KR20230084478A - 면역원성 코로나 바이러스 융합 단백질 및 관련 방법 - Google Patents

면역원성 코로나 바이러스 융합 단백질 및 관련 방법 Download PDF

Info

Publication number
KR20230084478A
KR20230084478A KR1020237010064A KR20237010064A KR20230084478A KR 20230084478 A KR20230084478 A KR 20230084478A KR 1020237010064 A KR1020237010064 A KR 1020237010064A KR 20237010064 A KR20237010064 A KR 20237010064A KR 20230084478 A KR20230084478 A KR 20230084478A
Authority
KR
South Korea
Prior art keywords
leu
ser
val
thr
asn
Prior art date
Application number
KR1020237010064A
Other languages
English (en)
Inventor
아비게일 이. 포웰
페이튼 안데르스-베너 바이덴바허
나탈리아 프라이드랜드
므린모이 산얄
피터 에스. 킴
Original Assignee
씨지 바이오허브 에스에프, 엘엘씨
더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티
더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 씨지 바이오허브 에스에프, 엘엘씨, 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티, 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 filed Critical 씨지 바이오허브 에스에프, 엘엘씨
Publication of KR20230084478A publication Critical patent/KR20230084478A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/08RNA viruses
    • C07K14/165Coronaviridae, e.g. avian infectious bronchitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/215Coronaviridae, e.g. avian infectious bronchitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/385Haptens or antigens, bound to carriers
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/205Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Campylobacter (G)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/79Transferrins, e.g. lactoferrins, ovotransferrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55505Inorganic adjuvants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55511Organic adjuvants
    • A61K2039/55561CpG containing adjuvants; Oligonucleotide containing adjuvants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55511Organic adjuvants
    • A61K2039/55566Emulsions, e.g. Freund's adjuvant, MF59
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55511Organic adjuvants
    • A61K2039/55572Lipopolysaccharides; Lipid A; Monophosphoryl lipid A
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55511Organic adjuvants
    • A61K2039/55577Saponins; Quil A; QS21; ISCOMS
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/60Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
    • A61K2039/6031Proteins
    • A61K2039/6068Other bacterial proteins, e.g. OMP
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/735Fusion polypeptide containing domain for protein-protein interaction containing a domain for self-assembly, e.g. a viral coat protein (includes phage display)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/90Fusion polypeptide containing a motif for post-translational modification
    • C07K2319/91Fusion polypeptide containing a motif for post-translational modification containing a motif for glycosylation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein

Abstract

페리틴 서브유닛 폴리펩티드의 아미노산 서열에 연결된 SARS-CoV-2와 같은 코로나바이러스의 스파이크 단백질의 엑토도메인의 아미노산 서열을 포함하는 융합 단백질이 제공된다. 코로나바이러스의 스파이크 단백질의 엑토도메인의 표면에 노출된 삼량체를 갖는 이러한 융합 단백질을 포함하는 나노입자가 또한 제공된다. 융합 단백질을 인코딩하는 핵산 및 벡터, 이러한 핵산 및 벡터를 포함하는 세포, 융합 단백질, 나노입자 또는 벡터를 포함하는 면역원성 조성물, 및 상응하는 방법 및 키트가 또한 제공된다.

Description

면역원성 코로나 바이러스 융합 단백질 및 관련 방법
배경
코로나바이러스(CoV)는 일반적인 감기부터 중동 호흡기 증후군(MERS) 및 중증 급성 호흡기 증후군(SARS)과 같은 보다 심각한 질병에 이르는 인간 질병을 유발하는 대규모 바이러스 패밀리이다. 코로나바이러스는 인수공통감염이며, 이는 동물과 사람 사이에 전염될 수 있음을 의미한다. 코로나바이러스는 바이러스 입자의 표면이 비리온으로부터 돌출된, 직경이 80-160 nm인, 잘 분리된 꽃잎 모양의 당단백질 "스파이크"로 덮여 있기 때문에 비리온 주위에 특징적인 왕관 또는 코로나를 갖는 크고 외피가 있는 단일 가닥 RNA 바이러스이다. 스파이크 당단백질은 비리온의 외부 외피에 위치한 클래스 I 바이러스 융합 단백질이다. 스파이크 단백질은 숙주 세포 수용체와 상호작용함으로써 바이러스 감염에 중요한 역할을 한다.
중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)는 호흡기 질환인 소위 코로나바이러스 질병 2019(COVID-19)를 유발하는 코로나바이러스의 균주이다. SARS-CoV-2는 전 세계적으로 확산되었으며 이미 1,600만 명 이상의 COVID-19 사례 및 600,000명 이상의 사망을 초래하였다. SARS-CoV-2는 엔도솜 또는 원형질막 융합을 통해 진핵 세포에 진입할 수 있다. 두 경로 모두에서, 비리온 표면의 스파이크는 막-결합된 단백질 안지오텐신-전환 효소 2(ACE2)에 결합하고 숙주 세포의 막에 대한 부착 및 진입을 매개한다. SARS-CoV-2는 전염성이 매우 높으며 주로 밀접한 접촉 및 호흡기 비말을 통해 사람들 사이에 확산된다. SARS-CoV-2의 장기적인 통제를 위해서는 전 세계적으로 널리 이용 가능한 효과적인 백신이 필요할 것이다.
개요
본 문서에서 사용된 "발명", "본 발명", "상기 발명" 및 "본 발명"이라는 용어는 본 특허 출원 및 하기 청구 범위의 모든 주제를 광범위하게 지칭하기 위한 것이다. 이러한 용어를 포함하는 진술은 본원에 설명된 주제를 제한하거나 하기 특허 청구 범위의 의미 또는 범위를 제한하지 않는 것으로 이해되어야 한다. 본 발명의 포괄적인 구현예는 본 개요가 아니라 청구 범위에 의해 정의된다. 본 개요는 본 발명의 다양한 양태에 대한 대략적인 개요이며 본 문서 및 첨부된 도면에서 설명되고 예시된 개념 중 일부를 소개한다. 본 개요는 청구된 주제의 핵심 또는 필수 특징을 식별하기 위한 것이 아니며 청구된 주제의 범위를 결정하기 위해 단독으로 사용하기 위한 것도 아니다. 본 주제는 전체 명세서, 일부 또는 모든 도면 및 각 청구항의 적절한 부분을 참조하여 이해되어야 한다. 본 발명의 예시적인 구현예 중 일부는 아래에서 논의된다.
코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열 및 페리틴 서브유닛 폴리펩티드의 아미노산 서열의 융합 단백질이 본 발명의 구현예에 포함되고 본 개시에 기술된다. 일부 예시적인 구현예에서, 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:14 또는 SEQ ID NO:15와 적어도 90% 서열 동일성을 갖는 스파이크 단백질의 엑토도메인의 인공적으로 변형된 아미노산 서열이다. 일부 예시적인 구현예에서, 코로나바이러스는 SARS-CoV-2이다. 일부 예시적인 구현예에서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 적어도 헵타드 반복 2(HR2)의 아미노산 서열의 C-말단 결실을 포함한다. 일부 예시적인 구현예에서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 푸린 인식 부위를 제거하는 돌연변이를 포함한다. 일부 예시적인 구현예에서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 스파이크 단백질을 예비-융합 입체형태로 안정화시키는 하나 이상의 돌연변이를 포함한다. 페리틴 서브유닛 폴리펩티드는 헬리코박터 파일로리(Helicobacter pylori) 페리틴 서브유닛 폴리펩티드일 수 있다. 일부 예시적인 구현예에서, 페리틴 서브유닛 폴리펩티드의 아미노산 서열은 SEQ ID NO:2와 적어도 90% 서열 동일성을 갖는 서열이다. 일부 예시적인 구현예에서, 페리틴 서브유닛 폴리펩티드는 하나 이상(즉, 적어도 하나)의 인공 글리코실화 부위를 함유한다. 일부 예시적인 구현예에서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 링커 아미노산 서열에 의해 페리틴 서브유닛 폴리펩티드의 아미노산 서열에 연결된다. 일부 예시적인 구현예에서, 융합 단백질의 아미노산 서열은 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:33 또는 SEQ ID NO:34와 적어도 90% 서열 동일성을 갖는 서열이다.
본 발명의 구현예에 따른 융합 단백질의 올리고머를 포함하는 나노입자가 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다. 본 발명의 구현예에 따른 나노입자는 코로나바이러스의 스파이크 단백질의 엑토도메인의 표면에 노출된 삼량체를 포함한다. 일부 예시적인 구현예에서, 각각의 나노입자는 코로나바이러스의 스파이크 단백질의 엑토도메인의 표면에 노출된 삼량체 중 8개를 포함한다. 본 발명의 구현예에 따른 융합 단백질을 인코딩하는 핵산이 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다. 본 발명의 구현예에 따른 핵산은 DNA 또는 RNA일 수 있다. 본 발명의 구현예에 따른 핵산을 포함하는 벡터가 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다. 본 발명의 구현예에 따른 핵산 또는 본 발명의 구현예에 따른 벡터를 포함하는 세포가 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다. 본 발명의 구현예에 따른 융합 단백질을 생산하는 방법이 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다. 융합 단백질을 생산하는 방법은 본 발명의 구현예에 따른 핵산 또는 본 발명의 구현예에 따른 벡터를 세포에 도입하는 단계; 융합 단백질의 발현을 허용하는 조건 하에서 세포를 인큐베이션하는 단계; 및 융합 단백질을 분리하는 단계를 포함할 수 있다. 본 발명의 구현예에 따른 나노입자를 생산하는 방법이 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다. 나노입자를 생산하는 방법은 본 발명의 구현예에 따른 핵산 또는 본 발명의 구현예에 따른 벡터를 세포에 도입하는 단계; 본 발명의 구현예에 따른 융합 단백질의 발현 및 나노입자의 자가-조립을 허용하는 조건 하에서 세포를 인큐베이션하는 단계; 및 나노입자를 분리하는 단계를 포함할 수 있다.
본 발명의 구현예에 따른 융합 단백질, 본 발명의 구현예에 따른 나노입자, 본 발명의 구현예에 따른 핵산 또는 본 발명의 구현예에 따른 벡터를 포함하는 면역원성 조성물이 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다. 일부 예시적인 구현예에서, 면역원성 조성물은 본 발명의 구현예에 따른 2개 이상의 상이한 융합 단백질, 본 발명의 구현예에 따른 2개 이상의 상이한 나노입자, 본 발명의 구현예에 따른 2개 이상의 상이한 핵산 또는 본 발명의 구현예에 따른 2개 이상의 상이한 벡터를 포함한다. 면역원성 조성물은 명반을 포함할 수 있는 하나 이상의 애주번트(즉, 적어도 하나)를 추가로 포함할 수 있다. 일부 예시적인 구현예에서, 면역원성 조성물은 동결건조된다. 본 발명의 구현예 중 하나 이상에 따른 면역원성 조성물, 및 면역원성 조성물을 투여하기 위한 장치 및 부형제 중 하나 이상을 포함하는 키트가 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다.
대상체에서 면역 반응을 유도하는 방법이 또한 본 발명의 구현예에 포함되고 본 개시에 기술되며, 상기 방법은 본 발명의 구현예에 따른 면역원성 조성물을 대상체에게 투여하는 단계를 포함한다. 이러한 방법에서, 면역원성 조성물은 대상체에서 코로나바이러스에 대한 보호 면역 반응을 유도할 수 있는 양으로 투여될 수 있다. 면역 반응은 대상체에서 코로나바이러스에 대한 중화 항체의 생산을 포함할 수 있다. 본 발명의 구현예에 따른 대상체에서 면역 반응을 유도하는 방법에서, 대상체는 인간일 수 있다.
본 개시는 하기 도면을 포함한다. 도면은 조성물 및 방법의 특정 구현예 및/또는 특징을 예시하고 조성물 및 방법의 임의의 설명(들)을 보충하기 위한 것이다. 서면 설명이 그러한 경우임을 명시적으로 나타내지 않는 한, 도면은 조성물 및 방법의 범위를 제한하지 않는다.
도 1a는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원 폴리펩티드 작제물의 개략도이다.
도 1b는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원 폴리펩티드의 3차원 구조의 개략도이며, 이는 극저온 전자현미경(cryo-EM)에 의해 결정된 스파이크 삼량체의 구조 및 X-선 결정학에 의해 결정된 헬리코박터 파일로리 페리틴 나노입자의 구조에 기초한다.
도 2a는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 발현 및 특성화 결과를 예시하는 웨스턴 블롯의 사진 이미지를 보여준다.
도 2b는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 발현 및 특성화 결과를 예시하는 SDS-PAGE 겔의 사진 이미지를 보여준다.
도 3은 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 다중각 광 산란(SEC-MALS)과 결합된 분석 규모 크기-배제 크로마토그래피의 결과를 예시하는 선 플롯을 보여준다.
도 4는 본 개시의 특정 양태에 따른 효소-결합 면역흡착 검정(ELISA)에 의한 인간 ACE2, 정제된 SARS-CoV-2 반응성 모노클로날 항체 CR3022, CB6 및 COVA-2-15, 및 에볼라 바이러스 반응성 모노클로날 항체 ADI-15731(음성 대조군으로서)에 대한 SARS-CoV-2 스파이크 단백질 항원의 결합 분석 결과를 예시하는 선 플롯을 보여준다.
도 5a는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크ΔC-페리틴 융합 단백질 나노입자의 대표적인 동작-보정 cryo-EM 현미경 사진 및 무참조 2D 클래스 평균을 보여준다.
도 5b, 상부 패널은 본 개시의 특정 양태에 따른 두 가지 상이한 관점에서 SARS-CoV-2 스파이크ΔC-페리틴 융합 단백질 나노입자의 재구성된 cryo-EM 맵을 보여준다. 하부 패널은 본 개시의 특정 양태에 따른 상부 패널보다 낮은 등고선 수준에 표시된 cryo-EM 맵에 도킹된 SARS-CoV-2 스파이크ΔC-페리틴 융합 단백질의 원자 모델에 대한 두 가지 상이한 관점을 보여준다.
도 6은 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 초기 면역화 21일 후에 추출된 혈청의 ELISA 결합 분석 결과를 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. SARS-CoV-2 RBD 단백질(왼쪽 그래프) 및 SARS-CoV-2 스파이크 단백질(오른쪽 그래프)에 대한 혈청의 결합을 분석하였다. 그래프에 표시된 각 포인트는 단일 동물로부터 2번의 기술적 중복 ELISA 곡선의 평균 log10 EC50 값을 나타낸다. 그래프의 각 막대는 10마리 동물의 평균 log10 EC50 값을 나타내고, 오차 막대는 표준 편차를 나타낸다. Kruskal-Wallis ANOVA에 이어 Dunn의 다중 비교를 사용하여 통계적 비교를 수행하였다. 모든 p 값은 다음과 같이 표시된다: * = p ≤ 0.05, ** = p ≤ 0.01, *** = p ≤ 0.001, **** = p ≤ 0.0001.
도 7은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가된 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 초기 면역화 21일 후에 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 4번의 중복에서 유래된 단일 동물로부터의 log10 IC50 값을 나타낸다. 4번의 중복을 만들어 내기 위해, 각 실험은 서로 다른 날에 2번 수행되었고, 각 날에 이중 실험이 수행되었다. 이를 통해 4개의 정규화된 희석 곡선이 생성되었고, 그 후 컴파일링되어 각 동물에 대한 각 IC50 값을 얻었다. 그래프 막대의 각 포인트는 10마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다. Kruskal-Wallis ANOVA에 이어 Dunn의 다중 비교를 사용하여 통계적 비교를 수행하였다. 모든 p 값은 다음과 같이 표시된다: * = p ≤ 0.05, ** = p ≤ 0.01, *** = p ≤ 0.001, **** = p ≤ 0.0001
도 8은 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 초기 면역화 28일 후에 추출된 혈청의 ELISA 결합 분석 결과를 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. SARS-CoV-2 RBD 단백질(왼쪽 그래프) 및 SARS-CoV-2 스파이크 단백질(오른쪽 그래프)에 대한 혈청의 결합을 분석하였다. 그래프의 각 포인트는 단일 동물로부터 2번의 기술적 중복 ELISA 곡선의 평균 log10 EC50 값을 나타낸다. 막대는 10마리 동물의 평균을 나타내고, 오차 막대는 표준 편차를 나타낸다. Kruskal-Wallis ANOVA에 이어 Dunn의 다중 비교를 사용하여 통계적 비교를 수행하였다. 모든 p 값은 다음과 같이 표시된다: * = p ≤ 0.05, ** = p ≤ 0.01, *** = p ≤ 0.001, **** = p ≤ 0.0001
도 9는 본 개시의 특정 양태에 따른 SARS-oV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 초기 면역화 28일 후에 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. 중화 특성은 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다.. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 그래프에 도시된 각 포인트는 4번의 중복에서 유래된 단일 동물로부터의 log10 IC50 값을 나타낸다. 4번의 중복을 만들어 내기 위해, 각 실험은 서로 다른 날에 2번 수행되었고, 각 날에 이중 실험이 수행되었다. 이를 통해 4개의 정규화된 희석 곡선이 생성되었고, 그 후 컴파일링되어 각 동물에 대한 각 IC50 값을 얻었다. 막대는 10마리 동물의 각 그룹에 대한 평균 log10 IC50을 나타내고, 오차 막대는 표준 편차를 나타낸다. Kruskal-Wallis ANOVA에 이어 Dunn의 다중 비교를 사용하여 통계적 비교를 수행하였다. 모든 p 값은 다음과 같이 표시된다: * = p ≤ 0.05, ** = p ≤ 0.01, *** = p ≤ 0.001, **** = p ≤ 0.0001
도 10은 본 개시의 특정 양태에 따른 2회 용량의 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청의 IgG1, IgG2a 및 IgG2b 서브클래스 반응(X-축에 표시된 바와 같음)의 ELISA 결합 분석 결과를 예시하는 도트 플롯을 보여준다. 항원은 각 패널의 상단에 표시된다. 그래프의 각 포인트는 단일 동물의 log10 EC50 값을 나타내고; 각 가로 막대는 10마리 동물 그룹에 대한 평균 log10 EC50 역가를 나타내고; 오차 막대는 표준 편차를 나타낸다.
도 11a는 본 개시의 특정 양태에 따른 2회 용량의 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청의 ELISA 결합 분석에 의해 결정된 IgG2a/IgG1 EC50의 비율을 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. 그래프의 각 포인트는 단일 동물의 비율 값을 나타내고; 각 가로 막대는 10마리 동물 그룹에 대한 평균 비율을 나타내고; 오차 막대는 표준 편차를 나타낸다.
도 11b는 본 개시의 특정 양태에 따른 2회 용량의 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청의 ELISA 결합 분석에 의해 결정된 IgG2b/IgG1 EC50의 비율을 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. 그래프의 각 포인트는 단일 동물의 비율 값을 나타내고; 각 가로 막대는 10마리 동물 그룹에 대한 평균 비율을 나타내고; 오차 막대는 표준 편차를 나타낸다.
도 12는 본 개시의 특정 양태에 따른 2회 용량의 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청에서 IgM 수준을 평가하는 ELISA에 의한 결합 분석 결과를 예시하는 선 플롯을 보여준다. 항원은 각 패널의 상단에 표시된다. 각 포인트는 용량-반응 연관 곡선에 핏팅된 각 동물(n = 그룹 당 10마리 마우스)로부터 실험 중복을 나타내고; 오차 막대는 각 포인트에 대한 표준 편차를 나타낸다.
도 13a는 본 개시의 특정 양태에 따른 상이한 용량(X-축에 표시됨)의 SARS-CoV-2 스파이크 단백질 항원 투여 28일 후에 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 10마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 13b는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원을 투여한 후 다양한 시점(X-축에 표시됨)에 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 5마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 14는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원(각 패널의 상단에 표시됨)으로 초기 면역화 다양한 시점(X-축에 표시됨)에 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 5마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 15a는 본 개시의 특정 양태에 따른 1 μg 또는 10 μg(X-축에 표시됨)의 SARS-CoV-2 스파이크 단백질 항원의 단일 용량으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 혈청은 초기 면역화 3주 후에 수집되었다. SARS-CoV-2 스파이크 단백질 항원은 각 패널의 상단에 표시된 대로 500 μg Alhydrogel® 및 20 μg CpG, 또는 10 μg Quil-A® 및 10 μg MPLA로 애주번트 처리되었다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 10마리 또는 20마리 동물의 각 그룹에 대한 평균 값을 나타내고(도시된 바와 같음), 오차 막대는 표준 편차를 나타낸다.
도 15b는 본 개시의 특정 양태에 따른 1 μg 또는 10 μg(X-축에 표시됨)의 SARS-CoV-2 스파이크 단백질 항원의 1회("21일") 또는 2회("28일") 용량으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. SARS-CoV-2 스파이크 단백질 항원은 500 μg의 Alhydrogel® 및 20 μg의 CpG, AddaVax™, 또는 10 μg의 Quil-A® 및 10 μg의 MPLA로 애주번트 처리되었다(X-축에 표시된 바와 같음). 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 10마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 16은 본 개시의 특정 양태에 따른 2회 용량의 2개의 SARS-CoV-2 스파이크 단백질 항원(표시된 바와 같음)으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 실험용 마우스에 투여된 SARS-CoV-2 스파이크 단백질 항원은 10 μg Quil-A® 및 10 μg MPLA로 애주번트 처리되었다. 혈청은 초기 면역화 21일, 28일 및 56일(X-축에 표시된 바와 같음) 후에 수집되었다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 5마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 17a는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 대표적인 크기-배제 크로마토그래피 추적을 보여준다.
도 17b는 본 개시의 특정 양태에 따른 발현되고 정제된 SARS-CoV-2 스파이크 단백질 항원의 상대적인 양의 비교를 예시하는 막대 그래프를 보여준다.
도 18은 입체형태적 모노클로날 항체 및 ACE2 수용체에 대한 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 결합을 테스트하는 Octet® 시스템(Sartorius, Gottingen, Germany)에서 생물층 간섭계(BLI)에 의해 생성된 플롯을 보여준다. Fc 단편에 융합된 모노클로날 항체 및 ACE2 수용체를 바이오센서 표면에 고정하고, 센서를 용액에 SARS CoV-2 스파이크 단백질 항원을 함유하는 웰로 이동시킨 다음, 항원을 함유하지 않는 웰로 이동시켰다. 항체 및 ACE2에 대한 SARS CoV-2 스파이크 단백질 항원의 결합 및 해리는 내부 표면 및 센서와 용액 사이의 외부 계면으로부터 분광광도계로 다시 반사되는 광파 사이의 광학적 간섭 변화를 초래한다. 간섭의 변화를 Y-축에 플롯팅하고 결합 및 해리를 나타내는데 사용하였다. 따라서 nm 이동(Y-축에 플롯팅됨)의 변화의 크기는 결합에 대한 대용으로 사용되며, 여기서 유사한 결합 파트너의 경우, 더 큰 변화는 더 많은 결합을 반영한다.
도 19는 본 개시의 특정 양태에 따른 2회 용량의 2개의 SARS-CoV-2 스파이크 단백질 항원(표시된 바와 같음)으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 실험용 마우스에 투여된 SARS-CoV-2 스파이크 단백질 항원은 500 μg 명반(Alhydrogel®, InvivoGen, San Diego, California) 및 20 μg CpG(InvivoGen)로 애주번트 처리되었다. 혈청은 초기 면역화 21일 및 42일(X-축에 표시된 바와 같음) 후에 수집되었다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 그룹 간 차이의 유의성은 스튜던트-t 테스트로 계산되었으며 플롯에 표시된 대로 유의하지 않은(NS) 것으로 확인되었다. 각 가로 막대는 10마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 20은 본 개시의 특정 양태에 따른 동결건조된("Lyo1", "Lyo2" 및 "Lyo3") 및 냉동된("냉동") 스파이크HexaProΔC 단백질 항원 샘플의 UV 스펙트럼을 보여준다.
도 21은, 좌측 패널에서, 본 개시의 특정 양태에 따른 동결건조된("Lyo") 및 냉동된("냉동") 스파이크HexaProΔC 단백질 항원 샘플의 스캐닝 형광측정 분석 결과를 예시하는 선 플롯을 보여준다.
도 22는 입체형태적 모노클로날 항체 및 ACE2 수용체에 대한 본 개시의 특정 양태에 따른 동결건조된("Lyo1", "Lyo2" 및 "Lyo3") 및 냉동된("냉동") 샘플에서 SARS-CoV-2 스파이크 단백질 항원의 결합을 테스트하기 위해 Octet® 시스템에서 BLI에 의해 생성된 플롯을 보여준다. Fc 단편에 융합된 모노클로날 항체 및 ACE2 수용체를 바이오센서 표면에 고정하고, 센서를 용액에 냉동되고 해동된("냉동") 또는 동결건조되고 재구성된("Lyo 1"-"Lyo 3") SARS CoV-2 스파이크 단백질 항원을 함유하는 웰로 이동시킨 다음, 항원을 함유하지 않는 웰로 이동시켰다. 항체 및 ACE2에 대한 SARS CoV-2 스파이크 단백질 항원의 결합 및 해리는 내부 표면 및 센서와 용액 사이의 외부 계면으로부터 분광광도계로 다시 반사되는 광파 사이의 광학적 간섭 변화를 초래한다. 간섭의 변화를 Y-축에 플롯팅하고 결합 및 해리를 나타내는데 사용하였다.
도 23은 본 개시의 특정 양태에 따른 동결건조된 및 냉동된 샘플(X-축에 표시된 바와 같이, 각각 3개의 마우스 그룹)로부터 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스의 그룹으로부터 추출된 혈청의 SARS-CoV-2 RBD 단백질(본 개시의 다른 곳에 기술된 바와 같이 ELISA에 의해 측정되고 Y-축에 EC50 값으로 표시됨)의 결합을 예시하는 도트 플롯을 보여준다. 각 포인트는 단일 동물의 log10 EC50 값을 나타낸다. 역가의 통계적 차이를 스튜던트 t-테스트로 분석하였으며 플롯에 표시된 대로 유의하지 않은(NS) 것으로 확인되었다.
도 24는 본 개시의 특정 양태에 따른 동결건조된 및 냉동된 샘플(X-축에 표시된 바와 같이, 각각 3개의 마우스 그룹)로부터 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다.
도 25는 입체형태적 모노클로날 항체 CB6 및 ACE2 수용체에 대한 동결건조된 SARS-CoV-2 스파이크 단백질 항원 샘플의 결합을 테스트하는 Octet® 시스템에서 BLI에 의해 생성된 플롯을 보여준다. SARS-CoV-2 스파이크 단백질 항원 샘플은 1%, 5% 또는 10% 수크로스(라벨링된 바와 같음)와 함께 10 mM 암모늄 바이카르보네이트 pH 7.8에서 동결건조되었고, SARS-CoV-2 스파이크 단백질 항원 샘플은 10% 수크로스와 함께 10 mM 암모늄 바이카르보네이트 pH 7.8("AB 냉동") 또는 10% 수크로스와 함께 PBS("PBS")에서 냉동되었다. Fc 단편에 융합된 모노클로날 항체 및 ACE2 수용체를 바이오센서 표면에 고정하고, 센서를 용액에 단백질 항원을 함유하는 웰로 이동시킨 다음, 항원을 함유하지 않는 웰로 이동시켰다. 항체 및 ACE2에 대한 SARS CoV-2 스파이크 단백질 항원의 결합 및 해리는 내부 표면 및 센서와 용액 사이의 외부 계면으로부터 분광광도계로 다시 반사되는 광파 사이의 광학적 간섭 변화를 초래한다. 간섭의 변화를 Y-축에 플롯팅하고 결합 및 해리를 나타내는데 사용하였다. 따라서 nm 이동(Y-축에 플롯팅됨)의 변화의 크기는 결합에 대한 대용으로 사용되며, 여기서 유사한 결합 파트너의 경우, 더 큰 변화는 더 많은 결합을 반영한다.
도 26은 휘발성 암모늄 바이카르보네이트 완충액에서 동결건조된 SARS-CoV-2 스파이크 단백질 항원의 특성을 테스트하는 크기 배제 크로마토그래피 - 다중각 광 산란(SEC-MALS) 테스트의 결과를 예시하는 플롯을 보여준다. 단백질은 재구성 직후("1일") 및 실온에서 4일 동안 보관된 후("4일") 테스트되었다.
도 27은 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 융합 단백질 나노입자에서 조작된 글리코실화 부위의 위치의 개략도이다. 페리틴 도메인은 흰색으로 표시된다. 조작된 글리코실화 부위에서 아스파라긴 잔기로 돌연변이된 리신 잔기는 검은색 구체로 표시된다. 조작된 글리코실화 부위에서 트레오닌 잔기로 돌연변이된 글루탐산 잔기는 회색 구체로 표시된다. 검은색 삼각형은 3중 대칭축을 묘사한다.
도 28은 입체형태적 모노클로날 항체 및 ACE2 수용체에 대한 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 결합을 테스트하는 Octet® 시스템에서 BLI에 의해 생성된 플롯을 보여준다. Fc 단편에 융합된 모노클로날 항체 및 ACE2 수용체를 바이오센서 표면에 고정하고, 센서를 용액에 SARS CoV-2 스파이크 단백질 항원을 함유하는 웰로 이동시킨 다음, 항원을 함유하지 않는 웰로 이동시켰다. 항체 및 ACE2에 대한 SARS CoV-2 스파이크 단백질 항원의 결합 및 해리는 내부 표면 및 센서와 용액 사이의 외부 계면으로부터 분광광도계로 다시 반사되는 광파 사이의 광학적 간섭 변화를 초래한다. 간섭의 변화를 Y-축에 플롯팅하고 결합 및 해리를 나타내는데 사용하였다. 따라서 nm 이동(Y-축에 플롯팅됨)의 변화의 크기는 결합에 대한 대용으로 사용되며, 여기서 유사한 결합 파트너의 경우, 더 큰 변화는 더 많은 결합을 반영한다. 플롯 라벨은 다음과 같다: "원래" - 스파이크HexaProΔC 페리틴; "D614G" - 스파이크HexaProΔC 페리틴 D614G; "B.1.1.7" - 스파이크HexaProΔC 페리틴 B.1.1.7; "B.1.351" - 스파이크HexaProΔC 페리틴 B.1.351; "LA" - 스파이크HexaProΔC 페리틴 B.1.429; "P1" - 스파이크HexaProΔC 페리틴 P1.
도 29는 본 개시의 특정 양태에 따른 6개의 슈도바이러스 패널에 대한 SARS-CoV-2 스파이크 단백질 항원의 중화 활성(SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 중화 검정을 사용하여 결정됨)의 "히트 맵"을 보여준다. SARS-CoV-2 스파이크 단백질 항원은 각 "히트 맵"의 x-축에 나열되어 있으며 다음과 같이 라벨링된다: "원래" - 스파이크HexaProΔC 페리틴; "D614G" - 스파이크HexaProΔC 페리틴 D614G; "B.1.1.7" - 스파이크HexaProΔC 페리틴 B.1.1.7; "B.1.351" - 스파이크HexaProΔC 페리틴 B.1.351; "LA" - 스파이크HexaProΔC 페리틴 B.1.429; "P1" - 스파이크HexaProΔC 페리틴 P1. 테스트한 슈도바이러스는 각 히트 맵의 y-축에 플롯팅되어 있으며 SARS-CoV-2 균주 Wuhan-1("WT"로 표시됨), D614G, B.1.429, B1.1.7, P1 및 B.1.351을 기반으로 한다. 히트 맵의 각 값은 특정 슈도타입형 바이러스에 대해 동일한 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 풀링된 혈청의 log10IC50 값이다.
도 30a는 본 개시의 특정 양태에 따른 스파이크HexaProΔC 페리틴(SEQ ID NO:16) 및 명반으로 면역화된 5마리 마우스의 그룹에서 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 대한 막대 아래에 표시된다.
도 30b는 본 개시의 특정 양태에 따른 스파이크HexaProΔC 페리틴(SEQ ID NO:16) 및 명반으로 면역화되고, 초기 면역화 21일 후에 부스팅된 5마리 마우스의 그룹에서 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 대한 막대 아래에 표시된다.
도 31a는 본 개시의 특정 양태에 따른 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 10마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 대한 막대 아래에 표시된다.
도 31b는 본 개시의 특정 양태에 따른 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화되고, 초기 면역화 21일 후에 부스팅된 10마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 대한 막대 아래에 표시된다.
도 32a는 본 개시의 특정 양태에 따른 명반 및 CpG로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 10마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 막대 아래에 표시된다.
도 32b는 본 개시의 특정 양태에 따른 명반 및 CpG로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화되고, 초기 면역화 21일 후에 부스팅된 10마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 막대 아래에 표시된다.
도 33은 본 개시의 특정 양태에 따른, x-축에 표시된, 상이한 용량의 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 플롯 위에 표시된 대로, 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다.
도 34a는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 야생형 SARS-CoV-2에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34b는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 B.1.421 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34c는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 B.1.1.7. 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34d는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 B.1.351 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34e는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 B.1.617.2 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34f는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 P.1 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
본 발명자들은 표면에 각각의 SARS-CoV-2 스파이크 엑토도메인의 버전을 표시하는 나노입자로 자가-조립되는 SARS-CoV-2 스파이크 엑토도메인 폴리펩티드 및 페리틴의 융합 단백질("SARS-CoV-2 스파이크-페리틴 융합 단백질")을 설계, 생성 및 특성화하였다. SARS-CoV-2 스파이크-페리틴 융합 단백질의 일부 버전은 SARS-CoV-2 스파이크 단백질의 전장 엑토도메인을 함유한다. 다른 버전은 C-말단 결실(일례에서, 70개 아미노산의 C-말단 결실)을 갖는 SARS-CoV-2 스파이크 단백질 엑토도메인을 함유한다. 본 발명자들은 놀랍게도 SARS-CoV-2 스파이크 단백질 아미노산 서열의 C-말단 결실이 포유동물 세포에서 생성된 융합 단백질의 발현을 상당히 개선시켰음을 발견하였다. 본 발명자들은 cryo-EM, 크기-배제 크로마토그래피 다중각 광 산란(SEC-MALS) 및 생체층 간섭계(BLI)에 의해 각 버전의 SARS-CoV-2 스파이크-페리틴 융합 단백질의 스파이크 도메인이 나노입자 표면에서 천연-유사 입체형태로 적절하게 폴딩되는 것을 확인하였고, 이는 ACE2 수용체 및/또는 하나 이상의 스파이크-특이적 모노클로날 항체에 대한 SARS-CoV-2 스파이크-페리틴 융합 단백질의 결합을 측정하였다. 본 발명자들은 다른 SARS-CoV-2 융합 단백질 항원과의 비교를 포함하여, 실험용 동물에서 SARS-CoV-2 스파이크-페리틴 융합 단백질의 면역원성을 테스트하였다. SARS-CoV-2 스파이크-페리틴 융합 단백질로 마우스를 단일 면역화한 후, 본 발명자들은 렌티바이러스 CoV-2 슈도바이러스 검정을 사용하여 결정된 바와 같이, 인간 회복기 혈장에서 보이는 것과 비슷하거나 더 많은 중화 항체 양을 관찰하였다. 대조적으로, CoV-2 수용체 결합 도메인(RBD) 또는 SARS-CoV-2 스파이크의 분리된 스파이크 삼량체를 사용한 단일 면역화는 훨씬 약한 중화 항체 반응을 유도하였다. 본 발명자들은 또한 면역원으로 사용된 SARS-CoV-2 스파이크-페리틴 융합 단백질에 대한 실험용 동물에서 생성된 항체의 SARS-CoV-2 바이러스 중화 특성을 테스트하였다. 본 발명자들은 나노입자로 자가-조립될 수 있는 SARS-CoV-2 스파이크-페리틴 융합 단백질이 다른 SARS-CoV-2 스파이크 단백질 항원과 비교하여 실험용 동물에서 훨씬 더 강력한 항원-특이적 및 중화 항체 반응을 유도하였음을 예기치 않게 발견하였다. 본 발명자들은 또한 SARS-CoV-2 스파이크 단백질 엑토도메인 아미노산 서열에서 C-말단 결실("C-말단 결실")을 갖는 SARS-CoV-2 스파이크-페리틴 융합 단백질이 테스트한 모든 항원 중 실험용 동물에서 가장 높은 중화 항체 반응을 유도하였음을 발견하였다. 본 발명자들은 SARS-CoV-2 스파이크-페리틴 융합 단백질이 포유동물 세포에서 생산된 후 나노입자로 자가-조립되는 능력, SARS-CoV-2 스파이크 단백질의 엑토도메인과 유사한 달성된 발현 수준, 및 SARS-CoV-2 스파이크-페리틴 융합 단백질에 의해 유도된 향상된 면역 반응을 감안할 때, SARS-CoV-2 스파이크-페리틴 융합 단백질(SARS-CoV-2 스파이크 단백질 엑토도메인 아미노산 서열에서 C-말단 결실을 갖는 스파이크-페리틴 융합 단백질 포함)이 SARS-CoV-2에 대한 서브유닛 또는 핵산 백신에 사용될 수 있음을 깨달았다.
본 발명자들은 C-말단 결실 및 2개 이상의 프롤린 치환을 갖는 여러 SARS-CoV-2 스파이크-페리틴 융합 단백질을 테스트하였고 C-말단 결실 및 6개의 프롤린 치환을 갖는 SARS-CoV-2 스파이크-페리틴 융합 단백질이 C-말단 결실 및 2개의 프롤린 치환을 갖는 SARS-CoV-2 스파이크-페리틴 융합 단백질에 동등하게 면역원성이었음을 발견하였다. 또한, C-말단 결실 및 6개의 프롤린 치환을 갖는 SARS-CoV-2 스파이크-페리틴 융합 단백질의 발현 및 정제 수율은 C-말단 결실 및 더 적은 프롤린 치환을 갖는 SARS-CoV-2 스파이크-페리틴 융합 단백질보다 예기치 않게 현저하게 더 높았다. 본 발명자들은 C-말단 결실 및 6개의 프롤린 치환을 갖는 SARS-CoV-2 스파이크-페리틴 융합 단백질의 여러 버전을 생성하고 테스트하였다. 이들 버전은 코로나바이러스 스파이크 단백질의 자연 발생 변이체를 기반으로 하며, 실험용 동물에 투여했을 때 높은 중화 활성을 가진 항체를 유도하였다. 본 발명자들은 동결건조되고 이어서 재구성된 SARS-CoV-2 스파이크-페리틴 융합 단백질이 이들의 구조 및 면역원성을 유지하였음을 발견하였다. 또한, 본 발명자들은 면역 시스템으로부터 페리틴 도메인을 차폐하고 페리틴 도메인에 대한 면역 반응을 감소시키기 위해(따라서 본 발명자들이 고안한 항-SARS-CoV-2 백신에 대한 비생산적 면역 반응을 최소화함), 페리틴 도메인에 인공 글리코실화 부위를 갖도록 SARS-CoV-2 스파이크 페리틴 융합 단백질을 조작하였다.
상기 발견에 기초하여, 본 발명자들은 코로나바이러스 스파이크-페리틴 융합 단백질, 이러한 융합 단백질로 구성된 나노입자, 핵산, 핵산 작제물 및 코로나바이러스 스파이크-페리틴 융합 단백질을 인코딩하는 벡터, 및 코로나바이러스 스파이크-페리틴 융합 단백질의 생산 및 사용과 관련된 세포, 조성물, 키트 및 방법의 다양한 구현예를 고안하고 본 개시에서 기술하였다. 코로나바이러스 스파이크-페리틴 융합 단백질의 나노입자 생산은 단일 발현 플라스미드만을 필요로 한다. 코로나바이러스 스파이크-페리틴 융합 단백질의 발현 및 정제는 가용성 단백질에 대한 표준 프로토콜을 사용하여 수행 및 확장될 수 있으며, 정제된 융합 단백질은 나노입자의 균질한 집단으로 자가-조립된다. 대조적으로, 별도의 구성요소로부터 조립된 나노입자는 구성요소가 별도로 생성되고 정제 후 컨쥬게이션 단계에서 컨쥬게이션될 것을 필요로 하며, 이는 수율을 크게 감소시키고 이질적인 나노입자 집단을 생성할 수 있다. 본 발명자들에 의해 고안되고 본 개시에 기술된 코로나바이러스 스파이크-페리틴 융합 단백질 및 관련 핵산, 핵산 작제물, 벡터, 세포, 조성물, 키트 및 방법은 단백질 또는 핵산을 기반으로 하는 면역원성 조성물(백신)의 개발 및 생산을 포함하나 이에 제한되지 않는 다양한 적용에 유용하고 코로나바이러스 감염에 대한 면역 반응을 유도하고 SARS-CoV-2 감염을 포함하나 이에 제한되지 않는 코로나바이러스 감염의 예방 또는 치료에 유용하다. 본 발명자들에 의해 얻어진 실험 결과는 코로나바이러스 스파이크 단백질 엑토도메인을 나타내는 스파이크-페리틴 융합 단백질의 나노입자가 대상체에서 임상적으로 관련된 양의 중화 항체를 안정적으로 유도할 수 있음을 입증하였다. 따라서, 코로나바이러스 스파이크-페리틴 융합 단백질 및 이러한 융합 단백질을 인코딩하는 핵산 작제물은 코로나바이러스 감염에 대한 보호를 유도하기 위한 단일 용량 백신과 같은 백신으로 사용될 수 있다.
용어 및 개념
많은 용어와 개념이 아래에 설명되어 있다. 이들은 본 문서의 나머지 부분 및 첨부된 도면과 함께 본 발명의 다양한 구현예의 이해를 용이하게 하기 위한 것이다. 이러한 용어 및 개념은 본 문서 및/또는 첨부된 도면 전체에 제공된 설명뿐만 아니라 본 발명의 분야에서 허용되는 관례에 기초하여 더 명확해지고 이해될 수 있다. 일부 다른 용어는 본 문서의 다른 섹션 및 첨부된 도면에서 명시적으로 또는 암시적으로 정의될 수 있으며, 본 발명의 분야에서 허용되는 관례, 본 문서 전체에 제공된 설명 및/또는 첨부된 도면에 기초하여 사용되고 이해될 수 있다. 명시적으로 정의되지 않은 용어들은 본 발명의 분야에서 허용되는 관례에 따라 정의되고 이해될 수 있으며, 본 문서 및/또는 첨부된 도면의 맥락에서 해석될 수 있다.
문맥상 달리 규정되지 않는 한, 단수형 용어는 복수형을 포함하고, 복수형 용어는 단수형을 포함할 것이다. 일반적으로, 세포 및 조직 배양, 분자 생물학, 면역학, 미생물학, 유전학 및 단백질 및 핵산 화학과 관련하여 사용되는 명명법 및 기술은 잘 알려져 있고 일반적으로 사용된다. 공지된 방법 및 기술은 달리 나타내지 않는 한 일반적으로 널리 공지된 통상적인 방법에 따라 그리고 다양한 일반적이고 보다 구체적인 참고문헌에 기재된 바와 같이 수행된다. 본 개시에 기재된 실험실 절차 및 기술과 관련하여 사용되는 명명법은 잘 알려져 있고 일반적으로 사용된다.
본원에서 사용되는 단수형은 달리 구체적으로 언급되지 않는 한 하나 이상을 지칭할 수 있다.
"또는"이라는 용어의 사용은 대안만을 지칭하도록 명시적으로 나타내지 않거나 대안이 상호 배타적이지 않는 한 "및/또는"을 의미하기 위해 사용되나, 본 개시는 대안만 그리고 "및/또는"을 지칭하는 정의를 지원한다. 본원에서 사용되는 "또 다른"은 적어도 두 번째 이상을 의미할 수 있다.
본원에서 사용되는 용어 "약" 및 "대략"은 일반적으로 측정의 성질 또는 정밀도를 고려하여 측정된 양에 대해 허용 가능한 오차 정도를 의미한다. 예시적인 오차 정도는 주어진 값 또는 값의 범위의 20%(%) 이내; 바람직하게는 10% 이내; 및 보다 바람직하게는 5% 이내이다. "약 X" 또는 "대략 X"에 대한 모든 언급은 구체적으로 적어도 X, 0.95X, 0.96X, 0.97X, 0.98X, 0.99X, 1.01X, 1.02X, 1.03X, 1.04X, 및 1.05X 값을 나타낸다. 따라서, 표현 "약 X" 및 "대략 X"는, 예를 들어, "0.98X"의 청구 제한에 대한 서면 지원을 교시하고 제공하기 위한 것이다. 대안적으로, 생물학적 시스템에서, 용어 "약" 및 "대략"은 주어진 값의 자릿수 내, 바람직하게는 5배 이내, 보다 바람직하게는 2배 이내의 값을 의미할 수 있다. 본원에서 주어진 수치는 달리 언급되지 않는 한 근사치이며, 용어 "약" 또는 "대략"은 명시적으로 언급되지 않을 때 추론될 수 있음을 의미한다. "약"이 숫자 범위의 시작 부분에 적용되면 범위의 양쪽 끝에 적용된다.
용어 "단백질", "펩티드" 및 "폴리펩티드"는 아미노산 잔기의 중합체를 나타내기 위해 상호교환적으로 사용된다. 이 용어는 자연 발생 아미노산 중합체 및 비자연 아미노산 중합체뿐만 아니라 하나(또는 그 초과)의 아미노산 잔기가 상응하는 자연 발생 아미노산의 인공 화학적 모방체인 아미노산 중합체에 적용된다. 이 용어는 아미노산 잔기가 공유 펩티드 결합에 의해 연결된 전장 단백질을 포함하는 임의의 길이의 아미노산 사슬을 포함한다.
"분리된" 또는 "정제된" 폴리펩티드 또는 단백질, 또는 생물학적 활성 부분인 폴리펩티드 또는 단백질은 자연 발생 환경에서 발견되는 폴리펩티드 또는 단백질과 일반적으로 동반되거나 상호작용하는 구성요소가 실질적으로 또는 본질적으로 없다. 따라서, 분리되거나 정제된 폴리펩티드 또는 단백질은 재조합 기술에 의해 생산될 때 다른 세포 물질 또는 배양 배지가 실질적으로 없거나, 화학적으로 합성될 때 화학적 전구체 또는 다른 화학 물질이 실질적으로 없다. 세포 물질이 실질적으로 없는 단백질은 오염 단백질이 약 30%, 20%, 10%, 5%, 1%, 0.5% 또는 0.1%(총 단백질) 미만인 단백질의 제조물을 포함한다. 본 발명의 단백질 또는 이의 생물학적 활성 부분이 재조합적으로 생산될 때, 최적의 배양 배지는 약 30%, 20%, 10%, 5%, 1%, 0.5% 또는 0.1%(농도 기준) 미만의 화학적 전구체 또는 관심 단백질이 아닌(non-protein-of-interest) 화학 물질을 나타낸다.
용어 "아미노산"은 펩티드, 폴리펩티드 또는 단백질에 혼입될 수 있는 임의의 단량체 단위를 지칭한다. 아미노산은 자연 발생 α-아미노산 및 이의 입체 이성질체뿐만 아니라 비자연(비자연 발생) 아미노산 및 이의 입체 이성질체를 포함한다. 주어진 아미노산의 "입체 이성질체"는 동일한 분자식 및 분자내 결합을 갖지만 결합 및 원자의 상이한 3차원 배열을 갖는 이성질체를 지칭한다(예를 들어, L-아미노산 및 상응하는 D-아미노산).
자연 발생 아미노산은 유전 코드에 의해 인코딩되는 아미노산뿐만 아니라 이후에 변형되는 아미노산, 예를 들어, 하이드록시프롤린, γ-카르복시글루타메이트 및 O-포스포세린이다. 자연 발생 α-아미노산은 알라닌(Ala), 시스테인(Cys), 아스파르트산(Asp), 글루탐산(Glu), 페닐알라닌(Phe), 글리신(Gly), 히스티딘(His), 이소류신(Ile), 아르기닌(Arg), 리신(Lys), 류신(Leu), 메티오닌(Met), 아스파라긴(Asn), 프롤린(Pro), 글루타민(Gln), 세린(Ser), 트레오닌(Thr), 발린(Val), 트립토판(Trp), 티로신(Tyr) 및 이들의 조합을 포함하나 이에 제한되지 않는다. 자연 발생 α-아미노산의 입체 이성질체는 D-알라닌(D-Ala), D-시스테인(D-Cys), D-아스파르트산(D-Asp), D-글루탐산(D- Glu), D-페닐알라닌(D-Phe), D-히스티딘(D-His), D-이소류신(D-Ile), D-아르기닌(D-Arg), D-리신(D-Lys), D-류신(D-Leu), D-메티오닌(D-Met), D-아스파라긴(D-Asn), D-프롤린(D-Pro), D-글루타민(D-Gln), D-세린(D-Ser), D-트레오닌(D-Thr), D-발린(D-Val), D-트립토판(D-Trp), D-티로신(D-Tyr) 및 이들의 조합을 포함하나 이에 제한되지 않는다.
비자연(비자연 발생) 아미노산은 아미노산 유사체, 아미노산 모방체, 합성 아미노산, N-치환된 글리신, 및 자연 발생 아미노산과 유사한 방식으로 기능하는 L- 또는 D-배열의 N-메틸 아미노산을 포함하나 이에 제한되지 않는다. 예를 들어, "아미노산 유사체"는 자연 발생 아미노산과 동일한 기본 화학 구조를 갖지만(즉, 수소, 카르복실 기, 아미노 기에 결합된 탄소) 호모세린, 노르류신, 메티오닌 설폭사이드, 메티오닌 메틸 설포늄과 같이 변형된 측쇄 기 또는 변형된 펩티드 백본을 갖는 비자연 아미노산일 수 있다. "아미노산 모방체"는 아미노산의 일반 화학 구조와 상이하나, 자연 발생 아미노산과 유사한 방식으로 기능하는 구조를 갖는 화학적 화합물을 지칭한다. 아미노산은 일반적으로 공지된 3문자 기호 또는 IUPAC-IUB 생화학 명명법 위원회에 의해 권장되는 1문자 기호로 나타낼 수 있다.
"보존적으로 변형된 변이체"라는 표현 및 관련 표현은 아미노산 서열뿐만 아니라 아미노산 서열을 인코딩하는 핵산 서열에도 적용될 수 있다. 인코딩된 서열 내의 단일 아미노산 또는 적은 퍼센트의 아미노산을 변경시키거나, 첨가하거나, 결실시키는 핵산, 펩티드, 폴리펩티드 또는 단백질 서열에 대한 치환, 결실 또는 첨가는 이러한 변경으로 인해 아미노산이 화학적으로 유사한 아미노산으로 치환되는 경우 "보존적으로 변형된 변이체"이다. 기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 당업계에 널리 공지되어 있다. 이러한 보존적으로 변형된 변이체는 본 발명의 다형성 변이체, 종간 동족체 및 대립유전자에 추가되며 이를 배제하지 않는다. 다음 8개의 그룹 각각은 서로에 대해 보존적 치환인 아미노산을 포함한다:
1) 알라닌(A), 글리신(G);
2) 아스파르트산(D), 글루탐산(E);
3) 아스파라긴(N), 글루타민(Q);
4) 아르기닌(R), 리신(K);
5) 이소류신(I), 류신(L), 메티오닌(M), 발린(V);
6) 페닐알라닌(F), 티로신(Y), 트립토판(W);
7) 세린(S), 트레오닌(T); 및
8) 시스테인(C), 메티오닌(M).
용어 "핵산", "핵산 서열", "뉴클레오티드 서열", "올리고뉴클레오티드", "폴리뉴클레오티드" 및 관련 용어 및 표현은 데옥시리보핵산(DNA) 또는 리보핵산(RNA) 및 이들의 중합체를 지칭한다. 본 개시에서 논의된 바와 같은 핵산 서열은 단일 가닥 형태, 이중 가닥 형태, 헤어핀, 스템-앤-루프 구조 등을 포함하나 이에 제한되지 않는 모든 형태의 핵산을 포함한다. RNA 서열이 기술될 때, 이의 상응하는 DNA 서열도 기술되며, 여기서 우리딘은 티미딘으로 표시된다. DNA 서열이 기술될 때, 이의 상응하는 RNA 서열도 기술되며, 여기서 티미딘은 우리딘으로 표시된다. 구체적으로 제한되지 않는 한, 용어 "핵산" 및 관련 용어 및 표현은 참조 핵산과 유사한 특성을 갖고 자연 발생 뉴클레오티드와 유사한 방식으로 대사되는 자연 뉴클레오티드의 알려진 유사체를 함유하는 핵산을 포함한다. 핵산 서열은 데옥시리보핵산 및 리보핵산의 조합을 포함할 수 있다. 이러한 데옥시리보핵산 및 리보핵산은 자연 발생 분자 및 합성 유사체를 모두 포함한다. 달리 나타내지 않는 한, 특정 핵산 서열은 축퇴 코돈 치환, 대립유전자, 오르톨로그, SNP 및 상보적 서열뿐만 아니라 명시적으로 나타낸 서열도 암시적으로 포함한다. 축퇴 코돈 치환은 하나 이상의 선택된(또는 모든) 코돈의 세 번째 위치가 혼합-염기 및/또는 데옥시이노신 잔기로 치환된 서열을 생성함으로써 달성될 수 있다.
용어 "동일성", "실질적인 동일성", "유사성", "실질적인 유사성", "상동성" 및 핵산 또는 아미노산 서열을 설명하는 맥락에서 사용되는 관련 용어 및 표현은 첨조 서열과 적어도 60% 서열 동일성을 갖는 서열을 지칭한다. 예는 표준 파라미터를 사용하는 BLAST와 같은 핵산 또는 아미노산 서열의 비교를 위한 프로그램을 사용하는 참조 서열과 비교하여, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함한다. 서열 비교를 위해, 전형적으로 하나의 서열이 테스트 서열과 비교되는 참조 서열로 작용한다. 서열 비교 알고리즘을 사용할 때, 테스트 및 참조 서열을 컴퓨터에 입력하고, 필요에 따라, 하위서열 좌표를 지정하고, 서열 알고리즘 프로그램 파라미터를 지정한다. 기본(표준) 프로그램 파라미터를 사용하거나 대체 파라미터를 지정할 수 있다. 그런 다음 서열 비교 알고리즘은 프로그램 파라미터를 기반으로 참조 서열에 대한 테스트 서열의 서열 동일성 퍼센트를 계산한다. "비교 창"은 인접 위치의 수(20 내지 600개, 일반적으로 약 50 내지 약 200개, 보다 일반적으로 약 100 내지 약 150개)의 임의의 하나의 세그먼트에 대한 참조를 포함하며, 여기서 서열은 두 서열이 최적으로 정렬된 후 인접 위치의 동일한 수의 참조 서열과 비교될 수 있다. 비교를 위한 서열 정렬 방법은 잘 알려져 있다. 비교를 위한 서열의 최적 정렬은, 예를 들어, Smith and Waterman, 1981의 국소 상동성 알고리즘, Needleman and Wunsch, 1970의 상동성 정렬 알고리즘, Pearson and Lipman, 1988의 유사성 검색 방법, 이러한 알고리즘의 컴퓨터 구현(예를 들어, BLAST), 또는 수동 정렬 및 육안 검사를 통해 수행될 수 있다.
서열 동일성 및 서열 유사성 퍼센트를 결정하는데 적합한 알고리즘은 각각 문헌[Altschul et al., 1990, and Altschul et al., 1977]에 기술된 BLAST 및 BLAST 2.0 알고리즘을 포함한다. BLAST 분석을 수행하기 위한 소프트웨어는 National Center for Biotechnology Information(NCBI) 웹 사이트를 통해 공개적으로 이용 가능하다. 이 알고리즘은 먼저 쿼리 서열에서 길이가 W인 짧은 단어를 식별하여 높은 점수 서열 쌍(HSP)을 식별하는 것을 포함하고, 이는 데이터베이스 서열에서 동일한 길이의 단어와 정렬될 때 일부 양의 값 임계 점수 T와 일치하거나 만족한다. T는 이웃 단어 점수 임계값이라고 지칭된다. 이러한 초기 이웃 단어 히트는 이를 포함하는 더 긴 HSP를 찾기 위한 검색을 시작하는 시드 역할을 한다. 그런 다음 누적 정렬 점수가 증가할 수 있는 한 단어 히트가 각 서열을 따라 양방향으로 확장된다. 누적 점수는 뉴클레오티드 서열에 대해 파라미터 M(일치하는 잔기 쌍에 대한 보상 점수; 항상 >0) 및 N(불일치 잔기에 대한 페널티 점수; 항상 <0)을 사용하여 계산된다. 아미노산 서열의 경우, 채점 매트릭스를 사용하여 누적 점수를 계산한다. 각 방향의 단어 히트의 확장은 누적 정렬 점수가 최대 달성 값에서 양 X만큼 떨어지거나; 누적 점수가 하나 이상의 음수-채점 잔기 정렬의 누적으로 인해 0 이하가 되거나; 서열의 끝에 도달했을 때 중지된다. BLAST 알고리즘 파라미터 W, T 및 X는 정렬의 감도 및 속도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열의 경우)은 기본값으로 단어 크기(W) 28, 기대값(E) 10, M=1, N=-2 및 두 가닥의 비교를 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 기본값으로 단어 크기(W) 3, 기대값(E) 10, 및 BLOSUM62 채점 매트릭스를 사용한다(Henikoff and Henikoff, 1989). BLAST 알고리즘은 또한 두 서열 간의 유사성에 대한 통계 분석을 수행한다(Karlin and Altschul, 1993). BLAST 알고리즘에 의해 제공되는 유사성의 한 척도는 최소 합계 확률(P(N))이며, 이는 두 뉴클레오티드 또는 아미노산 서열 사이의 일치가 우연히 발생할 확률을 나타낸다. 예를 들어, 테스트 핵산과 참조 핵산의 비교에서 최소 합계 확률이 약 0.01 미만, 보다 바람직하게는 약 10-5 미만, 가장 바람직하게는 약 10-20 미만인 경우 핵산은 참조 서열과 유사한 것으로 간주된다.
용어 "항체" 및 관련 용어는 또 다른 분자의 특정 공간 및 극성 조직에 결합하는 면역글로불린 또는 이의 단편을 지칭한다. 면역글로불린은 IgA, IgD, IgE, IgG1, IgG2a, IgG2b 및 IgG3, IgG4, IgM 등과 같은 다양한 클래스 및 아이소형을 포함한다. 항체는 모노클로날 또는 재조합일 수 있으며, 연속 하이브리드 세포주를 준비하고 분비된 단백질을 수집하는 것과 같은 실험실 기술에 의해, 또는 적어도 결합에 필요한 아미노산 서열을 코딩하는 뉴클레오티드 서열 또는 이들의 돌연변이된 버전을 클로닝 및 발현시켜 제조될 수 있다. 용어 "항체"는 인간화, 인간, 단일-사슬, 키메라, 합성, 재조합, 하이브리드, 돌연변이, 그래프트, 및 시험관 내 생성 항체 및 이들의 단편과 같은 천연, 인공적으로 변형된, 및 인공적으로 생성된 항체 형태를 포함한다. 용어 "항체"는 또한 면역글로불린 모이어티를 함유하는 융합 단백질을 포함하나 이에 제한되지 않는 복합 형태를 포함한다. "항체"는 또한 비-4차 항체 구조(예를 들어, 낙타 및 낙타 유도체)를 지칭한다. 항체 단편은 Fab, Fv 및 F(ab')2, Fab', scFv, Fd, dAb, Fc 등을 포함할 수 있다. 항체는 또한 단일-사슬 항체, 키메라 항체, 인간화 항체, 또는 특정 결합 부위에 특이적인 결합 활성을 유지하는 임의의 다른 항체 유도체일 수 있다. 또한, 면역글로불린 또는 이들의 단편의 응집체, 중합체 및 컨쥬게이트를 적절한 경우 사용할 수 있다.
"중화 항체"라는 표현은 감염 제제의 수명 주기 중 하나 이상의 부분을 중화 또는 억제함으로써 바이러스와 같은 감염 제제가 세포를 감염시키는 것을 막을 수 있는 항체를 지칭할 수 있다. 본 개시의 맥락에서, 중화 항체는 비제한적으로 SARS-CoV-2와 같은 코로나바이러스가 숙주 세포에서 수명 주기를 완료하는 것을 막을 수 있다. 예를 들어, 코로나바이러스와 같은 바이러스의 수명 주기는 바이러스가 숙주 세포에 부착하는 것으로 시작하여 숙주 세포에서 새로 형성된 바이러스의 발아로 끝난다. 이 수명 주기는 세포에 부착하는 단계, 세포에 진입하는 단계, 바이러스 막과 숙주 세포막의 융합 단계, 바이러스 리보핵단백질이 세포질로 방출되는 단계, 새로운 바이러스 입자가 형성되는 단계 및 숙주 세포막에서 바이러스 입자가 발아되는 단계를 포함하나 이에 제한되지 않는다.
용어 "면역원성" 및 관련 용어는 본 개시의 맥락에서 사용되는 경우, 단백질, 폴리펩티드, 또는 단백질 또는 폴리펩티드의 영역일 수 있는 항원이 대상체에서 특정 항원에 대한 면역 반응을 유도하는 능력을 지칭한다. 본 개시의 맥락에서, 면역 반응은 대상체에서 항원에 대한 체액성 및/또는 세포성 면역 반응의 발달이다. "체액성 면역 반응"은 분비(IgA) 또는 IgG 분자를 포함하는 항체 분자에 의해 매개되는 면역 반응을 지칭하는 반면, "세포성 면역 반응"은 T-림프구 및/또는 다른 백혈구에 의해 매개되는 반응이다. 세포성 면역의 한 가지 중요한 양태는 세포용해성 T-세포("CTL")에 의한 항원-특이적 반응을 포함한다. CTL은 주요 조직 적합성 복합체(MHC)에 의해 인코딩되고 세포 표면에서 발현되는 단백질과 관련하여 제시되는 펩티드 항원에 대한 특이성을 갖는다. CTL은 세포내 미생물의 파괴 또는 이러한 미생물에 감염된 세포의 용해를 유도하고 촉진하는데 도움이 된다. 세포 면역의 또 다른 양태는 헬퍼 T-세포에 의한 항원-특이적 반응을 포함한다. 헬퍼 T-세포는 표면에 MHC 분자와 관련하여 펩티드 항원을 표시하는 세포에 대해 비특이적 이펙터 세포의 기능을 자극하고 활성을 집중하는데 도움을 주는 역할을 한다. 세포 면역 반응은 또한 CD4+ 및 CD8+ T-세포로부터 유래된 것을 포함하여, 활성화된 T-세포 및/또는 다른 백혈구에 의해 생산된 사이토카인, 케모카인 및 다른 이러한 분자의 생산을 지칭한다. 따라서, 면역원성 조성물은 CTL 및/또는 헬퍼 T 세포의 생산 또는 활성화를 자극할 수 있다. 케모카인 및/또는 사이토카인의 생산도 자극될 수 있다. 면역원성 조성물은 또한 항체-매개 면역 반응을 유도할 수 있다. 면역원성 조성물은 대상체에게 투여시 다음 효과 중 하나 이상을 포함할 수 있다: B-세포에 의한 항체 생산; 및/또는 면역원성 조성물에 존재하는 항원 단백질에 특이적으로 지시된 억제제, 세포독성 또는 헬퍼 T-세포 및/또는 T-세포의 활성화. 대상체에서 유도된 면역 반응은 코로나바이러스, 예를 들어, SARS-CoV-2와 같은 바이러스의 감염성을 중화하고/거나 항체-보체 또는 항체 의존성 세포 세포독성(ADCC)을 매개하여 면역화된 대상체에게 바이러스 감염에 대한 보호를 제공하는 역할을 할 수 있다. 면역원성 조성물에 의해 유도된 면역 반응의 다양한 양태는 표준 검정을 사용하여 결정될 수 있으며, 그 중 일부는 본 개시에 기술되어 있다.
본 개시에 기재된 바와 같은 면역원성 조성물은 또한 "백신"으로 지칭될 수 있다. 면역원성 조성물 또는 백신은 투여시 대상체에서 이들에 대한 면역 반응을 유도하는 항원을 함유할 수 있다. 예를 들어, 본 개시에 기재된 일부 면역원성 조성물 또는 백신은 투여시 대상체에서 이들에 대한 면역 반응을 유도할 수 있는 SARS-CoV-2 스파이크 단백질 항원과 같은 코로나바이러스 스파이크 단백질 항원을 함유한다. 면역원성 조성물은 또한 이러한 항원을 인코딩하는 핵산 서열을 함유할 수 있다. 예를 들어, 본 개시에 기재된 일부 면역원성 조성물 또는 백신은 SARS-CoV-2 스파이크 단백질 항원과 같은 코로나바이러스 스파이크 단백질 항원을 인코딩하는 핵산 서열을 함유한다. 항원-인코딩 핵산 서열을 함유하는 면역원성 조성물은 "핵산 백신"으로 기술되거나 지칭될 수 있다. "핵산 백신"이라는 표현 및 관련 용어 및 표현은 네이키드 DNA 백신, 예를 들어, 플라스미드 백신, 및 바이러스 벡터에 포함되고/거나 바이러스 입자로서 전달되는 바이러스 벡터-기반 핵산 백신을 포함한다.
용어 "항원"은 대상체의 면역 시스템을 자극하여 항원-특이적 면역 반응을 생성할 수 있는 하나 이상의 에피토프(선형, 입체형태 또는 둘 모두)를 포함하는 분자, 예를 들어, 폴리펩티드를 지칭한다. 폴리펩티드 에피토프는 약 7 내지 15개의 아미노산, 예를 들어, 9, 10, 12 또는 15개의 아미노산을 포함할 수 있다. 예를 들어, "코로나바이러스 스파이크 단백질 항원"이라는 표현은 SARS-CoV-2 스파이크 단백질과 같은 코로나바이러스 스파이크 단백질의 폴리펩티드를 지칭할 수 있다. 용어 "항원"은 용어 "면역원"과 상호교환적으로 사용될 수 있다.
"바이러스"는 복수 및 단수의 의미로 모두 사용된다. "비리온"은 단일 바이러스를 지칭한다. 예를 들어, "코로나바이러스 비리온"이라는 표현은 코로나바이러스 입자를 지칭한다.
코로나바이러스는 포유동물 및 조류에서 질병을 일으키는 외피보유 단일 가닥 RNA 바이러스 그룹이다. 코로나바이러스 숙주는 박쥐, 돼지, 개, 고양이, 마우스, 래트, 소, 토끼, 닭 및 칠면조를 포함한다. 인간에서, 코로나바이러스는 경증 내지 중증의 호흡기 감염을 일으킨다. 코로나바이러스는 위험 요인이 매우 다양하다. 일부는 감염된 대상체의 30% 이상을 죽일 수 있다. 인간 코로나바이러스의 일부 예는 인간 코로나바이러스 229E(HCoV-229E); 인간 코로나바이러스 OC43(HCoV-OC43); 중증 급성 호흡기 증후군 코로나바이러스(SARS-CoV); 인간 코로나바이러스 NL63(HCoV-NL63, New Haven 코로나바이러스); 감염된 마우스에서 유래한 인간 코로나바이러스 HKU1(HCoV-HKU1)은 2005년 1월 홍콩의 두 환자에서 처음 발견되었다; 신종 코로나바이러스 2012 및 HCoV-EMC로도 알려진 중동 호흡기 증후군-관련 코로나바이러스(MERS-CoV); 및 2019-nCoV 또는 "신종 코로나바이러스 2019"로도 알려진 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)(Wu et al., 2020). 인간에서, SARS-CoV-2는 COVID-19라는 코로나바이러스 질병을 일으켜 심각한 증상과 사망을 초래할 수 있다.
스파이크 단백질(또는 "S 단백질")은 코로나바이러스 비리온과 숙주 세포 사이의 수용체 결합 및 막 융합을 매개할 수 있는 코로나바이러스 표면 단백질이다. 코로나바이러스 비리온 표면의 특징적인 스파이크는 스파이크 단백질 동종삼량체의 엑토도메인에 의해 형성된다. 코로나바이러스 스파이크 단백질은 21 내지 35개의 N-글리코실화 부위를 포함하는 다양한 버전으로 고도로 글리코실화된다. 다른 인간-병원성 외피보유 RNA 바이러스에서 발견되는 삼량체 당단백질과 비교하여, 코로나바이러스 스파이크 단백질은 상당히 더 크며 삼량체 당 총 거의 700 kDa이다. 코로나바이러스 스파이크 단백질의 엑토도메인은 숙주 세포 표면의 수용체 결합을 담당하는 S1이라는 N-말단 도메인 및 융합을 담당하는 C-말단 S2 도메인을 포함한다. SARS-CoV-2 스파이크 단백질의 S1 도메인은 숙주 세포의 안지오텐신-전환 효소 2(ACE2)에 결합할 수 있다. ACE2를 인식하는 SARS-CoV-2 스파이크 단백질 S1 도메인의 영역은 수용체 결합 도메인(RBD)이라고 하는 25 kDa 도메인이다(Walls et al., 2020). 독립형 폴리펩티드로 발현될 때, RBD는 ACE2에 결합할 수 있는 기능적으로 폴딩된 도메인을 형성할 수 있다. 다른 코로나바이러스에서, 스파이크 단백질은 비리온의 조립 및 세포외유출 동안 절단되거나 절단되지 않을 수 있다. 대부분의 알파코로나바이러스, 및 베타코로나바이러스 SARS-CoV에서, 비리온은 절단되지 않은 스파이크 단백질을 보유하는 반면, SARS-CoV-2를 포함한 일부 베타코로나바이러스의 비리온, 및 알려진 감마코로나바이러스에서, 스파이크 단백질은 S1과 S2 도메인 사이에서 절단된 것으로 발견된다. 이러한 비리온에서, 스파이크 단백질은 전형적으로 골지-상주 숙주 프로테아제인 푸린에 의해 절단된다. 따라서, SARS-CoV-2 스파이크 단백질의 자연 발생 또는 "야생형" 아미노산 서열(이는 최초의 바이러스 SARS-CoV-2 분리주인 Wuhan-Hu-1의 서열로 간주됨)은 S1과 S2 도메인 사이에 푸린 절단 부위를 포함한다. 코로나바이러스 스파이크 단백질의 S2 도메인은 2개의 헵타드 반복인 HR1 및 HR2를 포함하며, 이는 융합 과정에 참여하는 코일드-코일 형성의 반복적인 헵타펩티드 특성을 포함한다. COVID-19 환자의 혈청 분석은 스파이크 단백질에 대한 항체가 유도되고 바이러스가 숙주 세포로 진입하는 것을 억제할 수 있음을 보여준다(Brouwer et al., 2020). SARS-CoV-2 스파이크 단백질의 첫 번째 cryo-EM 구조는 문헌[Wrapp et al., 2020]에 설명되어 있다.
SARS-CoV-2 스파이크 단백질의 "야생형" 아미노산 서열 - SEQ ID NO:1
Figure pct00001
단백질 또는 폴리펩티드의 "도메인"은 구조적 및/또는 기능적 특성에 의해 정의되는 단백질 또는 폴리펩티드의 영역을 지칭한다. 예시적인 기능 특성은 효소 활성 및/또는 다른 단백질 또는 비단백질 실체에 결합하거나 결합되는 능력을 포함한다. 예를 들어, 코로나바이러스 스파이크 단백질은 S1 및 S2 도메인을 포함한다.
용어 "올리고머" 및 관련 용어는 폴리펩티드 또는 단백질과 관련하여 사용될 때 "서브유닛" 또는 "사슬"이라고도 지칭될 수 있는 2개 이상의 폴리펩티드 또는 단백질 단량체에 의해 형성된 복합체를 지칭한다. 예를 들어, 삼량체는 3개의 폴리펩티드 서브유닛으로 형성된 올리고머이다.
용어 "융합 단백질", "융합 폴리펩티드" 및 관련 용어는 단일 폴리펩티드를 형성하기 위해 융합 단백질 아미노산 서열로 결합되거나 연결된, 이전에 별도의 폴리펩티드 분자에서 발견된 2개 이상의 아미노산 서열을 포함하는 인공 또는 조작된 폴리펩티드 분자를 포함하는 폴리펩티드 분자에 관한 것이다. 예를 들어, 융합 단백질은 단일 단백질을 만들기 위해 펩티드 결합을 통해 함께 결합된 적어도 2개의 관련이 없는 단백질로부터의 아미노산 서열을 함유하는 조작된 재조합 단백질일 수 있다. 이러한 맥락에서, 단백질은 아미노산 서열이, 예를 들어, 세포 내부와 같은 자연 환경에서 펩티드 결합을 통해 함께 결합된 것으로 일반적으로 발견되지 않는 경우 관련이 없는 것으로 간주된다. 예를 들어, 본 개시는 관련이 없는 단백질인 코로나바이러스의 스파이크 단백질의 아미노산 서열과 페리틴 서브유닛 폴리펩티드의 아미노산 서열을 포함하는 융합 단백질을 기술한다. 융합 단백질의 아미노산 서열은 "인 프레임(in frame)"으로 결합된 상응하는 핵산 서열에 의해 인코딩되어 전사되고 번역되어 단일 폴리펩티드를 생산한다. 융합 단백질의 아미노산 서열은 인접하거나 하나 이상의 스페이서, 링커 또는 힌지 서열에 의해 분리될 수 있다. 융합 단백질은, 예를 들어, 신호 서열, 태그 서열 및/또는 링커 서열과 같은 추가적인 아미노산 서열을 포함할 수 있다.
페리틴은 동물, 박테리아 및 식물에서 발견되는 구상 단백질이며, 주로 수화된 철 이온 및 양성자를 광물화된 코어로 또는 그로부터 수송함으로써 다핵 Fe(III)2O3 형성의 속도 및 위치를 제어하는 역할을 한다. 페리틴의 구상 형태는 약 17-20 kDa의 분자량을 갖는 폴리펩티드인 단량체 서브유닛 단백질(단량체 페리틴 서브유닛이라고도 함)로 구성된다. 하나의 이러한 단량체 페리틴 서브유닛의 서열의 예는 SEQ ID NO:2로 표시된다. 각 단량체 페리틴 서브유닛은 4개의 역평행 나선 모티프를 포함하는 나선 다발의 토폴로지를 가지며, 다섯 번째로 짧은 나선(c-말단 나선)은 4개의 나선 다발의 긴 축에 대략 수직으로 놓여 있다. 관례에 따르면, 나선은 각각 N-말단으로부터 'A, B, C 및 D & E'로 라벨링된다. N-말단 서열은 캡시드 3중 축에 인접하게 놓여 표면으로 확장되는 반면, E 나선은 C-말단이 입자 코어로 확장되는 4중 축에서 함께 패킹된다. 이 패킹의 결과로 캡시드 표면에 2개의 기공이 생성된다. 이러한 기공 중 하나 또는 둘 모두는 수화된 철이 캡시드 안팎으로 확산되는 지점을 나타내는 것으로 예상된다. 생산 후, 이러한 단량체 페리틴 서브유닛 단백질은 구상 페리틴 단백질로 자가-조립된다. 따라서, 구상 형태의 페리틴은 24개의 단량체 페리틴 서브유닛 단백질을 포함하고, 432개의 대칭을 갖는 캡시드-유사 구조를 갖는다.
처음 5개 아미노산의 N-말단 결실을 갖는 헬리코박터 파일로리 페리틴 서브유닛의 아미노산 서열 - SEQ ID NO:2
Figure pct00002
용어 "개체", "대상체" 및 "환자"는 비인간 동물 또는 인간을 지칭하기 위해 본 개시에서 상호교환적으로 사용될 수 있다. 대상체의 예는 침팬지 및 기타 유인원 및 원숭이 종과 같은 비인간 영장류를 포함하는 인간 및 기타 영장류; 소, 양, 돼지, 물개, 염소 및 말과 같은 농장 동물; 개 및 고양이와 같은 가정용 포유동물; 마우스, 래트 및 기니피그와 같은 설치류를 포함하는 실험실 동물; 닭, 칠면조 및 기타 순계류 조류, 오리, 거위 등과 같은 가정용, 야생 및 사냥감 조류를 포함하는 조류를 포함하나 이에 제한되지 않는다. 개체, 대상체 및 환자라는 용어 자체는 특정 연령, 성별, 인종 또는 임상 상태를 나타내지 않는다. 따라서, 남성이든 여성이든 모든 연령의 대상체는 본 개시에 포함되도록 의도되며 노인, 성인, 어린이, 아기, 유아 및 영아를 포함하나 이에 제한되지 않는다. 마찬가지로, 본 발명의 방법은, 예를 들어, 백인(백인), 아프리카계 미국인(흑인), 미국 원주민, 하와이 원주민, 히스패닉, 라틴계, 아시아인 및 유럽인을 포함하는 모든 인종에 적용될 수 있다. 감염된 대상체는 코로나바이러스, 예를 들어, SARS-CoV-2와 같은 감염 유기체에 의해 감염된 것으로 알려진 대상체이다.
"투여하는" 또는 "투여"라는 용어는 대상체에게 본 개시에 기재된 조성물을 투여하는 맥락에서 사용될 때(및 관련 용어 및 표현), 신체 외부에 존재하는 물질(예를 들어, 본 개시에 기재된 면역원성 조성물)을 대상체에게 물리적으로 전달하는 행위를 지칭한다. 투여는 점막, 피내, 정맥내, 근육내, 피하 전달 및/또는 임의의 다른 공지된 물리적 전달 방법에 의한 것일 수 있다. 투여는 의료 전문가 또는 자가-투여에 의한 대상체로의 투여와 같은 직접 투여, 또는 본 개시에 기재된 조성물을 처방하는 행위일 수 있는 간접 투여를 포함한다.
용어 "글리코실화" 및 관련 용어 및 표현은 폴리펩티드 또는 단백질 분자의 특정 아미노산에 탄수화물 모이어티("글리칸"이라고도 함)를 첨가하는 단백질 및 폴리펩티드의 번역 후 변형의 과정 및/또는 결과를 지칭한다. N-결합된 글리코실화에서, 탄수화물 모이어티가 아스파라긴에 첨가된다. O-결합된 글리코실화에서, 탄수화물 모이어티가 세린 또는 트레오닌에 첨가된다. 탄수화물 모이어티의 부착은 공통 아미노산 서열("공통 서열")의 인식을 필요로 한다.
융합 단백질 및 나노입자
코로나바이러스의 스파이크 단백질("코로나바이러스 스파이크 단백질")의 아미노산 서열 및 페리틴 서브유닛 폴리펩티드의 아미노산 서열을 포함하는 융합 단백질이 본 개시에 제공되고 본 발명의 구현예에 포함된다. 본 발명의 구현예에 따른 융합 단백질에 포함된 코로나바이러스 스파이크 단백질 아미노산 서열은 "스파이크 폴리펩티드", "스파이크 단백질 도메인" 또는 "스파이크 도메인"으로도 지칭될 수 있으며, 페리틴 서브유닛 폴리펩티드 아미노산 서열은 "페리틴 아미노산 서열", "페리틴", "페리틴 도메인" 또는 "페리틴 폴리펩티드"로 지칭될 수 있다. 본 발명의 구현예에 따른 융합 단백질은, 상기 아미노산 서열 이외에, 비제한적으로 스파이크 도메인 및 페리틴 도메인 이외의 폴리펩티드 도메인의 아미노산 서열, 링커 서열, 신호 서열, 태그 등과 같은 다른 아미노산 서열을 포함할 수 있다. 이러한 다른 아미노산 서열 중 일부는 본 개시의 다른 곳에 기술되어 있다.
본 발명의 구현예에 따른 융합 단백질에 포함된 코로나바이러스 스파이크 단백질의 아미노산 서열은 알파코로나바이러스, 베타코로나바이러스, 감마코로나바이러스 또는 델타코로나바이러스와 같은 임의의 코로나바이러스로부터의 스파이크 단백질 서열일 수 있다. 본 개시에 기재된 융합 단백질의 일부 구현예는 인간 베타코로나바이러스, 예를 들어, SARS-CoV, MERS-CoV 및 SARS-CoV-2를 포함하나 이에 제한되지 않는 인간을 감염시킬 수 있는 코로나바이러스("인간 코로나바이러스")의 스파이크 단백질의 아미노산 서열을 포함한다. 본 개시에 기재된 융합 단백질의 일부 구현예는 BatCoV RaTG13, Bat SARSr-CoV ZXC21, Bat SARSr-CoV ZC45, BatSARSr-CoV WIV1, 또는 예를 들어 문헌[Zhang et al., 2020]에 기재된 다른 코로나바이러스를 포함하나 이에 제한되지 않는 비인간 동물을 감염시킬 수 있는 코로나바이러스의 스파이크 단백질의 아미노산 서열을 포함한다. 코로나바이러스 스파이크 단백질 서열은 자연 발생 및 인공적으로 생성된 변이체를 포함하여, 스파이크 단백질의 전체 또는 부분 아미노산 서열, 스파이크 단백질 단편의 아미노산 서열 또는 스파이크 단백질 변이체의 아미노산 서열일 수 있음을 이해해야 한다. 스파이크 단백질 아미노산 서열의 예시적인 변이체 중 일부는 비제한적으로 변이체 D614G, B.1.1.7("알파 변이체"로도 알려져 있음), B.1.429("LA 변이체"로도 알려져 있음), P1("감마 변이체"로도 알려져 있음), 및 B.1.351("베타 변이체"로도 알려져 있음), 또는 B.1.617.2("델타 변이체"로도 알려져 있음)와 같은 자연적으로 순환하는 SARS-CoV-2 변이체에서 발견되는 변이체이다.
융합 단백질의 일부 구현예는 코로나바이러스 스파이크 단백질의 자연 발생(또는 "야생형") 아미노산 서열 또는 이의 일부를 함유할 수 있다. 이러한 야생형 서열의 일부 비제한적인 예는 코로나바이러스 스파이크 단백질의 S1 도메인의 야생형 아미노산 서열; 코로나바이러스 스파이크 단백질의 RBD 도메인의 야생형 아미노산 서열; 또는 하나 이상의 C-말단, N-말단 또는 중간 부분이 결실된 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 일례는 HR2 아미노산 서열을 포함하는 C-말단 결실을 갖는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열의 일부 다른 예는 "변이체"로도 지칭될 수 있는 자연 발생 SARS-CoV-2 균주에서 발견되는 SEQ ID NO:1과 비교하여 돌연변이를 포함하는 서열이다. 이러한 예 중 하나는 SARS-CoV-2 변이체 계통 B.1.1.7의 균주 SARS-CoV-2 VUI 202012/01에서 발견된 바와 같이 (SEQ ID NO:1에 관해) 잔기 69-70 및 잔기 144의 결실을 갖는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 또 다른 예는 SARS-CoV-2 변이체 D614G에서 발견된 바와 같이 (SEQ ID NO:1에 관해) 잔기 614에서 D에서 G로 치환된 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 또 다른 예는 SARS-CoV-2 변이체 B.1.429에서 발견된 바와 같이 (SEQ ID NO:1에 관해) S13I, W152C, L452R 및 D614G 치환을 갖는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 또 다른 예는 SARS-CoV-2 변이체 P1에서 발견된 바와 같이 (SEQ ID NO:1에 관해) L18F, T20N, P26S, D138Y, R190S, K417T, E484K, N501Y, D614G, H655Y, T1027I 치환을 갖는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 또 다른 예는 SARS-CoV-2 변이체 B.1.351에서 발견된 바와 같이 (SEQ ID NO:1에 관해) L18F, D80A, D215G, 242-244 del, R246I, K417N, E484K, N501Y, D614G, A701V 치환을 갖는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 또 다른 예는 SARS-CoV-2 변이체 B.1.1.7에서 발견된 바와 같이 (SEQ ID NO:1에 관해) 잔기 69-70 및 잔기 144의 결실, 및 (SEQ ID NO:1에 관해) N501Y, A570D, D614G, P681H, T716I, S982A, D1118H 치환을 갖는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 또 다른 예는 잔기 SARS-CoV-2 변이체 B.1.617.2에서 발견된 바와 같이 (SEQ ID NO:1에 관해) 잔기 156-157의 결실, 및 (SEQ ID NO:1에 관해) T19R, G142D, R158G, L452R, T478K, D614G, P681R 및 D950N 치환을 갖는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 추가적인 예는 HR2 아미노산 서열 앞에 코로나바이러스 스파이크 단백질 내의 몇 개의 잔기(예를 들어, 1-5개)가 결실된 다른 자연 발생 균주의 서열을 포함한다. 코로나바이러스 스파이크 단백질의 상기 아미노산 서열의 특징 중 일부는 표 1에 요약되어 있다. 본 개시에 따른 SARS-CoV-2 스파이크 단백질 항원의 일부 예에서, 위에서 논의되고 위에서 요약된 것을 포함하나 이에 제한되지 않는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열의 다양한 특징 및 돌연변이는 다양한 조합 및 하위조합에서 발견될 수 있음을 이해해야 한다.
표 1. 코로나바이러스 스파이크 단백질의 아미노산 서열에서 발견되는 예시적인 특징(SEQ ID NO:1에 관해).
Figure pct00003
융합 단백질의 일부 구현예는 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열 또는 이의 일부를 함유할 수 있다. 일부 비제한적인 예에서, 인공적으로 변형된 아미노산 서열은 비제한적으로 본 개시에 논의된 것들과 같은 코로나바이러스 스파이크 단백질 서열의 야생형 아미노산 서열의 하나 이상의 특징을 포함할 수 있다. 일부 예시적인 구현예에서, 코로나바이러스 스파이크 단백질 서열의 야생형 아미노산 서열의 특징은 자연 발생 서열에서 발견되지 않는 방식으로 조합될 수 있다. 예를 들어, 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열 또는 이의 일부는 비제한적으로 변이체 D614G, B.1.1.7, B.1.429, B.1.351, P1 및 B.1.617.2와 같은 2개 이상의 자연적으로 순환하는 SARS-CoV-2 변이체 각각의 하나 이상의 특징을 포함할 수 있다. 이러한 인공적으로 변형된 서열의 일부 다른 비제한적인 예는 코로나바이러스 스파이크 단백질의 S1 도메인의 인공적으로 변형된 아미노산 서열; 코로나바이러스 스파이크 단백질의 RBD 도메인의 인공적으로 변형된 아미노산 서열; 또는 하나 이상의 C-말단, N-말단 또는 중간 부분이 결실된 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열, 예를 들어, HR2 아미노산 서열을 포함하는 C-말단이 결실된 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열이다. 융합 단백질의 일부 예시적인 구현예는 HR2 아미노산 서열을 포함하는 S2 도메인에서 C-말단이 결실된 자연 발생 또는 인공적으로 변형된 코로나바이러스 스파이크 단백질 아미노산 서열을 포함한다. 예를 들어, 코로나바이러스 스파이크 단백질 아미노산 서열은 HR2 아미노산 서열의 결실 또는 S2 도메인의 C-말단 아미노산의 70개 이하, 60개 이하 또는 50개 이하, 예를 들어, 50 내지 70개의 결실을 포함할 수 있다. 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 야생형 서열과 비교하여 다양한 아미노산 변형을 포함할 수 있다. 예를 들어, 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 글리코실화 부위를 제거하거나 첨가하는 돌연변이를 포함할 수 있다. 또 다른 예에서, 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 푸린 인식 부위와 같은 프로테아제 인식 부위를 제거하는 하나 이상의 돌연변이를 포함할 수 있다. 또 다른 예에서, 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 예비-융합 입체형태에서 스파이크 도메인을 안정화시키는 돌연변이와 같이 스파이크 도메인의 입체형태에 영향을 미치는 하나 이상의 돌연변이를 포함할 수 있다. 야생형 SARS-CoV-2 스파이크 단백질 서열의 일부 예시적인 변형은, 예를 들어, 문헌[Amanat et al., 2020 and Hhsieh et al., 2020]에 기재되어 있다. 문헌[Amanat et al., 2020]에 기재된 SEQ ID NO:3은 푸린 절단 부위 PRAR 서열이 알라닌(SEQ ID NO 1 및 3의 잔기 667)으로 돌연변이되고 SEQ ID NO:1의 잔기 968 및 969에서 프롤린 치환을 갖는 인공적으로 변형된 SARS-CoV-2 스파이크 단백질 서열이다. 문헌[Hhsieh et al., 2020]에 기재된 SEQ ID NO:14는 6개의 프롤린 치환 F817P, A892P, A899P, A942P(모두 SEQ ID NO:1에 대해 표시됨), 및 SEQ ID NO:1의 잔기 968 및 969에서 프롤린 치환을 갖는 인공적으로 변형된 SARS-CoV-2 스파이크 단백질 서열("HexaPro")이다.
인공적으로 변형된 SARS-CoV-2 스파이크 단백질 서열 - SEQ ID NO:3; PRAR 푸린 절단 부위에서 알라닌으로 돌연변이 및 프롤린 치환은 굵게 표시됨
Figure pct00004
인공적으로 변형된 SARS-CoV-2 스파이크 단백질 서열 "HexaPro" - SEQ ID NO:14; 프롤린 치환은 굵게 표시됨
Figure pct00005
일부 구현예에서, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질의 아미노산 서열은 SARS-CoV-2 스파이크 단백질 아미노산 서열의 야생형 또는 인공적으로 변형된 아미노산 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열이다. 일부 구현예에서, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질의 아미노산 서열은 SARS-CoV-2 스파이크 단백질 아미노산 서열의 야생형 또는 인공적으로 변형된 아미노산 서열의 일부와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열이다. 일부 경우에, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질은 하나 이상의 아미노산 잔기 치환을 포함하는 보존적으로 변형된 변이체 스파이크 단백질이다. 일부 경우에, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질은 단백질의 C-말단, N-말단 및/또는 중간 부분에서 하나 이상의 아미노산 잔기의 결실을 포함한다. 일부 경우에, 결실은 하나 이상의 연속 아미노산 잔기를 포함할 수 있다. 일부 경우에, 결실은 하나 이상의 비연속 아미노산 잔기를 포함할 수 있다. 일부 경우에, 스파이크 단백질은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 잔기의 결실을 포함할 수 있다. 일부 경우에, 스파이크 단백질은 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100개의 아미노산 잔기의 결실, 예를 들어, 10-15, 15-30, 25-50, 10-50 또는 50-100개의 아미노산 잔기의 결실을 포함할 수 있다. 예를 들어, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질의 아미노산 서열은 SEQ ID NO:1의 잔기 15 내지 1146, SEQ ID NO:1의 잔기 15 내지 1213 또는 SEQ ID NO:1의 잔기 1 내지 1146과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열일 수 있다. 일부 구현예에서, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질의 아미노산 서열은 SEQ ID NO:3과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열이다. 일부 구현예에서, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질의 아미노산 서열은 SEQ ID NO:4와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열이다. 일부 구현예에서, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질의 아미노산 서열은 SEQ ID NO:14와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열이다. 일부 구현예에서, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질의 아미노산 서열은 SEQ ID NO:15와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열이다.
인공적으로 변형된 부분 SARS-CoV-2 스파이크 단백질 서열 - SEQ ID NO:4
Figure pct00006
인공적으로 변형된 부분 SARS-CoV-2 스파이크 단백질 서열 - SEQ ID NO:15
Figure pct00007
본 발명의 구현예에 따른 융합 단백질은 페리틴 서브유닛 폴리펩티드의 아미노산 서열("페리틴 아미노산 서열")을 포함한다. 페리틴 아미노산 서열은 전장, 단일 페리틴 폴리펩티드의 아미노산 서열, 또는 단량체 페리틴 서브유닛의 올리고머로의 자가-조립을 지시할 수 있는 페리틴 아미노산 서열의 임의의 부분일 수 있다. 페리틴 아미노산 서열을 포함하는 융합 단백질은, 예를 들어, 미국 특허 번호 7,097,841에 기재되어 있다. 임의의 페리틴 단백질의 단량체 페리틴 서브유닛의 아미노산 서열 또는 이의 일부는 단량체 페리틴 서브유닛이 올리고머 또는 나노입자로 자가-조립될 수 있는 한 본 개시의 융합 단백질을 생산하는데 사용될 수 있다. 올리고머 또는 나노입자로 자가-조립되는 능력에 영향을 미치지 않으면서 페리틴 단백질의 아미노산 서열에서 변형이 이루어질 수 있다. 이러한 변형은 아미노산 잔기의 삽입, 아미노산 잔기의 결실 또는 아미노산 잔기의 치환을 포함한다. 예를 들어, 본 발명의 구현예에 따른 융합 단백질에 포함된 단량체 페리틴 서브유닛의 서열은 포유동물 페리틴 아미노산 서열로부터 유래될 수 있지만, 자연 발생 서열로부터 충분히 분기될 수 있으므로, 포유동물 페리틴 아미노산 서열이 유래된 종의 포유동물 대상체에게 면역원으로서 투여될 때, 이는 포유동물의 자연 페리틴 단백질과 반응하는 항체의 생산을 초래하지 않는다. 페리틴 아미노산 서열은 박테리아 페리틴 단백질, 식물 페리틴 단백질, 조류 페리틴 단백질, 곤충 페리틴 단백질, 진균 페리틴 단백질 및/또는 포유동물 페리틴 단백질로부터 유래될 수 있다. 본 개시의 융합 단백질의 일부 구현예에서, 페리틴 아미노산 서열은 H. 파일로리로부터 유래된다. 예를 들어, 본원에 제공된 바와 같은 융합 단백질에 포함된 페리틴 아미노산 서열은 SEQ ID NO:2와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열일 수 있거나 서열로부터 유래될 수 있다. 위에서 논의된 바와 같이, 본 발명의 구현예에 따른 융합 단백질은 H. 파일로리의 페리틴 서브유닛 폴리펩티드의 전장 서열을 포함할 필요가 없다. 단량체 페리틴 서브유닛의 올리고머로의 자가-조립을 지시하는 아미노산 서열을 함유하는 H. 파일로리 페리틴 서브유닛 폴리펩티드의 일부 또는 영역이 사용될 수 있다. 이러한 영역의 한 예는 아미노산 서열 H. 파일로리 페리틴 단백질의 아미노산 5와 168 사이에 위치한다. 더 많은 영역은 문헌[Zhang, 2011]에 개시되어 있다.
본 발명의 구현예에 따른 융합 단백질에 포함된 페리틴 아미노산 서열은 인공 글리코실화 부위, 예를 들어, 인공 (조작된) N-글리코실화 부위를 포함할 수 있으며, 이는 페리틴 아미노산 서열에 인공 돌연변이를 삽입하여 공통 글리코실화 서열을 생성하도록 조작된다. 예를 들어, 페리틴 핵산 서열에 공통 서열 NXS/T(여기서 X는 P일 수 없음)를 도입함으로써 인공 N-글리코실화 부위가 생성될 수 있다. 공통 글리코실화 서열은 페리틴 아미노산 서열에서 아미노산 잔기의 인공 치환에 의해 생성될 수 있다. 예를 들어, SEQ ID NO:2의 인공 N-글리코실화 부위는 2개의 아미노산 치환을 도입함으로써 생성될 수 있다: SEQ ID NO:2의 위치 75에 상응하는 위치에서 K에서 N, 그리고 SEQ ID NO:2의 위치 75에 상응하는 위치에서 E에서 T. 또 다른 예에서, SEQ ID NO:2의 인공 N-글리코실화 부위는 2개의 아미노산 치환을 도입함으로써 생성될 수 있다: SEQ ID NO:2의 위치 67에 상응하는 위치에서 T에서 N, 그리고 SEQ ID NO:2의 위치 69에 상응하는 위치에서 I에서 T. 또 다른 예에서, SEQ ID NO:2의 인공 N-글리코실화 부위는 2개의 아미노산 치환을 도입함으로써 생성될 수 있다: SEQ ID NO:2의 위치 74에 상응하는 위치에서 H에서 N, 그리고 SEQ ID NO:2의 위치 76에 상응하는 위치에서 F에서 T. 또 다른 예에서, SEQ ID NO:2의 인공 N-글리코실화 부위는 2개의 아미노산 치환을 도입함으로써 생성될 수 있다: SEQ ID NO:2의 위치 143에 상응하는 위치에서 E에서 N, 그리고 SEQ ID NO:2의 위치 145에 상응하는 위치에서 H에서 T.
본 발명에 따른 융합 단백질의 구현예는 페리틴 서브유닛 폴리펩티드의 아미노산 서열의 적어도 25개의 인접 아미노산, 적어도 50개의 인접 아미노산, 적어도 75개의 인접 아미노산, 적어도 100개의 인접 아미노산 또는 적어도 150개의 인접 아미노산에 연결된 SARS-CoV-2와 같은 코로나바이러스의 스파이크 단백질의 아미노산 서열(예를 들어, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:14 또는 SEQ ID NO:15와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열)을 포함한다. 본 발명에 따른 융합 단백질의 구현예에서, 페리틴 서브유닛 폴리펩티드의 아미노산 서열은 코로나바이러스의 스파이크 단백질의 아미노산 서열 뒤에(즉, 스파이크 단백질 아미노산 서열에 대해 하류 또는 C' 말단) 위치한다. 페리틴 서브유닛 폴리펩티드의 아미노산 서열의 존재로 인해, 본 발명의 구현예에 따른 융합 단백질은 나노입자로 조립되며, 이는 본 개시의 다른 곳에서 더 상세히 기술된다. 융합 단백질의 일부 구현예에서, 코로나바이러스의 스파이크 단백질의 아미노산 서열은 H. 파일로리의 페리틴 서브유닛 폴리펩티드의 아미노산 서열의 적어도 25개의 인접 아미노산, 적어도 50개의 인접 아미노산, 적어도 75개의 인접 아미노산, 적어도 100개의 인접 아미노산 또는 적어도 150개의 인접 아미노산에 연결된다. 본 발명의 구현예에 따른 융합 단백질에 포함된 H. 파일로리의 페리틴 서브유닛 폴리펩티드의 아미노산 서열은 SEQ ID NO:2와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 가질 수 있다. 본 발명의 구현예에 따른 융합 단백질에 포함된 H. 파일로리의 페리틴 서브유닛 폴리펩티드의 아미노산 서열은 올리고머 또는 나노입자로 자가-조립되는 융합 단백질을 생성한다.
본 발명에 따른 융합 단백질의 일부 구현예에서, 코로나바이러스의 스파이크 단백질의 아미노산 서열 및 페리틴 서브유닛 폴리펩티드의 아미노산 서열은 "링커" 아미노산 서열에 의해 연결된다. 펩티드 링커는, 예를 들어, 2 내지 5개, 2 내지 10개, 2 내지 20개, 2 내지 30개, 2 내지 40개, 2 내지 50개 또는 2 내지 60개 이상의 아미노산 길이, 예를 들어, 2개 아미노산, 3개 아미노산, 4개 아미노산, 5개 아미노산, 10개 아미노산, 15개 아미노산, 25개 아미노산, 35개 아미노산, 45개 아미노산, 50개 아미노산 또는 60개 아미노산일 수 있다. 길이에 따라, 링커 서열은 나선형, β-가닥, 코일/굽힘, 및 회전과 같은 2차 구조에서 다양한 입체형태를 가질 수 있다. 일부 경우에, 링커 서열은 확장된 입체형태를 가질 수 있고 인접한 단백질 도메인과 상호작용하지 않는 독립적인 도메인으로서 기능할 수 있다. 링커 서열은 강성이거나 가요성일 수 있다. 가요성 링커 서열은 융합 단백질의 도메인에 의해 채택될 수 있는 배향의 범위를 증가시킬 수 있다. 강성 링커는 도메인 사이에 고정된 거리를 유지하고 독립적인 기능을 유지하는데 도움이 되도록 사용될 수 있다. 융합 단백질에 대한 링커 서열은, 예를 들어, 문헌[Chen et al., 2013]에 설명되어 있다. 일부 구현예에서, 링커는 아미노산 서열 SGG, GSG, GG, GSGG(SEQ ID NO:5), NGTGGSG(SEQ ID NO:6), G, 또는 GGGGS(SEQ ID NO:7)이거나 이를 포함한다. 융합 단백질의 예시적인 구현예에서, SEQ ID NO:3 또는 SEQ ID NO:4와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 스파이크 단백질 아미노산 서열은 아미노산 서열 SGG, GSG, GG, GSGG(SEQ ID NO:5), NGTGGSG(SEQ ID NO:6), G, 또는 GGGGS(SEQ ID NO:7)을 갖거나 포함하는 링커에 의해 SEQ ID NO:2와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 페리틴 서브유닛 폴리펩티드의 아미노산 서열에 연결된다.
본 개시에 기재된 융합 단백질은 단백질 분리에 유용한 도메인 또는 서열을 포함할 수 있다. 일부 구현예에서, 폴리펩티드는 친화성 태그, 몇 개의 예를 들면, 예를 들어, AviTag™, Myc 태그, 폴리히스티딘 태그(예를 들어, 8XHis 태그), 알부민-결합 단백질, 알칼리 포스파타제, AU1 에피토프, AU5 에피토프, 비오틴-카르복시 담체 단백질(BCCP) 또는 FLAG 에피토프를 포함한다. 일부 구현예에서, 친화성 태그는 단백질 분리에 유용하다. 예를 들어, 문헌[Kimple et al., 2013]을 참조한다. 일부 구현예에서, 폴리펩티드 또는 단백질은 단백질 분리에 유용한 신호 서열, 예를 들어, 분비를 촉진하고 단백질 분리를 용이하게 하는 돌연변이된 인터루킨-2 신호 펩티드 서열을 포함한다. 예를 들어, 문헌[Low et al., 2013]을 참조한다. 일부 구현예에서, 융합 단백질은 프로테아제 인식 부위, 예를 들어, TEV 프로테아제 절단 부위를 포함할 수 있고, 이는 무엇보다도 융합 단백질 분리 후 신호 펩티드 또는 친화성 정제 태그의 제거에 유용할 수 있다.
본 개시에 기재된 융합 단백질의 일부 구현예는, 예를 들어, 발현 후 세포로부터 융합 단백질의 분비를 촉진하기 위해 코로나바이러스 신호 서열을 포함할 수 있다. 예를 들어, 일부 구현예에서, 코로나바이러스 스파이크 단백질 아미노산 서열 앞에 천연 코로나바이러스 신호 서열이 올 수 있다. 예시적인 구현예에서, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:14 또는 SEQ ID NO:15와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 스파이크 단백질 아미노산 서열 앞에 "신호 서열"로 지칭될 수 있는 천연 코로나바이러스 신호 서열 MFVFLVLLPLVSSQ(SEQ ID NO:8), MFVFLVLLPLVS(SEQ ID NO:31) 또는 MFVFLVLLPLVSS(SEQ ID NO:32)가 올 수 있다. 신호 서열은 스파이크 단백질 아미노산 서열 바로 앞에 있을 수 있거나, 신호 서열과 스파이크 단백질 아미노산 서열 사이에 링커 또는 스페이서 서열이 있을 수 있다. 본 발명의 구현예에 따른 융합 단백질의 아미노산 서열의 일부 예는 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:33 또는 SEQ ID NO:34와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열이다. 본 발명의 구현예에 따른 융합 단백질의 아미노산 서열의 일부 예는 N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:12, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:13, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:16, SEQ ID NO:17, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:18, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:21, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:22, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:23, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:24, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:25, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:26, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:27, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:28, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:29, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:30, N-말단 신호 서열(SEQ ID NO:31)이 없는 SEQ ID NO:33 또는 N-말단 신호 서열(SEQ ID NO:32)이 없는 SEQ ID NO:34와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열이다.
코로나바이러스의 스파이크 단백질의 아미노산 서열 및 페리틴 서브유닛 폴리펩티드의 아미노산 서열을 포함하는 융합 단백질을 포함하는 나노입자가 본 개시에 제공되고 본 발명의 구현예에 포함된다. 본 발명의 구현예에 따른 융합 단백질은 페리틴 서브유닛 폴리펩티드의 아미노산 서열을 포함한다는 사실로 인해 올리고머로 자가-조립할 수 있다. 이러한 자가-조립에 의해 생성되는 올리고머 구조 또는 초분자를 나노입자라고 한다. 본 발명의 예시적인 구현예는 본 개시에 기술된 바와 같은 융합 단백질의 올리고머를 포함하는 나노입자이다.
본 발명의 구현예에 따른 나노입자는 24개의 융합 단백질 서브유닛을 포함할 수 있고 432개의 대칭성을 가질 수 있다. 본 발명의 구현예에 따른 나노입자는 표면에 스파이크 단백질의 적어도 일부를 삼량체로 나타낸다. 즉, 본 발명의 구현예에 따른 나노입자는 코로나바이러스 스파이크 단백질의 표면에 노출된 삼량체를 포함한다. 나노입자는 코로나바이러스 스파이크 단백질의 표면에 노출된 8개의 삼량체를 포함할 수 있다. 나노입자가 대상체에게 투여되면 코로나바이러스 스파이크 단백질 삼량체의 표면에 노출된 삼량체는 대상체의 면역 시스템에 접근할 수 있으므로 코로나바이러스 스파이크 단백질에 대한 면역 반응을 유도할 수 있다. 페리틴 아미노산 서열을 포함하는 융합 단백질로 구성된 면역원성 나노입자는, 예를 들어, 문헌[U.S. Patent Nos. 9,441,19 and 10,137,190, Kanekiyo et al., 2013, Kanekiyo et al., 2015, and He et al., 2016]에 기술되어 있다.
핵산, 벡터, 세포 및 관련 방법
본 발명의 구현예 및 본 개시의 다른 곳에 기술된 융합 단백질을 인코딩하는 핵산이 본 개시에 제공되고 본 발명의 구현예에 포함된다. 본 발명의 구현예에 따른 핵산은 코로나바이러스의 스파이크 단백질("코로나바이러스 스파이크 단백질")의 아미노산 서열 및 페리틴 서브유닛 폴리펩티드("페리틴"으로 간단히 지칭될 수 있음)의 아미노산 서열의 융합 단백질을 인코딩한다. 본 발명의 구현예에 따른 핵산은 DNA 또는 RNA일 수 있다. 본 개시에 기술된 핵산은 본 발명의 구현예에 따른 융합 단백질 및 나노입자를 생산하기 위해 사용될 수 있다. 예를 들어, 본 개시에 기술된 핵산은 코로나바이러스, 예를 들어, 비제한적으로 SARS-CoV-2에 대한 면역원성 조성물 또는 백신으로서 사용될 융합 단백질 또는 나노입자를 생성하기 위해 본 발명의 구현예에 따른 융합 단백질 및 나노입자를 생산하는데 사용될 수 있다. 또 다른 예에서, 본 개시에 기술된 핵산은 핵산 백신으로 사용될 수 있으며, 이는 대상체에서 SARS-CoV-2를 포함하나 이에 제한되지 않는 코로나바이러스에 대한 보호 면역 반응을 유도하기 위해, 대상체에서 본 발명의 구현예에 따른 융합 단백질 및 나노입자를 생산할 목적으로 대상체에게 투여된다. 본 발명의 구현예에 따른 핵산을 사용하는 방법은 본 개시의 다른 곳에 기술되어 있다.
본 개시에 기술된 융합 단백질을 인코딩하는 핵산의 구현예는 페리틴 서브유닛 폴리펩티드의 아미노산 서열의 적어도 25개의 인접 아미노산, 적어도 50개의 인접 아미노산, 적어도 75개의 인접 아미노산, 적어도 100개의 인접 아미노산 또는 적어도 150개의 인접 아미노산에 연결된 SARS-CoV-2와 같은 코로나바이러스의 스파이크 단백질의 아미노산 서열(예를 들어, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:14 또는 SEQ ID NO:15와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열)을 포함하는 융합 단백질을 인코딩한다. 본 개시에 기술된 융합 단백질을 인코딩하는 핵산의 일부 구현예는 SARS-CoV-2와 같은 코로나바이러스의 스파이크 단백질의 아미노산 서열(예를 들어, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:14 또는 SEQ ID NO:15와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열)이 SEQ ID NO:2와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열과 같은 H. 파일로리의 페리틴 서브유닛 폴리펩티드의 적어도 25개의 인접 아미노산, 적어도 50개의 인접 아미노산, 적어도 75개의 인접 아미노산, 적어도 100개의 인접 아미노산 또는 적어도 150개의 인접 아미노산에 연결된 융합 단백질을 인코딩한다. 본 개시에 기술된 핵산의 일부 예는 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:12, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:13, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:16, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:17, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:18, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:21, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:22, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:23, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:24, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:25, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:26, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:27, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:28, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:29, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:30, N-말단 신호 서열(SEQ ID NO:31)이 없는 SEQ ID NO:33 또는 N-말단 신호 서열(SEQ ID NO:32)이 없는 SEQ ID NO:34와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 융합 단백질을 인코딩한다.
본원에 제공된 핵산 서열을 포함하는 핵산 작제물이 또한 본 개시에 제공되고 본 발명의 구현예에 포함된다. 핵산 작제물의 일부 구현예는 본 발명의 구현예에 따른 융합 단백질을 인코딩하는 정제된 핵산 분자이다. 예를 들어, 핵산 작제물은 본 발명의 구현예에 따른 융합 단백질을 인코딩하는 핵산에 작동 가능하게 연결된 프로모터를 포함하는 조작된 (재조합) DNA 핵산 서열일 수 있다. 핵산 서열은 다른 핵산 서열과 기능적 관계에 놓일 때 "작동 가능하게 연결된" 것이다. 프로모터는 전사를 개시하기 위해 RNA 폴리머라제 및 다른 단백질의 인식 및 결합에 관여하는 전사 시작부터 상류 및/또는 하류에 위치한 영역 또는 서열이다. 프로모터는 일반적으로 전사 시작 부위에 대해 비교적 고정된 위치에 있을 때 기능하는 핵산 서열 또는 서열들이다. 프로모터는 RNA 폴리머라제와 전사 인자의 기본적인 상호작용에 필요한 핵심 요소를 포함하며, 상류 요소 및 반응 요소를 포함할 수 있다. 본 발명의 구현예에 따른 핵산 작제물에 포함된 프로모터는 진핵 또는 원핵 프로모터일 수 있다. 일부 구현예에서, 프로모터는 유도성 프로모터이다. 일부 구현예에서, 프로모터는 항시적 프로모터이다. 본 발명의 구현예에 따른 핵산 작제물에 포함된 프로모터는 관심 숙주 세포 또는 숙주 유기체에서 본 개시에 기술된 융합 단백질을 인코딩하는 핵산 서열의 발현을 지시하거나 구동할 수 있다. 본 발명의 구현예에 따른 핵산 작제물을 제조하기 위해, 핵산은 적당한 배향 및, 적절한 경우, 적당한 리딩 프레임에서 핵산 서열을 제공하도록 조작될 수 있다. 이를 위해, 핵산 단편을 결합하기 위해 어댑터 또는 링커가 사용되거나 편리한 제한 부위, 불필요한 핵산 서열 제거, 제한 부위 제거 등을 제공하기 위해 다른 조작이 수반될 수 있다. 이러한 목적을 위해, 시험관 내 돌연변이 유발, 프라이머 복구, 제한, 어닐링, 전이 및 전환과 같은 재치환이 포함될 수 있다.
본 발명의 구현예에 따른 핵산은 관심 숙주 세포 또는 유기체에서 핵산에 의해 인코딩되는 융합 단백질의 발현을 위한 발현 카세트에 포함될 수 있다. 일부 구현예에서, 본 발명의 구현예에 따른 핵산은 관심 숙주 세포 또는 유기체에서의 발현을 위해 코돈-최적화될 수 있다. 발현 카세트는 본 발명의 구현예에 따른 융합 단백질을 인코딩하는 핵산에 작동 가능하게 연결된 5' 및 3' 조절 서열을 포함할 수 있다. 발현 카세트는 또한 다른 폴리펩티드 또는 단백질을 인코딩하는 핵산 서열을 포함할 수 있다. 발현 카세트는 다양한 핵산 서열을 발현 카세트로 삽입하기 위한 및/또는 발현 카세트를 벡터와 같은 다른 핵산으로 삽입하기 위한 복수의 제한 부위 및/또는 재조합 부위를 포함할 수 있다. 발현 카세트는 다양한 조절 영역 또는 서열, 예를 들어, 전사 개시 시작 부위, 작동자, 활성자, 인핸서, 다른 조절 요소, 리보솜 결합 부위, 개시 코돈, 종결 신호 등을 포함할 수 있으나 이에 제한되지 않는다. 발현 카세트에 포함된 예시적인 조절 서열은 프로모터, 전사 조절 영역 및/또는 번역 종결 영역이며, 이는 숙주 세포 또는 숙주 유기체, 또는 서로에 대해 내인성 또는 이종성일 수 있다. 이와 관련하여, "이종성"은 숙주 세포 또는 숙주 유기체에서 기원하지 않거나 숙주 세포 또는 숙주 유기체에서 발생하는 이의 형태로부터 실질적으로 변형된 핵산 서열을 의미한다. 발현 카세트는 또한 발현 카세트를 포함하는 숙주 세포의 선택을 위한 하나 이상의 선택 가능한 마커 유전자를 포함할 수 있다. 마커 유전자는, 몇 개의 예를 들면, 하이그로마이신 내성, 암피실린 내성, 젠타마이신 내성, 네오마이신 내성을 부여하는 것과 같은 항생제 내성을 부여하는 유전자를 포함하나 이에 제한되지 않는다. 추가적인 선택 가능한 마커가 알려져 있으며 임의의 마커를 사용할 수 있다. 예시적인 발현 카세트는 5'에서 3' 방향으로 관심 숙주 세포 또는 숙주 유기체에서 기능적인 전사 및 번역 개시 영역(프로모터 포함), 본 개시에 기재된 융합 단백질을 인코딩하는 핵산 서열, 및 전사 및 번역 종결 영역을 포함할 수 있다.
본 발명의 구현예에 따른 핵산 또는 핵산 작제물을 포함하는 벡터도 본 발명의 구현예에 포함된다. 이러한 벡터는 벡터에 포함된 핵산 서열의 전사를 지시하고 조절하는 필수 기능적 요소를 포함할 수 있다. 이러한 기능적 요소는 프로모터, 프로모터의 전사 활성을 조절할 수 있는 인핸서와 같은 프로모터의 상류 또는 하류 영역, 복제 기점, 프로모터에 인접한 삽입물의 클로닝을 용이하게 하는 적절한 제한 부위, 벡터 또는 삽입물을 포함하는 벡터를 포함하는 세포를 선택하는 역할을 할 수 있는 항생제 내성 유전자 또는 다른 마커, RNA 스플라이스 접합부, 전사 종결 영역, 또는 삽입된 유전자 또는 하이브리드의 발현을 촉진하는 역할을 할 수 있는 임의의 다른 영역을 포함하나 이에 제한되지 않는다. 예를 들어, 벡터는 플라스미드일 수 있다.
본 발명의 구현예에 따른 벡터는 박테리아 발현 벡터와 같은 박테리아 벡터일 수 있다. 예를 들어, 수많은 E. 콜리(E. coli) 발현 벡터 중 하나에 기초한 벡터는 본 발명의 구현예에 따른 핵산 발현에 유용할 수 있다. 본 발명의 구현예에 따른 핵산의 발현에 적합한 다른 박테리아 숙주는 바실러스 서브틸리스(Bacillus subtilis)와 같은 바실러스, 및 살모넬라(Salmonella), 세나티아(Senatia) 및 다양한 슈도모나스(Pseudomonas) 종과 같은 다른 장내세균과를 포함한다. 이러한 원핵 숙주에서, 숙주 세포와 호환되는 발현 제어 서열(예를 들어, 복제 기점)을 전형적으로 포함하는 적합한 발현 벡터도 사용할 수 있다. 락토스 프로모터 시스템, 트립토판(Trp) 프로모터 시스템, 베타-락타마제 프로모터 시스템 또는 파지 람다로부터의 프로모터 시스템과 같은 임의의 수의 다양한 잘 알려진 프로모터가 박테리아 발현 벡터에 사용될 수 있다.
효모 세포, 포유동물 세포 및 곤충 세포를 포함하나 이에 제한되지 않는 진핵 세포가 또한 폴딩 및 시스테인 쌍 형성, 복잡한 탄수화물 구조의 추가 및 활성 단백질의 분비와 같은 중요한 번역 후 변형을 선호하는 환경에서 단백질의 발현을 허용한다. 따라서, 효모 세포, 포유동물 세포 및 곤충 세포에서 본 개시에 기재된 핵산의 발현에 유용한 벡터가 또한 구상되고 본 발명의 구현예에 포함된다. 본 발명의 구현예에 따른 벡터는 비제한적으로 피치아 파스토리스(Pichia pastoris) 또는 사카로마이세스 세레비지에(Saccharomyces cerevisiae)의 세포와 같은 효모 세포에서 본 발명의 구현예에 따른 핵산의 발현에 적합한 효모 발현 벡터일 수 있다. 진핵 세포에서 사용되는 발현 벡터는 전사 종결에 필요한 서열을 포함할 수 있다. 이러한 영역은 mRNA의 번역되지 않은 부분에서 폴리아데닐화 세그먼트로서 전사된다. 따라서, 진핵 발현 벡터에 포함된 전사 단위는 폴리아데닐화 영역을 포함할 수 있다. 이 영역의 한 가지 이점은 전사된 단위가 mRNA처럼 처리되고 운반될 가능성을 증가시킨다는 것이다. 3' 비번역 영역도 전사 종결 부위를 포함한다. 진핵 세포용 발현 벡터는 인핸서와 같은 발현 제어 서열, 및 리보솜 결합 부위, RNA 스플라이스 부위 등과 같은 필수 정보 처리 부위를 포함할 수 있다.
본 발명의 구현예에 따른 발현 벡터는 또한 테트라사이클린 유도성 프로모터 또는 글루코코르티코이드 유도성 프로모터와 같은 유도성 프로모터의 제어 하에 본 개시에 기재된 핵산을 포함할 수 있다. 본 발명의 핵산은 또한 특정 세포, 조직 또는 기관에서 핵산의 발현을 촉진하기 위해 조직-특이적 프로모터의 제어 하에 있을 수 있다. 메탈로티오네인 프로모터, 열-충격 프로모터 및 다른 조절 가능한 프로모터와 같은 임의의 조절 가능한 프로모터가 또한 고려된다. 또한, Cre-loxP 유도성 시스템뿐만 아니라 Flp 재조합효소 유도성 프로모터 시스템도 사용될 수 있다.
일부 구현예에서, 본 발명의 구현예에 따른 융합 단백질을 인코딩하는 핵산은 숙주 세포 또는 숙주 유기체로의 전달을 위해 바이러스 벡터에 통합될 수 있다. 따라서, 본 발명의 구현예에 따른 벡터는 본 개시에 기재된 융합 단백질을 인코딩하는 핵산을 분해 없이 세포 내로 수송하는 바이러스 벡터를 포함하고, 전달되는 세포에서 핵산을 발현시키는 프로모터를 포함한다. 적합한 바이러스 벡터는 아데노바이러스 벡터, 아데노-관련 바이러스(AAV) 벡터, 헤르페스 바이러스 벡터, 레트로바이러스 벡터, 폭스바이러스 벡터 또는 렌티바이러스 벡터를 포함한다. 이러한 벡터를 작제하고 사용하는 방법은 잘 알려져 있다. 전형적으로, 바이러스 벡터는 비구조적 초기 유전자, 구조적 후기 유전자, RNA 폴리머라제 III 전사체, 복제 및 캡슐화에 필요한 역 말단 반복, 및 바이러스 게놈의 전사 및 복제를 제어하는 프로모터를 포함한다. 벡터로서 조작될 때, 바이러스는 전형적으로 초기 유전자 중 하나 이상을 제거하고 제거된 바이러스 DNA 대신 유전자 또는 유전자/프로모터 카세트를 바이러스 게놈에 삽입한다. 제거된 초기 유전자의 필요한 기능은 전형적으로 초기 유전자의 유전자 생성물을 트랜스로 발현하도록 조작된 세포주에 의해 공급된다.
예를 들어, 폭스 패밀리 바이러스의 재조합 바이러스는 본 발명의 구현예에 따른 핵산 분자를 숙주 세포 또는 숙주 유기체로 전달하기 위한 벡터로 사용될 수 있다. 여기에는 백시니아 바이러스와 조류 폭스바이러스, 예를 들어, 조류폭스 및 카나리폭스 바이러스가 포함된다. 재조합 폭스 바이러스를 생산하는 방법은 알려져 있다. 재조합 폭스 바이러스의 대표적인 예는 ALVAC, TROVAC 및 NYVAC를 포함한다. 또 다른 예에서, 아데노바이러스 벡터는 본 발명의 구현예에 따른 핵산 분자를 숙주 세포 또는 숙주 유기체로 전달하기 위해 사용될 수 있다. 또 다른 예에서, 아데노-관련 바이러스(AAV) 벡터 시스템은 본 발명의 구현예에 따른 핵산 분자를 숙주 세포 또는 숙주 유기체로 전달하기 위해 사용될 수 있다. 또 다른 예에서, 레트로바이러스 벡터는 본 발명의 구현예에 따른 핵산 분자를 숙주 세포 또는 숙주 유기체로 전달하기 위해 사용될 수 있다. 레트로바이러스 벡터의 예는 뮤린 말로니 백혈병 바이러스(MMLV)에 기초한 벡터, 및 벡터로서 MMLV의 바람직한 특성을 발현하는 레트로바이러스를 포함하나 이에 제한되지 않는다. 또 다른 예에서, 아데노바이러스 키메라 벡터와 같은 분자 컨쥬게이트 벡터는 본 발명의 구현예에 따른 핵산 분자를 숙주 세포 또는 숙주 유기체로 전달하기 위해 사용될 수 있다. 비제한적으로 Sindbis, Semliki Forest 및 베네수엘라 말 뇌염 바이러스와 같은 알파바이러스 속의 구성원에서 유래된 벡터는 또한 본 발명의 구현예에 따른 핵산 분자를 숙주 세포 또는 숙주 유기체로 전달하기 위해 사용될 수 있다.
본 발명의 구현예에 따른 핵산, 핵산 작제물 또는 벡터를 포함하는 세포가 또한 본 개시에 제공되고 본 발명의 구현예에 포함된다. 이러한 세포는 "숙주 세포들"(또는 단수로 "숙주 세포")로 지칭될 수 있다. 일부 숙주 세포는 본 개시에 기술된 융합 단백질을 생산할 수 있는 반면, 다른 숙주 세포는 본 발명의 구현예에 따른 핵산, DNA 작제물 또는 벡터를 생산하거나 유지하는데 사용될 수 있다. 숙주 세포는 시험관 내, 생체 외 또는 생체 내 숙주 세포일 수 있다. 임의의 숙주 세포 집단 및 하나 이상의 숙주 세포를 포함하는 세포 배양물도 본 발명의 구현예에 포함된다. 숙주 세포는, 예를 들어, 박테리아 세포를 포함하는 원핵 세포일 수 있다. 대안적으로, 세포는 진핵 세포일 수 있다. 원핵 숙주 세포의 예는 E. 콜리, 슈도모나스, 바실러스 또는 스트렙토마이세스의 세포이다. 진핵 세포의 예는 효모 세포(예를 들어, 사카로마이세스 효모, 또는 피치아, 칸디다(Candida), 한세눌라(Hansenula) 및 토룰롭시스(Torulopsis)와 같은 메틸영양 효모의 세포); 동물 세포, 예를 들어, CHO, R1. 1, B-W 및 LM 세포, 아프리카 녹색 원숭이 신장 세포(예를 들어, COS 1, COS 7, BSC1, BSC40 및 BMT10), 곤충 세포(예를 들어, Sf9), 인간 세포(예를 들어, 인간 배아 신장 세포, 예를 들어, HEK293 또는 HeLa 세포)이다.
숙주 세포(본 발명의 구현예에 따른 핵산, 핵산 작제물 또는 벡터를 포함하는 세포를 의미함)를 생산 또는 생성하는 방법도 본 발명의 구현예에 포함된다. 본 발명의 구현예에 따른 핵산, 핵산 작제물 또는 벡터는 숙주 세포의 유형에 따라 다양한 널리 공지된 방법에 의해 숙주 세포로 전달 또는 도입될 수 있다. 핵산, 핵산 작제물 또는 벡터를 세포 내로 도입하는 것과 관련하여 사용되는 "도입" 및 관련 용어 또는 구는 세포 외부로부터 세포 내부로의 핵산 서열의 전위를 지칭한다. 일부 경우에, 도입은 세포 외부에서 진핵 세포의 핵 내부로의 핵산의 전위를 지칭한다. 전기천공, 나노입자 전달, 바이러스 전달, 나노와이어 또는 나노튜브와의 접촉, 수용체 매개 내재화, 세포 투과 펩티드를 통한 전위, 리포솜 매개 전위, DEAE 덱스트란, 리포펙타민, 칼슘 포스페이트 또는 핵산을 원핵 또는 진핵 세포 숙주에 도입하기 위해 현재 알려져 있거나 추후 확인되는 임의의 방법을 포함하나 이에 제한되지 않는 이러한 전위의 다양한 방법이 고려된다. 표적화 뉴클레아제 시스템(예를 들어, RNA-유도 뉴클레아제(CRISPR-Cas9), 전사 활성자-유사 이펙터 뉴클레아제(TALEN), 징크 핑거 뉴클레아제(ZFN) 또는 megaTAL(MT)을 또한 사용하여 핵산을 세포에 도입할 수 있다.
본 개시에 기술된 융합 단백질 및 나노입자를 생산 또는 생성하는 방법도 본 발명의 구현예에 포함된다. 융합 단백질 또는 나노입자를 생산하는 예시적인 방법은 본 발명의 구현예에 따른 핵산, 본 발명의 구현예에 따른 핵산 작제물, 또는 본 발명의 구현예에 따른 벡터를 세포 내로 도입하는 단계를 포함할 수 있다. 도입 단계는 본 개시의 다른 곳에서 기술된 바와 같이 수행되며, 이러한 단계의 결과로서 핵산, 핵산 작제물 또는 벡터를 포함하는 세포("숙주 세포"로 지칭될 수 있음)가 생성된다. 융합 단백질을 생산하는 예시적인 방법은 융합 단백질의 발현을 허용하는 조건 하에서 숙주 세포를 인큐베이션하는 단계를 포함할 수 있다. 나노입자를 생산하는 예시적인 방법은 융합 단백질의 발현 및 나노입자의 자가-조립을 허용하는 조건 하에서 숙주 세포를 인큐베이션하는 단계를 포함할 수 있다. 숙주 세포에서 발현된 후, 융합 단백질 또는 나노입자는 다양한 정제 방법을 사용하여 분리 또는 정제될 수 있다. 일부 구현예에서, 융합 단백질은 숙주 세포로부터 분리될 수 있고 시험관 내에서 나노입자로 자가-조립될 수 있다.
본 개시에 기술된 융합 단백질 및 나노입자를 생산 또는 생성하는 과정을 설명하는 일례에서, 본 발명의 구현예에 따른 융합 단백질을 인코딩하는 핵산 또는 핵산 작제물은 플라스미드 또는 다른 벡터에 도입된 후, 살아 있는 세포를 형질전환하는데 사용된다. 예를 들어, 본 발명의 구현예에 따른 융합 단백질을 인코딩하는 핵산은 프로모터, 인핸서, 폴리 A 부위 및 다른 서열과 같은 필요한 조절 영역을 제공하는 발현 벡터에 올바른 배향으로 삽입된다. 일부 경우에, 유도성 또는 조직-특이적 프로모터의 조절 하에서 융합 단백질을 발현시키는 것이 바람직할 수 있다. 그런 다음 리포펙션 또는 전기천공과 같은 다양한 방법을 사용하여 발현 벡터를 살아 있는 세포로 형질감염시켜 융합 단백질을 발현하는 숙주 세포를 생성할 수 있다. 융합 단백질을 발현하는 세포는 적절한 항생제 선택 또는 다른 방법에 의해 선택되고 배양될 수 있다. 상업적으로 이용 가능한 생물반응기에서 세포를 성장시킴으로써 더 많은 양의 융합 단백질이 생산될 수 있다. 일단 숙주 세포에 의해 발현되면, 융합 단백질은 투석, 여과 및 크로마토그래피와 같은 표준 절차에 따라 분리(정제)될 수 있다. 융합 단백질을 분리하기 위해 세포를 용해시키는 단계가 포함될 수 있다. 따라서, 본 발명의 구현예에 따른 융합 단백질을 생산 또는 생성하는 방법은 융합 단백질의 발현을 허용하는 조건 하에서 벡터를 포함하는 세포를 배양하고, 세포를 수확하고/거나 배양된 세포로부터 배지를 수확하고, 세포 및/또는 배양 배지로부터 융합 단백질을 분리하는 하나 이상의 단계를 포함할 수 있다. 본 개시에 기술된 융합 단백질의 생산과 관련된 조성물, 방법 및 키트는 본 발명의 구현예의 범위 내에 포함된다.
면역원성 조성물 및 키트
본 개시에 기재된 융합 단백질, 본 개시에 기재된 나노입자, 본 개시에 기재된 핵산, 본 개시에 기재된 핵산 작제물, 또는 본 개시에 기재된 벡터 중 임의의 것을 함유하는 면역원성 조성물은 본 발명의 구현예에 포함된다. 본 발명의 구현예에 따른 면역원성 조성물은 또한 "백신"으로 지칭될 수 있다. 면역원성 조성물은 본 발명에 따른 융합 단백질, 나노입자, 핵산, 핵산 작제물 또는 벡터 및 약학적으로 허용되는 담체(부형제)를 포함할 수 있다. 면역원성 조성물은 본 발명의 구현예에 따른 융합 단백질, 나노입자, 핵산, 핵산 작제물 또는 벡터 및 애주번트를 포함할 수 있다. 면역원성 조성물은 본 발명의 구현예에 따른 융합 단백질, 나노입자, 핵산, 핵산 작제물 또는 벡터 및 비제한적으로 희석제, 용해제, 유화제 또는 보존제와 같은 다른 구성요소를 포함할 수 있다. 본 발명에 따른 면역원성 조성물은 수용액과 같은 용액, 수성 현탁액과 같은 현탁액일 수 있거나, 동결건조된 형태와 같은 건조 형태일 수 있다. 본 발명의 구현예에 따른 융합 단백질, 나노입자, 핵산, 핵산 작제물 또는 벡터 이외에 면역원성 조성물에 포함된 일부 구성요소(또는 성분)은 본 개시의 다른 곳에서 보다 상세하게 설명된다.
면역원성 조성물의 일부 구현예는 본 개시의 다른 곳에 기술된 하나 이상의 융합 단백질 또는 융합 단백질을 인코딩하는 핵산을 포함한다. 예를 들어, 면역원성 조성물은 본 개시의 다른 곳에 기술된 2개 이상, 3개 이상, 4개 이상, 5개 이상 등의 상이한 융합 단백질을 포함할 수 있다. 또 다른 예에서, 면역원성 조성물은 본 개시의 다른 곳에 기술된 2개 이상, 3개 이상, 4개 이상, 5개 이상 등의 상이한 융합 단백질을 인코딩하는 핵산을 포함할 수 있다. 2개 이상, 3개 이상, 4개 이상, 5개 이상 등의 상이한 융합 단백질을 인코딩하는 핵산은 벡터와 같은 동일한 핵산 작제물, 또는 상이한 핵산 작제물에 포함될 수 있다. 예를 들어, 면역원성 조성물은 N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:12, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:13, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:16, SEQ ID NO:17, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:18, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:21, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:22, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:23, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:24, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:25, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:26, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:27, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:28, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:29, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:30, N-말단 신호 서열(SEQ ID NO:31)이 없는 SEQ ID NO:33 또는 N-말단 신호 서열(SEQ ID NO:32)이 없는 SEQ ID NO:34와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 하나 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상 등의 융합 단백질 또는 융합 단백질을 인코딩하는 핵산을 포함할 수 있다.
본 발명의 구현예에 따른 면역원성 조성물은 약학적으로 허용되는 담체 또는 부형제를 포함할 수 있다. 약학적으로 허용되는 담체 또는 부형제는 생물학적으로 또는 달리 바람직하지 않지 않은 물질이며, 이는 바람직하지 않은 생물학적 효과를 일으키거나 이것이 포함된 약학적 조성물의 다른 구성요소와 유해한 방식으로 상호작용하지 않고 대상체에게 투여될 수 있는 물질을 의미한다. 담체 또는 부형제는 전형적으로 담체 또는 부형제가 포함된 조성물의 다른 성분의 분해를 최소화하고, 대상체에서 불리한 부작용(예를 들어, 알레르기 부작용)을 최소화하도록 선택된다. 약학적으로 허용되는 수성 담체의 예는 멸균수, 식염수, 링거 용액과 같은 완충 용액, 글리세롤 용액, 에탄올, 덱스트로스 용액, 요막액 또는 이들의 조합을 포함하나 이에 제한되지 않는다. 수성 담체의 pH는 일반적으로 약 5 내지 약 8 또는 약 7 내지 7.5이다. 담체는 pH 조절 완충액을 포함할 수 있다. 멸균성, pH, 등장성 및 안정성을 보장하는 이러한 수성 담체의 제조는 확립된 프로토콜에 따라 수행된다. 비수성 담체의 예는 프로필렌 글리콜, 폴리에틸렌 글리콜, 올리브유와 같은 식물성 오일, 및 에틸 올레에이트와 같은 주사 가능한 유기 에스테르이다. 다른 예시적인 담체는 고체 소수성 중합체의 반투과성 매트릭스와 같은 지속 방출 제조물이다. 다른 예시적인 담체는 비제한적으로 필름, 리포솜 또는 미세입자와 같은 성형된 물품 형태의 매트릭스이다. 예를 들어, 투여 경로 및 투여되는 조성물의 농도에 따라 특정 담체가 더 바람직할 수 있다.
본 발명의 구현예에 따른 면역원성 조성물은 애주번트를 포함할 수 있다. 화학적 애주번트의 일부 예는 알루미늄 포스페이트, 벤질알코늄 클로라이드, 우베니멕스(ubenimex), QS21, 알루미늄 하이드록사이드(예를 들어, 명반, 알루미늄 하이드록사이드 습식 겔 현탁액, 예를 들어, Alhydrogel®(Croda International, UK)), 사포닌(예를 들어, Quil A®(Croda International, UK)), 스쿠알렌(예를 들어, AddaVax™)이다. 소위 "유전적" 애주번트의 일부 예는 IL-2 유전자 또는 이의 단편, 과립구 대식세포 콜로니-자극 인자(GM-CSF) 유전자 또는 이의 단편, IL-18 유전자 또는 이의 단편, 케모카인(C-C 모티프) 리간드 21(CCL21) 유전자 또는 이의 단편, IL-6 유전자 또는 이의 단편, CpG, LPS, TLR 효능제(예를 들어, 모노포스포릴 지질 A(MPLA)), 및 다른 면역 자극 유전자이다. 단백질 애주번트의 일부 예는 IL-2 또는 이의 단편, 과립구 대식세포 콜로니-자극 인자(GM-CSF) 또는 이의 단편, IL-18 또는 이의 단편, 케모카인(C-C 모티프) 리간드 21(CCL21) 또는 이의 단편, IL-6 또는 이의 단편, CpG, LPS, TLR 효능제 및 다른 면역 자극 사이토카인 또는 이들의 단편이다. 지질 애주번트의 일부 예는 양이온성 리포솜, N3(양이온성 지질), MPLA, Quil-A® 및 AddaVax™이다. 다른 예시적인 애주번트는 콜레라 독소, 엔테로톡신, Fms-유사 티로신 키나제-3 리간드(Flt-3L), 부피바카인(bupivacaine), 마케인(marcaine) 및 레바미솔(levamisole)을 포함하나 이에 제한되지 않는다. 일부 구현예에서, 면역원성 조성물은 Quil-A®를 포함한다. 일부 구현예에서, 면역원성 조성물은 명반을 포함한다. 일부 구현예에서, 면역원성 조성물은 CpG를 포함한다. 하나 초과의 애주번트가 본 발명의 구현예에 따른 면역원성 조성물에 포함될 수 있다. 예를 들어, 일부 구현예에서, 면역원성 조성물은 명반 및 CpG를 포함할 수 있다.
본 발명의 구현예에 따른 면역원성 조성물은 일반적으로 투여에 사용되는 투여량 및 농도에서 대상체에게 비독성이거나 최소 독성이 되도록 제형화된다. 일부 구현예에서, 면역원성 조성물의 제형은 제형을 등장성으로 만들기에 적절한 양의 약학적으로 허용되는 염을 포함할 수 있다. 일부 구현예에서, 면역원성 조성물의 제형은, 예를 들어, pH, 삼투질농도, 점도, 투명도, 색상, 등장성, 냄새, 멸균성, 안정성, 용해 또는 방출 속도, 흡착 또는 조성물의 침투를 변형, 유지 또는 보존하기 위한 구성요소를 포함할 수 있다. 면역원성 조성물의 제형은 다음 구성요소 중 하나 이상을 포함할 수 있다: 아미노산(예를 들어, 글리신, 글루타민, 아스파라긴, 아르기닌 또는 리신); 항미생물제; 항산화제(예를 들어, 아스코르브산, 소듐 설파이트 또는 소듐 하이드로겐-설파이트); 완충액(예를 들어, 보레이트, 바이카르보네이트, Tris-HCl, 시트레이트, 포스페이트 또는 다른 유기산); 증량제(예를 들어, 만니톨 또는 글리신); 킬레이트제(예를 들어, 에틸렌디아민 테트라아세트산(EDTA)); 착화제(예를 들어, 카페인, 폴리비닐피롤리돈, 베타-사이클로덱스트린 또는 하이드록시프로필-베타-시클로덱스트린); 충전제; 단당류, 이당류 및 다른 탄수화물(예를 들어, 글루코스, 만노스 또는 덱스트린); 단백질(예를 들어, 혈청 알부민, 젤라틴 또는 면역글로불린); 착색제, 착향제 및 희석제; 유화제; 친수성 중합체(예를 들어, 폴리비닐피롤리돈); 저분자량 폴리펩티드; 염-형성 반대이온(예를 들어, 소듐); 보존제(예를 들어, 벤즈알코늄 클로라이드, 벤조산, 살리실산, 티메로살, 페네틸 알코올, 메틸파라벤, 프로필파라벤, 클로르헥시딘, 소르브산 또는 하이드로겐 퍼옥사이드); 용매(예를 들어, 글리세린, 프로필렌 글리콜 또는 폴리에틸렌 글리콜); 당 알코올(예를 들어, 만니톨 또는 소르비톨); 현탁화제; 계면활성제 또는 습윤제(예를 들어, 플루로닉, PEG, 소르비탄 에스테르, 폴리소르베이트, 예를 들어, 폴리소르베이트 20, 폴리소르베이트 80, 트리톤, 트로메타민, 레시틴, 콜레스테롤, 틸록사팔); 안정성 향상제(예를 들어, 수크로스 또는 소르비톨); 긴장성 향상제(예를 들어, 알칼리 금속 할라이드, 바람직하게는 소듐 또는 포타슘 클로라이드, 만니톨 소르비톨); 및/또는 전달 비히클.
일부 구현예에서, 면역원성 조성물은 동결건조된 형태와 같은 건조 형태(즉, 탈수 형태)로 제조될 수 있다. 이러한 제형은 "동결건조된" 또는 "동결건조물"로 지칭될 수 있다. 동결건조는 액체 제형에서 용매를 제거하는 냉동-건조 과정이다. 동결건조 과정은 냉동 및 건조의 동시 또는 순차적 단계 중 하나 이상을 포함할 수 있다. 본 발명의 구현예에 따른 면역원성 조성물은 비휘발성 또는 휘발성 완충액을 포함하는 수용액에서 동결건조될 수 있다. 적합한 비휘발성 완충액의 비제한적인 예는 PBS, Tris-HCl, HEPES 또는 L-히스티딘 완충액이다. 적합한 휘발성 완충액의 비제한적인 예는 암모늄 바이카르보네이트, 암모니아/아세트산 또는 N-에틸모르폴린/아세테이트 완충액이다. 본 발명의 구현예에 따른 동결건조된 면역원성 조성물은 적절한 담체 또는 부형제를 포함할 수 있다. 이러한 적절한 부형제는 cryo-보존제, 증량제, 계면활성제 또는 이들의 조합을 포함할 수 있으나 이에 제한되지 않는다. 예시적인 부형제는 폴리올, 이당류 또는 다당류 중 하나 이상, 예를 들어, 이를 테면, 만니톨, 소르비톨, 수크로스, 트레할로스 및/또는 덱스트란 40을 포함한다. 일부 경우에, cryo-보존제는 수크로스 및/또는 트레할로스일 수 있다. 일부 경우에, 증량제는 글리신 또는 만니톨일 수 있다. 일례에서, 계면활성제는, 예를 들어, 폴리소르베이트-20 및/또는 폴리소르베이트-80과 같은 폴리소르베이트일 수 있다. 본 발명의 구현예에 따른 동결건조된 면역원성 조성물은, 예를 들어, 케이크 또는 분말 형태일 수 있다. 동결건조된 면역원성 조성물은 사용 전에 담체 또는 부형제(예를 들어, 물 또는 완충 용액)에서 재수화/용해/재구성될 수 있다. 면역원성 조성물의 일부 구현예는 수크로스를 포함하는 완충 용액 또는 물에서 재구성된다.
본 발명의 구현예에 따른 면역원성 조성물은 대상체에게 투여하기 전에 멸균 상태일 수 있다. 멸균은 멸균 여과막을 통한 여과에 의해 달성될 수 있다. 면역원성 조성물이 동결건조될 때, 멸균은 동결건조 및 재구성 전 또는 후에 수행될 수 있다. 면역원성 조성물은 용액, 현탁액, 겔, 에멀젼, 고체, 또는 탈수되거나 동결건조된 분말로서 바이알 또는 백과 같은 멸균 용기에 보관할 수 있다.
본 개시에 기술된 면역원성 조성물을 포함하는 키트도 본 발명의 구현예에 포함된다. 예를 들어, 키트는 면역원성 조성물 및 백 또는 바이알과 같은 보관을 위한 용기를 포함할 수 있다. 이러한 용기는, 예를 들어, 피하 주사 바늘로 뚫을 수 있는 마개가 있는 백 또는 바이알과 같은 멸균 접근 포트를 가질 수 있다. 다른 예에서, 키트는 동결건조되거나 농축된 형태의 면역원성 조성물 및 희석제를 포함할 수 있다. 이러한 키트에서, 희석제는 또한 본 개시의 다른 곳에서 기재된 바와 같이 약학적으로 허용되는 담체 또는 부형제일 수 있다. 이러한 키트에 포함될 수 있는 희석제의 예는 식염수, 완충 식염수, 물 또는 수크로스이다. 다른 예에서, 키트는 면역원성 조성물 및 면역원성 조성물을 투여하기 위한 장치를 포함할 수 있다. 조성물을 투여하기 위한 장치는 주사 또는 경구 투여를 위한 주사기(예를 들어, 키트는 액체 면역원성 조성물로 미리-충전된 주사기일 수 있음), 미세바늘 패치와 같은 미세바늘 장치, 흡입기 또는 분무기일 수 있다. 일부 구현예에서, 키트는 단일 용량으로 투여될 때 대상체에서 코로나바이러스에 대한 보호 면역 반응을 유도할 수 있는 정의된 양의 면역원성 조성물을 함유할 수 있다. 일부 구현예에서, 키트는 대상체에서 코로나바이러스에 대한 보호 면역 반응을 유도할 수 있는 다중 용량의 정의된 양의 면역원성 조성물을 함유할 수 있다. 예를 들어, 키트는 면역원성 조성물을 함유하는 다수의 바이알, 주사기 또는 미세바늘 패치를 포함할 수 있다.
면역 반응을 유도하는 방법
대상체에게 본 개시에 기술된 면역원성 조성물을 투여함으로써 대상체에서 코로나바이러스에 대한 면역 반응을 유도하거나 유발하는 방법이 본 발명의 구현예에 포함된다. 이러한 방법의 구현예에서, 면역원성 조성물은 대상체에서 코로나바이러스에 대한 보호 면역 반응을 유도하거나 유발할 수 있는 양으로 투여된다. 대상체에서 코로나바이러스에 대한 보호 면역 반응은 대상체에서 항-코로나바이러스 중화 항체의 생산을 포함할 수 있다. 대상체에서 코로나바이러스에 대한 보호 면역 반응을 유도하거나 유발할 수 있는 면역원성 조성물의 양은 "유효량" 또는 "면역학적 유효량"으로 기술될 수 있고, 1회 용량 또는 2회 이상의 용량으로 투여될 수 있다. 투여를 위한 유효량 및 일정은 경험적으로 결정될 수 있다.
본 개시에 기재된 면역원성 조성물의 투여를 위한 투여량 범위는 원하는 효과, 즉, SARS-CoV-2와 같은 코로나바이러스에 대한 보호 면역 반응을 유도하기에 충분히 큰 범위이다. 투여량은 원하지 않는 교차-반응, 아나필락시스 반응 등과 같은 실질적인 불리한 부작용을 일으킬 정도로 크지 않아야 한다. 일반적으로, 투여량은 연령, 상태, 성별, 의학적 상태, 투여 경로, 또는 요법에 다른 약물이 포함되는지 여부에 따라 달라질 수 있다. 투여량은 임의의 금기사항이 있는 경우 의료 전문가에 의해 조정될 수 있다. 투여량은 다양할 수 있으며, 제제는 프라임 및 부스트 패러다임을 포함하여, 하루 또는 며칠 동안 매일 1회 이상의 용량 투여로 투여될 수 있다.
대상체에서 코로나바이러스에 대한 보호 면역 반응을 유도하거나 유발하는 방법의 맥락에서 사용되는 경우, 본 개시에 기술된 면역원성 조성물은 경구, 비경구, 정맥내, 근육내, 피하, 경피, 분무/흡입, 또는 기관지경을 통한 설치를 포함하나 이에 제한되지 않는 임의의 여러 투여 경로를 통해 투여될 수 있다. 면역원성 조성물은 경구 흡입, 비강 흡입 또는 비강 점막 투여에 의해 투여될 수 있다. 흡입에 의한 본 개시에 기재된 면역원성 조성물의 투여는, 예를 들어, 에어로졸 형태의 분무 또는 액적 메카니즘에 의한 전달을 통해 코 또는 입을 통해 이루어질 수 있다. 대상체에서 코로나바이러스에 대한 보호 면역 반응을 최적화하기 위해 투여 형태를 선택할 수 있다.
면역원성 조성물이 본 발명의 구현예에 따른 핵산, 핵산 작제물 또는 벡터를 포함하는 제공된 방법에서(이러한 조성물은 "핵산 면역원성 조성물" 또는 "핵산 백신"으로 지칭될 수 있음), 면역원성 조성물은 대상체의 세포 내로 도입될 수 있다. 핵산 전달 기술의 예는 "네이키드 DNA" 촉진(부피바카인, 중합체, 펩티드 매개) 전달, 및 양이온성 지질 복합체 또는 리포솜을 포함한다. 핵산은, 예를 들어, 미국 특허 번호 5,204,253에 기술된 바와 같은 탄도 전달 또는 압력(예를 들어, 미국 특허 번호 5,922,687 참조)을 사용하여 투여될 수 있다. 일부 예에서, 본 발명의 구현예에 따른 핵산, 핵산 작제물 또는 벡터 단독으로 또는 대부분으로 구성된 입자가 대상체에게 투여될 수 있다. 일부 예에서, 본 발명의 구현예에 따른 핵산, 핵산 작제물 또는 벡터는 대상체에게 투여하기 위해 금 입자와 같은 입자에 부착될 수 있다. 면역원성 조성물이 바이러스 벡터를 포함하는 경우, 바이러스 벡터는 대상체로부터 얻은 세포(자가 세포)에 도입될 수 있고 세포는 대상체에 투여될 수 있다. 일부 구현예에서, 본 발명의 구현예에 따른 핵산, 핵산 작제물 또는 벡터를 포함하는 면역원성 조성물은 주사 또는 전기천공, 또는 주사와 전기천공의 조합에 의해 투여될 수 있다.
본 개시에 기술된 방법의 맥락에서, 대상체는 건강하고 일반 대중보다 코로나바이러스 발명에 대한 위험이 높지 않을 수 있다. 일부 경우에, 대상체는 감염에 걸리기 쉬워서 코로나바이러스 감염 발병 위험이 높거나 COVID-19와 같은 심각한 형태의 코로나바이러스 질병으로 발달하기 쉬운 경향일 수 있다(예를 들어, 65세 이상의 사람, 천식 또는 다른 만성 호흡기 질환이 있는 사람, 어린이, 임산부, 유전적 소인이 있는 사람, 면역 시스템이 손상된 사람은 심각한 형태의 COVID-19로 발달하기 쉬운 경향일 수 있음). 대상체는 또한 현재 코로나바이러스에 감염된 대상체일 수 있으며, 하나 초과의 감염 증상을 가질 수 있다. 현재 코로나바이러스에 감염된 대상체는 증상 또는 진단 테스트 결과에 따라 코로나바이러스 감염으로 진단되었을 수 있다.
본 발명의 구현예에 따른 방법은 예방 및 치료 목적 모두에 유용하다. 코로나바이러스에 감염되었거나 코로나바이러스 감염에 민감한 대상체에게 유효량의 본 개시에 기술된 면역원성 조성물을 투여하는 것을 포함하는, 대상체에서 코로나바이러스 감염을 치료 또는 예방하는 방법도 본 발명의 구현예에 포함된다. 본 발명의 구현예에 따른 방법에서, 면역원성 조성물은 단독으로 또는, 예를 들어, 코로나바이러스 감염 또는 질병의 치료를 위한 항바이러스 화합물과 같은 하나 이상의 치료제와 함께 사용될 수 있다. 예방적 사용을 위해, 본 개시에 기술된 유효량의 면역원성 조성물은 코로나바이러스 감염의 개시 전(예를 들어, 명백한 감염 징후 전) 또는 초기 개시 동안(예를 들어, 초기 징후 및 감염 증상이 있을 때)에 대상체에게 투여될 수 있다. 예방적 투여는 코로나바이러스 감염 증상이 나타나기 며칠 전에서 몇 년 전에 발생할 수 있다. 예방적 투여는, 예를 들어, 코로나바이러스 감염에 대한 소인이 있는 것으로 확인된 대상체의 예방적 치료에서 사용될 수 있다. 치료적 치료는 감염의 진단 또는 발병 후에 치료적 유효량의 본 개시에 기술된 면역원성 조성물을 대상체에게 투여하는 것을 포함한다.
본 발명의 구현예의 맥락에서, 용어 "치료", "치료하다", "치료하는" 및 관련 용어 및 표현은 대상체에서 면역 반응을 유도함에 의해 코로나바이러스 감염의 영향 중 하나 이상 또는 코로나바이러스 감염의 하나 이상의 증상을 감소시키는 것을 지칭한다. 따라서 개시된 방법에서, 치료는 확립된 코로나바이러스 감염의 중증도 또는 코로나바이러스 감염의 증상의 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100% 감소를 지칭할 수 있다. 예를 들어, 코로나바이러스 감염을 치료하는 방법은 대조군에 비해 대상체에서 코로나바이러스 감염의 하나 이상의 증상이 10% 감소한 경우 치료로 간주된다. 따라서 감소는 천연 또는 대조군 수준과 비교하여 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 10% 내지 100% 사이의 임의의 퍼센트 감소일 수 있다. 치료가 반드시 코로나바이러스 감염 또는 질병 또는 코로나바이러스 감염 또는 질병의 증상의 치유 또는 완전한 제거를 의미하는 것은 아님이 이해된다.
본 발명의 구현예와 관련하여, 용어 "예방하다", "예방하는", 코로나바이러스 감염 또는 질병의 "예방" 및 관련 용어 및 표현은, 예를 들어, 대상체가 코로나바이러스 감염의 하나 이상의 증상을 나타내기 시작하기 전 또는 거의 동시에 발생하는 행위, 예를 들어, 면역원성 조성물의 투여를 지칭하며, 이는 감염의 하나 이상의 증상의 개시 또는 악화를 억제 또는 지연시키거나 재발을 지연시킨다. 본 개시에 사용된 바와 같이, 저하, 감소 또는 억제에 대한 언급은 대조군 수준과 비교하여 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 이상의 변화를 포함한다. 예를 들어, 본 개시에 기재된 방법은 감염을 감소시키기 위한 조성물을 수용하지 않은 코로나바이러스에 노출된 대조군 대상체와 비교할 때, 본 개시에 기술된 면역원성 조성물이 투여된 코로나바이러스에 노출된 대상체에서 코로나바이러스 감염의 개시, 악화 또는 재발, 또는 감염 증상의 약 10% 감소가 있는 경우 코로나바이러스 감염의 예방에 영향을 미치는 것으로 간주될 수 있다. 따라서, 코로나바이러스 감염의 개시, 악화 또는 재발의 감소는 대조군 대상체와 비교하여 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100%, 또는 그 사이의 임의의 감소량일 수 있다.
실시예
하기 실시예는 예시를 위해 제공되지만, 청구된 발명을 제한하지 않는다.
실시예 1: 재료 및 방법.
A. DNA 작제물.
SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)을 인코딩하는 작제물("RBD 작제물")은 문헌[Amanat et al. (2020)]에 기술되어 있다. SARS-CoV-2 스파이크 수용체 RBD는 SARS-CoV-2 Wuhan-Hu-1의 아미노산 잔기 319-541에 걸쳐 있다. RBD 작제물은 천연 신호 펩티드(아미노산 1-14)를 인코딩하는 핵산 서열에 이어, SARS-CoV-2 Wuhan-Hu-1 게놈 서열(GenBank Ref. No. MN9089473)의 잔기 319-541을 인코딩하는 서열, 및 C-말단에서 헥사히스티딘 태그를 인코딩하는 서열을 포함한다.
전장 및 C-말단 트렁케이션된 (ΔC) SARS-CoV-2 스파이크 단백질 엑토도메인 작제물은 문헌[Amanat et al. (2020)]에도 기술된 전장 스파이크 단백질 작제물로부터 제조되었고, 이는 푸린 부위(RRAR)가 알라닌으로 돌연변이되고 예비융합 입체형태에서 스파이크 삼량체를 안정화시키는 2개의 프롤린 돌연변이(K986P 및 V987P)를 갖는 스파이크 단백질의 잔기 1-1213을 인코딩하는 SARS-CoV-2 Wuhan-Hu-1 게놈 서열(GenBank MN9089473)의 핵산 서열을 포함한다. 스파이크 단백질의 잔기 1213을 인코딩하는 핵산 서열 다음에, GCN4 삼량체화 도메인 및 헥사히스티딘 태그를 인코딩하는 핵산 서열이 첨가되었다. 상기 작제물("FL 스파이크 삼량체")는 헵타드 반복 2(HR2)가 결실된 트렁케이션된 SARS-CoV-2 스파이크 단백질 엑토도메인을 인코딩하는 작제물의 기초로 사용되었다. ΔC SARS-CoV-2 스파이크 단백질 엑토도메인("스파이크ΔC 삼량체")을 인코딩하는 작제물, 스파이크 단백질의 잔기 1-1137을 인코딩하는 서열만이 포함되었다. 상기 작제물을 HiFi PCR(Takara)을 사용하여 pADD2 포유동물 발현 벡터로 옮긴 후, EcoRI/XhoI 제한 부위로 InFusion 클로닝하였다. 전장 스파이크 페리틴("FL 스파이크 페리틴") 및 ΔC 스파이크 페리틴("스파이크ΔC 페리틴") 작제물은 발현 벡터에서 전장 스파이크 단백질 엑토도메인(잔기 1-1213) 또는 ΔC 스파이크 단백질 엑토도메인(잔기 1-1143)을 인코딩하는 서열을 PCR-증폭한 후 스티칭 PCR하여 클로닝되었고, 여기서 작제물은 SGG 링커를 인코딩하는 앰플리콘에 이어 H. 파일로리 페리틴 서열(잔기 5-168)로 어닐링되었다. 그런 다음 생성된 앰플리콘을 EcoRI/XhoI 제한 부위를 사용하여 InFusion을 통해 pADD2 포유동물 발현 벡터에 삽입하였다. 최종 서열은 Sanger 시퀀싱을 사용하여 확인되었다.
위에서 논의된 작제물은 도 1에 개략적으로 예시되어 있으며, 작제물에 의해 인코딩된 아미노산 서열은 SEQ ID NO 7-11로 아래에 표시되고, SARS-CoV-2 스파이크 신호 펩티드 서열은 굵게/밑줄이 있는 글꼴로 표시되고, 헥사히스티딘 태그 서열은 굵게 표시되며, Ser/Gly 링커 영역은 밑줄로 표시되고, GCN4 삼량체화 도메인은 이탤릭체로 표시되고, H. 파일로리 페리틴 서열은 이탤릭체 및 밑줄로 표시된다.
RBD - SEQ ID NO:9
Figure pct00008
FL 스파이크 삼량체 - SEQ ID NO:10
Figure pct00009
ΔC 스파이크 삼량체 ("스파이크ΔC 삼량체") - SEQ ID NO:11
Figure pct00010
FL 스파이크 페리틴 융합 단백질 ("FL 스파이크 페리틴") - SEQ ID NO:12
Figure pct00011
ΔC 스파이크 페리틴 융합 단백질 ("스파이크ΔC 페리틴") - SEQ ID NO:13
Figure pct00012
SARS-CoV-2 반응성 모노클로날 항체, CR3022, CB6 및 COVA-2-15에 대한 가변 중쇄 및 가변 경쇄 서열은 인간 발현을 위해 코돈-최적화되었고 통합 DNA 기술(IDT)에서 유전자 블록 단편으로 정렬되었다. 단편을 PCR-증폭하고 InFusion을 사용하여 VRC01의 중쇄 또는 경쇄 Fc 서열을 포함하는 선형화된 CMV/R 발현 벡터에 삽입하였다.
Fc 태그에 융합된 가용성 인간 ACE2는 Addgene 플라스미드로부터 ACE2(잔기 1-615)를 PCR 증폭하고 이를 스티칭 PCR 단계를 사용하여 TEV-GSGG(SEQ ID NO:12) 링커에 의해 분리된 인간 Fc 도메인에 융합시켜 작제되었다. 그런 다음 EcoRI/XhoI 절단 부위를 사용하여 InFusion® 클로닝 시스템을 통해 hACE2-Fc를 pADD2 포유동물 발현 벡터에 삽입하였다.
클로닝된 모든 플라스미드는 Sanger 시퀀싱을 사용하여 서열-확인되었다. 시퀀싱 확인 후, 플라스미드를 Stellar Cells(Takara)로 형질전환하고 LB/카르베니실린 배양액에서 밤새 성장시켰고, 예외로 CMV/R mAb 플라스미드는 LB/카나마이신 배양액에서 성장시켰다. Macherey Nagel Maxi Prep 컬럼을 사용하여 포유동물 세포 형질감염을 위한 플라스미드를 준비하였다. 용리된 DNA는 형질감염 전에 0.22 μm 필터를 사용하여 생물안전(biosafety) 후드에서 여과되었다.
B. SARS-CoV-2 항원의 발현 및 정제.
모든 단백질은 Expi293F 세포에서 발현되었다. Expi293F 세포를 66% Freestyle/33% Expi 배지(ThermoFisher)를 사용하여 배양하고 TriForest 폴리카르보네이트 배플 진탕 플라스크에서 37℃, 8% CO2에서 성장시켰다. 세포를 대략 3-4 x 106개 세포/mL의 밀도로 형질감염시켰다. 형질감염 혼합물은 568 μg의 maxi-prepped DNA를 113 mL의 배양 배지(형질감염된 세포 1리터 당)에 첨가한 다음 1.48 mL의 FectoPro(Polyplus)를 첨가하여 제조되었다. 혼합물을 실온에서 10분 동안 인큐베이션한 다음 세포에 첨가하였다. 세포를 D-글루코스(0.04 g/L 최종 농도) 및 2-프로필펜탄(발프로)산(3 mM 최종 농도)으로 즉시 부스팅하였다. 배양물을 7,000 x g에서 15분 동안 회전시켜 형질감염 3-5일 후에 세포를 수확하였다. 0.22 μm 필터를 사용하여 상청액을 여과하였다.
RBD, FL 스파이크 삼량체 및 ΔC 스파이크 삼량체 폴리펩티드 항원을 HisPur™ Ni-NTA 수지(ThermoFisher)를 사용하여 정제하였다. 정제 전에, 수지를 약 10 컬럼 부피의 세척 완충액(10 mM 이미다졸/1X PBS)으로 3회 세척하였다. 세포 상청액을 10 mM 이미다졸/1X PBS로 1:1 희석하고, 수지를 희석된 세포 상청액에 첨가한 다음, 회전시키면서 4℃에서 인큐베이션하였다. 중력 흐름 정제를 위해 수지/상청액 혼합물을 유리 크로마토그래피 컬럼에 첨가하였다. 칼럼 내의 수지를 10 mM 이미다졸/1X PBS로 세척하고, 단백질을 250 mM 이미다졸/1X PBS로 용리시켰다. 컬럼 용리액은 원심 농축기(RBD의 경우 10 kDa 컷오프, 및 삼량체 작제물의 경우 100 kDa 컷오프)를 사용한 후 AKTA Pure 시스템(Cytiva)에서 크기-배제 크로마토그래피를 사용하여 농축되었다. RBD는 S200을 사용하여 정제되었다. FL 스파이크 삼량체 및 ΔC 스파이크 삼량체 항원은 S6에서 정제되었다. 컬럼은 정제 전에 1X PBS에서 미리-평형화되었다.
FL 스파이크 페리틴 및 ΔC 스파이크 페리틴 나노입자는 음이온 교환 크로마토그래피를 사용한 후 SRT® SEC-1000 컬럼을 사용한 크기-배제 크로마토그래피를 사용하여 분리되었다. 간단히, Expi293F 상청액을 AKTA Flux S 컬럼(Cytiva)을 사용하여 농축하였다. 그런 다음 완충액을 100 kDa 분자량 컷오프(MWCO) 투석 튜빙을 사용하여 4℃에서 밤새 투석을 통해 20 mM Tris, pH 8.0으로 변경하였다. 투석된 상청액을 0.22 μm 필터를 통해 여과하고 20 mM Tris, pH 8.0에서 평형화된 HiTrap® Q 음이온 교환 컬럼에 로딩하였다. 스파이크 나노입자는 0-1 M NaCl 구배를 사용하여 용리되었다. 단백질-함유 분획은 아래에서 추가로 논의되는 바와 같이 CR3022를 사용한 웨스턴 블롯 분석을 사용하여 초기에 확인되었다. 단백질-함유 분획을 풀링하고 100 kDa MWCO Amicon® 스핀 필터를 사용하여 농축하고, 후속하여 1X PBS에서 평형화된 SRT® SEC-1000 SEC 컬럼을 사용하여 AKTA Pure 시스템(Cytiva)에서 정제하였다. A280 신호 및 GelCode™ Blue Stain Reagent(ThermoFisher)로 염색된 4-20% Mini-PROTEAN® TGX™ 단백질 겔에서의 SDS-PAGE 분석을 기반으로 분획을 풀링하였다. 면역화 전에, 샘플을 10% 글리세롤로 보충하고, 0.22 μm 필터를 통해 여과하고, 스냅 냉동하고, 사용할 때까지 -20℃에서 보관하였다.
C. Expi 상청액의 웨스턴 블롯 분석.
Expi293F 상청액을 형질감염 3일 후에 수집하고, 7,000 xg에서 15분 동안 회전시켜 수확하고, 0.22 μm 필터를 통해 여과하였다. 샘플을 SDS-PAGE Laemmli 로딩 완충액(Bio-Rad)에 희석하고, 95℃에서 비등시킨 다음, 250V에서 4-20% Mini-PROTEAN® TGX 단백질 겔(Bio-Rad)에서 진행시켰다. Trans-Blot® Turbo™ 이동 시스템(Bio-Rad)을 사용하여 단백질을 니트로셀룰로스 막으로 옮겼다. 블롯을 5% 밀크/PBST에서 차단한 후 차단 블롯을 PBST로 세척하였다. 자체 제조한 1차 항체(CR3022, 5 μM 스톡 농도)를 PBST에서 1:10,000으로 첨가하였다. 블롯을 PBST로 세척하고 2차 토끼 항-인간 IgG H&L HRP(abcam ab6759)를 PBST에서 1:50,000 희석하여 첨가하였다. 블롯은 Pierce™ ECL 웨스턴 블롯팅 기질(ThermoFisher)을 사용하여 현상되고 GE Healthcare Life Sciences 이미저를 사용하여 이미지화되었다.
D. 정제된 mAb 및 마우스 혈청을 사용한 효소-결합 면역흡착 검정(ELISA).
SARS-CoV-2 항원과의 ELISA 결합은 MaxiSorp™ 96-웰 플레이트(ThermoFisher)에 항원을 1X PBS에서 2 μg/mL로 4℃에서 밤새 코팅하여 수행하였다. 코팅 후, 플레이트를 PBST로 3X 세척하고 ChonBlock™ 차단/희석 ELISA 완충액(Chondrex)을 사용하여 4℃에서 밤새 차단하였다. 완충액을 수동으로 제거하고 플레이트를 PBST로 3X 세척하였다. 마우스 혈청 샘플, 정제된 모노클로날 항체 및 hACE2-Fc를 1:50 혈청 희석 또는 10 μg/mL에서 시작하여 희석 완충액에서 연속 희석한 다음, 실온에서 1시간 동안 코팅된 플레이트에 첨가하였다. 플레이트를 PBST로 3X 세척하였다. 마우스 혈청 ELISA의 경우, HRP 염소 항-마우스(BioLegend 405306)를 희석 완충액에 1:10,000 희석하여 실온에서 1시간 동안 첨가하였다. 정제된 mAb 및 hACE2-Fc의 경우, Direct-Blot HRP 항-인간 IgG1 Fc 항체를 희석 완충액에 1:10,000 희석하여 실온에서 1시간 동안 첨가하였다. 2차 항체와 함께 인큐베이션한 후, ELISA 플레이트를 PBST로 6X 세척하였다. 1-Step™ Turbo TMB 기질(Pierce)을 사용하여 6분 동안 플레이트를 현상하고 2M 황산으로 켄칭하였다. BioTek 플레이트 판독기를 사용하여 450 nm에서의 흡광도를 판독하였다.
E. 마우스 면역화.
Balb/C 마우스를 The Jackson Laboratories(Bar Harbor, ME)에서 구입하였다. 모든 동물은 실험실 동물 관리에 관한 스탠포드 대학 행정 패널(APLAC)이 승인한 프로토콜에 따라 '실험실 동물의 인도적 관리 및 사용'에 대한 공중 보건 서비스 정책에 따라 스탠포드 대학에서 관리하였다. 6 내지 8주령 암컷 Balb/C 마우스는 1X PBS에서 희석된 애주번트로서 10 μg Quil-A® 애주번트(InVivogen, San Diego, CA) 및 10 μg 모노포스포릴 지질 A(InVivogen, San Diego, CA)(MPLA)와 함께 10 μg의 SARS-Cov-2 스파이크 단백질 면역원(또는 달리 명시됨)을 피하 주사하여 면역화되었다. 면역원 및 애주번트 조합의 목록은 표 2에 제공되어 있다.
표 2. 마우스 면역화에 사용되는 면역원 및 애주번트 조합.
Figure pct00013
F. SARS-CoV-2 슈도타입형 렌티바이러스 생산 및 바이러스 중화 검정.
SARS-CoV-2 스파이크 슈도타입형 렌티바이러스는 칼슘 포스페이트 형질감염 시약을 사용하여 HEK293T 세포에서 생산되었다. 600만 개의 세포를 형질감염 하루 전에 10 cm 플레이트의 D10 배지(DMEM + 첨가제: 10% FBS, L-글루타메이트, 페니실린, 스트렙토마이신 및 10 mM HEPES)에 시딩하였다. 문헌[Crawford et al., 2020]에 기술된 바와 같이, 렌티바이러스 패키징 벡터(pHAGE_Luc2_IRES_ZsGreen), SARS-CoV-2 스파이크 벡터("FL 스파이크"), 및 렌티바이러스 헬퍼 플라스미드(HDM-Hgpm2, HDM-Tat1b, 및 pRC-CMV_Rev1b)를 포함하는 5개-플라스미드 시스템이 바이러스 생산에 사용되었다. 스파이크 벡터는 SARS-CoV-2의 Wuhan-Hu-1 균주로부터의 전장 야생형 스파이크 서열을 포함하였다. 플라스미드를 필터 멸균수에 다음 비율로 첨가하였다: 500 μL의 최종 부피 중 10 μg pHAGE_Luc2_IRS_ZsGreen, 3.4 μg FL 스파이크, 2.2 μg HDM-Hgpm2, 2.2 μg HDM-Tat1b, 2.2 μg pRC-CMV_Rev1b. HEPES 완충 식염수(2X, pH 7.0)를 이 혼합물에 1 mL의 최종 부피로 적가하였다. 형질감염 복합체를 형성하기 위해, 용액을 부드럽게 교반하면서 100 μL의 2.5 M CaCl2를 적가하였다. 형질감염 반응을 실온에서 20분 동안 인큐베이션한 다음, 플레이팅된 세포에 천천히 적가하였다. 형질감염 24시간 후 배양 배지를 제거하고 신선한 D10 배지로 교체하였다. 300 x g에서 5분 동안 회전시킨 후 0.45 μm 필터를 통해 여과하여 형질감염 72시간 후 바이러스 상청액을 수확하였다. 바이러스 스톡을 분취하고 추가 사용 전까지 -80℃에서 보관하였다.
바이러스 중화 검정에서 감염에 사용된 표적 세포는 SARS-CoV-2 수용체인 ACE2를 안정적으로 과발현하는 HeLa 세포주에서 유래하였다. 이 세포주의 생산은 문헌[Rogers et al., 2020]에 자세히 설명되어 있다. ACE2/HeLa 세포는 감염 하루 전에 웰 당 5,000개 세포로 플레이팅되었다. 마우스 혈청을 56℃에서 30분 동안 열 불활성화하고, D10 배지에 희석한 다음, 바이러스와 함께 37℃에서 1시간 동안 인큐베이션하였다. 폴리브렌은 억제제/바이러스 희석 전에 5 μg/mL의 최종 농도로 첨가되었다. 인큐베이션 후, 배지를 세포로부터 제거하고, 동등한 부피의 억제제/바이러스 희석액으로 교체한 다음 37℃에서 약 48시간 동안 인큐베이션하였다. 감염성 판독은 루시페라제 수준을 측정하여 수행되었다. BriteLite™ 검정 판독 용액(Perkin Elmer)을 첨가하여 세포를 용해시키고 BioTek 플레이트 판독기를 사용하여 발광 값을 측정하였다. 각 플레이트는 6개의 세포만(0% 감염성) 및 6개의 바이러스만(100% 감염성) 웰을 평균하여 정규화되었다. 정규화된 값은 IC50 값을 얻기 위해 Prism에서 3개의 파라미터 비선형 회귀 억제제 곡선에 핏팅되었다.
G. cryo-EM 데이터 수집
샘플은 정제 후 ΔC 스파이크 및 FL 스파이크 페리틴 나노입자 모두에 대해 약 0.4 mg/mL의 최종 농도로 희석되었다. 각 샘플의 3 μL를 연속 탄소로 코팅된 글로우-방전 200-메시 R2/1 Quantifoil® 그리드에 적용하였다. 그리드를 2초 동안 블롯팅하고 Vitrobot™ Mark IV(Thermo Fisher Scientific)를 사용하여 4℃ 및 100% 습도에서 액체 에탄으로 신속하게 저온냉각하였다. 200 kV에서 작동되는 Talos™ Arctica™ cryo-전자 현미경(Thermo Fisher Scientific)을 사용하여 샘플을 스크리닝하였다. 그런 다음 샘플을 두 샘플 모두에 대해 130,000x(픽셀 당 1.06 Å의 보정된 샘플링에 상응함)의 배율로 GIF 에너지 필터(Gatan)와 함께 300 kV에서 작동되는 Titan Krios™ cryo 전자-현미경(Thermo Fisher Scientific)에서 이미지화하였다. 현미경 사진은 Gatan K2 Summit® 직접 전자 검출기가 장착된 EPU 소프트웨어(Thermo Fisher Scientific)로 기록되었으며, 여기서 각 이미지는 6초의 노출 시간 및 Å2 당 초 당 7.8개의 전자 노출 속도를 갖는 30개의 개별 프레임으로 구성되었다. 총 3,684개의 동영상 스택이 수집되었다.
H. 단일-입자 이미지 처리 및 3D 재구성
모든 동영상 스택은 먼저 이미지 처리를 위해 RELION(REgularised LIkelihood OptimisatioN용) 소프트웨어로 가져왔다. 동작-보정은 MotionCor2를 사용하여 수행되었으며, 변조 전달 함수(CTF)는 CTFFIND4를 사용하여 결정되었다(Rohou et al., 2015). 모든 입자는 EMAN2의 NeuralNet 옵션을 사용하여 자동 선택되었으며, 선택된 3,540개의 현미경 사진에서 152,734개의 입자를 산출하였다. 그런 다음, 입자 좌표를 RELION 소프트웨어로 가져왔고, 여기서 불량한 2D 클래스 평균은 여러 라운드의 2D 분류에 의해 제거되었다. 초기 모델은 팔면체 대칭이 적용된 ab-initio 재구성 옵션을 사용하여 cryoSPARC 플랫폼에서 구축되었다. 팔면체 대칭을 적용하거나 적용하지 않은 62,837개의 입자를 사용하여 최종 3D 정제를 수행하였고, 각각 X-Å 맵 및 X-Å 맵을 얻었다. 최종 맵의 해상도는 푸리에 쉘 상관 곡선의 0.143 기준으로 추정되었다. 가우시안 저역-통과 필터는 University of California San Francisco Chimera 소프트웨어 패키지에 표시되는 최종 3D 맵에 적용되었다.
실시예 2: SARS-CoV-2 항원의 발현 및 특성화.
실시예 1에 기술된 작제물에 의해 인코딩된 SARS-CoV-2 스파이크 단백질 항원을 실시예 1에서 논의된 바와 같이 발현시키고 특성화하였다. 특성화 결과는 도 2a, 2b 및 3에 예시되어 있다. 도 2a에 예시된 바와 같이, Expi293F 세포 상청액의 웨스턴 블롯 분석은 상이한 SARS-CoV-2 스파이크 단백질 항원 간에 발현 수준이 다양함을 나타내었다. 도 2a에 표시된 웨스턴 블롯을 생성하기 위해, 상청액을 비환원 SDS 로딩 완충액에서 비등시키고, 분리를 위해 10% 겔에서 진행시키고, 니트로셀룰로스 막으로 옮기고, 자체 생산된 재조합 항-SARS-CoV-2 스파이크 당단백질 S1 모노클로날 항체(mAb)로 블롯팅하였다. 도 2b에 예시된 바와 같이, 정제된 SARS-CoV-2 RBD(예상 MW 25.9 kDa), FL 스파이크 삼량체(예상 단량체 MW 138.3 kDa), ΔC 스파이크 삼량체(예상 단량체 MW 129.3 kDa), FL 스파이크 페리틴(예상 단량체 MW 151.9 kDa), 및 ΔC 스파이크 페리틴(예상 단량체 MW 143.8 kDa)의 SDS-PAGE 분석은 상기 SARS-CoV-2 항원의 예상된 바와 같은 분자량을 나타내었다. SDS-PAGE를 위해, 샘플을 비환원 SDS 로딩 완충액에서 비등시키고, 분리를 위해 10% 겔에서 진행시키고, 쿠마시 염색으로 시각화하였다. 실험용 동물의 면역화 전에 SARS-CoV-2 항원 제조물의 순도, 균질성 및 크기를 확인하기 위해 다중각 광 산란(SEC-MALS) 분석과 결합된 분석 규모 크기-배제 크로마토그래피를 사용하였다. SEC-MALS 분석 결과는 도 3에 예시되어 있다. RBD 항원은 S200 컬럼에서 분석되었고, 다른 4개 항원은 SRT-1000 컬럼에서 분석되었다. 컴파일링된 UV 신호, 광 산란 신호, 및 샘플의 굴절률 신호를 사용하여 ASTRA 소프트웨어 분석을 사용하여 각 제조물에 대한 추정 분자량 및 유체역학적 반경을 계산하였다. 중요한 것은, 이 분석을 통해 모든 SARS-CoV-2 스파이크 단백질 항원이 안정적으로 다량체화되었고 단량체 형태로 해리되지 않았음을 확인하였다는 것이다. 각 정제된 단백질에 대한 UV, 광 산란 및 굴절률 측정을 사용하여, 각 항원에 대한 추정 분자량 및 유체역학적 반경을 계산하였다. 또한, 이 분석을 통해 정제된 샘플이 본질적으로 균질하였고 이러한 조건에서 응집되기 쉽지 않음을 확인하였다. SARS-CoV-2 RBD에 결합하는 SARS1 모노클로날 항체인 CR3022를 사용하여 웨스턴 블롯을 통해 Expi 상청액의 발현 수준을 평가한 결과, HR2 영역을 포함하는 C-말단 결실이 스파이크 삼량체의 맥락에서 발현 수준을 향상시키고, 스파이크 페리틴 융합 단백질의 발현을 심지어 더욱 향상시켰음이 입증되었다.
실시예 3: SARS-CoV-2 스파이크 단백질 항원의 ELISA 결합 분석.
ELISA를 사용하여 인간 ACE2, COVID-19 정제된 모노클로날 항체(CR3022, CB6, COVA2-15) 및 COVID-19 환자 혈청(ADI-15731)에 대한 SARS-CoV-2 스파이크 단백질 항원의 결합을 비교하였다. ELISA를 위해, 각 SARS-CoV-2 스파이크 단백질 항원을 동등한 농도로 소수성으로 플레이팅하였다. 도 4에 예시된 ELISA 결합 곡선은 SARS-CoV-2 스파이크 단백질 항원이 각각에 대한 유사한 결합 수준에 의해 결정된 바와 같이, ACE2 결합 부위 및 모노클로날 항체 에피토프 모두를 유사하게 제시하였음을 나타내었다.
실시예 4: SARS-CoV-2 스파이크-페리틴 단백질의 cryo-EM 분석.
SARS-CoV-2 스파이크-페리틴 단백질의 cryo-EM 분석을 수행하였고, 결과는 도 5에 예시되어 있다. cryo-EM 분석 결과에 따르면, SARS-CoV-2 스파이크-페리틴 단백질은 코로나바이러스의 스파이크 단백질의 표면에 노출된 삼량체가 포함된 나노입자를 형성하였다. FL 스파이크 페리틴 및 ΔC 스파이크 페리틴의 cryo-EM 원시 이미지는 아포페리틴 입자 주위에 명확한 밀도를 보여주며, 이는 나노입자의 적절한 형성 및 표면에 스파이크 삼량체의 표시를 나타낸다. 2D 클래스 평균은 아포페리틴 외부에 스파이크 삼량체의 밀도를 추가로 보여주었지만, 스파이크 단백질 밀도는 이의 가요성으로 인해 얼룩졌다. ΔC 스파이크 페리틴 입자의 원시 이미지 및 2D 클래스 평균이 FL 스파이크 페리틴 입자보다 우수하였으므로, 추가 데이터 수집 및 이미지 처리를 위해 전자를 선택하였다. 단일-입자 분석을 사용하여, ΔC 스파이크 페리틴 복합체의 3차원(3D) 구조는 팔면체 대칭을 적용하거나 적용하지 않고 결정되었다. 두 cryo-EM 맵은 교차-상관 계수가 0.9857로 매우 유사하였다. cryo-EM 분석을 통해 스파이크 삼량체가 나노입자의 표면에 폴딩된 형태로 나타났음을 확인하였다.
실시예 5: SARS-CoV-2 스파이크 단백질 항원의 면역원성.
SARS-CoV-2 스파이크 단백질 항원의 면역원성 분석을 수행하였고, 실험 결과는 도 6-9에 예시되어 있다. 마우스 그룹은 10 μg의 각 SARS-CoV-2 스파이크 단백질 항원, 애주번트로서 10 μg의 Quil-A® 및 10 μg의 MPLA로 면역화되었고, 초기 면역화는 "0일"에 수행되었다. 마우스는 초기 면역화 후 "21일" 및 "28일"에 채혈하였고, "21일"에 부스트 용량의 면역원을 투여하였다. 21일 및 28일에 면역화된 마우스에서 추출된 혈청을 ELISA 및 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정으로 분석하였다. 슈도타입형 바이러스를 사용한 중화는 연구 실험실 환경에서 바이러스 억제를 평가하는 일반적인 방법이다.
ELISA를 사용하여 SARS-CoV-2 RBD 단백질 및 SARS-CoV-2 스파이크 단백질에 대한 혈청의 결합을 평가하였다. 21일(도 6) 및 28일(도 8)에 추출된 혈청의 ELISA 결합 분석은 5개 모두의 SARS-CoV-2 스파이크 단백질 항원이 SARS-CoV-2 RBD 및 전장 스파이크 단백질을 향한 항체를 유도하였음을 나타내었다. SARS-CoV-2의 혈청 중화는 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. 21일(도 7) 및 28일(도 9)에 추출된 혈청의 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정의 결과는 각 SARS-CoV-2 항원이 SARS-CoV-2 슈도타입형 렌티바이러스를 중화할 수 있는 스파이크-지시 항체를 유도하였음을 나타내었다. 그러나, ΔC 스파이크 페리틴 융합 단백질은 테스트한 모든 항원 중에서 실험용 동물에서 가장 높은 중화 항체 반응을 유도하였다. SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정은 21일에 추출된 혈청에 대해 수행되었고, 20개의 회복기 COVID-19 환자 혈장 샘플의 세트("회복기 COVID-19 혈장", 도 7에서 "CCP"로 표시됨)를 비교에 사용하였다. 비교 결과, ΔC 스파이크 페리틴 융합 단백질을 사용한 면역화는 회복기 COVID-19 혈장과 비교하여 적어도 2배 더 큰 중화 항체 역가를 유도한 것으로 나타났다.
실시예 6: SARS-CoV-2 스파이크 단백질 항원으로 면역화 후 면역글로불린-특이적 반응.
Quil-A®/MPLA로 애주번트 처리된 SARS-CoV-2 스파이크 단백질 항원으로 면역화 후 실험용 동물(마우스)의 면역글로불린-특이적 반응을 ELISA를 사용하여 평가하였다. 실험 결과는 도 10-12에 예시되어 있다. 도 10은 2회 용량의 SARS-CoV-2 스파이크 단백질 항원 FL 스파이크 페리틴("S-Fer"), 스파이크ΔC 페리틴("SΔC-Fer"), FL 스파이크 삼량체("S-GCN4"), 스파이크ΔC 삼량체("SΔC-GCN4") 및 RBD로 면역화된 실험용 마우스에서 추출된 혈청의 IgG1, IgG2a, IgG2b 서브클래스 반응에 대한 ELISA 결합 분석 결과를 예시한다. 10 μg 용량의 항원을 2회 투여하였고, 첫 번째 투여 21일 후에 두 번째 용량을 투여하였다. 실험은 Quil-A® 및 MPLA로 애주번트 처리된 2회 용량의 SARS-CoV-2 스파이크 단백질 항원을 사용한 면역화가 강력한 IgG1 및 IgG2 반응 및 최소 수준의 IgM 반응으로 이어졌음을 보여주었다.
도 10에 예시된 실험 결과는 상이한 SARS-Cov-2 스파이크 단백질 항원 그룹 간에 다양한 비율의 IgG 서브클래스를 사용한 광범위한 IgG 반응을 입증하였다. 도 11a에 추가로 예시된 바와 같이, 스파이크ΔC 페리틴 및 FL 스파이크 삼량체는 IgG1 반응에 비해 더 높은 IgG2a 반응을 유도하였고, FL 스파이크 페리틴 및 스파이크ΔC 삼량체 그룹은 대략적으로 균형 잡힌 수준의 IgG2a 및 IgG1 반응을 유도하였고, RBD는 IgG2a 반응보다 실질적으로 더 큰 IgG1 반응을 유도하였다. 도 11b에 추가로 예시된 바와 같이, 각 SARS-CoV-2 스파이크 단백질 항원은 1 미만의 IgG2b/IgG1 비율로 반응을 유도하였고, 이는 IgG1 반응에 비해 낮은 IgG2b 반응을 나타낸다. ELISA는 또한 실험용 동물에서 SARS-CoV-2 스파이크 단백질 항원-특이적 IgM 역가를 결정하는데 사용되었고, 결과는 도 12에 예시되어 있다. IgG와 비교하여 더 낮은 수준의 IgM이 검출되었다.
실시예 7: SARS-CoV-2 스파이크 단백질 항원으로 면역화 후 안정적인 중화 항체 반응.
SARS-CoV-2 스파이크 단백질 항원 FL 스파이크 페리틴("S-Fer"), 스파이크ΔC 페리틴("SΔC-Fer"), FL 스파이크 삼량체 ("S-GCN4"), 스파이크ΔC 삼량체("SΔC-GCN4") 및 RBD로 면역화 후 중화 항체 반응을 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가하였고, 결과는 도 13a, 13b 및 14에 예시되어 있다. 그 중에서도, 실험 결과는 스파이크ΔC 페리틴을 사용한 면역화가 용량-의존적 중화 항체 반응으로 이어졌고 면역화 후 최대 20주 동안 안정적인 중화 항체 수준을 유도하였음을 나타내었다.
도 13a는 10 μg의 Quil-A® 및 10 μg의 MPLA로 애주번트 처리된 0.1 μg, 1 μg 또는 10 μg의 스파이크ΔC 페리틴의 피하 투여 28일 후에 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시한다. 도 13b는 10 μg의 Quil-A®로 애주번트 처리된 20 μg의 스파이크ΔC 페리틴의 피하 투여 2주 내지 6주 후에 실험용 동물에서 중화 항체 반응이 증가하였고 중화 항체 반응이 스파이크ΔC 페리틴 투여 후 최대 20주 동안 안정적으로 유지되었음을 예시한다. 도 14는 총 100 μL의 부피 중 10 μg의 Quil-A® 및 10 μg의 MPLA로 애주번트 처리된 두 10 μg 용량의 SARS-CoV-2 스파이크 단백질 항원의 피하 투여 후 실험용 마우스에서 SARS-CoV-2 스파이크 단백질 항원에 대한 중화 항체 반응의 수명을 예시한다. 두 번째 용량은 첫 번째 용량 투여 21일 후에 투여되었다. 중화 항체 수준은 초기 투여 4주, 9주 및 15주 후에 수집된 혈청으로부터 평가되었다.
실시예 8: 애주번트 및 투여 조건의 스크리닝.
스파이크ΔC 페리틴으로 면역화를 위한 애주번트 및 투여 조건의 스크리닝을 수행하였고, 결과는 도 15a 및 15b에 예시되어 있다. 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 실험용 동물에서 수집된 혈청의 중화 특성을 평가하였다. 도 15a는 스파이크ΔC 페리틴으로 단일-용량 면역화를 위한 애주번트 및 투여 조건의 비교를 예시한다. 실험용 마우스에 500 μg의 Alhydrogel® 및 20 μg의 CpG, 또는 10 μg의 Quil-A® 및 10 μg의 MPLA로 애주번트 처리된 단일 용량의 1 μg 또는 10 μg의 스파이크ΔC 페리틴을 피하 투여하였다. 면역화 3주 후에 혈청을 수집하였다. 도 15b는 스파이크ΔC 페리틴으로 1회- 및 2회-용량 면역화를 위한 애주번트 및 투여 조건의 비교를 예시한다. 실험용 마우스에 500 μg의 Alhydrogel® 및 20 μg의 CpG, AddaVax™, 또는 10 μg의 Quil-A® 및 10 μg의 MPLA로 애주번트 처리된 첫 번째(초기 또는 프라임) 용량의 1 μg 또는 10 μg의 스파이크ΔC 페리틴을 피하 투여하였다. 혈청은 초기 면역화 21일 후에 수집되었고, 그 시점에 실험용 마우스에 500 μg의 Alhydrogel® 및 20μg의 CpG, AddaVax™, 또는 10 μg의 Quil-A® 및 10 μg의 MPLA로 애주번트 처리된 두 번째(부스트) 용량의 1 μg 또는 10 μg의 스파이크ΔC 페리틴을 피하 투여하였다. 프라임 및 부스트 용량은 실험용 동물의 각 그룹에서 동일하였다. 혈청이 또한 초기 면역화 28일 후에 수집하였다. 도 15b에 예시된 결과는 테스트한 모든 애주번트 조건이 스파이크ΔC 페리틴으로 면역화 후 정량화할 수 있는 중화 항체 수준을 유도하였음을 보여주었고, 500 μg의 Alhydrogel® 및 20 μg의 CpG는 1회 용량 후 가장 강력한 반응을 유도하였고, 10 μg의 Quil-A® 및 10 μg의 MPLA는 2회 용량 후 가장 강력한 반응을 유도하였다.
실시예 9: 2개의 상이한 SARS-CoV-2 스파이크 단백질 항원에 의해 유도된 중화 항체 반응의 비교.
2개의 상이한 SARS-CoV-2 스파이크 단백질 항원, 스파이크ΔC 페리틴("SΔC-Fer McLellan") 및 스파이크HexaProΔC 페리틴("SΔC-Fer HexaPro")에 의해 유도된 중화 항체 반응의 비교를 수행하였고, 결과는 도 16에 예시되어 있다. 스파이크HexaProΔC 페리틴(SEQ ID NO:16)은 실시예 1 및 문헌[Hsieh et al., 2020]에 기술된 것과 실질적으로 유사한 절차를 사용하여 발현 및 정제되었다. 실시예 1에 기술된 것과 실질적으로 유사한 절차를 사용하여, 실험용 마우스를 10 μg의 Quil-A® 및 10 μg의 MPL로 애주번트 처리된 2회 용량의 10 μg의 스파이크ΔC 페리틴 또는 스파이크HexaProΔC 페리틴으로 면역화하였다. 두 번째(부스트) 용량은 초기 면역화 21일 후에 투여되었다. 혈청은 초기 면역화 21일, 28일 및 56일 후에 수집되었다. 실험용 마우스에서 수집된 혈청의 중화 특성은 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. 스파이크ΔC 페리틴 및 스파이크HexaProΔC 페리틴에 의해 유도된 중화 항체 반응의 비교 결과, 스파이크HexaProΔC 페리틴은 스파이크ΔC 페리틴보다 더욱 면역원성인 것으로 나타났다. HexaPro SARS-CoV-2 스파이크 단백질 서열(SEQ ID NO:14)에 기반한 SARS-CoV-2 스파이크 단백질 항원은 아래에 표시된다. SARS-CoV-2 스파이크 신호 펩티드 서열은 굵게/밑줄이 있는 글꼴로 표시되고, 헥사히스티딘 태그 서열은 굵게 표시되며, Ser/Gly 링커 영역은 밑줄로 표시되고, GCN4 삼량체화 도메인 서열은 이탤릭체로 표시되고, H. 파일로리 페리틴 서열은 이탤릭체 및 밑줄로 표시된다.
스파이크HexaProΔC 페리틴 ("HexaPro ΔC 페리틴") - SEQ ID NO:16
Figure pct00014
스파이크HexaProΔC 페리틴 변이체 ("HexaPro ΔC 페리틴 변이체") - SEQ ID NO:17
Figure pct00015
스파이크HexaPro 페리틴 ("HexaPro 페리틴") - SEQ ID NO:18
Figure pct00016
스파이크HexaPro GCN4 ("HexaPro GCN4") - SEQ ID NO:19
Figure pct00017
스파이크HexaProΔC GCN4 ("HexaPro ΔC GCN4") - SEQ ID NO:20
Figure pct00018
실시예 10: 3개의 상이한 SARS-CoV-2 스파이크 단백질 항원의 발현 및 정제 수율의 비교.
다음 SARS-CoV-2 스파이크 단백질 항원의 발현 및 정제 수율을 비교하였고: ΔC 스파이크 페리틴 융합 단백질("스파이크ΔC 페리틴", SEQ ID NO:13, 도 17b-19에서 "Krammer"로 표기됨), ΔC 스파이크 페리틴 융합 단백질 변이체("스파이크ΔC 페리틴 변이체", SEQ ID NO:21, 도 17b-19에서 "McLellan"으로 표기됨), 및 스파이크HexaProΔC 페리틴("HexaPro ΔC 페리틴", SEQ ID NO:16, 도 17b-19에서 "HexaPro"로 표시됨), 결과는 도 17a 및 17b에 예시되어 있다. ΔC 스파이크 페리틴 융합 단백질 변이체(SEQ ID NO:14)의 아미노산 서열은 아래에 표시된다. SARS-CoV-2 스파이크 신호 펩티드 서열은 굵게/밑줄이 있는 글꼴로 표시되고, Ser/Gly 링커 영역은 밑줄로 표시되며, H. 파일로리 페리틴 서열은 이탤릭체 및 밑줄로 표시된다.
ΔC 스파이크 페리틴 융합 단백질 변이체 ("스파이크ΔC 페리틴 변이체") - SEQ ID NO:21
Figure pct00019
상기 3개의 SARS-CoV-2 스파이크 단백질 항원 각각은 실시예 1 및 문헌[Hsieh et al., 2020]에 설명된 절차에 기반한 절차를 사용하여 발현 및 정제되었다. 각 SARS-CoV-2 스파이크 단백질에 대해 이중으로 수행된 발현은 Freestyle™ 및 Expi293™ 발현 배지(Thermo Fisher Scientific, Waltham, Massachusetts)가 2:1 비율로 혼합된 배지에서 배양된 Expi293F 세포에서 수행되었고 제조업체의 지침에 따라 FectPRO® 시약(Polyplus transfection, New York, New York)으로 형질감염되었다. 배양 4-5일 후, 배양 배지를 회전 및 여과에 의해 정화하였다. 정화된 배지를 20 mM Tris, pH 8.0, 완충액으로 희석하고 낮은 이온 강도 완충액(완충액 A, 10 mM Tris, pH 8.0)으로 미리-평형화된 HiTrap Q® HP(Cytiva, Marlborough, Massachusetts) 컬럼에 샘플 펌프로 로딩하였다. 컬럼을 5 컬럼 부피의 완충액 A로 세척하고 완충액 B의 구배(10 mM Tris, pH 8.0, 1M NaCl)를 적용하였다. 5-25% 완충액 B로 용리된 분획을 수집하고 원심 농축기(Amicon®, MilliporeSigma, 100 kDa 컷오프)를 사용하여 20배 농축하였다. 생성된 농축물을 PBS로 10배 희석하고 다시 원심 농축기로 농축하였다. SRT1000 겔 여과 컬럼이 있는 AKTA™ pure FPLC(Cytiva, Marlborough, Massachusetts) 시스템을 추가 정제에 사용하였다.
겔 여과를 위해, 2 ml의 샘플을 2 ml 루프를 사용하여 FPLC 시스템에 주입하고 탈기된 PBS 완충액으로 미리-평형화된 SRT1000 컬럼에 적용하였다. SARS-CoV-2 스파이크 단백질 항원을 포함하는 분획을 수집하고, 풀링하고, 원심 농축기로 농축하였다. 글리세롤 또는 수크로스를 10%의 최종 농도(수크로스의 경우 중량 기준 또는 글리세롤의 경우 부피 기준)로 농축된 샘플에 첨가한 다음 0.22 μm 필터로 여과하고 0.4-0.5 mg/ml의 액체 질소로 급속-냉동하였다. 도 17a는 풀링된 분획이 음영 처리된 SARS-CoV-2 스파이크 단백질 항원의 대표적인 크기-배제 크로마토그래피 추적을 보여준다. 획득된 각 SARS-CoV-2 스파이크 단백질의 상대적인 양은 SARS-CoV-2 스파이크 단백질 항원을 포함하는 분획을 나타내는 곡선 아래 음영 영역으로 계산되었다(도 17a에 예시됨). 도 17b는 전술한 발현 및 정제 절차에 의해 획득된 각 SARS-CoV-2 스파이크 단백질 항원의 상대적인 양의 비교를 예시한다. 도 17b에 예시된 비교는 스파이크HexaProΔC 페리틴의 수율이 스파이크ΔC 페리틴 또는 스파이크ΔC 페리틴 변이체의 수율보다 약 2.5배 더 높음을 나타내었다.
실시예 11: 3개의 상이한 SARS-CoV-2 스파이크 단백질 항원의 면역원성.
실시예 10에 기술된 3개의 SARS-CoV-2 스파이크 단백질 항원 각각의 잠재적 면역원성을 평가하였다. Octet® 시스템(Sartorius, Gottingen, Germany)에서 생물층 간섭계(BLI)를 사용하여 입체형태적 모노클로날 항체(mAb) 및 ACE2 수용체에 대한 SARS-CoV-2 스파이크 단백질 항원의 결합을 테스트하였다. SARS-CoV-2 반응성 mAb, CR3022(HC GenBank DQ168569, LC Genbank DQ168570), CB6(HC GenBank MT470197, LC GenBank MT470196), 및 COVA-2-15(HC GenBank MT599861, LC GenBank MT599945)에 대한 가변 중쇄(HC) 및 가변 경쇄(LC) 서열은 IDT Codon Optimization Tool을 사용하여 인간 발현을 위해 코돈-최적화되고 IDT의 유전자 블록 단편으로 정렬되었다. 단편을 PCR로 증폭하고 In-Fusion® 클로닝 시스템(Takara Bio, Shiga, Japan)을 사용하여 VRC01의 중쇄 또는 경쇄 Fc 서열을 포함하는 CMV/R 발현 벡터에 삽입하였다. Fc 태그가 있는 가용성 인간 ACE2는 Addgene 플라스미드 #1786의 ACE2(아미노산 잔기 1-615를 인코딩하는 서열)를 PCR-증폭하고 이를 스티칭 PCR 단계를 사용하여 TEV-GSGG(SEQ ID NO:5) 링커에 의해 분리된 VRC01의 인간 Fc 도메인에 융합시켜 작제되었다. ACE2-Fc는 EcoRI/XhoI 절단 부위를 사용하여 In-Fusion®을 통해 pADD2 포유동물 발현 벡터에 삽입되었다. 정제된 스파이크 나노입자에 대한 SARS-CoV-2 mAb 및 ACE2 수용체-Fc 융합 단백질을 Octet Fc-결합 팁에 100 nM 농도로 로딩하고, 팁을 Octet 결합 완충액으로 150 nM(SARS-CoV-2 스파이크 단백질 항원 단량체 농도)로 희석하여 테스트 중인 SARS-CoV-2 스파이크 단백질 항원과 함께 웰에 침지시켰다. 결합 60초 후, 팁을 완충액만 존재하는 웰로 옮겼다(해리를 측정하기 위해). 도 18에 예시된 바와 같이, 3개의 SARS-CoV-2 스파이크 단백질 항원 각각이 입체형태적 항체 및 ACE2 수용체에 동등하게 결합하는 것이 관찰되었다. 상기 실험적 관찰을 통해 3개의 SARS-CoV-2 스파이크 단백질 항원 각각이 유사한 방식으로 에피토프를 표시하였음이 확인되었고 면역원성 부위의 제시가 테스트된 SARS-CoV-2 스파이크 단백질 항원 간의 서열 차이에 의해 영향을 받지 않는다는 것이 입증되었다.
SARS-CoV-2 스파이크 단백질 항원에 의해 유도된 중화 항체 반응의 비교는 다음 면역화 시스템을 사용하여 수행되었다. 그룹 당 10마리의 마우스를 500 μg의 명반(InvinoGen, San Diego, California) 및 20 μg의 CpG(InvivoGen)로 애주번트 처리된 2회 용량의 10 μg의 각 SARS-CoV-2 스파이크 단백질 항원으로 면역화하였다. 용량은 "0일" 및 "21일"에 근육내 주사로 투여하였고, 혈액 샘플은 "0일"(면역화 전), "21일" 및 "42일"에 채혈하였다. 실험용 동물로부터 수집된 혈청의 중화 역가는 실시예 1에 기술된 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 중화 검정을 사용하여 평가되었다. 세포의 감염성은 루시페라제 효소 활성을 측정하여 48시간 후에 측정되었다. 상대적인 루시페라제 효소 활성을 혈청 희석에 대해 플롯팅하고 희석 곡선에서 50% 감염 농도(IC50)를 계산하였다. 결과는 도 19에 예시되어 있다. 테스트한 3개의 SARS-CoV-2 스파이크 단백질 항원은 통계적으로 다르지 않은 중화 역가를 생성하였다.
실시예 12: SARS-CoV-2 스파이크 단백질 항원의 동결건조.
동결건조된 스파이크HexaProΔC 페리틴에 대한 실험적 연구가 수행되었고, 수크로스의 존재 하에서 동결건조되고 이후 재구성된 스파이크HexaProΔC 페리틴이 그 구조 및 면역원성을 유지하였음이 입증되었다. 실험 연구의 결과는 도 20-26에 예시되어 있다. 첫 번째 일련의 연구를 위해, 스파이크HexaProΔC 페리틴을 실시예 10에 기술된 바와 같이 발현 및 정제하고 10% 수크로스와 함께 PBS에서 급속 냉동하였다. 동결건조 및 재구성된 스파이크HexaProΔC 페리틴("동결건조된 샘플")을 생성하기 위해, 냉동된 샘플을 동결 건조기(Labconco™, Kansas City, Missouri)에서 밤새 동결건조하고 10% 수크로스와 함께 PBS의 시작 부피와 동일한 부피의 물에 재현탁하였다.
스파이크HexaProΔC 페리틴이 손실 없이 동결건조되고 재구성될 수 있음을 확인하기 위해, 냉동 및 해동된 스파이크HexaProΔC 페리틴 샘플("냉동된 샘플") 및 동결건조된 샘플의 UV 흡광도 스펙트럼을 비교하였고, 결과는 도 20에 예시되어 있다. 시차 주사 형광측정법(결과는 도 21에 예시되어 있음)을 통해 스파이크HexaProΔC 페리틴이 냉동된 및 동결건조된 샘플에서 동일한 열 안정성을 가짐을 확인하였다. 동결건조된 샘플의 스파이크HexaProΔC 페리틴이 입체형태적 에피토프를 유지하는지 확인하기 위해, 두 샘플 모두를 실질적으로 실시예 11에 설명된 대로 BLI로 테스트하였다. BLI 분석 결과는 도 22에 예시되어 있다. BLI 분석은 냉동된 및 동결건조된 샘플이 유사한 방식으로 입체형태적 항체 및 ACE 수용체에 결합하였음을 보여주었고, 이는 면역원성 부위의 제시가 동결건조 및 재구성에 의해 영향을 받지 않았음을 입증한다.
동결건조 및 재구성된 스파이크HexaProΔC 페리틴의 면역원성을 냉동 및 해동된 스파이크HexaProΔC 페리틴의 면역원성과 비교하였다. 냉동된 및 동결건조된 샘플을 각각 5마리의 마우스로 구성된 3개의 동일한 그룹(총 6개 그룹)에 투여하였다. 투여 전에, 동결건조된 및 냉동된 샘플을 실온에서 1시간 동안 인큐베이션하였다. 1시간 후, 10 μg의 단백질과 500 μg의 명반 및 20 μg의 CpG를 혼합하여 샘플을 제형화하였다. 마우스는 "0일"에 근육내 주사를 통한 면역화에 의해 프라이밍되었고, 혈액 샘플은 프라이밍 전 "0일", 면역화 후 "21일" 및 "42일"에 수집되었다. SARS-CoV-2 RBD 단백질에 대한 항혈청의 결합은 "21일"에 측정되었다. 96-웰 플레이트를 재조합 SARS-CoV-2 RBD 단백질로 코팅하고, 희석된 혈청 샘플의 역가를 ELISA로 측정하였다. 혈청 희석에 대해 광학 밀도를 플롯팅하고, 희석 곡선에서 50% 유효 농도(EC50)를 계산하였다. 결과는 도 23에 예시되어 있다. SARS-CoV-2 슈도바이러스 중화 역가는 "21일" 및 "42일"에 테스트되었다. 희석된 마우스 혈청 샘플을 "델타 21-스파이크" 단백질(C-말단 21개 아미노산 결실이 있는 SARS-CoV-2 스파이크 단백질) 및 루시페라제를 포함하는 슈도타입형 SARS-CoV-2 바이러스와 함께 1시간 동안 인큐베이션하고, ACE2 및 막횡단 세린 프로테아제 2(TMPRSS2)를 발현하는 HeLa 세포에 첨가하였다. 세포의 감염성은 루시페라제 효소 활성을 측정하여 48시간 후에 측정되었다. 상대적인 루시페라제 효소 활성을 혈청 희석에 대해 플롯팅하고 희석 곡선에서 50% 감염 농도(IC50)를 계산하였다. 결과는 도 24에 예시되어 있다. 상기 연구는 RBD 결합 역가 및 SARS-CoV-2 슈도바이러스 중화 역가가 냉동된 및 동결건조된 백신 후보로 면역화된 마우스의 혈청 간에 통계적으로 차이가 없음을 보여주었다.
스파이크HexaProΔC 페리틴은 휘발성 암모늄 바이카르보네이트 완충액에서 동결건조되고 10 mg/ml 이상의 농도로 재현탁될 수 있음이 입증되었다. PBS와 같은 비휘발성 완충액에서의 동결건조는 재구성 후 매우 높은 염 농도의 축적을 방지하기 위해 유사한 부피의 물에 재현탁해야 한다. 휘발성 완충액을 사용하면 단백질을 시작 부피에 비해 더 작은 부피로 재현탁하여, 샘플 농도를 증가시킬 수 있다. 암모늄 바이카르보네이트 완충액에서의 동결건조를 위해, 1% 수크로스(중량 기준)를 안정화제로 사용하였다. 동결건조된 샘플의 재구성(가용화) 용이성에 기초하여 1% 수크로스를 선택하였다. 스파이크HexaProΔC 페리틴을 실시예 10에 기재된 바와 같이 발현 및 정제하고, 10 mM 암모늄 바이카르보네이트, pH 7.8로 밤새 투석하였다. 투석 후, 수크로스를 1% 최종 농도(중량 기준)로 첨가하였다. 그런 다음 샘플을 액체 질소에서 1 mg/ml 단백질 농도로 급속 냉동하고, 밤새 동결건조하고, 약 11 mg/ml의 단백질 농도로 PBS에 재현탁하였다. 이어서 재구성된 샘플을 BLI에 의해 입체형태적 항체 CB6 및 ACE2 수용체에 대한 결합에 대해 테스트하였다(결과는 도 25에 예시되어 있음). 샘플 내 스파이크HexaProΔC 페리틴 나노입자의 구조적 완전성은 크기 배제 크로마토그래피 - 다중각 광 산란(SEC-MALS)으로 확인되었다. SEC-MALS 실험 결과는 도 26에 예시되어 있다. 도 26은 휘발성 암모늄 바이카르보네이트 완충액에서 동결건조된 SARS-CoV-2 스파이크 단백질 항원의 특성을 테스트한 SEC-MALS 결과를 예시한다. SEC-MALS 실험을 위해, 재구성 직후 PBS에서 평형화된 SRT SEC-1000 4.6 × 300 mm 컬럼에 5 μg의 단백질을 로딩하였다. UV 및 광-산란 추적 모두에서 검출된 단일의 우세한 피크는 샘플의 나노입자가 균질하고 응집되지 않았음을 확인하였다. 그런 다음 샘플을 실온에서 4일 동안 보관하고, 샘플을 확인하기 위해 SEC-MALS 실험을 반복하였다.
실시예 13: 조작된 글리코실화에 의한 페리틴 도메인 면역원성의 감소.
본 개시의 특정 구현예에 따른 SARS-CoV-2 스파이크 페리틴 융합 단백질 항원의 페리틴 도메인의 면역원성을 감소시키기 위해, 인공 글리코실화 부위가 페리틴 도메인에 설치되도록 설계하였다. 본 개시에 따른 융합 단백질의 페리틴 도메인은 N-결합된 단백질 글리코실화에 필요한 자연 발생 공통 서열 NXS/T(여기서 X는 P일 수 없음)를 포함하지 않는다. 페리틴 도메인에 인공 글리코실화 부위를 작제하기 위해, 융합 단백질 나노입자의 3중 대칭축에서 멀리 떨어진 위치를 선택하고, 2개의 아미노산 치환을 도입하여 인공 글리코실화 부위를 생성하였다. 3중 대칭축에서 멀리 떨어진 위치를 선택하는 것은 SARS-CoV-2 스파이크 융합 단백질 항원의 스파이크 단백질 도메인(3중 축에 위치함)에 대한 면역 반응의 중단을 최소화하기 위해 구상된다. 인공 글리코실화 부위를 갖는 스파이크HexaProΔC 페리틴 변이체의 예는 SEQ ID NO:22-25로 표시된다. SARS-CoV-2 스파이크 신호 펩티드 서열은 굵게/밑줄이 있는 글꼴로 표시되고, Ser/Gly 링커 영역은 밑줄로 표시되며, H. 파일로리 페리틴 서열은 이탤릭체 및 밑줄로 표시되고, 페리틴 도메인의 아미노산 치환은 이탤릭체, 밑줄 및 굵게 표시된다.
인공 글리코실화 부위를 갖는 스파이크HexaProΔC 페리틴 변이체 1 ("HexaPro ΔC Gly 1 페리틴") - SEQ ID NO:22
Figure pct00020
인공 글리코실화 부위를 갖는 스파이크HexaProΔC 페리틴 변이체 2 ("HexaPro ΔC Gly 2 페리틴") - SEQ ID NO:23
Figure pct00021
인공 글리코실화 부위를 갖는 스파이크HexaProΔC 페리틴 변이체 3 ("HexaPro ΔC Gly 3 페리틴") - SEQ ID NO:24
Figure pct00022
인공 글리코실화 부위를 갖는 스파이크HexaProΔC 페리틴 변이체 4 ("HexaPro ΔC Gly 4 페리틴") - SEQ ID NO:25
Figure pct00023
SEQ ID NO:22에서, 2개의 아미노산 치환은 SEQ ID NO:2의 위치 75에 상응하는 위치에서 K에서 N, 및 SEQ ID NO:2의 위치 77에 상응하는 위치에서 E에서 T로의 치환이다. SEQ ID NO:23에서, 2개의 아미노산 치환은 SEQ ID NO:2의 위치 67에 상응하는 위치에서 T에서 N, 및 SEQ ID NO:2의 위치 69에 상응하는 위치에서 I에서 T로의 치환이다. SEQ ID NO:24에서, 2개의 아미노산 치환은 SEQ ID NO:2의 위치 74에 상응하는 위치에서 H에서 N, 및 SEQ ID NO:2의 위치 76에 상응하는 위치에서 F에서 T로의 치환이다. SEQ ID NO:25에서, 2개의 아미노산 치환은 SEQ ID NO:2의 위치 143에 상응하는 위치에서 E에서 N, 및 SEQ ID NO:2의 위치 145에 상응하는 위치에서 H에서 T로의 치환이다. 도 27은 SEQ ID NO:22로부터 형성된 SARS-CoV-2 스파이크 융합 단백질 나노입자에서 조작된 글리코실화 부위의 위치를 개략적으로 예시한다.
실시예 14: 코로나바이러스 스파이크 단백질의 자연 발생 변이체에 기초한 SARS-CoV-2 스파이크 단백질 항원의 테스트.
코로나바이러스 스파이크 단백질의 자연 발생 변이체에 기초한 SARS-CoV-2 스파이크 단백질 항원의 테스트를 수행하였다. 코로나바이러스 스파이크 단백질 변이체는 자연적으로 순환하는 5개의 SARS-CoV-2 변이체: D614G, B.1.1.7, B.1.429("LA 변이체"라고도 함), P1 및 B.1.351로부터 연구를 위해 선택되었고, 이들은 특히 미국 보건복지부의 질병 통제 및 예방 센터에서 "관심 변이체"로 간주되었다. 이러한 SARS-CoV-2 스파이크 단백질 변이체("변이체 SARS-CoV-2 스파이크 단백질 항원")에 기초한 융합 단백질의 아미노산 서열은 아래에 SEQ ID NO:26(D614G 기반), SEQ ID NO:27(B.1.1.7 기반), SEQ ID NO:28(B.1.351 기반), SEQ ID NO:29(B.1.429 기반) 및 SEQ ID NO:30(P1 기반)으로 표시된다. SARS-CoV-2 스파이크 신호 펩티드 서열은 굵게/밑줄이 있는 글꼴로 표시되고, Ser/Gly 링커 영역은 밑줄로 표시되며, H. 파일로리 서열은 이탤릭체 및 밑줄로 표시되고, SEQ ID NO:2와 비교하여 스파이크 도메인 내의 아미노산 치환(표 1에도 요약되어 있음)은 굵게 표시되고, 결실은 밑줄 기호로 표시된다.
스파이크HexaProΔC 페리틴 D614G ("HexaPro ΔC 페리틴 D614G") - SEQ ID NO:26
Figure pct00024
스파이크HexaProΔC 페리틴 B.1.1.7 ("HexaPro ΔC 페리틴 B.1.1.7") - SEQ ID NO:27
Figure pct00025
스파이크HexaProΔC 페리틴 B.1.351 ("HexaPro ΔC 페리틴 B.1.351") - SEQ ID NO:28
Figure pct00026
스파이크HexaProΔC 페리틴 B.1.429 ("HexaPro ΔC 페리틴 B.1.429") - SEQ ID NO:29
Figure pct00027
스파이크HexaProΔC 페리틴 P1 ("HexaPro ΔC 페리틴 P1") - SEQ ID NO:30
Figure pct00028
코로나바이러스 스파이크 단백질의 자연 발생 변이체에 기초한 상기 SARS-CoV-2 스파이크 단백질 항원의 발현 및 정제는 실질적으로 실시예 10에 기재된 바와 같이 수행되었다. 단백질 샘플은 보관을 위해 10% 수크로스와 함께 PBS에서 급속 냉동되었다. BLI는 SARS-CoV-2 스파이크 단백질 항원이 입체형태적 mAb 및 ACE2 수용체에 결합하는 것을 확인하는데 사용되었다. BLI 실험은 실질적으로 실시예 11에 기재된 바와 같이 수행되었다. 결과는 도 28에 요약되어 있다. 입체형태적 항체 및 ACE2 수용체에 대한 스파이크HexaProΔC 페리틴 및 5개의 변이체 SARS-CoV-2 스파이크 단백질 항원 각각의 동등한 결합이 관찰되었다.
변이체 SARS-CoV-2 스파이크 단백질 항원에 의해 유도된 중화 항체 반응에 대한 테스트가 수행되었다. 그룹 당 5마리의 마우스를 각각의 변이체 SARS-CoV-2 스파이크 단백질 항원 및 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화하였다. 면역화는 실질적으로 실시예 11에 기재된 바와 같이 수행되었다. 혈액 샘플은 "0일"(면역화 전), "21일" 및 "28일"에 채혈되었다. 실험용 동물에서 수집된 혈청의 중화 역가는 6개의 슈도바이러스(Wuhan-1, D614G, B.1.429, B1.1.7, P1 및 B.1.351) 패널에 대해 실시예 1에 기술된 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 중화 검정을 사용하여 평가되었다. 결과는 "21일"의 풀링된 혈청을 사용하여 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 중화 검정을 사용하여 생성된 36개의 IC50 값, 및 "28일"의 풀링된 혈청에서의 또 다른 36개의 값으로 요약된다. 결과는 도 29의 표에 제시된 "히트 맵"으로 요약된다. 표에 제시된 각 값은 특정 슈도타입형 바이러스에 대한 동일한 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 풀링된 혈청의 log10IC50 값이다. 도 29에 요약된 분석을 통해 각 바이러스 변이체에 대한 각 SARS-CoV-2 스파이크 단백질 항원의 중화 활성을 비교할 수 있었다. SARS-CoV-2 스파이크 단백질 항원의 스파이크HexaProΔC 페리틴 버전으로 면역화된 동물은 테스트된 슈도바이러스 패널 전반에 걸쳐 가장 높은 중화 역가를 가졌다.
실시예 15: 애주번트 테스트.
애주번트 테스트는 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 마우스에서 SARS-CoV-2 중화 반응을 테스트하여 수행되었다. 결과는 도 30a-34f에 예시되어 있다. 도 30a 및 30b는 500 μg의 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴으로 면역화된 마우스에서 야생형 SARS-CoV-2에 대한 중화 반응의 실험적 테스트 결과를 예시한다. 5마리 마우스의 그룹은 피하 주사를 통해 500 μg의 명반(Alhydrogel®, InvivoGen, San Diego, California)으로 애주번트 처리된 5 μg의 스파이크HexaProΔC 페리틴으로 면역화되었다. 첫 번째 그룹(도 30a)은 1회 면역화되었고, 두 번째 그룹(도 30b)은 초기 면역화 21일 후에 부스팅되었다. 면역 반응을 모니터링하기 위해 표시된 시점에 마우스를 채혈하였고, 이후 야생형 SARS-CoV-2 슈도바이러스 중화 역가를 실질적으로 본 개시의 다른 곳에서 논의된 바와 같이 측정하였다. 간단히, 희석된 마우스 혈청 샘플을 슈도타입형 SARS-CoV-2 바이러스와 함께 1시간 동안 인큐베이션하고 ACE2 및 TMPRSS 2를 발현하는 HeLa 세포에 첨가하였다. 세포의 감염성은 루시페라제 효소 활성을 측정하여 48시간 후에 측정되었다. 상대적인 루시페라제 효소 활성을 혈청 희석에 대해 플롯팅하고 희석 곡선에서 50% 감염 농도(IC50)를 계산하였다. 실험 결과, 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴을 사용한 단일 용량 면역화가 마우스에서 SARS-CoV-2 중화 반응을 유도한 것으로 나타났다. 21일차 부스트가 중화 반응을 개선했지만, 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴을 사용한 단일-용량 면역화는 SARS-CoV-2에 대한 적절한 면역 반응을 생성하기에 충분했다.
도 31a 및 31b는 500 μg의 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴으로 면역화된 마우스에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체에 대한 중화 반응의 실험적 테스트 결과를 예시한다. 10마리 마우스의 그룹은 피하 주사를 통해 500 μg의 명반(Alhydrogel®, InvivoGen, San Diego, California)으로 애주번트 처리된 5 μg의 스파이크HexaProΔC 페리틴으로 면역화되었다. 첫 번째 그룹(도 31a)은 1회 면역화되었고, 두 번째 그룹(도 31b)은 초기 면역화 21일 후에 부스팅되었다. 면역 반응을 모니터링하기 위해 초기 면역화 63일 후에 마우스를 채혈하였다. 이어서, 실질적으로 상기 및 본 개시의 다른 곳에서 논의된 바와 같이 슈도타입형 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체에 대해 혈청 샘플의 중화 역가를 검정하였다. 실험 결과, 명반으로 애주번트 처리된 단일 용량의 스파이크HexaProΔC 페리틴으로 면역화된 마우스의 혈청이 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체를 모두 중화할 수 있는 것으로 나타났다. 21일차 부스트가 중화 활성을 증가시켰지만, 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴을 사용한 단일 용량 면역화가 B.1.617.2("델타 변이체")를 포함하는 테스트된 모든 변이체에 대해 SARS-CoV-2 항바이러스 반응을 일으키는데 효과적이었다.
도 32a 및 32b는 명반 및 CpG로 애주번트 처리된 스파이크HexaProΔC 페리틴으로 면역화된 마우스에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체에 대한 중화 반응의 실험적 테스트 결과를 예시한다. 10마리 마우스의 그룹을 피하 주사를 통해 500 μg의 명반(Alhydrogel®, InvivoGen, San Diego, California) 및 20 μg의 CpG(InvivoGen, San Diego, California)로 애주번트 처리된 5 μg의 스파이크HexaProΔC 페리틴으로 면역화하였다. 첫 번째 그룹(도 32a)은 1회 면역화되었고, 두 번째 그룹(도 32b)은 초기 면역화 21일 후에 부스팅되었다. 면역 반응을 모니터링하기 위해 초기 면역화 63일 후에 마우스를 채혈하였다. 이어서, 실질적으로 상기 및 본 개시의 다른 곳에서 논의된 바와 같이 슈도타입형 야생형 SARS-CoV-2 변이체에 대해 혈청 샘플의 중화 역가를 검정하였다. 실험 결과, 명반 및 CpG로 애주번트 처리된 단일 용량의 스파이크HexaProΔC 페리틴이 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체 모두에 대해 마우스에서 강력한 중화 반응을 유도하는 것으로 나타났다. 21일차 부스트는 중화 활성을 증가시켰다. 실험적 테스트는 명반 외에 애주번트로서 CpG를 포함시키는 것이 명반 단독 사용에 비해 유리하였음을 보여주었다.
도 33은 다양한 용량의 명반(Alhydrogel®, InvivoGen, San Diego, California)으로 애주번트 처리된 스파이크HexaProΔC 페리틴으로 면역화된 마우스에서 야생형 SARS-CoV-2에 대한 중화 반응의 실험적 테스트 결과를 예시한다. 5마리 마우스의 그룹은 피하 주사를 통해 500, 50 또는 5 μg의 명반(Alhydrogel®, InvivoGen, San Diego, California)으로 애주번트 처리된 5 μg의 스파이크HexaProΔC 페리틴으로 면역화되었다. 면역 반응을 모니터링하기 위해 초기 면역화 후 상이한 시점에 마우스를 채혈하였다. 이어서, 실질적으로 상기 및 본 개시의 다른 곳에서 논의된 바와 같이 슈도타입형 야생형 SARS-CoV-2 변이체에 대해 혈청 샘플의 중화 역가를 검정하였다. 실험은 명반의 용량을 늘리면 면역 반응이 개선되고, 명반의 용량을 줄이면 부스트가 유리하다는 것을 보여주었다. 실험은 또한 최고 테스트 용량의 명반으로 애주번트 처리된 단일-용량의 스파이크HexaProΔC 면역화(부스트 없음)에 의해 유도된 중화 반응이 시간이 지남에 따라 개선되었음을 보여주었다. 테스트된 최고 용량의 명반을 사용하여, 42일 및 84일에 측정된 단일-용량 중화 반응은 프라임-부스트 요법에 의해 유도된 중화 반응과 비슷하였다. 따라서, 더 높은 양의 명반으로 애주번트 처리된 스파이크HexaProΔC를 사용한 단일 용량 면역화는 항-SARS-CoV-2 반응을 일으키기에 충분할 수 있다.
도 34a-34f는 다양한 용량의 명반(Alhydrogel®, InvivoGen, San Diego, California)을 단독으로 또는 20 μg의 CpG와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴으로 면역화된 마우스에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체에 대한 중화 반응의 실험적 테스트 결과를 예시한다. 5마리 마우스의 그룹은 피하 주사를 통해 500, 50 또는 50 μg의 명반(Alhydrogel®, InvivoGen, San Diego, California)으로 애주번트 처리된 10 μg의 스파이크HexaProΔC 페리틴으로 면역화되었다. 테스트된 각 애주번트에 대해, 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다. 면역 반응을 모니터링하기 위해 21일 및 28일에 마우스를 채혈하였다. 각 그룹의 5마리 마우스의 혈청 샘플을 풀링하였다. 이어서, 실질적으로 상기 및 본 개시의 다른 곳에서 논의된 바와 같이 슈도타입형 야생형 SARS-CoV-2 변이체에 대해 풀링된 혈청 샘플의 중화 역가를 검정하였다. 실험은 프라임-부스트 요법에서 50 내지 150 μg의 명반 용량으로 애주번트 처리된 스파이크HexaProΔC를 사용한 면역화가 B.1.617.2("델타 변이체")를 포함하는 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체 모두에 대해 적절한 중화 반응을 유도하였음을 보여주었다.
실시예 16: 스파이크HexaProΔC 페리틴 변형.
SARS-CoV-2 단백질의 신호 펩티드 서열의 다른 버전을 포함하는 스파이크HexaProΔC 페리틴의 변형이 예상되며, 두 가지 예가 아래에 SEQ ID NO:33 및 34로 표시된다. SARS-CoV-2 스파이크 신호 펩티드 서열은 굵게/밑줄이 있는 글꼴로 표시되고, Ser/Gly 링커 영역은 밑줄로 표시되며, H. 파일로리 페리틴 서열은 이탤릭체 및 밑줄로 표시된다.
스파이크HexaProΔC 페리틴 변형 - SEQ ID NO:33
Figure pct00029
스파이크HexaProΔC 페리틴 변형 - SEQ ID NO:34
Figure pct00030
본 개시에 기재된 실시예 및 구현예는 단지 예시를 위한 것이며, 이에 비추어 다양한 수정 또는 변경이 당업자에게 제안될 것이고, 이는 본 출원의 사상 및 범위 및 첨부된 청구 범위의 범위 내에 포함되는 것으로 이해된다. 본 개시에 인용된 모든 간행물, 특허 및 특허 출원은 모든 목적을 위해 그 전체가 본원에 참조로 포함된다.
본 개시에 인용된 간행물
Figure pct00031
Figure pct00032
SEQUENCE LISTING <110> czb <120> IMMUNOGENIC CORONAVIRUS FUSION PROTEINS AND RELATED METHODS <130> 103182-1256502-005410WO <150> US 63/070,961 <151> 2020-08-27 <150> US 63/130,056 <151> 2020-12-23 <150> US 63/196,837 <151> 2021-06-04 <160> 30 <170> PatentIn version 3.5 <210> 1 <211> 1273 <212> PRT <213> SARS-CoV-2 <400> 1 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 2 <211> 163 <212> PRT <213> Helicobacter pylori <400> 2 Asp Ile Ile Lys Leu Leu Asn Glu Gln Val Asn Lys Glu Met Gln Ser 1 5 10 15 Ser Asn Leu Tyr Met Ser Met Ser Ser Trp Cys Tyr Thr His Ser Leu 20 25 30 Asp Gly Ala Gly Leu Phe Leu Phe Asp His Ala Ala Glu Glu Tyr Glu 35 40 45 His Ala Lys Lys Leu Ile Ile Phe Leu Asn Glu Asn Asn Val Pro Val 50 55 60 Gln Leu Thr Ser Ile Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr 65 70 75 80 Gln Ile Phe Gln Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser 85 90 95 Ile Asn Asn Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr 100 105 110 Phe Asn Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val 115 120 125 Leu Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn 130 135 140 His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys Ser 145 150 155 160 Arg Lys Ser <210> 3 <211> 1199 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 3 Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn 1 5 10 15 Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser 20 25 30 Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val 35 40 45 Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg 50 55 60 Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser 65 70 75 80 Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu 85 90 95 Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val 100 105 110 Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly 115 120 125 Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg 130 135 140 Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro 145 150 155 160 Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg 165 170 175 Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys 180 185 190 His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala 195 200 205 Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe 210 215 220 Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser 225 230 235 240 Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu 245 250 255 Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr 260 265 270 Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr 275 280 285 Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe 290 295 300 Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn 305 310 315 320 Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val 325 330 335 Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser 340 345 350 Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val 355 360 365 Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp 370 375 380 Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln 385 390 395 400 Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr 405 410 415 Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly 420 425 430 Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys 435 440 445 Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr 450 455 460 Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser 465 470 475 480 Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val 485 490 495 Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly 500 505 510 Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn 515 520 525 Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys 530 535 540 Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp 545 550 555 560 Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys 565 570 575 Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn 580 585 590 Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val 595 600 605 Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr 610 615 620 Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu 625 630 635 640 His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile 645 650 655 Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Ala Ser Val Ala Ser 660 665 670 Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val 675 680 685 Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser 690 695 700 Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp 705 710 715 720 Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu 725 730 735 Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly 740 745 750 Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val 755 760 765 Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn 770 775 780 Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe 785 790 795 800 Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe 805 810 815 Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu 820 825 830 Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu 835 840 845 Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr 850 855 860 Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro 865 870 875 880 Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln 885 890 895 Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser 900 905 910 Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu 915 920 925 Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr 930 935 940 Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu 945 950 955 960 Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile 965 970 975 Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr 980 985 990 Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala 995 1000 1005 Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val 1010 1015 1020 Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser 1025 1030 1035 Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala 1040 1045 1050 Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 1055 1060 1065 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr 1070 1075 1080 His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile 1085 1090 1095 Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile 1100 1105 1110 Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu 1115 1120 1125 Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr 1130 1135 1140 Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser 1145 1150 1155 Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala 1160 1165 1170 Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys 1175 1180 1185 Tyr Glu Gln Tyr Ile Lys Trp Pro Ser Gly Arg 1190 1195 <210> 4 <211> 1129 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 4 Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn 1 5 10 15 Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser 20 25 30 Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val 35 40 45 Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg 50 55 60 Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser 65 70 75 80 Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu 85 90 95 Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val 100 105 110 Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly 115 120 125 Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg 130 135 140 Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro 145 150 155 160 Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg 165 170 175 Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys 180 185 190 His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala 195 200 205 Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe 210 215 220 Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser 225 230 235 240 Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu 245 250 255 Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr 260 265 270 Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr 275 280 285 Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe 290 295 300 Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn 305 310 315 320 Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val 325 330 335 Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser 340 345 350 Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val 355 360 365 Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp 370 375 380 Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln 385 390 395 400 Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr 405 410 415 Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly 420 425 430 Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys 435 440 445 Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr 450 455 460 Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser 465 470 475 480 Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val 485 490 495 Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly 500 505 510 Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn 515 520 525 Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys 530 535 540 Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp 545 550 555 560 Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys 565 570 575 Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn 580 585 590 Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val 595 600 605 Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr 610 615 620 Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu 625 630 635 640 His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile 645 650 655 Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Ala Ser Val Ala Ser 660 665 670 Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val 675 680 685 Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser 690 695 700 Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp 705 710 715 720 Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu 725 730 735 Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly 740 745 750 Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val 755 760 765 Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn 770 775 780 Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe 785 790 795 800 Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe 805 810 815 Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu 820 825 830 Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu 835 840 845 Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr 850 855 860 Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro 865 870 875 880 Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln 885 890 895 Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser 900 905 910 Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu 915 920 925 Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr 930 935 940 Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu 945 950 955 960 Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile 965 970 975 Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr 980 985 990 Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala 995 1000 1005 Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val 1010 1015 1020 Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser 1025 1030 1035 Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala 1040 1045 1050 Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 1055 1060 1065 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr 1070 1075 1080 His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile 1085 1090 1095 Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile 1100 1105 1110 Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu 1115 1120 1125 Asp <210> 5 <211> 4 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 5 gsgg 4 <210> 6 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a, c, g, or t <400> 6 ngtggsg 7 <210> 7 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Constuct <400> 7 ggggs 5 <210> 8 <211> 14 <212> PRT <213> SARS-CoV-2 <400> 8 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln 1 5 10 <210> 9 <211> 243 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 9 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Arg Val 1 5 10 15 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 20 25 30 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 35 40 45 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 50 55 60 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 65 70 75 80 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 85 90 95 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 100 105 110 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 115 120 125 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 130 135 140 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 145 150 155 160 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 165 170 175 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 180 185 190 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 195 200 205 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 210 215 220 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe His His His 225 230 235 240 His His His <210> 10 <211> 1262 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 10 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Ala Ser Val Ala Ser Gln Ser 675 680 685 Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr 690 695 700 Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr 705 710 715 720 Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr 725 730 735 Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln 740 745 750 Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala 755 760 765 Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln 770 775 780 Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser 785 790 795 800 Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu 805 810 815 Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys 820 825 830 Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys 835 840 845 Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp 850 855 860 Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr 865 870 875 880 Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala 885 890 895 Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val 900 905 910 Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile 915 920 925 Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys 930 935 940 Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val 945 950 955 960 Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp 965 970 975 Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg 980 985 990 Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln 995 1000 1005 Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala 1010 1015 1020 Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp 1025 1030 1035 Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1040 1045 1050 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln 1055 1060 1065 Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys 1070 1075 1080 Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1085 1090 1095 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr 1100 1105 1110 Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly 1115 1120 1125 Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp 1130 1135 1140 Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser 1145 1150 1155 Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val 1160 1165 1170 Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys 1175 1180 1185 Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr 1190 1195 1200 Glu Gln Tyr Ile Lys Trp Pro Ser Gly Arg Gly Gly Gly Gly Ser 1205 1210 1215 Arg Met Lys Gln Ile Glu Asp Lys Ile Glu Glu Ile Leu Ser Lys 1220 1225 1230 Gln Tyr His Ile Glu Asn Glu Ile Ala Arg Ile Lys Lys Leu Ile 1235 1240 1245 Gly Glu Arg Gly Gly Ser Gly Gly His His His His His His 1250 1255 1260 <210> 11 <211> 1182 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 11 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Ala Ser Val Ala Ser Gln Ser 675 680 685 Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr 690 695 700 Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr 705 710 715 720 Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr 725 730 735 Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln 740 745 750 Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala 755 760 765 Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln 770 775 780 Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser 785 790 795 800 Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu 805 810 815 Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys 820 825 830 Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys 835 840 845 Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp 850 855 860 Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr 865 870 875 880 Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala 885 890 895 Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val 900 905 910 Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile 915 920 925 Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys 930 935 940 Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val 945 950 955 960 Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp 965 970 975 Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg 980 985 990 Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln 995 1000 1005 Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala 1010 1015 1020 Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp 1025 1030 1035 Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1040 1045 1050 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln 1055 1060 1065 Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys 1070 1075 1080 Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1085 1090 1095 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr 1100 1105 1110 Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly 1115 1120 1125 Ile Val Asn Asn Thr Val Tyr Asp Pro Gly Arg Met Lys Gln Ile 1130 1135 1140 Glu Asp Lys Ile Glu Glu Ile Leu Ser Lys Gln Tyr His Ile Glu 1145 1150 1155 Asn Glu Ile Ala Arg Ile Lys Lys Leu Ile Gly Glu Arg Gly Gly 1160 1165 1170 Ser Gly Gly His His His His His His 1175 1180 <210> 12 <211> 1379 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 12 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Ala Ser Val Ala Ser Gln Ser 675 680 685 Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr 690 695 700 Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr 705 710 715 720 Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr 725 730 735 Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln 740 745 750 Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala 755 760 765 Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln 770 775 780 Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser 785 790 795 800 Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu 805 810 815 Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys 820 825 830 Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys 835 840 845 Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp 850 855 860 Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr 865 870 875 880 Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala 885 890 895 Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val 900 905 910 Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile 915 920 925 Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys 930 935 940 Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val 945 950 955 960 Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp 965 970 975 Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg 980 985 990 Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln 995 1000 1005 Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala 1010 1015 1020 Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp 1025 1030 1035 Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1040 1045 1050 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln 1055 1060 1065 Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys 1070 1075 1080 Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1085 1090 1095 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr 1100 1105 1110 Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly 1115 1120 1125 Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp 1130 1135 1140 Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser 1145 1150 1155 Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val 1160 1165 1170 Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys 1175 1180 1185 Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr 1190 1195 1200 Glu Gln Tyr Ile Lys Trp Pro Ser Gly Arg Ser Gly Gly Asp Ile 1205 1210 1215 Ile Lys Leu Leu Asn Glu Gln Val Asn Lys Glu Met Gln Ser Ser 1220 1225 1230 Asn Leu Tyr Met Ser Met Ser Ser Trp Cys Tyr Thr His Ser Leu 1235 1240 1245 Asp Gly Ala Gly Leu Phe Leu Phe Asp His Ala Ala Glu Glu Tyr 1250 1255 1260 Glu His Ala Lys Lys Leu Ile Ile Phe Leu Asn Glu Asn Asn Val 1265 1270 1275 Pro Val Gln Leu Thr Ser Ile Ser Ala Pro Glu His Lys Phe Glu 1280 1285 1290 Gly Leu Thr Gln Ile Phe Gln Lys Ala Tyr Glu His Glu Gln His 1295 1300 1305 Ile Ser Glu Ser Ile Asn Asn Ile Val Asp His Ala Ile Lys Ser 1310 1315 1320 Lys Asp His Ala Thr Phe Asn Phe Leu Gln Trp Tyr Val Ala Glu 1325 1330 1335 Gln His Glu Glu Glu Val Leu Phe Lys Asp Ile Leu Asp Lys Ile 1340 1345 1350 Glu Leu Ile Gly Asn Glu Asn His Gly Leu Tyr Leu Ala Asp Gln 1355 1360 1365 Tyr Val Lys Gly Ile Ala Lys Ser Arg Lys Ser 1370 1375 <210> 13 <211> 1309 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 13 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Ala Ser Val Ala Ser Gln Ser 675 680 685 Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr 690 695 700 Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr 705 710 715 720 Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr 725 730 735 Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln 740 745 750 Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala 755 760 765 Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln 770 775 780 Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser 785 790 795 800 Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu 805 810 815 Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys 820 825 830 Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys 835 840 845 Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp 850 855 860 Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr 865 870 875 880 Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala 885 890 895 Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val 900 905 910 Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile 915 920 925 Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys 930 935 940 Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val 945 950 955 960 Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp 965 970 975 Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg 980 985 990 Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln 995 1000 1005 Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala 1010 1015 1020 Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp 1025 1030 1035 Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1040 1045 1050 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln 1055 1060 1065 Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys 1070 1075 1080 Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1085 1090 1095 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr 1100 1105 1110 Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly 1115 1120 1125 Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp 1130 1135 1140 Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln Val Asn Lys 1145 1150 1155 Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser Ser Trp Cys 1160 1165 1170 Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu Phe Asp His 1175 1180 1185 Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile Ile Phe Leu 1190 1195 1200 Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile Ser Ala Pro 1205 1210 1215 Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln Lys Ala Tyr 1220 1225 1230 Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn Ile Val Asp 1235 1240 1245 His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn Phe Leu Gln 1250 1255 1260 Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu Phe Lys Asp 1265 1270 1275 Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn His Gly Leu 1280 1285 1290 Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys Ser Arg Lys 1295 1300 1305 Ser <210> 14 <211> 1202 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 14 Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn 1 5 10 15 Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser 20 25 30 Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val 35 40 45 Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg 50 55 60 Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser 65 70 75 80 Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu 85 90 95 Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val 100 105 110 Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly 115 120 125 Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg 130 135 140 Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro 145 150 155 160 Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg 165 170 175 Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys 180 185 190 His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala 195 200 205 Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe 210 215 220 Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser 225 230 235 240 Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu 245 250 255 Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr 260 265 270 Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr 275 280 285 Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe 290 295 300 Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn 305 310 315 320 Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val 325 330 335 Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser 340 345 350 Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val 355 360 365 Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp 370 375 380 Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln 385 390 395 400 Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr 405 410 415 Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly 420 425 430 Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys 435 440 445 Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr 450 455 460 Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser 465 470 475 480 Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val 485 490 495 Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly 500 505 510 Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn 515 520 525 Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys 530 535 540 Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp 545 550 555 560 Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys 565 570 575 Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn 580 585 590 Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val 595 600 605 Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr 610 615 620 Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu 625 630 635 640 His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile 645 650 655 Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser 660 665 670 Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu 675 680 685 Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe 690 695 700 Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr 705 710 715 720 Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser 725 730 735 Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala 740 745 750 Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe 755 760 765 Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly 770 775 780 Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys 785 790 795 800 Arg Ser Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp 805 810 815 Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala 820 825 830 Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro 835 840 845 Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu 850 855 860 Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu 865 870 875 880 Gln Ile Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly 885 890 895 Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln 900 905 910 Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro 915 920 925 Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala 930 935 940 Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser 945 950 955 960 Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu 965 970 975 Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr 980 985 990 Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala 995 1000 1005 Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser 1010 1015 1020 Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe 1025 1030 1035 Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr 1040 1045 1050 Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys 1055 1060 1065 His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser 1070 1075 1080 Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro 1085 1090 1095 Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp 1100 1105 1110 Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln 1115 1120 1125 Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys 1130 1135 1140 Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile 1145 1150 1155 Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn 1160 1165 1170 Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu 1175 1180 1185 Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Ser Gly Arg 1190 1195 1200 <210> 15 <211> 1132 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 15 Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn 1 5 10 15 Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser 20 25 30 Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val 35 40 45 Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg 50 55 60 Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser 65 70 75 80 Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu 85 90 95 Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val 100 105 110 Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly 115 120 125 Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg 130 135 140 Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro 145 150 155 160 Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg 165 170 175 Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys 180 185 190 His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala 195 200 205 Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe 210 215 220 Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser 225 230 235 240 Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu 245 250 255 Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr 260 265 270 Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr 275 280 285 Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe 290 295 300 Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn 305 310 315 320 Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val 325 330 335 Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser 340 345 350 Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val 355 360 365 Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp 370 375 380 Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln 385 390 395 400 Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr 405 410 415 Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly 420 425 430 Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys 435 440 445 Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr 450 455 460 Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser 465 470 475 480 Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val 485 490 495 Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly 500 505 510 Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn 515 520 525 Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys 530 535 540 Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp 545 550 555 560 Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys 565 570 575 Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn 580 585 590 Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val 595 600 605 Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr 610 615 620 Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu 625 630 635 640 His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile 645 650 655 Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser 660 665 670 Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu 675 680 685 Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe 690 695 700 Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr 705 710 715 720 Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser 725 730 735 Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala 740 745 750 Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe 755 760 765 Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly 770 775 780 Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys 785 790 795 800 Arg Ser Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp 805 810 815 Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala 820 825 830 Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro 835 840 845 Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu 850 855 860 Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu 865 870 875 880 Gln Ile Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly 885 890 895 Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln 900 905 910 Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro 915 920 925 Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala 930 935 940 Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser 945 950 955 960 Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu 965 970 975 Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr 980 985 990 Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala 995 1000 1005 Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser 1010 1015 1020 Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe 1025 1030 1035 Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr 1040 1045 1050 Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys 1055 1060 1065 His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser 1070 1075 1080 Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro 1085 1090 1095 Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp 1100 1105 1110 Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln 1115 1120 1125 Pro Glu Leu Asp 1130 <210> 16 <211> 1312 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 16 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln 1145 1150 1155 Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser 1160 1165 1170 Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu 1175 1180 1185 Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile 1190 1195 1200 Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile 1205 1210 1215 Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln 1220 1225 1230 Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn 1235 1240 1245 Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn 1250 1255 1260 Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu 1265 1270 1275 Phe Asn Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn 1280 1285 1290 His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys 1295 1300 1305 Ser Arg Lys Ser 1310 <210> 17 <211> 1311 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 17 Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val Asn 1 5 10 15 Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe Thr 20 25 30 Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu His 35 40 45 Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp Phe 50 55 60 His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn 65 70 75 80 Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys 85 90 95 Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys 100 105 110 Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys 115 120 125 Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr 130 135 140 His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser 145 150 155 160 Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met 165 170 175 Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val 180 185 190 Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro 195 200 205 Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro 210 215 220 Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu 225 230 235 240 Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly 245 250 255 Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg 260 265 270 Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val 275 280 285 Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser 290 295 300 Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln 305 310 315 320 Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro 325 330 335 Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp 340 345 350 Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr 355 360 365 Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr 370 375 380 Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val 385 390 395 400 Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys 405 410 415 Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val 420 425 430 Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr 435 440 445 Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu 450 455 460 Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn 465 470 475 480 Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe 485 490 495 Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu 500 505 510 Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys 515 520 525 Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly 530 535 540 Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro 545 550 555 560 Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg 565 570 575 Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly 580 585 590 Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala 595 600 605 Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile His 610 615 620 Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn 625 630 635 640 Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn 645 650 655 Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser 660 665 670 Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala Ser 675 680 685 Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val 690 695 700 Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser 705 710 715 720 Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp 725 730 735 Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu 740 745 750 Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly 755 760 765 Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val 770 775 780 Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn 785 790 795 800 Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Pro 805 810 815 Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe 820 825 830 Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu 835 840 845 Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu 850 855 860 Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr 865 870 875 880 Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile Pro 885 890 895 Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln 900 905 910 Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser 915 920 925 Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala Leu 930 935 940 Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr 945 950 955 960 Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu 965 970 975 Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile 980 985 990 Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr 995 1000 1005 Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu 1010 1015 1020 Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg 1025 1030 1035 Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln 1040 1045 1050 Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 1055 1060 1065 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp 1070 1075 1080 Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly 1085 1090 1095 Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile 1100 1105 1110 Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val 1115 1120 1125 Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu 1130 1135 1140 Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln Val 1145 1150 1155 Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser Ser 1160 1165 1170 Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu Phe 1175 1180 1185 Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile Ile 1190 1195 1200 Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile Ser 1205 1210 1215 Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln Lys 1220 1225 1230 Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn Ile 1235 1240 1245 Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn Phe 1250 1255 1260 Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu Phe 1265 1270 1275 Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn His 1280 1285 1290 Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys Ser 1295 1300 1305 Arg Lys Ser 1310 <210> 18 <211> 1374 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 18 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn 1205 1210 1215 Glu Gln Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser 1220 1225 1230 Met Ser Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu 1235 1240 1245 Phe Leu Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys 1250 1255 1260 Leu Ile Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr 1265 1270 1275 Ser Ile Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile 1280 1285 1290 Phe Gln Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile 1295 1300 1305 Asn Asn Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr 1310 1315 1320 Phe Asn Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu 1325 1330 1335 Val Leu Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn 1340 1345 1350 Glu Asn His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile 1355 1360 1365 Ala Lys Ser Arg Lys Ser 1370 <210> 19 <211> 1257 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 19 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Gly Gly Gly Gly Ser Arg Met Lys Gln Ile 1205 1210 1215 Glu Asp Lys Ile Glu Glu Ile Leu Ser Lys Gln Tyr His Ile Glu 1220 1225 1230 Asn Glu Ile Ala Arg Ile Lys Lys Leu Ile Gly Glu Arg Gly Gly 1235 1240 1245 Ser Gly Gly His His His His His His 1250 1255 <210> 20 <211> 1195 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 20 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Gly Gly Gly Gly Ser Arg Met Lys Gln Ile Glu Asp 1145 1150 1155 Lys Ile Glu Glu Ile Leu Ser Lys Gln Tyr His Ile Glu Asn Glu 1160 1165 1170 Ile Ala Arg Ile Lys Lys Leu Ile Gly Glu Arg Gly Gly Ser Gly 1175 1180 1185 Gly His His His His His His 1190 1195 <210> 21 <211> 1312 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 21 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln 1145 1150 1155 Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser 1160 1165 1170 Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu 1175 1180 1185 Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile 1190 1195 1200 Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile 1205 1210 1215 Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln 1220 1225 1230 Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn 1235 1240 1245 Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn 1250 1255 1260 Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu 1265 1270 1275 Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn 1280 1285 1290 His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys 1295 1300 1305 Ser Arg Lys Ser 1310 <210> 22 <211> 1312 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 22 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln 1145 1150 1155 Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser 1160 1165 1170 Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu 1175 1180 1185 Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile 1190 1195 1200 Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile 1205 1210 1215 Ser Ala Pro Glu His Asn Phe Thr Gly Leu Thr Gln Ile Phe Gln 1220 1225 1230 Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn 1235 1240 1245 Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn 1250 1255 1260 Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu 1265 1270 1275 Phe Asn Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn 1280 1285 1290 His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys 1295 1300 1305 Ser Arg Lys Ser 1310 <210> 23 <211> 1312 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 23 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln 1145 1150 1155 Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser 1160 1165 1170 Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu 1175 1180 1185 Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile 1190 1195 1200 Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Asn Ser Thr 1205 1210 1215 Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln 1220 1225 1230 Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn 1235 1240 1245 Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn 1250 1255 1260 Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu 1265 1270 1275 Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn 1280 1285 1290 His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys 1295 1300 1305 Ser Arg Lys Ser 1310 <210> 24 <211> 1312 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 24 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln 1145 1150 1155 Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser 1160 1165 1170 Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu 1175 1180 1185 Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile 1190 1195 1200 Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile 1205 1210 1215 Ser Ala Pro Glu Asn Lys Thr Glu Gly Leu Thr Gln Ile Phe Gln 1220 1225 1230 Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn 1235 1240 1245 Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn 1250 1255 1260 Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu 1265 1270 1275 Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn 1280 1285 1290 His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys 1295 1300 1305 Ser Arg Lys Ser 1310 <210> 25 <211> 1312 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 25 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln 1145 1150 1155 Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser 1160 1165 1170 Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu 1175 1180 1185 Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile 1190 1195 1200 Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile 1205 1210 1215 Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln 1220 1225 1230 Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn 1235 1240 1245 Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn 1250 1255 1260 Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu 1265 1270 1275 Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Asn Asn 1280 1285 1290 Thr Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys 1295 1300 1305 Ser Arg Lys Ser 1310 <210> 26 <211> 1312 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 26 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln 1145 1150 1155 Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser 1160 1165 1170 Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu 1175 1180 1185 Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile 1190 1195 1200 Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile 1205 1210 1215 Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln 1220 1225 1230 Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn 1235 1240 1245 Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn 1250 1255 1260 Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu 1265 1270 1275 Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn 1280 1285 1290 His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys 1295 1300 1305 Ser Arg Lys Ser 1310 <210> 27 <211> 1309 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 27 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro 65 70 75 80 Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser 85 90 95 Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr 100 105 110 Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val 115 120 125 Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr His Lys 130 135 140 Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala 145 150 155 160 Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu 165 170 175 Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys 180 185 190 Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn 195 200 205 Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val 210 215 220 Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala 225 230 235 240 Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr 245 250 255 Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe 260 265 270 Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys 275 280 285 Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr 290 295 300 Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr 305 310 315 320 Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly 325 330 335 Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg 340 345 350 Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser 355 360 365 Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu 370 375 380 Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg 385 390 395 400 Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala 405 410 415 Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala 420 425 430 Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr 435 440 445 Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp 450 455 460 Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val 465 470 475 480 Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro 485 490 495 Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe 500 505 510 Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr 515 520 525 Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr 530 535 540 Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln 545 550 555 560 Gln Phe Gly Arg Asp Ile Asp Asp Thr Thr Asp Ala Val Arg Asp Pro 565 570 575 Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val 580 585 590 Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu 595 600 605 Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp 610 615 620 Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe 625 630 635 640 Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser 645 650 655 Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln 660 665 670 Thr Gln Thr Asn Ser His Gly Ser Ala Ser Ser Val Ala Ser Gln Ser 675 680 685 Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr 690 695 700 Ser Asn Asn Ser Ile Ala Ile Pro Ile Asn Phe Thr Ile Ser Val Thr 705 710 715 720 Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr 725 730 735 Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln 740 745 750 Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala 755 760 765 Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln 770 775 780 Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser 785 790 795 800 Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Pro Ile Glu 805 810 815 Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys 820 825 830 Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys 835 840 845 Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp 850 855 860 Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr 865 870 875 880 Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile Pro Phe Pro 885 890 895 Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val 900 905 910 Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile 915 920 925 Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala Leu Gly Lys 930 935 940 Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val 945 950 955 960 Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp 965 970 975 Ile Leu Ala Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg 980 985 990 Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln 995 1000 1005 Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala 1010 1015 1020 Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp 1025 1030 1035 Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1040 1045 1050 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln 1055 1060 1065 Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys 1070 1075 1080 Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1085 1090 1095 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr 1100 1105 1110 Thr His Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly 1115 1120 1125 Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp 1130 1135 1140 Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln Val Asn Lys 1145 1150 1155 Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser Ser Trp Cys 1160 1165 1170 Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu Phe Asp His 1175 1180 1185 Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile Ile Phe Leu 1190 1195 1200 Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile Ser Ala Pro 1205 1210 1215 Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln Lys Ala Tyr 1220 1225 1230 Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn Ile Val Asp 1235 1240 1245 His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn Phe Leu Gln 1250 1255 1260 Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu Phe Lys Asp 1265 1270 1275 Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn His Gly Leu 1280 1285 1290 Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys Ser Arg Lys 1295 1300 1305 Ser <210> 28 <211> 1309 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 28 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Phe Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Ala 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Gly Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu His Ile Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr 245 250 255 Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe 260 265 270 Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys 275 280 285 Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr 290 295 300 Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr 305 310 315 320 Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly 325 330 335 Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg 340 345 350 Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser 355 360 365 Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu 370 375 380 Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg 385 390 395 400 Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala 405 410 415 Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala 420 425 430 Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr 435 440 445 Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp 450 455 460 Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val 465 470 475 480 Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro 485 490 495 Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe 500 505 510 Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr 515 520 525 Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr 530 535 540 Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln 545 550 555 560 Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro 565 570 575 Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val 580 585 590 Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu 595 600 605 Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp 610 615 620 Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe 625 630 635 640 Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser 645 650 655 Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln 660 665 670 Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala Ser Gln Ser 675 680 685 Ile Ile Ala Tyr Thr Met Ser Leu Gly Val Glu Asn Ser Val Ala Tyr 690 695 700 Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr 705 710 715 720 Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr 725 730 735 Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln 740 745 750 Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala 755 760 765 Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln 770 775 780 Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser 785 790 795 800 Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Pro Ile Glu 805 810 815 Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys 820 825 830 Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys 835 840 845 Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp 850 855 860 Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr 865 870 875 880 Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile Pro Phe Pro 885 890 895 Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val 900 905 910 Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile 915 920 925 Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala Leu Gly Lys 930 935 940 Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val 945 950 955 960 Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp 965 970 975 Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg 980 985 990 Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln 995 1000 1005 Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala 1010 1015 1020 Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp 1025 1030 1035 Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1040 1045 1050 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln 1055 1060 1065 Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys 1070 1075 1080 Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1085 1090 1095 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr 1100 1105 1110 Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly 1115 1120 1125 Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp 1130 1135 1140 Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln Val Asn Lys 1145 1150 1155 Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser Ser Trp Cys 1160 1165 1170 Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu Phe Asp His 1175 1180 1185 Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile Ile Phe Leu 1190 1195 1200 Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile Ser Ala Pro 1205 1210 1215 Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln Lys Ala Tyr 1220 1225 1230 Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn Ile Val Asp 1235 1240 1245 His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn Phe Leu Gln 1250 1255 1260 Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu Phe Lys Asp 1265 1270 1275 Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn His Gly Leu 1280 1285 1290 Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys Ser Arg Lys 1295 1300 1305 Ser <210> 29 <211> 1312 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 29 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ile Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Cys Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Arg Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln 1145 1150 1155 Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser 1160 1165 1170 Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu 1175 1180 1185 Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile 1190 1195 1200 Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile 1205 1210 1215 Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln 1220 1225 1230 Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn 1235 1240 1245 Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn 1250 1255 1260 Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu 1265 1270 1275 Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn 1280 1285 1290 His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys 1295 1300 1305 Ser Arg Lys Ser 1310 <210> 30 <211> 1312 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 30 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Phe Thr Asn Arg Thr Gln Leu Pro Ser Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Tyr Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Ser Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Thr Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu Tyr Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Ile Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln 1145 1150 1155 Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser 1160 1165 1170 Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu 1175 1180 1185 Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile 1190 1195 1200 Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile 1205 1210 1215 Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln 1220 1225 1230 Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn 1235 1240 1245 Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn 1250 1255 1260 Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu 1265 1270 1275 Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn 1280 1285 1290 His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys 1295 1300 1305 Ser Arg Lys Ser 1310

Claims (29)

  1. 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열 및 페리틴 서브유닛 폴리펩티드의 아미노산 서열의 융합 단백질로서, 여기서 스파이크 단백질의 인공적으로 변형된 아미노산 서열이 SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:14 또는 SEQ ID NO:15와 적어도 90% 서열 동일성을 갖는 서열인, 융합 단백질.
  2. 제1항에 있어서, 코로나바이러스가 SARS-CoV-2인 융합 단백질.
  3. 제1항 또는 제2항에 있어서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열이 적어도 헵타드 반복 2(HR2)의 아미노산 서열의 C-말단 결실을 포함하는 융합 단백질.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열이 푸린 인식 부위를 제거하는 돌연변이를 포함하는 융합 단백질.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열이 스파이크 단백질을 예비-융합 입체형태로 안정화시키는 하나 이상의 돌연변이를 포함하는 융합 단백질.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 페리틴 서브유닛 폴리펩티드가 헬리코박터 파일로리(Helicobacter pylori) 페리틴 서브유닛 폴리펩티드인 융합 단백질.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 페리틴 서브유닛 폴리펩티드의 아미노산 서열이 SEQ ID NO:2와 적어도 90% 서열 동일성을 갖는 서열인 융합 단백질.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 페리틴 서브유닛 폴리펩티드가 하나 이상의 인공 글리코실화 부위를 포함하는 융합 단백질.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열이 링커 아미노산 서열에 의해 페리틴 서브유닛 폴리펩티드의 아미노산 서열에 연결되는 융합 단백질.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 융합 단백질의 아미노산 서열이 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:33 또는 SEQ ID NO:34와 적어도 90% 동일성을 갖는 서열인 융합 단백질.
  11. 제1항 내지 제10항 중 어느 한 항의 융합 단백질의 올리고머를 포함하는 나노입자.
  12. 제11항에 있어서, 나노입자가 코로나바이러스의 스파이크 단백질의 엑토도메인의 표면에 노출된 삼량체를 포함하는 나노입자.
  13. 제12항에 있어서, 나노입자가 코로나바이러스의 스파이크 단백질의 엑토도메인의 표면에 노출된 8개의 삼량체를 포함하는 나노입자.
  14. 제1항 내지 제10항 중 어느 한 항의 융합 단백질을 인코딩하는 핵산.
  15. 제14항에 있어서, 핵산이 DNA 또는 RNA인 핵산.
  16. 제14항 또는 제15항의 핵산을 포함하는 벡터.
  17. 제14항 또는 제15항의 핵산 또는 제14항의 벡터를 포함하는 세포.
  18. 제1항 내지 제9항 중 어느 한 항의 융합 단백질, 제10항 내지 제12항 중 어느 한 항의 나노입자, 제13항 또는 제14항의 핵산, 또는 제 15항의 벡터를 포함하는 면역원성 조성물.
  19. 제1항 내지 제9항 중 어느 한 항의 2개 이상의 상이한 융합 단백질, 제10항 내지 제12항 중 어느 한 항의 2개 이상의 상이한 나노입자, 제13항 또는 제14항의 2개 이상의 상이한 핵산, 또는 제15항의 2개 이상의 상이한 벡터를 포함하는 면역원성 조성물.
  20. 제18항 또는 제19항에 있어서, 하나 이상의 애주번트를 추가로 포함하는 면역원성 조성물.
  21. 제18항 내지 제20항 중 어느 한 항에 있어서, 하나 이상의 애주번트가 명반을 포함하는 면역원성 조성물.
  22. 제18항 또는 제20항에 있어서, 면역원성 조성물이 동결건조된 면역원성 조성물.
  23. 제18항 내지 제22항 중 어느 한 항의 면역원성 조성물 및 면역원성 조성물을 투여하기 위한 장치 및 부형제 중 하나 이상을 포함하는 키트.
  24. 대상체에게 제18항 내지 제22항 중 어느 한 항의 면역원성 조성물을 투여하는 것을 포함하는, 대상체에서 면역 반응을 유도하는 방법.
  25. 제24항에 있어서, 면역원성 조성물이 대상체에서 코로나바이러스에 대한 보호 면역 반응을 유도할 수 있는 양으로 투여되는 방법.
  26. 제25항에 있어서, 보호 면역 반응이 대상체에서 코로나바이러스에 대한 중화 항체의 생산을 포함하는 방법.
  27. 제24항 내지 제26항 중 어느 한 항에 있어서, 대상체가 인간인 방법.
  28. 제14항 또는 제15항의 핵산 또는 제15항의 벡터를 세포에 도입하고;
    융합 단백질의 발현을 허용하는 조건 하에서 세포를 인큐베이션하고;
    융합 단백질을 분리하는 것을 포함하는, 융합 단백질을 생산하는 방법.
  29. 제14항 또는 제15항의 핵산 또는 제15항의 벡터를 세포에 도입하고;
    융합 단백질의 발현 및 나노입자의 자가-조립을 허용하는 조건 하에서 세포를 인큐베이션하고;
    나노입자를 분리하는 것을 포함하는, 나노입자를 생산하는 방법.
KR1020237010064A 2020-08-27 2021-08-27 면역원성 코로나 바이러스 융합 단백질 및 관련 방법 KR20230084478A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202063070961P 2020-08-27 2020-08-27
US63/070,961 2020-08-27
US202063130056P 2020-12-23 2020-12-23
US63/130,056 2020-12-23
US202163196837P 2021-06-04 2021-06-04
US63/196,837 2021-06-04
PCT/US2021/047885 WO2022047116A1 (en) 2020-08-27 2021-08-27 Immunogenic coronavirus fusion proteins and related methods

Publications (1)

Publication Number Publication Date
KR20230084478A true KR20230084478A (ko) 2023-06-13

Family

ID=80354081

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237010064A KR20230084478A (ko) 2020-08-27 2021-08-27 면역원성 코로나 바이러스 융합 단백질 및 관련 방법

Country Status (12)

Country Link
US (1) US20230399364A1 (ko)
EP (1) EP4203998A1 (ko)
JP (1) JP2023540486A (ko)
KR (1) KR20230084478A (ko)
AU (1) AU2021333793A1 (ko)
BR (1) BR112023003526A2 (ko)
CA (1) CA3193288A1 (ko)
CL (1) CL2023000566A1 (ko)
CO (1) CO2023003453A2 (ko)
IL (1) IL300905A (ko)
MX (1) MX2023002413A (ko)
WO (1) WO2022047116A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114717205A (zh) * 2022-03-29 2022-07-08 中国人民解放军军事科学院军事医学研究院 一种冠状病毒RBDdm变异体及其应用
CN115746148B (zh) * 2022-10-14 2023-09-12 中国医学科学院病原生物学研究所 具有冠状病毒rbd和膜融合抑制多肽的蛋白质及其作为冠状病毒抑制剂的应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HU228121B1 (en) * 2001-05-17 2012-11-28 Stichting Tech Wetenschapp Corona-virus-like particles comprising functionally deleted genomes
EP2758038B1 (en) * 2011-09-23 2018-05-30 The United States of America, as represented by The Secretary, Department of Health & Human Services Novel influenza hemagglutinin protein-based vaccines

Also Published As

Publication number Publication date
BR112023003526A2 (pt) 2023-04-11
CO2023003453A2 (es) 2023-04-27
AU2021333793A1 (en) 2023-04-13
EP4203998A1 (en) 2023-07-05
US20230399364A1 (en) 2023-12-14
CA3193288A1 (en) 2022-03-03
WO2022047116A1 (en) 2022-03-03
CL2023000566A1 (es) 2023-10-30
MX2023002413A (es) 2023-05-23
JP2023540486A (ja) 2023-09-25
IL300905A (en) 2023-04-01

Similar Documents

Publication Publication Date Title
KR102482994B1 (ko) 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물
EP2928493B1 (en) Fusion proteins for use as immunogenic enhancers for inducing antigen-specific t cell responses
CA2485363C (en) Ferritin fusion proteins for use in vaccines and other applications
ES2659875T3 (es) Vacuna de trímero de Env VIH-1 bioquímicamente estabilizado
ES2858315T3 (es) Proteína F de prefusión de VRS soluble estabilizada para uso en la profilaxis de la infección por VRS
CN115515627A (zh) SARS-CoV-2疫苗
JP2003529319A (ja) HIV−1gp41を標的化する広範に中和する抗体を誘発する方法
US8936789B2 (en) Immunoenhancer-linked oligomeric HIV envelope peptides
US20230399364A1 (en) Immunogenic Coronavirus Fusion Proteins and Related Methods
CN115246874A (zh) 一种重组新型冠状病毒s-rbd三聚体蛋白、其制备方法和应用
KR20220010478A (ko) 기도 감염의 치료 또는 예방용 서브유닛 백신
WO2019092002A1 (en) Pharmaceutical compositions for treatment or prevention of viral infections
WO2023051701A1 (zh) 抗SARS-CoV-2感染的mRNA、蛋白以及抗SARS-CoV-2感染的疫苗
WO2021262672A1 (en) Sars-cov-2 rbd constructs
WO2022135563A1 (zh) 同时诱导抗多种病毒的免疫应答的方法
CA2914555A1 (en) Single domain antibody display
WO2021235503A1 (ja) コロナウイルスの蛋白質が担持された複合蛋白質単量体、当該単量体の会合体、及び当該会合体を有効成分とするコンポーネントワクチン
WO2024059149A2 (en) Immunogenic coronavirus fusion proteins and related methods
CN116964104A (zh) 免疫原性冠状病毒融合蛋白及相关方法
CA3174685A1 (en) Immunogenic coronavirus fusion proteins and related methods
CN113801206A (zh) 利用受体识别域诱导抗新冠病毒中和抗体的方法
RU2811991C2 (ru) Субъединичная вакцина для лечения или предотвращения инфекции дыхательных путей
US20230310584A1 (en) Nucleic acids encoding a polypeptide comprising a modified fc region of a human igg1 and at least one heterologous antigen
US20240067706A1 (en) Fully human broad-spectrum neutralizing antibody 76e1 against coronavirus, and use thereof
Ávalos et al. Chimeric Antigen by the Fusion of SARS-CoV-2 Receptor Binding Domain with the Extracellular Domain of Human CD154: A Promising Improved Vaccine Candidate. Vaccines 2022, 10 (6), 897