TW202237626A - Sars-cov-2免疫顯性肽構築體及其用途 - Google Patents
Sars-cov-2免疫顯性肽構築體及其用途 Download PDFInfo
- Publication number
- TW202237626A TW202237626A TW110142318A TW110142318A TW202237626A TW 202237626 A TW202237626 A TW 202237626A TW 110142318 A TW110142318 A TW 110142318A TW 110142318 A TW110142318 A TW 110142318A TW 202237626 A TW202237626 A TW 202237626A
- Authority
- TW
- Taiwan
- Prior art keywords
- hla
- peptide
- mhc
- cov
- sars
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5091—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing the pathological state of an organism
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/569—Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
- G01N33/56966—Animal cells
- G01N33/56972—White blood cells
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/569—Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
- G01N33/56983—Viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/57—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
- A61K2039/572—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 cytotoxic response
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/70—Multivalent vaccine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/20—Vectors comprising a special translation-regulating system translation of more than one cistron
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/20—Vectors comprising a special translation-regulating system translation of more than one cistron
- C12N2840/203—Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/435—Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
- G01N2333/705—Assays involving receptors, cell surface antigens or cell surface determinants
- G01N2333/70503—Immunoglobulin superfamily, e.g. VCAMs, PECAM, LFA-3
- G01N2333/70539—MHC-molecules, e.g. HLA-molecules
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2500/00—Screening for compounds of potential therapeutic value
- G01N2500/04—Screening involving studying the effect of compounds C directly on molecule A (e.g. C are potential ligands for a receptor A, or potential substrates for an enzyme A)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2500/00—Screening for compounds of potential therapeutic value
- G01N2500/10—Screening for compounds of potential therapeutic value involving cells
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/52—Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Immunology (AREA)
- Engineering & Computer Science (AREA)
- Hematology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Urology & Nephrology (AREA)
- General Health & Medical Sciences (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Virology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Food Science & Technology (AREA)
- Biotechnology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Pathology (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Mycology (AREA)
- Public Health (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Physiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Biophysics (AREA)
- Veterinary Medicine (AREA)
- Zoology (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本文提供經由誘導針對所鑑別之SARS-COV-2免疫顯性肽的免疫反應來治療及/或預防COVID-19之方法及組合物。
Description
2019年冠狀病毒疾病或COVID-19係由嚴重急性呼吸道症候群(SARS)-CoV-2 (SARS-CoV-2)病毒感染引起的全球流行病,其已在全球奪走了>500,000條生命且已影響數百萬人。SARS-CoV-2係已知感染人類之第七種冠狀病毒;SARS-CoV、MERS-CoV及SARS-CoV-2可引起嚴重疾病,而HKU1、NL63、OC43及229E引起輕微症狀。開發有效疫苗及療法需要瞭解適應性免疫反應如何識別及清除該病毒,以及該病毒與免疫系統之間的相互作用如何影響該疾病之病理。迄今為止,大多數工作集中在B細胞介導之對病毒的抗體反應上,但對細胞毒性CD8+ T細胞如何識別及清除受感染細胞之瞭解較少。
CD8 T細胞在提供抵抗各種病原體之保護方面起到關鍵作用,且愈來愈多的證據證明SARS-CoV-2就是這種情況。密切相關之SARS-CoV的研究揭露,CD8 T細胞在動物模型之急性感染期間提供保護且記憶CD8 T細胞在人類之急性感染之後的持續時間比體液反應更長。在SARS-CoV-2感染期間,CD8 T細胞反應之幅度與較輕疾病過程相關,表明具有保護作用。值得注意的是,在暴露於SARS-CoV-2且無症狀地清除該病毒之患者中,在抗病毒抗體不存在下已觀察到SARS-CoV-2反應性T細胞,這進一步證明了T細胞之保護作用。
目前SARS-CoV-2疫苗開發工作主要集中在產生針對S蛋白之中和抗體。臨床開發中之絕大多數疫苗(及美國的所有Ph II/III候選物)僅使用S蛋白作為抗原。因此,此等疫苗候選物在天然感染期間缺失由CD8 T細胞識別之大多數抗原。實際上,仔細追蹤接種SARS-CoV-2 S蛋白疫苗之患者的T細胞反應,已揭露可變且微弱之CD8 T細胞反應。需要併入更廣泛抗原之新一代疫苗來更好地參與CD8 T細胞反應,以期提供抵抗SARS-CoV-2之更穩固且持久的保護。迄今為止,開發中之SARS-CoV-2疫苗已在疫苗接種之後導致微弱且可變之CD8反應(Mateus等人 (2021)
Science374:eabj9853)。
本發明至少部分地基於SARS-CoV-2免疫顯性肽之發現。重要的是,此等免疫原性肽中之一些可引出患者之T細胞反應,例如當其經串接時,當其以其他方式安排於多肽中時,或者當其與其他肽組合於構築體(例如核酸載體構築體,諸如藉由包裝於用於細胞內抗原表現之最佳免疫顯性抗原決定基中而使載體尺寸對T細胞反應功效增至最大的彼等)上時。
在一些態樣中,免疫原性多肽包含至少兩個選自表1A、1B、1C、1D、1E及/或1F之肽抗原決定基。在某些態樣中,該至少兩個肽抗原決定基以串接次序位於免疫原性多肽中,視情況其中至少一或多個免疫顯性抗原決定基存在於超過一個複本中。
進一步提供多個實施例,其可應用於本發明之任何態樣及/或與本文所述之任何其他實施例組合。例如,在一些實施例中,至少一或多個免疫顯性抗原決定基存在於超過一個複本中,諸如存在於2個複本、3個複本、4個複本、5個複本、6個複本或更多個或者其間任何範圍(包括其)之複本中,諸如一種免疫顯性抗原決定基為2個複本,另一免疫顯性抗原決定基為3個複本,第三免疫顯性抗原決定基為單一複本,等。在一些實施例中,免疫原性多肽包含至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29個或更多個該等肽抗原決定基,視情況其中該免疫原性多肽包含HLA-A*02、HLA-A*03、HLA-A*01、HLA-A*11、HLA-A*24及HLA-B*07中之每一者至少一個、兩個及/或三個免疫顯性抗原決定基(例如,每一個列出之HLA一個免疫顯性抗原決定基,每一個列出之HLA兩個免疫顯性抗原決定基,每一個列出之HLA三個免疫顯性抗原決定基,或者其間任何範圍(包括其),諸如對於HLA-A*02及HLA-A*03中之每一者一個免疫顯性抗原決定基,加上對於HLA-A*01及HLA-A*11中之每一者兩個免疫顯性抗原決定基,且對於HLA-A*24及HLA-B*07中之每一者三個免疫顯性抗原決定基,等)。在一些實施例中,免疫原性多肽包含3個來自表1A、1B、1C、1D、1E及1F中之每一者之肽抗原決定基。在一些實施例中,免疫原性多肽進一步包含該等肽抗原決定基之間的連接子。在某些實施例中,該連接子包含用於該等肽抗原決定基中之每一者的至少三個胺基酸,其中該至少三個胺基酸係與其各別肽抗原決定基鄰接之彼等。在某些實施例中,該連接子為蛋白酶體裂解基序。在一些實施例中,該等免疫原性多肽進一步包含一或多種選自由Orf1ab、M、N、Orf3a及S組成之群的全長SARS-CoV-2蛋白,或其一或多個蛋白片段,視情況其中該一或多种全長SARS-CoV-2蛋白之片段涵蓋未編碼功能性SARS-CoV-2蛋白之SARS-CoV-2蛋白。在一些實施例中,該等免疫原性多肽進一步包含核糖體停止/再啟動區段、IRES區段及/或轉譯後裂解區段,視情況其中該轉譯後裂解區段為P2A區段。在一些實施例中,該等免疫原性多肽包含本文所述之表(諸如表1G或表1I)中所提供之胺基酸序列中的任一者。
在某些態樣中,該等免疫原性多肽包含至少兩個肽片段,該至少兩個肽片段各自包含該等肽抗原決定基中之至少兩者,其中每一個肽片段中的該等肽抗原決定基中之該至少兩者係源自同一SARS-CoV-2蛋白。
如上文所述,進一步提供多個實施例,其可應用於本發明之任何態樣及/或與本文所述之任何其他實施例組合。例如,在一些實施例中,該至少兩個肽片段係源自SARS-CoV-2之N蛋白、M蛋白、ORF1a/b蛋白或ORF3a蛋白。在一些實施例中,該等免疫原性多肽包含至多6個該等肽片段。在一些實施例中,該等免疫原性多肽進一步包含一或多種選自由Orf1ab、M、N、Orf3a及S組成之群的全長SARS-CoV-2蛋白,或其一或多個蛋白片段,視情況其中該一或多种全長SARS-CoV-2蛋白之片段涵蓋未編碼功能性SARS-CoV-2蛋白之SARS-CoV-2蛋白。在一些實施例中,該等免疫原性多肽進一步包含核糖體停止/再啟動區段、IRES區段及/或轉譯後裂解區段,視情況其中該轉譯後裂解區段為P2A區段。在一些實施例中,該等免疫原性多肽包含本文所述之表(諸如表1H或表1J)中所提供之胺基酸序列中的任一者。在一些實施例中,該等免疫原性多肽能夠活體外或活體內引出T細胞反應,視情況其中藉由四聚體染色分析、T細胞活化分析、CD137染色分析、細胞內IFNγ (IFNg)染色分析、細胞介素釋放分析及/或T細胞增生分析來測定該T細胞反應。
進一步提供多個實施例,其可應用於本發明之任何態樣及/或與本文所述之任何其他實施例組合。舉例而言,在一實施例中,該免疫原性肽係源自SARS-CoV-2蛋白,視情況其中該免疫原性肽為8、9、10、11、12、13、14或15個胺基酸長。在另一實施例中,該SARS-CoV-2蛋白係選自由orf1a/b、S蛋白、N蛋白、M蛋白、orf3a及orf7a組成之群。在又一實施例中,該免疫原性肽能够引出個體之T細胞反應。在一些實施例中,該等免疫原性肽包含選自表1A、1B、1C、1D、1E及/或1F之肽抗原決定基。
在又一態樣中,提供一種免疫原性組合物,其包含至少一種本文所述之免疫原性肽(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127種或更多種,或者其間任何範圍(包括其),諸如1-5種肽),視情況其中該免疫原性組合物進一步包含1)一或多種選自由Orf1ab、M、N、Orf3a及S組成之群的全長SARS-CoV-2蛋白,或其一或多個蛋白片段,視情況其中該一或多種全長SARS-CoV-2蛋白之片段涵蓋未編碼功能性SARS-CoV-2蛋白之SARS-CoV-2蛋白,及/或2)佐劑。
進一步提供多個實施例,其可應用於本發明之任何態樣及/或與本文所述之任何其他實施例組合。舉例而言,在一實施例中,該免疫原性組合物能夠活體外及/或活體內引出T細胞反應。在另一實施例中,藉由四聚體染色分析、T細胞活化分析、CD137染色分析、細胞內IFNg染色分析、細胞介素釋放分析及/或T細胞增生分析來測定該T細胞反應。
在又一態樣中,提供一種組合物,其包含免疫原性多肽及MHC分子,該免疫原性多肽包含至少兩個選自表1A、1B、1C、1D、1E及/或1F之肽抗原決定基。
進一步提供多個實施例,其可應用於本發明之任何態樣及/或與本文所述之任何其他實施例組合。舉例而言,在一實施例中,該MHC分子為MHC多聚體,視情況其中該MHC多聚體為四聚體。在另一實施例中,該MHC分子為MHC I類分子。在另一實施例中,該MHC分子包含MHC α鏈,該鏈係選自由HLA-A*02、HLA-A*03、HLA-A*01、HLA-A*11、HLA-A*24及HLA-B*07組成之群的HLA血清型,視情況其中HLA等位基因係選自由HLA-A*0201、HLA-A*0202、HLA-A*0203、HLA-A*0204、HLA-A*0205、HLA-A*0206、HLA-A*0207、HLA-A*0210、HLA-A*0211、HLA-A*0212、HLA-A*0213、HLA-A*0214、HLA-A*0216、HLA-A*0217、HLA-A*0219、HLA-A*0220、HLA-A*0222、HLA-A*0224、HLA-A*0230、HLA-A*0242、HLA-A*0253、HLA-A*0260、HLA-A*0274等位基因、HLA-A*0301、HLA-A*0302、HLA-A*0305、HLA-A*0307、HLA-A*0101、HLA-A*0102、HLA-A*0103、HLA-A*0116等位基因、HLA-A*1101、HLA-A*1102、HLA-A*1103、HLA-A*1104、HLA-A*1105、HLA-A*1119等位基因、HLA-A*2402、HLA-A*2403、HLA-A*2405、HLA-A*2407、HLA-A*2408、HLA-A*2410、HLA-A*2414、HLA-A*2417、HLA-A*2420、HLA-A*2422、HLA-A*2425、HLA-A*2426、HLA-A*2458等位基因、HLA-B*0702、HLA-B*0704、HLA-B*0705、HLA-B*0709、HLA-B*0710、HLA-B*0715及HLA-B*0721等位基因組成之群。針對此等及其他HLA等位基因之序列、特徵、結構資訊、功能資訊、結合搭配物及其類似物係此項技術中熟知的(參見例如全球資訊網:hla.alleles.org/nomenclature/index.html、hla.alleles.org/data/hla-a.html,及hla.alleles.org/data/hla-b.html)。
在另一態樣中,提供一種穩定MHC-肽複合物,其在MHC分子之背景中包含選自表1A、1B、1C、1D、1E及/或1F之肽抗原決定基。
進一步提供多個實施例,其可應用於本發明之任何態樣及/或與本文所述之任何其他實施例組合。舉例而言,在一實施例中,該MHC分子為MHC多聚體,視情況其中該MHC多聚體為四聚體。在另一實施例中,該MHC分子為MHC I類分子。在另一實施例中,該MHC分子包含MHC α鏈,該鏈係選自由HLA-A*02、HLA-A*03、HLA-A*01、HLA-A*11、HLA-A*24及HLA-B*07組成之群的HLA血清型,視情況其中HLA等位基因係選自由HLA-A*0201、HLA-A*0202、HLA-A*0203、HLA-A*0204、HLA-A*0205、HLA-A*0206、HLA-A*0207、HLA-A*0210、HLA-A*0211、HLA-A*0212、HLA-A*0213、HLA-A*0214、HLA-A*0216、HLA-A*0217、HLA-A*0219、HLA-A*0220、HLA-A*0222、HLA-A*0224、HLA-A*0230、HLA-A*0242、HLA-A*0253、HLA-A*0260、HLA-A*0274等位基因、HLA-A*0301、HLA-A*0302、HLA-A*0305、HLA-A*0307、HLA-A*0101、HLA-A*0102、HLA-A*0103、HLA-A*0116等位基因、HLA-A*1101、HLA-A*1102、HLA-A*1103、HLA-A*1104、HLA-A*1105、HLA-A*1119等位基因、HLA-A*2402、HLA-A*2403、HLA-A*2405、HLA-A*2407、HLA-A*2408、HLA-A*2410、HLA-A*2414、HLA-A*2417、HLA-A*2420、HLA-A*2422、HLA-A*2425、HLA-A*2426、HLA-A*2458等位基因、HLA-B*0702、HLA-B*0704、HLA-B*0705、HLA-B*0709、HLA-B*0710、HLA-B*0715及HLA-B*0721等位基因組成之群。在又一實施例中,該肽抗原決定基及該MHC分子係共價連接及/或其中該MHC分子之α及β鏈係共價連接。在另一實施例中,該穩定MHC-肽複合物包含可偵測標記,視情況其中該可偵測標記為螢光團。
在又一態樣中,提供一種免疫原性組合物,其包含本文所述之穩定MHC-肽複合物及佐劑。
在又一態樣中,提供一種經分離核酸,其編碼本文所述之免疫原性多肽或其補體,視情況其中該經分離核酸為DNA、RNA、mRNA、cDNA、自複製的、環化的、多聯體化的,包含源自所關注之基因(諸如血紅素A)的5’非轉譯區(5’UTR)及/或3’UTR,包含表現啟動子,包含內部核糖體進入位點(IRES),及/或包含自裂解2A肽(諸如P2A或T2A)。
在另一態樣中,提供一種載體,其包含本文所述之經分離核酸。在一些實施例中,該載體為表現載體。
預期編碼本文所述之免疫原性多肽的基礎核酸或者包含該核酸之載體可用於其中需要該免疫原性多肽之本發明之任何態樣或實施例中(例如,該核酸編碼且產生該免疫原性多肽)。由於所編碼且產生之免疫原性多肽且並非歸因於核酸本身,該核酸為免疫原性組合物。
在又一態樣中,提供一種細胞,其a)包含本文所述之經分離核酸,b)包含本文所述之載體,及/或c)産生一或多種本文所述之免疫原性多肽及/或將一或多種本文所述之穩定MHC-肽複合物呈遞於細胞表面,視情況其中該細胞係經遺傳工程改造。
在又一態樣中,提供一種結合部分,其特异性結合本文所述之免疫原性肽及/或本文所述之穩定MHC-肽複合物,視情況其中該結合部分為抗體、抗體之抗原結合片段、TCR、TCR之抗原結合片段、單鏈TCR (scTCR)、嵌合抗原受體(CAR)或包含TCR及效應子域(視情況進一步包含跨膜域及細胞內效應子域)之融合蛋白。
在又一態樣中,提供一種器件或套組,其包含a)一或多種本文所述之免疫原性多肽及/或b)一或多種本文所述之穩定MHC-肽複合物,該器件或套組視情況包含偵測a)及/或b)與T細胞受體之結合的試劑。
在另一態樣中,提供一種偵測結合穩定MHC-肽複合物之T細胞之方法,其包含:(a)使包含T細胞之樣品與本文所述之穩定MHC-肽複合物接觸;及(b)偵測T細胞與該穩定MHC-肽複合物之結合,視情況進一步測定與該穩定MHC-肽複合物結合之穩定MHC-肽特异性T細胞之百分率。
進一步提供多個實施例,其可應用於本發明之任何態樣及/或與本文所述之任何其他實施例組合。舉例而言,在一實施例中,樣品包含外周血單核細胞(PBMC)。在另一實施例中,T細胞為CD8+ T細胞。在又一實施例中,使用螢光活化細胞分選(FACS)、酶聯免疫吸附劑分析(ELISA)、放射免疫分析(RIA)、免疫化學、西方墨點或細胞內流式分析來執行偵測及/或測定。在又一實施例中,樣品包含接觸或懷疑接觸過一或多種SARS-CoV-2蛋白或其片段之T細胞。
在又一態樣中,提供一種確定個體是否已暴露於SARS-CoV-2及/或具有抵抗SARS-CoV-2之保護的方法,該方法包含a)將包含自個體獲得之T細胞之細胞群體與本文所述之免疫原性多肽或本文所述之穩定MHC-肽複合物一起培育;及b)偵測反應性之存在或水準,其中存在反應性或與對照水準相比反應性水準較高指示該個體已暴露於SARS-CoV-2及/或具有抵抗SARS-CoV-2之保護。
在又一態樣中,提供一種用於預測罹患SARS-CoV-2感染之個體之臨床結果的方法,該方法包含a)測定自個體獲得之T細胞與一或多種本文所述之免疫原性肽或一或多種本文所述之穩定MHC-肽複合物之間的反應性之存在或水準;及b)將該反應性之存在或水準與來自對照之反應性之存在或水準進行比較,其中該對照係獲自具有良好臨床結果之個體,其中個體樣品中存在反應性或如與對照相比反應性水準較高指示該個體具有良好臨床結果。
在另一態樣中,提供一種評估SARS-CoV-2療法之功效之方法,該方法包含a)在向個體提供至少一部分SARS-CoV-2療法之前自個體獲得之第一樣品中,測定自個體獲得之T細胞與一或多種本文所述之免疫原性肽或一或多種本文所述之穩定MHC-肽複合物之間的反應性之存在或水準,及b)測定一或多種本文所述之免疫原性肽或一或多種本文所述之穩定MHC-肽複合物與自個體獲得之T細胞之間的反應性之存在或水準,該等T細胞存在於提供部分SARS-CoV-2療法之后自個體獲得之第二樣品中,其中第二樣品中存在反應性或相對於第一樣品反應性水準較高指示該療法對治療個體之SARS-CoV-2有效。
進一步提供多個實施例,其可應用於本發明之任何態樣及/或與本文所述之任何其他實施例組合。舉例而言,在一實施例中,反應性水準由a)結合之存在及/或b) T細胞活化及/或效應子功能指示,視情況其中T細胞活化或效應子功能為T細胞增生、殺死或細胞介素釋放。在另一實施例中,該方法進一步包含在後續時間點重複步驟a)及b),視情況其中個體在第一時間點與後續時間點之間已經歷治療以改善SARS-CoV-2感染。在又一實施例中,使用螢光活化細胞分選(FACS)、酶聯免疫吸附劑分析(ELISA)、放射免疫分析(RIA)、免疫化學、西方墨點或細胞內流式分析來偵測T細胞結合、活化及/或效應子功能。在又一實施例中,對照水準為參考數字。在另一實施例中,對照水準係未暴露於SARS-CoV-2之個體水準。
在又一態樣中,提供一種預防及/或治療個體之SARS-CoV-2感染之方法,該方法包含向該個體投與治療有效量的包含及/或編碼一或多種免疫原性多肽之免疫原性組合物,及/或本文所述之細胞。
進一步提供多個實施例,其可應用於本發明之任何態樣及/或與本文所述之任何其他實施例組合。例如,在一實施例中,該免疫原性組合物包含編碼本文所述之免疫原性多肽(諸如包含至少兩個選自表1A、1B、1C、1D、1E及/或1F之肽抗原決定基的免疫原性多肽)之核酸。在一實施例中,該免疫原性肽係源自SARS-CoV-2蛋白,視情況其中該免疫原性肽為8、9、10、11、12、13、14或15個胺基酸長。在一實施例中,該SARS-CoV-2蛋白係選自由orf1a/b、S蛋白、N蛋白、M蛋白、orf3a及orf7a組成之群。在一實施例中,該免疫原性多肽能够引出個體之T細胞反應。在一實施例中,該免疫原性組合物包含超過一種免疫原性多肽。在又一實施例中,該免疫原性組合物進一步包含佐劑。在又一實施例中,該免疫原性組合物能够引出個體之T細胞反應。在另一實施例中,所投與之免疫原性組合物誘導個體針對SARS-CoV-2之免疫反應。在又一實施例中,所投與之免疫原性組合物誘導個體針對SARS-CoV-2之T細胞免疫反應。在又一實施例中,該T細胞免疫反應為CD8+ T細胞免疫反應。
在又一態樣中,提供一種鑑別與至少一種本文所述之免疫原性多肽之肽抗原決定基結合的肽結合分子或其抗原結合片段之方法,該方法包含a)提供細胞,該細胞在MHC分子之背景中將該至少一種本文所述之免疫原性多肽之肽抗原決定基呈遞於該細胞之表面上,視情況其中該細胞包含編碼且表現該至少一種免疫原性多肽之核酸;b)測定複數種候選肽結合分子或其抗原結合片段在MHC分子之背景中與細胞上之肽抗原決定基的結合;及c)鑑別在MHC分子之背景中與肽抗原決定基結合的一或多種肽結合分子或其抗原結合片段。
進一步提供多個實施例,其可應用於本發明之任何態樣及/或與本文所述之任何其他實施例組合。舉例而言,在一實施例中,步驟a)包含使MHC分子在細胞表面上與選自表1A、1B、1C、1D、1E及/或1F之肽抗原決定基接觸。在另一實施例中,步驟a)包含用編碼本文所述之免疫原性多肽之核酸轉染細胞,該核酸呈編碼本文所述之免疫原性多肽之基礎核酸形式或呈包含此類基礎核酸之載體形式,諸如包含編碼選自表1A、1B、1C、1D、1E及/或1F之肽抗原決定基的異源序列。
在另一態樣中,提供一種鑑別與至少一種本文所述之免疫原性多肽之肽抗原決定基結合的肽結合分子或其抗原結合片段之方法,該方法包含a)提供在MHC分子之背景中包含該至少一種本文所述之免疫原性多肽之肽抗原決定基的穩定MHC-肽複合物;b)測定複數種候選肽結合分子或其抗原結合片段與該穩定MHC-肽複合物之結合;及c)鑑別與該穩定MHC-肽複合物結合之一或多種肽結合分子或其抗原結合片段。
進一步提供多個實施例,其可應用於本發明之任何態樣及/或與本文所述之任何其他實施例組合。舉例而言,在一實施例中,該MHC分子為MHC多聚體,視情況其中該MHC多聚體為四聚體。在另一實施例中,該MHC分子為MHC I類分子。在另一實施例中,該MHC分子包含MHC α鏈,該鏈係選自由HLA-A*02、HLA-A*03、HLA-A*01、HLA-A*11、HLA-A*24及HLA-B*07組成之群的HLA血清型,視情況其中HLA等位基因係選自由HLA-A*0201、HLA-A*0202、HLA-A*0203、HLA-A*0204、HLA-A*0205、HLA-A*0206、HLA-A*0207、HLA-A*0210、HLA-A*0211、HLA-A*0212、HLA-A*0213、HLA-A*0214、HLA-A*0216、HLA-A*0217、HLA-A*0219、HLA-A*0220、HLA-A*0222、HLA-A*0224、HLA-A*0230、HLA-A*0242、HLA-A*0253、HLA-A*0260、HLA-A*0274等位基因、HLA-A*0301、HLA-A*0302、HLA-A*0305、HLA-A*0307、HLA-A*0101、HLA-A*0102、HLA-A*0103、HLA-A*0116等位基因、HLA-A*1101、HLA-A*1102、HLA-A*1103、HLA-A*1104、HLA-A*1105、HLA-A*1119等位基因、HLA-A*2402、HLA-A*2403、HLA-A*2405、HLA-A*2407、HLA-A*2408、HLA-A*2410、HLA-A*2414、HLA-A*2417、HLA-A*2420、HLA-A*2422、HLA-A*2425、HLA-A*2426、HLA-A*2458等位基因、HLA-B*0702、HLA-B*0704、HLA-B*0705、HLA-B*0709、HLA-B*0710、HLA-B*0715及HLA-B*0721等位基因組成之群。在又一實施例中,該肽抗原決定基及該MHC分子係共價連接及/或其中該MHC分子之α及β鏈係共價連接。在另一實施例中,該穩定MHC-肽複合物包含可偵測標記,視情況其中該可偵測標記為螢光團。在又一實施例中,該複數種候選肽結合分子包含一或多種T細胞受體(TCR),或TCR之一或多個抗原結合片段。在又一實施例中,該複數種候選肽結合分子包含至少2、5、10、100、10
3、10
4、10
5、10
6、10
7、10
8、10
9種或更多種不同的候選肽結合分子。在另一實施例中,該複數種候選肽結合分子包含自個體或個體群體之樣品獲得的一或多種候選肽結合分子;或該複數種候選肽結合分子包含包括自個體樣品獲得之親本支架肽結合分子之突變的一或多種候選肽結合分子。在又一實施例中,該個體或個體群體a)未感染SARS-CoV-2及/或已自COVID-19中恢復或b)感染SARS-CoV-2及/或具有COVID-19。在又一實施例中,該個體或個體群體已接種一或多種免疫原性多肽,其中該等免疫原性多肽包含選自表1A、1B、1C、1D、1E及/或1F之肽抗原決定基。在另一實施例中,該個體為哺乳動物,視情況其中該哺乳動物為人類、靈長類動物或嚙齒動物。在又一實施例中,該個體為HLA轉殖基因小鼠及/或為人類TCR轉殖基因小鼠。在又一實施例中,樣品包含T細胞。在另一實施例中,樣品包含外周血單核細胞(PBMC)或CD8+記憶T細胞。在又一實施例中,TCR之抗原結合片段為單鏈TCR (scTCR)。
在另一態樣中,提供根據本文所述之方法鑑別之肽結合分子或其抗原結合片段,視情況其中結合部分為抗體、抗體之抗原結合片段、TCR、TCR之抗原結合片段、單鏈TCR (scTCR)、嵌合抗原受體(CAR)或包含TCR及效應子域之融合蛋白。
在又一態樣中,提供一種治療個體之SARS-CoV-2感染之方法,該方法包含向該個體投與治療有效量的經遺傳工程改造之T細胞,該等T細胞表現藉由本文所述之方法鑑別的TCR。
在又一態樣中,提供一種治療個體之SARS-CoV-2感染之方法,該方法包含向該個體投與治療有效量的經遺傳工程改造之T細胞,該等T細胞表現與至少一種本文所述之免疫原性多肽之肽抗原決定基結合的TCR。
在另一態樣中,提供一種治療個體之SARS-CoV-2感染之方法,該方法包含向該個體投與治療有效量的經遺傳工程改造之T細胞,該等T細胞表現與在MHC分子之背景中包含至少一種本文所述之免疫原性多肽之肽抗原決定基的穩定MHC-肽複合物結合之TCR。
進一步提供多個實施例,其可應用於本發明之任何態樣及/或與本文所述之任何其他實施例組合。舉例而言,在一實施例中,該MHC分子為MHC多聚體,視情況其中該MHC多聚體為四聚體。在另一實施例中,該MHC分子為MHC I類分子。在另一實施例中,該MHC分子包含MHC α鏈,該鏈係選自由HLA-A*02、HLA-A*03、HLA-A*01、HLA-A*11、HLA-A*24及HLA-B*07組成之群的HLA血清型,視情況其中HLA等位基因係選自由HLA-A*0201、HLA-A*0202、HLA-A*0203、HLA-A*0204、HLA-A*0205、HLA-A*0206、HLA-A*0207、HLA-A*0210、HLA-A*0211、HLA-A*0212、HLA-A*0213、HLA-A*0214、HLA-A*0216、HLA-A*0217、HLA-A*0219、HLA-A*0220、HLA-A*0222、HLA-A*0224、HLA-A*0230、HLA-A*0242、HLA-A*0253、HLA-A*0260、HLA-A*0274等位基因、HLA-A*0301、HLA-A*0302、HLA-A*0305、HLA-A*0307、HLA-A*0101、HLA-A*0102、HLA-A*0103、HLA-A*0116等位基因、HLA-A*1101、HLA-A*1102、HLA-A*1103、HLA-A*1104、HLA-A*1105、HLA-A*1119等位基因、HLA-A*2402、HLA-A*2403、HLA-A*2405、HLA-A*2407、HLA-A*2408、HLA-A*2410、HLA-A*2414、HLA-A*2417、HLA-A*2420、HLA-A*2422、HLA-A*2425、HLA-A*2426、HLA-A*2458等位基因、HLA-B*0702、HLA-B*0704、HLA-B*0705、HLA-B*0709、HLA-B*0710、HLA-B*0715及HLA-B*0721等位基因組成之群。在又一實施例中,該肽抗原決定基及該MHC分子係共價連接及/或其中該MHC分子之α及β鏈係共價連接。在另一實施例中,該穩定MHC-肽複合物包含可偵測標記,視情況其中該可偵測標記為螢光團。在又一實施例中,T細胞係自a)個體、b)未感染SARS-CoV-2之供體或c)自COVID-19中恢復之供體分離。
在又一態樣中,提供一種預防及/或治療個體之SARS-CoV-2感染之方法,該方法包含向該個體輸注抗原特异性T細胞,其中該等抗原特异性T細胞係藉由以下產生:a)用本文所述之免疫原性多肽、編碼本文所述之免疫原性多肽的核酸、包含至少一種本文所述之免疫原性多肽之肽抗原決定基的穩定MHC-肽複合物或者在MHC分子之背景中編碼及/或在細胞表面上呈遞至少一種本文所述之免疫原性多肽之肽的細胞,諸如用表現本文所述之構築體的免疫原性多肽刺激個體之PBMC或T細胞;及b)活體外擴增抗原特异性T細胞,視情況在刺激PBMC或T細胞之前自該個體分離該等PBMC或T細胞。
進一步提供多個實施例,其可應用於本發明之任何態樣及/或與本文所述之任何其他實施例組合。舉例而言,在一實施例中,T細胞為原生T細胞、中央記憶T細胞或效應子記憶T細胞。在另一實施例中,T細胞為CD8+記憶T細胞。在又一實施例中,使該等劑在適合於在肽抗原決定基、免疫原性多肽、穩定MHC-肽複合物、T細胞受體及/或T細胞之間形成至少一種免疫複合物的條件下及時間內接觸置放。在又一實施例中,肽抗原決定基、免疫原性多肽、穩定MHC-肽複合物及/或T細胞受體由細胞表現,且該等細胞在一或多個步驟期間經擴增及/或分離。在另一實施例中,該個體為哺乳動物,視情況其中該哺乳動物為人類、靈長類動物或嚙齒動物。
相關申請案之交叉引用
本申請案主張2020年11月12日申請之美國臨時申請案第63/113,024號的權益;該申請案之完整內容以引用之方式整體併入本文中。
本發明至少部分基於發現SARS-CoV-2病毒特异性免疫原性多肽構築體,該等構築體例如可用作疫苗。進行系統性綜合調查以對由恢復期COVID-19患者識別之精確T細胞標靶定位。引人注目地,該研究揭露在患者中反復地識別出之高度免疫顯性肽抗原之有限集合,包括若干看來得到普遍認可之抗原。
為了提供關於此類具有免疫原性肽之疫苗之設計的資訊,對感染SARS-CoV-2之後CD8 T細胞識別之標靶進行全面的全基因組分析。對六種最常見的HLA等位基因(HLA-A:02、HLA-A01、HLA-A03、HLA-A11、HLA-A24及HLA-B07 – 其中全球>85%的人表現此等等位基因中之至少一者之集合)上識別之標靶之景觀定位。鑑別且驗證大多數具有適當HLA等位基因之患者反復識別的每一個等位基因之免疫顯性抗原決定基之核心集合。已揭露此等抗原決定基強力呈現於MHC分子上,由患者之原生CD8 T細胞譜系有效地識別,且有可能具保護性(基於其對總體CD8 T細胞反應之巨大貢獻,其有可能具保護性)。除了鑑別特定HLA等位基因上呈現之精確抗原決定基,亦揭露T細胞對SARS-CoV-2基因組之反應性的模式。發現在HLA等位基因中反復識別之基因組區域(包括N、M及ORF3a蛋白,以及ORF1ab之部分),且此等區域代表有吸引力的疫苗抗原,該等抗原亦有可能產生受限於額外等位基因上之CD8 T細胞反應。亦鑑別了CD8 T細胞對SARS-CoV-2基因組中與地方性乙型冠狀病毒具有交叉反應性之特定區段的反應。此等區域受到特別關注,因為靶向此等區域之疫苗將有可能加強CD8 T細胞對地方性乙型冠狀病毒之任何現有反應性且具有產生更強反應之潛力。
此數據已使得能夠設計疫苗候選物,該等候選物含有CD8 T細胞抗原之廣泛集合以更精確地再現對SARS-CoV-2之天然免疫性。特定言之,所設計之疫苗包括多抗原決定基疫苗及基於片段之疫苗。
在多抗原決定基疫苗中,多個免疫顯性CD8 T細胞抗原決定基經串接以作為單一多蛋白表現。此方法具有提供最大密度之經驗證T細胞抗原決定基之優勢。設計了介於6-29個總抗原決定基範圍內之變異體。多抗原決定基疫苗之關鍵設計特徵在於能夠使免疫顯性抗原決定基之有效加工及呈遞增至最大,同時使任何非天然接合抗原決定基減至最少。亦設計了含有最佳蛋白酶體裂解序列之多抗原決定基,其係源自天然蛋白序列(直接地圍繞全長蛋白中之每一個抗原決定基之胺基酸,基於吾人的篩選數據,其經驗證導致有效呈遞)或使用合成蛋白酶體裂解序列作為抗原決定基間連接子。亦使用生物資訊方法來選擇最佳抗原決定基次序以使經預測之高親和力接合抗原決定基之產生減至最少(自數百萬個測試變異體中選擇最佳次序)。
在基於片段之疫苗中,來自SARS-CoV-2之較長基因組區段之集合經串接,已鑑別該等區段在一系列HLA等位基因中具免疫顯性。此方法具有包括SARS-CoV-2蛋白序列之較長延伸段的優勢,這增加了編碼由吾人未研究之其他HLA等位基因呈遞之額外CD8 T細胞抗原決定基的可能性。對於此等疫苗,2與6個之間的區段經串接。
就更廣泛背景及遞送而言,兩類疫苗均為高度模塊化的。其可用作集中於加強CD8 T細胞反應之獨立疫苗,或可與經設計以產生中和抗體反應之抗原一起共引入。在後一種情況下,其可與核糖體再啟動位點(諸如P2A序列)之後的其他抗原一起表現。該等設計中之數種包括最佳化S蛋白(含有兩個脯胺酸突變,該等突變經設計以增強蛋白穩定性)、隨後P2A序列及多抗原決定基或多片段蛋白。其可使用mRNA、DNA、病毒載體或作為經純化蛋白來遞送。
作為與該等構築體之特定抗原決定基相關的一個實例,本文中確定CD8+ T細胞反應由SARS-CoV-2中由具有相同HLA類型之患者共享之少數(3-8個)高度抗原性(免疫顯性)抗原決定基佔主導。此等抗原決定基主要為SARS-CoV-2所獨有(亦即,不存在於「普通感冒」冠狀病毒中),在病毒分離物中係不變的,且頻繁地由每一名患者內之多個純系型靶向。在所研究之六個HLA類型中,鑑別出至少二十九個共享抗原決定基。值得注意的是,僅約10% (29個中的3個)抗原決定基出現於S蛋白中(亦即,約90% SARS-CoV-2免疫顯性抗原決定基位於S蛋白外部),突出顯示了對經設計以引出更廣泛CD8+ T細胞反應之新疫苗類別的需要。實際上,在這29個抗原決定基中未出現UK、南非、巴西或δ變異體之突變且當分析感染SARS-CoV-2之患者時,一些HLA類型未產生任何刺突蛋白抗原決定基(例如,針對五名A*01:01患者及五名A*11:01患者篩選數據未鑑別出刺突蛋白中之任何抗原決定基)。值得注意的是,已確定94%之經篩選患者具有識別既定HLA之三個最主要抗原決定基中之至少一者的T細胞且53%之患者具有識別既定HLA之最主要抗原決定基中之全部三者的T細胞。對18名額外A*02:01患者進行之額外確認分析重申了對前六個已鑑別A*02:01抗原決定基具特異性之記憶CD8+ T細胞的存在,且單細胞測序揭露患者通常具有>5種不同的靶向每一個抗原決定基之T細胞純系,但同一T細胞受體Va及Vb區主要用於識別此等抗原決定基,甚至跨患者。靶向此等免疫顯性抗原決定基中之大多數(29個中之27個)的T細胞不會與引起普通感冒之地方性冠狀病毒交叉反應,且該等抗原決定基不會出現在具有高突變變异之區域中。此等結果為更好地瞭解COVID-19中之CD8+ T細胞反應提供有用工具,且對疫苗設計及開發具有重要意義。
因此,本發明部分地係關於經鑑別免疫原性多肽構築體、包含單獨或與MHC分子一起的此等免疫原性多肽構築體之組合物、穩定MHC-肽複合物、診斷、預後及監測T細胞對SARS-CoV-2之反應的方法,以及藉由投與包含及/或編碼經鑑別免疫原性多肽構築體之免疫原性組合物來預防及/或治療SARS-CoV-2感染的方法。
I. 定義
為方便起見,此處收集了本說明書、實例及隨附申請專利範圍中所用之某些術語。
冠詞「一(a/an)」在本文中用於指該冠詞之一個或超過一個(亦即,至少一個)語法對象。舉例而言,「一要素」意謂一種要素或超過一種要素。
如本文所用,術語「投與」意謂向個體提供醫藥劑或組合物,且包括但不限於由醫學專業人員投與及自我投與。
術語「免疫反應」包括T細胞介導及/或B細胞介導之免疫反應。例示性免疫反應包括T細胞反應,例如細胞介素産生及細胞毒性。此外,術語免疫反應包括受T細胞活化間接影響之免疫反應,例如抗體産生(體液反應)及細胞介素反應性細胞(例如巨噬細胞)之活化。
習知T細胞(亦稱為Tconv或Teff)具有效應子功能(例如,細胞介素分泌、細胞毒性活性、抗自我識別及其類似功能)以藉助於其對一或多種T細胞受體之表現來增加免疫反應。Tcon或Teff一般係定義為任何非Treg之T細胞群體且包括例如原生T細胞、經活化T細胞、記憶T細胞、靜息Tcon或已分化為例如Th1或Th2譜系之Tcon。在一些實施例中,Teff為非Treg T細胞之子集。在一些實施例中,Teff為CD4+ Teff或CD8+ Teff,諸如CD4+輔助T淋巴球(例如,Th0、Th1、Tfh或Th17)及CD8+細胞毒性T淋巴球。如本文進一步所描述,細胞毒性T細胞為CD8+ T淋巴球。「原生Tcon」為CD4
+T細胞,該等T細胞已在骨髓中分化,且在胸腺中成功地經歷了正向及負向中央選擇過程,但尚未藉由暴露於抗原而活化。原生Tcon之特徵通常在於L-選擇素(CD62L)之表面表現、活化標記物(諸如CD25、CD44或CD69)之缺乏以及記憶標記物(諸如CD45RO)之缺乏。因此,咸信原生Tcon為靜止且非分裂的,需要用於體内恆定存活之介白素7 (IL-7)及介白素15 (IL-15) (至少參見WO 2010/101870)。在抑制免疫反應之背景下,此類細胞之存在及活性為非所需的。與Treg不同,Tcon并非無反應性的且可回應於基於抗原之T細胞受體活化而增生(Lechler等人 (2001)
Philos. Trans. R. Soc. Lond. Biol. Sci.356:625-637)。在腫瘤中,耗竭細胞可呈現無反應性之標記。
術語「疫苗」係指引出對所關注抗原之免疫反應的醫藥組合物。疫苗亦可對個體賦予保護性免疫。
「載體」係指能够轉運與其連接之另一核酸之核酸分子。一種類型之較佳載體為游離基因體,亦即能够進行染色體外複製之核酸。較佳載體係能够自主複製及/或表現與其連接之核酸的彼等載體。能够引導可操作性連接之基因之表現的載體在本文中稱為「表現載體」。一般而言,在重組DNA技術中使用之表現載體通常呈「質體」形式,質體一般係指環狀雙股DNA環,其載體形式不與染色體結合。在本說明書中,「質體」及「載體」可互換使用,因為質體為最常用之載體形式。然而,如熟習此項技術者將瞭解,本發明意欲包括此類其他形式之表現載體,其提供等效功能且隨後在此項技術中為人所知。
術語「免疫治療劑」可包括可刺激宿主免疫系統以在個體中産生對病毒感染之免疫反應的任何分子、肽、抗體或其他劑。各種免疫治療劑可用於本文所述之組合物及方法。
「經分離蛋白」係指在自細胞中分離或藉由重組DNA技術産生時實質上不含其他蛋白質、細胞材料、分離介質及培養基的蛋白質,或在化學合成時實質上不含化學前驅物或其他化學物質的蛋白質。「經分離」或「經純化」蛋白或其生物活性部分實質上不含來自產生抗體、多肽、肽或融合蛋白之細胞或組織來源的細胞材料或其他污染蛋白,或在化學合成時實質上不含化學前驅物或其他化學物質。用語「實質上不含細胞材料」包括生物標記物多肽或其片段之製劑,其中蛋白質係自分離出或重組産生該蛋白質之細胞的細胞組分中分離。在一實施例中,用語「實質上不含細胞材料」包括生物標記物蛋白或其片段之製劑,其具有小於約30% (以乾重計)之非生物標記物蛋白(本文中亦稱為「污染蛋白」),更佳地小於約20%之非生物標記物蛋白,更佳地小於約10%之非生物標記物蛋白,且最佳地小於約5%之非生物標記物蛋白。當重組産生抗體、多肽、肽或融合蛋白或其片段(例如其生物活性片段)時,其亦較佳地實質上不含培養基,亦即,培養基代表小於蛋白質製劑之體積之約20%,更佳地小於約10%且最佳地小於約5%。
如本文所用,術語「同型」係指由重鏈恒定區基因編碼之抗體類別(例如,IgM、IgG1、IgG2C及其類似類別)。
如本文所用,術語「K
D」意欲指特定抗體-抗原相互作用之解離平衡常數。可藉由標準抗體-抗原分析,例如競爭分析、飽和分析或諸如ELISA或RIA之標準免疫分析來量測或測定本發明所涵蓋之抗體的結合親和力。
「套組」係包含至少一種試劑,例如探針或小分子之任何製品(例如,包裝或容器),該至少一種試劑用於特异性地偵測及/或影響本發明所涵蓋之標記物之表現。該套組可作為用於執行本發明所涵蓋之方法之單元來推銷、分售或銷售。該套組可包含表現可用於本發明所涵蓋之方法之組合物所必需之一或多種試劑。在某些實施例中,該套組可進一步包含參考標準,例如編碼不影響或調控控制細胞生長、分裂、遷移、存活或凋亡之信號傳導路徑的蛋白質之核酸。熟習此項技術者可設想許多此類對照蛋白,包括但不限於常見分子標籤(例如,綠色螢光蛋白及β-半乳糖苷酶)、未藉由GeneOntology參考歸類於任何涵蓋細胞生長、分裂、遷移、存活或凋亡之路徑中之蛋白質或者普遍存在之持家蛋白。套組中之試劑可在個別容器中提供,或在單一容器中以兩種或兩種以上試劑之混合物形式提供。此外,可包括描述套組內之組合物之用途的指導性材料。
術語「預防(prevent/preventing/prevention)」、「預防性治療」及其類似術語係指降低個體發展疾病、病症或疾患之概率,該個體未患但有風險或容易發展疾病、病症或疾患。
術語「預後」包括對病毒感染之可能過程及結果或自疾病恢復之可能性的預測。在一些實施例中,使用統計算法提供個體之病毒感染之預後。舉例而言,預後可為手術、病毒感染之臨床亞型之發展、一或多種臨床因素之發展或自疾病恢復。
用於偵測或測定至少一種生物標記物之存在或水準之術語「樣品」通常為腦組織、腦脊液、全血、血漿、血清、唾液、尿液、糞樣(stool) (例如糞便(feces))、淚液及任何其他體液(例如,如上文在「體液」之定義下所描述),或組織樣品(例如,活體組織切片),諸如小腸、結腸樣品或手術切除組織。在某些情况下,本發明所涵蓋之方法進一步包含在偵測或測定樣品中之至少一種標記物之存在或水準之前自個體獲得樣品。
術語「小分子」為此項技術之術語且包括分子量小於約1000或分子量小於約500之分子。在一實施例中,小分子不僅僅包含肽鍵。在另一實施例中,小分子并非寡聚物。可針對活性進行篩選之例示性小分子化合物包括但不限於肽、肽模擬物、核酸、碳水化合物、小有機分子(例如聚乙醯類) (Cane等人 (1998)
Science282:63)及天然産物提取物文庫。在另一實施例中,該等化合物為小有機非肽化合物。在另一實施例中,小分子并非生物合成的。
術語「特异性結合」係指抗體與預定抗原結合。通常,當使用所關注抗原作為分析物且抗體作為配位體,在BIACORE®分析儀器中藉由表面電漿子共振(SPR)技術測定時,抗體以大約小於10
-7M,諸如大約小於10
-8M、10
-9M或10
-10M或甚至更低之親和力(K
D)結合,且與預定抗原結合之親和力係其與除預定抗原或密切相關抗原以外之非特异性抗原(例如,BSA、酪蛋白)結合之親和力的至少1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.5、3.0、3.5、4.0、4.5、5.0、6.0、7.0、8.0、9.0或10.0倍或更多倍。片語「識別抗原之抗體」及「對抗原具特异性之抗體」在本文中可與術語「與抗原特异性結合之抗體」互換使用。選擇性結合為相對術語,其係指抗體區分對一種抗原及另一抗原之結合的能力。
術語「個體」係指任何健康動物、哺乳動物或人類,或任何罹患病毒感染(例如SARS-CoV-2感染)之動物、哺乳動物或人類。術語「個體」可與「患者」互換。
如本文所用,胺基酸序列之間的「一致性百分比」與「同源性百分比」同義,其可使用由Karlin及Altschul (Proc. Natl. Acad. Sci. USA 90, 5873-5877, 1993)修改的Karlin及Altschul算法(Proc. Natl. Acad. Sci. USA 87, 2264-2268, 1990)測定。將所提及之算法併入至Altschul等人之NBLAST及XBLAST程式(J. Mol. Biol. 215, 403-410, 1990)中。用NBLAST程式執行BLAST核苷酸搜索,分數=100,字長=12,以獲得與本文所描述之聚核苷酸同源之核苷酸序列。用XBLAST程式執行BLAST蛋白搜索,分數=50,字長=3,以獲得與參考多肽同源之胺基酸序列。為了獲得間隙比對以用於比較目的,使用間隙BLAST,如Altschul等人(Nucleic Acids Res. 25, 3389-3402, 1997)所述。當使用BLAST及間隙BLAST程式時,使用各別程式(例如,XBLAST及NBLAST)之預設參數。
如本文所用,片語「醫藥學上可接受之載劑」意謂參與將本發明化合物自身體之一個器官或部分携帶或轉運至身體之另一個器官或部分的醫藥學上可接受之材料、組合物或媒劑,諸如液體或固體填充劑、稀釋劑、賦形劑或溶劑囊封材料。
「經轉錄聚核苷酸」或「核苷酸轉錄物」係與成熟mRNA之全部或一部分互補或同源的聚核苷酸(例如,mRNA、hnRNA、cDNA或此類RNA或cDNA之類似物),該成熟mRNA藉由生物標記物核酸之轉錄及(若存在) RNA轉錄物之正常轉錄後加工(例如剪接)以及RNA轉錄物之逆轉錄製成。
術語「T細胞」包括CD4
+T細胞及CD8
+T細胞。術語T細胞亦包括T輔助1型T細胞及T輔助2型T細胞兩者。術語「抗原呈遞細胞」包括專職抗原呈遞細胞(例如,B淋巴球、單核細胞、樹突狀細胞、朗格漢斯細胞(Langerhans cell)),以及其他抗原呈遞細胞(例如,角質細胞、內皮細胞、星形細胞、纖維母細胞及寡樹突細胞)。
術語「T細胞受體」或「TCR」應理解為涵蓋完整TCR以及其抗原結合部分或抗原結合片段。在一些實施例中,TCR為完整或全長TCR,包括呈αβ形式或γδ形式之TCR。在一些實施例中,TCR係小於全長TCR但與MHC分子中結合之特定肽結合,諸如與MHC-肽複合物結合的抗原結合部分。在一些情况下,TCR之抗原結合部分或片段可僅含有全長或完整TCR之部分結構域,但仍能够結合完整TCR所結合之肽抗原決定基,諸如MHC-肽複合物。在一些情况下,抗原結合部分含有TCR之可變域,諸如TCR之可變α鏈及可變β鏈,該等可變域足以形成與特定MHC-肽複合物結合之結合位點。一般而言,TCR之可變鏈含有參與識別肽、MHC及/或MHC-肽複合物之互補決定區(CDR)。
術語「治療效應」係指由藥理學活性物質在動物,特定言之哺乳動物,且更特定言之人類中引起之局部或全身效應。因此,該術語意謂意欲用於診斷、治愈、緩解、治療或預防動物或人類之疾病或用於增强其所需身體或精神發育及狀況之任何物質。片語「治療有效量」意謂以適於任何治療之合理效益/風險比産生一些所需局部或全身效應的此類物質之量。在某些實施例中,化合物之治療有效量將取决於其治療指數、溶解度及其類似因素。舉例而言,藉由本發明所涵蓋之方法發現的某些化合物可以足以産生適於此類治療之合理效益/風險比的量進行投與。
如本文所用,術語「治療有效量」及「有效量」意謂化合物、材料或包含本發明所涵蓋之化合物之組合物的量,該量以適於任何醫學治療之合理效益/風險比在動物之至少一個細胞亞群中有效産生一些所需治療效應。可在細胞培養物或實驗動物中藉由例如用於測定LD
50及ED
50之標準醫藥學程序來測定本發明化合物之毒性及治療功效。展現大治療指數之組合物為較佳的。在一些實施例中,可量測LD
50(致死劑量),且相對於不投與劑,其在投與該劑時可例如降低至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%、700%、800%、900%、1000%或更多。同樣,可量測ED
50(亦即,達成症狀之半最大抑制的濃度),且相對於不投與劑,其在投與該劑時可例如增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%、700%、800%、900%、1000%或更多。同樣,亦可量測IC
50,且相對於不投與劑,其在投與該劑時可例如增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%、700%、800%、900%、1000%或更多。在一些實施例中,在一種分析中,T細胞免疫反應可增加至少約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或甚至100%。在另一實施例中,可實現病毒負載之至少約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或甚至100%降低。
「治療」個體之疾病或「治療」患有疾病之個體係指使個體經受醫藥治療,例如藥物投與,使得該疾病之至少一種症狀有所减輕或得以預防以免惡化。
術語「體液」係指自身體排泄或分泌之流體以及通常不分泌之流體(例如,羊水、水樣液、膽汁、血液及血漿、腦脊液、耵聹及耳垢、考珀液(cowper’s fluid)或射精前液、乳糜、食糜、糞便、女性射液、間隙液、細胞內液、淋巴液、月經、母乳、黏液、胸水、膿液、唾液、皮脂、精液、血清、汗液、滑液、淚液、尿液、陰道潤滑液、玻璃體液、嘔吐物)。
術語「編碼區」係指核苷酸序列中包含轉譯成胺基酸殘基之密碼子之區域,而術語「非編碼區」係指核苷酸序列中未轉譯成胺基酸之區域(例如,5'及3'非轉譯區)。
術語「互補」係指兩條核酸股之區域之間或同一核酸股之兩個區域之間的序列互補性之廣泛概念。已知第一核酸區之腺嘌呤殘基能够與第二核酸區之殘基形成特定氫鍵(「鹼基配對」),若第二核酸區之殘基為胸腺嘧啶或尿嘧啶,則該第二核酸區與第一區反平行。同樣,已知第一核酸股之胞嘧啶殘基能够與第二核酸股之殘基鹼基配對,若第二核酸股之殘基為鳥嘌呤,則該第二核酸股與第一股反平行。若當核酸之第一區與相同或不同核酸之第二區以反平行方式排列時,第一區之至少一個核苷酸殘基能够與第二區之殘基鹼基配對,則該兩個區域互補。較佳地,第一區包含第一部分且第二區包含第二部分,由此,當第一部分及第二部分以反平行方式排列時,第一部分之核苷酸殘基之至少約50%且較佳地至少約75%、至少約90%或至少約95%能够與第二部分之核苷酸殘基鹼基配對。更佳地,第一部分之所有核苷酸殘基均能够與第二部分中之核苷酸殘基鹼基配對。
如本文所用,關於經活化免疫細胞之術語「共刺激」包括共刺激分子提供誘導增生或效應子功能之第二、非活化受體介導之信號(「共刺激信號」)的能力。舉例而言,共刺激信號可導致細胞介素分泌,例如,在已接收T細胞受體介導之信號之T細胞中。已例如經由活化受體接收細胞受體介導之信號之免疫細胞在本文中稱為「經活化免疫細胞」。
術語「確定適合個體之治療方案」意謂確定用於個體之治療方案(亦即,用於預防及/或治療個體之病毒感染之單一療法或不同療法之組合),該治療方案係基於或基本上基於或至少部分基於根據本發明之分析結果開始、進行修改及/或結束。一個實例係在手術之後開始輔助療法,其目的為降低復發風險,另一實例將為修改特定化學療法之劑量。除了根據本發明之分析結果以外,該確定亦可基於待治療個體之個人特徵。在大多數情况下,將由主治醫師或醫生執行對適合個體之治療方案之實際確定。
如本文所用,術語「佐劑」係指與單獨投與抗原相比,當在投與抗原之前、同時或之後投與時促進、延長及/或增强對抗原之免疫反應之品質及/或强度的物質。佐劑可增加由疫苗接種誘導之免疫反應之量級及持續時間。
如本文所用,「同源」係指同一核酸股之兩個區域之間或兩個不同核酸股之區域之間的核苷酸序列相似性。當兩個區域中之核苷酸殘基位置由相同核苷酸殘基佔據時,則該等區域在彼位置處係同源的。若每一個區域之至少一個核苷酸殘基位置由相同殘基佔據,則第一區與第二區同源。兩個區域之間的同源性以兩個區域之核苷酸殘基位置由相同核苷酸殘基佔據之比例表述。舉例而言,具有核苷酸序列5'-ATTGCC-3’之區域及具有核苷酸序列5'-TATGGC-3’之區域共享50%同源性。較佳地,第一區包含第一部分且第二區包含第二部分,由此,該等部分中之每一者的核苷酸殘基位置之至少約50%且較佳地至少約75%、至少約90%或至少約95%由相同核苷酸殘基佔據。更佳地,該等部分中之每一者的所有核苷酸殘基位置由相同核苷酸殘基佔據。
術語「免疫細胞」係指在免疫反應中起作用之細胞。免疫細胞具有造血起源,且包括淋巴球,諸如B細胞及T細胞;天然殺手細胞;骨髓細胞,諸如單核細胞、巨噬細胞、嗜酸性球、肥大細胞、嗜鹼性球及顆粒球。
術語「SARS-CoV-2」或「嚴重急性呼吸道症候群冠狀病毒2」係指2019年冠狀病毒疾病(COVID-19)之病原體。SARS-CoV-2在2020年3月11日被世界衛生組織(WHO)鑑別為流行病。在支持病毒進入宿主細胞中之過程中,SARS-CoV2與在下呼吸道中高度表現的ACE2接收者,諸如肺之II型肺泡細胞(AT2)、食管上端及分層上皮細胞以及其他細胞(諸如來自迴腸及結腸之吸收性腸上皮細胞、膽管細胞、心肌細胞、腎近端小管細胞及膀胱上皮細胞)結合。因此,感染此病毒之患者不僅經歷導致急性呼吸窘迫症候群(ARDS)之呼吸道問題(諸如肺炎),而且經歷心臟、腎臟及消化道病症。
尚無根除患者之SARS-CoV2病毒之特定治療。可使用另一β-冠狀病毒方法之治療方法,諸如SARS-CoV或MERS-CoV治療。此等方法中之一些包括洛匹那韋(lopinavir)/利托那韋(ritonavir)、氯喹及羥氯喹。亦可使用每晚兩次干擾素α之氣霧劑吸入。在一些情况下,干擾素-α與利巴韋林(ribavirin)之組合常用於冠狀病毒(諸如MERS-CoV)。亦發現干擾素與類固醇藥物之組合可加速肺修復且增加氧存活水準。然而,使用干擾素α之療法已顯示不一致之結果。
SARS-CoV-2病毒係一種有包膜的非分段正義RNA病毒,該病毒包括於廣泛分佈於人類及其他哺乳動物中之沙貝病毒(sarbecovirus)、正冠狀病毒(ortho corona virinae)亞科中。其直徑為約65-125 nm,含有單股RNA,且在外表面上具有冠狀刺突。SARS-CoV2係在先前鑑別之SARS-CoV及MERS-CoV之後的一種新穎β-冠狀病毒,其導致肺功能衰竭及潜在致命呼吸道感染,且主要在中國廣東及沙特阿拉伯暴發。
SARS-CoV-2之基因組尺寸自29.8 kb至29.9 kb變化,且其基因組結構遵循已知CoV之特定基因特徵。基因組中超過三分之二的5'包含編碼orf1a/b多蛋白之orf1a/b,而三分之一的3’由編碼四種主要結構蛋白之基因組成,該等結構蛋白包括刺突(S)醣蛋白、小包膜(E)醣蛋白、膜(M)醣蛋白及核衣殼(N)蛋白。另外,SARS-CoV-2含有6種輔助蛋白,其由ORF3a、ORF6、ORF7a、ORF7b及ORF8基因編碼(Khailany等人 (2020)
Gene Rep19:100682)。
ORF1ab基因係該冠狀病毒之最大基因區段,且其構成兩種ORF,亦即ORF1a及ORF1b,以藉由促成核糖體移框事件産生兩種較大的重疊多蛋白pp1a (orf1a多蛋白)及pp1ab (orf1ab多蛋白)。該等多蛋白由蛋白酶,即木瓜酶樣蛋白酶(PLpro)及絲胺酸型Mpro (胰凝乳蛋白酶樣蛋白酶(3CLpro))蛋白酶補充,該等蛋白酶在nsp3及nsp 5中編碼。隨後,pp1a及pp1ab分別裂解成非結構蛋白(nsps) 1-11及1-16。nsps在病毒及宿主細胞中之許多過程中發揮著重要作用。orf1a多蛋白及orf1ab多蛋白之代表性序列呈現於下文表1K中。
ORF3a係由SARS-CoV-2基因組編碼的輔助蛋白之一。最近研究已顯示,SARS-CoV-2 ORF3a蛋白之功能域與毒力、傳染性、離子通道形成及病毒釋放有關(Issa等人 (2020) mSystems 5:e00266-20)。ORF3a之代表性序列呈現於下文表1K中。
ORF7a係另一SARS-CoV-2基因組編碼之輔助蛋白,該輔助蛋白由主要位於高爾基體(Golgi apparatus)中,但可在細胞表面上發現的I型跨膜蛋白構成。SARS-CoV ORF7a之病毒基因組與ORF7b重疊,其中它們共享轉錄調控序列(TRS)。在一些實施例中,ORF7a具有15-胺基酸(aa) N端信號肽、81-aa魯米那域、21-aa跨膜域及5-aa細胞質尾(Taylor等人 (2015)
J. Virol.89:11820-11833)。ORF7a之代表性序列呈現於下文表1K中。
刺突或S醣蛋白係在病毒之外部部分中發現的分子量為約150 kDa之跨膜蛋白。S蛋白具有位於病毒S1亞單元中之RBD,該RBD藉由與宿主細胞上之其受體ACE2結合來促使病毒進入宿主細胞中。S蛋白形成在病毒表面突出之同源三聚體,且藉由吸引在下呼吸道細胞中表現之血管緊張素轉換酶2 (ACE2)來促進包膜病毒與宿主細胞之結合。此醣蛋白由宿主細胞弗林蛋白酶樣蛋白酶裂解成2個亞單元,亦即S1及S2。S1部分負責利用受體結合域構成來決定宿主病毒範圍及細胞趨向性,而S2用於在傳輸宿主細胞時介導病毒融合。S醣蛋白之代表性序列呈現於下文表1K中。
稱為N蛋白之核衣殼係位於在結構上與病毒之核酸材料結合的內質網-高爾基體區中的CoV之結構組分。因為該蛋白質與RNA結合,故該蛋白質參與與病毒基因組、病毒複製週期及宿主細胞對病毒感染之細胞反應相關的過程。N蛋白亦在很大程度上磷酸化,且表明其導致結構變化,從而增强對病毒RNA之親和力。N醣蛋白之代表性序列呈現於下文表1K中。
此病毒之另一重要部分為膜或M蛋白,其為結構上最大程度結構化之蛋白質,且在決定病毒包膜之形狀方面起作用。此蛋白質可與所有其他結構蛋白結合。與M蛋白結合有助於使核衣殼或N蛋白穩定化,且藉由使內部病毒粒子內之N蛋白-RNA複合物穩定化來促進病毒組裝之完成。M蛋白之代表性序列呈現於下文表1K中。
最後一個組分為包膜或E蛋白,其為SARS-CoV-2結構中之最小蛋白,在此病毒之産生及成熟中起作用。
SARS-CoV-2之基因組資訊為公開可獲得的且可例如自NCBI嚴重急性呼吸系統症候群冠狀病毒2資料庫(可在全球資訊網ncbi.nlm.nih.gov/sars-cov-2/獲得)及NGDC基因組數據中心(可在bigd.big.ac.cn/gwh/獲得)以及已定序分離株之流行病學資料獲得。特定蛋白質之胺基酸序列與可編碼該蛋白質之核苷酸序列之間存在已知且確定的對應關係,如由遺傳密碼所限定(如下所示)。同樣,特定核酸之核苷酸序列與由彼核酸編碼之胺基酸序列之間存在已知且確定的對應關係,如由遺傳密碼所限定。
遺傳密碼
丙胺酸(Ala, A) GCA、GCC、GCG、GCT
精胺酸(Arg, R) AGA、ACG、CGA、CGC、CGG、CGT
天冬醯胺(Asn, N) AAC、AAT
天冬胺酸(Asp, D) GAC、GAT
半胱胺酸(Cys, C) TGC、TGT
麩胺酸(Glu, E) GAA、GAG
麩醯胺(Gln, Q) CAA、CAG
甘胺酸(Gly, G) GGA、GGC、GGG、GGT
組胺酸(His, H) CAC、CAT
異白胺酸(Ile, I) ATA、ATC、ATT
白胺酸(Leu, L) CTA、CTC、CTG、CTT、TTA、TTG
離胺酸(Lys, K) AAA、AAG
甲硫胺酸(Met, M) ATG
苯丙胺酸(Phe, F
)TTC、TTT
脯胺酸(Pro, P) CCA、CCC、CCG、CCT
絲胺酸(Ser, S) AGC、AGT、TCA、TCC、TCG、TCT
酥胺酸(Thr, T) ACA、ACC、ACG、ACT
色胺酸(Trp, W) TGG
酪胺酸(Tyr, Y) TAC、TAT
纈胺酸(Val, V) GTA、GTC、GTG、GTT
終止信號(末端) TAA、TAG、TGA
遺傳密碼之一個重要且眾所周知的特徵為其冗餘性,由此,對於用於製備蛋白質之大多數胺基酸而言,可使用多於一個編碼核苷酸三聯體(如上文所說明)。因此,許多不同核苷酸序列可編碼既定胺基酸序列。此類核苷酸序列被視為在功能上等效,因為其使得在所有生物體中産生相同胺基酸序列(儘管某些生物體可比其他生物體更有效地轉譯一些序列)。此外,有時可在既定核苷酸序列中發現嘌呤或嘧啶之甲基化變異體。此類甲基化不影響三核苷酸密碼子與對應胺基酸之間的編碼關係。
鑑於前述,可使用編碼生物標記物核酸(或其任何部分)之DNA或RNA之核苷酸序列來衍生多肽胺基酸序列,從而使用遺傳密碼將DNA或RNA轉譯成胺基酸序列。同樣,對於多肽胺基酸序列,可自遺傳密碼推斷出可編碼該多肽之對應核苷酸序列(由於其冗餘性,其將產生用於任何既定胺基酸序列之多個核酸序列)。因此,本文中對編碼多肽之核苷酸序列之描述及/或揭示應被視為亦包括對由該核苷酸序列編碼之胺基酸序列之描述及/或揭示。同樣,本文中對多肽胺基酸序列之描述及/或揭示應被視為亦包括對可編碼該胺基酸序列之所有可能核苷酸序列之描述及/或揭示。
II. 肽及構築體
在某些態樣中,本文提供經由投與經鑑別SARS-COV-2免疫顯性肽或編碼經鑑別SARS-COV-2免疫顯性肽之核酸來誘導針對SARS-CoV-2之免疫反應,從而治療及/或預防COIVD-19的方法及組合物。
在一些態樣中,本文提供包含至少兩個肽抗原決定基或至少兩個肽片段之免疫原性多肽,該等肽片段中之每一者包含至少兩個肽抗原決定基。下文描述與此等免疫原性多肽之肽抗原決定基相關的多個實施例(例如,關於免疫顯性肽描述之肽抗原決定基亦可為免疫原性多肽之組成性肽抗原決定基)。
某些例示性免疫原性多肽(例如,構築體)顯示於圖1、圖2、圖5A-圖5C、圖6A-圖6C、圖7、圖8、圖9A及圖9B中。如所見,該等免疫原性多肽可包括多個(例如,4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29個)肽抗原決定基(例如,表1A至1F中之彼等),可包括SARS-CoV-2蛋白中具有至少兩個此類抗原決定基之片段,且可進一步具有額外區段,諸如S蛋白區段及/或核糖體停止/再啟動區段、IRES區段及/或轉譯後裂解區段,視情況其中該轉譯後裂解區段為P2A區段。在一些實施例中,SARS-CoV-2蛋白中包含所關注之抗原決定基之片段可由尺寸定義,諸如在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、1、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、315、320、325、330、335、340、345、350、355、360、365、370、375、380、385、390、395、400、405、410、415、419、420、400、405、410、415、420、425、430、435、440、445、450、455、460、465、470、475、480、485、490、495、500、505、510、515、520、525、530、535、540、545、550、555、560、565、570、575、580、585、590、595、600、605、610、615、620、625、630、635、640、645、650、655、660、665、670、675、680、685、690、695、700、705、710、715、720、725、730、735、740、745、750、755、760、765、770、775、780、785、790、795、800、805、810、815、820、825、830、835、840、845、850、855、860、865、870、875、880、885、890、895、900、905、910、915、920、925、930、935、940、945、950、955、960、965、970、975、980、985、990、995、1000、1005、1010、1015、1020、1025、1030、1035、1040、1045、1050、1055、1060、1065、1070、1075、1080、1085、1090、1095、1100、1105、1110、1115、1120、1125、1130、1135、1140、1145、1150、1155、1160、1165、1170、1175、1180、1185、1190、1195、1200、1205、1210、1215、1220、1235、1240、1245、1250、1255、1260、1265、1270、1271個胺基酸(AA)之間或者其間任何範圍(包括其),諸如8-1271、30-40、15-30、15-40、30-112、8-38、8-96、8-104、8-107、8-112、8-88、8-87、8-85、8-66、8-55、222-275、222-419、275-419、222-1271及其類似範圍。在一些實施例中,最小片段為8 AA抗原決定基。在一些實施例中,非抗原決定基片段之代表性14個片段之疫苗構築體介於30-40 AA範圍內且14個片段中之最小片段= [3+9+3]抗原決定基[3aa + 抗原決定基 + 3aa])。在一些實施例中,蛋白質跨越片段之最大片段為112 AA。在一些實施例中,S蛋白(1271 AA由38個胺基酸之片段覆蓋。在一些實施例中,N蛋白(419 AA)由96 AA、104 AA及/或107 AA之一或多個片段(例如,N_Frag1 = 96 AA,N_Frag2 = 104 AA及/或N_Frag3 = 107 AA)覆蓋。在一些實施例中,Orf3a蛋白(275 AA)由85 AA、87 AA及/或88 AA之一或多個片段(例如,3a_Frag1 = 88 AA,3a_Frag2 = 87 AA,及/或3a_Frag 3 = 85 AA)覆蓋。在一些實施例中,M蛋白(222 AA)由55 AA及/或66 AA之一或多個片段(例如,M_Frag1 = 66及/或M_Frag2 = 55)覆蓋。
在某些實施例中,SARS-COV-2免疫顯性肽包含選自表1A、1B、1C、1D、1E及/或1F之肽抗原決定基(例如,由該肽抗原決定基組成)。本文所述之肽抗原決定基可與MHC分子,諸如具有特定α鏈等位基因之特定HLA分子組合。舉例而言,表1A之肽經鑑別與α鏈具有HLA-A*02血清型之MHC相關聯,諸如由HLA-A*0201、HLA-A*0202、HLA-A*0203、HLA-A*0204、HLA-A*0205、HLA-A*0206、HLA-A*0207、HLA-A*0210、HLA-A*0211、HLA-A*0212、HLA-A*0213、HLA-A*0214、HLA-A*0216、HLA-A*0217、HLA-A*0219、HLA-A*0220、HLA-A*0222、HLA-A*0224、HLA-A*0230、HLA-A*0242、HLA-A*0253、HLA-A*0260及/或HLA-A*0274等位基因編碼之MHC;表1C之肽經鑑別與α鏈具有HLA-A*03血清型之MHC相關聯,諸如由HLA-A*0301、HLA-A*0302、HLA-A*0305及/或HLA-A*0307編碼之MHC;表1B之肽經鑑別與α鏈具有HLA-A*01血清型之MHC相關聯,諸如由HLA-A*0101、HLA-A*0102、HLA-A*0103及/或HLA-A*0116等位基因編碼之MHC;表1D之肽經鑑別與α鏈具有HLA-A*11血清型之MHC相關聯,諸如由HLA-A*1101、HLA-A*1102、HLA-A*1103、HLA-A*1104、HLA-A*1105及/或HLA-A*1119等位基因編碼之MHC;表1E之肽經鑑別與α鏈具有HLA-A*24血清型之MHC相關聯,諸如由HLA-A*2402、HLA-A*2403、HLA-A*2405、HLA-A*2407、HLA-A*2408、HLA-A*2410、HLA-A*2414、HLA-A*2417、HLA-A*2420、HLA-A*2422、HLA-A*2425、HLA-A*2426及/或HLA-A*2458等位基因編碼之MHC;且表1F之肽經鑑別與α鏈具有HLA-B*07血清型之MHC相關聯,諸如由HLA-B*0702、HLA-B*0704、HLA-B*0705、HLA-B*0709、HLA-B*0710、HLA-B*0715及/或HLA-B*0721等位基因編碼之MHC,如工作實例中進一步所描述。在一些實施例中,SARS-COV-2免疫顯性肽係源自選自表1K之SARS-COV-2蛋白。在一些實施例中,單獨投與或與佐劑組合投與一或多個SARS-COV-2免疫顯性肽。
在某些態樣中,本文提供組合物,其包含一或多種本文所述之SARS-CoV-2免疫原性肽及佐劑。
表 1A (HLA-A02)
表 1B (HLA-A01)
表 1C (HLA-A03)
表 1D (HLA-A11)
表 1E (HLA-A24)
表 1F (HLA-B07)
表 1G >19_抗原決定基_3aa_連接子(288 aa)
>19_抗原決定基_kaa_連接子(228 aa)
>19_抗原決定基_無_連接子(174 aa)
>27_抗原決定基_3aa_連接子(412 aa)
>27_抗原決定基_kaa_連接子(328 aa)
>27_抗原決定基_無連接子(250 aa)
表 1H >11_frag (500 aa)
表 1I >s-pp-p2a-19_抗原決定基_3aa (1588 aa)
>s-pp-p2a-27_抗原決定基_3aa (1712 aa)*
* 注意:圖2 (續)中指定為#2之27個抗原決定基之片段係第35頁標記為「27_抗原決定基_3aa_連接子」的構築體之更精確描繪。圖2中之構築體描繪係圖2 (續)所示之構築體描繪的更早版本且此等構築體描繪中之每一者均為圖5-9中提供之精確構築體描繪的更早描繪。
>14_片段(546 aa)
>B.1.617.2_S.PP_Epi-M/N/ORF3a (1099 aa)
>B.1.617.2_S.PP_EpiFrag-M/N/ORF3a (1221 aa)
表 1J >s-pp-p2a-11_frag (1800 aa)
表 1K >YP_009724389 (SARS-CoV-2 ORF1a/b蛋白)
MESLVPGFNEKTHVQLSLPVLQVRDVLVRGFGDSVEEVLSEARQHLKDGTCGLVEVEKGVLPQLEQPYVFIKRSDARTAPHGHVMVELVAELEGIQYGRSGETLGVLVPHVGEIPVAYRKVLLRKNGNKGAGGHSYGADLKSFDLGDELGTDPYEDFQENWNTKHSSGVTRELMRELNGGAYTRYVDNNFCGPDGYPLECIKDLLARAGKASCTLSEQLDFIDTKRGVYCCREHEHEIAWYTERSEKSYELQTPFEIKLAKKFDTFNGECPNFVFPLNSIIKTIQPRVEKKKLDGFMGRIRSVYPVASPNECNQMCLSTLMKCDHCGETSWQTGDFVKATCEFCGTENLTKEGATTCGYLPQNAVVKIYCPACHNSEVGPEHSLAEYHNESGLKTILRKGGRTIAFGGCVFSYVGCHNKCAYWVPRASANIGCNHTGVVGEGSEGLNDNLLEILQKEKVNINIVGDFKLNEEIAIILASFSASTSAFVETVKGLDYKAFKQIVESCGNFKVTKGKAKKGAWNIGEQKSILSPLYAFASEAARVVRSIFSRTLETAQNSVRVLQKAAITILDGISQYSLRLIDAMMFTSDLATNNLVVMAYITGGVVQLTSQWLTNIFGTVYEKLKPVLDWLEEKFKEGVEFLRDGWEIVKFISTCACEIVGGQIVTCAKEIKESVQTFFKLVNKFLALCADSIIIGGAKLKALNLGETFVTHSKGLYRKCVKSREETGLLMPLKAPKEIIFLEGETLPTEVLTEEVVLKTGDLQPLEQPTSEAVEAPLVGTPVCINGLMLLEIKDTEKYCALAPNMMVTNNTFTLKGGAPTKVTFGDDTVIEVQGYKSVNITFELDERIDKVLNEKCSAYTVELGTEVNEFACVVADAVIKTLQPVSELLTPLGIDLDEWSMATYYLFDESGEFKLASHMYCSFYPPDEDEEEGDCEEEEFEPSTQYEYGTEDDYQGKPLEFGATSAALQPEEEQEEDWLDDDSQQTVGQQDGSEDNQTTTIQTIVEVQPQLEMELTPVVQTIEVNSFSGYLKLTDNVYIKNADIVEEAKKVKPTVVVNAANVYLKHGGGVAGALNKATNNAMQVESDDYIATNGPLKVGGSCVLSGHNLAKHCLHVVGPNVNKGEDIQLLKSAYENFNQHEVLLAPLLSAGIFGADPIHSLRVCVDTVRTNVYLAVFDKNLYDKLVSSFLEMKSEKQVEQKIAEIPKEEVKPFITESKPSVEQRKQDDKKIKACVEEVTTTLEETKFLTENLLLYIDINGNLHPDSATLVSDIDITFLKKDAPYIVGDVVQEGVLTAVVIPTKKAGGTTEMLAKALRKVPTDNYITTYPGQGLNGYTVEEAKTVLKKCKSAFYILPSIISNEKQEILGTVSWNLREMLAHAEETRKLMPVCVETKAIVSTIQRKYKGIKIQEGVVDYGARFYFYTSKTTVASLINTLNDLNETLVTMPLGYVTHGLNLEEAARYMRSLKVPATVSVSSPDAVTAYNGYLTSSSKTPEEHFIETISLAGSYKDWSYSGQSTQLGIEFLKRGDKSVYYTSNPTTFHLDGEVITFDNLKTLLSLREVRTIKVFTTVDNINLHTQVVDMSMTYGQQFGPTYLDGADVTKIKPHNSHEGKTFYVLPNDDTLRVEAFEYYHTTDPSFLGRYMSALNHTKKWKYPQVNGLTSIKWADNNCYLATALLTLQQIELKFNPPALQDAYYRARAGEAANFCALILAYCNKTVGELGDVRETMSYLFQHANLDSCKRVLNVVCKTCGQQQTTLKGVEAVMYMGTLSYEQFKKGVQIPCTCGKQATKYLVQQESPFVMMSAPPAQYELKHGTFTCASEYTGNYQCGHYKHITSKETLYCIDGALLTKSSEYKGPITDVFYKENSYTTTIKPVTYKLDGVVCTEIDPKLDNYYKKDNSYFTEQPIDLVPNQPYPNASFDNFKFVCDNIKFADDLNQLTGYKKPASRELKVTFFPDLNGDVVAIDYKHYTPSFKKGAKLLHKPIVWHVNNATNKATYKPNTWCIRCLWSTKPVETSNSFDVLKSEDAQGMDNLACEDLKPVSEEVVENPTIQKDVLECNVKTTEVVGDIILKPANNSLKITEEVGHTDLMAAYVDNSSLTIKKPNELSRVLGLKTLATHGLAAVNSVPWDTIANYAKPFLNKVVSTTTNIVTRCLNRVCTNYMPYFFTLLLQLCTFTRSTNSRIKASMPTTIAKNTVKSVGKFCLEASFNYLKSPNFSKLINIIIWFLLLSVCLGSLIYSTAALGVLMSNLGMPSYCTGYREGYLNSTNVTIATYCTGSIPCSVCLSGLDSLDTYPSLETIQITISSFKWDLTAFGLVAEWFLAYILFTRFFYVLGLAAIMQLFFSYFAVHFISNSWLMWLIINLVQMAPISAMVRMYIFFASFYYVWKSYVHVVDGCNSSTCMMCYKRNRATRVECTTIVNGVRRSFYVYANGGKGFCKLHNWNCVNCDTFCAGSTFISDEVARDLSLQFKRPINPTDQSSYIVDSVTVKNGSIHLYFDKAGQKTYERHSLSHFVNLDNLRANNTKGSLPINVIVFDGKSKCEESSAKSASVYYSQLMCQPILLLDQALVSDVGDSAEVAVKMFDAYVNTFSSTFNVPMEKLKTLVATAEAELAKNVSLDNVLSTFISAARQGFVDSDVETKDVVECLKLSHQSDIEVTGDSCNNYMLTYNKVENMTPRDLGACIDCSARHINAQVAKSHNIALIWNVKDFMSLSEQLRKQIRSAAKKNNLPFKLTCATTRQVVNVVTTKIALKGGKIVNNWLKQLIKVTLVFLFVAAIFYLITPVHVMSKHTDFSSEIIGYKAIDGGVTRDIASTDTCFANKHADFDTWFSQRGGSYTNDKACPLIAAVITREVGFVVPGLPGTILRTTNGDFLHFLPRVFSAVGNICYTPSKLIEYTDFATSACVLAAECTIFKDASGKPVPYCYDTNVLEGSVAYESLRPDTRYVLMDGSIIQFPNTYLEGSVRVVTTFDSEYCRHGTCERSEAGVCVSTSGRWVLNNDYYRSLPGVFCGVDAVNLLTNMFTPLIQPIGALDISASIVAGGIVAIVVTCLAYYFMRFRRAFGEYSHVVAFNTLLFLMSFTVLCLTPVYSFLPGVYSVIYLYLTFYLTNDVSFLAHIQWMVMFTPLVPFWITIAYIICISTKHFYWFFSNYLKRRVVFNGVSFSTFEEAALCTFLLNKEMYLKLRSDVLLPLTQYNRYLALYNKYKYFSGAMDTTSYREAACCHLAKALNDFSNSGSDVLYQPPQTSITSAVLQSGFRKMAFPSGKVEGCMVQVTCGTTTLNGLWLDDVVYCPRHVICTSEDMLNPNYEDLLIRKSNHNFLVQAGNVQLRVIGHSMQNCVLKLKVDTANPKTPKYKFVRIQPGQTFSVLACYNGSPSGVYQCAMRPNFTIKGSFLNGSCGSVGFNIDYDCVSFCYMHHMELPTGVHAGTDLEGNFYGPFVDRQTAQAAGTDTTITVNVLAWLYAAVINGDRWFLNRFTTTLNDFNLVAMKYNYEPLTQDHVDILGPLSAQTGIAVLDMCASLKELLQNGMNGRTILGSALLEDEFTPFDVVRQCSGVTFQSAVKRTIKGTHHWLLLTILTSLLVLVQSTQWSLFFFLYENAFLPFAMGIIAMSAFAMMFVKHKHAFLCLFLLPSLATVAYFNMVYMPASWVMRIMTWLDMVDTSLSGFKLKDCVMYASAVVLLILMTARTVYDDGARRVWTLMNVLTLVYKVYYGNALDQAISMWALIISVTSNYSGVVTTVMFLARGIVFMCVEYCPIFFITGNTLQCIMLVYCFLGYFCTCYFGLFCLLNRYFRLTLGVYDYLVSTQEFRYMNSQGLLPPKNSIDAFKLNIKLLGVGGKPCIKVATVQSKMSDVKCTSVVLLSVLQQLRVESSSKLWAQCVQLHNDILLAKDTTEAFEKMVSLLSVLLSMQGAVDINKLCEEMLDNRATLQAIASEFSSLPSYAAFATAQEAYEQAVANGDSEVVLKKLKKSLNVAKSEFDRDAAMQRKLEKMADQAMTQMYKQARSEDKRAKVTSAMQTMLFTMLRKLDNDALNNIINNARDGCVPLNIIPLTTAAKLMVVIPDYNTYKNTCDGTTFTYASALWEIQQVVDADSKIVQLSEISMDNSPNLAWPLIVTALRANSAVKLQNNELSPVALRQMSCAAGTTQTACTDDNALAYYNTTKGGRFVLALLSDLQDLKWARFPKSDGTGTIYTELEPPCRFVTDTPKGPKVKYLYFIKGLNNLNRGMVLGSLAATVRLQAGNATEVPANSTVLSFCAFAVDAAKAYKDYLASGGQPITNCVKMLCTHTGTGQAITVTPEANMDQESFGGASCCLYCRCHIDHPNPKGFCDLKGKYVQIPTTCANDPVGFTLKNTVCTVCGMWKGYGCSCDQLREPMLQSADAQSFLNRVCGVSAARLTPCGTGTSTDVVYRAFDIYNDKVAGFAKFLKTNCCRFQEKDEDDNLIDSYFVVKRHTFSNYQHEETIYNLLKDCPAVAKHDFFKFRIDGDMVPHISRQRLTKYTMADLVYALRHFDEGNCDTLKEILVTYNCCDDDYFNKKDWYDFVENPDILRVYANLGERVRQALLKTVQFCDAMRNAGIVGVLTLDNQDLNGNWYDFGDFIQTTPGSGVPVVDSYYSLLMPILTLTRALTAESHVDTDLTKPYIKWDLLKYDFTEERLKLFDRYFKYWDQTYHPNCVNCLDDRCILHCANFNVLFSTVFPPTSFGPLVRKIFVDGVPFVVSTGYHFRELGVVHNQDVNLHSSRLSFKELLVYAADPAMHAASGNLLLDKRTTCFSVAALTNNVAFQTVKPGNFNKDFYDFAVSKGFFKEGSSVELKHFFFAQDGNAAISDYDYYRYNLPTMCDIRQLLFVVEVVDKYFDCYDGGCINANQVIVNNLDKSAGFPFNKWGKARLYYDSMSYEDQDALFAYTKRNVIPTITQMNLKYAISAKNRARTVAGVSICSTMTNRQFHQKLLKSIAATRGATVVIGTSKFYGGWHNMLKTVYSDVENPHLMGWDYPKCDRAMPNMLRIMASLVLARKHTTCCSLSHRFYRLANECAQVLSEMVMCGGSLYVKPGGTSSGDATTAYANSVFNICQAVTANVNALLSTDGNKIADKYVRNLQHRLYECLYRNRDVDTDFVNEFYAYLRKHFSMMILSDDAVVCFNSTYASQGLVASIKNFKSVLYYQNNVFMSEAKCWTETDLTKGPHEFCSQHTMLVKQGDDYVYLPYPDPSRILGAGCFVDDIVKTDGTLMIERFVSLAIDAYPLTKHPNQEYADVFHLYLQYIRKLHDELTGHMLDMYSVMLTNDNTSRYWEPEFYEAMYTPHTVLQAVGACVLCNSQTSLRCGACIRRPFLCCKCCYDHVISTSHKLVLSVNPYVCNAPGCDVTDVTQLYLGGMSYYCKSHKPPISFPLCANGQVFGLYKNTCVGSDNVTDFNAIATCDWTNAGDYILANTCTERLKLFAAETLKATEETFKLSYGIATVREVLSDRELHLSWEVGKPRPPLNRNYVFTGYRVTKNSKVQIGEYTFEKGDYGDAVVYRGTTTYKLNVGDYFVLTSHTVMPLSAPTLVPQEHYVRITGLYPTLNISDEFSSNVANYQKVGMQKYSTLQGPPGTGKSHFAIGLALYYPSARIVYTACSHAAVDALCEKALKYLPIDKCSRIIPARARVECFDKFKVNSTLEQYVFCTVNALPETTADIVVFDEISMATNYDLSVVNARLRAKHYVYIGDPAQLPAPRTLLTKGTLEPEYFNSVCRLMKTIGPDMFLGTCRRCPAEIVDTVSALVYDNKLKAHKDKSAQCFKMFYKGVITHDVSSAINRPQIGVVREFLTRNPAWRKAVFISPYNSQNAVASKILGLPTQTVDSSQGSEYDYVIFTQTTETAHSCNVNRFNVAITRAKVGILCIMSDRDLYDKLQFTSLEIPRRNVATLQAENVTGLFKDCSKVITGLHPTQAPTHLSVDTKFKTEGLCVDIPGIPKDMTYRRLISMMGFKMNYQVNGYPNMFITREEAIRHVRAWIGFDVEGCHATREAVGTNLPLQLGFSTGVNLVAVPTGYVDTPNNTDFSRVSAKPPPGDQFKHLIPLMYKGLPWNVVRIKIVQMLSDTLKNLSDRVVFVLWAHGFELTSMKYFVKIGPERTCCLCDRRATCFSTASDTYACWHHSIGFDYVYNPFMIDVQQWGFTGNLQSNHDLYCQVHGNAHVASCDAIMTRCLAVHECFVKRVDWTIEYPIIGDELKINAACRKVQHMVVKAALLADKFPVLHDIGNPKAIKCVPQADVEWKFYDAQPCSDKAYKIEELFYSYATHSDKFTDGVCLFWNCNVDRYPANSIVCRFDTRVLSNLNLPGCDGGSLYVNKHAFHTPAFDKSAFVNLKQLPFFYYSDSPCESHGKQVVSDIDYVPLKSATCITRCNLGGAVCRHHANEYRLYLDAYNMMISAGFSLWVYKQFDTYNLWNTFTRLQSLENVAFNVVNKGHFDGQQGEVPVSIINNTVYTKVDGVDVELFENKTTLPVNVAFELWAKRNIKPVPEVKILNNLGVDIAANTVIWDYKRDAPAHISTIGVCSMTDIAKKPTETICAPLTVFFDGRVDGQVDLFRNARNGVLITEGSVKGLQPSVGPKQASLNGVTLIGEAVKTQFNYYKKVDGVVQQLPETYFTQSRNLQEFKPRSQMEIDFLELAMDEFIERYKLEGYAFEHIVYGDFSHSQLGGLHLLIGLAKRFKESPFELEDFIPMDSTVKNYFITDAQTGSSKCVCSVIDLLLDDFVEIIKSQDLSVVSKVVKVTIDYTEISFMLWCKDGHVETFYPKLQSSQAWQPGVAMPNLYKMQRMLLEKCDLQNYGDSATLPKGIMMNVAKYTQLCQYLNTLTLAVPYNMRVIHFGAGSDKGVAPGTAVLRQWLPTGTLLVDSDLNDFVSDADSTLIGDCATVHTANKWDLIISDMYDPKTKNVTKENDSKEGFFTYICGFIQQKLALGGSVAIKITEHSWNADLYKLMGHFAWWTAFVTNVNASSSEAFLIGCNYLGKPREQIDGYVMHANYIFWRNTNPIQLSSYSLFDMSKFPLKLRGTAVMSLKEGQINDMILSLLSKGRLIIRENNRVVISSDVLVNN
>YP_009724390 (SARS-CoV-2 S蛋白)
MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT
>YP_009724397 (SARS-CoV-2 N蛋白)
MSDNGPQNQRNAPRITFGGPSDSTGSNQNGERSGARSKQRRPQGLPNNTASWFTALTQHGKEDLKFPRGQGVPINTNSSPDDQIGYYRRATRRIRGGDGKMKDLSPRWYFYYLGTGPEAGLPYGANKDGIIWVATEGALNTPKDHIGTRNPANNAAIVLQLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRNSSRNSTPGSSRGTSPARMAGNGGDAALALLLLDRLNQLESKMSGKGQQQQGQTVTKKSAAEASKKPRQKRTATKAYNVTQAFGRRGPEQTQGNFGDQELIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPSGTWLTYTGAIKLDDKDPNFKDQVILLNKHIDAYKTFPPTEPKKDKKKKADETQALPQRQKKQQTVTLLPAADLDDFSKQLQQSMSSADSTQA
>YP_009724391 (SARS-CoV-2 orf3a蛋白)
MDLFMRIFTIGTVTLKQGEIKDATPSDFVRATATIPIQASLPFGWLIVGVALLAVFQSASKIITLKKRWQLALSKGVHFVCNLLLLFVTVYSHLLLVAAGLEAPFLYLYALVYFLQSINFVRIIMRLWLCWKCRSKNPLLYDANYFLCWHTNCYDYCIPYNSVTSSIVITSGDGTTSPISEHDYQIGGYTEKWESGVKDCVVLHSYFTSDYYQLYSTQLSTDTGVEHVTFFIYNKIVDEPEEHVQIHTIDGSSGVVNPVMEPIYDEPTTTTSVPL
> YP_009724393.1 (SARS-CoV-2 M蛋白)
MADSNGTITVEELKKLLEQWNLVIGFLFLTWICLLQFAYANRNRFLYIIKLIFLWLLWPVTLACFVLAAVYRINWITGGIAIAMACLVGLMWLSYFIASFRLFARTRSMWSFNPETNILLNVPLHGTILTRPLLESELVIGAVILRGHLRIAGHHLGRCDIKDLPKEITVATSRTLSYYKLGASQRVAGDSGFAAYSRYRIGNYKLNTDHSSSSDNIALLVQ
> YP_009724395.1 (SARS-CoV-2 orf7a蛋白)
MKIILFLALITLATCELYHYQECVRGTTVLLKEPCSSGTYEGNSPFHPLADNKFALTCFSTQFAFACPDGVKHVYQLRARSVSPKLFIRQEEVQELYSPIFLIVAAIVFITLCFTLKRKTE
* 表1A-1K中包括肽抗原決定基,以及包含其全長與表1A-1K中列出之任何SEQ ID NO之胺基酸序列或其部分具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高一致性或者其間任何範圍(包括其),諸如85-99%一致性之胺基酸序列的多肽分子。此類多肽可具有本文所進一步描述之全長肽或多肽之功能。
表 2>19_抗原決定基_3aa_連接子(870 nt)
AtgtacgccagcgccctgtgggagatccagcaggtggtggacgctgatcacagctacttcacctctgattactaccagctttattctacacagaagcactacgtgtatatcggcgaccccgcccaactgcctgcccctgacgcctacaaaaccttcccccccacagaacccaaaaaggacaaaatctgggtcgccaccgagggcgccctgaacacccctaaagaccatatcatcaccgtggccacaagcagaaccctgagctattacaagctgggcgcttacgccctggtgtactttctgcagagcatcaacttcgtgcggatctccctggaaatccctaggcggaacgttgctaccctgcaggccgagcctaatatgatggtgaccaacaacaccttcaccctcaagggcggagccaagaaccccctgctgtacgacgccaattacttcctgtgctggcacaaggacctgtctccaagatggtatttctactacctgggcaccggctactaccacaccacagatccaagcttcctgggaagatacatgagcgctgaaagcctgagacctgataccagatacgtgctgatggacggcagaaaggtgcctaccgacaactacattaccacataccccggccagtgtagattcgtgacagacacccctaagggacctaaggtgaagtacagcacattcaagtgctacggcgtgtccccaacaaagctgaatgataaatacgagcagtacatcaagtggccttggtacatctggctgggcagcagctccaagctgtgggcccagtgcgtgcagctgcacaacgactacgtcggctacctgcaacctcggacatttctgctgaagtacaacTAG
>19_抗原決定基_kaa_連接子(690 nt)
AtggccctgtgggagatccagcaggttgtgaaggctgcattcacctctgattactaccagctgtacaaggccgccgtgtacatcggcgaccccgcccagctgaaggccgctaaaaccttcccccccaccgagcctaagaaagctgctgcaacagaaggcgccctgaatacacctaagaaagccgccgccacaagcagaacactgagctactacaagaaggccgctgtgtatttcctccagagcatcaacttcaaggccgctatccccaggcggaacgtggccaccctgaaagctgccatggtcaccaacaacacctttaccctgaagaaggccgccctgctgtacgacgccaattactttctgaaggccgcatctccacggtggtacttctactacctgaaggccgccaccaccgaccctagcttcctgggcagatacaaggccgccagacctgacaccagatacgtgctgaaagccgcccctaccgacaactacattacaacctacaaggccgccgtgacagatacccctaagggacctaaaaaggccgccaagtgctacggcgtgtccccaacaaagaaggccgctcagtacatcaagtggccttggtatatcaaggccgccaagctgtgggcccaatgtgtgcagctgaaggccgcctatctgcagcctagaaccttcctgctgTAG
>19_抗原決定基_無_連接子(528 nt)
AtggccctgtgggagatccagcaggtggtgttcaccagcgactactaccagctgtacgtgtacatcggcgaccccgctcagctgaagaccttcccacctaccgaacccaaggccaccgagggagccctgaacacccctaaggctacatctagaaccctgagctactacaaggtgtacttcctgcagtctatcaacttcatcccccggagaaacgtggccaccctgatggttaccaacaacacctttaccctgaagctgctgtacgacgccaattacttcctcagccctcggtggtatttctactaccttacaaccgaccctagcttcctgggcagatacagacctgacacaagatatgtgctgcctacagataattacatcaccacatacgtcaccgatacccccaaaggccctaaaaagtgctacggcgtgtcccctacaaagcagtacattaagtggccttggtacatcaagctgtgggcccagtgtgtgcagctgtatctgcaaccacggacatttctgctgTAG
>27_抗原決定基_3aa_連接子(1248 nt)
atgcacagctacttcaccagcgactactaccagctgtacagcacccagaagcactacgtgtacatcggcgaccccgcccagctgcccgccccctacgccctggtgtacttcctgcagagcatcaacttcgtgaggatcgccacctactacctgttcgacgagagcggcgagttcaagctggccagccacaagaaccccctgctgtacgacgccaactacttcctgtgctggcacaggaaggtgcccaccgacaactacatcaccacctaccccggccagatcaccgtggccaccagcaggaccctgagctactacaagctgggcgcccccaacatgatggtgaccaacaacaccttcaccctgaagggcggcgccagcatcatcaagaccatccagcccagggtggagaagaagaagctgaagtacgagcagtacatcaagtggccctggtacatctggctgggcaaggacctgagccccaggtggtacttctactacctgggcaccggcacctacaagaacacctgcgacggcaccaccttcacctacgccagcgccgtgcacgccggcaccgacctggagggcaacttctacggccccttcgagagcctgaggcccgacaccaggtacgtgctgatggacggccagaccgcctgcaccgacgacaacgccctggcctactacaacaccaccagcagcagcaagctgtgggcccagtgcgtgcagctgcacaacgactacgccagcgccctgtgggagatccagcaggtggtggacgccgacgacgcctacaagaccttcccccccaccgagcccaagaaggacaagagcaccttcaagtgctacggcgtgagccccaccaagctgaacgacgcccccagcgccagcgccttcttcggcatgagcaggatcggcatgctggccctgctgctgctggacaggctgaaccagctggagagcaagagcctggagatccccaggaggaacgtggccaccctgcaggccgagtactaccacaccaccgaccccagcttcctgggcaggtacatgagcgccagggacgtggacaccgacttcgtgaacgagttctacgcctacctgtgcaggttcgtgaccgacacccccaagggccccaaggtgaagtacatctgggtggccaccgagggcgccctgaacacccccaaggaccacatctacgtgggctacctgcagcccaggaccttcctgctgaagtacaacTGATAATAG
>27_抗原決定基_kaa_連接子(990 nt)
AtgtttacgtcagactactatcagctttacaaagcagccgtctatatcggggatcccgcccagcttaaagccgccgtgtatttcctgcagtccatcaacttcaaagcagcgtatttgttcgatgagtctggggagtttaaattgaaagctgccctcctctacgacgccaattattttcttaaagcggccccaacggataactatataacgacctacaaagcagctgccacatcccgaacactcagttattataagaaagcagccatggttacgaataacacttttacgctgaaaaaagctgcaaaaacgattcagccgcgggttgaaaagaaagctgcgcagtacataaagtggccatggtatatcaaagccgcctcccccagatggtacttctattatttgaaagcggccaacacatgcgacggtaccacgtttacatataaagctgcggggacagacttggaagggaatttttacaaggcggctcgcccagatacacgctacgttttgaaagccgcttgtactgatgataacgcattggcttactataaagcagcaaagctttgggcccagtgcgttcagctgaaggccgcagcgctctgggaaatccaacaggttgtgaaagccgcaaaaactttcccgccgacagaaccgaaaaaggcggcgaagtgctatggagtcagtcctactaaaaaggccgccgcgtcagccttctttggcatgagtcgcaaggctgctctgcttttggatcggctcaatcaactcaaagccgcaataccgagaaggaacgttgcgacattgaaggcggccacaacagacccgtcattcctgggcagatacaaggcagctgataccgacttcgtcaatgagttttacaaggcggcggtcactgacacaccgaaaggccccaaaaaggccgctgcgaccgagggtgcgttgaatacaccaaaaaaggcagcatatctccagccaaggacgttcctgctgTAG
>27_抗原決定基_無連接子(756 nt)
atgttcacctctgattactaccagctttatgtgtacattggagatcctgctcagctggtgtacttcctgcagagcatcaacttctacctgttcgacgagagcggcgaattcaagctgctgctgtacgacgccaactacttcctgcctaccgataattacatcaccacatacgccacatctcggaccctgagctactacaagatggtcaccaacaacacctttaccctgaagaagaccatccagcctcgggtggaaaagcagtacatcaagtggccttggtatatcagccctagatggtacttttactacctgaacacctgcgacggcaccacctttacatacggcacagatctggaaggcaacttctacagacctgacaccagatacgtgctgtgcaccgacgacaatgccctggcctactataagctgtgggcccaatgtgtgcagctggctctgtgggagatccagcaggtggtgaagacattcccccccaccgagcccaagaaatgctacggcgtgtccccaacaaaggccagcgccttcttcggcatgagccggctgctgctggacagactgaaccagctgatcccccgcaggaacgtggccaccctgaccaccgacccctccttcctgggaagatacgacacagacttcgtgaacgagttctacgttacagatacaccaaaaggccctaaagctacagagggcgccctgaatacccctaagtacctgcaacctagaacctttctgctcTAG
>11_frag (1506 nt)
atgtacgctctggtttattttcttcagtccatcaacttcgtaaggatcattatgcgactctggctgtgctggaagtgtcgcagcaagaaccccctcttgtatgacgctaattacttcctgtgctggcacggggacggcaagatgaaagatctgagccccagatggtacttctactatcttggtaccggacccgaagccgggctgccatacggggcaaataaagacggtattatctgggttgccactgagggtgccctgaatactcctaaagaccacattggcacacggaatcccgagaagtactgcgcattggctcccaacatgatggtgaccaacaatacctttacattaaaggggggagcaccaaccaaagtgacttttggcacttacaagaacacatgtgacggcacgacttttacctacgcaagcgctctgtgggaaattcaacaggtcgtcgacgccgatcttaacgagtctcttatcgatttacaggaattgggtaaatatgaacagtatatcaagtggccttggtacatctggctaggctttatagcaggacttatagctatcgtcatggttcagaccgcttgtacagacgataatgccctcgcctattataataccaccaaaggtgggcgttttgtgctggccctgctgtccgatctgcaggatctgaagtgggctcgcttcccaaaaagtgacggaaccggcacgatctacaccgagttggagccaccttgtcgcttcgtgaccgatacgccaaaaggccctaaagtgaagtatctccgggttgaagcattcgaatactatcataccacagatccttccttcctcgggaggtacatgagtgccctaaatcatactaagaaatggattaccgtggccacttcacgaactctctcctactacaaactgggcgcttcacagcgggtagccggcgacagcggattcgccgcctactccaggtatagaattggaaactataagctgaacacagaccattcttctagcagcgacaacatcgctctgttggtgcaggtcttgcaacagctgcgggtggagtcttcaagtaagttatgggcacaatgcgttcaacttcacaatgatattctactggcgaaagacacggccccctctgcgtccgccttttttggaatgtctagaatagggatggaagtaacaccatccggcacatggctcacatatacaggcgcgatcaagttagacgacaaggacccgaatttcaaagatcaggtgattctgctcaacaagcacatcgatgcatataagacatttccacctacggagcccaagaaggacaaaagcaagctcatagagtacactgatttcgcaacctcggcttgtgtcctcgctgccgagtgcaccattttcaaagatgcctcagggaagcctgtgccgtattgctacgatacaaacgtgcttgaaggttcggtggcgtacgagagtctgaggcccgatactagatatgtcctgatggacggaTAG
>s-pp-p2a-19_抗原決定基_3aa (4767 nt)
atgttcgtgttcctggtgctgctccccctggtctctagccagtgcgtgaatttaaccacacgcacccaactgccccccgcatacaccaactcctttaccagaggcgtgtactaccctgataaggtgtttagatctagcgttttgcacagcacacaggacctcttcctgccattcttcagcaatgtgacctggttccacgccattcacgtgtccggcacaaacggcactaagagattcgacaaccccgtgctgccttttaatgacggcgtgtactttgcatccaccgagaagtctaacatcatcagaggctggatattcggcaccaccctcgatagcaagacacagagcctgctcatcgtgaacaacgccacaaacgtggtgatcaaggtgtgcgagtttcagttctgcaacgaccctttcctgggggtctactaccacaaaaacaacaagagctggatggaatctgagttccgggtgtactccagcgccaataattgcaccttcgagtacgtgtcccagcccttcctgatggacttggagggcaagcagggcaattttaagaacctgagagagttcgtgtttaaaaatatcgacggctacttcaagatctacagcaagcatacacctatcaatctggtgagagacctgcctcagggcttcagcgcattggagcccctggttgacctgcccatcggcatcaacatcacaagattccagacactgctggccctgcacagaagctacctgacccctggagattcctcttctggatggaccgccggagccgccgcctactacgtgggatacctgcagcctagaaccttcctactgaagtacaatgagaatggaaccatcaccgatgccgtggactgcgctctggaccccctgagcgagacaaagtgtaccctgaagagcttcaccgtggaaaagggcatctatcagaccagcaacttccgagtccagcctacagagagcattgtgcggttccctaacatcacaaacctgtgcccttttggggaagtgttcaacgcgacccggttcgccagcgtgtatgcctggaacagaaaacggatctccaactgcgtggcagattacagcgtgctgtacaacagcgccagtttcagcaccttcaagtgctacggcgtgagccctacaaaactgaacgatctgtgcttcaccaatgtgtacgccgactctttcgtgatcaggggcgacgaagtgaggcagattgcccccggccagacgggcaaaatcgccgactacaactacaagctgcccgacgacttcaccggctgcgttattgcctggaactctaacaacctcgattctaaagtgggcggaaactacaactacctgtaccggctgttcagaaaaagcaacctgaaacctttcgagagagacatatccacagaaatctaccaggctggctctactccttgtaatggcgttgaagggttcaactgctactttccactgcagagctacggctttcagcctacaaacggagtgggctaccagccctaccgtgtggtggtgctgagcttcgaactgttgcacgcccccgctaccgtctgcggcccgaagaagagcacgaacctggtaaagaacaagtgcgtgaatttcaacttcaacggcctgacaggcaccggcgtgctgaccgaatcgaacaagaagtttctgccatttcagcagttcggccgggacatcgccgacaccaccgatgccgtgcgggatcctcagacactagaaatcctggacatcaccccctgtagcttcggcggcgtgagcgtcatcacacctggcacaaacaccagcaaccaggtggccgtgctctaccaggacgtgaattgcacagaggtgcctgtggccatccacgccgatcagctgacccctacatggcgggtctactctacaggaagcaacgtgttccagacaagagccggatgccttataggcgccgagcacgtgaacaacagctacgaatgcgacatccctatcggcgccggcatctgtgcttcttaccagacacagactaactctccacggagagccagatcagtggcctctcagtctatcatcgcctataccatgagtctgggagccgagaacagcgtggcatacagcaacaacagcatcgccatcccaaccaacttcacaatcagtgtgacaaccgagatcctgcccgtgtccatgaccaagacctcggtggattgcacgatgtacatctgcggcgacagcaccgaatgcagcaacctcctgctccagtacggcagtttctgcacacagctgaaccgggccctaaccggcatcgccgtggaacaggacaaaaacacccaggaggtgttcgcccaagtgaagcaaatctacaagaccccacctatcaaggacttcggcggcttcaattttagccagatcctgccagacccttctaagccttcaaagagaagcttcatcgaggacctgttattcaacaaagtgacgctggccgatgctggcttcatcaagcaatacggcgactgcctcggcgacatcgcggcacgagacctgatctgcgcccagaagtttaacggactgaccgtgttaccacctcttctgaccgatgaaatgatcgcacagtacaccagcgccctcctggccggcaccatcaccagcggatggaccttcggagcgggcgctgcactgcagatccctttcgccatgcagatggcctacagatttaatgggattggcgtgacccaaaacgtgctgtacgaaaaccagaaattgatcgctaaccaattcaactctgccattggaaagatccaggatagcctgagctctaccgcatccgctctgggcaagttgcaagacgtggtgaaccagaacgcccaggccctgaacacgctggtgaaacagctgagcagcaacttcggcgctattagcagcgtgctgaatgatattctgtcccggctggacccgcctgaggctgaggtgcagattgatcggctgattacgggtcggctgcagagcctgcagacctacgttacccagcagttgatcagagccgccgagatcagagccagtgcgaacctggcggcaaccaagatgagcgagtgtgtcctcggacagagcaagcgggttgacttctgtggaaagggctaccacctgatgagcttcccccagtctgccccgcacggcgtggtgttcctgcacgtgacctatgtgccagcccaggagaaaaatttcaccactgcccctgctatctgtcatgatggcaaggcccacttccccagagaaggcgttttcgtgagcaatggcacacactggttcgtgacacagcggaacttttacgagcctcagatcatcacaactgacaatactttcgtgagtggcaactgcgacgtcgtcatcggcatcgtgaacaacaccgtgtacgaccctctgcaacctgagctggacagcttcaaggaagagctggataagtacttcaagaaccacaccagccccgacgtagatctgggcgacatcagcggcatcaacgccagcgtggtcaacatccagaaggagatcgacagactgaacgaggttgccaagaatctgaacgaaagcctgatcgacctgcaggaactgggcaagtacgagcagtacatcaaatggccttggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtcaccatcatgctgtgttgcatgacctcatgctgctcttgcctgaagggctgttgtagctgcggctcttgttgcaagttcgacgaagatgacagcgagcctgtgctcaagggcgtgaagctgcactacacccgggccaagcggagcggctccggcgccaccaattttagcctgctaaagcaggccggcgacgtcgaggagaaccccggcccttatgccagcgctctgtgggagatccagcaggtggtggacgccgaccacagctacttcaccagcgactactaccagctgtactctacccaaaagcactacgtgtacatcggcgatccagcccagctgccagcccctgatgcttacaagactttccccccaacagaacctaagaaagataaaatttgggtggccactgaaggcgccctgaacacgcctaaggaccacatcatcacagtggccaccagcagaacactgagctactacaagttaggcgcctacgctttggtgtatttcctgcagagcatcaacttcgtgcgcatcagcctggaaatccccagaaggaacgtggccactctgcaggctgagcctaacatgatggtgaccaacaacacctttaccctgaagggcggagccaagaaccccctgctgtacgatgctaattacttcctgtgctggcacaaggatctgagtcctagatggtacttttactacctgggcacgggttactaccacaccaccgaccccagcttcctgggcagatacatgtccgcagaaagcctgagacctgataccagatacgtgctgatggacggcagaaaggtgcctacagacaactacatcaccacctaccctggccagtgcagattcgtaacggacacacctaagggccccaaggtgaagtacagcacttttaagtgctacggagtgtctcctacaaagctgaacgataagtacgagcagtacataaagtggccctggtacatttggctgggcagcagtagcaagctatgggcccagtgtgttcagctgcataacgactacgtgggatacctgcagccaagaacctttctgctgaagtacaacTAG
>s-pp-p2a-27_抗原決定基_3aa (5139 nt)
atgttcgtgttcctggtgctgctccccctggtctctagccagtgcgtgaatttaaccacacgcacccaactgccccccgcatacaccaactcctttaccagaggcgtgtactaccctgataaggtgtttagatctagcgttttgcacagcacacaggacctcttcctgccattcttcagcaatgtgacctggttccacgccattcacgtgtccggcacaaacggcactaagagattcgacaaccccgtgctgccttttaatgacggcgtgtactttgcatccaccgagaagtctaacatcatcagaggctggatattcggcaccaccctcgatagcaagacacagagcctgctcatcgtgaacaacgccacaaacgtggtgatcaaggtgtgcgagtttcagttctgcaacgaccctttcctgggggtctactaccacaaaaacaacaagagctggatggaatctgagttccgggtgtactccagcgccaataattgcaccttcgagtacgtgtcccagcccttcctgatggacttggagggcaagcagggcaattttaagaacctgagagagttcgtgtttaaaaatatcgacggctacttcaagatctacagcaagcatacacctatcaatctggtgagagacctgcctcagggcttcagcgcattggagcccctggttgacctgcccatcggcatcaacatcacaagattccagacactgctggccctgcacagaagctacctgacccctggagattcctcttctggatggaccgccggagccgccgcctactacgtgggatacctgcagcctagaaccttcctactgaagtacaatgagaatggaaccatcaccgatgccgtggactgcgctctggaccccctgagcgagacaaagtgtaccctgaagagcttcaccgtggaaaagggcatctatcagaccagcaacttccgagtccagcctacagagagcattgtgcggttccctaacatcacaaacctgtgcccttttggggaagtgttcaacgcgacccggttcgccagcgtgtatgcctggaacagaaaacggatctccaactgcgtggcagattacagcgtgctgtacaacagcgccagtttcagcaccttcaagtgctacggcgtgagccctacaaaactgaacgatctgtgcttcaccaatgtgtacgccgactctttcgtgatcaggggcgacgaagtgaggcagattgcccccggccagacgggcaaaatcgccgactacaactacaagctgcccgacgacttcaccggctgcgttattgcctggaactctaacaacctcgattctaaagtgggcggaaactacaactacctgtaccggctgttcagaaaaagcaacctgaaacctttcgagagagacatatccacagaaatctaccaggctggctctactccttgtaatggcgttgaagggttcaactgctactttccactgcagagctacggctttcagcctacaaacggagtgggctaccagccctaccgtgtggtggtgctgagcttcgaactgttgcacgcccccgctaccgtctgcggcccgaagaagagcacgaacctggtaaagaacaagtgcgtgaatttcaacttcaacggcctgacaggcaccggcgtgctgaccgaatcgaacaagaagtttctgccatttcagcagttcggccgggacatcgccgacaccaccgatgccgtgcgggatcctcagacactagaaatcctggacatcaccccctgtagcttcggcggcgtgagcgtcatcacacctggcacaaacaccagcaaccaggtggccgtgctctaccaggacgtgaattgcacagaggtgcctgtggccatccacgccgatcagctgacccctacatggcgggtctactctacaggaagcaacgtgttccagacaagagccggatgccttataggcgccgagcacgtgaacaacagctacgaatgcgacatccctatcggcgccggcatctgtgcttcttaccagacacagactaactctccacggagagccagatcagtggcctctcagtctatcatcgcctataccatgagtctgggagccgagaacagcgtggcatacagcaacaacagcatcgccatcccaaccaacttcacaatcagtgtgacaaccgagatcctgcccgtgtccatgaccaagacctcggtggattgcacgatgtacatctgcggcgacagcaccgaatgcagcaacctcctgctccagtacggcagtttctgcacacagctgaaccgggccctaaccggcatcgccgtggaacaggacaaaaacacccaggaggtgttcgcccaagtgaagcaaatctacaagaccccacctatcaaggacttcggcggcttcaattttagccagatcctgccagacccttctaagccttcaaagagaagcttcatcgaggacctgttattcaacaaagtgacgctggccgatgctggcttcatcaagcaatacggcgactgcctcggcgacatcgcggcacgagacctgatctgcgcccagaagtttaacggactgaccgtgttaccacctcttctgaccgatgaaatgatcgcacagtacaccagcgccctcctggccggcaccatcaccagcggatggaccttcggagcgggcgctgcactgcagatccctttcgccatgcagatggcctacagatttaatgggattggcgtgacccaaaacgtgctgtacgaaaaccagaaattgatcgctaaccaattcaactctgccattggaaagatccaggatagcctgagctctaccgcatccgctctgggcaagttgcaagacgtggtgaaccagaacgcccaggccctgaacacgctggtgaaacagctgagcagcaacttcggcgctattagcagcgtgctgaatgatattctgtcccggctggacccgcctgaggctgaggtgcagattgatcggctgattacgggtcggctgcagagcctgcagacctacgttacccagcagttgatcagagccgccgagatcagagccagtgcgaacctggcggcaaccaagatgagcgagtgtgtcctcggacagagcaagcgggttgacttctgtggaaagggctaccacctgatgagcttcccccagtctgccccgcacggcgtggtgttcctgcacgtgacctatgtgccagcccaggagaaaaatttcaccactgcccctgctatctgtcatgatggcaaggcccacttccccagagaaggcgttttcgtgagcaatggcacacactggttcgtgacacagcggaacttttacgagcctcagatcatcacaactgacaatactttcgtgagtggcaactgcgacgtcgtcatcggcatcgtgaacaacaccgtgtacgaccctctgcaacctgagctggacagcttcaaggaagagctggataagtacttcaagaaccacaccagccccgacgtagatctgggcgacatcagcggcatcaacgccagcgtggtcaacatccagaaggagatcgacagactgaacgaggttgccaagaatctgaacgaaagcctgatcgacctgcaggaactgggcaagtacgagcagtacatcaaatggccttggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtcaccatcatgctgtgttgcatgacctcatgctgctcttgcctgaagggctgttgtagctgcggctcttgttgcaagttcgacgaagatgacagcgagcctgtgctcaagggcgtgaagctgcactacacccgggccaagcggagcggctccggcgccaccaattttagcctgctaaagcaggccggcgacgtcgaggagaaccccggccctcactcctactttacaagtgattactaccaactgtactcaacacagaagcactacgtgtacatcggcgatcctgcccagctgccagccccttacgccctagtgtattttctgcaatctatcaacttcgtccggattgccacgtactatctgttcgacgagtctggcgaattcaaactggcctcccacaagaaccctctgctgtatgacgctaactacttcctatgctggcacagaaaggtgcccaccgataactacatcacaacctaccctggccagataaccgtggccacaagcagaacactgtcctactacaagctgggtgctcctaatatgatggtgaccaacaacacattcaccctgaagggcggagccagtatcatcaagaccatccagcctagagtggaaaagaaaaagctgaagtacgagcagtacatcaagtggccttggtatatctggctgggaaaagacctgagccccagatggtacttttactatctgggcacaggcacctacaagaacacctgtgacggcacaacattcacctacgcctctgccgtgcacgccggaacagacctggaaggcaacttctacggacctttcgagagcctgagacccgataccaggtacgtgctgatggatggccagaccgcctgtacagacgacaatgctctggcctactataacaccactagcagctcaaagctgtgggcccagtgcgtgcagctgcataacgattacgccagcgccctgtgggagatccaacaggtggtggacgccgacgacgcttataagaccttccctcccaccgagcccaagaaggacaagagtaccttcaaatgctacggcgtttctcccaccaaactgaacgacgctcctagcgccagtgccttctttggaatgtcaagaatcggcatgcttgccctgctgctgctcgatagactgaaccagctggaatccaagagccttgagatccccagaagaaacgtggctaccctgcaggccgagtactaccacaccaccgacccttccttcctggggagatacatgagcgccagagacgtcgatactgacttcgtaaatgagttctacgcctacctgtgtagattcgtcacagacaccccaaagggccctaaggtcaagtacatttgggtggccaccgaaggcgctctgaacactcctaaggatcacatctatgtcggctacctgcagcctcggacattcctgctgaaatacaacTAG
>14_片段(1647 nt)
atgctgagggtggaggccttcgagtactaccacaccaccgaccccagcttcctgggcaggtacatgagcgccctgaaccacaccaagaagtgggtgctgcagcagctgagggtggagagcagcagcaagctgtgggcccagtgcgtgcagctgcacaacgacatcctgctggccaaggacaccgcccccagcgccagcgccttcttcggcatgagcaggatcggcatggaggtgacccccagcggcacctggctgacctacaccggcgccatcaagctggacgacaaggaccccaacttcaaggaccaggtgatcctgctgaacaagcacatcgacgcctacaagaccttcccccccaccgagcccaagaaggacaagagcctggagatccccaggaggaacgtggccaccctgcaggccgagctgaacgagagcctgatcgacctgcaggagctgggcaagtacgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgcagaccgcctgcaccgacgacaacgccctggcctactacaacaccaccaagggcggcaggttcgtgctggccctgctgagcgacctgcaggacctgaagtgggccaggttccccaagagcgacggcaccggcaccatctacaccgagctggagcccccctgcaggttcgtgaccgacacccccaagggccccaaggtgaagtacagcatcatcaagaccatccagcccagggtggagaagaagaagctgatcaccgtggccaccagcaggaccctgagctactacaagctgggcgccagccagagggtggccggcgacagcggcttcgccgcctacagcaggtacaggatcggcaactacaagctgaacaccgaccacagcagcagcagcgacaacatcgccctgctggtgcagagcaagctgatcgagtacaccgacttcgccaccagcgcctgcgtgctggccgccgagtgcaccatcttcaaggacgccagcggcaagcccgtgccctactgctacgacaccaacgtgctggagggcagcgtggcctacgagagcctgaggcccgacaccaggtacgtgctgatggacggcgagaagtactgcgccctggcccccaacatgatggtgaccaacaacaccttcaccctgaagggcggcgcccccaccaaggtgaccttcggcggcgacggcaagatgaaggacctgagccccaggtggtacttctactacctgggcaccggccccgaggccggcctgccctacggcgccaacaaggacggcatcatctgggtggccaccgagggcgccctgaacacccccaaggaccacatcggcaccaggaacccctacgccctggtgtacttcctgcagagcatcaacttcgtgaggatcatcatgaggctgtggctgtgctggaagtgcaggagcaagaaccccctgctgtacgacgccaactacttcctgtgctggcacacctacaagaacacctgcgacggcaccaccttcacctacgccagcgccctgtgggagatccagcaggtggtggacgccgacaagcactacgtgtacatcggcgaccccgcccagctgcccgcccccTGATAATAG
>B.1.617.2_S.PP_Epi-M/N/ORF3a (3306 nt)
atgtacgccagcgccctgtgggagatccagcaggtggtggacgccgacagcagcagcaagctgtgggcccagtgcgtgcagctgcacaacgacaagcactacgtgtacatcggcgaccccgcccagctgcccgcccccagcctggagatccccagaagaaacgtggccaccctgcaggccgagagagacgtggacaccgacttcgtgaacgagttctacgcctacctgacctacaagaacacctgcgacggcaccaccttcacctacgccagcgcccccaacatgatggtgaccaacaacaccttcaccctgaagggcggcgccgccacctactacctgttcgacgagagcggcgagttcaagctggccagccactactaccacaccaccgaccccagcttcctgggcagatacatgagcgccgagagcctgagacccgacaccagatacgtgctgatggacggccagaccgcctgcaccgacgacaacgccctggcctactacaacaccaccagcatcatcaagaccatccagcccagagtggagaagaagaagctgtgcagattcgtgaccgacacccccaagggccccaaggtgaagtacagcaccttcaagtgctacggcgtgagccccaccaagctgaacgacagaaaggtgcccaccgacaactacatcaccacctaccccggccaggtgcacgccggcaccgacctggagggcaacttctacggccccttctacgtgggctacctgcagcccagaaccttcctgctgaagtacaacggcgacggcaagatgaaggacctgagccccagatggtacttctactacctgggcaccggccccgaggccggcctgccctacggcgccaacaaggacggcatcatctgggtggccaccgagggcgccctgaacacccccaaggaccacatcggcaccagaaaccccgccaacaacgccgccatcgtgctgcagctgccccagggcaccaccctgcccaagggcttctacgccgagggcagcagaggcggcagccaggccagcagcagaagcagcagcagaagcagaaacagcagcagaaacagcacccccggcgagaagtgggagagcggcgtgaaggactgcgtggtgctgcacagctacttcaccagcgactactaccagctgtacagcacccagctgagcaccgacaccggcgtggagcacgtgaccttcttcatctacaacaagatcgtggacgagcccgaggagcacgtgcagatccacaccatcgacggcagcagcggcgtggtgaaccccgtgatggagcccatctacgacgagcccaccaccaccaccagcgtgcccctgagcagcatgggcaccagccccgccagaatggccggcaacggcggcgacgccgccctggccctgctgctgctggacagactgaaccagctggagagcaagatgagcggcaagggccagcagcagcagggccagaccgtgaccaagaagagcgccgccgaggccagcaagaagcccagacagaagagaaccgccaccaaggcctacaacgtgacccaggccttcggcagaagaggccccgagcagacccagggcaacttcggcgaccaggagctgatcagacagggcaccgactacaagcactggccccagatcgcccagttcaagcagggcgagatcaaggacgccacccccctggacttcgtgagagccaccgccaccatccccatccaggccagcctgcccttcggctggctgatcgtgggcgtggccctgctggccgtgttccagagcgccagcaagatcatcaccctgaagaagagatggcagctggccctgagcaagggcgtgcacttcgtgtgcaacctgctgctgctgttcgtgaccgtgtacagccacctgctgctggtggccgccggcctggaggccatgagcgacaacggcccccagaaccagagaaacgcccccagaatcaccttcggcggccccagcgacagcaccggcagcaaccagaacggcgagagaagcggcgccagaagcaagcagagaagaccccagggcctgcccaacaacaccgccagctggttcaccgccctgacccagcacggcaaggagggcctgaagttccccagaggccagggcgtgcccatcaacaccaacagcagccccgacgaccagatcggctactacagaagagccaccagaagaatcagaggcctgttcgccagaaccagaagcatgtggagcttcaaccccgagaccaacatcctgctgaacgtgcccctgcacggcaccatcctgaccagacccctgctggagagcgagctggtgatcggcgccgtgatcctgagaggccacctgagaatcgccggccaccacctgggcagatgcgacatcaaggacctgcccaaggagcccttcctgtacctgtacgccctggtgtacttcctgcagagcatcaacttcgtgagaatcatcatgagactgtggctgtgctggaagtgcagaagcaagaaccccctgctgtacgacgccaactacttcctgtgctggcacaccaactgctacgactactgcatcccctacaacagcgtgaccagcagcatcgtgatcaccagcggcgacggcaccaccagccccatcagcgagcacgactaccagatcggcggctacaccgcccccagcgccagcgccttcttcggcatgagcagaatcggcatggaggtgacccccagcggcacctggctgacctacaccggcgccatcaagctggacgacaaggaccccaacttcaaggaccaggtgatcctgctgaacaagcacatcgacgcctacaagaccttcccccccaccgagcccaagaaggacaagaagaagaaggcctacgagacccaggccctgccccagagacagaagaagcagcagaccgtgaccctgctgcccgccgccgacctggacgacttcagcaagcagctgcagcagagcatgagcagcgccgacagcacccaggccatcaccgtggccaccagcagaaccctgagctactacaagctgggcgccagccagagagtggccggcgacagcggcttcgccgcctacagcagatacagaatcggcaactacaagctgaacaccgaccacagcagcagcagcgacaacatcgccctgctggtgcagctgaacgagagcctgatcgacctgcaggagctgggcaagtacgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgTGATAATAG
>B.1.617.2_S.PP_EpiFrag-M/N/ORF3a (3672 nt)
atggccacctactacctgttcgacgagagcggcgagttcaagctggccagccacagcaagctgatcgagtacaccgacttcgccaccagcgcctgcgtgctggccgccgagtgcaccatcttcaaggacgccagcggcaagcccgtgccctactgctacgacaccaacgtgctggagggcagcgtggcctacgagagcctgagacccgacaccagatacgtgctgatggacggcagaaaggtgcccaccgacaactacatcaccacctaccccggccagcagaccgcctgcaccgacgacaacgccctggcctactacaacaccaccaagggcggcagattcgtgctggccctgctgagcgacctgcaggacctgaagtgggccagattccccaagagcgacggcaccggcaccatctacaccgagctggagcccccctgcagattcgtgaccgacacccccaagggccccaaggtgaagtacagcaccttcaagtgctacggcgtgagccccaccaagctgaacgacagagacgtggacaccgacttcgtgaacgagttctacgcctacctgacctacaagaacacctgcgacggcaccaccttcacctacgccagcgccctgtgggagatccagcaggtggtggacgccgacctgagagtggaggccttcgagtactaccacaccaccgaccccagcttcctgggcagatacatgagcgccctgaaccacaccaagaagtggaagcactacgtgtacatcggcgaccccgcccagctgcccgcccccagcctggagatccccagaagaaacgtggccaccctgcaggccgaggtgctgcagcagctgagagtggagagcagcagcaagctgtgggcccagtgcgtgcagctgcacaacgacatcctgctggccaaggacaccgtgcacgccggcaccgacctggagggcaacttctacggccccttcagcatcatcaagaccatccagcccagagtggagaagaagaagctggagaagtactgcgccctggcccccaacatgatggtgaccaacaacaccttcaccctgaagggcggcgcccccaccaaggtgaccttcggctacgtgggctacctgcagcccagaaccttcctgctgaagtacaacggcgacggcaagatgaaggacctgagccccagatggtacttctactacctgggcaccggccccgaggccggcctgccctacggcgccaacaaggacggcatcatctgggtggccaccgagggcgccctgaacacccccaaggaccacatcggcaccagaaaccccgccaacaacgccgccatcgtgctgcagctgccccagggcaccaccctgcccaagggcttctacgccgagggcagcagaggcggcagccaggccagcagcagaagcagcagcagaagcagaaacagcagcagaaacagcacccccggcgagaagtgggagagcggcgtgaaggactgcgtggtgctgcacagctacttcaccagcgactactaccagctgtacagcacccagctgagcaccgacaccggcgtggagcacgtgaccttcttcatctacaacaagatcgtggacgagcccgaggagcacgtgcagatccacaccatcgacggcagcagcggcgtggtgaaccccgtgatggagcccatctacgacgagcccaccaccaccaccagcgtgcccctgagcagcatgggcaccagccccgccagaatggccggcaacggcggcgacgccgccctggccctgctgctgctggacagactgaaccagctggagagcaagatgagcggcaagggccagcagcagcagggccagaccgtgaccaagaagagcgccgccgaggccagcaagaagcccagacagaagagaaccgccaccaaggcctacaacgtgacccaggccttcggcagaagaggccccgagcagacccagggcaacttcggcgaccaggagctgatcagacagggcaccgactacaagcactggccccagatcgcccagttcaagcagggcgagatcaaggacgccacccccctggacttcgtgagagccaccgccaccatccccatccaggccagcctgcccttcggctggctgatcgtgggcgtggccctgctggccgtgttccagagcgccagcaagatcatcaccctgaagaagagatggcagctggccctgagcaagggcgtgcacttcgtgtgcaacctgctgctgctgttcgtgaccgtgtacagccacctgctgctggtggccgccggcctggaggccatgagcgacaacggcccccagaaccagagaaacgcccccagaatcaccttcggcggccccagcgacagcaccggcagcaaccagaacggcgagagaagcggcgccagaagcaagcagagaagaccccagggcctgcccaacaacaccgccagctggttcaccgccctgacccagcacggcaaggagggcctgaagttccccagaggccagggcgtgcccatcaacaccaacagcagccccgacgaccagatcggctactacagaagagccaccagaagaatcagaggcctgttcgccagaaccagaagcatgtggagcttcaaccccgagaccaacatcctgctgaacgtgcccctgcacggcaccatcctgaccagacccctgctggagagcgagctggtgatcggcgccgtgatcctgagaggccacctgagaatcgccggccaccacctgggcagatgcgacatcaaggacctgcccaaggagcccttcctgtacctgtacgccctggtgtacttcctgcagagcatcaacttcgtgagaatcatcatgagactgtggctgtgctggaagtgcagaagcaagaaccccctgctgtacgacgccaactacttcctgtgctggcacaccaactgctacgactactgcatcccctacaacagcgtgaccagcagcatcgtgatcaccagcggcgacggcaccaccagccccatcagcgagcacgactaccagatcggcggctacaccgcccccagcgccagcgccttcttcggcatgagcagaatcggcatggaggtgacccccagcggcacctggctgacctacaccggcgccatcaagctggacgacaaggaccccaacttcaaggaccaggtgatcctgctgaacaagcacatcgacgcctacaagaccttcccccccaccgagcccaagaaggacaagaagaagaaggcctacgagacccaggccctgccccagagacagaagaagcagcagaccgtgaccctgctgcccgccgccgacctggacgacttcagcaagcagctgcagcagagcatgagcagcgccgacagcacccaggccatcaccgtggccaccagcagaaccctgagctactacaagctgggcgccagccagagagtggccggcgacagcggcttcgccgcctacagcagatacagaatcggcaactacaagctgaacaccgaccacagcagcagcagcgacaacatcgccctgctggtgcagctgaacgagagcctgatcgacctgcaggagctgggcaagtacgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgTGATAATAG
>s-pp-p2a-11_frag (5403 nt)
atgttcgtttttctggttctgctgccactcgtgtcaagtcagtgcgtgaaccttactacaaggactcagctcccaccagcatacacgaatagttttacgcggggcgtgtactatccagacaaagtgtttcgcagctctgttctacattcaactcaagacctgtttttgcctttcttctccaatgtgacctggttccacgccatccacgtgagtggcacgaacgggaccaaacggtttgataacccagtgctgccttttaacgacggggtatatttcgcctctactgaaaaatccaacatcatccgcggctggattttcgggaccactcttgactccaagacccagtcactcctgatcgtaaacaatgcgaccaacgtcgtgattaaggtgtgcgagtttcaattctgtaacgaccctttcctgggtgtatattaccacaagaataataagtcctggatggaatcagagtttagagtatactctagcgctaacaactgtacttttgaatatgtgtcccaacccttcttgatggacttggagggaaaacagggaaattttaagaatctccgagagttcgtgtttaaaaacattgacggctatttcaagatatactctaagcatacacccatcaatctggtccgcgatctgccacaggggtttagcgcactggaaccgttggtggatctccccattgggattaatatcacccgtttccagacacttttagccttgcatcggagctacctaacccccggggactcaagtagcggctggactgcgggagcggccgcctattatgtcggatatctgcagcctcggacattcctcctgaagtacaatgagaatggcacaattacagacgcagtagactgtgccctggatccgctctccgaaaccaaatgcacgctgaaatcatttacggtggaaaaaggtatataccagaccagcaatttcagggtgcagcctacggagtccattgtccgtttccccaatatcaccaatctgtgtcctttcggcgaagtgtttaacgcaactaggttcgcgagtgtctacgcctggaaccgaaagagaatctcaaactgtgtggccgattacagcgtcctgtacaactccgcatctttcagtaccttcaagtgctacggggtcagccccaccaaacttaacgatctttgcttcactaacgtttatgccgatagttttgtcatcaggggcgacgaagtgcgacagattgcccctggacagacgggaaagatcgccgactataactataagctgccagacgatttcacaggatgcgtgatcgcctggaatagcaacaatctggactctaaggtgggggggaattataattatttgtatagactgtttcgaaagtcaaaccttaagccatttgagagggatatcagcacagagatttaccaggcaggaagcaccccatgtaacggggtagaaggcttcaactgctacttccccctccagtcatatgggttccagcctaccaatggtgtgggttaccagccgtacagagtagtggttctttcatttgagctgctgcatgcccctgccaccgtctgcggacctaaaaaatctaccaatttagtgaaaaataagtgcgtgaattttaatttcaacggccttacgggcaccggcgtgctgactgagagcaataagaaattcttaccatttcagcagttcggccgcgacatagctgataccaccgatgcagttcgcgacccccagaccctggagatccttgacatcactccttgcagtttcggaggagtctcggtcatcacacctggaacaaacacatccaaccaggtggcagttctttaccaggatgtgaactgtaccgaagtgccagtggcaatccacgccgatcagttaactcccacctggagagtgtactctacaggctctaacgtcttccagactcgggccggttgccttattggggctgagcacgtgaacaactcctacgagtgcgacatacctattggtgccggcatctgtgccagctaccagacccaaaccaattcgccaaggcgagcgcgttctgtagcaagccagtcgattattgcctacactatgtccttaggtgctgagaactctgtggcttactctaacaactccatagcaattccaacaaactttacaattagtgttactactgaaatcttgcccgtcagcatgactaaaacctctgtcgattgtaccatgtacatttgtggggactctacagagtgcagcaatcttctgctccagtacggctctttttgtacgcagctgaaccgtgctctgactgggattgccgtcgagcaagataagaacacccaggaggtgtttgcccaagttaagcagatttataagacaccacccatcaaagacttcggcggatttaacttttctcagattctgcccgacccctccaagcccagcaagaggagctttatcgaggacctgctgttcaataaggtcacactcgctgatgcaggattcatcaagcagtatggcgattgcctcggagacatcgctgcgagagacctcatatgcgctcagaaattcaatggcctgacggtgctacctccgctactgactgacgaaatgatagctcagtacacgtcggctctcttggccggaacaatcacctccggatggacctttggcgcgggagcagcactacagatcccttttgcaatgcaaatggcttaccggttcaatggcataggggtaactcaaaatgtgctgtacgagaaccaaaaattgatcgctaaccagttcaacagcgccattgggaagatccaggattctttgtcctcaaccgccagtgcattgggcaagctccaggacgtcgttaaccagaacgctcaggccttaaacacgctggtcaaacagttgtcctccaattttggcgctatatccagcgttctcaatgatatcctttcccgcttagatccaccagaagctgaggtccaaattgataggttaataaccggcagactccagagcctgcaaacttacgtcacccagcaactcatacgcgccgcggagatccgcgctagcgcaaacctagctgccactaaaatgagtgagtgtgttctcggacagtctaagcgggtggacttttgcggcaaaggctatcacctcatgagcttcccccaaagcgcaccacatggcgttgtgttcttgcacgtgacttacgttcccgcacaggagaaaaatttcaccacagcccccgccatctgccatgatgggaaagctcattttccacgagaaggggtgttcgtgtcaaacggtacacactggtttgtcacacaaagaaatttttatgaacctcaaattatcacaactgacaataccttcgtgagcggaaactgtgatgtcgtaattgggatcgtaaacaacactgtgtatgacccccttcagcccgaactggacagtttcaaggaagagcttgacaagtatttcaagaaccatacttcaccagacgtagaccttggtgatatttcaggaatcaacgctagtgtggtgaacatccagaaagaaattgatcgcctcaatgaggtcgcgaaaaatctgaatgagtctctgatcgacctgcaagagttggggaagtacgaacagtatattaaatggccctggtacatttggctgggatttatagctggactcattgccattgttatggtcacaataatgctgtgttgcatgactagctgttgctcatgcctaaaagggtgctgcagttgcggctcctgttgcaagtttgatgaagacgatagcgagccggtccttaaaggcgttaagctacattatactagggctaagagatccggcagtggggcgaccaactttagcttgttgaagcaagcaggggacgtggaagaaaaccccggcccttacgccctagtgtactttctgcagtccattaacttcgttcggattatcatgaggttgtggctgtgttggaagtgtcggtcgaagaatccactcctgtacgatgcaaattactttctgtgctggcacggagacggcaaaatgaaagacctgtccccgagatggtatttttattatctgggtaccggtcccgaggcggggctgccctacggggcaaacaaagacggaatcatctgggtcgcaacagagggagctcttaatacacctaaagatcacattggcacccgcaatcccgagaagtactgtgccctggcccccaatatgatggtgacaaataacacctttacattaaagggcggggccccaaccaaggtgacattcggtacatacaagaatacctgtgacggcacaacgttcacgtatgcaagcgctctgtgggagatccaacaggtggtggacgccgacctgaatgaaagtctgattgatctccaggaactcggcaaatatgagcagtatatcaagtggccttggtacatctggctcggttttatcgctggtcttatcgccatcgtgatggtgcagactgcttgcaccgatgataatgcactcgcgtactacaacaccacaaaaggaggacgatttgtgctagccctgctcagtgatctgcaagatctcaaatgggcccgcttcccgaagtccgatggaaccggcacaatctatacagaattggaacctccttgtaggttcgtgaccgatactcccaagggtcccaaggtaaaatacctgcgggtagaagcttttgaatactaccacactactgacccatcttttctgggcagatatatgtctgcattaaatcacaccaaaaagtggataacagtggccacctcccggacactgtcatactataaactgggtgcatcccagcgggttgctggtgattccggattcgccgcctattcgcggtatagaatagggaattacaagttgaataccgaccactccagttctagtgataacatagccctgctggttcaggttcttcagcagctgagagtagaatcttccagcaagctgtgggcccagtgtgttcaactccacaatgatattttactcgccaaggacactgcaccgtcagcctctgccttcttcgggatgtctcgtattggtatggaggttactcctagcggcacatggctgacgtacaccggggctataaagttggacgacaaggacccaaacttcaaggaccaagtgatcttactgaacaaacatatcgatgcttataagacattccctcctactgagcctaaaaaagataaatcaaagctcattgagtacacagattttgctacaagcgcttgtgtcctggcggccgagtgcaccatcttcaaagacgctagtggcaagcccgtgccgtattgctatgacaccaatgtgctcgagggttcagtcgcctatgagtcattaaggccagatacgaggtacgtcctaatggatgggTAG
>YP_009724389 (SARS-CoV-2 ORF1a/b蛋白)
>YP_009724390 (SARS-CoV-2 S蛋白)
>YP_009724397 (SARS-CoV-2 N蛋白)
>YP_009724391 (SARS-CoV-2 orf3a蛋白)
> YP_009724393.1 (SARS-CoV-2 M蛋白)
> YP_009724395.1 (SARS-CoV-2 orf7a蛋白)
* 表2中包括核酸序列,其全長與編碼表1A-1K中之任一者中列出的多肽之核酸或其部分具有至少約60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高一致性或者其間任何範圍(包括其),諸如85-99%一致性。此類核酸序列可編碼具有如本文進一步描述之全長肽或多肽之一或多種功能的多肽且亦可表示RNA核酸分子(例如,經尿苷置換之胸腺嘧啶)。
肽抗原決定基 | 源自 SARS-CoV-2 蛋白 |
KLWAQCVQL | ORF1ab |
YLQPRTFLL | S |
LLYDANYFL | ORF3a |
ALWEIQQVV | ORF1ab |
LLLDRLNQL | N |
YLFDESGEFKL | ORF1ab |
肽抗原決定基 | 源自 SARS-CoV-2 蛋白 |
FTSDYYQLY | ORF3a |
TTDPSFLGRY | ORF1ab |
PTDNYITTY | ORF1ab |
ATSRTLSYY | M |
CTDDNALAYY | ORF1ab |
NTCDGTTFTY | ORF1ab |
DTDFVNEFY | ORF1ab |
GTDLEGNFY | ORF1ab |
肽抗原決定基 | 源自 SARS-CoV-2 蛋白 |
KTFPPTEPK | N |
KCYGVSPTK | S |
MVTNNTFTLK | ORF1ab |
KTIQPRVEK | ORF1ab |
肽抗原決定基 | 源自 SARS-CoV-2 蛋白 |
KTFPPTEPK | N |
VTDTPKGPK | ORF1ab |
ATEGALNTPK | N |
ASAFFGMSR | N |
ATSRTLSYYK | M |
肽抗原決定基 | 源自 SARS-CoV-2 蛋白 |
QYIKWPWYI | S |
VYFLQSINF | ORF3a |
VYIGDPAQL | ORF1ab |
肽抗原決定基 | 源自 SARS-CoV-2 蛋白 |
SPRWYFYYL | N |
RPDTRYVL | ORF1ab |
IPRRNVATL | ORF1ab |
在一些實施例中,本文提供orf1a/b多肽及/或編碼orf1a/b多肽之核酸。Orf1a/b多肽係包括胺基酸序列之多肽,該胺基酸序列對應於orf1a/b多蛋白之胺基酸序列及/或該orf1a/b胺基酸序列中具有足以引出orf1a/b特异性免疫反應的長度之一部分。在某些實施例中,orf1a/b多肽亦包括不對應於該胺基酸序列之胺基酸(例如,包含orf1a/b胺基酸序列及對應於非orf1a/b蛋白或多肽之胺基酸序列之融合蛋白)。在一些實施例中,orf1a/b多肽僅包括對應於orf1a/b多蛋白或其片段之胺基酸序列。
在一些實施例中,orf1a/b多肽具有包含以下、基本上由以下組成或由以下組成的胺基酸序列:表1K中闡述之orf1a/b蛋白胺基酸序列之至少8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500或7000個連續胺基酸。在一些實施例中,該等連續胺基酸與表1K中闡述之orf1a/b之胺基酸序列一致。在一些實施例中,orf1a/b多肽包含一或多個選自由以下組成之群的肽抗原決定基,基本上由該等肽抗原決定基組成,或由該等肽抗原決定基組成:表1A、表1B、表1C、表1D、表1E及/或表1F中列出之orf1a/b肽抗原決定基。
在一些實施例中,本文提供S蛋白多肽及/或編碼S蛋白多肽之核酸。S蛋白多肽係包括胺基酸序列之多肽,該胺基酸序列對應於S蛋白多蛋白之胺基酸序列及/或該S蛋白胺基酸序列中具有足以引出S蛋白特异性免疫反應的長度之一部分。在某些實施例中,S蛋白多肽亦包括不對應於該胺基酸序列之胺基酸(例如,包含S蛋白胺基酸序列及對應於非S蛋白或多肽之胺基酸序列之融合蛋白)。在一些實施例中,S蛋白多肽僅包括對應於S蛋白多蛋白或其片段之胺基酸序列。
在某些實施例中,S蛋白多肽具有包含以下、基本上由以下組成或由以下組成的胺基酸序列:表1K中闡述之S蛋白胺基酸序列之至少8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200或1250個連續胺基酸。在一些實施例中,該等連續胺基酸與表1K中闡述之S蛋白之胺基酸序列一致。在一些實施例中,S多肽包含一或多個選自由以下組成之群的肽抗原決定基,基本上由該等肽抗原決定基組成,或由該等肽抗原決定基組成:表1A、表1B、表1C、表1D、表1E及/或表1F中列出之S肽抗原決定基。
在一些實施例中,本文提供N蛋白多肽及/或編碼N蛋白多肽之核酸。N蛋白多肽係包括胺基酸序列之多肽,該胺基酸序列對應於N蛋白多蛋白之胺基酸序列及/或該N蛋白胺基酸序列中具有足以引出N蛋白特异性免疫反應的長度之一部分。在某些實施例中,N蛋白多肽亦包括不對應於該胺基酸序列之胺基酸(例如,包含N蛋白胺基酸序列及對應於非N蛋白或多肽之胺基酸序列之融合蛋白)。在一些實施例中,N蛋白多肽僅包括對應於N蛋白多蛋白或其片段之胺基酸序列。
在某些實施例中,N蛋白多肽具有包含以下、基本上由以下組成或由以下組成的胺基酸序列:表1K中闡述之N蛋白胺基酸序列之至少8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290或300個連續胺基酸。在一些實施例中,該等連續胺基酸與表1K中闡述之N蛋白之胺基酸序列一致。在一些實施例中,N多肽包含一或多個選自由以下組成之群的肽抗原決定基,基本上由該等肽抗原決定基組成,或由該等肽抗原決定基組成:表1A、表1B、表1C、表1D、表1E及/或表1F中列出之N肽抗原決定基。
在一些實施例中,本文提供M蛋白多肽及/或編碼M蛋白多肽之核酸。M蛋白多肽係包括胺基酸序列之多肽,該胺基酸序列對應於M蛋白多蛋白之胺基酸序列及/或該M蛋白胺基酸序列中具有足以引出M蛋白特异性免疫反應的長度之一部分。在某些實施例中,M蛋白多肽亦包括不對應於該胺基酸序列之胺基酸(例如,包含M蛋白胺基酸序列及對應於非M蛋白或多肽之胺基酸序列之融合蛋白)。在一些實施例中,M蛋白多肽僅包括對應於N蛋白多蛋白或其片段之胺基酸序列。
在某些實施例中,M蛋白多肽具有包含以下、基本上由以下組成或由以下組成的胺基酸序列:表1K中闡述之M蛋白胺基酸序列之至少8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210或220個連續胺基酸。在一些實施例中,該等連續胺基酸與表1K中闡述之M蛋白之胺基酸序列一致。在一些實施例中,M多肽包含一或多個選自由以下組成之群的肽抗原決定基,基本上由該等肽抗原決定基組成,或由該等肽抗原決定基組成:表1A、表1B、表1C、表1D、表1E及/或表1F中列出之M肽抗原決定基。
在一些實施例中,本文提供orf3a多肽及/或編碼orf3a多肽之核酸。Orf3a多肽係包括胺基酸序列之多肽,該胺基酸序列對應於orf3a多蛋白之胺基酸序列及/或該orf3a胺基酸序列中具有足以引出orf3a特异性免疫反應的長度之一部分。在某些實施例中,orf3a多肽亦包括不對應於該胺基酸序列之胺基酸(例如,包含orf3a胺基酸序列及對應於非orf3a蛋白或多肽之胺基酸序列之融合蛋白)。在一些實施例中,orf3a多肽僅包括對應於orf3a多蛋白或其片段之胺基酸序列。
在某些實施例中,orf3a多肽具有包含以下、基本上由以下組成或由以下組成的胺基酸序列:表1K中闡述之orf3a胺基酸序列之至少8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260或270個連續胺基酸。在一些實施例中,該等連續胺基酸與表1K中闡述之orf3a蛋白之胺基酸序列一致。在一些實施例中,orf3a多肽包含一或多個選自由以下組成之群的肽抗原決定基,基本上由該等肽抗原決定基組成,或由該等肽抗原決定基組成:表1A、表1B、表1C、表1D、表1E及/或表1F中列出之orf3a肽抗原決定基。
在一些實施例中,本文提供orf7a多肽及/或編碼orf7a多肽之核酸。Orf7a多肽係包括胺基酸序列之多肽,該胺基酸序列對應於orf7a多蛋白之胺基酸序列及/或該orf7a胺基酸序列中具有足以引出orf7a特异性免疫反應的長度之一部分。在某些實施例中,orf7a多肽亦包括不對應於該胺基酸序列之胺基酸(例如,包含orf7a胺基酸序列及對應於非orf7a蛋白或多肽之胺基酸序列之融合蛋白)。在一些實施例中,orf7a多肽僅包括對應於orf7a多蛋白或其片段之胺基酸序列。
在某些實施例中,orf7a多肽具有包含以下、基本上由以下組成或由以下組成的胺基酸序列:表1K中闡述之orf7a胺基酸序列之至少8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110或120個連續胺基酸。在一些實施例中,該等連續胺基酸與表1K中闡述之orf7a蛋白之胺基酸序列一致。在一些實施例中,orf7a多肽包含一或多個選自由以下組成之群的肽抗原決定基,基本上由該等肽抗原決定基組成,或由該等肽抗原決定基組成:表1A、表1B、表1C、表1D、表1E及/或表1F中列出之orf7a肽抗原決定基。
如熟習此項技術者所熟知,具有顯著序列相似性之多肽可在宿主動物中引起一致或非常相似的免疫反應。因此,在一些實施例中,本文所述之SARS-CoV-2免疫原性肽或其片段之衍生物、等效物、變異體、片段或突變體亦可適用於本文所提供之方法及組合物。
在一些實施例中,本文提供SARS-CoV-2免疫原性多肽之變化形式或衍生物。改變之多肽可具有例如藉由保守取代改變之胺基酸序列,但仍然引出與未改變蛋白抗原反應之免疫反應,且被視為功能等效物。如本文所使用,術語「保守取代」表示胺基酸殘基由另一生物學相似殘基置換。此項技術中已熟知,同一保守基團內之胺基酸通常可彼此替代而不實質上影響蛋白質之功能。根據某些實施例,SARS-CoV-2免疫原性肽之配位體結合域之衍生物、等效物、變異體或突變體係與本文所述之SARS-CoV-2免疫原性肽或其片段之序列至少85%同源的多肽。在一些實施例中,同源性為至少90%、至少95%、至少98%或更高。
本發明所涵蓋之免疫原性肽可包含源自SARS-CoV-2蛋白之肽抗原決定基,諸如表1A、表1B、表1C、表1D、表1E及/或表1F中列出之彼等肽抗原決定基。在一些實施例中,免疫原性肽為8、9、10、11、12、13、14或15個胺基酸長。在一些實施例中,肽胺基酸序列係經修飾,其可包括保守或非保守突變。肽可包含至多1、2、3、4個或更多個突變。在一些實施例中,肽可包含至少1、2、3、4個或更多個突變。
在一些實施例中,肽可經化學修飾。舉例而言,可使肽發生突變以修飾肽特性,諸如可偵測性、穩定性、生物分佈、藥物動力學、半衰期、表面電荷、疏水性、結合位點、pH、功能及其類似特性。N-甲基化係可在本發明所涵蓋之肽中發生的甲基化之一個實例。在一些實施例中,可藉由對游離胺進行甲基化,諸如藉由用甲醛及氰基硼氫化鈉進行還原甲基化來修飾肽。
化學修飾可包含聚合物、聚醚、聚乙二醇、生物聚合物、兩性離子聚合物、聚胺基酸、脂肪酸、樹枝狀聚合物、Fc區、簡單飽和碳鏈(諸如棕櫚酸酯或肉豆蔻酸酯)或白蛋白。具有Fc區之肽之化學修飾可為融合Fc-肽。聚胺基酸可包括例如具有重複之單個胺基酸之聚胺基酸序列(例如聚甘胺酸),及具有可遵循或可不遵循模式之混合聚胺基酸序列之聚胺基酸序列,或前述的任何組合。在一些實施例中,本發明所涵蓋之肽可經修飾,使得該修飾增加肽之穩定性及/或半衰期。在一些實施例中,可使用疏水部分之附接(諸如至N端、C端或內部胺基酸)來延長本發明所涵蓋之肽的半衰期。在其他實施例中,肽可包括轉譯後修飾(例如,甲基化及/或醯胺化),其可影響例如血清半衰期。在一些實施例中,簡單碳鏈(例如,藉由肉豆蔻醯化及/或棕櫚醯化)可與融合蛋白或肽結合。在一些實施例中,簡單碳鏈可使融合蛋白或肽易於與未結合材料分離。舉例而言,可用於使融合蛋白或肽與未結合材料分離之方法包括但不限於溶劑萃取及逆相層析。親脂部分可經由與血清白蛋白可逆結合來延長半衰期。經結合部分可為經由與血清白蛋白可逆結合來延長肽之半衰期的親脂部分。在一些實施例中,親脂部分可為膽固醇或膽固醇衍生物,包括膽甾烯、膽甾烷、膽甾二烯及氧化膽固醇。在一些實施例中,肽可與肉豆蔻酸(十四酸)或其衍生物結合。在其他實施例中,肽可與半衰期修飾劑偶合(例如,結合)。半衰期修飾劑之實例包括但不限於:聚合物,聚乙二醇(PEG),羥乙基澱粉,聚乙烯醇,水溶性聚合物,兩性離子水溶性聚合物,水溶性聚(胺基酸),脯胺酸、丙胺酸及絲胺酸之水溶性聚合物,含有甘胺酸、麩胺酸及絲胺酸之水溶性聚合物,Fc區,脂肪酸,棕櫚酸,或與白蛋白結合之分子。在一些實施例中,間隔子或連接子可偶合至肽,諸如1、2、3、4個或更多個用作間隔子或連接子之胺基酸殘基,以便促進與另一分子之結合或融合,以及促進肽自此類結合或融合分子裂解。在一些實施例中,融合蛋白或肽可與例如可修飾或影響肽之特性之變化的其他部分結合。
肽可與用於成像、研究、治療、治療診斷學、醫藥學、化學療法、螯合療法、靶向藥物遞送及放射療法之劑結合。在一些實施例中,肽可與可偵測劑結合或融合,該等劑諸如螢光團、近紅外染料、對比劑、奈米粒子、含金屬奈米粒子、金屬螯合物、X射線對比劑、PET劑、金屬、放射性同位素、染料、放射性核素螯合劑或可用於成像之另一合適材料。在一些實施例中,1、2、3、4、5、6、7、8、9、10個或更多個可偵測部分可連接至肽。放射性同位素之非限制性實例包括α發射體、β發射體、正電子發射體及γ發射體。在一些實施例中,金屬或放射性同位素係選自由以下組成之群:錒、鋂、鉍、鎘、銫、鈷、銪、釓、銥、鉛、鑥、錳、鈀、釙、鐳、釕、釤、鍶、鎝、鉈及釔。在一些實施例中,金屬為錒、鉍、鉛、鐳、鍶、釤或釔。在一些實施例中,放射性同位素為錒-225或鉛-212。在一些實施例中,近紅外染料不容易由生物組織及流體淬滅。在一些實施例中,螢光團係發射波長在650 nm與4000 nm之間的電磁輻射之螢光劑,此類發射係用於偵測此類劑。可用作結合分子之螢光染料之非限制性實例包括DyLight-680、DyLight-750、VivoTag-750、DyLight-800、IRDye-800、VivoTag-680、Cy5.5、ZQ800或靛青綠(ICG)。在一些實施例中,近紅外染料通常包括花青染料(例如,Cy7、Cy5.5及Cy5)。用作本發明所涵蓋之結合分子的螢光染料之額外非限制性實例包括吖啶橙或吖啶黃、Alexa Fluor (例如,Alexa Fluor 790、750、700、680、660及647)及其任何衍生物、7-放線菌素D、8-苯胺基萘-1-磺酸、ATTO染料及其任何衍生物、金胺-若丹明染色劑及其任何衍生物、苯蒽酮(bensantrhone)、比曼恩(bimane)、9-10-雙(苯基乙炔基)蒽、5,12-雙(苯基乙炔基)萘、雙苯甲醯亞胺、腦彩虹、鈣黃綠素、羧基螢光素(carbodyfluorescein)及其任何衍生物、1-氯-9,10-雙(苯基乙炔基)蒽及其任何衍生物、DAPI、DiOC6、DyLight Fluor及其任何衍生物、艾吡可酮(epicocconone)、溴化乙錠、FlAsH-EDT2、Fluodye及其任何衍生物、FluoProbe及其任何衍生物、螢光素及其任何衍生物、Fura及其任何衍生物、GelGreen及其任何衍生物、GelRed及其任何衍生物、螢光蛋白及其任何衍生物、m同型蛋白及其任何衍生物(諸如mCherry)、赫他明(hetamethine)染料及其任何衍生物、郝思特(hoeschst)染色劑、亞胺基香豆素(iminocoumarin)、印度黃、indo-1及其任何衍生物、來若丹(laurdan)、螢光黃及其任何衍生物、螢光素及其任何衍生物、螢光素酶及其任何衍生物、部花青(mercocyanine)及其任何衍生物、尼羅(nile)染料及其任何衍生物、苝、焰红染料、藻染料(phycodye)及其任何衍生物、碘化丙啶、比染因(pyranine)、若丹明及其任何衍生物、核糖綠(ribogreen)、RoGFP、紅螢烯、二苯乙烯及其任何衍生物、磺醯若丹明(sulforhodamine)及其任何衍生物、SYBR及其任何衍生物、synapto-pHluorin、四苯基丁二烯、tris四鈉、Texas Red、Titan Yellow、TSQ、繖形酮、紫蒽酮、黃色螢光蛋白及YOYO-1。其他合適螢光染料包括但不限於螢光素及螢光素染料(例如,异硫氰酸螢光素或FITC、萘基螢光素、4', 5'-二氯-2',7'-二甲氧基螢光素、6-羧基螢光素或FAM等)、羧花青、部花青、苯乙烯染料、氧雜菁染料(oxonol dye)、藻紅蛋白、紅螢素、曙紅、若丹明染料(例如,羧基四甲基-若丹明或TAMRA、羧基若丹明6G、羧基-X-若丹明(ROX)、麗絲胺若丹明B (lissamine rhodamine B)、若丹明6G、若丹明綠、若丹明紅、四甲基若丹明(TMR)等)、香豆素及香豆素染料(例如,甲氧基香豆素、二烷基胺基香豆素、羥基香豆素、胺基甲基香豆素(AMCA)等)、Oregon Green染料(例如,Oregon Green 488、Oregon Green 500、Oregon Green 514等)、Texas Red、Texas Red-X、SPECTRUM RED、SPECTRUM GREEN、花青染料(例如,CY-3、Cy-5、CY-3.5、CY-5.5等)、ALEXA FLUOR染料(例如,ALEXA FLUOR 350、ALEXA FLUOR 488、ALEXA FLUOR 532、ALEXA FLUOR 546、ALEXA FLUOR 568、ALEXA FLUOR 594、ALEXA FLUOR 633、A LEXA FLUOR 660、ALEXA FLUOR 680等)、BODIPY染料(例如,BODIPY FL、BODIPY R6G、BODIPY TMR、BODIPY TR、BODIPY 530/550、BODIPY 558/568、BODIPY 564/570、BODIPY 576/589、BODIPY 581/591、BODIPY 630/650、BODIPY 650/665等)、IRDye (例如,IRD40、IRD 700、IRD 800等)及其類似物。額外合適之可偵測劑描述於PCT/US14/56177中。放射性同位素之非限制性實例包括α發射體、β發射體、正電子發射體及γ發射體。在一些實施例中,金屬或放射性同位素係選自由以下組成之群:錒、鋂、鉍、鎘、銫、鈷、銪、釓、銥、鉛、鑥、錳、鈀、釙、鐳、釕、釤、鍶、鎝、鉈及釔。在一些實施例中,金屬為錒、鉍、鉛、鐳、鍶、釤或釔。在一些實施例中,放射性同位素為錒-225或鉛-212。
肽可與放射增敏劑或光敏劑結合。放射增敏劑之實例包括但不限於:ABT-263、ABT-199、WEHI-539、太平洋紫杉醇、卡鉑、順鉑、奧沙利鉑、吉西他濱、依他硝唑、米索硝唑、替拉扎明及核酸鹼基衍生物(例如,鹵化嘌呤或嘧啶,諸如5-氟去氧尿苷)。光敏劑之實例包括但不限於:發光時産生熱之螢光分子或珠粒、奈米粒子、卟啉及卟啉衍生物(例如,二氫卟酚、細菌綠素(bacteriochlorin)、异細菌綠素、酞青及萘酞青)、金屬卟啉、金屬酞青、白芷素、硫屬元素哌喃鹽染料(chalcogenapyrrillium dye)、葉綠素、香豆素、黃素及相關化合物(諸如咯嗪及核黃素)、富勒烯(fullerene)、去鎂葉綠素酸(pheophorbide)、焦去鎂葉綠素酸、花青(例如,部花青540)、去鎂葉綠素、藍寶石、特沙弗林(texaphyrin)、紫紅素(purpurin)、卟啉烯、吩噻嗪鎓(phenothiazinium)、亞甲藍衍生物、萘二甲醯亞胺、尼羅藍衍生物、醌類、苝醌(例如金絲桃素(hypericin)、竹紅菌素(hypocrellin)及尾孢菌素(cercosporin))、補骨脂素(psoralen)、醌類、類視色素(retinoid)、若丹明、噻吩、威爾丁(verdin)、呫噸染料(xanthene dye) (例如曙紅、紅螢素、孟加拉玫紅)、卟啉之二聚物及寡聚物形式,以及諸如5-胺基乙醯丙酸之前藥。有利地,此方法允許同時使用治療劑(例如,藥物)及電磁能(例如,輻射或光)兩者對所關注細胞(例如,免疫細胞)進行高特异性靶向。在一些實施例中,該肽與該劑融合,或與該劑共價或非共價連接,例如直接連接或經由連接子連接。
肽可諸如藉由固相肽合成或溶液相肽合成而以重組或合成方式産生。可藉由已知合成方法,諸如使用茀基甲氧羰基(Fmoc)化學或藉由丁氧羰基(Boc)化學來執行肽合成。肽片段可以酶或合成方式接合在一起。
在一些實施例中,本文提供編碼本文所述之SARS-CoV-2免疫原性多肽或其片段之核酸,諸如編碼SARS-CoV-2免疫原性肽之DNA分子。在一些實施例中,該組合物包含表現載體,該表現載體包含編碼本文所述之SARS-CoV-2免疫原性肽或其片段之開放閱讀框。在一些實施例中,該核酸包括表現開放閱讀框所必需之調控元件。此類元件可包括例如啟動子、起始密碼子、終止密碼子及聚腺苷酸化信號。另外,可包括增强子。此等元件可與編碼SARS-CoV-2免疫原性多肽或其片段之序列可操作性連接。
啟動子之實例包括但不限於來自猿病毒40 (SV40)之啟動子;小鼠乳腺腫瘤病毒(MMTV)啟動子;來自人類免疫缺乏病毒(HIV)之啟動子,諸如HIV長末端重複序列(LTR)啟動子;來自莫洛尼病毒之啟動子;來自巨細胞病毒(CMV)之啟動子,諸如CMV即刻早期啟動子;來自Epstein Barr病毒(EBV)之啟動子;來自勞斯肉瘤病毒(RSV)之啟動子;以及來自諸如人類肌動蛋白、人類肌凝蛋白、人類血紅蛋白、人類肌肉肌酸及人類金屬硫蛋白之人類基因的啟動子。合適聚腺苷酸化信號之實例包括但不限於SV40聚腺苷酸化信號及LTR聚腺苷酸化信號。
除了表現所需之調控元件以外,核酸分子中亦可包括其他元件。此類額外元件包括增强子。增强子包括上文所述之啟動子。較佳增强子/啟動子包括例如人類肌動蛋白、人類肌凝蛋白、人類血紅蛋白、人類肌肉肌酸及病毒增强子,諸如來自CMV、RSV及EBV之彼等增强子/啟動子。
在一些實施例中,可單獨使用核酸(例如,呈裸核酸形式)或如下文進一步描述,將核酸可操作性併入載劑或遞送載體中。可用遞送載體包括但不限於生物可降解微膠囊、免疫刺激複合物(ISCOM)或脂質體以及經遺傳工程改造之减毒活載劑,諸如病毒或細菌。
在一些實施例中,載體為病毒載體,諸如慢病毒、逆轉錄病毒、疱疹病毒、腺病毒、腺相關病毒、痘瘡病毒、桿狀病毒、鷄痘(Fowl pox)病毒、禽痘(AV-pox)病毒、經修飾安卡拉痘瘡(MVA)病毒及其他重組病毒。舉例而言,慢病毒載體可用於感染T細胞。
III. 核酸、載體及細胞
本發明之另一目的係關於編碼所述之免疫原性多肽、SARS-CoV-2免疫原性肽及其片段、MHC分子以及TCR及其片段的核酸序列。在一些態樣中,本文揭示藉由包裝於用於細胞內抗原表現之最佳免疫顯性抗原決定基中而使載體尺寸對T細胞反應功效增至最大的核酸載體構築體。一般而言,如下文進一步描述,本發明所涵蓋之核酸(無論裸核酸抑或併入載體內)可為直接疫苗構築體(或用於製造該等構築體之載體),包括mRNA (或者產生mRNA之活體外轉錄表現載體)、用作DNA疫苗之哺乳動物表現載體及其類似物。本發明所涵蓋之核酸可出於某些目的,諸如人類個體中之高表現而經密碼子最佳化。本發明所涵蓋之核酸可經工程改造以具有高鳥嘌呤及胞嘧啶(G-C)含量,諸如至少約60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高一致性或者其間任何範圍(包括其),諸如60-70% G-C含量。
在一特定實施例中,本發明係關於一種編碼本文所述之SARS-CoV-2免疫原性肽之核酸序列。在一特定實施例中,本發明係關於一種編碼本文所述之免疫原性多肽之核酸序列。
通常,該核酸為DNA (例如,cDNA)或RNA (例如,mRNA)分子,其可呈鹼性或包括於任何合適載體,諸如質體、黏質體、游離基因體、人工染色體、噬菌體、病毒或病毒載體中。
此類鹼性核酸可為「初級構築體」,諸如初級mRNA構築體,其係指編碼一或多種所關注多肽且保留足以允許轉譯其中編碼之所關注多肽之結構及/或化學特徵的聚核苷酸轉錄本。初級構築體可為本發明所涵蓋之聚核苷酸。當經結構或化學修飾時,該初級構築體可稱作經修飾核酸,諸如經修飾mRNA。除多肽編碼序列以外,核酸構築體亦可包含此項技術中熟知之序列,諸如加帽序列、拖尾序列、環化序列及其類似序列。例如,拖尾序列可介於不存在至500個核苷酸長之範圍內(例如,至少60、70、80、90、120、140、160、180、200、250、300、350、400、450或500個核苷酸)。在拖尾序列為聚腺苷酸尾時,可以聚腺苷酸結合蛋白結合為單位或隨聚腺苷酸結合蛋白結合而變來確定長度。在此實施例中,聚腺苷酸尾足夠長以結合至少4個聚腺苷酸結合蛋白單體。聚腺苷酸結合蛋白單體與大約38個核苷酸之延伸段結合。因而,已觀察到約80個核苷酸及160個核苷酸之聚腺苷酸尾具功能性。加帽區可包含單一帽或形成該帽之一系列核苷酸。在此實施例中,加帽區可為1至10個(例如,2-9、3-8、4-7、1-5、5-10個或至少2個或10個或更少個核苷酸長)。在一些實施例中,該帽不存在。因此,本發明所涵蓋之核酸可因此包含2至40個或更多個(例如,2-19、2-28個等)之蛋白編碼區,且可進一步包含一或多個本文所述之額外元件,諸如起始及/或終止密碼子、轉譯序列、內部核糖體進入序列、蛋白裂解序列、信號序列、加帽序列、拖尾序列、限制序列、自複製序列及其類似元件。在一些實施例中,本發明所涵蓋之核酸可諸如經由此項技術中熟知之化學、酶及/或核酶催化方式經環化及/或多聯體化。新近形成之5'-/3'-鍵聯可為分子內或分子間的。
在一些實施例中,本發明所涵蓋之核酸係自複製的,諸如自複製RNA,如mRNA。RNA之大量產生具有成本效益且可由來自商業合成之DNA前驅體之任何既定的已發現序列以幾乎同一天快速性產生,而無內毒素。它一般比DNA更安全且更容易投與,因為它不會造成基因組整合風險,且僅需要進入細胞質即可起作用。此外,由於基於α病毒或黃病毒基因組可獲得自複製RNA (repRNA),可使用極低劑量來實現最大免疫原性及抗原產生水準。在一些實施例中,repRNA係缺乏後代病毒粒子之產生所需的病毒結構蛋白之減毒病毒基因組,但保留轉譯及複製能力且因此可有效增加RNA轉譯之半衰期。舉例而言,相對於將等莫耳量之編碼一或多種外源基因之習知mRNA遞送至細胞所產生的轉譯及表現,將編碼一或多種外源基因之RepRNA遞送至細胞可以有效地增加該等外源基因在該等細胞中之轉譯及表現。在一些實施例中,RepRNA為非致細胞病變性RepRNA。在一些實施例中,repRNA為α病毒自擴增repRNA (例如,包括5'帽;5'非轉譯區(5' UTR)、在第一開放閱讀框內編碼之非結構基因(例如,NSP1-4)、基因組啟動子區(例如,26S亞基因組啟動子)、第二開放閱讀框、3'非轉譯區(3' UTR)及3'聚腺苷酸化尾。repRNA分子通常在9,000與20,000個核苷酸之間長,視經編碼基因序列之尺寸而定)。非結構基因編碼RNA依賴性RNA聚合酶(RdRp)。通常,RdRp不耐受用於保護習知RNA免受核酸內切酶及自催化降解之經典核苷酸修飾。因此,奈米囊封(例如,奈米粒子、脂質、脂質奈米粒子、陽離子分子、聚合物及其類似物)可用於表現平台之有效部署。repRNA係模塊化的且開放閱讀框可經工程改造以適應所關注之外源序列。當repRNA沈積於宿主細胞之細胞質中時,由repRNA NS基因編碼之RNA依賴性RNA聚合酶(RdRp)在該細胞內表現。該RdRp接著可複製整個repRNA,或者僅複製repRNA編碼抗原之RdRp複本(亦即,藉助於亞基因組啟動子)。複製子RNA增加RNA介導之基因遞送的總體效率,因為repRNA可合成全長複製子之更多複本,以及編碼包括於第二開放閱讀框內之基因的mRNA之更多複本。宿主細胞核糖體繼續轉譯全長複製子複本或較短的僅抗原mRNA,導致增強由repRNA編碼之基因之表現。
為了進一步增強蛋白質產生,可將本發明所涵蓋之核酸設計為與其他聚核苷酸、染料、嵌入劑(例如,吖啶)、交聯劑(例如,補骨脂素及絲裂黴素C)、卟啉(TPPC4、特沙弗林及藍寶石)、多環芳烴(例如,啡嗪及二氫啡嗪)、人工核酸內切酶(例如,EDTA)、烷基化劑、磷酸鹽、胺基、巰基、PEG (例如,PEG-40K)、MPEG、MPEG
2、聚胺基、烷基、經取代烷基、經放射性標記之標記物、酶、半抗原(例如,生物素)、轉運/吸收促進劑(例如,阿司匹靈、維生素E及葉酸)、合成核糖核酸酶、蛋白質(例如,醣蛋白)或肽(例如,對共配位體具有特定親和力之分子)或抗體(例如,與諸如癌細胞、內皮細胞或骨細胞之特定細胞類型結合的抗體)、激素及激素受體及/或非肽物質(例如,脂質、凝集素、碳水化合物、維生素、輔因子及藥物)結合。本發明所涵蓋之核酸的代表性實例描述於本文中,諸如工作實例及圖中,且係此項技術中熟知的(至少參見美國專利公開案2020/0354423、美國專利公開案2020/0254086及美國專利公開案2020/0155660)。
術語「載體」、「選殖載體」及「表現載體」意謂藉由該媒劑可將DNA或RNA序列(例如,外來基因)引入至宿主細胞中,以便轉化宿主且促進所引入序列之表現(例如,轉錄及轉譯)。因此,本發明所涵蓋之另一目的係關於一種包含本發明所涵蓋之核酸的載體。
此類載體可包含調控元件,諸如啟動子、增强子、終止子及其類似物,以在向個體投與後引起或引導該多肽之表現。用於動物細胞表現載體之啟動子及增强子的實例包括SV40之早期啟動子及增强子(Mizukami T等人 1987)、莫洛尼小鼠白血病病毒之LTR啟動子及增强子(Kuwana Y等人 1987)、免疫球蛋白H鏈之啟動子(Mason J O等人 1985)及增强子(Gillies S D等人 1983)及其類似物。
可使用任何動物細胞表現載體。合適載體之實例包括pAGE107 (Miyaji H等人 1990)、pAGE103 (Mizukami T等人 1987)、pHSG274 (Brady G等人 1984)、pKCR (O'Hare K等人 1981)、pSG1 β d2-4-(Miyaji H等人 1990)及其類似物。質體之其他代表性實例包括包含複製起點之複製質體,或整合質體,諸如pUC、pcDNA、pBR及其類似物。病毒載體之代表性實例包括腺病毒、逆轉錄病毒、疱疹病毒及AAV載體。此類重組病毒可藉由此項技術中已知的技術産生,諸如藉由轉染包裝細胞或藉由用輔助質體或病毒瞬時轉染產生。病毒包裝細胞之典型實例包括PA317細胞、PsiCRIP細胞、GPenv陽性細胞、293細胞等。用於産生此類複製缺陷型重組病毒之詳細方案可見於例如WO 95/14785、WO 96/22378、美國專利第5,882,877號、美國專利第6,013,516號、美國專利第4,861,719號、美國專利第5,278,056號及WO 94/19478中。在一些實施例中,可使用基於病毒載體之平台。代表性、非限制性實例包括牛痘、禽痘、自複製α病毒、馬拉巴病毒、腺病毒及慢病毒,包括但不限於第二、第三或雜交第二/第三代慢病毒以及經設計以靶向特定細胞類型或受體之任一代重組慢病毒(至少參見Hu等人 (2011)
Immunol Rev.239:45-61,Sakuma等人 (2012)
Biochem J.443:603-618,Cooper等人 (2015)
Nucl. Acids Res.43:682-690,Zufferey等人 (1998)
J. Virol.72:9873-9880,及美國專利公開案2020/0010849)。
本發明之另一目的係關於一種已由根據本發明之核酸及/或載體轉染、感染或轉化之細胞。術語「轉化」意謂將「外來」(亦即,外部或細胞外)基因、DNA或RNA序列引入宿主細胞,使得宿主細胞將表現所引入之基因或序列,從而産生所需物質,通常為由所引入之基因或序列編碼之蛋白質或酶。接收且表現所引入之DNA或RNA之宿主細胞已「經轉化」。
本發明所涵蓋之核酸可用於在合適表現系統中産生本發明所涵蓋之重組多肽。術語「表現系統」意謂在合適條件下之宿主細胞及相容性載體,例如用於表現由載體所携帶且引入至宿主細胞之外來DNA編碼之蛋白質。
常見表現系統包括大腸桿菌宿主細胞及質體載體、昆蟲宿主細胞及桿狀病毒載體以及哺乳動物宿主細胞及載體。宿主細胞之其他實例包括但不限於原核細胞(諸如細菌)及真核細胞(諸如酵母細胞、哺乳動物細胞、昆蟲細胞、植物細胞等)。特定實例包括大腸桿菌;克魯維酵母屬(
Kluyveromyces)或酵母屬(
Saccharomyces)酵母;哺乳動物細胞株(例如,Vero細胞、CHO細胞、3T3細胞、COS細胞等);以及初代或所建立之哺乳動物細胞培養物(例如,由淋巴母細胞、纖維母細胞、胚胎細胞、上皮細胞、神經細胞、脂肪細胞等産生)。實例亦包括小鼠SP2/0-Ag14細胞(ATCC CRL1581)、小鼠P3X63-Ag8.653細胞(ATCC CRL1580)、二氫葉酸還原酶基因(下文稱為「DHFR基因」)缺陷型CHO細胞(Urlaub G等人;1980)、大鼠YB2/3HL.P2.G11.16Ag.20細胞(ATCC CRL 1662,下文稱為「YB2/0細胞」)及其類似細胞。YB2/0細胞為較佳的,因為當在此細胞中表現時,嵌合或人源化抗體之ADCC活性有所增强。
本發明亦係關於一種根據本發明産生表現本發明所涵蓋之SARS-CoV-2免疫原性肽及其片段、MHC分子以及TCR及其片段之重組宿主細胞的方法,該方法包含由以下組成之步驟:(i)將如上文所述之重組核酸或載體活體外或離體引入至勝任宿主細胞中,(ii)活體外或離體培養所獲得的重組宿主細胞,及(iii)視情況,選擇表現該等SARS-CoV-2免疫原性肽及其片段、MHC分子以及TCR及其片段之細胞。此類重組宿主細胞可用於本發明所涵蓋之診斷、預後及/或治療方法。
在另一態樣中,本發明提供在選擇性雜交條件下與本文所揭示之聚核苷酸雜交的經分離核酸。因此,此實施例之聚核苷酸可用於分離、偵測及/或定量包含此類聚核苷酸之核酸。舉例而言,本發明所涵蓋之聚核苷酸可用於鑑別、分離或擴增寄存文庫中之部分或全長純系。在一些實施例中,該等聚核苷酸係自人類或哺乳動物核酸文庫分離或以其他方式與來自該文庫之cDNA互補的基因組序列或cDNA序列。較佳地,cDNA文庫包含至少80%之全長序列,較佳地至少85%或90%之全長序列,且更佳地至少95%之全長序列。可使該等cDNA文庫標準化以增加稀有序列之表示。低嚴格度或中等嚴格度雜交條件通常但非排他地用於相對於互補序列具有降低之序列一致性的序列。中等嚴格度及高嚴格度條件可視情況用於具更高一致性之序列。低嚴格度條件允許選擇性雜交具有約70%序列一致性之序列,且可用於鑑別異種同源或同種同源序列。視情況,本發明所涵蓋之聚核苷酸將編碼由本文所述之聚核苷酸編碼的抗體之至少一部分。本發明所涵蓋之聚核苷酸包括可用於與編碼本發明所涵蓋之抗體之聚核苷酸選擇性雜交的核酸序列。參見例如Ausubel, 同上;Colligan, 同上,各自完整地以引用之方式併入本文中。
IV. MHC- 肽複合物
在某些態樣中,本文提供包含本文所述之SARS-CoV-2免疫原性肽及MHC分子之組合物。在一些實施例中,SARS-CoV-2免疫原性肽與MHC分子形成穩定複合物。
在本發明所涵蓋之組合物及方法中提供且使用之MHC蛋白可為此項技術中已知的任何合適MHC分子。一般而言,該等分子具有式(α-β-P)
n,其中n至少為2,例如在2-10之間,例如4。α為I類或II類MHC蛋白之α鏈。β係本文中定義為II類MHC蛋白之β鏈或MHC I類蛋白之β
2微球蛋白的β鏈。P為肽抗原。
在一些實施例中,MHC蛋白為MHC I類複合物,諸如HLA I複合物。
MHC蛋白可來自任何哺乳動物或鳥類物種,例如靈長類物種,尤其人類;嚙齒動物,包括小鼠、大鼠及倉鼠;兔;馬、牛、犬、猫等。舉例而言,MHC蛋白可源自人類HLA蛋白或鼠科動物H-2蛋白。HLA蛋白包括II類亞單元HLA-DPα、HLA-DPβ、HLA-DQα、HLA-DQβ、HLA-DRα及HLA-DRβ,及I類蛋白HLA-A、HLA-B、HLA-C,以及β2-微球蛋白。H-2蛋白包括I類亞單元H-2K、H-2D、H-2L,及II類亞單元I-Aα、I-Aβ、I-Eα及I-Eβ,以及β2-微球蛋白。一些代表性MHC蛋白之序列可見於Kabat等人 Sequences of Proteins of Immunological Interest, NIH公開案第91-3242號, 第724-815頁中。適合根據本發明使用之MHC蛋白亞單元係正常膜結合蛋白之可溶性形式,其如此項技術中已知來製備,例如藉由跨膜域及細胞質域之缺失來製備。
對於I類蛋白,可溶性形式可包括α1、α2及α3域。可溶性II類亞單元可包括α亞單元之α1及α2域,以及β亞單元之β1及β2域。
α及β亞單元可分開産生且允許活體外締合以形成穩定异源雙股複合物,或兩個亞單元可在單一細胞中表現。用於産生MHC亞單元之方法係此項技術中已知的。
在某些實施例中,MHC-肽複合物包含選自表1A之肽抗原決定基以及α鏈具有HLA-A*02血清型的MHC,諸如由HLA-A*0201、HLA-A*0202、HLA-A*0203、HLA-A*0204、HLA-A*0205、HLA-A*0206、HLA-A*0207、HLA-A*0210、HLA-A*0211、HLA-A*0212、HLA-A*0213、HLA-A*0214、HLA-A*0216、HLA-A*0217、HLA-A*0219、HLA-A*0220、HLA-A*0222、HLA-A*0224、HLA-A*0230、HLA-A*0242、HLA-A*0253、HLA-A*0260及/或HLA-A*0274等位基因編碼之MHC。在其他實施例中,MHC-肽複合物包含選自表1C之肽抗原決定基以及α鏈具有HLA-A*03血清型之MHC,諸如由HLA-A*0301、HLA-A*0302、HLA-A*0305及/或HLA-A*0307等位基因編碼之MHC。在其他實施例中,MHC-肽複合物包含選自表1B之肽抗原決定基以及α鏈具有HLA-A*01血清型之MHC,諸如由HLA-A*0101、HLA-A*0102、HLA-A*0103及/或HLA-A*0116等位基因編碼之MHC。在其他實施例中,MHC-肽複合物包含選自表1D之肽抗原決定基以及α鏈具有HLA-A*11血清型之MHC,諸如由HLA-A*1101、HLA-A*1102、HLA-A*1103、HLA-A*1104、HLA-A*1105及/或HLA-A*1119等位基因編碼之MHC。在其他實施例中,MHC-肽複合物包含選自表1E之肽抗原決定基以及α鏈具有HLA-A*24血清型之MHC,諸如由HLA-A*2402、HLA-A*2403、HLA-A*2405、HLA-A*2407、HLA-A*2408、HLA-A*2410、HLA-A*2414、HLA-A*2417、HLA-A*2420、HLA-A*2422、HLA-A*2425、HLA-A*2426及/或HLA-A*2458等位基因編碼之MHC。在其他實施例中,MHC-肽複合物包含選自表1F之肽抗原決定基以及α鏈具有HLA-B*07血清型之MHC,諸如由HLA-B*0702、HLA-B*0704、HLA-B*0705、HLA-B*0709、HLA-B*0710、HLA-B*0715及/或HLA-B*0721等位基因編碼之MHC。
為了製備MHC-肽複合物,該等亞單元可與抗原肽組合,且允許活體外折疊以形成具有鏈內二硫鍵鍵結域之穩定异源二聚體複合物。肽可包括於初始折疊反應中,或可在隨後步驟中添加至空的异源二聚體中。在本發明所涵蓋之組合物及方法中,此肽為SARS-CoV-2免疫原性肽或其片段。允許亞單元及肽之折疊及締合之條件係此項技術中已知的。作為一個實例,可將大致等莫耳量之經溶解α及β亞單元混合在脲溶液中。藉由稀釋或透析至不含脲之經緩衝溶液中來起始再折疊。可在約pH 5至5.5下將肽裝載至空的II類异源二聚體中持續約1至3天,接著進行中和、濃縮及緩衝液交換。然而,特定折疊條件對於本發明之實踐并非關鍵的。
單體複合物(α-β-P) (本文為單體)可經多聚化,例如MHC四聚體。所得多聚體在較長時段內穩定。較佳地,可藉由使單體經由α或β亞單元上之特定附接位點與多價實體結合來形成多聚體,如此項技術中已知(例如,如美國專利第5,635,363號中所述)。無論單體形式抑或多聚體形式,MHC蛋白亦可與珠粒或任何其他支撐物結合。
多聚體複合物可經標記,以便在用於免疫染色或此項技術中已知之其他方法時可直接進行偵測,或可如此項技術中已知與特异性結合該複合物(例如,與MHC蛋白亞單元結合)之第二經標記免疫試劑聯合使用。舉例而言,可偵測標記可為螢光團,諸如异硫氰酸螢光素(FITC)、若丹明、Texas Red、藻紅蛋白(PE)、異藻藍蛋白(APC)、Brilliant Violet™ 421、Brilliant UV
TM395、Brilliant Violet
TM480、Brilliant Violet
TM421 (BV421)、Brilliant Blue
TM515、APC-R700或APC-Fire750。在一些實施例中,多聚體複合物由能够特异性結合另一部分之部分標記。舉例而言,標記可為生物素、卵白素、寡核苷酸或配位體。其他所關注標記可包括螢光染料、染料、酶、化學發光劑、粒子、放射性同位素或其他直接或間接可偵測劑。
在一些實施例中,藉由用包含將重組或异源抗原編碼至細胞中之核酸的載體(例如,病毒載體)轉染或轉導細胞來産生在MHC分子之背景中將免疫原性肽呈遞於細胞表面上之細胞。在一些實施例中,該載體係在如下條件下引入至該細胞中,其中一或多種肽抗原(在一些情况下,包括經表現异源蛋白之一或多種肽抗原)在主要組織相容性複合物(MHC)分子之背景中由該細胞表現、經加工且呈遞於細胞表面上。
一般而言,與載體接觸之細胞係表現MHC之細胞,亦即MHC表現細胞。該細胞可為如下細胞,其通常在細胞表面上表現MHC,經誘導在細胞表面上表現MHC及/或上調MHC表現,或經工程改造以在細胞表面上表現MHC分子。在一些實施例中,MHC含有在一些情况下可與多肽之肽抗原複合的多型性肽結合位點或結合槽,該等肽抗原包括由細胞機制加工之肽抗原。在一些情况下,MHC分子可在細胞表面上呈現或表現,包括呈肽複合物,亦即MHC-肽複合物之形式,從而呈遞呈可由T細胞上之TCR或其他肽結合分子識別的構形之抗原。
在一些實施例中,細胞為有核細胞。在一些實施例中,細胞為抗原呈遞細胞。在一些實施例中,細胞為巨噬細胞、樹突狀細胞、B細胞、內皮細胞或纖維母細胞。在一些實施例中,細胞為內皮細胞,諸如內皮細胞株或原代內皮細胞。在一些實施例中,細胞為纖維母細胞,諸如纖維母細胞細胞株或原代纖維母細胞。
在一些實施例中,細胞為人工抗原呈遞細胞(aAPC)。通常,aAPC包括天然APC之特徵,包括表現MHC分子、刺激及共刺激分子、Fc受體、黏附分子及/或産生或分泌細胞介素(例如,IL-2)之能力。通常,aAPC係缺乏上述一或多者之表現的細胞株,且藉由引入(例如,藉由轉染或轉導)以下一或多者而產生:MHC分子中缺失之元件、低親和力Fc受體(CD32)、高親和力Fc受體(CD64)、一或多個共刺激信號(例如,CD7、B7-1 (CD80)、B7-2 (CD86)、PD-L1、PD-L2、4-1BBL、OX40L、ICOS-L、ICAM、CD30L、CD40、CD70、CD83、HLA-G、MICA、MICB、HVEM、淋巴毒素β受體、ILT3、ILT4、3/TR6或B7-H3配位體;或與CD27、CD28、4-1BB、OX40、CD30、CD40、PD-1、ICOS、LFA-1、CD2、CD7、LIGHT、NKG2C、B7-H3、Toll配位體受體或CD83配位體特异性結合之抗體)、細胞黏附分子(例如,ICAM-1或LFA-3)及/或細胞介素(例如,IL-2、IL-4、IL-6、IL-7、IL-10、IL-12、IL-15、IL-21、干擾素-α (IFNα)、干擾素-β (IFNβ)、干擾素-γ (IFNγ)、腫瘤壞死因子-α (TNFα)、腫瘤壞死因子-β (TNFβ)、顆粒球巨噬細胞群落刺激因子(GM-CSF)及顆粒球群落刺激因子(GCSF))。在一些情况下,aAPC通常不表現MHC分子,但可經工程改造以表現MHC分子,或者在一些情况下,經誘導或可經誘導以表現MHC分子,諸如藉由用細胞介素刺激。在一些情况下,aAPC亦可裝載有刺激配位體,該刺激配位體可包括例如抗CD3抗體、抗CD28抗體或抗CD2抗體。可用作産生aAPC之骨架之例示性細胞株為K562細胞株或纖維母細胞細胞株。各種aAPC係此項技術中已知的,參見例如美國專利第8,722,400號;公開申請案第US2014/0212446號;Butler及Hirano (2014) Immunol Rev., 257(1):10. 1111/imr.12129;Suhoshki 等人 (2007) Mol. Ther., 15:981-988)。
測定或鑑別由細胞表現之特定MHC或等位基因係充分在熟練技術人員之水準內。在一些實施例中,在使細胞與載體接觸之前,可評估或確認特定MHC分子之表現,諸如藉由使用對特定MHC分子具有特异性之抗體。MHC分子之抗體係此項技術中已知的,諸如下文所述之任何抗體。
在一些實施例中,可選擇細胞以表現所需MHC限制之MHC等位基因。在一些實施例中,細胞(諸如細胞株)之MHC分型係此項技術中已知的。在一些實施例中,可使用此項技術中熟知之程序,諸如藉由使用分子單倍型分析(BioTest ABC SSPtray, BioTest Diagnostics Corp., Denville, N.J.;SeCore Kits, Life Technologies, Grand Island, N.Y.)執行組織分型來測定細胞(諸如自個體獲得之原代細胞)之MHC分型。在一些情况下,執行標準細胞分型以諸如藉由使用基於序列之分型(SBT)來測定HLA基因型係充分在熟練技術人員之水準內(Adams等人 (2004) J. Transl. Med., 2:30;Smith (2012) Methods Mol Biol., 882:67-86)。在一些情况下,已知細胞(諸如纖維母細胞)之HLA分型。舉例而言,人類胎兒肺纖維母細胞細胞株MRC-5為HLA-A*0201、A29、B13、B44 Cw7 (C*0702);人類包皮纖維母細胞細胞株Hs68為HLA-A1、A29、B8、B44、Cw7、Cw16;且WI-38細胞株為A*6801、B*0801 (Solache等人 (1999) J Immunol, 163:5512-5518;Ameres等人 (2013) PloS Pathog. 9:e1003383)。人類轉染子纖維母細胞細胞株M1DR1/Ii/DM表現HLA-DR及HLA-DM (Karakikes等人 (2012) FASEB J., 26:4886-96)。
在一些實施例中,與載體接觸或引入至載體之細胞係經工程改造或經轉染以表現MHC分子之細胞。在一些實施例中,可藉由遺傳修飾親本細胞株來製備細胞株。在一些實施例中,細胞通常缺乏特定MHC分子且經工程改造以表現此類特定MHC分子。在一些實施例中,使用重組DNA技術對細胞進行遺傳工程改造。
在一些實施例中,使用本文所述之穩定MHC-肽複合物來偵測結合穩定MHC-肽複合物之T細胞。在一些實施例中,使用本文所述之穩定MHC-肽複合物,例如藉由偵測與經螢光標記之MHC-肽複合物特异性結合的T細胞(例如,CD8+ T細胞)之量及/或百分率來監測個體之T細胞反應。用於産生、標記及使用用於偵測MHC-肽複合物特异性T細胞之MHC-肽複合物(例如,MHC-肽四聚體)的方法係此項技術中熟知的。額外描述可見於例如美國專利第7,776,562號;美國專利第8,268,964號;及美國專利公開案第2019/0085048號,其中每一者均以引用之方式整體併入本文中。
V. 免疫原性組合物
在一些態樣中,本文提供醫藥組合物(例如,疫苗組合物),其包含SARS-CoV-2免疫原性肽及/或編碼SARS-CoV-2免疫原性肽之核酸以及佐劑。在一些態樣中,本文提供醫藥組合物(例如,疫苗組合物),其包含免疫原性多肽及/或編碼免疫原性多肽之核酸以及佐劑。在一些態樣中,本文提供包含穩定MHC-肽複合物及佐劑之醫藥組合物(例如疫苗組合物),該MHC-肽複合物在MHC分子之背景中包含SARS-CoV-2免疫原性肽。在一些實施例中,該組合物包括多種(例如,兩種或兩種以上) SARS-CoV-2免疫原性肽或核酸及佐劑之組合。在一些實施例中,該組合物包括多種(例如兩種或兩種以上)穩定MHC-肽複合物及佐劑之組合,該等穩定MHC-肽複合物在MHC分子之背景中包含SARS-CoV-2免疫原性肽。在一些實施例中,上文所述之組合物進一步包含醫藥學上可接受之載劑。
本文所揭示之醫藥組合物可特殊地經調配用於以固體或液體形式投與,包括經調適用於以下之彼等形式:(1)經口投與,例如灌服劑(水性或非水性溶液或懸浮液);錠劑,例如以經頰、舌下及全身吸收為目標之彼等錠劑;施用於舌頭之大丸劑、散劑、顆粒、糊劑;或(2)非經腸投與,例如呈例如無菌溶液或懸浮液或持續釋放調配物形式藉由皮下、肌肉內、靜脈內或硬膜外注射。
製備此等調配物或組合物之方法包括使本文所述之SARS-CoV-2免疫原性肽及/或核酸與佐劑、載劑及視情況選用的一或多種輔助成分結合的步驟。一般地,藉由以下方式來製備該等調配物:使本文所述之劑與液體載劑或精細分散之固體載劑或兩者均勻且緊密地結合,且接著必要時使產物成型。
適於非經腸投與之醫藥組合物包含本文所述之SARS-CoV-2免疫原性肽及/或核酸與佐劑以及一或多種醫藥學上可接受之無菌等滲水性或非水性溶液、分散液、懸浮液或乳液或者可能僅在使用之前重構為無菌可注射溶液或分散液的無菌粉末之組合,其可含有糖、醇、抗氧化劑、緩衝劑、抑菌劑、使調配物與預期接受者之血液等滲的溶質或者懸浮劑或增稠劑。
可用於該等醫藥組合物之合適水性及非水性載劑之實例包括水、乙醇、多元醇(諸如甘油、丙二醇、聚乙二醇及其類似物)及其合適混合物、植物油(諸如橄欖油)以及可注射有機酯(諸如油酸乙酯)。舉例而言,可藉由使用諸如卵磷脂之包衣材料,藉由在分散液之情况下維持所需粒徑,及藉由使用界面活性劑來維持適當流動性。
無論所選擇之投與途徑如何,可呈合適水合形式使用的本文所提供之劑及/或本文所揭示之醫藥組合物均係藉由熟習此項技術者已知的習知方法調配成醫藥學上可接受之劑型。
在一些實施例中,當投與至個體時,所述醫藥組合物可引出針對感染SARS-CoV-2之細胞之免疫反應。此類醫藥組合物可用作用於預防性及/或治療性治療COIVD-19之疫苗組合物。
在一些實施例中,該醫藥組合物進一步包含生理學上可接受之佐劑。在一些實施例中,所用佐劑對該醫藥組合物提供增加之免疫原性。此另一免疫反應刺激化合物或佐劑可(i)在重構肽且視情況用如上文所定義之油基佐劑乳化之後混合至根據本發明之醫藥組合物,(ii)可為上文所定義之本發明所涵蓋之重構組合物的一部分,(iii)可實體連接至待重構之肽,或(iv)可分開投與至待治療之個體、哺乳動物或人類。該佐劑可為提供抗原之緩慢釋放的佐劑(例如,該佐劑可為脂質體),或其可為自身具免疫原性,由此與抗原(亦即,存在於SARS-CoV-2免疫原性肽中之抗原)協同地起作用之佐劑。舉例而言,該佐劑可為已知佐劑,或促進抗原攝取、將免疫系統細胞募集至投與位點或促進起反應之淋巴樣細胞的免疫活化之其他物質。佐劑包括但不限於免疫調節分子(例如,細胞介素)、油及水乳液、氫氧化鋁、葡聚糖、硫酸葡聚糖、氧化鐵、褐藻酸鈉、Bacto-Adjuvant、合成聚合物(諸如聚胺基酸及胺基酸共聚物)、皂苷、石蠟油及胞壁醯二肽。在一些實施例中,該佐劑為佐劑65、α-GalCer、磷酸鋁、氫氧化鋁、磷酸鈣、β-葡聚糖肽、CpG DNA、GM-CSF、GPI-0100、IFA、IFN-γ、IL-17、脂質A、脂多糖、Lipovant、Montanide、N-乙醯基-胞壁醯基-L-丙胺醯基-D-异麩醯胺酸、Pam3CSK4、quil A、海藻糖二黴菌酸酯或酵母聚糖。
在一些實施例中,該佐劑為免疫調節分子。舉例而言,該免疫調節分子可為重組蛋白細胞介素、趨化介素或免疫刺激劑或編碼細胞介素、趨化介素或免疫刺激劑之核酸,經設計以增强免疫反應。
免疫調節細胞介素之實例包括干擾素(例如,IFNα、IFNβ及IFNγ)、介白素(例如,IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-12、IL-17及IL-20)、腫瘤壞死因子(例如,TNFα及TNFβ)、紅血球生成素(EPO)、FLT-3配位體、gIp10、TCA-3、MCP-1、MIF、MIP-1α、MIP-1β、Rantes、巨噬細胞群落刺激因子(M-CSF)、顆粒球群落刺激因子(G-CSF)及顆粒球-巨噬細胞群落刺激因子(GM-CSF),以及前述任一者之功能片段。
在一些實施例中,與趨化介素受體(亦即,CXC、CC、C或CX3C趨化介素受體)結合之免疫調節趨化介素亦可包括於此處提供之組合物中。趨化介素之實例包括但不限於Mip1α、Mip-1β、Mip-3α (Larc)、Mip-3β、Rantes、Hcc-1、Mpif-1、Mpif-2、Mcp-1、Mcp-2、Mcp-3、Mcp-4、Mcp-5、Eotaxin、Tarc、Elc、I309、IL-8、Gcp-2、Gro-α、Gro-β、Gro-γ、Nap-2、Ena-78、Gcp-2、Ip-10、Mig、I-Tac、Sdf-1及Bca-1 (Blc),以及前述任一者之功能片段。
在一些實施例中,該組合物包含編碼本文所述之SARS-CoV-2免疫原性多肽之核酸,諸如編碼SARS-CoV-2免疫原性肽之DNA分子。在一些實施例中,該組合物包含表現載體,該表現載體包含編碼SARS-CoV-2免疫原性肽之開放閱讀框。
當由細胞(例如,肌肉細胞、抗原呈遞細胞(APC),諸如樹突狀細胞、巨噬細胞等)吸收時,DNA分子可作為染色體外分子存在於細胞中及/或可整合至染色體中。DNA可呈質體形式引入至細胞中,該質體形式可保持作為獨立遺傳材料。替代地,可將可整合至染色體中之線性DNA引入至細胞中。視情況,當將DNA引入至細胞中時,可添加促進DNA整合至染色體中之試劑。
VI. 結合部分
在一些態樣中,提供一種結合部分,其結合本文所述之肽及/或本文所述之穩定MHC-肽複合物。舉例而言,提供與肽及/或穩定MHC-肽複合物特异性結合之結合蛋白,如T細胞受體(TCR)、抗體及其類似物,諸如具有小於或等於約10
-7M之K
d(例如,約10
-7、約10
-8、約10
-9、約10
10、約10
-11、約10
-12、約10
-13、約10
-14)。
在一些實施例中,MHC分子包含MHC α鏈,該MHC α鏈係選自由以下組成之群之HLA血清型:HLA-A*02、HLA-A*03、HLA-A*01、HLA-A*11、HLA-A*24及/或HLA-B*07。在一些實施例中,HLA等位基因係選自由以下組成之群:HLA-A*0201、HLA-A*0202、HLA-A*0203、HLA-A*0204、HLA-A*0205、HLA-A*0206、HLA-A*0207、HLA-A*0210、HLA-A*0211、HLA-A*0212、HLA-A*0213、HLA-A*0214、HLA-A*0216、HLA-A*0217、HLA-A*0219、HLA-A*0220、HLA-A*0222、HLA-A*0224、HLA-A*0230、HLA-A*0242、HLA-A*0253、HLA-A*0260及HLA-A*0274等位基因。在一特定實施例中,HLA等位基因為HLA-A*0201。在一些實施例中,該等結合蛋白係經遺傳工程改造、經分離及/或經純化。
在一些實施例中,本文所提供之結合蛋白包含嵌合、人類化、人類、靈長類動物或嚙齒動物(例如,大鼠或小鼠)恒定區。舉例而言,人類可變區可與鼠科動物恒定區嵌合,或鼠科動物可變區可用人類恒定區及/或人類構架區人類化。在一些實施例中,可使恒定區突變以修飾功能性(例如,在TCR α及β鏈中之相對殘基位置中引入非天然存在之半胱胺酸取代以提供可用於增加TCR α與β鏈之間的親和力之二硫鍵)。同樣,可在恒定區之跨膜域中進行突變以修飾功能性(例如,藉由用疏水性胺基酸引入非天然存在之殘基取代來增加疏水性)。
在一些實施例中,如與參考CDR序列相比,該結合蛋白之每一個CDR具有至多五個胺基酸取代、插入、缺失或其組合。
在一些實施例中,本文所揭示之結合蛋白可包含T細胞受體(TCR)、TCR之抗原結合片段或嵌合抗原受體(CAR)。在一些實施例中,本文所揭示之結合蛋白可包含兩個多肽鏈,其中每一者均包含可變區,該可變區包含TCR α鏈之CDR3及TCR β鏈之CDR3,或TCR α鏈及TCR β鏈兩者之CDR1、CDR2及CDR3。在一些實施例中,結合蛋白包含單鏈TCR (scTCR),其包含TCR V
α及TCR V
β域兩者,但僅包含單個TCR恒定域(C
α或C
β)
。術語「嵌合抗原受體」(CAR)係指一種融合蛋白,其經工程改造以含有兩個或兩個以上天然存在之胺基酸序列,該等序列以非天然存在或非天然存在於宿主細胞中之方式連接在一起,當存在於細胞表面上時,該融合蛋白可用作受體。本發明所涵蓋之CAR可包括細胞外部分,其包含抗原結合域(亦即,獲自或源自免疫球蛋白或免疫球蛋白樣分子,諸如抗體或TCR,或者源自或獲自來自NK細胞之殺手免疫受體的抗原結合域),該抗原結合域與跨膜域及一或多個細胞內信號傳導域(視情況含有共刺激域)連接(參見例如Sadelain 等人 (2013
) Cancer Discov. 3:388,Harris及Kranz (2016)
Trends Pharmacol. Sci.37:220,及Stone等人 (2014)
Cancer Immunol. Immunother.63:1163)。
在一些實施例中,本文所揭示之結合蛋白(例如,TCR、TCR之抗原結合片段或嵌合抗原受體(CAR))為嵌合的(例如,包含來自多於一個供體或物種之胺基酸殘基或基序)、人類化(例如,包含來自非人類生物體之殘基,該等殘基發生改變或經取代以降低人類之免疫原性風險)或人類的。
用於産生經工程改造之結合蛋白(諸如TCR、CAR及其抗原結合片段)之方法係此項技術中熟知的(例如Bowerman等人 (2009)
Mol. Immunol.5:3000,美國專利第6,410,319號,美國專利第7,446,191號,美國專利公開案第2010/065818號;美國專利第8,822,647號,PCT公開案第WO 2014/031687號,美國專利第7,514,537號,及Brentjens等人 (2007)
Clin. Cancer Res.73:5426)。
在一些實施例中,本文所述之結合蛋白係在細胞表面上表現之TCR或其抗原結合片段,其中如與內源性TCR相比,細胞表面表現之TCR能够更有效地與CD3蛋白締合。當在如T細胞之細胞的表面上表現時,如與內源性結合蛋白(諸如內源性TCR)相比,本發明所涵蓋之結合蛋白(諸如TCR)亦可具有細胞上之較高表面表現。在一些實施例中,本文提供一種CAR,其中CAR之結合域包含抗原特异性TCR結合域(參見例如Walseng等人 (2017)
Scientific Reports7:10713)
。
亦提供經修飾之結合蛋白(例如,TCR、TCR之抗原結合片段或CAR),其可根據熟知方法使用本文所揭示之具有一或多個V
α及/或V
β序列之結合蛋白作為起始材料對經修飾之結合蛋白進行工程改造來製備,該經修飾之結合蛋白可具有與起始結合蛋白相比發生改變的特性。可藉由修飾一個或兩個可變區(亦即,V
α及/或V
β)內,例如一或多個CDR區內及/或一或多個構架區內之一或多個殘基來對結合蛋白進行工程改造。或者或另外,可藉由修飾恒定區內之殘基來對結合蛋白進行工程改造。
另一類型之可變區修飾係使V
α及/或V
βCDR1、CDR2及/或CDR3區內之胺基酸殘基突變,由此改良所關注之結合蛋白的一或多種結合特性(例如,親和力)。可執行定點突變誘發或PCR介導之突變誘發以引入突變,且可在如本文所述及實例中所提供之活體外或活體內分析中評估對蛋白結合或其他所關注之功能特性的影響。在一些實施例中,可引入保守修飾(如上文所論述)。突變可為胺基酸取代、添加或缺失。在一些實施例中,突變為取代。此外,CDR區內之不超過一個、兩個、三個、四個或五個殘基通常經修飾。
在一些實施例中,本文所述之結合蛋白(例如,TCR、TCR之抗原結合片段或CAR)相對於天然存在之TCR可具有一或多個胺基酸取代、缺失或添加。在一些實施例中,如與參考CDR序列相比,該結合蛋白之每一個CDR具有至多五個胺基酸取代、插入、缺失或其組合。胺基酸之保守取代為熟知的,且可天然發生,或可在重組産生結合蛋白時經引入。可使用此項技術中已知之突變誘發方法將胺基酸取代、缺失及添加引入至蛋白質中(參見例如Sambrook等人 (2001)
Molecular Cloning: A Laboratory Manual, 第3版, Cold Spring Harbor Laboratory Press, NY)。可使用寡核苷酸定點特异性(或區段特异性)突變誘發程序來提供經改變聚核苷酸,該經改變聚核苷酸具有根據所需取代、缺失或插入發生改變之特定密碼子。或者,可使用隨機或飽和突變誘發技術,諸如丙胺酸掃描突變誘發、易錯聚合酶鏈反應突變誘發及寡核苷酸定向突變誘發來製備免疫原多肽變異體(參見例如Sambrook等人, 同上)。
一般技術人員已知的多種準則指示在肽或多肽中之特定位置處經取代之胺基酸是否為保守的(或相似的)。舉例而言,相似胺基酸或保守胺基酸取代係其中胺基酸殘基經具有相似側鏈之胺基酸殘基置換的取代。相似胺基酸可包括於以下類別中:具有鹼性側鏈之胺基酸(例如,離胺酸、精胺酸、組胺酸);具有酸性側鏈之胺基酸(例如,天冬胺酸、麩胺酸);具有不帶電極性側鏈之胺基酸(例如,甘胺酸、天冬醯胺、麩醯胺酸、絲胺酸、酥胺酸、酪胺酸、半胱胺酸、組胺酸);具有非極性側鏈之胺基酸(例如,丙胺酸、纈胺酸、白胺酸、異白胺酸、脯胺酸、苯丙胺酸、甲硫胺酸、色胺酸);具有β-分支鏈側鏈之胺基酸(例如,酥胺酸、纈胺酸、異白胺酸),及具有芳族側鏈之胺基酸(例如,酪胺酸、苯丙胺酸、色胺酸)。脯胺酸被視為更難以歸類,與具有脂族側鏈之胺基酸(例如,白胺酸、纈胺酸、異白胺酸及丙胺酸)共享特性。在一些實施例中,用麩醯胺酸取代麩胺酸或用天冬醯胺取代天冬胺酸可被視為相似取代,因為麩醯胺酸及天冬醯胺分別為麩胺酸及天冬胺酸之醯胺衍生物。如此項技術中應理解,藉由使多肽之胺基酸序列及其上保守胺基酸取代與第二多肽之序列進行比較來測定兩種多肽之間的「相似性」(例如,使用GENEWORKS™、Align、BLAST算法或描述於本文中且在此項技術中實踐之其他算法)。
在本文所述之實施例中的任一者中,經編碼結合蛋白(例如,TCR、TCR之抗原結合片段或CAR)可包含「信號肽」(亦稱為前導序列、前導肽或轉運肽)。信號肽使新進合成之多肽靶向其在細胞內部或外部的適當位置。在定位或分泌期間或者一旦定位或分泌已完成,可自多肽中移除信號肽。具有信號肽之多肽在本文中稱作「前蛋白」且已移除信號肽之多肽在本文中稱作「成熟」蛋白或多肽。在一些實施例中,本文所述之結合蛋白(例如,TCR、TCR之抗原結合片段或CAR)包含成熟V
α域、成熟V
β域或兩者。在一些實施例中,本文所述之結合蛋白(例如,TCR、TCR之抗原結合片段或CAR)包含成熟TCR β-鏈、成熟TCR α-鏈或兩者。
在一些實施例中,該等結合蛋白為融合蛋白,其包含:(a)包含TCR或其抗原結合片段之細胞外組分;(b)包含效應子域或其功能部分之細胞內組分;及(c)連接細胞外及細胞內組分之跨膜域。在一些實施例中,該融合蛋白能够與MHC-肽抗原複合物特异性結合,該MHC-肽抗原複合物在MHC分子(例如,MHC I類分子)之背景中包含本文所述之肽抗原決定基。
如本文所用,「效應子域」或「免疫效應子域」係融合蛋白或受體之細胞內部分或域,當接收到適當信號時,其可直接或間接促進細胞中之免疫反應。在一些實施例中,效應子域係來自免疫細胞蛋白或其部分或免疫細胞蛋白複合物,當進行結合(例如,CD3ζ)時,或當該免疫細胞蛋白或其部分或免疫細胞蛋白複合物直接與標靶分子結合且觸發免疫細胞中之效應子域之信號轉導時,該效應子域接收信號。
當效應子域含有一或多個信號傳導域或基序,諸如基於細胞內酪胺酸之活化基序(ITAM),諸如在共刺激分子中發現之彼等時,其可直接地促進細胞反應。不希望受理論束縛,咸信在T細胞受體或包含T細胞效應子域之融合蛋白與配位體銜接之後,ITAM可用於T細胞活化。在一些實施例中,細胞內組分或其功能部分包含ITAM。例示性免疫效應子域包括但不限於來自以下之彼等域:CD3ε、CD3δ、CD3ζ、CD25、CD79A、CD79B、CARD11、DAP10、FcRα、FcRβ、FcRγ、Fyn、HVEM、ICOS、Lck、LAG3、LAT、LRP、NKG2D、NOTCH1、NOTCH2、NOTCH3、NOTCH4、Wnt、ROR2、Ryk、SLAMF1、Slp76、pTα、TCRα、TCRβ、TRIM、Zap70、PTCH2或其任何組合。在一些實施例中,效應子域包含淋巴球受體信號傳導域(例如,CD3ζ或其功能部分或變異體)。
在其他實施例中,該融合蛋白之細胞內組分包含選自以下之共刺激域或其功能部分:CD27、CD28、4-1BB (CD137)、OX40 (CD134)、CD2、CD5、ICAM-l (CD54)、LFA-l (CD11a/CD18)、ICOS (CD278)、GITR、CD30、CD40、BAFF-R、HVEM、LIGHT、MKG2C、SLAMF7、NKp80、CD160、B7-H3、與CD83特異性結合之配位體或其功能變異體,或其任何組合。在一些實施例中,該細胞內組分包含CD28共刺激域或其功能部分或變異體(其可視情況包括在原生CD28蛋白之位置186-187處之LL-GG突變(例如,Nguyen等人 (2003)
Blood702:4320)、4-1BB共刺激域或其功能部分或變異體,或兩者。
在一些實施例中,效應子域包含CD3ε胞內域或其功能(例如,信號傳導)部分,或其功能變異體。在其他實施例中,效應子域包含CD27胞內域或其功能(例如,信號傳導)部分,或其功能變異體
。在其他實施例中,效應子域包含CD28胞內域或其功能(例如,信號傳導)部分,或其功能變異體
。在其他實施例中,效應子域包含4-1BB胞內域或其功能(例如,信號傳導)部分,或其功能變異體
。在其他實施例中,效應子域包含OX40胞內域或其功能(例如,信號傳導)部分,或其功能變異體
。在其他實施例中,效應子域包含CD2胞內域或其功能(例如,信號傳導)部分,或其功能變異體
。在其他實施例中,效應子域包含CD5胞內域或其功能(例如,信號傳導)部分,或其功能變異體
。在其他實施例中,效應子域包含ICAM-l胞內域或其功能(例如,信號傳導)部分,或其功能變異體
。在其他實施例中,效應子域包含LFA-l胞內域或其功能(例如,信號傳導)部分,或其功能變異體
。在其他實施例中,效應子域包含ICOS胞內域或其功能(例如,信號傳導)部分,或其功能變異體
。
本發明所涵蓋之細胞外組分及細胞內組分藉由跨膜域連接。如本文所用,「跨膜域」係跨膜蛋白中可插入至細胞膜中或橫跨細胞膜之部分。跨膜域具有三維結構,該結構在細胞膜中熱力學穩定且一般介於約15個胺基酸至約30個胺基酸之長度範圍內。跨膜域之結構可包含α螺旋、β桶、β折疊、β螺旋或其任何組合。在一些實施例中,跨膜域包含或源自已知跨膜蛋白(例如,CD4跨膜域、CD8跨膜域、CD27跨膜域、CD28跨膜域或其任何組合)。
在一些實施例中,該融合蛋白之細胞外組分進一步包含安置於結合域與跨膜域之間的連接子。如本文中當提及融合蛋白中連接結合域與跨膜域之組分時所用,「連接子」可為具有約兩個胺基酸至約500個胺基酸之胺基酸序列,其可為藉由連接子連接之兩個區域、域、基序、片段或模塊之間的構形移動提供靈活性及空間。例如,本發明所涵蓋之連接子可使結合域遠離表現該融合蛋白之宿主細胞的表面定位以使得能夠實現宿主細胞與標靶細胞之間的適當接觸、抗原結合及活化(Patel等人 (1999)
Gene Therapy6:412-419)
。連接子長度可基於所選標靶分子、所選結合抗原決定基或抗原結合域捕獲及親和力而變化以使抗原識別增至最大(參見例如Guest等人
(2005)
Immunother.28:203-11,及PCT公開案第WO 2014/031687號)。例示性連接子包括具有甘胺酸-絲胺酸胺基酸鏈之彼等連接子,該甘胺酸-絲胺酸胺基酸鏈具有一個至約十個Gly
xSer
y重複序列,其中x及y各自獨立地為0至10之整數,其限制條件在於x及y不同時為0 (例如,(Gly
4Ser)
2、(Gly
3Ser)
2、Gly
2Ser或其組合,諸如((Gly
3Ser)
2Gly
2Ser))。
在一些實施例中,本發明所涵蓋之結合部分可為經工程改造之蛋白支架、抗體或其抗原結合片段、TCR模擬抗體及其類似物。可使用常規免疫學方法針對本文所述之肽及/或MHC-肽複合物來設計及/或産生此類結合部分,該等方法諸如使宿主免疫、獲得産生抗體之細胞及/或其抗體,及産生可用於産生單株抗體之融合瘤(例如,Watt等人 (2006)
Nat. Biotechnol.24:177-183;Gebauer及Skerra (2009)
Curr. Opin. Chem Biol.13:245-255;Skerra等人 (2008)
FEBS J.275:2677-2683;Nygren等人 (2008)
FEBS J.275:2668-2676;Dana等人 (2012)
Exp. Rev. Mol. Med.14:e6;Sergeva等人 (2011)
Blood117:4262-4272;PCT公開案第WO 2007/143104號、第PCT/US86/02269號及第WO 86/01533號;美國專利第4,816,567號;Better等人 (1988)
Science240:1041-1043;Liu等人 (1987)
Proc. Natl. Acad. Sci. U.S.A.84:3439-3443;Liu等人 (1987)
J. Immunol.139:3521-3526;Sun等人 (1987)
Proc. Natl. Acad. Sci.84:214-218;Nishimura等人 (1987)
Cancer Res.47:999-1005;Wood等人 (1985)
Nature314:446-449;Shaw等人 (1988)
J. Natl. Cancer Inst.80:1553-1559);Morrison, S. L. (1985)
Science229:1202-1207;Oi等人 (1986)
Biotechniques4:214;美國專利第5,225,539號;Jones等人 (1986)
Nature321:552-525;Verhoeyan等人 (1988)
Science239:1534;及Beidler等人 (1988)
J. Immunol.141:4053-4060。必要時,可使用習知程序來分離或純化結合部分,該等程序諸如蛋白A-瓊脂糖、羥基磷灰石層析、凝膠電泳、透析、親和力層析、硫酸銨或乙醇沈澱、酸萃取、陰離子或陽離子交換層析、磷酸纖維素層析、疏水性相互作用層析、羥基磷灰石層析、凝集素層析及高效液相層析(HPLC) (例如,Current Protocols in Immunology,或者Current Protocols in Protein Science, John Wiley & Sons, NY, N.Y.)。
術語「抗體(antibody/antibodies)」廣泛涵蓋天然存在之抗體形式(例如,IgG、IgA、IgM、IgE)及重組抗體,諸如單鏈抗體、嵌合及人類化抗體以及多特异性抗體,以及所有前述抗體之片段及衍生物,該等片段及衍生物具有至少一個抗原結合位點。抗體衍生物可包含與抗體結合之蛋白質或化學部分。
此外,內抗體為熟知的抗原結合分子,其具有抗體特徵,但能够在細胞內表現以便結合及/或抑制所關注之細胞內標靶(Chen等人 (1994)
Human Gene Ther.5:595-601)。用於使抗體適於靶向(例如,抑制)細胞內部分之方法係此項技術中熟知的,諸如使用單鏈抗體(scFv)、修飾免疫球蛋白VL域以獲得超穩定性、修飾抗體以抵抗還原細胞內環境、産生增加細胞內穩定性及/或調節細胞內定位之融合蛋白及其類似方法。細胞內抗體亦可經引入且表現於多細胞生物體之一或多個細胞、組織或器官中,例如用於預防及/或治療目的(例如,作為基因療法) (至少參見PCT公開案第WO 08/020079號、第WO 94/02610號、第WO 95/22618號及第WO 03/014960號;美國專利第7,004,940號;Cattaneo及Biocca (1997)
Intracellular Antibodies: Development and Applications(Landes and Springer-Verlag publs.);Kontermann (2004)
Methods34:163-170;Cohen等人 (1998)
Oncogene17:2445-2456;Auf der Maur等人 (2001)
FEBS Lett.508:407-412;Shaki-Loewenstein等人 (2005)
J. Immunol. Meth.303:19-39)。
如本文所用,術語「抗體」亦包括抗體之「抗原結合部分」(或簡稱為「抗體部分」)。如本文所用,術語「抗原結合部分」係指抗體中保留與抗原(例如,本文所述之肽及/或MHC-肽複合物)特异性結合之能力的一或多個片段。已顯示,抗體之抗原結合功能可由全長抗體之片段執行。涵蓋在術語抗體之「抗原結合部分」内之結合片段的實例包括(i) Fab片段,其係由VL、VH、CL及CH1域組成之單價片段;(ii) F(ab')2片段,其係包含在鉸鏈區由二硫橋連接之兩個Fab片段的二價片段;(iii)由VH及CH1域組成之Fd片段;(iv)由抗體之單一臂之VL及VH域組成的Fv片段,(v) dAb片段(Ward等人, (1989)
Nature341:544-546),其由VH域組成;及(vi)經分離之互補决定區(CDR)。此外,雖然Fv片段之兩個域VL及VH係由單獨基因編碼,但其可使用重組方法藉由合成連接子接合,該合成連接子使得其能够被製成單個蛋白鏈,其中VL與VH區配對以形成單價多肽(稱為單鏈Fv (scFv);參見例如Bird等人 (1988)
Science242:423-426;及Huston等人 (1988)
Proc. Natl. Acad. Sci. USA85:5879-5883;及Osbourn等人 1998, Nature Biotechnology 16: 778)。此類單鏈抗體亦意欲涵蓋在術語抗體之「抗原結合部分」內。特定scFv之任何VH及VL序列均可與人類免疫球蛋白恒定區cDNA或基因組序列連接,以便産生編碼完整IgG多肽或其他同型之表現載體。VH及VL亦可用於使用蛋白質化學或重組DNA技術産生Fab、Fv或其他免疫球蛋白片段。亦涵蓋諸如雙功能抗體之其他形式之單鏈抗體。雙功能抗體為二價、雙特异性抗體,其中VH及VL域在單個多肽鏈上表現,但使用之連接子過短以致於無法在同一鏈上之兩個域之間進行配對,從而迫使該等域與另一鏈之互補域配對且産生兩個抗原結合位點(參見例如Holliger等人 (1993)
Proc. Natl. Acad. Sci. U.S.A.90:6444-6448;Poljak等人 (1994)
Structure2:1121-1123)。
另外,抗體或其抗原結合部分可為由該抗體或抗體部分與一或多種其他蛋白質或肽之共價或非共價締合形成的較大免疫黏附多肽之一部分。此類免疫黏附多肽之實例包括使用卵白素核心區製成四聚體scFv多肽(Kipriyanov等人 (1995)
Human Antibodies and Hybridomas6:93-101)及使用半胱胺酸殘基、蛋白質亞單元肽及C端聚組胺酸標籤製成二價且生物素化scFv多肽(Kipriyanov等人 (1994)
Mol. Immunol. 31:1047-1058)。諸如Fab及F(ab')
2片段之抗體部分可使用習知技術自完整抗體製備,諸如分別對完整抗體進行木瓜蛋白酶消化或胃蛋白酶消化。此外,如本文所述,可使用標準重組DNA技術獲得抗體、抗體部分及免疫黏附多肽。
抗體可為多株或單株的;异種、同種异體或同基因的;或其經修飾形式(例如人類化、嵌合等)。抗體亦可為全人類的。較佳地,本發明所涵蓋之抗體特异性地或實質上特异性地與本文所述之肽及/或MHC-肽複合物結合。如本文所用,術語「單株抗體」及「單株抗體組合物」係指僅含有一種能够與抗原之特定抗原決定基發生免疫反應之抗原結合位點的抗體多肽群體,而術語「多株抗體」及「多株抗體組合物」係指含有多種能够與特定抗原相互作用之抗原結合位點的抗體多肽群體。單株抗體組合物通常對與其發生免疫反應之特定抗原展現出單一結合親和力。
與本文所述之其他結合部分相似,抗體亦可為「人類化的」,其意欲包括由具有可變區及恒定區之非人類細胞製成之抗體,該等可變區及恒定區已改變為與將由人類細胞製成的抗體更密切相似。舉例而言,藉由改變非人類抗體胺基酸序列以併入在人類生殖系免疫球蛋白序列中發現之胺基酸。本發明所涵蓋之人類化抗體可例如在CDR中包括不由人類生殖系免疫球蛋白序列編碼之胺基酸殘基(例如,藉由活體外隨機或位點特异性突變誘發或藉由活體內體細胞突變引入之突變)。如本文所用,術語「人類化抗體」亦包括其中源自另一哺乳動物物種之生殖系之CDR序列已植入人類構架序列上的抗體。
在一些實施例中,本發明所涵蓋之結合蛋白可共價連接至部分。在一些實施例中,該共價連接之部分包含親和力標籤或標記。親和力標籤可選自由麩胱甘肽-S-轉移酶(GST)、鈣調蛋白結合蛋白(CBP)、蛋白C標籤、Myc標籤、HaloTag、HA標籤、Flag標籤、His標籤、生物素標籤及V5標籤組成之群。標記可為螢光蛋白。在一些實施例中,該共價連接之部分係選自由發炎劑、消炎劑、細胞介素、毒素、細胞毒性分子、放射性同位素或諸如單鏈Fv之抗體組成之群。
結合蛋白可與用於成像、研究、治療、治療診斷學、醫藥學、化學療法、螯合療法、靶向藥物遞送及放射療法之劑結合。在一些實施例中,結合蛋白可與可偵測劑結合或融合,該等劑諸如螢光團、近紅外染料、對比劑、奈米粒子、含金屬奈米粒子、金屬螯合物、X射線對比劑、PET劑、金屬、放射性同位素、染料、放射性核素螯合劑或可用於成像之另一合適材料。在一些實施例中,1、2、3、4、5、6、7、8、9、10個或更多個可偵測部分可連接至結合蛋白。放射性同位素之非限制性實例包括α發射體、β發射體、正電子發射體及γ發射體。在一些實施例中,金屬或放射性同位素係選自由以下組成之群:錒、鋂、鉍、鎘、銫、鈷、銪、釓、銥、鉛、鑥、錳、鈀、釙、鐳、釕、釤、鍶、鎝、鉈及釔。在一些實施例中,金屬為錒、鉍、鉛、鐳、鍶、釤或釔。在一些實施例中,放射性同位素為錒-225或鉛-212
。在一些實施例中,近紅外染料不容易由生物組織及流體淬滅。在一些實施例中,螢光團係發射波長在650 nm與4000 nm之間的電磁輻射之螢光劑,此類發射係用於偵測此類劑
。可用作結合分子之螢光染料之非限制性實例包括DyLight-680、DyLight-750、VivoTag-750、DyLight-800、IRDye-800、VivoTag-680、Cy5.5、ZQ800或靛青綠(ICG)。在一些實施例中,近紅外染料通常包括花青染料(例如,Cy7、Cy5.5及Cy5)
。用作根據本發明之結合分子的螢光染料之額外非限制性實例包括吖啶橙或吖啶黃、Alexa Fluors® (例如,Alexa Fluor® 790、750、700、680、660及647)及其任何衍生物、7-放線菌素D、8-苯胺基萘-1-磺酸、ATTO®染料及其任何衍生物、金胺-若丹明染色劑及其任何衍生物、苯蒽酮、比曼恩、9-10-雙(苯基乙炔基)蒽、5,12-雙(苯基乙炔基)萘、雙苯甲醯亞胺、腦彩虹、鈣黃綠素、羧基螢光素及其任何衍生物、1-氯-9,10-雙(苯基乙炔基)蒽及其任何衍生物、DAPI、DiOC6、DyLight® Fluors®及其任何衍生物、艾吡可酮、溴化乙錠、FlAsH-EDT2®、Fluodye及其任何衍生物、FluoProbe®及其任何衍生物、螢光素及其任何衍生物、Fura®及其任何衍生物、GelGreen®及其任何衍生物、GelRed®及其任何衍生物、螢光蛋白及其任何衍生物、m同型蛋白及其任何衍生物(諸如mCherry)、赫他明染料及其任何衍生物、郝思特染色劑、亞胺基香豆素、印度黃、indo-1及其任何衍生物、來若丹、螢光黃及其任何衍生物、螢光素及其任何衍生物、螢光素酶及其任何衍生物、部花青及其任何衍生物、尼羅染料及其任何衍生物、苝、焰红染料、藻染料及其任何衍生物、碘化丙啶、比染因、若丹明及其任何衍生物、核糖綠、RoGFP、紅螢烯、二苯乙烯及其任何衍生物、磺醯若丹明及其任何衍生物、SYBR及其任何衍生物、synapto-pHluorin、四苯基丁二烯、tris四鈉、Texas Red、Titan Yellow、TSQ、繖形酮、紫蒽酮、黃色螢光蛋白及YOYO-1
。其他合適螢光染料包括但不限於螢光素及螢光素染料(例如,异硫氰酸螢光素或FITC、萘基螢光素、4', 5'-二氯-2',7'-二甲氧基螢光素、6-羧基螢光素或FAM等)、羧花青、部花青、苯乙烯染料、氧雜菁染料、藻紅蛋白、紅螢素、曙紅、若丹明染料(例如,羧基四甲基-若丹明或TAMRA、羧基若丹明6G、羧基-X-若丹明(ROX)、麗絲胺若丹明B、若丹明6G、若丹明綠、若丹明紅、四甲基若丹明(TMR)等)、香豆素及香豆素染料(例如,甲氧基香豆素、二烷基胺基香豆素、羥基香豆素、胺基甲基香豆素(AMCA)等)、Oregon Green™染料(例如,Oregon Green™ 488、500、514等)、Texas Red®、Texas Red®-X、SPECTRUM RED®、SPECTRUM GREEN®、花青染料(例如,CY-3、Cy-5、CY-3.5、CY-5.5等)、Alexa Fluor®染料(例如,Alexa Fluor® 350、488、532、546、568、594、633、660、680等)、BODIPY®染料(例如,BODIPY® FL、R6G、TMR、TR、 530/550、558/568、564/570、576/589、581/591、630/650、650/665等)、IRD染料(例如,IRD40™、IRD700™、IRD800™等)及其類似物
。額外的合適可偵測劑係此項技術中熟知的(例如,PCT公開案第PCT/US14/56177號)。放射性同位素之非限制性實例包括α發射體、β發射體、正電子發射體及γ發射體。在一些實施例中,金屬或放射性同位素係選自由以下組成之群:錒、鋂、鉍、鎘、銫、鈷、銪、釓、銥、鉛、鑥、錳、鈀、釙、鐳、釕、釤、鍶、鎝、鉈及釔。在一些實施例中,金屬為錒、鉍、鉛、鐳、鍶、釤或釔。在一些實施例中,放射性同位素為錒-225或鉛-212。
結合蛋白可與放射增敏劑或光敏劑結合。放射增敏劑之實例包括但不限於:ABT-263、ABT-199、WEHI-539、太平洋紫杉醇、卡鉑、順鉑、奧沙利鉑、吉西他濱、依他硝唑、米索硝唑、替拉扎明及核酸鹼基衍生物(例如,鹵化嘌呤或嘧啶,諸如5-氟去氧尿苷)
。光敏劑之實例包括但不限於:發光時産生熱之螢光分子或珠粒、奈米粒子、卟啉及卟啉衍生物(例如,二氫卟酚、細菌綠素、异細菌綠素、酞青及萘酞青)、金屬卟啉、金屬酞青、白芷素、硫屬元素哌喃鹽染料、葉綠素、香豆素、黃素及相關化合物(諸如咯嗪及核黃素)、富勒烯、去鎂葉綠素酸、焦去鎂葉綠素酸、花青(例如,部花青540)、去鎂葉綠素、藍寶石、特沙弗林、紫紅素、卟啉烯、吩噻嗪鎓、亞甲藍衍生物、萘二甲醯亞胺、尼羅藍衍生物、醌類、苝醌(例如金絲桃素、竹紅菌素及尾孢菌素)、補骨脂素、醌類、類視色素、若丹明、噻吩、威爾丁、呫噸染料(例如曙紅、紅螢素、孟加拉玫紅)、卟啉之二聚物及寡聚物形式,以及諸如5-胺基乙醯丙酸之前藥
。有利地,此方法允許同時使用治療劑(例如,藥物)及電磁能(例如,輻射或光)兩者對所關注細胞(例如,免疫細胞)進行高特异性靶向
。在一些實施例中,該結合蛋白與該劑融合,或與該劑共價或非共價連接,例如直接連接或經由連接子連接。
在一些實施例中,該結合蛋白可經化學修飾。舉例而言,可使結合蛋白發生突變以修飾肽特性,諸如可偵測性、穩定性、生物分佈、藥物動力學、半衰期、表面電荷、疏水性、結合位點、pH、功能及其類似特性
。N-甲基化係可在本發明所涵蓋之結合蛋白中發生的甲基化之一個實例
。在一些實施例中,可藉由對游離胺進行甲基化,諸如藉由用甲醛及氰基硼氫化鈉進行還原甲基化來修飾結合蛋白。
化學修飾可包含聚合物、聚醚、聚乙二醇、生物聚合物、兩性離子聚合物、聚胺基酸、脂肪酸、樹枝狀聚合物、Fc區、簡單飽和碳鏈(諸如棕櫚酸酯或肉豆蔻酸酯)或白蛋白。具有Fc區之結合蛋白之化學修飾可為融合Fc-蛋白。聚胺基酸可包括例如具有重複之單個胺基酸之聚胺基酸序列(例如聚甘胺酸),及具有可遵循或可不遵循模式之混合聚胺基酸序列之聚胺基酸序列,或前述的任何組合。
在一些實施例中,本發明所涵蓋之結合蛋白可經修飾。在一些實施例中,該等修飾與親本結合蛋白具有實質或顯著序列一致性以産生維持親本結合蛋白之一或多種生物物理及/或生物學活性(例如,維持結合特异性)之功能變異體。在一些實施例中,該突變為保守胺基酸取代。
在一些實施例中,本發明所涵蓋之結合蛋白可包含替代一或多個天然存在之胺基酸的合成胺基酸。此類合成胺基酸係此項技術中熟知的,且包括例如胺基環己烷甲酸、正白胺酸、a-胺基正癸酸、高絲胺酸、S-乙醯胺基甲基-半胱胺酸、反式-3-羥基脯胺酸及反式-4-羥基脯胺酸、4-胺基苯丙胺酸、4-硝基苯丙胺酸、4-氯苯丙胺酸、4-羧基苯丙胺酸、β-苯基絲胺酸β-羥基苯丙胺酸、苯基甘胺酸、a-萘基丙胺酸、環己基丙胺酸、環己基甘胺酸、吲哚啉-2-甲酸、1,2,3,4-四氫异喹啉-3-甲酸、胺基丙二酸、胺基丙二酸單醯胺、N'-苯甲基-N'-甲基-離胺酸、Ν',Ν'-二苯甲基-離胺酸、6-羥基離胺酸、鳥胺酸、a-胺基環戊烷甲酸、oc-胺基環己烷甲酸、a-胺基環庚烷甲酸、a-(2-胺基-2-降莰烷)-甲酸、α,γ-二胺基丁酸、β-二胺基丙酸、高苯丙胺酸及oc-第三丁基甘胺酸。
本發明所涵蓋之結合蛋白可經修飾,諸如糖基化、醯胺化、羧化、磷酸化、酯化、N-醯化、環化(例如,經由二硫橋),或轉化為酸加成鹽及/或視情況二聚化或聚合或結合。
在一些實施例中,可使用疏水性部分之附接(諸如至N端、C端或內部胺基酸)來延長本發明所涵蓋之肽的半衰期
。在其他實施例中,結合蛋白可包括轉譯後修飾(例如,甲基化及/或醯胺化),其可影響例如血清半衰期
。在一些實施例中,簡單碳鏈(例如,藉由肉豆蔻醯化及/或棕櫚醯化)可與結合蛋白結合
。在一些實施例中,簡單碳鏈可使結合蛋白容易與未結合材料分離
。舉例而言,可用於使結合蛋白與未結合材料分離之方法包括但不限於溶劑萃取及逆相層析
。親脂部分可經由與血清白蛋白可逆結合來延長半衰期。經結合部分可為經由與血清白蛋白可逆結合來延長肽之半衰期的親脂部分。在一些實施例中,親脂部分可為膽固醇或膽固醇衍生物,包括膽甾烯、膽甾烷、膽甾二烯及氧化膽固醇
。在一些實施例中,結合蛋白可與肉豆蔻酸(十四烷酸)或其衍生物結合。在其他實施例中,結合蛋白可與半衰期修飾劑偶合(例如,結合)
。半衰期修飾劑之實例包括但不限於:聚合物,聚乙二醇(PEG),羥乙基澱粉,聚乙烯醇,水溶性聚合物,兩性離子水溶性聚合物,水溶性聚(胺基酸),脯胺酸、丙胺酸及絲胺酸之水溶性聚合物,含有甘胺酸、麩胺酸及絲胺酸之水溶性聚合物,Fc區,脂肪酸,棕櫚酸,或與白蛋白結合之分子
。在一些實施例中,間隔子或連接子可偶合至結合蛋白,諸如1、2、3、4、5、6、7、8、9、10個或更多個用作間隔子或連接子之胺基酸殘基,以便促進與另一分子之結合或融合,以及促進肽自此類結合或融合分子裂解
。在一些實施例中,結合蛋白可與例如可修飾或影響該等結合蛋白之特性之變化的其他部分結合。
結合蛋白可諸如藉由固相肽合成或溶液相肽合成而以重組或合成方式産生。可藉由已知合成方法,諸如使用茀基甲氧羰基(Fmoc)化學或藉由丁氧羰基(Boc)化學來執行多肽合成
。多肽片段可以酶或合成方式接合在一起。
在本發明所涵蓋之一態樣中,本文提供産生本文所述之結合蛋白的方法,其包含以下步驟:(i)在適合使本文所述之結合蛋白表現的條件下培養經轉型宿主細胞,該宿主細胞已藉由包含編碼該結合蛋白之序列之核酸轉型;及(ii)回收經表現之結合蛋白。
舉例而言,可用於分離及純化重組産生之結合蛋白之方法可包括自將結合蛋白分泌至培養基中的合適宿主細胞/載體系統獲得上清液,及接著使用市售過濾器濃縮培養基。濃縮後,可將濃縮物應用於單一合適純化基質或一系列合適基質,諸如親和力基質或離子交換樹脂。可使用一或多個逆相HPLC步驟來進一步純化重組多肽。當自其天然環境中分離免疫原時,亦可使用此等純化方法。用於大規模製造本文所述之一或多種結合蛋白之方法包括批量細胞培養,對其進行監測及控制以維持適當培養條件。可根據描述於本文中且在此項技術中已知之方法執行結合蛋白之純化。
熟知多種用於評估結合親和力及/或確定結合分子是否與特定配位體(例如,肽抗原-MHC複合物)特异性結合之分析。諸如藉由使用此項技術中熟知之多種結合分析中之任一者來測定結合蛋白對標靶(諸如標靶多肽之T細胞肽抗原決定基)之結合親和力係在熟練技術人員之水準內。舉例而言,在一些實施例中,可使用Biacore™機器來測定兩種蛋白質之間的複合物之結合常數。可藉由監測當緩衝液傳遞通過晶片時折射率相對於時間之變化來測定該複合物之解離常數(K
D)。用於量測一種蛋白質與另一蛋白質之結合的其他合適分析包括例如免疫分析,例如酶聯免疫吸附劑分析(ELISA)及放射免疫分析(RIA),或藉由經由螢光、UV吸收、圓二色性或核磁共振(NMR)監測蛋白質之光譜或光學特性之變化來測定結合。其他例示性分析包括但不限於西方墨點、ELISA、分析性超速離心、光譜分析及表面電漿子共振(Biacore™)分析(參見例如Scatchard等人 (1949)
Ann. N.Y. Acad. Sci.51:660;Wilson (2002)
Science295:2103;Wolff等人(1993)
Cancer Res.53:2560,及美國專利第5,283,173號及第5,468,614號)、流式細胞術、測序及用於偵測經表現核酸之其他方法。在一實例中,藉由使用經標記多聚體,諸如MHC-抗原肽四聚體,例如藉由流式細胞術評估與各種濃度之四聚體的結合來量測對標靶之表觀親和力。在一代表性實例中,使用在濃度範圍內之經標記四聚體之2倍稀釋來量測結合蛋白之表觀K
D,接著藉由非線性回歸來確定結合曲線,表觀K
D係經測定為産生半最大結合之配位體濃度。
VII. 用途及方法 a. 診斷方法
在一些態樣中,本文提供用於確定個體是否已暴露於SARS-CoV-2及/或具有抵抗SARS-CoV-2之保護的診斷方法,該等診斷方法包含:(a)使自個體獲得之樣品(例如,血液、經分離PBMC或經分離T細胞)與諸如來自本文所述之免疫原性多肽構築體的本文所述之SARS-CoV-2免疫原性肽(例如,選自表1A、1B、1C、1D、1E及/或1F之肽抗原決定基)、本文所述之MHC-肽複合物或者編碼及/或呈遞本文所述之MHC-肽複合物的細胞一起培育;及(b)偵測反應性水準;其中反應性水準高於對照水準指示該個體已暴露於SARS-CoV-2及/或具有抵抗SARS-CoV-2之保護。
在一些實施例中,反應性水準係由T細胞活化或效應子功能,諸如但不限於T細胞增生、殺死或細胞介素釋放指示。對照水準可為參考數字或未暴露於SARS-CoV-2之健康個體之水準。
b. 治療方法
在一些態樣中,本文提供用於預防及/或治療COVID-19 (亦即,SARS-CoV-2感染)及/或用於誘導針對SARS-CoV-2蛋白或其片段之免疫反應的方法。在某些實施例中,該方法包含向個體投與本文所述之免疫原性組合物。
可使用本文所述之方法來治療任何有需要之個體。如本文所用,「有需要之個體」包括具有COVID-19、已具有COVID-19及/或易具有COVID-19之任何個體。舉例而言,在一些實施例中,個體具有COVID-19。在一些實施例中,個體已經歷針對COVID-19之治療。在一些實施例中,個體由於年齡或免疫系統受損或其他使個體易具有COVID-19之嚴重基礎醫學疾患而易具有COVID-19。
本文所揭示之醫藥組合物可藉由任何合適投與途徑(包括經口及非經腸)遞送。在某些實施例中,一般地遞送該等醫藥組合物(例如,經由經口或非經腸投與)。在特定實施例中,藉由皮下注射來投與該等醫藥組合物。
本發明劑之劑量可藉由參考該劑之血漿濃度來確定。舉例而言,可使用最大血漿濃度(Cmax)及自時間0至無窮大之血漿濃度-時間曲線下面積(AUC(0-4))。劑量包括産生上述Cmax及AUC (0-4)值之彼等劑量及產生彼等參數之較大或較小值之其他劑量。
醫藥組合物中之活性成分之實際劑量水準可變化以便獲得針對特定患者、組合物及投與模式有效實現所需治療反應而不會對患者産生毒性的活性成分之量。
所選劑量水準將取决於多種因素,包括所用特定劑之活性、投與途徑、投與時間、所用特定化合物之排泄或代謝速率、治療持續時間、與所用特定化合物組合使用之其他藥物、化合物及/或材料、所治療患者之年齡、性別、體重、狀況、一般健康狀况及既往病史以及醫學領域中熟知之類似因素。
一般熟習此項技術之醫師或獸醫可容易地確定所需醫藥組合物之有效量且開具處方。例如,醫師或獸醫可能以低於為了實現所需治療效應而需要之水準的水準開具處方及/或投與醫藥組合物中所用之劑的劑量且逐漸增加劑量,直至實現所需效應。
一般而言,本文所述之劑之合適日劑量將係作為該劑有效産生治療效應之最低劑量的量。此類有效劑量一般將取决於上文所述之因素。
在一些實施例中,該免疫原性組合物包含一定量之SRS-CoV-2免疫原性肽與構成醫藥劑量單位之佐劑的組合。醫藥劑量單位在本文中係定義為在既定時間點應用於個體之活性成分(例如,SRS-CoV-2免疫原性肽及/或佐劑)之量。醫藥劑量單位可以單一體積(例如單次注射)應用於個體,或可以2、3、4、5個或更多個分開體積或注射應用於身體之不同位置,例如右肢及左肢。以分開體積應用單一醫藥劑量單位之原因可為多方面的,諸如避免不良副作用、避免抗原競爭及/或組成分析考慮因素。本文中應瞭解,分開體積之醫藥劑量在組成上可不同,亦即,可包含不同種類或組成之活性成分及/或佐劑。
醫藥劑量單位可為有效量或有效量之一部分。「有效量」在本文中應理解為相對於未經治療之患者預防及/或減少疾病(例如,COVID-19)之症狀所需的活性成分之量或劑量。用於實踐本發明以預防性及/或治療性治療COVID-19之活性化合物之有效量視投與方式、個體之年齡、體重及一般健康狀况而變化。最終,主治醫師或獸醫將决定適當量及劑量方案。此類量係稱為「有效」量。此有效量亦可為能够在待治療個體中誘導有效細胞T細胞反應或更佳地有效全身性細胞T細胞反應之量。
在一態樣中,本文提供一種在個體中引出對感染SARS-CoV-2病毒之細胞之免疫反應的方法。該方法包含:向個體投與本文所述之醫藥組合物,其中當投與至個體時,該藥物組合物引出對感染SARS-CoV-2病毒之細胞之免疫反應。
一般而言,免疫反應可包括體液免疫反應、細胞介導之免疫反應或兩者。
可藉由標準免疫分析來測定體液反應以測定來自接受該醫藥組合物之個體之血清樣品中的抗體水準。細胞免疫反應係涉及T細胞且可活體外或活體内測定之反應。舉例而言,可將全身細胞免疫反應測定為在投與醫藥組合物之後的合適時間自個體取樣之細胞(例如,外周血白血球(PBL))中之T細胞增生活性。在使例如PBMC與刺激物一起培育適當時段之後,可測定[
3H]胸苷併入。可使用流式細胞術來測定正在增生之T細胞子集。
在某些態樣中,本文所提供之方法包括投與至人類及非人類哺乳動物。亦考慮了獸醫應用。在一些實施例中,個體可為其中可引出其免疫反應之任何活生物體。個體之實例包括但不限於人類、家畜、犬、猫、小鼠、大鼠及其轉殖基因物種。
在一些實施例中,可在任何適當時間投與該醫藥組合物。舉例而言,可在治療具有COVID-19之個體之前或期間進行投與,且在SARS-CoV-2感染變得臨床上不可偵測之後繼續投與。亦可在顯示復發迹象之個體中繼續投與。
在一些實施例中,可以治療或預防有效量投與該醫藥組合物。可使用已知程序且以足以實現所需效應之劑量及時段向個體投與該醫藥組合物。
在一些實施例中,可在任何合適位點向個體投與該醫藥組合物。投與途徑可為非經腸、肌肉內、皮下、皮內、腹膜內、鼻內、靜脈內(包括經由留置導管)、經由傳入淋巴管或藉由任何其他適合於個體之疾患之途徑。較佳地,將以有效産生所需反應(引出免疫反應抑或預防性或治療性治療SARS-CoV-2感染及/或相關症狀)之量及時段投與該劑量。
該醫藥組合物可在其他療法之後、之前或同時給予,該等其他療法包括亦引出個體之免疫反應之療法。舉例而言,個體可預先或同時由其他形式之免疫調節劑治療,此類其他療法較佳以不干擾本文所述之組合物之免疫原性的方式提供。
投與可由護理人員(例如,醫師、獸醫)適當地計時,且可取决於個體之臨床疾患、投與目的及/或亦考慮或投與之其他療法。在一些實施例中,可投與初始劑量,且監測個體之免疫學及/或臨床反應。免疫監測之合適手段包括使用患者之外周血淋巴球(PBL)作為回應者且使用本文所述之免疫原性肽或MHC-肽複合物作為刺激物。亦可藉由在投與位點處之延遲發炎反應來確定免疫反應。適當時可在初始劑量之後給予一或多個劑量,通常每月、每半月或每週一次,直至實現所需效應。此後,可根據需要給予額外的加强劑量或維持劑量,尤其當免疫學或臨床益處顯示減弱時。
c. 鑑別在 MHC 分子之背景中與肽結合之分子的方法
在一些態樣中,本文提供鑑別與選自表1A、1B、1C、1D、1E及/或1F之肽抗原決定基結合之肽結合分子或其抗原結合片段的方法。
在一些實施例中,肽結合分子(亦即,MHC-肽結合分子)係具有與在MHC分子(MHC-肽複合物)之背景中呈遞或呈現於諸如細胞表面上之肽抗原決定基結合(例如特异性結合)之能力的分子或其部分。例示性肽結合分子包括展現出與MHC-肽複合物結合之特异性能力的T細胞受體或抗體或其抗原結合部分,包括其單鏈免疫球蛋白可變區(例如,scTCR、scFv)。在一些實施例中,肽結合分子為TCR或其抗原結合片段。在一些實施例中,肽結合分子為抗體,諸如TCR樣抗體或其抗原結合片段。在一些實施例中,肽結合分子為TCR樣CAR,該TCR樣CAR含有抗體或其抗體結合片段,諸如TCR樣抗體,諸如已經工程改造以與MHC-肽複合物結合之抗體。在一些實施例中,肽結合分子可源自天然來源,或其可部分地或全部以合成或重組方式産生。
在一些實施例中,可藉由使一或多種候選肽結合分子(諸如一或多種候選TCR分子、抗體或其抗原結合片段)與MHC-肽複合物接觸且評估該一或多種候選結合分子中之每一者是否與MHC-肽複合物結合(諸如特异性結合)來鑑別與肽抗原決定基結合之結合分子。該等方法可活體外、離體或活體内執行。用於篩選之方法係此項技術中熟知的,諸如描述於美國專利公開案2020/0102553中。
在一些實施例中,該等方法包括使複數個結合分子或結合分子文庫(諸如複數個TCR或抗體或者TCR或抗體文庫)與MHC限制性抗原決定基接觸,及鑑別或選擇特异性結合此類抗原決定基之分子。在一些實施例中,可篩選或評估含有複數個不同結合分子(諸如複數個不同TCR或複數個不同抗體)之文庫或集合與MHC限制性抗原決定基的結合。在一些實施例中,諸如為了選擇特异性結合MHC限制性肽之抗體分子,可使用融合瘤方法。
在一些實施例中,可使用篩選方法,其中複數個候選結合分子(諸如候選結合分子文庫或集合)同時或依次個別地與肽結合分子接觸。可鑑別或選擇與特定MHC-肽複合物特异性結合之文庫成員。在一些實施例中,候選結合分子之文庫或集合可含有至少2、5、10、100、10
3、10
4、10
5、10
6、10
7、10
8、10
9個或更多個不同肽結合分子。
在一些實施例中,可使用該等方法來鑑別展現出結合多於一種MHC單倍型或多於一種MHC等位基因之肽結合分子,諸如TCR或抗體。在一些實施例中,諸如TCR或抗體之肽結合分子特异性結合或識別在複數個MHC I類單倍型或等位基因之背景中呈遞之肽抗原決定基。在一些實施例中,諸如TCR或抗體之肽結合分子特异性結合或識別在複數個MHC II類單倍型或等位基因之背景中呈遞之肽抗原決定基。
已知多種用於評估結合親和力及/或確定結合分子是否與特定配位體(例如,MHC-肽複合物)特异性結合之分析。諸如藉由使用此項技術中熟知之多種結合分析中之任一者來測定TCR對標靶多肽之T細胞抗原決定基的結合親和力係在熟練技術人員之水準內。舉例而言,在一些實施例中,可使用BIAcore機器來測定兩種蛋白質之間的複合物之結合常數。可藉由監測當緩衝液傳遞通過晶片時折射率相對於時間之變化來測定該複合物之解離常數(K
D)。用於量測一種蛋白質與另一蛋白質之結合的其他合適分析包括例如免疫分析,例如酶聯免疫吸附劑分析(ELISA)及放射免疫分析(RIA),或藉由經由螢光、UV吸收、圓二色性或核磁共振(NMR)監測蛋白質之光譜或光學特性之變化來測定結合。其他例示性分析包括但不限於西方墨點、ELISA、分析性超速離心、光譜分析及表面電漿子共振(Biacore®)分析(參見例如Scatchard等人(1949)
Ann. N.Y. Acad. Sci.51:660;Wilson (2002)
Science295:2103;Wolff等人 (1993)
Cancer Res.53:2560;及美國專利第5,283,173號、第5,468,614號或等效物)、流式細胞術、測序及用於偵測經表現核酸之其他方法。在一實例中,藉由使用經標記四聚體,例如藉由流式細胞術評估與各種濃度之四聚體的結合來量測對TCR之表觀親和力。在一實例中,使用在濃度範圍內之經標記四聚體之2倍稀釋來量測TCR之表觀K
D,接著藉由非線性回歸來確定結合曲線,表觀K
D係經測定為産生半最大結合之配位體濃度。
在一些實施例中,可使用該等方法來鑑別僅在特定肽存在於複合物中時,而非特定肽不存在或存在另一非重疊或不相關肽時結合的結合分子。在一些實施例中,該結合分子在不存在所結合肽之情况下實質上不結合MHC,及/或在不存在MHC之情况下實質上不結合該肽。在一些實施例中,該等結合分子為至少部分特异性的。在一些實施例中,若存在特定肽,則例示性經鑑別結合分子可與MHC-肽複合物結合,且若存在相對於特定肽具有一個或兩個取代之相關肽,則亦結合。
在一些實施例中,可使用諸如TCR樣抗體之經鑑別抗體來製造或産生嵌合抗原受體(CAR),該等受體含有與MHC-肽複合物特异性結合之非TCR抗體。
在一些實施例中,可使用鑑別肽結合分子(諸如TCR或TCR樣抗體或TCR樣CAR)之方法來對表現或含有肽結合分子之細胞進行工程改造。在一些實施例中,細胞或經工程改造之細胞為T細胞。在一些實施例中,該T細胞為CD4+或CD8+ T細胞。在一些實施例中,肽結合分子識別MHC I類肽複合物、MHC II類肽複合物及/或MHC-E肽複合物。在一些實施例中,可使用在MHC I類之背景中特异性識別肽之肽結合分子(諸如TCR或抗體或CAR)來對CD8+ T細胞進行工程改造。在一些實施例中,亦提供表現或含有用於識別在MHC I類之背景中呈遞之肽的TCR、抗體或CAR之經工程改造之CD8+ T細胞之組合物。在此類實施例中之任一者中,該等細胞可用於過繼性細胞療法之方法中。
在一些實施例中,可藉由擴增自個體分離之T細胞之Vα及Vβ譜系來産生TCR文庫,該等細胞包括存在於PBMC、脾臟或其他淋巴器官中之細胞。在一些情况下,T細胞可自腫瘤浸潤淋巴球(TIL)擴增。在一些實施例中,可由CD4+或CD8+細胞産生TCR文庫。在一些實施例中,TCR可自正常健康個體之T細胞來源(亦即,正常TCR文庫)擴增。在一些實施例中,TCR可自患病個體之T細胞來源(亦即,患病TCR文庫)擴增。在一些實施例中,使用簡併引子來擴增Vα及VP之基因譜系,諸如藉由在自人類獲得之樣品(諸如T細胞)中進行RT-PCR而擴增。在一些實施例中,可由原生Vα及Vβ文庫組裝scTv文庫,其中擴增産物經選殖或經組裝以由連接子分開。視個體及細胞之來源而定,該等文庫可為HLA等位基因特异性的。
或者,在一些實施例中,可藉由親本或支架TCR分子之突變誘發或多樣化來産生TCR文庫。舉例而言,在一些態樣中,個體(例如人類或其他哺乳動物,諸如嚙齒動物)可接種肽,諸如藉由本發明方法鑑別之肽。在一些實施例中,可自個體獲得樣品,諸如含有血液淋巴球之樣品。在一些情况下,例如TCR之結合分子可自樣品擴增,例如樣品中所含之T細胞。在一些實施例中,可諸如藉由篩選選擇抗原特异性T細胞以評估針對肽之CTL活性。在一些態樣中,可諸如藉由結合活性,例如對抗原之特定親和力或親合力來選擇例如存在於抗原特异性T細胞上之TCR。在一些態樣中,使TCR經受定向演化,諸如藉由例如α或β鏈之突變誘發來進行。在一些態樣中,TCR之CDR內之特定殘基發生改變。在一些實施例中,可藉由親和力成熟來修飾所選TCR。在一些態樣中,所選TCR可用作針對抗原之親本支架TCR。
在一些實施例中,個體為人類,諸如具有COVID-19之人類。在一些實施例中,個體為嚙齒動物,諸如小鼠。在一些此類實施例中,小鼠為轉殖基因小鼠,諸如表現人類MHC (亦即,HLA)分子(諸如HLA-A2)之小鼠。參見Nicholson等人Adv Hematol. 2012; 2012: 404081。
在一些實施例中,個體係表現人類TCR之轉殖基因小鼠或為抗原陰性小鼠。參見Li等人 (2010)
Nat Med.161029-1034;Obenaus等人 (2015)
Nat Biotechnol.33:402-407。在一些態樣中,個體係表現人類HLA分子及人類TCR之轉殖基因小鼠。
在一些實施例中,諸如在個體為轉殖基因HLA小鼠之情況下,將經鑑別TCR修飾為例如嵌合或人類化的。在一些態樣中,諸如類似於已知的抗體人類化方法,修飾TCR支架。
在一些實施例中,使用此類支架分子來産生TCR文庫。
舉例而言,在一些實施例中,該文庫包括與親本或支架TCR分子相比已經修飾或經工程改造之TCR或其抗原結合部分。在一些實施例中,可使用定向演化方法來産生具有經改變特性,諸如對特定MHC-肽複合物具有更高親和力之TCR。在一些實施例中,呈現方法涉及工程改造或修飾已知、親本或參考TCR。舉例而言,在某些情况下,野生型TCR可用作用於産生突變誘發TCR之模板,其中CDR之一或多個殘基發生突變,且選擇具有所需經改變特性,諸如對所需標靶抗原具有更高親和力之突變體。在一些實施例中,藉由包括但不限於以下之呈現方法實現定向演化:酵母呈現(Holler等人 (2003)
Nat Immunol4:55-62;Holler等人 (2000)
Proc Natl Acad Sci USA97:5387-5392)、噬菌體呈現(Li等人 (2005)
Nat Biotechnol23:349-354)或T細胞呈現(Chervin等人 (2008)
J Immunol Methods339:175-184)。
在一些實施例中,該等文庫可為可溶性的。在一些實施例中,該等文庫為呈現文庫,其中TCR呈現於噬菌體或細胞之表面上,或附著於粒子或分子,諸如細胞、核糖體或核酸,例如RNA或DNA。通常,包括正常及疾病TCR文庫或多樣化文庫之TCR文庫可以任何形式産生,包括呈异源二聚體形式或呈單鏈形式。在一些實施例中,TCR之一或多個成員可為雙鏈异源二聚體。在一些實施例中,可藉由引入二硫鍵來促進Vα及Vβ鏈之配對。在一些實施例中,TCR文庫之成員可為TCR單鏈(scTv或ScTCR),在一些情况下,其可包括由連接子分開之Vα及Vβ鏈。另外,在一些情况下,在自文庫篩選及選擇TCR之後,所選成員可以任何形式産生,諸如全長TCR异源二聚體或單鏈形式或其抗原結合片段。
在美國專利申請案2020/0182884中亦描述了鑑別在MHC分子之背景中與肽結合之分子之其他方法,該申請案以引用之方式整體併入本文中。
d. 臨床試驗期間之效應監測
監測SARS-CoV-2療法(例如化合物、藥物、疫苗或細胞療法)對T細胞反應性(例如,結合及/或T細胞活化及/或效應子功能之存在)之影響,不僅可應用於基礎候選肽-結合分子篩選,亦可應用於臨床試驗。舉例而言,可在罹患COVID-19之個體之臨床試驗中監測如本文所述之SARS-CoV-2免疫原性肽或組合物、編碼此類SARS-CoV-2免疫原性肽之核酸、MHC-肽複合物或者表現核酸、載體、免疫原性肽或MHC-肽複合物之細胞增加針對SARS-CoV-2感染之免疫反應(例如,T細胞免疫反應)的有效性。在此類臨床試驗中,結合及/或T細胞活化及/或效應子功能(例如,T細胞增生、殺死或細胞介素釋放)之存在可用作特定細胞、組織或系統之表型之「讀出」或標記物。同樣,可在罹患COVID-19之個體之臨床試驗中監測適應性T細胞療法之有效性,該療法利用經工程改造以表現藉由如本文所述之篩選分析確定之TCR的T細胞,或利用用免疫原性肽、MHC-肽複合物或者編碼及/或呈遞如本文所述之MHC-肽複合物之細胞刺激的T細胞來增加對感染SARS-CoV-2之細胞之免疫反應。在此類臨床試驗中,結合及/或T細胞活化及/或效應子功能(例如,T細胞增生、殺死或細胞介素釋放)之存在可用作特定細胞、組織或系統之表型之「讀出」或標記物。
在一實施例中,本發明提供一種用於監測SARS-CoV-2療法(例如,化合物、藥物、疫苗或細胞療法)治療個體之有效性之方法,該方法包括步驟a)在向個體提供至少一部分SARS-CoV-2療法之前自個體獲得之第一樣品中,測定自個體獲得之T細胞與一或多種免疫原性肽或一或多種本文所述之穩定MHC-肽複合物之間的反應性之存在或水準,及b)測定一或多種免疫原性肽或一或多種本文所述之穩定MHC-肽複合物與自個體獲得之T細胞之間的反應性之存在或水準,該等T細胞存在於提供部分SARS-CoV-2療法之后自個體獲得之第二樣品中,其中第二樣品中存在反應性或相對於第一樣品反應性水準較高指示該療法對治療個體之SARS-CoV-2有效。
舉例而言,增加SARS-CoV-2療法之投與可合適地增加自個體獲得之T細胞與一或多個種疫原性肽或一或多種本文所述之穩定MHC-肽複合物之間的反應性之存在或水準,亦即增加SARS-CoV-2療法之有效性。根據此類實施例,自個體獲得之T細胞與一或多種免疫原性肽或一或多種本文所述之穩定MHC-肽複合物之間的反應性之存在或水準可用作SARS-CoV-2療法之有效性之指示,即使在缺乏可觀測表型反應之情况下亦如此。同樣,亦可使用對T細胞與一或多種免疫原性肽或一或多種本文所述之穩定MHC-肽複合物之間的反應性之存在或水準之分析(諸如藉由直接結合分析、螢光活化細胞分選(FACS)、酶聯免疫吸附劑分析(ELISA)、放射免疫分析(RIA)、免疫化學、西方墨點或細胞內流式分析)來選擇將接受SARS-CoV-2療法之患者。
舉例而言,在直接結合分析中,免疫原性肽或MHC-肽複合物可與放射性同位素或酶標記偶合,使得可藉由偵測經標記免疫原性肽或MHC-肽複合物來測定結合。舉例而言,免疫原性肽或MHC-肽複合物可直接地或間接地用
125I、
35S、
14C或
3H標記,且藉由對放射性發射直接計數或藉由閃爍計數來偵測放射性同位素。或者,可用例如辣根過氧化酶、鹼性磷酸酶或螢光素酶以酶法標記免疫原肽或MHC-肽複合物,且藉由測定適當受質至產物之轉化來偵測酶標記。亦可使用標準結合或酶分析分析來實現測定免疫原肽或MHC-肽複合物與T細胞之間的相互作用。在上述分析方法之一或多個實施例中,可需要固定免疫原性肽或MHC-肽複合物以適應該分析之自動化。
可在適合容納反應物之任何容器中實現免疫原肽或MHC-肽複合物與T細胞之結合。此類容器之非限制性實例包括微量滴定板、試管及微量離心管。本文所述之免疫原性肽或MHC-肽複合物之經固定形式亦可包括與固相結合之免疫原性肽或MHC-肽複合物,該固相如多孔、微孔(具有小於約一微米之平均孔直徑)或大孔(具有超過約10微米之平均孔直徑)材料,諸如膜、纖維素、硝基纖維素或玻璃纖維;珠粒,諸如由瓊脂糖或聚丙烯醯胺或乳膠製成之珠粒;或皿、板或孔之表面,諸如由聚苯乙烯製成之表面。
在一些實施例中,T細胞對一或多種免疫原性肽或一或多種本文所述之穩定MHC-肽複合物之反應性,結合及/或T細胞活化及/或效應子功能之存在。術語「T細胞活化」係指選自增生、分化、細胞介素分泌、細胞毒性效應子分子之釋放、細胞毒性活性及活化標記物之表現的T淋巴球,尤其係指細胞毒性T淋巴球之一或多種細胞反應。
可根據本文所述之T細胞功能參數中之任一者(例如,增生、細胞介素釋放、細胞毒性、細胞表面標記物表型之變化等)來量測T細胞對一或多種免疫原性肽或一或多種穩定MHC-肽複合物之反應性。
可藉由此項技術中熟知之方法,例如ELISA、酶聯免疫吸收點(ELISPOT)、Luminex®分析、細胞內細胞介素染色及流式細胞術及其組合(例如,細胞內細胞介素染色及流式細胞術)來量測細胞介素産生及/或釋放。其可根據所實施之方法來測定。
如本文所用,術語「細胞介素」係指介導及/或調控生物或細胞功能或過程(例如,免疫、發炎及造血)之分子。如本文所用,術語「細胞介素」包括「淋巴介質」、「趨化介素」、「單核因子」及「介白素」。可用細胞介素之實例為GM-CSF、IL-1α、IL-1β、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-10.、IL-12、IL-15、IFN-α、IFN-β、IFN-γ、MIP-1α、MIP-1β、TGF-β、TNF-α及TNF-β。
可例如經由併入諸如氚化胸苷分析或MTT分析之非放射性分析來測定由抗原特异性誘導或刺激免疫反應引起之T細胞之增生及純系擴增。
可使用此項技術中常規實踐之數種技術及方法中之任一者來執行測定CTL活性之細胞毒性分析(例如,Henkart等人 (2003)
Fundamental Immunology1127-1150)。用於量測抗原特异性T細胞反應性之方法之額外描述可見於例如美國專利10,208,086及美國專利申請案2017/0209573中,該等專利中之每一者均以引用之方式整體併入本文中。
VIII. 細胞療法
在某些態樣中,該等方法包括過繼性細胞療法,藉此向個體投與表現靶向MHC限制性抗原決定基之所提供分子的經遺傳工程改造細胞(例如,表現TCR或TCR樣CAR之細胞)。此類投與可以抗原靶向方式促進細胞活化(例如,T細胞活化),使得感染SARS-CoV-2之細胞成為破壞目標。
因此,所提供之方法及用途包括用於過繼性細胞療法之方法及用途。在一些實施例中,該等方法包括將細胞或含有細胞之組合物投與至個體、組織或細胞,諸如患有、有風險患上或疑似患有疾病、疾患或病症之個體、組織或細胞。在一些實施例中,例如經由過繼性細胞療法,諸如過繼性T細胞療法,將該等細胞、群體及組合物投與至患有待治療之特定疾病或疾患之個體。在一些實施例中,將該等細胞或組合物投與至個體,諸如患有疾病或疾患或有患上疾病或疾患之風險之個體。在一些態樣中,該等方法由此治療(例如,改善)疾病或疾患之一或多種症狀。
用於過繼性細胞療法之細胞投與方法為已知的且可與所提供之方法及組合物聯合使用。舉例而言,過繼性T細胞療法方法描述於例如Gruenberg等人之美國專利申請公開案第2003/0170238號;Rosenberg之美國專利第4,690,915號;Rosenberg (2011)
Nat Rev Clin Oncol.8:577-585)中。參見例如Themeli等人 (2013)
Nat Biotechnol.31: 928-933;Tsukahara等人 (2013)
Biochem Biophys Res Commun438: 84-89;Davila等人 (2013)
PLoS ONE8:e61338。
在一些實施例中,藉由自體轉移進行細胞療法,例如過繼性細胞療法,例如過繼性T細胞療法,其中自欲接受細胞療法之個體或自源自此類個體之樣品分離及/或以其他方式製備細胞。因此,在一些態樣中,該等細胞係源自需要治療之個體,例如患者,且在分離及加工之後將該等細胞投與至同一個體。
在一些實施例中,藉由同種異體轉移進行細胞療法,例如過繼性細胞療法,例如過繼性T細胞療法,其中自除了欲接受或最終接受細胞療法之個體以外之個體(例如,第一個體)分離及/或以其他方式製備細胞。在此類實施例中,隨後將該等細胞投與至相同物種之不同個體,例如第二個體。在一些實施例中,第一及第二個體在遺傳上一致。在一些實施例中,第一及第二個體在遺傳上相似。在一些實施例中,第二個體表現與第一個體相同之HLA類別或超類型。
在一些實施例中,投與該等細胞、細胞群體或組合物之個體為靈長類動物,諸如人類。在一些實施例中,靈長類動物為猴子或猿。個體可為雄性或雌性且可為任何合適的年齡,包括嬰兒、少年、青少年、成人及老年個體。在一些實施例中,個體為非靈長類哺乳動物,諸如嚙齒動物。在一些實例中,患者或個體係用於疾病、過繼性細胞療法及/或用於評估諸如細胞介素釋放症候群(CRS)之毒性結果的經驗證動物模型。
可藉由任何合適方式,例如藉由注射,例如靜脈内或皮下注射、眼內注射、眼周注射、視網膜下注射、玻璃體內注射、經中隔注射、鞏膜下注射、脈絡膜內注射、前房內注射、結膜下注射(subconjectval injection/subconjuntival injection)、眼球筋膜下注射(sub-Tenon's injection)、眼球後注射、球周注射或後鞏膜旁遞送來投與該等結合分子,諸如TCR、TCR樣抗體及含有TCR樣抗體之嵌合受體(例如,CAR)及表現其之細胞。在一些實施例中,藉由非經腸、肺內及鼻內投與該等結合分子,且若需要局部治療,則藉由病變內投與進行投與。非經腸輸注包括肌肉內、靜脈內、動脈內、腹膜內或皮下投與。給藥及投與可部分地取决於投與為短暫的抑或長期的。各種給藥方案包括但不限於在各種時間點單次或多次投與、推注投與及脈衝輸注。
對於疾病之預防或治療,該結合分子或細胞的適當劑量可取決於欲治療疾病之類型、結合分子之類型、疾病之嚴重程度及過程、投與結合分子係用於預防性抑或治療性目的、先前療法、患者的臨床病史及對結合分子之反應以及主治醫師之決定。在一些實施例中,該等組合物及分子以及細胞適合一次性或經一系列治療投與至患者。
在某些實施例中,可將細胞或細胞亞型之個別群體以約一百萬至約一千億個細胞之範圍及/或以下細胞量/公斤體重投與至個體:諸如100萬至約500億個細胞(例如,約500萬個細胞、約2500萬個細胞、約5億個細胞、約10億個細胞、約50億個細胞、約200億個細胞、約300億個細胞、約400億個細胞,或由前述值中之任兩者限定之範圍),諸如約1000萬至約1000億個細胞(例如,約2000萬個細胞、約3000萬個細胞、約4000萬個細胞、約6000萬個細胞、約7000萬個細胞、約8000萬個細胞、約9000萬個細胞、約100億個細胞、約250億個細胞、約500億個細胞、約750億個細胞、約900億個細胞或由前述值中之任兩者限定之範圍),及在一些情况下,約1億個細胞至約500億個細胞(例如,約1.2億個細胞、約2.5億個細胞、約3.5億個細胞、約4.5億個細胞、約6.5億個細胞、約8億個細胞、約9億個細胞、約30億個細胞、約300億個細胞、約450億個細胞)或此等範圍及/或每公斤體重之間的任何值。劑量可視該疾病或病症及/或患者及/或其他治療所特有之屬性而變化。
在一些實施例中,例如,在個體為人類之情況下,劑量包括少於約1×10
8個總的重組受體(例如,CAR)表現細胞、T細胞或外周血單核細胞(PBMC),例如在約1×10
6至1×10
8個此類細胞之範圍內,諸如2×10
6、5×10
6、1×10
7、5×10
7或1×10
8個或總的此類細胞,或在前述值中之任兩者之間的範圍。
在一些實施例中,該等細胞或結合分子(例如,TCR或TCR樣抗體)係作為組合治療之一部分投與,諸如與另一治療介入(諸如另一抗體或經工程改造之細胞或受體或劑,諸如細胞毒性或治療劑)同時或以任何次序依序投與。
在一些實施例中,該等細胞或結合分子(例如,TCR或TCR樣抗體)與一或多種額外治療劑共投與,或與另一治療介入聯合,同時或以任何次序依序投與。在一些情况下,該等細胞與時間上足够接近之另一療法共同投與,使得細胞群體增强一或多種額外治療劑之效應,反之亦然。在一些實施例中,該等細胞或結合分子(例如,TCR或TCR樣抗體)在一或多種額外治療劑之前投與。在一些實施例中,該等細胞或結合分子(例如,TCR或TCR樣抗體)在一或多種額外治療劑之後投與。
在一些態樣中,一旦將該等細胞投與至哺乳動物(例如,人類),即藉由多種已知方法中之任一種來量測經工程改造之細胞群體及/或結合分子(例如,TCR或TCR樣抗體)之生物活性。欲評估之參數包括活體內例如藉由成像或者離體例如藉由ELISA或流式細胞術量測的經工程改造或天然T細胞或其他免疫細胞與抗原之特異性結合。在某些實施例中,可使用此項技術中已知之任何合適方法,諸如描述於例如Kochenderfer等人 (2009)
J. Immunotherapy32:689-702及Herman等人
(2004)
J. Immunological Methods285:25-40中之細胞毒性分析來量測經工程改造細胞破壞標靶細胞之能力。在某些實施例中,亦可藉由分析諸如CD 107a、IFNγ、IL-2及TNF之某些細胞介素之表現及/或分泌來量測該等細胞之生物活性。在一些態樣中,藉由評估諸如腫瘤負荷或負載减少之臨床結果來量測生物活性。
在某些實施例中,經工程改造細胞以多種方式經修飾,使得其治療或預防功效增加。舉例而言,由群體表現之經工程改造CAR或TCR可直接或間接藉由連接子與靶向部分結合。使例如CAR或TCR之化合物與靶向部分結合之實踐係此項技術中已知的。參見例如Wadwa等人 (1995)
J. Drug Targeting3: 111及美國專利第5,087,616號。
在某些態樣中,可在用於提供SARS-CoV-2引發的抗原呈遞細胞及/或用此等抗原呈遞細胞産生之SARS-CoV-2特异性淋巴球之組合物及方法中使用本文所述之SARS-CoV-2免疫原性肽或編碼此類SARS-CoV-2免疫原性肽之核酸。在一些實施例中,使用此類抗原呈遞細胞及/或淋巴球來治療及/或預防COIVD-19 (亦即,SARS-CoV-2感染)。
在一些態樣中,本文提供用於製造SARS-CoV-2引發的抗原呈遞細胞之方法,該等方法藉由在足以使至少一種SARS-CoV-2免疫原性多肽由抗原呈遞細胞呈遞之條件下使抗原呈遞細胞與單獨或與佐劑組合的本文所述之SARS-CoV-2免疫原性多肽或編碼至少一種SARS-CoV-2免疫原性多肽之核酸接觸來進行。
在一些實施例中,可使單獨或與佐劑組合的SARS-CoV-2免疫原性多肽或編碼SARS-CoV-2免疫原性多肽之核酸與包含抗原呈遞細胞之同源、實質上同質或异源組合物接觸。舉例而言,該組合物可包括但不限於全血、新鮮血液或其部分,諸如但不限於外周血單核細胞、全血之膚色血球層部分、濃縮紅細胞、輻射血液、樹突狀細胞、單核球、巨噬細胞、中性顆粒球、淋巴球、天然殺手細胞及天然殺手T細胞。若視情況使用抗原呈遞細胞之前驅物,則可在足以使該等前驅物分化成抗原呈遞細胞之合適培養條件下培養該等前驅物。在一些實施例中,抗原呈遞細胞(或其前驅物)係選自單核球、巨噬細胞、髓系細胞、B細胞、樹突狀細胞或朗格漢斯細胞。
與抗原呈遞細胞接觸置放之單獨或與佐劑組合的SARS-CoV-2免疫原性多肽或編碼SARS-CoV-2免疫原性多肽之核酸的量可由一般技術者藉由常規實驗測定。一般而言,使抗原呈遞細胞與單獨或與佐劑組合的SARS-CoV-2免疫原性多肽或編碼SARS-CoV-2免疫原性多肽之核酸接觸,持續足以使細胞呈遞用於調節T細胞之抗原之經加工形式的時段。在一實施例中,在單獨或與佐劑組合的SARS-CoV-2免疫原性多肽或編碼SARS-CoV-2免疫原性多肽之核酸存在下培育抗原呈遞細胞持續少於約一週,說明性地,持續約1分鐘至約48小時、約2分鐘至約36小時、約3分鐘至約24小時、約4分鐘至約12小時、約6分鐘至約8小時、約8分鐘至約6小時小時、約10分鐘至約5小時、約15分鐘至約4小時、約20分鐘至約3小時、約30分鐘至約2小時以及約40分鐘至約1小時。可例如使用脈衝追踪方法來測定抗原呈遞細胞加工及呈遞抗原所必需之單獨或與佐劑組合的SARS-CoV-2免疫原性多肽或編碼SARS-CoV-2免疫原性多肽之核酸的時間及量,其中在接觸之後為洗淨期及暴露於讀出系統(例如,抗原反應性T細胞)。
在某些實施例中,可使用用於將抗原遞送至抗原呈遞細胞之內源加工路徑之任何適當方法。此類方法包括但不限於涉及pH敏感性脂質體之方法、抗原與佐劑之偶合、凋亡細胞遞送、將細胞脈衝輸送至樹突狀細胞上、將包含抗原之重組嵌合病毒樣粒子(VLP)遞送至樹突狀細胞株之MHC I類加工路徑。
在一實施例中,使經溶解SARS-CoV-2免疫原性多肽與抗原呈遞細胞一起培育。在一些實施例中,可使SARS-CoV-2免疫原性多肽與細胞溶素偶合以增强抗原至抗原呈遞細胞之細胞溶質中的轉移,從而遞送至MHC I類路徑。例示性細胞溶素包括皂苷化合物,諸如含皂苷之免疫刺激複合物(ISCOM5)、成孔毒素(例如,α-毒素)以及革蘭氏陽性細菌之天然細胞溶素,諸如李斯特菌溶血素O (LLO)、鏈球菌溶血素O (SLO)及穿孔球菌溶血素O (PFO)。
在一些實施例中,可根據此項技術中已知之方法分離抗原呈遞細胞(諸如樹突狀細胞及巨噬細胞),且藉由此項技術中已知的用於將編碼SARS-CoV-2免疫原性多肽之核酸引入至抗原呈遞細胞中之方法用聚核苷酸進行轉染。轉染試劑及方法係此項技術中已知的且可購得。舉例而言,可在合適培養基中提供編碼SARS-CoV-2免疫原性多肽之RNA且與脂質(例如,陽離子脂質)組合,接著與抗原呈遞細胞接觸。此類脂質之非限制性實例包括LIPOFECTIN
TM及LIPOFECTAMINE
TM。隨後可使所得聚核苷酸-脂質複合物與抗原呈遞細胞接觸。或者,可使用諸如電穿孔或磷酸鈣轉染之技術將聚核苷酸引入至抗原呈遞細胞中。接著可使用裝載聚核苷酸之抗原呈遞細胞在活體内或離體刺激T淋巴球(例如,細胞毒性T淋巴球)增生。在一實施例中,以過繼性免疫療法方法將離體擴增之T淋巴球投與至個體。
在某些態樣中,本文提供一種包含抗原呈遞細胞之組合物,該等細胞已在足以使SARS-CoV-2免疫原性抗原決定基由抗原呈遞細胞呈遞之條件下與單獨或與佐劑組合的SARS-CoV-2免疫原性多肽或編碼SARS-CoV-2免疫原性多肽之核酸活體外接觸。
在一些態樣中,本文提供一種用於製備對SARS-CoV-2蛋白具有特异性之淋巴球之方法。該方法包含在足以産生能够引出針對感染SARS-CoV-2病毒之細胞之免疫反應的SARS-CoV-2蛋白特异性淋巴球之條件下,使淋巴球與上文所述之抗原呈遞細胞接觸。因此,亦可使用抗原呈遞細胞來提供淋巴球,包括T淋巴球及B淋巴球,用於引出針對感染SARS-CoV-2病毒之細胞之免疫反應。
在一些實施例中,使T淋巴球製劑與上文所述之抗原呈遞細胞接觸一個時段(例如,至少約24小時)以將T淋巴球引至由抗原呈遞細胞呈遞之SARS-CoV-2免疫原性抗原決定基。
在一些實施例中,抗原呈遞細胞群體可與外周血T淋巴球之异源群體以及單獨或與佐劑組合的SARS-CoV-2免疫原性多肽或編碼SARS-CoV-2免疫原性多肽之核酸一起共培養。該等細胞可在足以使SARS-CoV-2多肽中包括之SARS-CoV-2抗原決定基由抗原呈遞細胞呈遞之條件下共培養持續一個時段,且引發T淋巴球群體對細胞作出反應之抗原呈遞細胞經SARS-CoV-2病毒感染。在某些實施例中,本文提供引發對感染SARS-CoV-2病毒之細胞作出反應之T淋巴球及B淋巴球。
T淋巴球可獲自任何合適來源,諸如外周血、脾臟及淋巴結。T淋巴球可用作粗製劑或部分經純化或實質上經純化製劑,其可藉由標準技術獲得,該等技術包括但不限於涉及使用抗體之免疫磁性或流式細胞術技術之方法。
在某些態樣中,本文提供一種組合物(例如,醫藥組合物),其包含上文所述之抗原呈遞細胞或淋巴球以及醫藥學上可接受之載劑及/或稀釋劑。在一些實施例中,該組合物進一步包含如上所述之佐劑。
在某些態樣中,本文提供一種用於引出對感染SARS-CoV-2病毒之細胞之免疫反應的方法,該方法包含向個體投與足以引出免疫反應之有效量的上文所述之抗原呈遞細胞或淋巴球。在一些實施例中,本文提供一種用於治療或預防COVID-19之方法,該方法包含向個體投與有效量之上文所述之抗原呈遞細胞或淋巴球。在一實施例中,抗原呈遞細胞或淋巴球係全身投與,較佳藉由注射投與。或者,吾人可例如經由直接注射至組織中來進行局部而非全身性投與,諸如在儲槽或持續釋放調配物中。
在某些實施例中,本文所述之抗原引發之抗原呈遞細胞及由此等抗原呈遞細胞産生的抗原特异性T淋巴球可用作免疫調節組合物中之活性化合物,用於預防性或治療性治療COVID-19。在一些實施例中,本文所述之SARS-CoV-2引發之抗原呈遞細胞可用於産生CD8
+T淋巴球、CD4
+T淋巴球及/或B淋巴球以用於過繼性轉移至個體。因此,例如,SARS-CoV-2特异性淋巴球可進行過繼性轉移以用於罹患COVID-19之個體之治療目的。
在某些實施例中,本文所述之抗原呈遞細胞及/或淋巴球可單獨或組合投與至個體,用於引出免疫反應,尤其引出對感染SARS-CoV-2病毒之細胞之免疫反應。在一些實施例中,抗原呈遞細胞及/或淋巴球可源自個體(亦即,自體細胞)或源自與個體MHC匹配或錯配之不同個體(例如,同種异體)。
可進行抗原呈遞細胞及淋巴球之單次或多次投與,其中細胞數目及治療係由護理人員(例如,醫師)選擇。在一些實施例中,抗原呈遞細胞及/或淋巴球係在醫藥學上可接受之載劑中投與。合適載劑可為其中生長有細胞之生長培養基,或任何合適緩衝培養基,諸如磷酸鹽緩衝生理食鹽水。該等細胞可單獨或作為與其他治療劑聯合之輔助療法投與。
IX. 套組
本發明亦涵蓋套組。舉例而言,該套組可包含封裝於合適容器中之免疫原性肽、包含編碼免疫原性肽之序列之載體、如本文所述之穩定MHC-肽複合物、佐劑及其組合,且可進一步包含使用此類試劑之說明書。該套組亦可含有其他組件,諸如封裝於單獨容器中之投與工具。
藉由以下實例進一步說明本發明,該等實例不應解釋為限制性的。本申請案中引用之所有參考文獻、專利及公開專利申請案之內容以及附圖均以引用之方式併入本文中。
實例 實例 1 : SARS-CoV-2 疫苗構築體
進行研究以建構將產生對SARS-CoV-2之最強可能CD8 T細胞反應之疫苗。這包括使對各個別抗原決定基之反應的量級以及總靶向抗原決定基之寬度增至最大。同時,疫苗設計面臨數種限制。一個重要考慮因素係整個疫苗構築體之有限尺寸;尺寸過大對疫苗遞送系統(諸如mRNA或病毒載體)構成挑戰且可阻礙完整構築體之有效表現。
該領域中對多抗原決定基疫苗產生真正強大的T細胞反應之能力存在相當大的懷疑。此懷疑集中於兩個主要挑戰上。第一個挑戰涉及疫苗中包括之抗原決定基的有限集合。多抗原決定基疫苗主要僅包括個別經編碼肽抗原決定基。相比之下,包括完整蛋白質之疫苗可加工成數千個不同抗原決定基–其中不同抗原決定基在不同MHC等位基因上呈遞。SARS-CoV-2 S蛋白尺寸之蛋白質含有如此多的潛在抗原決定基,使得針對每個可能的MHC等位基因存在多種經預測高親和力結合劑。多抗原決定基疫苗之挑戰係針對有限、MHC限制、預定義之抗原決定基集合引出比針對完整蛋白質將天然地獲得的反應更強之反應。第二個挑戰涉及在多抗原決定基疫苗之背景中該等抗原決定基之加工及呈遞。僅因為所發現之抗原決定基在SARS-CoV-2感染之背景中有效呈遞,並不意謂其將在多抗原決定基疫苗之背景中呈遞。由於多抗原決定基疫苗中包括之抗原決定基的數目有限,這一問題尤為嚴重;該疫苗中即使一小部分之抗原決定基未能呈遞亦可對該疫苗在特定MHC等位基因上引出反應之能力造成巨大影響。
此等挑戰在該領域中得到廣泛理解且已阻礙成功開發針對其他病毒之多抗原決定基疫苗。實際上,即使考慮到最近開展了SARS-CoV-2抗原決定基定位工作且鑑別了在各MHC等位基因上識別之高度免疫顯性抗原決定基之有限集合,人們仍對此等生物見解是否可能轉譯為克服此等基本挑戰之有效疫苗持相當大的懷疑態度。
在多抗原決定基疫苗之設計中作出兩組開放式決策,其包括1)該疫苗中包括之內容物及2)其中表現該內容物之背景。
探索這兩項決策之廣泛選擇。利用先前產生之獨特試劑(來自一組恢復期COVID19患者之高度活性記憶CD8 T細胞),設計多種疫苗以進行實驗檢查。
詳言之,由所設計之蛋白質疫苗序列回譯DNA序列且接著使用GenSmart™密碼子最佳化算法(GenScript, Inc.;亦參見PCT公開案WO 2020/0024917)進行序列最佳化。訂購呈gBlocks (Integrated DNA Technologies Inc.)形式之DNA且使用NEBuilder® HiFi DNA組裝主混合液(New England Biolabs;目錄#E2621S)將其組裝成EcoRI線性化pHAGE-CMV-IRES-Puro載體(Kula等人 (2019)
Cell178:1016-1028)。將總成轉化成Mix & Go!化學勝任細胞(Zymo Research;目錄#T3007)且選擇個別群落用於Sanger測序。
用各疫苗構築體以感染複數(MOI) 1轉導表現A*02:01之HEK293細胞且使用嘌呤黴素(1.5 ug/mL, Gibco)進行選擇。將5×10
4個細胞接種於96孔板中且靜置16 h。以2:1之效應子:標靶比率添加自恢復期COVID-19患者分離之記憶CD8 T細胞(Ferretti等人 (2020)
ImmunityS1074-7613(20)30447-7;在doi.org/10.1016/j.immuni.2020.10.006可獲得)且培育持續16-18小時。在培育之後,藉由移液管吸移使該等細胞混合,轉移至V型底96孔板,且藉由在300xg下離心持續5分鐘使其集結成粒。收集上清液且使用Ella (Protein Simple)來量測IFNγ。用BV421結合之抗CD8 (BioLegend)、AF647結合之抗CD69 (Biolegend)及PE結合之抗CD137 (Miltenyi)抗體對細胞集結粒進行染色,且在Cytoflex S (Beckman Coulter)上進行分析。
結果證明,該疫苗之背景及內容物均已以未預測之方式對其效能產生深刻影響。此外,據觀察,與臨床試驗中之當前疫苗候選物相比,所設計之疫苗構築體很有希望產生更強的CD8 T細胞反應。
鑑別了在六個最常見MHC等位基因上呈遞之免疫顯性抗原決定基:HLA-A*02:01、HLA-A*01:01、HLA-A*03:01、HLA-A*11:01、HLA-A*24:02及HLA-B*07:02。設計了多抗原決定基疫苗,其編碼全部29個已鑑別之免疫顯性抗原決定基(6個A2、8個A1、4個A3、5個A11、3個A24、3個B7)或19個免疫顯性抗原決定基(每個MHC有3-4個)。當選擇該19個抗原決定基時,包括在多個MHC等位基因上具有經預測或驗證之呈遞的抗原決定基。此19個抗原決定基包括下文所鑑別之表L1的子集。
下文表L由表L1及表L2構成,鑑別了可用於所揭示之構築體中的29個肽抗原決定基(例如表L1中之序列,及表L2中之額外數據)。應注意,表L清楚地證明orf3a、M及N以及orf1ab蛋白係用於容納T細胞抗原決定基之熱點。
表 L1
表 L2
等位基因 | 肽名稱 | 肽 | 蛋白質 | 開始 | 結束 | 多個HLA等位基因 | 用於19個抗原決定基之構築體 | |
0 | A02 | KLW | KLWAQCVQL | ORF1ab | 3886 | 3894 | 是 | |
1 | A02 | YLQ | YLQPRTFLL | S | 269 | 277 | 是 | |
2 | A02 | LLY | LLYDANYFL | ORF3a | 139 | 147 | 是 | |
3 | A02 | ALW | ALWEIQQVV | ORF1ab | 4094 | 4102 | 是 | |
4 | A02 | LLL | LLLDRLNQL | N | 222 | 230 | ||
5 | A02 | YLF | YLFDESGEFKL | ORF1ab | 906 | 916 | ||
6 | A01 | FTS | FTSDYYQLY | ORF3a | 207 | 215 | 是 | |
7 | A01 | TTD | TTDPSFLGRY | ORF1ab | 1637 | 1646 | 是 | |
8 | A01 | PTD | PTDNYITTY | ORF1ab | 1321 | 1329 | 是 | |
9 | A01 | ATS | ATSRTLSYY | M | 171 | 179 | 是(A01及A11) | |
10 | A01 | CTD | CTDDNALAYY | ORF1ab | 4163 | 4172 | ||
11 | A01 | NTC | NTCDGTTFTY | ORF1ab | 4082 | 4091 | ||
12 | A01 | DTD | DTDFVNEFY | ORF1ab | 5130 | 5138 | ||
13 | A01 | GTD | GTDLEGNFY | ORF1ab | 3437 | 3445 | ||
14 | A03 | KTF | KTFPPTEPK | N | 361 | 369 | 是(A03及A11) | 是 |
15 | A03 | KCY | KCYGVSPTK | S | 378 | 386 | 是 | |
16 | A03 | MVT | MVTNNTFTLK | ORF1ab | 807 | 816 | 是 | |
17 | A03 | KTI | KTIQPRVEK | ORF1ab | 282 | 290 | ||
18 | A11 | KTF | KTFPPTEPK | N | 361 | 369 | 是(A03及A11) | |
19 | A11 | VTD | VTDTPKGPK | ORF1ab | 4216 | 4224 | 是 | |
20 | A11 | ATE | ATEGALNTPK | N | 134 | 143 | 是 | |
21 | A11 | ASA | ASAFFGMSR | N | 311 | 319 | ||
22 | A11 | ATS | ATSRTLSYYK | M | 171 | 180 | 是(A01及A11) | 是 |
23 | A24 | QYI | QYIKWPWYI | S | 1208 | 1216 | 是 | |
24 | A24 | VYF | VYFLQSINF | ORF3a | 112 | 120 | 是 | |
25 | A24 | VYI | VYIGDPAQL | ORF1ab | 5721 | 5729 | 是 | |
26 | B07 | SPR | SPRWYFYYL | N | 105 | 113 | 是 | |
27 | B07 | RPD | RPDTRYVL | ORF1ab | 2949 | 2956 | 是 | |
28 | B07 | IPR | IPRRNVATL | ORF1ab | 5916 | 5924 | 是 |
等位基因 | 肽名稱 | 親和力(nM) | 部分% (螢幕M+ 2SD) | 部分% (四聚體) | |
0 | A02 | KLW | 17.7 | 88.9 | 77.8 |
1 | A02 | YLQ | 5.4 | 77.8 | 44.4 |
2 | A02 | LLY | 3.1 | 88.9 | 55.6 |
3 | A02 | ALW | 7.8 | 88.9 | 25.9 |
4 | A02 | LLL | 14.8 | 33.3 | 22.2 |
5 | A02 | YLF | 22.2 | 44.4 | 18.5 |
6 | A01 | FTS | 3.2 | 100 | |
7 | A01 | TTD | 7.2 | 100 | |
8 | A01 | PTD | 6.1 | 80 | |
9 | A01 | ATS | 16.7 | 60 | |
10 | A01 | CTD | 5.3 | 100 | |
11 | A01 | NTC | 121.8 | 60 | |
12 | A01 | DTD | 2.8 | 40 | |
13 | A01 | GTD | 6 | 40 | |
14 | A03 | KTF | 20.8 | 100 | |
15 | A03 | KCY | 152.6 | 100 | |
16 | A03 | MVT | 19.8 | 40 | |
17 | A03 | KTI | 113.2 | 40 | |
18 | A11 | KTF | 6.3 | 100 | |
19 | A11 | VTD | 160.6 | 60 | |
20 | A11 | ATE | 55.5 | 80 | |
21 | A11 | ASA | 14.4 | 40 | |
22 | A11 | ATS | 7.9 | 60 | |
23 | A24 | QYI | 13.2 | 60 | |
24 | A24 | VYF | 47.4 | 80 | |
25 | A24 | VYI | 206 | 40 | |
26 | B07 | SPR | 6.3 | 80 | |
27 | B07 | RPD | 56.9 | 80 | |
28 | B07 | IPR | 5.1 | 20 |
就疫苗背景而言,一個重要因素為抗原決定基之間的連接子。該連接子係該等抗原決定基是否有可能經有效加工及呈遞之關鍵決定因素。所測試之構築體完全不具有連接子(直接串接),在每個抗原決定基上游及下游具有3aa (相鄰抗原決定基之間總計6aa間距),或者在每個抗原決定基集合之間具有最佳化蛋白酶體裂解序列「KAA」。額外工作亦包括最佳化多抗原決定基疫苗內之抗原決定基次序。此處,目的係使以高親和力結合MHC但未在SARS-CoV-2基因組中發現之接合抗原決定基的產生減至最少;此類抗原決定基將與所需抗原決定基競爭呈遞。開發一種算法以迭代地改變抗原決定基次序,從而移除多抗原決定基構築體內之最高親和力的經預測抗原決定基。將此算法應用於10,000個不同的起始構築體且選擇具有最佳最終效能之變異體。詳言之,已確定促成差異之變數係在評估接合新抗原決定基時考慮哪些HLA等位基因之選擇。出於該算法之目的,選擇呈遞表L中之抗原決定基的6個HLA等位基因。接著,產生在所選擇之抗原決定基之間的所有可能接合之廣泛集合。使用NetMHC4.0算法(Jurtz等人 (2017)
J. Immunol.199:3360-3368)來確定所檢查之6個MHC等位基因上之MHC結合抗原決定基。對於每個接合,鑑別出未源自天然病毒序列(亦即,由於接合自身而產生)之最高親和力的經預測結合劑。接著,分配該等抗原決定基之隨機起始次序。對於既定次序,鑑別出最高親和力的經預測接合抗原決定基。評估可能在該構築體內交換兩個抗原決定基之所有可能方式,且選擇導致最低親和力的剩餘接合抗原決定基之抗原決定基交換。重複此過程,直至無抗原決定基交換可能進一步改良該構築體。此完整算法以10,000個隨機起始次序運行,且選擇表現最佳之最終次序(亦即,其中最高親和力的接合抗原決定基具有最低可能親和力之次序)。
在設計不同構築體之過程中,多抗原決定基疫苗內之個別抗原決定基的位置亦發生變化。最終,所設計之多抗原決定基疫苗係經建構為在細胞質中表現之獨立構築體,或在多順反子表現背景中經建構為在原生SARS-CoV-2 S蛋白之後(使用P2A序列使得在該S蛋白使用其天然信號序列進行跨膜表現之後,吾人之多抗原決定基疫苗能夠直接進行細胞質表現)。
為了評估此等構築體,使用慢病毒轉導(在低MOI下)在僅表現HLA-A*02:01之HEK293T細胞中表現各構築體。接著使經修飾HEK293T細胞與來自一組恢復期COVID-19患者(例如,A*02:01陽性COVID-19患者)之記憶CD8 T細胞進行共培養。使用IFNγ (IFNg)分泌來評估針對任何經呈遞抗原決定基之T細胞反應的強度。這提供了該等抗原決定基在每種疫苗之背景中呈遞之效率如何的讀數。基於先前的工作,已知大多數COVID19恢復期患者針對所測試之抗原決定基產生記憶CD8 T細胞,因此反應強度提供了該等抗原決定基在各疫苗構築體中有效呈遞之效率如何的直接讀數。
包括數個重要對照。首先,單獨測試HEK293T細胞(無任何病毒序列),該等細胞充當陰性對照(「A2 Screps」)。其次,使用用三個免疫顯性HLA-A*02:01 SARS-CoV-2抗原決定基之集合產生脈衝之肽作為陽性對照(由於肽脈衝以高效率直接裝載至MHC上) (「A2 Screps + KLW/YLQ/LLY」)。第三,單獨使用S蛋白。這是目前在臨床試驗中測試最佳之先導構築體,其允許使藉由多抗原決定基構築體引出之T細胞反應的量級與此基線進行比較。最後,跨越該三個免疫顯性HLA-A*02:01抗原決定基中之每一者的約500 aa大片段亦包括於脈衝實驗中。
實驗結果顯示於圖3及圖4中且測定了數個關鍵結果。
首先,觀察到抗原決定基呈遞之效率之間存在顯著差異,視各疫苗之背景而定。詳言之,使用在各抗原決定基上游及下游之三個胺基酸係經鑑別為優於不存在連接子或使用KAA連接子。其次,觀察到該構築體之細胞質表現至關重要。實際上,儘管S蛋白含有一個免疫顯性HLA-A*02:01抗原決定基,在任何患者中均觀察到對全長S蛋白之極其微弱反應。事實上,S蛋白中跨越此抗原決定基之500 aa片段(「ORF S-1」)之表現導致較強反應,由此突出顯示全長S蛋白導致特別差的呈遞。第三,觀察到多抗原決定基疫苗之直接表現導致比使用P2A序列更強之表現。一般而言,27個抗原決定基之表現導致比19個抗原決定基之表現更強的反應。
然而,最引人注目之收穫係整個疫苗構築體之效率。與單獨S蛋白相比,所有所測試之多抗原決定基構築體均導致顯著更強之T細胞反應,且數種最佳構築體比陽性對照肽脈衝表現更好。此結果非常令人驚訝,且強調了在使用適當抗原決定基、連接子及蛋白質背景時多抗原決定基疫苗之潛力。
此等結果與對多抗原決定基構築體之效用持懷疑態度的先前技術形成鮮明對比。舉例而言,Korber等人 (2009)
J. Virol.(2009) 83: 8300–8314提供了用於HIV之基於T-細胞之疫苗方法的廣泛概述,且在其關於多抗原決定基疫苗之部分中突出顯示了利用此理論方法所觀察到的免疫原性缺乏。
基於所進行之研究,已發現以下兩項很重要。首先,該等抗原決定基自身之身份。所包括之抗原決定基係具有最高水準之功能性驗證的彼等抗原決定基–其在實際SARS-CoV-2感染之背景中具有免疫顯性。已鑑別出其他抗原決定基,其係經預測的,藉由質譜分析在受感染細胞中偵測到,或在敏感抗原特異性擴增之後由恢復期患者識別出;這未顯示其具有免疫顯性(且因此在疫苗背景中,有可能最具免疫原性且由免疫系統有效地識別)。其次,所包括之抗原決定基的數目。在一些實施例中,選擇抗原決定基以涵蓋多種多樣的HLA類型(例如,每一個該6種最常見的HLA至少一個免疫顯性抗原決定基)。應注意,一些抗原決定基由多個HLA等位基因呈遞,因此有可能僅用4或5個抗原決定基在6種等位基因中之每一者上獲得單一免疫顯性抗原決定基。例如,因此可能用4、5、6個或更多個抗原決定基實現每一個該6種最常見的HLA至少一個免疫顯性抗原決定基之最低覆蓋,由此提供群體中之HLA多樣性的合理覆蓋–低於此類HLA多樣性覆蓋之疫苗將具有大的盲點且錯過具有次最佳HLA等位基因之患者。更廣泛地,咸信藉由添加更多抗原決定基顯著增加該疫苗之價值。在一些實施例中,該等構築體具有每一個該6種最常見的HLA至少兩個免疫顯性抗原決定基。所測試之構築體具有最少18個抗原決定基(在6個HLA等位基因中之每一者上大約3個),且咸信此舉增加產生強烈且廣泛反應。
咸信每一個HLA等位基因具有多個抗原決定基很重要,因為1)並非始終知曉哪些抗原決定基(或蛋白質)最具保護性,2)更有可能將針對所包括之抗原決定基中的至少一者產生強烈T細胞反應,及3)針對多個抗原決定基之T細胞反應對於功效及預防抗原逃逸變異體而言很重要。
以下因素經確定為具有可量測但相對較低之重要性。
一個因素係該等抗原決定基之間的連接子之身份。雖然多種連接子顯示一些功效,但使用3個胺基酸之連接子所見的抗原決定基呈遞之約2倍增強很有意義,不過更長連接子亦合適。
另一因素係該等抗原決定基之次序。使該等抗原決定基之次序最佳化以限制接合抗原決定基,但咸信具有多種抗原決定基次序之構築體顯示可相當的結果。對於何種接合抗原決定基被視為有問題,沒有硬性截止。一般而言,咸信高親和力的接合抗原決定基與所需抗原決定基競爭,且由此降低所觀察到之免疫反應的量級。對於該等疫苗構築體,移除經預測結合親和力< 77 nM (諸如≤ 75 nM、≤ 70 nM、≤ 65 nM、≤ 60 nM、≤ 55 nM、≤ 50 nM、≤ 45 nM、≤ 40 nM、≤ 35 nM、≤ 30 nM、≤ 25 nM、≤ 20 nM、≤ 15 nM、≤ 10 nM、≤ 5 nM或更低或者其間任何範圍(包括其),諸如50-75 nM)之所有接合抗原決定基。在所揭示之29個抗原決定基之疫苗的情況下,此意謂整個構築體中之22個最高親和力的經預測結合劑係尤為需要之抗原決定基。咸信具有經預測高親和力結合之單一抗原決定基將不具有顯著效應,且一般難以量測移除接合抗原決定基之益處。
此外,相關背景中之研究表明取向對呈遞效率幾乎無影響。理論上,N端抗原決定基可能更有效地呈遞片段,因為將始終合成N端,而一些缺陷蛋白產物可缺乏C端。然而,實驗數據表明抗原決定基在多個取向中之呈遞一般可相當。
由於整體疫苗構築體之尺寸限制,在添加抗原決定基重複對包括額外的新穎抗原決定基之間存在取捨。優先考慮額外的新穎抗原決定基以提供更廣泛HLA覆蓋及更多抗原決定基(從而提供更多病毒蛋白之覆蓋)。
根據初步分析,3aa連接子看來相對最有效。更長連接子可能與3aa同樣有效,但其需要更大的整體疫苗構築體且甚至無連接子疫苗亦顯示一些功效。因此,具有連接子總體上係有用的。
在一些實施例中,核糖體停止/再啟動位點為較佳的,因為其最強且最小。在某些實施例中,亦可使用IRES或轉譯後裂解序列。在一些實施例中,可使S蛋白與多抗原決定基疫苗共表現以使得能夠產生抗體反應。咸信該兩種蛋白質可能以任一次序表現。通常,第一種蛋白質將具有較高表現水準,且具有S蛋白之較高表現可能更為重要(若僅為了與單獨S蛋白疫苗進行直接比較)。預期該疫苗將以任一取向起作用。
一般而言,多順反子表現之替代方案係同時遞送兩種疫苗(使用如mRNA之遞送系統尤其容易進行)。
多種偵測方法可用於此等研究中。舉例而言,可使用四聚體染色來定量針對個別抗原決定基之T細胞,使用T細胞活化分析(例如,CD137染色、細胞內IFNg染色等)來定量反應性T細胞,且使用TCR測序來證明該疫苗再現了在天然感染中產生之TCR譜系。
實例 2 :額外 SARS-CoV-2 疫苗構築體及確認結果
為了進一步確認上述結果,設計額外SARS-CoV-2疫苗構築體,諸如圖9C-9E中所述之彼等。
亦執行額外分析以進一步確認上述結果。舉例而言,使用經調配為脂質奈米粒子(LNP)之疫苗構築體來進行多種活體外分析。圖10顯示自SARS-CoV-2患者分離之記憶T細胞與用圖9C中所述之疫苗構築體的代表性LNP調配物處理之細胞反應,由此證明細胞可有效地加工且呈遞抗原決定基,使得可以與受SARS-CoV-2感染之細胞相似的方式識別該等細胞。簡言之,根據製造商之說明書,使用CD8+記憶T細胞分離套組(Miltenyi, 目錄#130-094-412)自最近恢復之SARS-CoV-2患者(Tmem池)分離記憶T細胞。使Tmem池與表現HLA-A*02:01或HLA-B*07:02之無HLA I類HEK293T細胞進行共培養,該等細胞經圖9C中之構築體的1 ug/mL mRNA-LNP複合物處理。24小時之後,根據製造商之說明書,使用人類IFN-γ第3代Simple Plex Ella分析(Protein Simple, 目錄#SPCKB-PS-002574)來量測干擾素γ。
此外,可使用個別TCR純系作為試劑來評估特定抗原決定基之加工及呈遞(諸如圖11中所示之彼等代表性純系及數據)。例如,圖11顯示出圖6A中所述之27個抗原決定基之構築體中所含的四個個別抗原決定基以能夠由對SARS-CoV-2抗原決定基具特異性之TCR識別的方式經加工及呈遞。簡言之,使用EasySep™人類CD14陽性選擇套組II (StemCell Technologies, 17858)自HLA-A*02:01及HLA-B*07:02陽性健康供體分離單核球,且在介白素-4及顆粒球-巨噬細胞群落刺激因子存在下培養48小時以分化成單核球源性樹突狀細胞(moDC)。用含有來自圖6A中所述之構築體的1 ug/mL mRNA之LNP處理MoDC持續四小時,接著用TNFα、IL-1β、IL-6及PGE2處理。48小時後,使moDC與用個別TCR轉導之T細胞進行共培養,該等TCR各自識別表1A及表1F中所述之LLY、SPR、KLW或YLQ抗原決定基。藉由用AF647結合之抗CD69 (Biolegend, 目錄#310918)及PE結合之抗CD137 (Biolegend, 目錄#309804)抗體染色來量測TCR之活化,藉由流式細胞術(Cytoflex S, Beckman Coulter)進行偵測。
有趣的是,亦確定圖9C中所述之疫苗構築體的LNP調配物利用共同TRAV基因產生SARS-CoV-2抗原決定基特異性TCR (圖13-16)。
回應於天然SARS-CoV-2感染,識別SARS-CoV-2之相同免疫顯性抗原決定基的TCR共享共同TRAV基因且係自感染恢復之後不久由SARS-CoV-2患者之記憶T細胞(Tmem)利用的顯性TRAV基因(圖12)。為了確認疫苗構築體由使用與來自COVID患者之Tmem細胞相同的TCR基因之原生譜系擴增T細胞,執行活體外疫苗模型(圖13)。簡言之,使經含有來自圖9C中所述之構築體的1 ug/mL mRNA之LNP處理之moDC與自健康供體血液分離之原生CD8 T細胞進行共培養,該等健康供體血液係在SARS-CoV-2廣泛感染之前,在2019年使用EasySep™人類原生CD8+ T細胞分離套組II (StemCell, 17968)收集的。在96孔板之多個孔中分離共培養物以偵測來自原生譜系之特定純系的擴增。在10天擴增之後,將各孔分成四個複本且用所指示之肽的經螢光標記四聚體(Tetramer Shop, 目錄#HA02-070及HB07-017)對一個複本之每一個孔進行染色,且藉由流式細胞術(Cytoflex S, Beckman Coulter)進行量測。匯集剩餘之複本且用分別以來自表1A及表1F之1 ug/mL各肽產生脈衝之HLA-A*02:01或HLA-B*07:02單等位基因HEK293T細胞進行再刺激(圖13)。藉由流式細胞術(MoFlo Astrios EQ)對利用CD69及CD137染色鑑別之再活化T細胞進行分選且測序以測定由經擴增T細胞利用之TRAV基因。結果證明,產生脈衝之SARS-CoV-2免疫顯性肽(諸如YLQ肽)在該分析中誘導肽特異性T細胞之擴增(圖14)且圖9C中所述之疫苗構築體在該分析中誘導SARS-CoV特異性T細胞之擴增(圖15)。有趣的是,亦確定圖9C中所述之疫苗構築體的LNP調配物利用共同TRAV基因產生SARS-CoV-2抗原決定基特異性TCR (圖16)。
可執行額外確認實驗。
在一代表性實施例中,執行加工及呈遞分析。舉例而言,將構築體(例如,經調配為封裝mRNA之脂質奈米粒子(mRNA-LNP))引入樹突狀細胞(DC),該等樹突狀細胞係該構築體之標靶細胞。使經處理DC與抗原決定基特異性T細胞進行共培養且量測T細胞之反應性,諸如藉由分析表面活化標記物及IFNg。當T細胞作出反應時,該等抗原決定基可能適當地經加工及呈遞。為了比較構築體之抗原決定基加工及呈遞,使用EasySep™人類CD14陽性選擇套組II (StemCell Technologies, 17858)自具有匹配所關注之抗原決定基的HLA類型之健康供體分離單核球。在粒細胞群落刺激因子(GM-CSF)及介白素4 (IL-4)存在下培養單核球持續72 h以分化成moDC。72小時後,用含有各構築體之1 ug/mL mRNA之LNP處理moDC持續四小時且接著用TNFα、IL-1β、IL-6及PGE2處理。48小時後,以1:1 moDC:T細胞比率將經抗原決定基特異性TCR轉導之T細胞添加至培養物中且共培養持續24小時。藉由AIM CD69 (Biolegend, 目錄#309804)及CD137 (Biolegend, 目錄#309804)之流式細胞術染色來量測T細胞活化且藉由流式細胞術(Cytoflex S, Beckman Coulter)進行量測。能夠引出抗原決定基特異性T細胞之活化的構築體顯示,由TCR識別之抗原決定基充分地經加工及呈遞以誘導T細胞活化。此外,當在構築體之間比較單一抗原決定基之加工及呈遞時,由特定構築體引出之T細胞活化的較高水準係解釋為對於所量測之抗原決定基較高水準之加工及呈遞。
在另一代表性實施例中,執行活體外疫苗分析。舉例而言,再次將構築體(例如,mRNA-LNP調配物)引入至DC mRNA-LNP且使該等DC與來自2019年或更早收集之供體血液的原生T細胞(亦即,無COVID暴露)進行共培養。在96孔板之數百個孔中分離經共培養之細胞且藉由肽結合之MHC四聚體染色來量測抗原特異性擴增。藉由用抗原特異性純系鑑別之孔的數目來量測反應之量級(圖13)。在10天擴增之後,匯集T細胞且用表現所關注之單一HLA的HEK細胞進行再活化,再次用具有用於引出初始反應之構築體的1 ug/mL mRNA之LNP處理。用AIM CD69 (Biolegend, 目錄#309804)及CD137 (Biolegend, 目錄#309804)對細胞染色且對AIM雙陽性細胞進行分選,且對經重排TCR基因進行測序。該分析可比較對共培養作出反應之T細胞與來自COVID患者之記憶T細胞且分析經擴增T細胞之譜系。
在另一代表性實施例中,執行MHC擴增分析。例如,將構築體(例如,mRNA-LNP調配物)引入至表現匹配COVID患者記憶T細胞之HLA的單一HLA之細胞,諸如人類胚胎腎(HEK)細胞,以便確定SARS-CoV-2蛋白(諸如N、Orf3a及M)中之免疫原性區域是否含有在額外HLA上呈遞之抗原決定基,使得疫苗接種將在具有除上文所述之彼等HLA以外的HLA之個體中有效。為了評估將對該等構築體作出反應之人的理論百分率,使用CD8+記憶T細胞分離套組(Miltenyi, 目錄#130-094-412)自最近自SARS-CoV-2感染恢復且表現除表1中所述之已知抗原決定基的HLA以外之HLA之患者分離CD8 Tmem細胞且加以儲存。使Tmem細胞與表現匹配HLA之單等位基因HEK細胞進行共培養且藉由使用人類IFN-γ第3代Simple Plex Ella分析(Protein Simple, 目錄#SPCKB-PS-002574)量測IFNγ釋放來測定T細胞活化。因為經該等構築體處理之HEK含有單一HLA,故Tmem細胞之活化顯示該構築體上之抗原決定基係經加工且呈遞於所測試之HLA上。此外,對COVID患者Tmem細胞之識別說明,未定義之抗原決定基足以在暴露於SARS-CoV-2之患者的記憶譜系中產生特定T細胞,且具有所測試之HLA的患者將可能能夠產生T細胞對由該構築體遞送之抗原決定基的反應。
在另一代表性實施例中,執行活體內疫苗分析。例如,可用構築體使動物模型(例如經工程改造以表現人類TCR譜系及人類MHC之人類化小鼠模型,諸如VELOCI-T®小鼠模型;Regeneron, Inc.)及人類個體免疫以測定抗SARS-CoV-2免疫性且可使用肽結合之MHC四聚體染色、ELISPOT分析或共培養分析來量測抗原決定基特異性T細胞反應,其中使來自接種疫苗之小鼠或患者的Tmem細胞與經攜帶相應疫苗構築體之mRNA的LNP處理之單等位基因HEK進行共培養。
以引用之方式併入
本文所提及之所有出版物、專利及專利申請案均由此以引用之方式整體併入,就如同各個別出版物、專利或專利申請案特定地且個別地經指示以引用之方式併入一般。在發生衝突之情况下,將以本申請案(包括本文中之任何定義)為準。
亦以全文引用之方式併入引用與進入公共數據庫相關的寄存編號之任何聚核苷酸及多肽序列,諸如由美國基因組研究院(The Institute for Genomic Research;TIGR)在全球資訊網tigr.org處及/或美國國家生物技術資訊中心(National Center for Biotechnology Information;NCBI)在全球資訊網ncbi.nlm.nih.gov處所維持之彼等數據庫。
等效物
熟習此項技術者將認識到或能夠僅使用常規實驗來確定本文所述之本發明所涵蓋的特定實施例之多種等效物。此類等效物意欲由以下申請專利範圍涵蓋。
申請文件之專利含有至少一張以彩色繪製的圖式。帶有彩色圖之本專利或專利申請公開案之副本將在必要費用之請求及支付後由專利局提供。
圖 1顯示編碼免疫顯性抗原決定基之代表性多抗原決定基疫苗構築體(例如,免疫原性多肽之實施例)。
圖 2顯示代表性下一代SARS-CoV-2疫苗構築體(例如,免疫原性多肽之實施例)。
圖 3顯示COVID-19患者記憶CD8 T細胞對多種疫苗構築體之反應。數據係兩名患者之平均值(以個別點顯示)。
圖 4顯示與單獨S蛋白相比,所選疫苗構築體顯示優異CD8 T細胞活化。測試9名患者之記憶CD8 T細胞對SARS-CoV-2疫苗構築體之反應性以產生數據。
圖 5A-
圖 5C顯示代表性19-抗原決定基構築體。
圖 5A顯示具有3aa連接子之代表性19-抗原決定基構築體。
圖 5B顯示具有KAA連接子之代表性19-抗原決定基構築體。
圖 5C顯示不具有連接子之代表性19-抗原決定基構築體。
圖 6A-
圖 6C顯示代表性27-抗原決定基構築體。
圖 6A顯示具有3aa連接子之代表性27-抗原決定基構築體。
圖 6B顯示具有KAA連接子之代表性27-抗原決定基構築體。
圖 6C顯示不具有連接子之代表性27-抗原決定基構築體。
圖 7顯示代表性片段構築體(例如至少兩個肽片段之實施例,該等肽片段中之每一者均包含至少兩個肽抗原決定基)。
圖 8顯示與S蛋白區段及P2A融合之代表性片段構築體。
圖 9A-
圖 9E顯示代表性多抗原決定基構築體融合。
圖 9A顯示與S蛋白區段及P2A融合之具有3aa連接子之代表性19-抗原決定基構築體。
圖 9B顯示與S蛋白區段及P2A融合之具有3aa連接子之代表性27-抗原決定基構築體。
圖 9C顯示包含於來自SARS-CoV-2 N、Orf1a、M、Orf3a及S蛋白之14個片段中的代表性19-抗原決定基構築體。每一個片段由介於27個核苷酸至195個核苷酸之範圍內的核酸序列編碼且含有所發現之抗原決定基中的一或多者,涵蓋總計19種已知抗原決定基。設計14個片段之構築體以使其包括可由與所發現之抗原決定基相同的蛋白酶體片段呈遞之任何潛在免疫原性抗原決定基且包括可在除已知結合且呈遞所發現之抗原決定基之MHC分子以外的MHC分子上呈遞之潛在未發現抗原決定基。
圖 9D顯示包含於片段內之代表性多抗原決定基構築體,該等片段跨越整個(完整) SARS-CoV-2 M、N及Orf3a蛋白,但以非連續片段以及S蛋白片段表示,與來自SARS-CoV-2 Orf1ab及S蛋白之17個抗原決定基組合。此構築體係多抗原決定基構築體及基於片段之構築體的組合。例如,該構築體之5’部分係來自SARS-CoV-2之刺突及orf1ab蛋白的17個抗原決定基之多聯體,該等抗原決定基由周圍3個原生胺基酸連接在一起。該構築體之3’部分係共同跨越N、Orf3a及M蛋白且含有S蛋白的一個片段之片段之多聯體。為了避免產生功能性蛋白(例如,已知Orf3a蛋白具有免疫抑制活性),將N、Orf3a及M蛋白分成2-3個片段且藉由交替每一個片段之次序使其分散於序列中。所有27種發現之抗原決定基均在此構築體中表示。包括SARS-CoV-2基因組之整個(完整) N、Orf3a及M區,因為在針對該區域之尺寸進行調節時,N、Orf3a及M蛋白含有最高豐度之抗原決定基。不受理論束縛,咸信此區域具有引起免疫原性抗原決定基之加工及呈遞的生物學驅動因子,且因此有可能含有可由多種不同MHC呈遞之抗原決定基,從而潛在地擴大可回應於該構築體之患者的數目。圖中之標題B.1.617.2_S.PP係指來自δ變異體(B.1.617.2)之S蛋白的PP穩定化形式。此代表性構築體中包括之S蛋白的片段係來自SARS-CoV-2之δ變異體。
圖 9E顯示包含於片段內之代表性多抗原決定基構築體,該等片段跨越整個(完整) SARS-CoV-2 M、N及Orf3a蛋白,但以非連續片段表示,與來自SARS-CoV-2 ORF1ab及S蛋白之片段組合。B.1.617.2_S.PP_EpiFrag-M/N/ORF3a含有與圖9D中描述之Epi-M/N/ORF3a構築體相同的3’ N、Orf3a、M及S片段,除了5’ 17epi片段部分由來自圍繞圖9D之17個抗原決定基之Orf1ab及S蛋白的片段置換。其係來自14_片段抗原決定基之相同片段。圖中之標題B.1.617.2_S.PP係指來自δ變異體(B.1.617.2)之S蛋白的PP穩定化形式。此代表性構築體中包括之S蛋白的片段係來自SARS-CoV-2之δ變異體。圖9C-圖9E所示之代表性序列不包括額外序列,諸如連接子。舉例而言,3AA連接子係非必需的,因為較大片段為所鑑別之抗原決定基提供連接子空間,且未鑑別之抗原決定基係未定義的,以致連接子不存在確保了抗原決定基未直接處於區段之末端。該等區段未直接置於P2A位點處。一個例外係圖9D之多抗原決定基部分,其含有3AA連接子。
圖 10顯示來自SARS-CoV-2患者之記憶T細胞(Tmem)池識別圖9C之疫苗構築體。將十四(14)個片段之mRNA構築體(描述於圖9C中)與脂質奈米粒子一起引入至經修飾以表現單一MHC-I分子之單等位基因HEK293T細胞。使自恢復之SARS-CoV-2患者分離的記憶T細胞與構築體處理之單等位基因HEK293T細胞經受共培養且藉由利用ELISA量測干擾素γ釋放來測試對構築體之反應性。
圖 11顯示識別SARS-CoV-2之特異性抗原決定基的TCR與用含有圖6A之27多抗原決定基構築體之LNP處理的樹突狀細胞反應。在SARS-CoV2廣泛感染之前,自2019年在美國收集之血液中分離單核細胞源性樹突狀細胞(moDC)。用含有圖6A中之構築體之mRNA的LNP處理moDC。使對來自表1A或1F之每一個所指示抗原決定基具特異性的T細胞與LNP處理之moDC經受共培養且藉由活化誘導之標記物(AIM) CD69及CD137之流式細胞術染色來量測T細胞反應性。因此,充分地加工且呈遞含於此等構築體內之抗原決定基以引出抗原決定基特異性T細胞之反應。
圖 12顯示識別SARS-CoV-2之抗原決定基的TCR使用共同TRAV基因。顯示識別表1A及F之YLQ、KLW及SPR抗原決定基的特異性純系之頻率。突出顯示共享之顯性TRAV基因。亦參見Ferretti等人 (2020)
Immunity53: 1095-1107,尤其圖4以及用於證明TCR使用共同TRAV基因之額外支持的材料及方法。
圖 13顯示活體外疫苗模型之代表性、非限制性實例。
圖 14顯示在圖13之活體外疫苗模型中,脈衝SARS-CoV-2免疫顯性肽誘導來自原生T細胞群體之肽特異性T細胞的擴增。如所指示,使用MHC-肽四聚體染色來偵測肽特異性TCR。
圖 15顯示在圖13之活體外疫苗模型中,疫苗構築體誘導來自原生T細胞群體之肽特異性T細胞的擴增。
圖 16A- 圖 16C顯示對應於已知由所測試之MHC呈遞的抗原決定基(圖12)之已知V區在來自用圖9C之構築體處理的活體外疫苗模型而非來自未處理對照之頂部擴增TCR純系中佔優勢。圖16A說明經擴增純系之TRAV基因,突出顯示了對應於已知結合YLQ肽之TCR的已知TRAV基因,其中背景減去高於對照樣品之最大值的頻率。圖16B及16C說明當用表1A及F中描述之已知肽再刺激時,對應於圖9C之疫苗構築體的經擴增純系之TRAV基因。針對所測試之所指示MHC,突出顯示了對應於已知結合圖9C中之構築體內的肽之TCR之TRAV基因,其中背景減去高於對照樣品之最大值的頻率。因此,此等構築體在活體外疫苗模型中誘導原生T細胞之反應,該模型再現了對SARS-CoV-2天然感染之免疫反應。
<![CDATA[<110> TScan治療公司(TSCAN THERAPEUTICS, INC.)]]> AHS醫院集團(AHS HOSPITAL CORP.) <![CDATA[<120> SARS-COV-2免疫顯性肽構築體及其用途]]> <![CDATA[<130> TTC-00525]]> <![CDATA[<140> TW 110142318]]> <![CDATA[<141> 2021-11-12]]> <![CDATA[<150> US 63/113,024]]> <![CDATA[<151> 2020-11-12]]> <![CDATA[<160> 65 ]]> <![CDATA[<170> PatentIn 3.5版]]> <![CDATA[<210> 1]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 1]]> Lys Leu Trp Ala Gln Cys Val Gln Leu 1 5 <![CDATA[<210> 2]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 2]]> Tyr Leu Gln Pro Arg Thr Phe Leu Leu 1 5 <![CDATA[<210> 3]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 3]]> Leu Leu Tyr Asp Ala Asn Tyr Phe Leu 1 5 <![CDATA[<210> 4]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 4]]> Ala Leu Trp Glu Ile Gln Gln Val Val 1 5 <![CDATA[<210> 5]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 5]]> Leu Leu Leu Asp Arg Leu Asn Gln Leu 1 5 <![CDATA[<210> 6]]> <![CDATA[<211> 11]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 6]]> Tyr Leu Phe Asp Glu Ser Gly Glu Phe Lys Leu 1 5 10 <![CDATA[<210> 7]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 7]]> Phe Thr Ser Asp Tyr Tyr Gln Leu Tyr 1 5 <![CDATA[<210> 8]]> <![CDATA[<211> 10]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 8]]> Thr Thr Asp Pro Ser Phe Leu Gly Arg Tyr 1 5 10 <![CDATA[<210> 9]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 9]]> Pro Thr Asp Asn Tyr Ile Thr Thr Tyr 1 5 <![CDATA[<210> 10]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 10]]> Ala Thr Ser Arg Thr Leu Ser Tyr Tyr 1 5 <![CDATA[<210> 11]]> <![CDATA[<211> 10]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 11]]> Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr 1 5 10 <![CDATA[<210> 12]]> <![CDATA[<211> 10]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 12]]> Asn Thr Cys Asp Gly Thr Thr Phe Thr Tyr 1 5 10 <![CDATA[<210> 13]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 13]]> Asp Thr Asp Phe Val Asn Glu Phe Tyr 1 5 <![CDATA[<210> 14]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 14]]> Gly Thr Asp Leu Glu Gly Asn Phe Tyr 1 5 <![CDATA[<210> 15]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 15]]> Lys Thr Phe Pro Pro Thr Glu Pro Lys 1 5 <![CDATA[<210> 16]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 16]]> Lys Cys Tyr Gly Val Ser Pro Thr Lys 1 5 <![CDATA[<210> 17]]> <![CDATA[<211> 10]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 17]]> Met Val Thr Asn Asn Thr Phe Thr Leu Lys 1 5 10 <![CDATA[<210> 18]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 18]]> Lys Thr Ile Gln Pro Arg Val Glu Lys 1 5 <![CDATA[<210> 19]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 19]]> Val Thr Asp Thr Pro Lys Gly Pro Lys 1 5 <![CDATA[<210> 20]]> <![CDATA[<211> 10]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 20]]> Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys 1 5 10 <![CDATA[<210> 21]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 21]]> Ala Ser Ala Phe Phe Gly Met Ser Arg 1 5 <![CDATA[<210> 22]]> <![CDATA[<211> 10]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 22]]> Ala Thr Ser Arg Thr Leu Ser Tyr Tyr Lys 1 5 10 <![CDATA[<210> 23]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 23]]> Gln Tyr Ile Lys Trp Pro Trp Tyr Ile 1 5 <![CDATA[<210> 24]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 24]]> Val Tyr Phe Leu Gln Ser Ile Asn Phe 1 5 <![CDATA[<210> 25]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 25]]> Val Tyr Ile Gly Asp Pro Ala Gln Leu 1 5 <![CDATA[<210> 26]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 26]]> Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu 1 5 <![CDATA[<210> 27]]> <![CDATA[<211> 8]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 27]]> Arg Pro Asp Thr Arg Tyr Val Leu 1 5 <![CDATA[<210> 28]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 28]]> Ile Pro Arg Arg Asn Val Ala Thr Leu 1 5 <![CDATA[<210> 29]]> <![CDATA[<211> 288]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 多肽 <![CDATA[<400> 29]]> Tyr Ala Ser Ala Leu Trp Glu Ile Gln Gln Val Val Asp Ala Asp His 1 5 10 15 Ser Tyr Phe Thr Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Lys His 20 25 30 Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Asp Ala Tyr 35 40 45 Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys Ile Trp Val Ala 50 55 60 Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Ile Thr Val Ala 65 70 75 80 Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly Ala Tyr Ala Leu Val 85 90 95 Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ser Leu Glu Ile Pro 100 105 110 Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Pro Asn Met Met Val Thr 115 120 125 Asn Asn Thr Phe Thr Leu Lys Gly Gly Ala Lys Asn Pro Leu Leu Tyr 130 135 140 Asp Ala Asn Tyr Phe Leu Cys Trp His Lys Asp Leu Ser Pro Arg Trp 145 150 155 160 Tyr Phe Tyr Tyr Leu Gly Thr Gly Tyr Tyr His Thr Thr Asp Pro Ser 165 170 175 Phe Leu Gly Arg Tyr Met Ser Ala Glu Ser Leu Arg Pro Asp Thr Arg 180 185 190 Tyr Val Leu Met Asp Gly Arg Lys Val Pro Thr Asp Asn Tyr Ile Thr 195 200 205 Thr Tyr Pro Gly Gln Cys Arg Phe Val Thr Asp Thr Pro Lys Gly Pro 210 215 220 Lys Val Lys Tyr Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys 225 230 235 240 Leu Asn Asp Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp 245 250 255 Leu Gly Ser Ser Ser Lys Leu Trp Ala Gln Cys Val Gln Leu His Asn 260 265 270 Asp Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn 275 280 285 <![CDATA[<210> 30]]> <![CDATA[<211> 228]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 多肽 <![CDATA[<400> 30]]> Ala Leu Trp Glu Ile Gln Gln Val Val Lys Ala Ala Phe Thr Ser Asp 1 5 10 15 Tyr Tyr Gln Leu Tyr Lys Ala Ala Val Tyr Ile Gly Asp Pro Ala Gln 20 25 30 Leu Lys Ala Ala Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Ala Ala 35 40 45 Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Lys Ala Ala Ala Thr Ser 50 55 60 Arg Thr Leu Ser Tyr Tyr Lys Lys Ala Ala Val Tyr Phe Leu Gln Ser 65 70 75 80 Ile Asn Phe Lys Ala Ala Ile Pro Arg Arg Asn Val Ala Thr Leu Lys 85 90 95 Ala Ala Met Val Thr Asn Asn Thr Phe Thr Leu Lys Lys Ala Ala Leu 100 105 110 Leu Tyr Asp Ala Asn Tyr Phe Leu Lys Ala Ala Ser Pro Arg Trp Tyr 115 120 125 Phe Tyr Tyr Leu Lys Ala Ala Thr Thr Asp Pro Ser Phe Leu Gly Arg 130 135 140 Tyr Lys Ala Ala Arg Pro Asp Thr Arg Tyr Val Leu Lys Ala Ala Pro 145 150 155 160 Thr Asp Asn Tyr Ile Thr Thr Tyr Lys Ala Ala Val Thr Asp Thr Pro 165 170 175 Lys Gly Pro Lys Lys Ala Ala Lys Cys Tyr Gly Val Ser Pro Thr Lys 180 185 190 Lys Ala Ala Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Lys Ala Ala Lys 195 200 205 Leu Trp Ala Gln Cys Val Gln Leu Lys Ala Ala Tyr Leu Gln Pro Arg 210 215 220 Thr Phe Leu Leu 225 <![CDATA[<210> 31]]> <![CDATA[<211> 174]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 多肽 <![CDATA[<400> 31]]> Ala Leu Trp Glu Ile Gln Gln Val Val Phe Thr Ser Asp Tyr Tyr Gln 1 5 10 15 Leu Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Lys Thr Phe Pro Pro 20 25 30 Thr Glu Pro Lys Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Ala Thr 35 40 45 Ser Arg Thr Leu Ser Tyr Tyr Lys Val Tyr Phe Leu Gln Ser Ile Asn 50 55 60 Phe Ile Pro Arg Arg Asn Val Ala Thr Leu Met Val Thr Asn Asn Thr 65 70 75 80 Phe Thr Leu Lys Leu Leu Tyr Asp Ala Asn Tyr Phe Leu Ser Pro Arg 85 90 95 Trp Tyr Phe Tyr Tyr Leu Thr Thr Asp Pro Ser Phe Leu Gly Arg Tyr 100 105 110 Arg Pro Asp Thr Arg Tyr Val Leu Pro Thr Asp Asn Tyr Ile Thr Thr 115 120 125 Tyr Val Thr Asp Thr Pro Lys Gly Pro Lys Lys Cys Tyr Gly Val Ser 130 135 140 Pro Thr Lys Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Lys Leu Trp Ala 145 150 155 160 Gln Cys Val Gln Leu Tyr Leu Gln Pro Arg Thr Phe Leu Leu 165 170 <![CDATA[<210> 32]]> <![CDATA[<211> 412]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 多肽 <![CDATA[<400> 32]]> His Ser Tyr Phe Thr Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Lys 1 5 10 15 His Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Tyr Ala 20 25 30 Leu Val Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ala Thr Tyr 35 40 45 Tyr Leu Phe Asp Glu Ser Gly Glu Phe Lys Leu Ala Ser His Lys Asn 50 55 60 Pro Leu Leu Tyr Asp Ala Asn Tyr Phe Leu Cys Trp His Arg Lys Val 65 70 75 80 Pro Thr Asp Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Ile Thr Val Ala 85 90 95 Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly Ala Pro Asn Met Met 100 105 110 Val Thr Asn Asn Thr Phe Thr Leu Lys Gly Gly Ala Ser Ile Ile Lys 115 120 125 Thr Ile Gln Pro Arg Val Glu Lys Lys Lys Leu Lys Tyr Glu Gln Tyr 130 135 140 Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Lys Asp Leu Ser Pro Arg 145 150 155 160 Trp Tyr Phe Tyr Tyr Leu Gly Thr Gly Thr Tyr Lys Asn Thr Cys Asp 165 170 175 Gly Thr Thr Phe Thr Tyr Ala Ser Ala Val His Ala Gly Thr Asp Leu 180 185 190 Glu Gly Asn Phe Tyr Gly Pro Phe Glu Ser Leu Arg Pro Asp Thr Arg 195 200 205 Tyr Val Leu Met Asp Gly Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu 210 215 220 Ala Tyr Tyr Asn Thr Thr Ser Ser Ser Lys Leu Trp Ala Gln Cys Val 225 230 235 240 Gln Leu His Asn Asp Tyr Ala Ser Ala Leu Trp Glu Ile Gln Gln Val 245 250 255 Val Asp Ala Asp Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys 260 265 270 Lys Asp Lys Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu 275 280 285 Asn Asp Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile Gly 290 295 300 Met Leu Ala Leu Leu Leu Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys 305 310 315 320 Ser Leu Glu Ile Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Tyr 325 330 335 Tyr His Thr Thr Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Arg 340 345 350 Asp Val Asp Thr Asp Phe Val Asn Glu Phe Tyr Ala Tyr Leu Cys Arg 355 360 365 Phe Val Thr Asp Thr Pro Lys Gly Pro Lys Val Lys Tyr Ile Trp Val 370 375 380 Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Tyr Val Gly 385 390 395 400 Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn 405 410 <![CDATA[<210> 33]]> <![CDATA[<211> 328]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 多肽 <![CDATA[<400> 33]]> Phe Thr Ser Asp Tyr Tyr Gln Leu Tyr Lys Ala Ala Val Tyr Ile Gly 1 5 10 15 Asp Pro Ala Gln Leu Lys Ala Ala Val Tyr Phe Leu Gln Ser Ile Asn 20 25 30 Phe Lys Ala Ala Tyr Leu Phe Asp Glu Ser Gly Glu Phe Lys Leu Lys 35 40 45 Ala Ala Leu Leu Tyr Asp Ala Asn Tyr Phe Leu Lys Ala Ala Pro Thr 50 55 60 Asp Asn Tyr Ile Thr Thr Tyr Lys Ala Ala Ala Thr Ser Arg Thr Leu 65 70 75 80 Ser Tyr Tyr Lys Lys Ala Ala Met Val Thr Asn Asn Thr Phe Thr Leu 85 90 95 Lys Lys Ala Ala Lys Thr Ile Gln Pro Arg Val Glu Lys Lys Ala Ala 100 105 110 Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Lys Ala Ala Ser Pro Arg Trp 115 120 125 Tyr Phe Tyr Tyr Leu Lys Ala Ala Asn Thr Cys Asp Gly Thr Thr Phe 130 135 140 Thr Tyr Lys Ala Ala Gly Thr Asp Leu Glu Gly Asn Phe Tyr Lys Ala 145 150 155 160 Ala Arg Pro Asp Thr Arg Tyr Val Leu Lys Ala Ala Cys Thr Asp Asp 165 170 175 Asn Ala Leu Ala Tyr Tyr Lys Ala Ala Lys Leu Trp Ala Gln Cys Val 180 185 190 Gln Leu Lys Ala Ala Ala Leu Trp Glu Ile Gln Gln Val Val Lys Ala 195 200 205 Ala Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Ala Ala Lys Cys Tyr 210 215 220 Gly Val Ser Pro Thr Lys Lys Ala Ala Ala Ser Ala Phe Phe Gly Met 225 230 235 240 Ser Arg Lys Ala Ala Leu Leu Leu Asp Arg Leu Asn Gln Leu Lys Ala 245 250 255 Ala Ile Pro Arg Arg Asn Val Ala Thr Leu Lys Ala Ala Thr Thr Asp 260 265 270 Pro Ser Phe Leu Gly Arg Tyr Lys Ala Ala Asp Thr Asp Phe Val Asn 275 280 285 Glu Phe Tyr Lys Ala Ala Val Thr Asp Thr Pro Lys Gly Pro Lys Lys 290 295 300 Ala Ala Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Lys Ala Ala Tyr 305 310 315 320 Leu Gln Pro Arg Thr Phe Leu Leu 325 <![CDATA[<210> 34]]> <![CDATA[<211> 250]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 多肽 <![CDATA[<400> 34]]> Phe Thr Ser Asp Tyr Tyr Gln Leu Tyr Val Tyr Ile Gly Asp Pro Ala 1 5 10 15 Gln Leu Val Tyr Phe Leu Gln Ser Ile Asn Phe Tyr Leu Phe Asp Glu 20 25 30 Ser Gly Glu Phe Lys Leu Leu Leu Tyr Asp Ala Asn Tyr Phe Leu Pro 35 40 45 Thr Asp Asn Tyr Ile Thr Thr Tyr Ala Thr Ser Arg Thr Leu Ser Tyr 50 55 60 Tyr Lys Met Val Thr Asn Asn Thr Phe Thr Leu Lys Lys Thr Ile Gln 65 70 75 80 Pro Arg Val Glu Lys Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Ser Pro 85 90 95 Arg Trp Tyr Phe Tyr Tyr Leu Asn Thr Cys Asp Gly Thr Thr Phe Thr 100 105 110 Tyr Gly Thr Asp Leu Glu Gly Asn Phe Tyr Arg Pro Asp Thr Arg Tyr 115 120 125 Val Leu Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Lys Leu Trp Ala 130 135 140 Gln Cys Val Gln Leu Ala Leu Trp Glu Ile Gln Gln Val Val Lys Thr 145 150 155 160 Phe Pro Pro Thr Glu Pro Lys Lys Cys Tyr Gly Val Ser Pro Thr Lys 165 170 175 Ala Ser Ala Phe Phe Gly Met Ser Arg Leu Leu Leu Asp Arg Leu Asn 180 185 190 Gln Leu Ile Pro Arg Arg Asn Val Ala Thr Leu Thr Thr Asp Pro Ser 195 200 205 Phe Leu Gly Arg Tyr Asp Thr Asp Phe Val Asn Glu Phe Tyr Val Thr 210 215 220 Asp Thr Pro Lys Gly Pro Lys Ala Thr Glu Gly Ala Leu Asn Thr Pro 225 230 235 240 Lys Tyr Leu Gln Pro Arg Thr Phe Leu Leu 245 250 <![CDATA[<210> 35]]> <![CDATA[<211> 500]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 多肽 <![CDATA[<400> 35]]> Tyr Ala Leu Val Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile 1 5 10 15 Met Arg Leu Trp Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu 20 25 30 Tyr Asp Ala Asn Tyr Phe Leu Cys Trp His Gly Asp Gly Lys Met Lys 35 40 45 Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr Gly Pro Glu 50 55 60 Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp Gly Ile Ile Trp Val Ala 65 70 75 80 Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Gly Thr Arg Asn 85 90 95 Pro Glu Lys Tyr Cys Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn 100 105 110 Thr Phe Thr Leu Lys Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Thr 115 120 125 Tyr Lys Asn Thr Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu 130 135 140 Trp Glu Ile Gln Gln Val Val Asp Ala Asp Leu Asn Glu Ser Leu Ile 145 150 155 160 Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp 165 170 175 Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val 180 185 190 Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn Thr Thr 195 200 205 Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu Gln Asp Leu 210 215 220 Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly Thr Ile Tyr Thr 225 230 235 240 Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp Thr Pro Lys Gly Pro 245 250 255 Lys Val Lys Tyr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr 260 265 270 Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr Lys 275 280 285 Lys Trp Ile Thr Val Ala Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu 290 295 300 Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly Phe Ala Ala Tyr Ser 305 310 315 320 Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp His Ser Ser Ser 325 330 335 Ser Asp Asn Ile Ala Leu Leu Val Gln Val Leu Gln Gln Leu Arg Val 340 345 350 Glu Ser Ser Ser Lys Leu Trp Ala Gln Cys Val Gln Leu His Asn Asp 355 360 365 Ile Leu Leu Ala Lys Asp Thr Ala Pro Ser Ala Ser Ala Phe Phe Gly 370 375 380 Met Ser Arg Ile Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr 385 390 395 400 Tyr Thr Gly Ala Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp 405 410 415 Gln Val Ile Leu Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro 420 425 430 Pro Thr Glu Pro Lys Lys Asp Lys Ser Lys Leu Ile Glu Tyr Thr Asp 435 440 445 Phe Ala Thr Ser Ala Cys Val Leu Ala Ala Glu Cys Thr Ile Phe Lys 450 455 460 Asp Ala Ser Gly Lys Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu 465 470 475 480 Glu Gly Ser Val Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val 485 490 495 Leu Met Asp Gly 500 <![CDATA[<210> 36]]> <![CDATA[<211> 1588]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 多肽 <![CDATA[<400> 36]]> Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr Arg Ala Lys Arg Ser 1265 1270 1275 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp 1280 1285 1290 Val Glu Glu Asn Pro Gly Pro Tyr Ala Ser Ala Leu Trp Glu Ile 1295 1300 1305 Gln Gln Val Val Asp Ala Asp His Ser Tyr Phe Thr Ser Asp Tyr 1310 1315 1320 Tyr Gln Leu Tyr Ser Thr Gln Lys His Tyr Val Tyr Ile Gly Asp 1325 1330 1335 Pro Ala Gln Leu Pro Ala Pro Asp Ala Tyr Lys Thr Phe Pro Pro 1340 1345 1350 Thr Glu Pro Lys Lys Asp Lys Ile Trp Val Ala Thr Glu Gly Ala 1355 1360 1365 Leu Asn Thr Pro Lys Asp His Ile Ile Thr Val Ala Thr Ser Arg 1370 1375 1380 Thr Leu Ser Tyr Tyr Lys Leu Gly Ala Tyr Ala Leu Val Tyr Phe 1385 1390 1395 Leu Gln Ser Ile Asn Phe Val Arg Ile Ser Leu Glu Ile Pro Arg 1400 1405 1410 Arg Asn Val Ala Thr Leu Gln Ala Glu Pro Asn Met Met Val Thr 1415 1420 1425 Asn Asn Thr Phe Thr Leu Lys Gly Gly Ala Lys Asn Pro Leu Leu 1430 1435 1440 Tyr Asp Ala Asn Tyr Phe Leu Cys Trp His Lys Asp Leu Ser Pro 1445 1450 1455 Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr Gly Tyr Tyr His Thr Thr 1460 1465 1470 Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Glu Ser Leu Arg 1475 1480 1485 Pro Asp Thr Arg Tyr Val Leu Met Asp Gly Arg Lys Val Pro Thr 1490 1495 1500 Asp Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Cys Arg Phe Val Thr 1505 1510 1515 Asp Thr Pro Lys Gly Pro Lys Val Lys Tyr Ser Thr Phe Lys Cys 1520 1525 1530 Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Lys Tyr Glu Gln Tyr 1535 1540 1545 Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Ser Ser Ser Lys Leu 1550 1555 1560 Trp Ala Gln Cys Val Gln Leu His Asn Asp Tyr Val Gly Tyr Leu 1565 1570 1575 Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn 1580 1585 <![CDATA[<210> 37]]> <![CDATA[<211> 1712]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 多肽 <![CDATA[<400> 37]]> Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr Arg Ala Lys Arg Ser 1265 1270 1275 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp 1280 1285 1290 Val Glu Glu Asn Pro Gly Pro His Ser Tyr Phe Thr Ser Asp Tyr 1295 1300 1305 Tyr Gln Leu Tyr Ser Thr Gln Lys His Tyr Val Tyr Ile Gly Asp 1310 1315 1320 Pro Ala Gln Leu Pro Ala Pro Tyr Ala Leu Val Tyr Phe Leu Gln 1325 1330 1335 Ser Ile Asn Phe Val Arg Ile Ala Thr Tyr Tyr Leu Phe Asp Glu 1340 1345 1350 Ser Gly Glu Phe Lys Leu Ala Ser His Lys Asn Pro Leu Leu Tyr 1355 1360 1365 Asp Ala Asn Tyr Phe Leu Cys Trp His Arg Lys Val Pro Thr Asp 1370 1375 1380 Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Ile Thr Val Ala Thr Ser 1385 1390 1395 Arg Thr Leu Ser Tyr Tyr Lys Leu Gly Ala Pro Asn Met Met Val 1400 1405 1410 Thr Asn Asn Thr Phe Thr Leu Lys Gly Gly Ala Ser Ile Ile Lys 1415 1420 1425 Thr Ile Gln Pro Arg Val Glu Lys Lys Lys Leu Lys Tyr Glu Gln 1430 1435 1440 Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Lys Asp Leu Ser 1445 1450 1455 Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr Gly Thr Tyr Lys Asn 1460 1465 1470 Thr Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Val His Ala 1475 1480 1485 Gly Thr Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Glu Ser Leu 1490 1495 1500 Arg Pro Asp Thr Arg Tyr Val Leu Met Asp Gly Gln Thr Ala Cys 1505 1510 1515 Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn Thr Thr Ser Ser Ser 1520 1525 1530 Lys Leu Trp Ala Gln Cys Val Gln Leu His Asn Asp Tyr Ala Ser 1535 1540 1545 Ala Leu Trp Glu Ile Gln Gln Val Val Asp Ala Asp Asp Ala Tyr 1550 1555 1560 Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys Ser Thr Phe 1565 1570 1575 Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Ala Pro Ser 1580 1585 1590 Ala Ser Ala Phe Phe Gly Met Ser Arg Ile Gly Met Leu Ala Leu 1595 1600 1605 Leu Leu Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Ser Leu Glu 1610 1615 1620 Ile Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Tyr Tyr His 1625 1630 1635 Thr Thr Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Arg Asp 1640 1645 1650 Val Asp Thr Asp Phe Val Asn Glu Phe Tyr Ala Tyr Leu Cys Arg 1655 1660 1665 Phe Val Thr Asp Thr Pro Lys Gly Pro Lys Val Lys Tyr Ile Trp 1670 1675 1680 Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Tyr 1685 1690 1695 Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn 1700 1705 1710 <![CDATA[<210> 38]]> <![CDATA[<211> 546]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 多肽 <![CDATA[<400> 38]]> Met Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr Asp Pro Ser 1 5 10 15 Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr Lys Lys Trp Val 20 25 30 Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp Ala Gln Cys 35 40 45 Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp Thr Ala Pro Ser 50 55 60 Ala Ser Ala Phe Phe Gly Met Ser Arg Ile Gly Met Glu Val Thr Pro 65 70 75 80 Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala Ile Lys Leu Asp Asp Lys 85 90 95 Asp Pro Asn Phe Lys Asp Gln Val Ile Leu Leu Asn Lys His Ile Asp 100 105 110 Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys Ser Leu 115 120 125 Glu Ile Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Leu Asn Glu 130 135 140 Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys 145 150 155 160 Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile 165 170 175 Val Met Val Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr 180 185 190 Asn Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu 195 200 205 Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly Thr 210 215 220 Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp Thr Pro 225 230 235 240 Lys Gly Pro Lys Val Lys Tyr Ser Ile Ile Lys Thr Ile Gln Pro Arg 245 250 255 Val Glu Lys Lys Lys Leu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser 260 265 270 Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly Phe 275 280 285 Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp 290 295 300 His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln Ser Lys Leu 305 310 315 320 Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys Val Leu Ala Ala Glu 325 330 335 Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys Pro Val Pro Tyr Cys Tyr 340 345 350 Asp Thr Asn Val Leu Glu Gly Ser Val Ala Tyr Glu Ser Leu Arg Pro 355 360 365 Asp Thr Arg Tyr Val Leu Met Asp Gly Glu Lys Tyr Cys Ala Leu Ala 370 375 380 Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys Gly Gly Ala 385 390 395 400 Pro Thr Lys Val Thr Phe Gly Gly Asp Gly Lys Met Lys Asp Leu Ser 405 410 415 Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr Gly Pro Glu Ala Gly Leu 420 425 430 Pro Tyr Gly Ala Asn Lys Asp Gly Ile Ile Trp Val Ala Thr Glu Gly 435 440 445 Ala Leu Asn Thr Pro Lys Asp His Ile Gly Thr Arg Asn Pro Tyr Ala 450 455 460 Leu Val Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg 465 470 475 480 Leu Trp Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp 485 490 495 Ala Asn Tyr Phe Leu Cys Trp His Thr Tyr Lys Asn Thr Cys Asp Gly 500 505 510 Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile Gln Gln Val Val 515 520 525 Asp Ala Asp Lys His Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Pro 530 535 540 Ala Pro 545 <![CDATA[<210> 39]]> <![CDATA[<211> 1099]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 多肽 <![CDATA[<400> 39]]> Met Tyr Ala Ser Ala Leu Trp Glu Ile Gln Gln Val Val Asp Ala Asp 1 5 10 15 Ser Ser Ser Lys Leu Trp Ala Gln Cys Val Gln Leu His Asn Asp Lys 20 25 30 His Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Ser Leu 35 40 45 Glu Ile Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Arg Asp Val 50 55 60 Asp Thr Asp Phe Val Asn Glu Phe Tyr Ala Tyr Leu Thr Tyr Lys Asn 65 70 75 80 Thr Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Pro Asn Met Met 85 90 95 Val Thr Asn Asn Thr Phe Thr Leu Lys Gly Gly Ala Ala Thr Tyr Tyr 100 105 110 Leu Phe Asp Glu Ser Gly Glu Phe Lys Leu Ala Ser His Tyr Tyr His 115 120 125 Thr Thr Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Glu Ser Leu 130 135 140 Arg Pro Asp Thr Arg Tyr Val Leu Met Asp Gly Gln Thr Ala Cys Thr 145 150 155 160 Asp Asp Asn Ala Leu Ala Tyr Tyr Asn Thr Thr Ser Ile Ile Lys Thr 165 170 175 Ile Gln Pro Arg Val Glu Lys Lys Lys Leu Cys Arg Phe Val Thr Asp 180 185 190 Thr Pro Lys Gly Pro Lys Val Lys Tyr Ser Thr Phe Lys Cys Tyr Gly 195 200 205 Val Ser Pro Thr Lys Leu Asn Asp Arg Lys Val Pro Thr Asp Asn Tyr 210 215 220 Ile Thr Thr Tyr Pro Gly Gln Val His Ala Gly Thr Asp Leu Glu Gly 225 230 235 240 Asn Phe Tyr Gly Pro Phe Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe 245 250 255 Leu Leu Lys Tyr Asn Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg 260 265 270 Trp Tyr Phe Tyr Tyr Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr 275 280 285 Gly Ala Asn Lys Asp Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu 290 295 300 Asn Thr Pro Lys Asp His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala 305 310 315 320 Ala Ile Val Leu Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe 325 330 335 Tyr Ala Glu Gly Ser Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser 340 345 350 Ser Arg Ser Arg Asn Ser Ser Arg Asn Ser Thr Pro Gly Glu Lys Trp 355 360 365 Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr Ser 370 375 380 Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly Val 385 390 395 400 Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro Glu 405 410 415 Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val Asn 420 425 430 Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser Val 435 440 445 Pro Leu Ser Ser Met Gly Thr Ser Pro Ala Arg Met Ala Gly Asn Gly 450 455 460 Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu Asp Arg Leu Asn Gln Leu 465 470 475 480 Glu Ser Lys Met Ser Gly Lys Gly Gln Gln Gln Gln Gly Gln Thr Val 485 490 495 Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys Lys Pro Arg Gln Lys Arg 500 505 510 Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln Ala Phe Gly Arg Arg Gly 515 520 525 Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp Gln Glu Leu Ile Arg Gln 530 535 540 Gly Thr Asp Tyr Lys His Trp Pro Gln Ile Ala Gln Phe Lys Gln Gly 545 550 555 560 Glu Ile Lys Asp Ala Thr Pro Leu Asp Phe Val Arg Ala Thr Ala Thr 565 570 575 Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val Gly Val 580 585 590 Ala Leu Leu Ala Val Phe Gln Ser Ala Ser Lys Ile Ile Thr Leu Lys 595 600 605 Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val Cys Asn 610 615 620 Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu Val Ala 625 630 635 640 Ala Gly Leu Glu Ala Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn 645 650 655 Ala Pro Arg Ile Thr Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn 660 665 670 Gln Asn Gly Glu Arg Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln 675 680 685 Gly Leu Pro Asn Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His 690 695 700 Gly Lys Glu Gly Leu Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn 705 710 715 720 Thr Asn Ser Ser Pro Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr 725 730 735 Arg Arg Ile Arg Gly Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe 740 745 750 Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile 755 760 765 Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile 770 775 780 Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp 785 790 795 800 Ile Lys Asp Leu Pro Lys Glu Pro Phe Leu Tyr Leu Tyr Ala Leu Val 805 810 815 Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp 820 825 830 Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn 835 840 845 Tyr Phe Leu Cys Trp His Thr Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr 850 855 860 Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr 865 870 875 880 Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Ala Pro 885 890 895 Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile Gly Met Glu Val Thr 900 905 910 Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala Ile Lys Leu Asp Asp 915 920 925 Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu Leu Asn Lys His Ile 930 935 940 Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys Lys 945 950 955 960 Lys Lys Ala Tyr Glu Thr Gln Ala Leu Pro Gln Arg Gln Lys Lys Gln 965 970 975 Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu Asp Asp Phe Ser Lys 980 985 990 Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser Thr Gln Ala Ile Thr 995 1000 1005 Val Ala Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly Ala Ser 1010 1015 1020 Gln Arg Val Ala Gly Asp Ser Gly Phe Ala Ala Tyr Ser Arg Tyr 1025 1030 1035 Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp His Ser Ser Ser Ser 1040 1045 1050 Asp Asn Ile Ala Leu Leu Val Gln Leu Asn Glu Ser Leu Ile Asp 1055 1060 1065 Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp 1070 1075 1080 Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met 1085 1090 1095 Val <![CDATA[<210> 40]]> <![CDATA[<211> 1221]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 多肽 <![CDATA[<400> 40]]> Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly Glu Phe Lys Leu Ala 1 5 10 15 Ser His Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys 20 25 30 Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys Pro 35 40 45 Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val Ala Tyr 50 55 60 Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp Gly Arg Lys 65 70 75 80 Val Pro Thr Asp Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gln Thr Ala 85 90 95 Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn Thr Thr Lys Gly Gly 100 105 110 Arg Phe Val Leu Ala Leu Leu Ser Asp Leu Gln Asp Leu Lys Trp Ala 115 120 125 Arg Phe Pro Lys Ser Asp Gly Thr Gly Thr Ile Tyr Thr Glu Leu Glu 130 135 140 Pro Pro Cys Arg Phe Val Thr Asp Thr Pro Lys Gly Pro Lys Val Lys 145 150 155 160 Tyr Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp 165 170 175 Arg Asp Val Asp Thr Asp Phe Val Asn Glu Phe Tyr Ala Tyr Leu Thr 180 185 190 Tyr Lys Asn Thr Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu 195 200 205 Trp Glu Ile Gln Gln Val Val Asp Ala Asp Leu Arg Val Glu Ala Phe 210 215 220 Glu Tyr Tyr His Thr Thr Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser 225 230 235 240 Ala Leu Asn His Thr Lys Lys Trp Lys His Tyr Val Tyr Ile Gly Asp 245 250 255 Pro Ala Gln Leu Pro Ala Pro Ser Leu Glu Ile Pro Arg Arg Asn Val 260 265 270 Ala Thr Leu Gln Ala Glu Val Leu Gln Gln Leu Arg Val Glu Ser Ser 275 280 285 Ser Lys Leu Trp Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu 290 295 300 Ala Lys Asp Thr Val His Ala Gly Thr Asp Leu Glu Gly Asn Phe Tyr 305 310 315 320 Gly Pro Phe Ser Ile Ile Lys Thr Ile Gln Pro Arg Val Glu Lys Lys 325 330 335 Lys Leu Glu Lys Tyr Cys Ala Leu Ala Pro Asn Met Met Val Thr Asn 340 345 350 Asn Thr Phe Thr Leu Lys Gly Gly Ala Pro Thr Lys Val Thr Phe Gly 355 360 365 Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Gly 370 375 380 Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu 385 390 395 400 Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp Gly 405 410 415 Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His 420 425 430 Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln Leu 435 440 445 Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser Arg 450 455 460 Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn Ser 465 470 475 480 Ser Arg Asn Ser Thr Pro Gly Glu Lys Trp Glu Ser Gly Val Lys Asp 485 490 495 Cys Val Val Leu His Ser Tyr Phe Thr Ser Asp Tyr Tyr Gln Leu Tyr 500 505 510 Ser Thr Gln Leu Ser Thr Asp Thr Gly Val Glu His Val Thr Phe Phe 515 520 525 Ile Tyr Asn Lys Ile Val Asp Glu Pro Glu Glu His Val Gln Ile His 530 535 540 Thr Ile Asp Gly Ser Ser Gly Val Val Asn Pro Val Met Glu Pro Ile 545 550 555 560 Tyr Asp Glu Pro Thr Thr Thr Thr Ser Val Pro Leu Ser Ser Met Gly 565 570 575 Thr Ser Pro Ala Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala 580 585 590 Leu Leu Leu Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly 595 600 605 Lys Gly Gln Gln Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala 610 615 620 Glu Ala Ser Lys Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr 625 630 635 640 Asn Val Thr Gln Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly 645 650 655 Asn Phe Gly Asp Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His 660 665 670 Trp Pro Gln Ile Ala Gln Phe Lys Gln Gly Glu Ile Lys Asp Ala Thr 675 680 685 Pro Leu Asp Phe Val Arg Ala Thr Ala Thr Ile Pro Ile Gln Ala Ser 690 695 700 Leu Pro Phe Gly Trp Leu Ile Val Gly Val Ala Leu Leu Ala Val Phe 705 710 715 720 Gln Ser Ala Ser Lys Ile Ile Thr Leu Lys Lys Arg Trp Gln Leu Ala 725 730 735 Leu Ser Lys Gly Val His Phe Val Cys Asn Leu Leu Leu Leu Phe Val 740 745 750 Thr Val Tyr Ser His Leu Leu Leu Val Ala Ala Gly Leu Glu Ala Met 755 760 765 Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr Phe 770 775 780 Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg Ser 785 790 795 800 Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn Thr 805 810 815 Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Gly Leu Lys 820 825 830 Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro Asp 835 840 845 Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly Leu 850 855 860 Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn Pro Glu Thr Asn Ile 865 870 875 880 Leu Leu Asn Val Pro Leu His Gly Thr Ile Leu Thr Arg Pro Leu Leu 885 890 895 Glu Ser Glu Leu Val Ile Gly Ala Val Ile Leu Arg Gly His Leu Arg 900 905 910 Ile Ala Gly His His Leu Gly Arg Cys Asp Ile Lys Asp Leu Pro Lys 915 920 925 Glu Pro Phe Leu Tyr Leu Tyr Ala Leu Val Tyr Phe Leu Gln Ser Ile 930 935 940 Asn Phe Val Arg Ile Ile Met Arg Leu Trp Leu Cys Trp Lys Cys Arg 945 950 955 960 Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn Tyr Phe Leu Cys Trp His 965 970 975 Thr Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr Asn Ser Val Thr Ser Ser 980 985 990 Ile Val Ile Thr Ser Gly Asp Gly Thr Thr Ser Pro Ile Ser Glu His 995 1000 1005 Asp Tyr Gln Ile Gly Gly Tyr Thr Ala Pro Ser Ala Ser Ala Phe 1010 1015 1020 Phe Gly Met Ser Arg Ile Gly Met Glu Val Thr Pro Ser Gly Thr 1025 1030 1035 Trp Leu Thr Tyr Thr Gly Ala Ile Lys Leu Asp Asp Lys Asp Pro 1040 1045 1050 Asn Phe Lys Asp Gln Val Ile Leu Leu Asn Lys His Ile Asp Ala 1055 1060 1065 Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys Lys Lys 1070 1075 1080 Lys Ala Tyr Glu Thr Gln Ala Leu Pro Gln Arg Gln Lys Lys Gln 1085 1090 1095 Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu Asp Asp Phe Ser 1100 1105 1110 Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser Thr Gln Ala 1115 1120 1125 Ile Thr Val Ala Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly 1130 1135 1140 Ala Ser Gln Arg Val Ala Gly Asp Ser Gly Phe Ala Ala Tyr Ser 1145 1150 1155 Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp His Ser Ser 1160 1165 1170 Ser Ser Asp Asn Ile Ala Leu Leu Val Gln Leu Asn Glu Ser Leu 1175 1180 1185 Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp 1190 1195 1200 Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile 1205 1210 1215 Val Met Val 1220 <![CDATA[<210> 41]]> <![CDATA[<211> 1800]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 多肽 <![CDATA[<400> 41]]> Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr Arg Ala Lys Arg Ser 1265 1270 1275 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp 1280 1285 1290 Val Glu Glu Asn Pro Gly Pro Tyr Ala Leu Val Tyr Phe Leu Gln 1295 1300 1305 Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp Leu Cys Trp 1310 1315 1320 Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn Tyr Phe 1325 1330 1335 Leu Cys Trp His Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg 1340 1345 1350 Trp Tyr Phe Tyr Tyr Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro 1355 1360 1365 Tyr Gly Ala Asn Lys Asp Gly Ile Ile Trp Val Ala Thr Glu Gly 1370 1375 1380 Ala Leu Asn Thr Pro Lys Asp His Ile Gly Thr Arg Asn Pro Glu 1385 1390 1395 Lys Tyr Cys Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr 1400 1405 1410 Phe Thr Leu Lys Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Thr 1415 1420 1425 Tyr Lys Asn Thr Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala 1430 1435 1440 Leu Trp Glu Ile Gln Gln Val Val Asp Ala Asp Leu Asn Glu Ser 1445 1450 1455 Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys 1460 1465 1470 Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala 1475 1480 1485 Ile Val Met Val Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala 1490 1495 1500 Tyr Tyr Asn Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu 1505 1510 1515 Ser Asp Leu Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp 1520 1525 1530 Gly Thr Gly Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe 1535 1540 1545 Val Thr Asp Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Arg Val 1550 1555 1560 Glu Ala Phe Glu Tyr Tyr His Thr Thr Asp Pro Ser Phe Leu Gly 1565 1570 1575 Arg Tyr Met Ser Ala Leu Asn His Thr Lys Lys Trp Ile Thr Val 1580 1585 1590 Ala Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly Ala Ser Gln 1595 1600 1605 Arg Val Ala Gly Asp Ser Gly Phe Ala Ala Tyr Ser Arg Tyr Arg 1610 1615 1620 Ile Gly Asn Tyr Lys Leu Asn Thr Asp His Ser Ser Ser Ser Asp 1625 1630 1635 Asn Ile Ala Leu Leu Val Gln Val Leu Gln Gln Leu Arg Val Glu 1640 1645 1650 Ser Ser Ser Lys Leu Trp Ala Gln Cys Val Gln Leu His Asn Asp 1655 1660 1665 Ile Leu Leu Ala Lys Asp Thr Ala Pro Ser Ala Ser Ala Phe Phe 1670 1675 1680 Gly Met Ser Arg Ile Gly Met Glu Val Thr Pro Ser Gly Thr Trp 1685 1690 1695 Leu Thr Tyr Thr Gly Ala Ile Lys Leu Asp Asp Lys Asp Pro Asn 1700 1705 1710 Phe Lys Asp Gln Val Ile Leu Leu Asn Lys His Ile Asp Ala Tyr 1715 1720 1725 Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys Ser Lys Leu 1730 1735 1740 Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys Val Leu Ala Ala 1745 1750 1755 Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys Pro Val Pro Tyr 1760 1765 1770 Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val Ala Tyr Glu Ser 1775 1780 1785 Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp Gly 1790 1795 1800 <![CDATA[<210> 42]]> <![CDATA[<211> 7096]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 42]]> Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu 1 5 10 15 Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly 20 25 30 Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp 35 40 45 Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu 50 55 60 Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro 65 70 75 80 His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln 85 90 95 Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly 100 105 110 Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn 115 120 125 Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp 130 135 140 Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn 145 150 155 160 Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu 165 170 175 Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly 180 185 190 Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala 195 200 205 Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr 210 215 220 Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp 225 230 235 240 Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu 245 250 255 Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn 260 265 270 Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val 275 280 285 Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr 290 295 300 Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu 305 310 315 320 Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe 325 330 335 Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu 340 345 350 Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile 355 360 365 Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu 370 375 380 Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly 385 390 395 400 Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys 405 410 415 His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly 420 425 430 Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp 435 440 445 Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val 450 455 460 Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe 465 470 475 480 Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr 485 490 495 Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr 500 505 510 Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser 515 520 525 Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val 530 535 540 Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg 545 550 555 560 Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr 565 570 575 Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr 580 585 590 Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu 595 600 605 Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu 610 615 620 Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu 625 630 635 640 Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala 645 650 655 Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys 660 665 670 Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu 675 680 685 Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn 690 695 700 Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys 705 710 715 720 Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro 725 730 735 Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu 740 745 750 Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln 755 760 765 Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys 770 775 780 Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys 785 790 795 800 Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys 805 810 815 Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu 820 825 830 Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg 835 840 845 Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu 850 855 860 Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile 865 870 875 880 Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp 885 890 895 Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly 900 905 910 Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp 915 920 925 Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser 930 935 940 Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu 945 950 955 960 Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu 965 970 975 Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp 980 985 990 Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val 995 1000 1005 Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile 1010 1015 1020 Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val 1025 1030 1035 Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys 1040 1045 1050 Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly 1055 1060 1065 Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met 1070 1075 1080 Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys 1085 1090 1095 Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His 1100 1105 1110 Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile 1115 1120 1125 Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val 1130 1135 1140 Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro 1145 1150 1155 Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val 1160 1165 1170 Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser 1175 1180 1185 Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile 1190 1195 1200 Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser 1205 1210 1215 Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys 1220 1225 1230 Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe 1235 1240 1245 Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu 1250 1255 1260 His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe 1265 1270 1275 Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu 1280 1285 1290 Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly 1295 1300 1305 Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp 1310 1315 1320 Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr 1325 1330 1335 Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe 1340 1345 1350 Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu 1355 1360 1365 Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu 1370 1375 1380 Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile 1385 1390 1395 Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu 1400 1405 1410 Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys 1415 1420 1425 Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu 1430 1435 1440 Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn 1445 1450 1455 Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala 1460 1465 1470 Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly 1475 1480 1485 Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu 1490 1495 1500 Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly 1505 1510 1515 Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys 1520 1525 1530 Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly 1535 1540 1545 Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg 1550 1555 1560 Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn 1565 1570 1575 Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln 1580 1585 1590 Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys 1595 1600 1605 Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn 1610 1615 1620 Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr 1625 1630 1635 Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr 1640 1645 1650 Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys 1655 1660 1665 Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu 1670 1675 1680 Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala 1685 1690 1695 Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu 1700 1705 1710 Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val 1715 1720 1725 Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser 1730 1735 1740 Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln 1745 1750 1755 Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr 1760 1765 1770 Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr 1775 1780 1785 Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro 1790 1795 1800 Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His 1805 1810 1815 Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys 1820 1825 1830 Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile 1835 1840 1845 Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile 1850 1855 1860 Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys 1865 1870 1875 Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp 1880 1885 1890 Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr 1895 1900 1905 Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala 1910 1915 1920 Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala 1925 1930 1935 Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg 1940 1945 1950 Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val 1955 1960 1965 Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala 1970 1975 1980 Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr 1985 1990 1995 Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu 2000 2005 2010 Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu 2015 2020 2025 Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp 2030 2035 2040 Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln 2045 2050 2055 Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly 2060 2065 2070 Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu 2075 2080 2085 Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser 2090 2095 2100 Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly 2105 2110 2115 Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val 2120 2125 2130 Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys 2135 2140 2145 Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg 2150 2155 2160 Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln 2165 2170 2175 Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser 2180 2185 2190 Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys 2195 2200 2205 Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe 2210 2215 2220 Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val 2225 2230 2235 Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu 2240 2245 2250 Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu 2255 2260 2265 Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr 2270 2275 2280 Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu 2285 2290 2295 Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser 2300 2305 2310 Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe 2315 2320 2325 Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu 2330 2335 2340 Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe 2345 2350 2355 Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln 2360 2365 2370 Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala 2375 2380 2385 Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly 2390 2395 2400 Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala 2405 2410 2415 Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser 2420 2425 2430 Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His 2435 2440 2445 Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr 2450 2455 2460 Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys 2465 2470 2475 Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser 2480 2485 2490 Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala 2495 2500 2505 Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn 2510 2515 2520 Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile 2525 2530 2535 Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser 2540 2545 2550 Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro 2555 2560 2565 Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser 2570 2575 2580 Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe 2585 2590 2595 Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val 2600 2605 2610 Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn 2615 2620 2625 Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp 2630 2635 2640 Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser 2645 2650 2655 His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr 2660 2665 2670 Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu 2675 2680 2685 Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val 2690 2695 2700 Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe 2705 2710 2715 Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala 2720 2725 2730 Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg 2735 2740 2745 Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly 2750 2755 2760 Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu 2765 2770 2775 Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val 2780 2785 2790 His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly 2795 2800 2805 Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr 2810 2815 2820 Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe 2825 2830 2835 Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu 2840 2845 2850 Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly 2855 2860 2865 Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His 2870 2875 2880 Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr 2885 2890 2895 Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys 2900 2905 2910 Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys 2915 2920 2925 Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val 2930 2935 2940 Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp 2945 2950 2955 Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val 2960 2965 2970 Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr 2975 2980 2985 Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg 2990 2995 3000 Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe 3005 3010 3015 Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro 3020 3025 3030 Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val 3035 3040 3045 Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr 3050 3055 3060 Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val 3065 3070 3075 Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys 3080 3085 3090 Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile 3095 3100 3105 Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu 3110 3115 3120 Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe 3125 3130 3135 Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe 3140 3145 3150 Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn 3155 3160 3165 Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe 3170 3175 3180 Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu 3185 3190 3195 Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys 3200 3205 3210 Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu 3215 3220 3225 Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn 3230 3235 3240 Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr 3245 3250 3255 Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser 3260 3265 3270 Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr 3275 3280 3285 Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg 3290 3295 3300 His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu 3305 3310 3315 Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala 3320 3325 3330 Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys 3335 3340 3345 Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys 3350 3355 3360 Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu 3365 3370 3375 Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met 3380 3385 3390 Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys 3395 3400 3405 Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys 3410 3415 3420 Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr 3425 3430 3435 Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr 3440 3445 3450 Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu 3455 3460 3465 Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu 3470 3475 3480 Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met 3485 3490 3495 Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu 3500 3505 3510 Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys 3515 3520 3525 Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr 3530 3535 3540 Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp 3545 3550 3555 Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys 3560 3565 3570 Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu 3575 3580 3585 Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe 3590 3595 3600 Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile 3605 3610 3615 Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His 3620 3625 3630 Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala 3635 3640 3645 Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile 3650 3655 3660 Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys 3665 3670 3675 Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile 3680 3685 3690 Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val 3695 3700 3705 Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr 3710 3715 3720 Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile 3725 3730 3735 Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe 3740 3745 3750 Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile 3755 3760 3765 Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr 3770 3775 3780 Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys 3785 3790 3795 Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr 3800 3805 3810 Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu 3815 3820 3825 Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys 3830 3835 3840 Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val 3845 3850 3855 Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu 3860 3865 3870 Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp 3875 3880 3885 Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp 3890 3895 3900 Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu 3905 3910 3915 Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu 3920 3925 3930 Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe 3935 3940 3945 Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala 3950 3955 3960 Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys 3965 3970 3975 Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg 3980 3985 3990 Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala 3995 4000 4005 Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala 4010 4015 4020 Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg 4025 4030 4035 Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg 4040 4045 4050 Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala 4055 4060 4065 Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr 4070 4075 4080 Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile 4085 4090 4095 Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu 4100 4105 4110 Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val 4115 4120 4125 Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu 4130 4135 4140 Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr 4145 4150 4155 Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn 4160 4165 4170 Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu 4175 4180 4185 Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly 4190 4195 4200 Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp 4205 4210 4215 Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly 4220 4225 4230 Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala 4235 4240 4245 Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn 4250 4255 4260 Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys 4265 4270 4275 Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn 4280 4285 4290 Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile 4295 4300 4305 Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly 4310 4315 4320 Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn 4325 4330 4335 Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro 4340 4345 4350 Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr 4355 4360 4365 Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys 4370 4375 4380 Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser 4385 4390 4395 Phe Leu Asn Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro 4400 4405 4410 Cys Gly Thr Gly Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp 4415 4420 4425 Ile Tyr Asn Asp Lys Val Ala Gly Phe Ala Lys Phe Leu Lys Thr 4430 4435 4440 Asn Cys Cys Arg Phe Gln Glu Lys Asp Glu Asp Asp Asn Leu Ile 4445 4450 4455 Asp Ser Tyr Phe Val Val Lys Arg His Thr Phe Ser Asn Tyr Gln 4460 4465 4470 His Glu Glu Thr Ile Tyr Asn Leu Leu Lys Asp Cys Pro Ala Val 4475 4480 4485 Ala Lys His Asp Phe Phe Lys Phe Arg Ile Asp Gly Asp Met Val 4490 4495 4500 Pro His Ile Ser Arg Gln Arg Leu Thr Lys Tyr Thr Met Ala Asp 4505 4510 4515 Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly Asn Cys Asp Thr 4520 4525 4530 Leu Lys Glu Ile Leu Val Thr Tyr Asn Cys Cys Asp Asp Asp Tyr 4535 4540 4545 Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro Asp Ile 4550 4555 4560 Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln Ala Leu 4565 4570 4575 Leu Lys Thr Val Gln Phe Cys Asp Ala Met Arg Asn Ala Gly Ile 4580 4585 4590 Val Gly Val Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp 4595 4600 4605 Tyr Asp Phe Gly Asp Phe Ile Gln Thr Thr Pro Gly Ser Gly Val 4610 4615 4620 Pro Val Val Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr 4625 4630 4635 Leu Thr Arg Ala Leu Thr Ala Glu Ser His Val Asp Thr Asp Leu 4640 4645 4650 Thr Lys Pro Tyr Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr 4655 4660 4665 Glu Glu Arg Leu Lys Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp 4670 4675 4680 Gln Thr Tyr His Pro Asn Cys Val Asn Cys Leu Asp Asp Arg Cys 4685 4690 4695 Ile Leu His Cys Ala Asn Phe Asn Val Leu Phe Ser Thr Val Phe 4700 4705 4710 Pro Pro Thr Ser Phe Gly Pro Leu Val Arg Lys Ile Phe Val Asp 4715 4720 4725 Gly Val Pro Phe Val Val Ser Thr Gly Tyr His Phe Arg Glu Leu 4730 4735 4740 Gly Val Val His Asn Gln Asp Val Asn Leu His Ser Ser Arg Leu 4745 4750 4755 Ser Phe Lys Glu Leu Leu Val Tyr Ala Ala Asp Pro Ala Met His 4760 4765 4770 Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg Thr Thr Cys Phe 4775 4780 4785 Ser Val Ala Ala Leu Thr Asn Asn Val Ala Phe Gln Thr Val Lys 4790 4795 4800 Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val Ser Lys 4805 4810 4815 Gly Phe Phe Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe Phe 4820 4825 4830 Phe Ala Gln Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr 4835 4840 4845 Arg Tyr Asn Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe 4850 4855 4860 Val Val Glu Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly 4865 4870 4875 Cys Ile Asn Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser 4880 4885 4890 Ala Gly Phe Pro Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr 4895 4900 4905 Asp Ser Met Ser Tyr Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr 4910 4915 4920 Lys Arg Asn Val Ile Pro Thr Ile Thr Gln Met Asn Leu Lys Tyr 4925 4930 4935 Ala Ile Ser Ala Lys Asn Arg Ala Arg Thr Val Ala Gly Val Ser 4940 4945 4950 Ile Cys Ser Thr Met Thr Asn Arg Gln Phe His Gln Lys Leu Leu 4955 4960 4965 Lys Ser Ile Ala Ala Thr Arg Gly Ala Thr Val Val Ile Gly Thr 4970 4975 4980 Ser Lys Phe Tyr Gly Gly Trp His Asn Met Leu Lys Thr Val Tyr 4985 4990 4995 Ser Asp Val Glu Asn Pro His Leu Met Gly Trp Asp Tyr Pro Lys 5000 5005 5010 Cys Asp Arg Ala Met Pro Asn Met Leu Arg Ile Met Ala Ser Leu 5015 5020 5025 Val Leu Ala Arg Lys His Thr Thr Cys Cys Ser Leu Ser His Arg 5030 5035 5040 Phe Tyr Arg Leu Ala Asn Glu Cys Ala Gln Val Leu Ser Glu Met 5045 5050 5055 Val Met Cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr Ser 5060 5065 5070 Ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile 5075 5080 5085 Cys Gln Ala Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp 5090 5095 5100 Gly Asn Lys Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg 5105 5110 5115 Leu Tyr Glu Cys Leu Tyr Arg Asn Arg Asp Val Asp Thr Asp Phe 5120 5125 5130 Val Asn Glu Phe Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met 5135 5140 5145 Ile Leu Ser Asp Asp Ala Val Val Cys Phe Asn Ser Thr Tyr Ala 5150 5155 5160 Ser Gln Gly Leu Val Ala Ser Ile Lys Asn Phe Lys Ser Val Leu 5165 5170 5175 Tyr Tyr Gln Asn Asn Val Phe Met Ser Glu Ala Lys Cys Trp Thr 5180 5185 5190 Glu Thr Asp Leu Thr Lys Gly Pro His Glu Phe Cys Ser Gln His 5195 5200 5205 Thr Met Leu Val Lys Gln Gly Asp Asp Tyr Val Tyr Leu Pro Tyr 5210 5215 5220 Pro Asp Pro Ser Arg Ile Leu Gly Ala Gly Cys Phe Val Asp Asp 5225 5230 5235 Ile Val Lys Thr Asp Gly Thr Leu Met Ile Glu Arg Phe Val Ser 5240 5245 5250 Leu Ala Ile Asp Ala Tyr Pro Leu Thr Lys His Pro Asn Gln Glu 5255 5260 5265 Tyr Ala Asp Val Phe His Leu Tyr Leu Gln Tyr Ile Arg Lys Leu 5270 5275 5280 His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr Ser Val Met 5285 5290 5295 Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr 5300 5305 5310 Glu Ala Met Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala 5315 5320 5325 Cys Val Leu Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys 5330 5335 5340 Ile Arg Arg Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val 5345 5350 5355 Ile Ser Thr Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val 5360 5365 5370 Cys Asn Ala Pro Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr 5375 5380 5385 Leu Gly Gly Met Ser Tyr Tyr Cys Lys Ser His Lys Pro Pro Ile 5390 5395 5400 Ser Phe Pro Leu Cys Ala Asn Gly Gln Val Phe Gly Leu Tyr Lys 5405 5410 5415 Asn Thr Cys Val Gly Ser Asp Asn Val Thr Asp Phe Asn Ala Ile 5420 5425 5430 Ala Thr Cys Asp Trp Thr Asn Ala Gly Asp Tyr Ile Leu Ala Asn 5435 5440 5445 Thr Cys Thr Glu Arg Leu Lys Leu Phe Ala Ala Glu Thr Leu Lys 5450 5455 5460 Ala Thr Glu Glu Thr Phe Lys Leu Ser Tyr Gly Ile Ala Thr Val 5465 5470 5475 Arg Glu Val Leu Ser Asp Arg Glu Leu His Leu Ser Trp Glu Val 5480 5485 5490 Gly Lys Pro Arg Pro Pro Leu Asn Arg Asn Tyr Val Phe Thr Gly 5495 5500 5505 Tyr Arg Val Thr Lys Asn Ser Lys Val Gln Ile Gly Glu Tyr Thr 5510 5515 5520 Phe Glu Lys Gly Asp Tyr Gly Asp Ala Val Val Tyr Arg Gly Thr 5525 5530 5535 Thr Thr Tyr Lys Leu Asn Val Gly Asp Tyr Phe Val Leu Thr Ser 5540 5545 5550 His Thr Val Met Pro Leu Ser Ala Pro Thr Leu Val Pro Gln Glu 5555 5560 5565 His Tyr Val Arg Ile Thr Gly Leu Tyr Pro Thr Leu Asn Ile Ser 5570 5575 5580 Asp Glu Phe Ser Ser Asn Val Ala Asn Tyr Gln Lys Val Gly Met 5585 5590 5595 Gln Lys Tyr Ser Thr Leu Gln Gly Pro Pro Gly Thr Gly Lys Ser 5600 5605 5610 His Phe Ala Ile Gly Leu Ala Leu Tyr Tyr Pro Ser Ala Arg Ile 5615 5620 5625 Val Tyr Thr Ala Cys Ser His Ala Ala Val Asp Ala Leu Cys Glu 5630 5635 5640 Lys Ala Leu Lys Tyr Leu Pro Ile Asp Lys Cys Ser Arg Ile Ile 5645 5650 5655 Pro Ala Arg Ala Arg Val Glu Cys Phe Asp Lys Phe Lys Val Asn 5660 5665 5670 Ser Thr Leu Glu Gln Tyr Val Phe Cys Thr Val Asn Ala Leu Pro 5675 5680 5685 Glu Thr Thr Ala Asp Ile Val Val Phe Asp Glu Ile Ser Met Ala 5690 5695 5700 Thr Asn Tyr Asp Leu Ser Val Val Asn Ala Arg Leu Arg Ala Lys 5705 5710 5715 His Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Arg 5720 5725 5730 Thr Leu Leu Thr Lys Gly Thr Leu Glu Pro Glu Tyr Phe Asn Ser 5735 5740 5745 Val Cys Arg Leu Met Lys Thr Ile Gly Pro Asp Met Phe Leu Gly 5750 5755 5760 Thr Cys Arg Arg Cys Pro Ala Glu Ile Val Asp Thr Val Ser Ala 5765 5770 5775 Leu Val Tyr Asp Asn Lys Leu Lys Ala His Lys Asp Lys Ser Ala 5780 5785 5790 Gln Cys Phe Lys Met Phe Tyr Lys Gly Val Ile Thr His Asp Val 5795 5800 5805 Ser Ser Ala Ile Asn Arg Pro Gln Ile Gly Val Val Arg Glu Phe 5810 5815 5820 Leu Thr Arg Asn Pro Ala Trp Arg Lys Ala Val Phe Ile Ser Pro 5825 5830 5835 Tyr Asn Ser Gln Asn Ala Val Ala Ser Lys Ile Leu Gly Leu Pro 5840 5845 5850 Thr Gln Thr Val Asp Ser Ser Gln Gly Ser Glu Tyr Asp Tyr Val 5855 5860 5865 Ile Phe Thr Gln Thr Thr Glu Thr Ala His Ser Cys Asn Val Asn 5870 5875 5880 Arg Phe Asn Val Ala Ile Thr Arg Ala Lys Val Gly Ile Leu Cys 5885 5890 5895 Ile Met Ser Asp Arg Asp Leu Tyr Asp Lys Leu Gln Phe Thr Ser 5900 5905 5910 Leu Glu Ile Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Asn 5915 5920 5925 Val Thr Gly Leu Phe Lys Asp Cys Ser Lys Val Ile Thr Gly Leu 5930 5935 5940 His Pro Thr Gln Ala Pro Thr His Leu Ser Val Asp Thr Lys Phe 5945 5950 5955 Lys Thr Glu Gly Leu Cys Val Asp Ile Pro Gly Ile Pro Lys Asp 5960 5965 5970 Met Thr Tyr Arg Arg Leu Ile Ser Met Met Gly Phe Lys Met Asn 5975 5980 5985 Tyr Gln Val Asn Gly Tyr Pro Asn Met Phe Ile Thr Arg Glu Glu 5990 5995 6000 Ala Ile Arg His Val Arg Ala Trp Ile Gly Phe Asp Val Glu Gly 6005 6010 6015 Cys His Ala Thr Arg Glu Ala Val Gly Thr Asn Leu Pro Leu Gln 6020 6025 6030 Leu Gly Phe Ser Thr Gly Val Asn Leu Val Ala Val Pro Thr Gly 6035 6040 6045 Tyr Val Asp Thr Pro Asn Asn Thr Asp Phe Ser Arg Val Ser Ala 6050 6055 6060 Lys Pro Pro Pro Gly Asp Gln Phe Lys His Leu Ile Pro Leu Met 6065 6070 6075 Tyr Lys Gly Leu Pro Trp Asn Val Val Arg Ile Lys Ile Val Gln 6080 6085 6090 Met Leu Ser Asp Thr Leu Lys Asn Leu Ser Asp Arg Val Val Phe 6095 6100 6105 Val Leu Trp Ala His Gly Phe Glu Leu Thr Ser Met Lys Tyr Phe 6110 6115 6120 Val Lys Ile Gly Pro Glu Arg Thr Cys Cys Leu Cys Asp Arg Arg 6125 6130 6135 Ala Thr Cys Phe Ser Thr Ala Ser Asp Thr Tyr Ala Cys Trp His 6140 6145 6150 His Ser Ile Gly Phe Asp Tyr Val Tyr Asn Pro Phe Met Ile Asp 6155 6160 6165 Val Gln Gln Trp Gly Phe Thr Gly Asn Leu Gln Ser Asn His Asp 6170 6175 6180 Leu Tyr Cys Gln Val His Gly Asn Ala His Val Ala Ser Cys Asp 6185 6190 6195 Ala Ile Met Thr Arg Cys Leu Ala Val His Glu Cys Phe Val Lys 6200 6205 6210 Arg Val Asp Trp Thr Ile Glu Tyr Pro Ile Ile Gly Asp Glu Leu 6215 6220 6225 Lys Ile Asn Ala Ala Cys Arg Lys Val Gln His Met Val Val Lys 6230 6235 6240 Ala Ala Leu Leu Ala Asp Lys Phe Pro Val Leu His Asp Ile Gly 6245 6250 6255 Asn Pro Lys Ala Ile Lys Cys Val Pro Gln Ala Asp Val Glu Trp 6260 6265 6270 Lys Phe Tyr Asp Ala Gln Pro Cys Ser Asp Lys Ala Tyr Lys Ile 6275 6280 6285 Glu Glu Leu Phe Tyr Ser Tyr Ala Thr His Ser Asp Lys Phe Thr 6290 6295 6300 Asp Gly Val Cys Leu Phe Trp Asn Cys Asn Val Asp Arg Tyr Pro 6305 6310 6315 Ala Asn Ser Ile Val Cys Arg Phe Asp Thr Arg Val Leu Ser Asn 6320 6325 6330 Leu Asn Leu Pro Gly Cys Asp Gly Gly Ser Leu Tyr Val Asn Lys 6335 6340 6345 His Ala Phe His Thr Pro Ala Phe Asp Lys Ser Ala Phe Val Asn 6350 6355 6360 Leu Lys Gln Leu Pro Phe Phe Tyr Tyr Ser Asp Ser Pro Cys Glu 6365 6370 6375 Ser His Gly Lys Gln Val Val Ser Asp Ile Asp Tyr Val Pro Leu 6380 6385 6390 Lys Ser Ala Thr Cys Ile Thr Arg Cys Asn Leu Gly Gly Ala Val 6395 6400 6405 Cys Arg His His Ala Asn Glu Tyr Arg Leu Tyr Leu Asp Ala Tyr 6410 6415 6420 Asn Met Met Ile Ser Ala Gly Phe Ser Leu Trp Val Tyr Lys Gln 6425 6430 6435 Phe Asp Thr Tyr Asn Leu Trp Asn Thr Phe Thr Arg Leu Gln Ser 6440 6445 6450 Leu Glu Asn Val Ala Phe Asn Val Val Asn Lys Gly His Phe Asp 6455 6460 6465 Gly Gln Gln Gly Glu Val Pro Val Ser Ile Ile Asn Asn Thr Val 6470 6475 6480 Tyr Thr Lys Val Asp Gly Val Asp Val Glu Leu Phe Glu Asn Lys 6485 6490 6495 Thr Thr Leu Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys Arg 6500 6505 6510 Asn Ile Lys Pro Val Pro Glu Val Lys Ile Leu Asn Asn Leu Gly 6515 6520 6525 Val Asp Ile Ala Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Asp 6530 6535 6540 Ala Pro Ala His Ile Ser Thr Ile Gly Val Cys Ser Met Thr Asp 6545 6550 6555 Ile Ala Lys Lys Pro Thr Glu Thr Ile Cys Ala Pro Leu Thr Val 6560 6565 6570 Phe Phe Asp Gly Arg Val Asp Gly Gln Val Asp Leu Phe Arg Asn 6575 6580 6585 Ala Arg Asn Gly Val Leu Ile Thr Glu Gly Ser Val Lys Gly Leu 6590 6595 6600 Gln Pro Ser Val Gly Pro Lys Gln Ala Ser Leu Asn Gly Val Thr 6605 6610 6615 Leu Ile Gly Glu Ala Val Lys Thr Gln Phe Asn Tyr Tyr Lys Lys 6620 6625 6630 Val Asp Gly Val Val Gln Gln Leu Pro Glu Thr Tyr Phe Thr Gln 6635 6640 6645 Ser Arg Asn Leu Gln Glu Phe Lys Pro Arg Ser Gln Met Glu Ile 6650 6655 6660 Asp Phe Leu Glu Leu Ala Met Asp Glu Phe Ile Glu Arg Tyr Lys 6665 6670 6675 Leu Glu Gly Tyr Ala Phe Glu His Ile Val Tyr Gly Asp Phe Ser 6680 6685 6690 His Ser Gln Leu Gly Gly Leu His Leu Leu Ile Gly Leu Ala Lys 6695 6700 6705 Arg Phe Lys Glu Ser Pro Phe Glu Leu Glu Asp Phe Ile Pro Met 6710 6715 6720 Asp Ser Thr Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln Thr Gly 6725 6730 6735 Ser Ser Lys Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp Asp 6740 6745 6750 Phe Val Glu Ile Ile Lys Ser Gln Asp Leu Ser Val Val Ser Lys 6755 6760 6765 Val Val Lys Val Thr Ile Asp Tyr Thr Glu Ile Ser Phe Met Leu 6770 6775 6780 Trp Cys Lys Asp Gly His Val Glu Thr Phe Tyr Pro Lys Leu Gln 6785 6790 6795 Ser Ser Gln Ala Trp Gln Pro Gly Val Ala Met Pro Asn Leu Tyr 6800 6805 6810 Lys Met Gln Arg Met Leu Leu Glu Lys Cys Asp Leu Gln Asn Tyr 6815 6820 6825 Gly Asp Ser Ala Thr Leu Pro Lys Gly Ile Met Met Asn Val Ala 6830 6835 6840 Lys Tyr Thr Gln Leu Cys Gln Tyr Leu Asn Thr Leu Thr Leu Ala 6845 6850 6855 Val Pro Tyr Asn Met Arg Val Ile His Phe Gly Ala Gly Ser Asp 6860 6865 6870 Lys Gly Val Ala Pro Gly Thr Ala Val Leu Arg Gln Trp Leu Pro 6875 6880 6885 Thr Gly Thr Leu Leu Val Asp Ser Asp Leu Asn Asp Phe Val Ser 6890 6895 6900 Asp Ala Asp Ser Thr Leu Ile Gly Asp Cys Ala Thr Val His Thr 6905 6910 6915 Ala Asn Lys Trp Asp Leu Ile Ile Ser Asp Met Tyr Asp Pro Lys 6920 6925 6930 Thr Lys Asn Val Thr Lys Glu Asn Asp Ser Lys Glu Gly Phe Phe 6935 6940 6945 Thr Tyr Ile Cys Gly Phe Ile Gln Gln Lys Leu Ala Leu Gly Gly 6950 6955 6960 Ser Val Ala Ile Lys Ile Thr Glu His Ser Trp Asn Ala Asp Leu 6965 6970 6975 Tyr Lys Leu Met Gly His Phe Ala Trp Trp Thr Ala Phe Val Thr 6980 6985 6990 Asn Val Asn Ala Ser Ser Ser Glu Ala Phe Leu Ile Gly Cys Asn 6995 7000 7005 Tyr Leu Gly Lys Pro Arg Glu Gln Ile Asp Gly Tyr Val Met His 7010 7015 7020 Ala Asn Tyr Ile Phe Trp Arg Asn Thr Asn Pro Ile Gln Leu Ser 7025 7030 7035 Ser Tyr Ser Leu Phe Asp Met Ser Lys Phe Pro Leu Lys Leu Arg 7040 7045 7050 Gly Thr Ala Val Met Ser Leu Lys Glu Gly Gln Ile Asn Asp Met 7055 7060 7065 Ile Leu Ser Leu Leu Ser Lys Gly Arg Leu Ile Ile Arg Glu Asn 7070 7075 7080 Asn Arg Val Val Ile Ser Ser Asp Val Leu Val Asn Asn 7085 7090 7095 <![CDATA[<210> 43]]> <![CDATA[<211> 1273]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 43]]> Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <![CDATA[<210> 44]]> <![CDATA[<211> 419]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 44]]> Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr 1 5 10 15 Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg 20 25 30 Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn 35 40 45 Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu 50 55 60 Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro 65 70 75 80 Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly 85 90 95 Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr 100 105 110 Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp 115 120 125 Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp 130 135 140 His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln 145 150 155 160 Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser 165 170 175 Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn 180 185 190 Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala 195 200 205 Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu 210 215 220 Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln 225 230 235 240 Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys 245 250 255 Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln 260 265 270 Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp 275 280 285 Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile 290 295 300 Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile 305 310 315 320 Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala 325 330 335 Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu 340 345 350 Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro 355 360 365 Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln 370 375 380 Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu 385 390 395 400 Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser 405 410 415 Thr Gln Ala <![CDATA[<210> 45]]> <![CDATA[<211> 275]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 45]]> Met Asp Leu Phe Met Arg Ile Phe Thr Ile Gly Thr Val Thr Leu Lys 1 5 10 15 Gln Gly Glu Ile Lys Asp Ala Thr Pro Ser Asp Phe Val Arg Ala Thr 20 25 30 Ala Thr Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val 35 40 45 Gly Val Ala Leu Leu Ala Val Phe Gln Ser Ala Ser Lys Ile Ile Thr 50 55 60 Leu Lys Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val 65 70 75 80 Cys Asn Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu 85 90 95 Val Ala Ala Gly Leu Glu Ala Pro Phe Leu Tyr Leu Tyr Ala Leu Val 100 105 110 Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp 115 120 125 Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn 130 135 140 Tyr Phe Leu Cys Trp His Thr Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr 145 150 155 160 Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr 165 170 175 Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Glu Lys 180 185 190 Trp Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr 195 200 205 Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly 210 215 220 Val Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro 225 230 235 240 Glu Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val 245 250 255 Asn Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser 260 265 270 Val Pro Leu 275 <![CDATA[<210> 46]]> <![CDATA[<211> 222]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 46]]> Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu 1 5 10 15 Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile 20 25 30 Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile 35 40 45 Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys 50 55 60 Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile 65 70 75 80 Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe 85 90 95 Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe 100 105 110 Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile 115 120 125 Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile 130 135 140 Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp 145 150 155 160 Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu 165 170 175 Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly 180 185 190 Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr 195 200 205 Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln 210 215 220 <![CDATA[<210> 47]]> <![CDATA[<211> 121]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 嚴重急性呼吸道症候群冠狀病毒2 (Severe acute respiratory syndrome coronavirus 2)]]> <![CDATA[<400> 47]]> Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu 1 5 10 15 Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys 20 25 30 Glu Pro Cys Ser Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro 35 40 45 Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Phe Ser Thr Gln Phe Ala 50 55 60 Phe Ala Cys Pro Asp Gly Val Lys His Val Tyr Gln Leu Arg Ala Arg 65 70 75 80 Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Glu Leu 85 90 95 Tyr Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu 100 105 110 Cys Phe Thr Leu Lys Arg Lys Thr Glu 115 120 <![CDATA[<210> 48]]> <![CDATA[<211> 870]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 聚核苷酸 <![CDATA[<400> 48]]> atgtacgcca gcgccctgtg ggagatccag caggtggtgg acgctgatca cagctacttc 60 acctctgatt actaccagct ttattctaca cagaagcact acgtgtatat cggcgacccc 120 gcccaactgc ctgcccctga cgcctacaaa accttccccc ccacagaacc caaaaaggac 180 aaaatctggg tcgccaccga gggcgccctg aacaccccta aagaccatat catcaccgtg 240 gccacaagca gaaccctgag ctattacaag ctgggcgctt acgccctggt gtactttctg 300 cagagcatca acttcgtgcg gatctccctg gaaatcccta ggcggaacgt tgctaccctg 360 caggccgagc ctaatatgat ggtgaccaac aacaccttca ccctcaaggg cggagccaag 420 aaccccctgc tgtacgacgc caattacttc ctgtgctggc acaaggacct gtctccaaga 480 tggtatttct actacctggg caccggctac taccacacca cagatccaag cttcctggga 540 agatacatga gcgctgaaag cctgagacct gataccagat acgtgctgat ggacggcaga 600 aaggtgccta ccgacaacta cattaccaca taccccggcc agtgtagatt cgtgacagac 660 acccctaagg gacctaaggt gaagtacagc acattcaagt gctacggcgt gtccccaaca 720 aagctgaatg ataaatacga gcagtacatc aagtggcctt ggtacatctg gctgggcagc 780 agctccaagc tgtgggccca gtgcgtgcag ctgcacaacg actacgtcgg ctacctgcaa 840 cctcggacat ttctgctgaa gtacaactag 870 <![CDATA[<210> 49]]> <![CDATA[<211> 690]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 聚核苷酸 <![CDATA[<400> 49]]> atggccctgt gggagatcca gcaggttgtg aaggctgcat tcacctctga ttactaccag 60 ctgtacaagg ccgccgtgta catcggcgac cccgcccagc tgaaggccgc taaaaccttc 120 ccccccaccg agcctaagaa agctgctgca acagaaggcg ccctgaatac acctaagaaa 180 gccgccgcca caagcagaac actgagctac tacaagaagg ccgctgtgta tttcctccag 240 agcatcaact tcaaggccgc tatccccagg cggaacgtgg ccaccctgaa agctgccatg 300 gtcaccaaca acacctttac cctgaagaag gccgccctgc tgtacgacgc caattacttt 360 ctgaaggccg catctccacg gtggtacttc tactacctga aggccgccac caccgaccct 420 agcttcctgg gcagatacaa ggccgccaga cctgacacca gatacgtgct gaaagccgcc 480 cctaccgaca actacattac aacctacaag gccgccgtga cagatacccc taagggacct 540 aaaaaggccg ccaagtgcta cggcgtgtcc ccaacaaaga aggccgctca gtacatcaag 600 tggccttggt atatcaaggc cgccaagctg tgggcccaat gtgtgcagct gaaggccgcc 660 tatctgcagc ctagaacctt cctgctgtag 690 <![CDATA[<210> 50]]> <![CDATA[<211> 528]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 聚核苷酸 <![CDATA[<400> 50]]> atggccctgt gggagatcca gcaggtggtg ttcaccagcg actactacca gctgtacgtg 60 tacatcggcg accccgctca gctgaagacc ttcccaccta ccgaacccaa ggccaccgag 120 ggagccctga acacccctaa ggctacatct agaaccctga gctactacaa ggtgtacttc 180 ctgcagtcta tcaacttcat cccccggaga aacgtggcca ccctgatggt taccaacaac 240 acctttaccc tgaagctgct gtacgacgcc aattacttcc tcagccctcg gtggtatttc 300 tactacctta caaccgaccc tagcttcctg ggcagataca gacctgacac aagatatgtg 360 ctgcctacag ataattacat caccacatac gtcaccgata cccccaaagg ccctaaaaag 420 tgctacggcg tgtcccctac aaagcagtac attaagtggc cttggtacat caagctgtgg 480 gcccagtgtg tgcagctgta tctgcaacca cggacatttc tgctgtag 528 <![CDATA[<210> 51]]> <![CDATA[<211> 1248]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 聚核苷酸 <![CDATA[<400> 51]]> atgcacagct acttcaccag cgactactac cagctgtaca gcacccagaa gcactacgtg 60 tacatcggcg accccgccca gctgcccgcc ccctacgccc tggtgtactt cctgcagagc 120 atcaacttcg tgaggatcgc cacctactac ctgttcgacg agagcggcga gttcaagctg 180 gccagccaca agaaccccct gctgtacgac gccaactact tcctgtgctg gcacaggaag 240 gtgcccaccg acaactacat caccacctac cccggccaga tcaccgtggc caccagcagg 300 accctgagct actacaagct gggcgccccc aacatgatgg tgaccaacaa caccttcacc 360 ctgaagggcg gcgccagcat catcaagacc atccagccca gggtggagaa gaagaagctg 420 aagtacgagc agtacatcaa gtggccctgg tacatctggc tgggcaagga cctgagcccc 480 aggtggtact tctactacct gggcaccggc acctacaaga acacctgcga cggcaccacc 540 ttcacctacg ccagcgccgt gcacgccggc accgacctgg agggcaactt ctacggcccc 600 ttcgagagcc tgaggcccga caccaggtac gtgctgatgg acggccagac cgcctgcacc 660 gacgacaacg ccctggccta ctacaacacc accagcagca gcaagctgtg ggcccagtgc 720 gtgcagctgc acaacgacta cgccagcgcc ctgtgggaga tccagcaggt ggtggacgcc 780 gacgacgcct acaagacctt cccccccacc gagcccaaga aggacaagag caccttcaag 840 tgctacggcg tgagccccac caagctgaac gacgccccca gcgccagcgc cttcttcggc 900 atgagcagga tcggcatgct ggccctgctg ctgctggaca ggctgaacca gctggagagc 960 aagagcctgg agatccccag gaggaacgtg gccaccctgc aggccgagta ctaccacacc 1020 accgacccca gcttcctggg caggtacatg agcgccaggg acgtggacac cgacttcgtg 1080 aacgagttct acgcctacct gtgcaggttc gtgaccgaca cccccaaggg ccccaaggtg 1140 aagtacatct gggtggccac cgagggcgcc ctgaacaccc ccaaggacca catctacgtg 1200 ggctacctgc agcccaggac cttcctgctg aagtacaact gataatag 1248 <![CDATA[<210> 52]]> <![CDATA[<211> 990]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 聚核苷酸 <![CDATA[<400> 52]]> atgtttacgt cagactacta tcagctttac aaagcagccg tctatatcgg ggatcccgcc 60 cagcttaaag ccgccgtgta tttcctgcag tccatcaact tcaaagcagc gtatttgttc 120 gatgagtctg gggagtttaa attgaaagct gccctcctct acgacgccaa ttattttctt 180 aaagcggccc caacggataa ctatataacg acctacaaag cagctgccac atcccgaaca 240 ctcagttatt ataagaaagc agccatggtt acgaataaca cttttacgct gaaaaaagct 300 gcaaaaacga ttcagccgcg ggttgaaaag aaagctgcgc agtacataaa gtggccatgg 360 tatatcaaag ccgcctcccc cagatggtac ttctattatt tgaaagcggc caacacatgc 420 gacggtacca cgtttacata taaagctgcg gggacagact tggaagggaa tttttacaag 480 gcggctcgcc cagatacacg ctacgttttg aaagccgctt gtactgatga taacgcattg 540 gcttactata aagcagcaaa gctttgggcc cagtgcgttc agctgaaggc cgcagcgctc 600 tgggaaatcc aacaggttgt gaaagccgca aaaactttcc cgccgacaga accgaaaaag 660 gcggcgaagt gctatggagt cagtcctact aaaaaggccg ccgcgtcagc cttctttggc 720 atgagtcgca aggctgctct gcttttggat cggctcaatc aactcaaagc cgcaataccg 780 agaaggaacg ttgcgacatt gaaggcggcc acaacagacc cgtcattcct gggcagatac 840 aaggcagctg ataccgactt cgtcaatgag ttttacaagg cggcggtcac tgacacaccg 900 aaaggcccca aaaaggccgc tgcgaccgag ggtgcgttga atacaccaaa aaaggcagca 960 tatctccagc caaggacgtt cctgctgtag 990 <![CDATA[<210> 53]]> <![CDATA[<211> 756]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 聚核苷酸 <![CDATA[<400> 53]]> atgttcacct ctgattacta ccagctttat gtgtacattg gagatcctgc tcagctggtg 60 tacttcctgc agagcatcaa cttctacctg ttcgacgaga gcggcgaatt caagctgctg 120 ctgtacgacg ccaactactt cctgcctacc gataattaca tcaccacata cgccacatct 180 cggaccctga gctactacaa gatggtcacc aacaacacct ttaccctgaa gaagaccatc 240 cagcctcggg tggaaaagca gtacatcaag tggccttggt atatcagccc tagatggtac 300 ttttactacc tgaacacctg cgacggcacc acctttacat acggcacaga tctggaaggc 360 aacttctaca gacctgacac cagatacgtg ctgtgcaccg acgacaatgc cctggcctac 420 tataagctgt gggcccaatg tgtgcagctg gctctgtggg agatccagca ggtggtgaag 480 acattccccc ccaccgagcc caagaaatgc tacggcgtgt ccccaacaaa ggccagcgcc 540 ttcttcggca tgagccggct gctgctggac agactgaacc agctgatccc ccgcaggaac 600 gtggccaccc tgaccaccga cccctccttc ctgggaagat acgacacaga cttcgtgaac 660 gagttctacg ttacagatac accaaaaggc cctaaagcta cagagggcgc cctgaatacc 720 cctaagtacc tgcaacctag aacctttctg ctctag 756 <![CDATA[<210> 54]]> <![CDATA[<211> 1506]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 聚核苷酸 <![CDATA[<400> 54]]> atgtacgctc tggtttattt tcttcagtcc atcaacttcg taaggatcat tatgcgactc 60 tggctgtgct ggaagtgtcg cagcaagaac cccctcttgt atgacgctaa ttacttcctg 120 tgctggcacg gggacggcaa gatgaaagat ctgagcccca gatggtactt ctactatctt 180 ggtaccggac ccgaagccgg gctgccatac ggggcaaata aagacggtat tatctgggtt 240 gccactgagg gtgccctgaa tactcctaaa gaccacattg gcacacggaa tcccgagaag 300 tactgcgcat tggctcccaa catgatggtg accaacaata cctttacatt aaagggggga 360 gcaccaacca aagtgacttt tggcacttac aagaacacat gtgacggcac gacttttacc 420 tacgcaagcg ctctgtggga aattcaacag gtcgtcgacg ccgatcttaa cgagtctctt 480 atcgatttac aggaattggg taaatatgaa cagtatatca agtggccttg gtacatctgg 540 ctaggcttta tagcaggact tatagctatc gtcatggttc agaccgcttg tacagacgat 600 aatgccctcg cctattataa taccaccaaa ggtgggcgtt ttgtgctggc cctgctgtcc 660 gatctgcagg atctgaagtg ggctcgcttc ccaaaaagtg acggaaccgg cacgatctac 720 accgagttgg agccaccttg tcgcttcgtg accgatacgc caaaaggccc taaagtgaag 780 tatctccggg ttgaagcatt cgaatactat cataccacag atccttcctt cctcgggagg 840 tacatgagtg ccctaaatca tactaagaaa tggattaccg tggccacttc acgaactctc 900 tcctactaca aactgggcgc ttcacagcgg gtagccggcg acagcggatt cgccgcctac 960 tccaggtata gaattggaaa ctataagctg aacacagacc attcttctag cagcgacaac 1020 atcgctctgt tggtgcaggt cttgcaacag ctgcgggtgg agtcttcaag taagttatgg 1080 gcacaatgcg ttcaacttca caatgatatt ctactggcga aagacacggc cccctctgcg 1140 tccgcctttt ttggaatgtc tagaataggg atggaagtaa caccatccgg cacatggctc 1200 acatatacag gcgcgatcaa gttagacgac aaggacccga atttcaaaga tcaggtgatt 1260 ctgctcaaca agcacatcga tgcatataag acatttccac ctacggagcc caagaaggac 1320 aaaagcaagc tcatagagta cactgatttc gcaacctcgg cttgtgtcct cgctgccgag 1380 tgcaccattt tcaaagatgc ctcagggaag cctgtgccgt attgctacga tacaaacgtg 1440 cttgaaggtt cggtggcgta cgagagtctg aggcccgata ctagatatgt cctgatggac 1500 ggatag 1506 <![CDATA[<210> 55]]> <![CDATA[<211> 4767]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 聚核苷酸 <![CDATA[<400> 55]]> atgttcgtgt tcctggtgct gctccccctg gtctctagcc agtgcgtgaa tttaaccaca 60 cgcacccaac tgccccccgc atacaccaac tcctttacca gaggcgtgta ctaccctgat 120 aaggtgttta gatctagcgt tttgcacagc acacaggacc tcttcctgcc attcttcagc 180 aatgtgacct ggttccacgc cattcacgtg tccggcacaa acggcactaa gagattcgac 240 aaccccgtgc tgccttttaa tgacggcgtg tactttgcat ccaccgagaa gtctaacatc 300 atcagaggct ggatattcgg caccaccctc gatagcaaga cacagagcct gctcatcgtg 360 aacaacgcca caaacgtggt gatcaaggtg tgcgagtttc agttctgcaa cgaccctttc 420 ctgggggtct actaccacaa aaacaacaag agctggatgg aatctgagtt ccgggtgtac 480 tccagcgcca ataattgcac cttcgagtac gtgtcccagc ccttcctgat ggacttggag 540 ggcaagcagg gcaattttaa gaacctgaga gagttcgtgt ttaaaaatat cgacggctac 600 ttcaagatct acagcaagca tacacctatc aatctggtga gagacctgcc tcagggcttc 660 agcgcattgg agcccctggt tgacctgccc atcggcatca acatcacaag attccagaca 720 ctgctggccc tgcacagaag ctacctgacc cctggagatt cctcttctgg atggaccgcc 780 ggagccgccg cctactacgt gggatacctg cagcctagaa ccttcctact gaagtacaat 840 gagaatggaa ccatcaccga tgccgtggac tgcgctctgg accccctgag cgagacaaag 900 tgtaccctga agagcttcac cgtggaaaag ggcatctatc agaccagcaa cttccgagtc 960 cagcctacag agagcattgt gcggttccct aacatcacaa acctgtgccc ttttggggaa 1020 gtgttcaacg cgacccggtt cgccagcgtg tatgcctgga acagaaaacg gatctccaac 1080 tgcgtggcag attacagcgt gctgtacaac agcgccagtt tcagcacctt caagtgctac 1140 ggcgtgagcc ctacaaaact gaacgatctg tgcttcacca atgtgtacgc cgactctttc 1200 gtgatcaggg gcgacgaagt gaggcagatt gcccccggcc agacgggcaa aatcgccgac 1260 tacaactaca agctgcccga cgacttcacc ggctgcgtta ttgcctggaa ctctaacaac 1320 ctcgattcta aagtgggcgg aaactacaac tacctgtacc ggctgttcag aaaaagcaac 1380 ctgaaacctt tcgagagaga catatccaca gaaatctacc aggctggctc tactccttgt 1440 aatggcgttg aagggttcaa ctgctacttt ccactgcaga gctacggctt tcagcctaca 1500 aacggagtgg gctaccagcc ctaccgtgtg gtggtgctga gcttcgaact gttgcacgcc 1560 cccgctaccg tctgcggccc gaagaagagc acgaacctgg taaagaacaa gtgcgtgaat 1620 ttcaacttca acggcctgac aggcaccggc gtgctgaccg aatcgaacaa gaagtttctg 1680 ccatttcagc agttcggccg ggacatcgcc gacaccaccg atgccgtgcg ggatcctcag 1740 acactagaaa tcctggacat caccccctgt agcttcggcg gcgtgagcgt catcacacct 1800 ggcacaaaca ccagcaacca ggtggccgtg ctctaccagg acgtgaattg cacagaggtg 1860 cctgtggcca tccacgccga tcagctgacc cctacatggc gggtctactc tacaggaagc 1920 aacgtgttcc agacaagagc cggatgcctt ataggcgccg agcacgtgaa caacagctac 1980 gaatgcgaca tccctatcgg cgccggcatc tgtgcttctt accagacaca gactaactct 2040 ccacggagag ccagatcagt ggcctctcag tctatcatcg cctataccat gagtctggga 2100 gccgagaaca gcgtggcata cagcaacaac agcatcgcca tcccaaccaa cttcacaatc 2160 agtgtgacaa ccgagatcct gcccgtgtcc atgaccaaga cctcggtgga ttgcacgatg 2220 tacatctgcg gcgacagcac cgaatgcagc aacctcctgc tccagtacgg cagtttctgc 2280 acacagctga accgggccct aaccggcatc gccgtggaac aggacaaaaa cacccaggag 2340 gtgttcgccc aagtgaagca aatctacaag accccaccta tcaaggactt cggcggcttc 2400 aattttagcc agatcctgcc agacccttct aagccttcaa agagaagctt catcgaggac 2460 ctgttattca acaaagtgac gctggccgat gctggcttca tcaagcaata cggcgactgc 2520 ctcggcgaca tcgcggcacg agacctgatc tgcgcccaga agtttaacgg actgaccgtg 2580 ttaccacctc ttctgaccga tgaaatgatc gcacagtaca ccagcgccct cctggccggc 2640 accatcacca gcggatggac cttcggagcg ggcgctgcac tgcagatccc tttcgccatg 2700 cagatggcct acagatttaa tgggattggc gtgacccaaa acgtgctgta cgaaaaccag 2760 aaattgatcg ctaaccaatt caactctgcc attggaaaga tccaggatag cctgagctct 2820 accgcatccg ctctgggcaa gttgcaagac gtggtgaacc agaacgccca ggccctgaac 2880 acgctggtga aacagctgag cagcaacttc ggcgctatta gcagcgtgct gaatgatatt 2940 ctgtcccggc tggacccgcc tgaggctgag gtgcagattg atcggctgat tacgggtcgg 3000 ctgcagagcc tgcagaccta cgttacccag cagttgatca gagccgccga gatcagagcc 3060 agtgcgaacc tggcggcaac caagatgagc gagtgtgtcc tcggacagag caagcgggtt 3120 gacttctgtg gaaagggcta ccacctgatg agcttccccc agtctgcccc gcacggcgtg 3180 gtgttcctgc acgtgaccta tgtgccagcc caggagaaaa atttcaccac tgcccctgct 3240 atctgtcatg atggcaaggc ccacttcccc agagaaggcg ttttcgtgag caatggcaca 3300 cactggttcg tgacacagcg gaacttttac gagcctcaga tcatcacaac tgacaatact 3360 ttcgtgagtg gcaactgcga cgtcgtcatc ggcatcgtga acaacaccgt gtacgaccct 3420 ctgcaacctg agctggacag cttcaaggaa gagctggata agtacttcaa gaaccacacc 3480 agccccgacg tagatctggg cgacatcagc ggcatcaacg ccagcgtggt caacatccag 3540 aaggagatcg acagactgaa cgaggttgcc aagaatctga acgaaagcct gatcgacctg 3600 caggaactgg gcaagtacga gcagtacatc aaatggcctt ggtacatctg gctgggcttc 3660 atcgccggcc tgatcgccat cgtgatggtc accatcatgc tgtgttgcat gacctcatgc 3720 tgctcttgcc tgaagggctg ttgtagctgc ggctcttgtt gcaagttcga cgaagatgac 3780 agcgagcctg tgctcaaggg cgtgaagctg cactacaccc gggccaagcg gagcggctcc 3840 ggcgccacca attttagcct gctaaagcag gccggcgacg tcgaggagaa ccccggccct 3900 tatgccagcg ctctgtggga gatccagcag gtggtggacg ccgaccacag ctacttcacc 3960 agcgactact accagctgta ctctacccaa aagcactacg tgtacatcgg cgatccagcc 4020 cagctgccag cccctgatgc ttacaagact ttccccccaa cagaacctaa gaaagataaa 4080 atttgggtgg ccactgaagg cgccctgaac acgcctaagg accacatcat cacagtggcc 4140 accagcagaa cactgagcta ctacaagtta ggcgcctacg ctttggtgta tttcctgcag 4200 agcatcaact tcgtgcgcat cagcctggaa atccccagaa ggaacgtggc cactctgcag 4260 gctgagccta acatgatggt gaccaacaac acctttaccc tgaagggcgg agccaagaac 4320 cccctgctgt acgatgctaa ttacttcctg tgctggcaca aggatctgag tcctagatgg 4380 tacttttact acctgggcac gggttactac cacaccaccg accccagctt cctgggcaga 4440 tacatgtccg cagaaagcct gagacctgat accagatacg tgctgatgga cggcagaaag 4500 gtgcctacag acaactacat caccacctac cctggccagt gcagattcgt aacggacaca 4560 cctaagggcc ccaaggtgaa gtacagcact tttaagtgct acggagtgtc tcctacaaag 4620 ctgaacgata agtacgagca gtacataaag tggccctggt acatttggct gggcagcagt 4680 agcaagctat gggcccagtg tgttcagctg cataacgact acgtgggata cctgcagcca 4740 agaacctttc tgctgaagta caactag 4767 <![CDATA[<210> 56]]> <![CDATA[<211> 5139]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 聚核苷酸 <![CDATA[<400> 56]]> atgttcgtgt tcctggtgct gctccccctg gtctctagcc agtgcgtgaa tttaaccaca 60 cgcacccaac tgccccccgc atacaccaac tcctttacca gaggcgtgta ctaccctgat 120 aaggtgttta gatctagcgt tttgcacagc acacaggacc tcttcctgcc attcttcagc 180 aatgtgacct ggttccacgc cattcacgtg tccggcacaa acggcactaa gagattcgac 240 aaccccgtgc tgccttttaa tgacggcgtg tactttgcat ccaccgagaa gtctaacatc 300 atcagaggct ggatattcgg caccaccctc gatagcaaga cacagagcct gctcatcgtg 360 aacaacgcca caaacgtggt gatcaaggtg tgcgagtttc agttctgcaa cgaccctttc 420 ctgggggtct actaccacaa aaacaacaag agctggatgg aatctgagtt ccgggtgtac 480 tccagcgcca ataattgcac cttcgagtac gtgtcccagc ccttcctgat ggacttggag 540 ggcaagcagg gcaattttaa gaacctgaga gagttcgtgt ttaaaaatat cgacggctac 600 ttcaagatct acagcaagca tacacctatc aatctggtga gagacctgcc tcagggcttc 660 agcgcattgg agcccctggt tgacctgccc atcggcatca acatcacaag attccagaca 720 ctgctggccc tgcacagaag ctacctgacc cctggagatt cctcttctgg atggaccgcc 780 ggagccgccg cctactacgt gggatacctg cagcctagaa ccttcctact gaagtacaat 840 gagaatggaa ccatcaccga tgccgtggac tgcgctctgg accccctgag cgagacaaag 900 tgtaccctga agagcttcac cgtggaaaag ggcatctatc agaccagcaa cttccgagtc 960 cagcctacag agagcattgt gcggttccct aacatcacaa acctgtgccc ttttggggaa 1020 gtgttcaacg cgacccggtt cgccagcgtg tatgcctgga acagaaaacg gatctccaac 1080 tgcgtggcag attacagcgt gctgtacaac agcgccagtt tcagcacctt caagtgctac 1140 ggcgtgagcc ctacaaaact gaacgatctg tgcttcacca atgtgtacgc cgactctttc 1200 gtgatcaggg gcgacgaagt gaggcagatt gcccccggcc agacgggcaa aatcgccgac 1260 tacaactaca agctgcccga cgacttcacc ggctgcgtta ttgcctggaa ctctaacaac 1320 ctcgattcta aagtgggcgg aaactacaac tacctgtacc ggctgttcag aaaaagcaac 1380 ctgaaacctt tcgagagaga catatccaca gaaatctacc aggctggctc tactccttgt 1440 aatggcgttg aagggttcaa ctgctacttt ccactgcaga gctacggctt tcagcctaca 1500 aacggagtgg gctaccagcc ctaccgtgtg gtggtgctga gcttcgaact gttgcacgcc 1560 cccgctaccg tctgcggccc gaagaagagc acgaacctgg taaagaacaa gtgcgtgaat 1620 ttcaacttca acggcctgac aggcaccggc gtgctgaccg aatcgaacaa gaagtttctg 1680 ccatttcagc agttcggccg ggacatcgcc gacaccaccg atgccgtgcg ggatcctcag 1740 acactagaaa tcctggacat caccccctgt agcttcggcg gcgtgagcgt catcacacct 1800 ggcacaaaca ccagcaacca ggtggccgtg ctctaccagg acgtgaattg cacagaggtg 1860 cctgtggcca tccacgccga tcagctgacc cctacatggc gggtctactc tacaggaagc 1920 aacgtgttcc agacaagagc cggatgcctt ataggcgccg agcacgtgaa caacagctac 1980 gaatgcgaca tccctatcgg cgccggcatc tgtgcttctt accagacaca gactaactct 2040 ccacggagag ccagatcagt ggcctctcag tctatcatcg cctataccat gagtctggga 2100 gccgagaaca gcgtggcata cagcaacaac agcatcgcca tcccaaccaa cttcacaatc 2160 agtgtgacaa ccgagatcct gcccgtgtcc atgaccaaga cctcggtgga ttgcacgatg 2220 tacatctgcg gcgacagcac cgaatgcagc aacctcctgc tccagtacgg cagtttctgc 2280 acacagctga accgggccct aaccggcatc gccgtggaac aggacaaaaa cacccaggag 2340 gtgttcgccc aagtgaagca aatctacaag accccaccta tcaaggactt cggcggcttc 2400 aattttagcc agatcctgcc agacccttct aagccttcaa agagaagctt catcgaggac 2460 ctgttattca acaaagtgac gctggccgat gctggcttca tcaagcaata cggcgactgc 2520 ctcggcgaca tcgcggcacg agacctgatc tgcgcccaga agtttaacgg actgaccgtg 2580 ttaccacctc ttctgaccga tgaaatgatc gcacagtaca ccagcgccct cctggccggc 2640 accatcacca gcggatggac cttcggagcg ggcgctgcac tgcagatccc tttcgccatg 2700 cagatggcct acagatttaa tgggattggc gtgacccaaa acgtgctgta cgaaaaccag 2760 aaattgatcg ctaaccaatt caactctgcc attggaaaga tccaggatag cctgagctct 2820 accgcatccg ctctgggcaa gttgcaagac gtggtgaacc agaacgccca ggccctgaac 2880 acgctggtga aacagctgag cagcaacttc ggcgctatta gcagcgtgct gaatgatatt 2940 ctgtcccggc tggacccgcc tgaggctgag gtgcagattg atcggctgat tacgggtcgg 3000 ctgcagagcc tgcagaccta cgttacccag cagttgatca gagccgccga gatcagagcc 3060 agtgcgaacc tggcggcaac caagatgagc gagtgtgtcc tcggacagag caagcgggtt 3120 gacttctgtg gaaagggcta ccacctgatg agcttccccc agtctgcccc gcacggcgtg 3180 gtgttcctgc acgtgaccta tgtgccagcc caggagaaaa atttcaccac tgcccctgct 3240 atctgtcatg atggcaaggc ccacttcccc agagaaggcg ttttcgtgag caatggcaca 3300 cactggttcg tgacacagcg gaacttttac gagcctcaga tcatcacaac tgacaatact 3360 ttcgtgagtg gcaactgcga cgtcgtcatc ggcatcgtga acaacaccgt gtacgaccct 3420 ctgcaacctg agctggacag cttcaaggaa gagctggata agtacttcaa gaaccacacc 3480 agccccgacg tagatctggg cgacatcagc ggcatcaacg ccagcgtggt caacatccag 3540 aaggagatcg acagactgaa cgaggttgcc aagaatctga acgaaagcct gatcgacctg 3600 caggaactgg gcaagtacga gcagtacatc aaatggcctt ggtacatctg gctgggcttc 3660 atcgccggcc tgatcgccat cgtgatggtc accatcatgc tgtgttgcat gacctcatgc 3720 tgctcttgcc tgaagggctg ttgtagctgc ggctcttgtt gcaagttcga cgaagatgac 3780 agcgagcctg tgctcaaggg cgtgaagctg cactacaccc gggccaagcg gagcggctcc 3840 ggcgccacca attttagcct gctaaagcag gccggcgacg tcgaggagaa ccccggccct 3900 cactcctact ttacaagtga ttactaccaa ctgtactcaa cacagaagca ctacgtgtac 3960 atcggcgatc ctgcccagct gccagcccct tacgccctag tgtattttct gcaatctatc 4020 aacttcgtcc ggattgccac gtactatctg ttcgacgagt ctggcgaatt caaactggcc 4080 tcccacaaga accctctgct gtatgacgct aactacttcc tatgctggca cagaaaggtg 4140 cccaccgata actacatcac aacctaccct ggccagataa ccgtggccac aagcagaaca 4200 ctgtcctact acaagctggg tgctcctaat atgatggtga ccaacaacac attcaccctg 4260 aagggcggag ccagtatcat caagaccatc cagcctagag tggaaaagaa aaagctgaag 4320 tacgagcagt acatcaagtg gccttggtat atctggctgg gaaaagacct gagccccaga 4380 tggtactttt actatctggg cacaggcacc tacaagaaca cctgtgacgg cacaacattc 4440 acctacgcct ctgccgtgca cgccggaaca gacctggaag gcaacttcta cggacctttc 4500 gagagcctga gacccgatac caggtacgtg ctgatggatg gccagaccgc ctgtacagac 4560 gacaatgctc tggcctacta taacaccact agcagctcaa agctgtgggc ccagtgcgtg 4620 cagctgcata acgattacgc cagcgccctg tgggagatcc aacaggtggt ggacgccgac 4680 gacgcttata agaccttccc tcccaccgag cccaagaagg acaagagtac cttcaaatgc 4740 tacggcgttt ctcccaccaa actgaacgac gctcctagcg ccagtgcctt ctttggaatg 4800 tcaagaatcg gcatgcttgc cctgctgctg ctcgatagac tgaaccagct ggaatccaag 4860 agccttgaga tccccagaag aaacgtggct accctgcagg ccgagtacta ccacaccacc 4920 gacccttcct tcctggggag atacatgagc gccagagacg tcgatactga cttcgtaaat 4980 gagttctacg cctacctgtg tagattcgtc acagacaccc caaagggccc taaggtcaag 5040 tacatttggg tggccaccga aggcgctctg aacactccta aggatcacat ctatgtcggc 5100 tacctgcagc ctcggacatt cctgctgaaa tacaactag 5139 <![CDATA[<210> 57]]> <![CDATA[<211> 1647]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 聚核苷酸 <![CDATA[<400> 57]]> atgctgaggg tggaggcctt cgagtactac cacaccaccg accccagctt cctgggcagg 60 tacatgagcg ccctgaacca caccaagaag tgggtgctgc agcagctgag ggtggagagc 120 agcagcaagc tgtgggccca gtgcgtgcag ctgcacaacg acatcctgct ggccaaggac 180 accgccccca gcgccagcgc cttcttcggc atgagcagga tcggcatgga ggtgaccccc 240 agcggcacct ggctgaccta caccggcgcc atcaagctgg acgacaagga ccccaacttc 300 aaggaccagg tgatcctgct gaacaagcac atcgacgcct acaagacctt cccccccacc 360 gagcccaaga aggacaagag cctggagatc cccaggagga acgtggccac cctgcaggcc 420 gagctgaacg agagcctgat cgacctgcag gagctgggca agtacgagca gtacatcaag 480 tggccctggt acatctggct gggcttcatc gccggcctga tcgccatcgt gatggtgcag 540 accgcctgca ccgacgacaa cgccctggcc tactacaaca ccaccaaggg cggcaggttc 600 gtgctggccc tgctgagcga cctgcaggac ctgaagtggg ccaggttccc caagagcgac 660 ggcaccggca ccatctacac cgagctggag cccccctgca ggttcgtgac cgacaccccc 720 aagggcccca aggtgaagta cagcatcatc aagaccatcc agcccagggt ggagaagaag 780 aagctgatca ccgtggccac cagcaggacc ctgagctact acaagctggg cgccagccag 840 agggtggccg gcgacagcgg cttcgccgcc tacagcaggt acaggatcgg caactacaag 900 ctgaacaccg accacagcag cagcagcgac aacatcgccc tgctggtgca gagcaagctg 960 atcgagtaca ccgacttcgc caccagcgcc tgcgtgctgg ccgccgagtg caccatcttc 1020 aaggacgcca gcggcaagcc cgtgccctac tgctacgaca ccaacgtgct ggagggcagc 1080 gtggcctacg agagcctgag gcccgacacc aggtacgtgc tgatggacgg cgagaagtac 1140 tgcgccctgg cccccaacat gatggtgacc aacaacacct tcaccctgaa gggcggcgcc 1200 cccaccaagg tgaccttcgg cggcgacggc aagatgaagg acctgagccc caggtggtac 1260 ttctactacc tgggcaccgg ccccgaggcc ggcctgccct acggcgccaa caaggacggc 1320 atcatctggg tggccaccga gggcgccctg aacaccccca aggaccacat cggcaccagg 1380 aacccctacg ccctggtgta cttcctgcag agcatcaact tcgtgaggat catcatgagg 1440 ctgtggctgt gctggaagtg caggagcaag aaccccctgc tgtacgacgc caactacttc 1500 ctgtgctggc acacctacaa gaacacctgc gacggcacca ccttcaccta cgccagcgcc 1560 ctgtgggaga tccagcaggt ggtggacgcc gacaagcact acgtgtacat cggcgacccc 1620 gcccagctgc ccgccccctg ataatag 1647 <![CDATA[<210> 58]]> <![CDATA[<211> 3306]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 聚核苷酸 <![CDATA[<400> 58]]> atgtacgcca gcgccctgtg ggagatccag caggtggtgg acgccgacag cagcagcaag 60 ctgtgggccc agtgcgtgca gctgcacaac gacaagcact acgtgtacat cggcgacccc 120 gcccagctgc ccgcccccag cctggagatc cccagaagaa acgtggccac cctgcaggcc 180 gagagagacg tggacaccga cttcgtgaac gagttctacg cctacctgac ctacaagaac 240 acctgcgacg gcaccacctt cacctacgcc agcgccccca acatgatggt gaccaacaac 300 accttcaccc tgaagggcgg cgccgccacc tactacctgt tcgacgagag cggcgagttc 360 aagctggcca gccactacta ccacaccacc gaccccagct tcctgggcag atacatgagc 420 gccgagagcc tgagacccga caccagatac gtgctgatgg acggccagac cgcctgcacc 480 gacgacaacg ccctggccta ctacaacacc accagcatca tcaagaccat ccagcccaga 540 gtggagaaga agaagctgtg cagattcgtg accgacaccc ccaagggccc caaggtgaag 600 tacagcacct tcaagtgcta cggcgtgagc cccaccaagc tgaacgacag aaaggtgccc 660 accgacaact acatcaccac ctaccccggc caggtgcacg ccggcaccga cctggagggc 720 aacttctacg gccccttcta cgtgggctac ctgcagccca gaaccttcct gctgaagtac 780 aacggcgacg gcaagatgaa ggacctgagc cccagatggt acttctacta cctgggcacc 840 ggccccgagg ccggcctgcc ctacggcgcc aacaaggacg gcatcatctg ggtggccacc 900 gagggcgccc tgaacacccc caaggaccac atcggcacca gaaaccccgc caacaacgcc 960 gccatcgtgc tgcagctgcc ccagggcacc accctgccca agggcttcta cgccgagggc 1020 agcagaggcg gcagccaggc cagcagcaga agcagcagca gaagcagaaa cagcagcaga 1080 aacagcaccc ccggcgagaa gtgggagagc ggcgtgaagg actgcgtggt gctgcacagc 1140 tacttcacca gcgactacta ccagctgtac agcacccagc tgagcaccga caccggcgtg 1200 gagcacgtga ccttcttcat ctacaacaag atcgtggacg agcccgagga gcacgtgcag 1260 atccacacca tcgacggcag cagcggcgtg gtgaaccccg tgatggagcc catctacgac 1320 gagcccacca ccaccaccag cgtgcccctg agcagcatgg gcaccagccc cgccagaatg 1380 gccggcaacg gcggcgacgc cgccctggcc ctgctgctgc tggacagact gaaccagctg 1440 gagagcaaga tgagcggcaa gggccagcag cagcagggcc agaccgtgac caagaagagc 1500 gccgccgagg ccagcaagaa gcccagacag aagagaaccg ccaccaaggc ctacaacgtg 1560 acccaggcct tcggcagaag aggccccgag cagacccagg gcaacttcgg cgaccaggag 1620 ctgatcagac agggcaccga ctacaagcac tggccccaga tcgcccagtt caagcagggc 1680 gagatcaagg acgccacccc cctggacttc gtgagagcca ccgccaccat ccccatccag 1740 gccagcctgc ccttcggctg gctgatcgtg ggcgtggccc tgctggccgt gttccagagc 1800 gccagcaaga tcatcaccct gaagaagaga tggcagctgg ccctgagcaa gggcgtgcac 1860 ttcgtgtgca acctgctgct gctgttcgtg accgtgtaca gccacctgct gctggtggcc 1920 gccggcctgg aggccatgag cgacaacggc ccccagaacc agagaaacgc ccccagaatc 1980 accttcggcg gccccagcga cagcaccggc agcaaccaga acggcgagag aagcggcgcc 2040 agaagcaagc agagaagacc ccagggcctg cccaacaaca ccgccagctg gttcaccgcc 2100 ctgacccagc acggcaagga gggcctgaag ttccccagag gccagggcgt gcccatcaac 2160 accaacagca gccccgacga ccagatcggc tactacagaa gagccaccag aagaatcaga 2220 ggcctgttcg ccagaaccag aagcatgtgg agcttcaacc ccgagaccaa catcctgctg 2280 aacgtgcccc tgcacggcac catcctgacc agacccctgc tggagagcga gctggtgatc 2340 ggcgccgtga tcctgagagg ccacctgaga atcgccggcc accacctggg cagatgcgac 2400 atcaaggacc tgcccaagga gcccttcctg tacctgtacg ccctggtgta cttcctgcag 2460 agcatcaact tcgtgagaat catcatgaga ctgtggctgt gctggaagtg cagaagcaag 2520 aaccccctgc tgtacgacgc caactacttc ctgtgctggc acaccaactg ctacgactac 2580 tgcatcccct acaacagcgt gaccagcagc atcgtgatca ccagcggcga cggcaccacc 2640 agccccatca gcgagcacga ctaccagatc ggcggctaca ccgcccccag cgccagcgcc 2700 ttcttcggca tgagcagaat cggcatggag gtgaccccca gcggcacctg gctgacctac 2760 accggcgcca tcaagctgga cgacaaggac cccaacttca aggaccaggt gatcctgctg 2820 aacaagcaca tcgacgccta caagaccttc ccccccaccg agcccaagaa ggacaagaag 2880 aagaaggcct acgagaccca ggccctgccc cagagacaga agaagcagca gaccgtgacc 2940 ctgctgcccg ccgccgacct ggacgacttc agcaagcagc tgcagcagag catgagcagc 3000 gccgacagca cccaggccat caccgtggcc accagcagaa ccctgagcta ctacaagctg 3060 ggcgccagcc agagagtggc cggcgacagc ggcttcgccg cctacagcag atacagaatc 3120 ggcaactaca agctgaacac cgaccacagc agcagcagcg acaacatcgc cctgctggtg 3180 cagctgaacg agagcctgat cgacctgcag gagctgggca agtacgagca gtacatcaag 3240 tggccctggt acatctggct gggcttcatc gccggcctga tcgccatcgt gatggtgtga 3300 taatag 3306 <![CDATA[<210> 59]]> <![CDATA[<211> 3672]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 聚核苷酸 <![CDATA[<400> 59]]> atggccacct actacctgtt cgacgagagc ggcgagttca agctggccag ccacagcaag 60 ctgatcgagt acaccgactt cgccaccagc gcctgcgtgc tggccgccga gtgcaccatc 120 ttcaaggacg ccagcggcaa gcccgtgccc tactgctacg acaccaacgt gctggagggc 180 agcgtggcct acgagagcct gagacccgac accagatacg tgctgatgga cggcagaaag 240 gtgcccaccg acaactacat caccacctac cccggccagc agaccgcctg caccgacgac 300 aacgccctgg cctactacaa caccaccaag ggcggcagat tcgtgctggc cctgctgagc 360 gacctgcagg acctgaagtg ggccagattc cccaagagcg acggcaccgg caccatctac 420 accgagctgg agcccccctg cagattcgtg accgacaccc ccaagggccc caaggtgaag 480 tacagcacct tcaagtgcta cggcgtgagc cccaccaagc tgaacgacag agacgtggac 540 accgacttcg tgaacgagtt ctacgcctac ctgacctaca agaacacctg cgacggcacc 600 accttcacct acgccagcgc cctgtgggag atccagcagg tggtggacgc cgacctgaga 660 gtggaggcct tcgagtacta ccacaccacc gaccccagct tcctgggcag atacatgagc 720 gccctgaacc acaccaagaa gtggaagcac tacgtgtaca tcggcgaccc cgcccagctg 780 cccgccccca gcctggagat ccccagaaga aacgtggcca ccctgcaggc cgaggtgctg 840 cagcagctga gagtggagag cagcagcaag ctgtgggccc agtgcgtgca gctgcacaac 900 gacatcctgc tggccaagga caccgtgcac gccggcaccg acctggaggg caacttctac 960 ggccccttca gcatcatcaa gaccatccag cccagagtgg agaagaagaa gctggagaag 1020 tactgcgccc tggcccccaa catgatggtg accaacaaca ccttcaccct gaagggcggc 1080 gcccccacca aggtgacctt cggctacgtg ggctacctgc agcccagaac cttcctgctg 1140 aagtacaacg gcgacggcaa gatgaaggac ctgagcccca gatggtactt ctactacctg 1200 ggcaccggcc ccgaggccgg cctgccctac ggcgccaaca aggacggcat catctgggtg 1260 gccaccgagg gcgccctgaa cacccccaag gaccacatcg gcaccagaaa ccccgccaac 1320 aacgccgcca tcgtgctgca gctgccccag ggcaccaccc tgcccaaggg cttctacgcc 1380 gagggcagca gaggcggcag ccaggccagc agcagaagca gcagcagaag cagaaacagc 1440 agcagaaaca gcacccccgg cgagaagtgg gagagcggcg tgaaggactg cgtggtgctg 1500 cacagctact tcaccagcga ctactaccag ctgtacagca cccagctgag caccgacacc 1560 ggcgtggagc acgtgacctt cttcatctac aacaagatcg tggacgagcc cgaggagcac 1620 gtgcagatcc acaccatcga cggcagcagc ggcgtggtga accccgtgat ggagcccatc 1680 tacgacgagc ccaccaccac caccagcgtg cccctgagca gcatgggcac cagccccgcc 1740 agaatggccg gcaacggcgg cgacgccgcc ctggccctgc tgctgctgga cagactgaac 1800 cagctggaga gcaagatgag cggcaagggc cagcagcagc agggccagac cgtgaccaag 1860 aagagcgccg ccgaggccag caagaagccc agacagaaga gaaccgccac caaggcctac 1920 aacgtgaccc aggccttcgg cagaagaggc cccgagcaga cccagggcaa cttcggcgac 1980 caggagctga tcagacaggg caccgactac aagcactggc cccagatcgc ccagttcaag 2040 cagggcgaga tcaaggacgc cacccccctg gacttcgtga gagccaccgc caccatcccc 2100 atccaggcca gcctgccctt cggctggctg atcgtgggcg tggccctgct ggccgtgttc 2160 cagagcgcca gcaagatcat caccctgaag aagagatggc agctggccct gagcaagggc 2220 gtgcacttcg tgtgcaacct gctgctgctg ttcgtgaccg tgtacagcca cctgctgctg 2280 gtggccgccg gcctggaggc catgagcgac aacggccccc agaaccagag aaacgccccc 2340 agaatcacct tcggcggccc cagcgacagc accggcagca accagaacgg cgagagaagc 2400 ggcgccagaa gcaagcagag aagaccccag ggcctgccca acaacaccgc cagctggttc 2460 accgccctga cccagcacgg caaggagggc ctgaagttcc ccagaggcca gggcgtgccc 2520 atcaacacca acagcagccc cgacgaccag atcggctact acagaagagc caccagaaga 2580 atcagaggcc tgttcgccag aaccagaagc atgtggagct tcaaccccga gaccaacatc 2640 ctgctgaacg tgcccctgca cggcaccatc ctgaccagac ccctgctgga gagcgagctg 2700 gtgatcggcg ccgtgatcct gagaggccac ctgagaatcg ccggccacca cctgggcaga 2760 tgcgacatca aggacctgcc caaggagccc ttcctgtacc tgtacgccct ggtgtacttc 2820 ctgcagagca tcaacttcgt gagaatcatc atgagactgt ggctgtgctg gaagtgcaga 2880 agcaagaacc ccctgctgta cgacgccaac tacttcctgt gctggcacac caactgctac 2940 gactactgca tcccctacaa cagcgtgacc agcagcatcg tgatcaccag cggcgacggc 3000 accaccagcc ccatcagcga gcacgactac cagatcggcg gctacaccgc ccccagcgcc 3060 agcgccttct tcggcatgag cagaatcggc atggaggtga cccccagcgg cacctggctg 3120 acctacaccg gcgccatcaa gctggacgac aaggacccca acttcaagga ccaggtgatc 3180 ctgctgaaca agcacatcga cgcctacaag accttccccc ccaccgagcc caagaaggac 3240 aagaagaaga aggcctacga gacccaggcc ctgccccaga gacagaagaa gcagcagacc 3300 gtgaccctgc tgcccgccgc cgacctggac gacttcagca agcagctgca gcagagcatg 3360 agcagcgccg acagcaccca ggccatcacc gtggccacca gcagaaccct gagctactac 3420 aagctgggcg ccagccagag agtggccggc gacagcggct tcgccgccta cagcagatac 3480 agaatcggca actacaagct gaacaccgac cacagcagca gcagcgacaa catcgccctg 3540 ctggtgcagc tgaacgagag cctgatcgac ctgcaggagc tgggcaagta cgagcagtac 3600 atcaagtggc cctggtacat ctggctgggc ttcatcgccg gcctgatcgc catcgtgatg 3660 gtgtgataat ag 3672 <![CDATA[<210> 60]]> <![CDATA[<211> 5403]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 聚核苷酸 <![CDATA[<400> 60]]> atgttcgttt ttctggttct gctgccactc gtgtcaagtc agtgcgtgaa ccttactaca 60 aggactcagc tcccaccagc atacacgaat agttttacgc ggggcgtgta ctatccagac 120 aaagtgtttc gcagctctgt tctacattca actcaagacc tgtttttgcc tttcttctcc 180 aatgtgacct ggttccacgc catccacgtg agtggcacga acgggaccaa acggtttgat 240 aacccagtgc tgccttttaa cgacggggta tatttcgcct ctactgaaaa atccaacatc 300 atccgcggct ggattttcgg gaccactctt gactccaaga cccagtcact cctgatcgta 360 aacaatgcga ccaacgtcgt gattaaggtg tgcgagtttc aattctgtaa cgaccctttc 420 ctgggtgtat attaccacaa gaataataag tcctggatgg aatcagagtt tagagtatac 480 tctagcgcta acaactgtac ttttgaatat gtgtcccaac ccttcttgat ggacttggag 540 ggaaaacagg gaaattttaa gaatctccga gagttcgtgt ttaaaaacat tgacggctat 600 ttcaagatat actctaagca tacacccatc aatctggtcc gcgatctgcc acaggggttt 660 agcgcactgg aaccgttggt ggatctcccc attgggatta atatcacccg tttccagaca 720 cttttagcct tgcatcggag ctacctaacc cccggggact caagtagcgg ctggactgcg 780 ggagcggccg cctattatgt cggatatctg cagcctcgga cattcctcct gaagtacaat 840 gagaatggca caattacaga cgcagtagac tgtgccctgg atccgctctc cgaaaccaaa 900 tgcacgctga aatcatttac ggtggaaaaa ggtatatacc agaccagcaa tttcagggtg 960 cagcctacgg agtccattgt ccgtttcccc aatatcacca atctgtgtcc tttcggcgaa 1020 gtgtttaacg caactaggtt cgcgagtgtc tacgcctgga accgaaagag aatctcaaac 1080 tgtgtggccg attacagcgt cctgtacaac tccgcatctt tcagtacctt caagtgctac 1140 ggggtcagcc ccaccaaact taacgatctt tgcttcacta acgtttatgc cgatagtttt 1200 gtcatcaggg gcgacgaagt gcgacagatt gcccctggac agacgggaaa gatcgccgac 1260 tataactata agctgccaga cgatttcaca ggatgcgtga tcgcctggaa tagcaacaat 1320 ctggactcta aggtgggggg gaattataat tatttgtata gactgtttcg aaagtcaaac 1380 cttaagccat ttgagaggga tatcagcaca gagatttacc aggcaggaag caccccatgt 1440 aacggggtag aaggcttcaa ctgctacttc cccctccagt catatgggtt ccagcctacc 1500 aatggtgtgg gttaccagcc gtacagagta gtggttcttt catttgagct gctgcatgcc 1560 cctgccaccg tctgcggacc taaaaaatct accaatttag tgaaaaataa gtgcgtgaat 1620 tttaatttca acggccttac gggcaccggc gtgctgactg agagcaataa gaaattctta 1680 ccatttcagc agttcggccg cgacatagct gataccaccg atgcagttcg cgacccccag 1740 accctggaga tccttgacat cactccttgc agtttcggag gagtctcggt catcacacct 1800 ggaacaaaca catccaacca ggtggcagtt ctttaccagg atgtgaactg taccgaagtg 1860 ccagtggcaa tccacgccga tcagttaact cccacctgga gagtgtactc tacaggctct 1920 aacgtcttcc agactcgggc cggttgcctt attggggctg agcacgtgaa caactcctac 1980 gagtgcgaca tacctattgg tgccggcatc tgtgccagct accagaccca aaccaattcg 2040 ccaaggcgag cgcgttctgt agcaagccag tcgattattg cctacactat gtccttaggt 2100 gctgagaact ctgtggctta ctctaacaac tccatagcaa ttccaacaaa ctttacaatt 2160 agtgttacta ctgaaatctt gcccgtcagc atgactaaaa cctctgtcga ttgtaccatg 2220 tacatttgtg gggactctac agagtgcagc aatcttctgc tccagtacgg ctctttttgt 2280 acgcagctga accgtgctct gactgggatt gccgtcgagc aagataagaa cacccaggag 2340 gtgtttgccc aagttaagca gatttataag acaccaccca tcaaagactt cggcggattt 2400 aacttttctc agattctgcc cgacccctcc aagcccagca agaggagctt tatcgaggac 2460 ctgctgttca ataaggtcac actcgctgat gcaggattca tcaagcagta tggcgattgc 2520 ctcggagaca tcgctgcgag agacctcata tgcgctcaga aattcaatgg cctgacggtg 2580 ctacctccgc tactgactga cgaaatgata gctcagtaca cgtcggctct cttggccgga 2640 acaatcacct ccggatggac ctttggcgcg ggagcagcac tacagatccc ttttgcaatg 2700 caaatggctt accggttcaa tggcataggg gtaactcaaa atgtgctgta cgagaaccaa 2760 aaattgatcg ctaaccagtt caacagcgcc attgggaaga tccaggattc tttgtcctca 2820 accgccagtg cattgggcaa gctccaggac gtcgttaacc agaacgctca ggccttaaac 2880 acgctggtca aacagttgtc ctccaatttt ggcgctatat ccagcgttct caatgatatc 2940 ctttcccgct tagatccacc agaagctgag gtccaaattg ataggttaat aaccggcaga 3000 ctccagagcc tgcaaactta cgtcacccag caactcatac gcgccgcgga gatccgcgct 3060 agcgcaaacc tagctgccac taaaatgagt gagtgtgttc tcggacagtc taagcgggtg 3120 gacttttgcg gcaaaggcta tcacctcatg agcttccccc aaagcgcacc acatggcgtt 3180 gtgttcttgc acgtgactta cgttcccgca caggagaaaa atttcaccac agcccccgcc 3240 atctgccatg atgggaaagc tcattttcca cgagaagggg tgttcgtgtc aaacggtaca 3300 cactggtttg tcacacaaag aaatttttat gaacctcaaa ttatcacaac tgacaatacc 3360 ttcgtgagcg gaaactgtga tgtcgtaatt gggatcgtaa acaacactgt gtatgacccc 3420 cttcagcccg aactggacag tttcaaggaa gagcttgaca agtatttcaa gaaccatact 3480 tcaccagacg tagaccttgg tgatatttca ggaatcaacg ctagtgtggt gaacatccag 3540 aaagaaattg atcgcctcaa tgaggtcgcg aaaaatctga atgagtctct gatcgacctg 3600 caagagttgg ggaagtacga acagtatatt aaatggccct ggtacatttg gctgggattt 3660 atagctggac tcattgccat tgttatggtc acaataatgc tgtgttgcat gactagctgt 3720 tgctcatgcc taaaagggtg ctgcagttgc ggctcctgtt gcaagtttga tgaagacgat 3780 agcgagccgg tccttaaagg cgttaagcta cattatacta gggctaagag atccggcagt 3840 ggggcgacca actttagctt gttgaagcaa gcaggggacg tggaagaaaa ccccggccct 3900 tacgccctag tgtactttct gcagtccatt aacttcgttc ggattatcat gaggttgtgg 3960 ctgtgttgga agtgtcggtc gaagaatcca ctcctgtacg atgcaaatta ctttctgtgc 4020 tggcacggag acggcaaaat gaaagacctg tccccgagat ggtattttta ttatctgggt 4080 accggtcccg aggcggggct gccctacggg gcaaacaaag acggaatcat ctgggtcgca 4140 acagagggag ctcttaatac acctaaagat cacattggca cccgcaatcc cgagaagtac 4200 tgtgccctgg cccccaatat gatggtgaca aataacacct ttacattaaa gggcggggcc 4260 ccaaccaagg tgacattcgg tacatacaag aatacctgtg acggcacaac gttcacgtat 4320 gcaagcgctc tgtgggagat ccaacaggtg gtggacgccg acctgaatga aagtctgatt 4380 gatctccagg aactcggcaa atatgagcag tatatcaagt ggccttggta catctggctc 4440 ggttttatcg ctggtcttat cgccatcgtg atggtgcaga ctgcttgcac cgatgataat 4500 gcactcgcgt actacaacac cacaaaagga ggacgatttg tgctagccct gctcagtgat 4560 ctgcaagatc tcaaatgggc ccgcttcccg aagtccgatg gaaccggcac aatctataca 4620 gaattggaac ctccttgtag gttcgtgacc gatactccca agggtcccaa ggtaaaatac 4680 ctgcgggtag aagcttttga atactaccac actactgacc catcttttct gggcagatat 4740 atgtctgcat taaatcacac caaaaagtgg ataacagtgg ccacctcccg gacactgtca 4800 tactataaac tgggtgcatc ccagcgggtt gctggtgatt ccggattcgc cgcctattcg 4860 cggtatagaa tagggaatta caagttgaat accgaccact ccagttctag tgataacata 4920 gccctgctgg ttcaggttct tcagcagctg agagtagaat cttccagcaa gctgtgggcc 4980 cagtgtgttc aactccacaa tgatatttta ctcgccaagg acactgcacc gtcagcctct 5040 gccttcttcg ggatgtctcg tattggtatg gaggttactc ctagcggcac atggctgacg 5100 tacaccgggg ctataaagtt ggacgacaag gacccaaact tcaaggacca agtgatctta 5160 ctgaacaaac atatcgatgc ttataagaca ttccctccta ctgagcctaa aaaagataaa 5220 tcaaagctca ttgagtacac agattttgct acaagcgctt gtgtcctggc ggccgagtgc 5280 accatcttca aagacgctag tggcaagccc gtgccgtatt gctatgacac caatgtgctc 5340 gagggttcag tcgcctatga gtcattaagg ccagatacga ggtacgtcct aatggatggg 5400 tag 5403 <![CDATA[<210> 61]]> <![CDATA[<211> 20]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 肽 <![CDATA[<220>]]> <![CDATA[<221> 位點]]> <![CDATA[<222> (1)..(10)]]> <![CDATA[<223> 此區域可涵蓋0-10個殘基]]> <![CDATA[<220>]]> <![CDATA[<221> 位點]]> <![CDATA[<222> (11)..(20)]]> <![CDATA[<223> 此區域可涵蓋0-10個殘基]]> <![CDATA[<220>]]> <![CDATA[<223> 關於取代及較佳實施例之詳細描述,參見所申請之說明書]]> <![CDATA[<400> 61]]> Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Ser Ser Ser Ser Ser 1 5 10 15 Ser Ser Ser Ser 20 <![CDATA[<210> 62]]> <![CDATA[<211> 10]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 肽 <![CDATA[<400> 62]]> Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 <![CDATA[<210> 63]]> <![CDATA[<211> 8]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 肽 <![CDATA[<400> 63]]> Gly Gly Gly Ser Gly Gly Gly Ser 1 5 <![CDATA[<210> 64]]> <![CDATA[<211> 11]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 肽 <![CDATA[<400> 64]]> Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser 1 5 10 <![CDATA[<210> 65]]> <![CDATA[<211> 4]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列(Artificial Sequence)]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成]]> 肽 <![CDATA[<400> 65]]> Ser Gly Ser Gly 1
Claims (93)
- 一種免疫原性多肽,其包含至少兩個選自表1A、1B、1C、1D、1E及/或1F之肽抗原決定基。
- 如請求項1之免疫原性多肽,其包含呈串接次序之該至少兩個肽抗原決定基,視情況其中至少一或多個免疫顯性抗原決定基存在於超過一個複本中。
- 如請求項2之免疫原性多肽,其包含至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29個或更多個該等肽抗原決定基,視情況其中該免疫原性多肽包含HLA-A*02、HLA-A*03、HLA-A*01、HLA-A*11、HLA-A*24及HLA-B*07中之每一者至少一個、兩個及/或三個免疫顯性抗原決定基。
- 如請求項2或3之免疫原性多肽,其包含3個來自表1A、1B、1C、1D、1E及1F中之每一者之肽抗原決定基。
- 如請求項2至4中任一項之免疫原性多肽,其進一步包含該等肽抗原決定基之間的連接子。
- 如請求項5之免疫原性多肽,其中該連接子包含用於該等肽抗原決定基中之每一者的至少三個胺基酸,其中該至少三個胺基酸係與其各別肽抗原決定基鄰接之彼等。
- 如請求項5之免疫原性多肽,其中該連接子為蛋白酶體裂解基序。
- 如請求項2至7中任一項之免疫原性多肽,其進一步包含一或多種選自由Orf1ab、M、N、Orf3a及S組成之群的全長SARS-CoV-2蛋白,或其一或多個蛋白片段,視情況其中該一或多种全長SARS-CoV-2蛋白之片段涵蓋未編碼功能性SARS-CoV-2蛋白之SARS-CoV-2蛋白。
- 如請求項2至8中任一項之免疫原性多肽,其進一步包含核糖體停止/再啟動區段、IRES區段及/或轉譯後裂解區段,視情況其中該轉譯後裂解區段為P2A區段。
- 如請求項2至9中任一項之免疫原性多肽,其包含表1G或表1I中所提供之胺基酸序列中的任一者。
- 如請求項1之免疫原性多肽,其包含至少兩個肽片段,該至少兩個肽片段各自包含該等肽抗原決定基中之至少兩者,其中每一個肽片段中的該等肽抗原決定基中之該至少兩者係源自同一SARS-CoV-2蛋白。
- 如請求項11之免疫原性多肽,其中該至少兩個肽片段係源自SARS-CoV-2之N蛋白、M蛋白、ORF1a/b蛋白或ORF3a蛋白。
- 如請求項11或12之免疫原性多肽,其包含至多6個該等肽片段。
- 如請求項11至13中任一項之免疫原性多肽,其進一步包含一或多種選自由Orf1ab、M、N、Orf3a及S組成之群的全長SARS-CoV-2蛋白,或其一或多個蛋白片段,視情況其中該一或多种全長SARS-CoV-2蛋白之片段涵蓋未編碼功能性SARS-CoV-2蛋白之SARS-CoV-2蛋白。
- 如請求項11至14中任一項之免疫原性多肽,其進一步包含核糖體停止/再啟動區段、IRES區段及/或轉譯後裂解區段,視情況其中該轉譯後裂解區段為P2A區段。
- 如請求項11、12、14及15中任一項之免疫原性多肽,其包含表1H或表1J中所提供之胺基酸序列中的任一者。
- 如請求項1至16中任一項之免疫原性多肽,其中該免疫原性多肽能夠活體外及/或活體內引出T細胞反應,視情況其中藉由四聚體染色分析、T細胞活化分析、CD137染色分析、細胞內IFNg染色分析、細胞介素釋放分析及/或T細胞增生分析來測定該T細胞反應。
- 一種免疫原性組合物,其包含至少一種如請求項1至17中任一項之免疫原性多肽,視情況其中該免疫原性組合物進一步包含1)一或多種選自由Orf1ab、M、N、Orf3a及S組成之群的全長SARS-CoV-2蛋白,或其一或多個蛋白片段,視情況其中該一或多种全長SARS-CoV-2蛋白之片段涵蓋未編碼功能性SARS-CoV-2蛋白之SARS-CoV-2蛋白,及/或2)佐劑。
- 如請求項18之免疫原性組合物,其中該免疫原性組合物能夠活體外及/或活體內引出T細胞反應,視情況其中藉由四聚體染色分析、T細胞活化分析、CD137染色分析、細胞內IFNg染色分析、細胞介素釋放分析及/或T細胞增生分析來測定該T細胞反應。
- 如請求項18或19之免疫原性組合物,其中該免疫原性組合物能够引出個體之T細胞反應。
- 一種組合物,其包含至少一種如請求項1至17中任一項之免疫原性多肽及MHC分子。
- 如請求項21之組合物,其中該MHC分子為MHC多聚體,視情況其中該MHC多聚體為四聚體。
- 如請求項21或22之組合物,其中該MHC分子為MHC I類分子。
- 如請求項21至23中任一項之組合物,其中該MHC分子包含MHC α鏈,該鏈係選自由HLA-A*02、HLA-A*03、HLA-A*01、HLA-A*11、HLA-A*24及/或HLA-B*07組成之群的HLA血清型,視情況其中該HLA等位基因係選自由HLA-A*0201、HLA-A*0202、HLA-A*0203、HLA-A*0204、HLA-A*0205、HLA-A*0206、HLA-A*0207、HLA-A*0210、HLA-A*0211、HLA-A*0212、HLA-A*0213、HLA-A*0214、HLA-A*0216、HLA-A*0217、HLA-A*0219、HLA-A*0220、HLA-A*0222、HLA-A*0224、HLA-A*0230、HLA-A*0242、HLA-A*0253、HLA-A*0260、HLA-A*0274等位基因、HLA-A*0301、HLA-A*0302、HLA-A*0305、HLA-A*0307、HLA-A*0101、HLA-A*0102、HLA-A*0103、HLA-A*0116等位基因、HLA-A*1101、HLA-A*1102、HLA-A*1103、HLA-A*1104、HLA-A*1105、HLA-A*1119等位基因、HLA-A*2402、HLA-A*2403、HLA-A*2405、HLA-A*2407、HLA-A*2408、HLA-A*2410、HLA-A*2414、HLA-A*2417、HLA-A*2420、HLA-A*2422、HLA-A*2425、HLA-A*2426、HLA-A*2458等位基因、HLA-B*0702、HLA-B*0704、HLA-B*0705、HLA-B*0709、HLA-B*0710、HLA-B*0715及HLA-B*0721等位基因組成之群。
- 一種穩定MHC-肽複合物,其在MHC分子之背景中包含該至少一種如請求項1至17中任一項之免疫原性多肽的肽抗原決定基。
- 如請求項25之穩定MHC-肽複合物,其中該MHC分子為MHC多聚體,視情況其中該MHC多聚體為四聚體。
- 如請求項25或26之穩定MHC-肽複合物,其中該MHC分子為MHC I類分子。
- 如請求項25至27中任一項之穩定MHC-肽複合物,其中該MHC分子包含MHC α鏈,該鏈係選自由HLA-A*02、HLA-A*03、HLA-A*01、HLA-A*11、HLA-A*24及/或HLA-B*07組成之群的HLA血清型,視情況其中該HLA等位基因係選自由HLA-A*0201、HLA-A*0202、HLA-A*0203、HLA-A*0204、HLA-A*0205、HLA-A*0206、HLA-A*0207、HLA-A*0210、HLA-A*0211、HLA-A*0212、HLA-A*0213、HLA-A*0214、HLA-A*0216、HLA-A*0217、HLA-A*0219、HLA-A*0220、HLA-A*0222、HLA-A*0224、HLA-A*0230、HLA-A*0242、HLA-A*0253、HLA-A*0260、HLA-A*0274等位基因、HLA-A*0301、HLA-A*0302、HLA-A*0305、HLA-A*0307、HLA-A*0101、HLA-A*0102、HLA-A*0103、HLA-A*0116等位基因、HLA-A*1101、HLA-A*1102、HLA-A*1103、HLA-A*1104、HLA-A*1105、HLA-A*1119等位基因、HLA-A*2402、HLA-A*2403、HLA-A*2405、HLA-A*2407、HLA-A*2408、HLA-A*2410、HLA-A*2414、HLA-A*2417、HLA-A*2420、HLA-A*2422、HLA-A*2425、HLA-A*2426、HLA-A*2458等位基因、HLA-B*0702、HLA-B*0704、HLA-B*0705、HLA-B*0709、HLA-B*0710、HLA-B*0715及HLA-B*0721等位基因組成之群。
- 如請求項25至28中任一項之穩定MHC-肽複合物,其中該肽抗原決定基及該MHC分子係共價連接及/或其中該MHC分子之α及β鏈係共價連接。
- 如請求項25至29中任一項之穩定MHC-肽複合物,其中該穩定MHC-肽複合物包含可偵測標記,視情況其中該可偵測標記為螢光團。
- 一種免疫原性組合物,其包含如請求項25至30中任一項之穩定MHC-肽複合物及佐劑。
- 一種經分離核酸,其編碼如請求項1至17中任一項之免疫原性多肽或其補體,視情況其中該經分離核酸為DNA、RNA、經化學修飾RNA、mRNA、cDNA、自複製的、環化的、多聯體化的,包含5’非轉譯區(5’UTR)及/或3’UTR,包含表現啟動子,包含內部核糖體進入位點(IRES),及/或包含自裂解2A肽(諸如P2A或T2A)。
- 一種載體,其包含如請求項32之經分離核酸,視情況其中該載體為表現載體。
- 一種細胞,其a)包含如請求項32之經分離核酸,b)包含如請求項33之載體,及/或c)産生一或多種如請求項1至17中任一項之免疫原性多肽及/或將一或多種如請求項25至30中任一項之穩定MHC-肽複合物呈遞於細胞表面,視情況其中該細胞係經遺傳工程改造。
- 一種結合部分,其特异性結合如請求項1至17中任一項之免疫原性多肽及/或如請求項25至30中任一項之穩定MHC-肽複合物,視情況其中該結合部分為抗體、抗體之抗原結合片段、TCR、TCR之抗原結合片段、單鏈TCR (scTCR)、嵌合抗原受體(CAR)或包含TCR及效應子域之融合蛋白。
- 一種器件或套組,其包含a)一或多種如請求項1至17中任一項之免疫原性多肽及/或b)一或多種如請求項25至30中任一項之穩定MHC-肽複合物,該器件或套組視情況包含偵測a)及/或b)與T細胞受體之結合的試劑。
- 一種偵測結合穩定MHC-肽複合物之T細胞之方法,其包含: a) 使包含T細胞之樣品與如請求項25至30中任一項之穩定MHC-肽複合物接觸;及 b) 偵測T細胞與該穩定MHC-肽複合物之結合,視情況進一步測定與該穩定MHC-肽複合物結合之穩定MHC-肽特异性T細胞的百分率,視情況其中該樣品包含外周血單核細胞(PBMC)。
- 如請求項37之方法,其中該等T細胞為CD8+ T細胞。
- 如請求項37或38之方法,其中使用螢光活化細胞分選(FACS)、酶聯免疫吸附劑分析(ELISA)、放射免疫分析(RIA)、免疫化學、西方墨點或細胞內流式分析來執行該偵測及/或測定。
- 如請求項37至39中任一項之方法,其中該樣品包含接觸或懷疑接觸過一或多種SARS-CoV-2蛋白或其片段之T細胞。
- 一種確定個體是否已暴露於SARS-CoV-2及/或具有抵抗SARS-CoV-2之保護的方法,其包含: a) 使包含自該個體獲得之T細胞之細胞群體與如請求項1至17中任一項之免疫原性多肽或如請求項25至30中任一項之穩定MHC-肽複合物一起培育;及 b) 偵測反應性之存在或水準, 其中存在反應性或與對照水準相比反應性水準較高指示該個體已暴露於SARS-CoV-2及/或具有抵抗SARS-CoV-2之保護。
- 一種用於預測罹患SARS-CoV-2感染之個體之臨床結果的方法,其包含: a) 測定自該個體獲得之T細胞與一或多種如請求項1至17中任一項之免疫原性多肽或一或多種如請求項25至30中任一項之穩定MHC-肽複合物之間的反應性之存在或水準;及 b) 將該反應性之存在或水準與來自對照之反應性之存在或水準進行比較,其中該對照係獲自具有良好臨床結果之個體; 其中該個體樣品中存在反應性或如與該對照相比反應性水準較高指示該個體具有良好臨床結果。
- 一種評估SARS-CoV-2療法之功效之方法,其包含: a) 在向個體提供該SARS-CoV-2療法的至少一部分之前自該個體獲得之第一樣品中,測定自該個體獲得之T細胞與一或多種如請求項1至17中任一項之免疫原性多肽或一或多種如請求項25至30中任一項之穩定MHC-肽複合物之間的反應性之存在或水準,及 b) 測定該一或多種如請求項1至17中任一項之免疫原性多肽或該一或多種如請求項25至30中任一項之穩定MHC-肽複合物與自該個體獲得之T細胞之間的反應性之存在或水準,該等T細胞存在於提供該SARS-CoV-2療法的該部分之后自該個體獲得之第二樣品中, 其中該第二樣品中存在反應性或相對於該第一樣品反應性水準較高指示該療法對治療該個體之SARS-CoV-2有效。
- 如請求項41至43中任一項之方法,其中該反應性水準由a)結合之存在及/或b) T細胞活化及/或效應子功能指示,視情況其中該T細胞活化或效應子功能為T細胞增生、殺死或細胞介素釋放。
- 如請求項41至44中任一項之方法,其進一步包含在後續時間點重複步驟a)及b),視情況其中該個體在第一時間點與該後續時間點之間已經歷治療以改善SARS-CoV-2感染。
- 如請求項41至45中任一項之方法,其中使用螢光活化細胞分選(FACS)、酶聯免疫吸附劑分析(ELISA)、放射免疫分析(RIA)、免疫化學、西方墨點或細胞內流式分析來偵測該T細胞結合、活化及/或效應子功能。
- 如請求項41至46中任一項之方法,其中該對照水準為參考數字。
- 如請求項41至47中任一項之方法,其中該對照水準係未暴露於SARS-CoV-2之個體水準。
- 一種預防及/或治療個體之SARS-CoV-2感染之方法,其包含向該個體投與治療有效量的包含及/或編碼至少一種如請求項1至17中任一項之免疫原性多肽之免疫原性組合物,或如請求項34之細胞。
- 如請求項49之方法,其中該免疫原性組合物包含編碼如請求項1至17中任一項之免疫原性多肽之核酸。
- 如請求項49或50之方法,其中該核酸為DNA、RNA、mRNA、cDNA、自複製的、環化的及/或多聯體化的。
- 如請求項49至51中任一項之方法,其中該SARS-CoV-2蛋白係選自由orf1a/b、S蛋白、N蛋白、M蛋白、orf3a及orf7a組成之群。
- 如請求項49至51中任一項之方法,其中該免疫原性多肽能够引出個體之T細胞反應。
- 如請求項49至52中任一項之方法,其中該免疫原性組合物包含超過一種免疫原性多肽。
- 如請求項49至54中任一項之方法,其中該免疫原性組合物進一步包含佐劑。
- 如請求項49至55中任一項之方法,其中該免疫原性組合物能够引出個體之T細胞反應。
- 如請求項49至56中任一項之方法,其中該投與之免疫原性組合物誘導該個體針對該SARS-CoV-2之免疫反應。
- 如請求項49至57中任一項之方法,其中該投與之免疫原性組合物誘導該個體針對該SARS-CoV-2之T細胞免疫反應。
- 如請求項49至58中任一項之方法,其中該T細胞免疫反應為CD8+ T細胞免疫反應。
- 一種鑑別與該至少一種如請求項1至17中任一項之免疫原性多肽之肽抗原決定基結合的肽結合分子或其抗原結合片段之方法,其包含: a) 提供細胞,該細胞在MHC分子之背景中將該至少一種如請求項1至17中任一項之免疫原性多肽之肽抗原決定基呈遞於該細胞之表面上,視情況其中該細胞包含編碼且表現該至少一種免疫原性多肽之核酸; b) 測定複數種候選肽結合分子或其抗原結合片段在該MHC分子之背景中與該細胞上之該肽抗原決定基的結合;及 c) 鑑別在該MHC分子之背景中與該肽抗原決定基結合的一或多種肽結合分子或其抗原結合片段。
- 如請求項60之方法,其中該步驟a)包含使該MHC分子在該細胞之表面上與選自表1A、1B、1C、1D、1E及/或1F之肽抗原決定基接觸。
- 如請求項60之方法,其中該步驟a)包含用鹼性核酸及/或包含該鹼性核酸之載體轉染該細胞。
- 一種鑑別與該至少一種如請求項1至17中任一項之免疫原性多肽之肽抗原決定基結合的肽結合分子或其抗原結合片段之方法,其包含: a) 提供穩定MHC-肽複合物,其在MHC分子之背景中包含該至少一種如請求項1至17中任一項之免疫原性多肽的肽抗原決定基; b) 測定複數種候選肽結合分子或其抗原結合片段與該穩定MHC-肽複合物的結合;及 c) 鑑別與該穩定MHC-肽複合物結合的一或多種肽結合分子或其抗原結合片段。
- 如請求項63之方法,其中該MHC分子為MHC多聚體,視情況其中該MHC多聚體為四聚體。
- 如請求項63或64之方法,其中該MHC分子為MHC I類分子。
- 如請求項63至65中任一項之方法,其中該MHC分子包含MHC α鏈,該鏈係選自由HLA-A*02、HLA-A*03、HLA-A*01、HLA-A*11、HLA-A*24及/或HLA-B*07組成之群的HLA血清型,視情況其中該HLA等位基因係選自由HLA-A*0201、HLA-A*0202、HLA-A*0203、HLA-A*0204、HLA-A*0205、HLA-A*0206、HLA-A*0207、HLA-A*0210、HLA-A*0211、HLA-A*0212、HLA-A*0213、HLA-A*0214、HLA-A*0216、HLA-A*0217、HLA-A*0219、HLA-A*0220、HLA-A*0222、HLA-A*0224、HLA-A*0230、HLA-A*0242、HLA-A*0253、HLA-A*0260、HLA-A*0274等位基因、HLA-A*0301、HLA-A*0302、HLA-A*0305、HLA-A*0307、HLA-A*0101、HLA-A*0102、HLA-A*0103、HLA-A*0116等位基因、HLA-A*1101、HLA-A*1102、HLA-A*1103、HLA-A*1104、HLA-A*1105、HLA-A*1119等位基因、HLA-A*2402、HLA-A*2403、HLA-A*2405、HLA-A*2407、HLA-A*2408、HLA-A*2410、HLA-A*2414、HLA-A*2417、HLA-A*2420、HLA-A*2422、HLA-A*2425、HLA-A*2426、HLA-A*2458等位基因、HLA-B*0702、HLA-B*0704、HLA-B*0705、HLA-B*0709、HLA-B*0710、HLA-B*0715及HLA-B*0721等位基因組成之群。
- 如請求項63至66中任一項之方法,其中該肽抗原決定基及該MHC分子係共價連接及/或其中該MHC分子之α及β鏈係共價連接。
- 如請求項63至67中任一項之方法,其中該穩定MHC-肽複合物包含可偵測標記,視情況其中該可偵測標記為螢光團。
- 如請求項60至68中任一項之方法,其中該複數種候選肽結合分子包含一或多種T細胞受體(TCR),或TCR之一或多個抗原結合片段。
- 如請求項60至69中任一項之方法,其中該複數種候選肽結合分子包含至少2、5、10、100、10 3、10 4、10 5、10 6、10 7、10 8、10 9種或更多種不同的候選肽結合分子。
- 如請求項60至70中任一項之方法,其中該複數種候選肽結合分子包含自個體或個體群體之樣品獲得的一或多種候選肽結合分子;或該複數種候選肽結合分子包含包括自個體樣品獲得之親本支架肽結合分子之突變的一或多種候選肽結合分子。
- 如請求項71之方法,其中該個體或個體群體a)未感染SARS-CoV-2及/或已自COVID-19中恢復或b)感染SARS-CoV-2及/或具有COVID-19。
- 如請求項71或72之方法,其中該個體或個體群體已接種一或多種免疫原性多肽,其中該等免疫原性多肽包含選自表1A、1B、1C、1D、1E及/或1F之肽抗原決定基。
- 如請求項68至73中任一項之方法,其中該個體為哺乳動物,視情況其中該哺乳動物為人類、靈長類動物或嚙齒動物。
- 如請求項71至74中任一項之方法,其中該個體為HLA轉殖基因小鼠及/或為人類TCR轉殖基因小鼠。
- 如請求項71至75中任一項之方法,其中該樣品包含T細胞。
- 如請求項76之方法,其中該樣品包含外周血單核細胞(PBMC)或CD8+記憶T細胞。
- 一種根據請求項60至77中任一項所鑑別之肽結合分子或其抗原結合片段,視情況其中該結合部分為抗體、抗體之抗原結合片段、TCR、TCR之抗原結合片段、單鏈TCR (scTCR)、嵌合抗原受體(CAR)或包含TCR及效應子域之融合蛋白。
- 一種治療個體之SARS-CoV-2感染之方法,其包含向該個體投與治療有效量的經遺傳工程改造之T細胞,該等T細胞表現藉由如請求項63至78中任一項之方法鑑別的TCR。
- 一種治療個體之SARS-CoV-2感染之方法,其包含向該個體投與治療有效量的經遺傳工程改造之T細胞,該等T細胞表現與該至少一種如請求項1至17中任一項之免疫原性多肽之肽抗原決定基結合的TCR。
- 一種治療個體之SARS-CoV-2感染之方法,其包含向該個體投與治療有效量的經遺傳工程改造之T細胞,該等T細胞表現與在MHC分子之背景中包含該至少一種如請求項1至17中任一項之免疫原性多肽之肽抗原決定基的穩定MHC-肽複合物結合之TCR。
- 如請求項81之方法,其中該MHC分子為MHC多聚體,視情況其中該MHC多聚體為四聚體。
- 如請求項79至82中任一項之方法,其中該MHC分子為MHC I類分子。
- 如請求項79至83中任一項之方法,其中該MHC分子包含MHC α鏈,該鏈係選自由HLA-A*02、HLA-A*03、HLA-A*01、HLA-A*11、HLA-A*24及/或HLA-B*07組成之群的HLA血清型,視情況其中該HLA等位基因係選自由HLA-A*0201、HLA-A*0202、HLA-A*0203、HLA-A*0204、HLA-A*0205、HLA-A*0206、HLA-A*0207、HLA-A*0210、HLA-A*0211、HLA-A*0212、HLA-A*0213、HLA-A*0214、HLA-A*0216、HLA-A*0217、HLA-A*0219、HLA-A*0220、HLA-A*0222、HLA-A*0224、HLA-A*0230、HLA-A*0242、HLA-A*0253、HLA-A*0260、HLA-A*0274等位基因、HLA-A*0301、HLA-A*0302、HLA-A*0305、HLA-A*0307、HLA-A*0101、HLA-A*0102、HLA-A*0103、HLA-A*0116等位基因、HLA-A*1101、HLA-A*1102、HLA-A*1103、HLA-A*1104、HLA-A*1105、HLA-A*1119等位基因、HLA-A*2402、HLA-A*2403、HLA-A*2405、HLA-A*2407、HLA-A*2408、HLA-A*2410、HLA-A*2414、HLA-A*2417、HLA-A*2420、HLA-A*2422、HLA-A*2425、HLA-A*2426、HLA-A*2458等位基因、HLA-B*0702、HLA-B*0704、HLA-B*0705、HLA-B*0709、HLA-B*0710、HLA-B*0715及HLA-B*0721等位基因組成之群。
- 如請求項79至84中任一項之方法,其中該肽抗原決定基及該MHC分子係共價連接及/或其中該MHC分子之α及β鏈係共價連接。
- 如請求項79至85中任一項之方法,其中該穩定MHC-肽複合物包含可偵測標記,視情況其中該可偵測標記為螢光團。
- 如請求項79至86中任一項之方法,其中該等T細胞係自a)該個體、b)未感染SARS-CoV-2之供體或c)自COVID-19中恢復之供體分離。
- 一種預防或治療個體之SARS-CoV-2感染之方法,其包含向該個體輸注抗原特异性T細胞,其中該等抗原特异性T細胞係藉由以下産生: a) 用如請求項1至17中任一項之免疫原性多肽、編碼如請求項1至17中任一項之免疫原性多肽的核酸、在MHC分子之背景中包含該至少一種如請求項1至17中任一項之免疫原性多肽之肽抗原決定基的穩定MHC-肽複合物或者在MHC分子之背景中編碼及/或在細胞表面上呈遞該至少一種如請求項1至17中任一項之免疫原性多肽之肽抗原決定基的細胞刺激個體之PBMC或T細胞;及 b) 活體外擴增抗原特异性T細胞,視情況在刺激PBMC或T細胞之前自該個體分離該等PBMC或T細胞。
- 如請求項88之方法,其中該T細胞為原生T細胞、中央記憶T細胞或效應子記憶T細胞。
- 如請求項89之方法,其中該T細胞為CD8+記憶T細胞。
- 如請求項36至90中任一項之方法,其中使該等劑在適合於在該肽抗原決定基、免疫原性多肽、穩定MHC-肽複合物、T細胞受體及/或T細胞之間形成至少一種免疫複合物的條件下及時間內接觸置放。
- 如請求項36至91中任一項之方法,其中該肽抗原決定基、免疫原性多肽、穩定MHC-肽複合物及/或T細胞受體由細胞表現,且該等細胞在一或多個步驟期間經擴增及/或分離。
- 如請求項36至92中任一項之方法,其中該個體為哺乳動物,視情況其中該哺乳動物為人類、靈長類動物或嚙齒動物。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063113024P | 2020-11-12 | 2020-11-12 | |
US63/113,024 | 2020-11-12 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202237626A true TW202237626A (zh) | 2022-10-01 |
Family
ID=81601698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW110142318A TW202237626A (zh) | 2020-11-12 | 2021-11-12 | Sars-cov-2免疫顯性肽構築體及其用途 |
Country Status (3)
Country | Link |
---|---|
AR (1) | AR124054A1 (zh) |
TW (1) | TW202237626A (zh) |
WO (1) | WO2022104002A2 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024077134A1 (en) * | 2022-10-05 | 2024-04-11 | Tscan Therapeutics, Inc. | Prame immunogenic peptides, binding proteins recognizing prame immunogenic peptides, and uses thereof |
AU2023241307A1 (en) * | 2022-10-05 | 2024-05-02 | Tscan Therapeutics, Inc. | Magea1 immunogenic peptides, binding proteins recognizing magea1 immunogenic peptides, and uses thereof |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7897744B2 (en) * | 2003-04-28 | 2011-03-01 | The Public Health Agency Of Canada | SARS virus nucleotide and amino acid sequences and uses thereof |
CA3104859A1 (en) * | 2018-07-03 | 2020-01-09 | Leidos, Inc. | Materials and methods for cell-free expression of vaccine epitope concatemers |
LT3869199T (lt) * | 2020-02-20 | 2022-07-11 | Euroimmun Medizinische Labordiagnostika Ag | Būdai ir reagentai sars-cov-2 diagnostikai |
IT202000006754A1 (it) * | 2020-03-31 | 2021-10-01 | Diasorin S P A | Saggi per la rivelazione di SARS-CoV-2 |
-
2021
- 2021-11-12 WO PCT/US2021/059050 patent/WO2022104002A2/en active Application Filing
- 2021-11-12 TW TW110142318A patent/TW202237626A/zh unknown
- 2021-11-12 AR ARP210103138A patent/AR124054A1/es unknown
Also Published As
Publication number | Publication date |
---|---|
AR124054A1 (es) | 2023-02-08 |
WO2022104002A9 (en) | 2023-05-25 |
WO2022104002A3 (en) | 2022-06-23 |
WO2022104002A2 (en) | 2022-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230287079A1 (en) | Binding proteins recognizing sars-cov-2 antigens and uses thereof | |
TW202237626A (zh) | Sars-cov-2免疫顯性肽構築體及其用途 | |
AU2022204350B2 (en) | SARS-CoV-2 immunodominant peptide constructs and uses thereof | |
AU2024200495A1 (en) | Magea1 immunogenic peptides, binding proteins recognizing magea1 immunogenic peptides, and uses thereof | |
US20240190931A1 (en) | Magec2 immunogenic peptides, binding proteins recognizing magec2 immunogenic peptides, and uses thereof | |
AU2021323388B2 (en) | Binding proteins recognizing HA-1 antigen and uses thereof | |
US20230241205A1 (en) | Sars-cov-2 immunodominant peptides and uses thereof | |
US20230272049A1 (en) | Binding proteins recognizing hpv16 e7 antigen and uses thereof | |
WO2024077135A1 (en) | Magea1 immunogenic peptides, binding proteins recognizing magea1 immunogenic peptides, and uses thereof | |
WO2024077134A1 (en) | Prame immunogenic peptides, binding proteins recognizing prame immunogenic peptides, and uses thereof | |
CN118103049A (zh) | 识别ha-2抗原的结合蛋白及其用途 | |
JP2024517618A (ja) | Ha-2抗原を認識する結合タンパク質及びその使用 | |
CN116940593A (zh) | 识别ha-1抗原的结合蛋白及其用途 |