TWI828168B

TWI828168B - 用作b型肝炎病毒(hbv)疫苗之自我複製rna分子及其用途

Info

Publication number: TWI828168B
Application number: TW111120040A
Authority: TW
Inventors: 丹尼爾包登; 海倫荷頓
Original assignee: 愛爾蘭商健生科學愛爾蘭無限公司
Priority date: 2019-06-20
Filing date: 2020-06-19
Publication date: 2024-01-01
Also published as: MA56535A; TW202235428A; AU2020298267A1; CA3143632A1; TW202108598A; EP3986458A1; US20220313815A1; TWI769467B; WO2020255055A1

Abstract

本發明描述編碼B型肝炎病毒(hepatitis B virus；HBV)疫苗之自我複製RNA分子。本發明亦描述尤其在患有慢性HBV感染之個體中使用所揭示之自我複製RNA分子來誘導針對HBV之免疫反應或治療HBV誘發之疾病的方法。

Description

用作B型肝炎病毒(HBV)疫苗之自我複製RNA分子及其用途

B型肝炎病毒(HBV)係編碼四個開放閱讀框架及七種蛋白質的3.2 kb親肝性小DNA病毒。約2.4億人患有慢性B型肝炎感染(慢性HBV)，其特徵為病毒及亞病毒粒子持久存在於血液中超過6個月(Cohen等人J. Viral Hepat. (2011) 18(6), 377-83)。持久的HBV感染經由用病毒肽及循環抗原長期刺激HBV特異性T細胞受體而產生循環及肝內HBV特異性CD4+及CD8+ T細胞的T細胞耗盡。因此，T細胞多功能性減弱(亦即，IL-2、腫瘤壞死因子(TNF)-α、IFN-γ含量降低，且增殖缺乏)。

自20世紀80年代以來，已獲得針對HBV感染之安全且有效的預防性疫苗，且其為B型肝炎預防之支柱(World Health Organization, Hepatitis B: Fact sheet第204號[Internet] 2015年3月)。世界衛生組織(World Health Organization)建議所有嬰兒接受疫苗接種，且在存在較低或中等B型肝炎地方性流行的國家中，建議所有兒童及青少年(＜18歲)以及處於風險群體類別的某些人接受疫苗接種。由於接受疫苗接種，使得全世界感染率大幅下降。但是，預防性疫苗不能治癒已確定之HBV感染。

慢性HBV當前係用IFN-α及核苷或核苷酸類似物進行治療，但由於在感染之肝細胞中持續存在一種稱為共價閉合環狀DNA (cccDNA)之細胞內病毒複製中間物，該中間物作為病毒RNA之模板起重要作用，且因此產生新穎病毒粒子，因此最終無法治癒。普遍認為，誘發病毒特異性T細胞及B細胞反應可以有效地除去載有cccDNA之肝細胞。當前靶向HBV聚合酶之療法抑制病毒血症，但對存在於核中之cccDNA及相關之循環抗原產生的作用有限。最嚴格之治癒形式可以除去生物體中之HBV cccDNA，此既不為觀察到的自然發生之結果，亦非任何治療性干預之結果。然而，HBV表面抗原(HBsAg)之喪失為臨床上可信的治癒等效結果，因為疾病復發可以僅在嚴重免疫抑制情況下才會發生，其可接著藉由預防性治療加以預防。因此，至少自臨床觀點看，HBsAg之喪失與針對HBV之最嚴格的免疫重建形式相關。

舉例而言，經證實，利用聚乙二醇化干擾素(pegIFN)-α進行之免疫調節在維持有限治療療程之治療結束後反應方面優於核苷或核苷酸療法。除直接抗病毒作用外，據報導，IFN-α在細胞培養物及人類化小鼠中對cccDNA起到表觀遺傳抑制作用，使得病毒粒子生產率及轉錄本減少(Belloni等人J. Clin. Invest. (2012) 122(2), 529-537)。然而，此療法仍伴隨副作用且部分由於IFN-α對HBV特異性T細胞僅具有較弱的調節作用，總體反應相當低。詳言之，治癒率較低(＜10%)且毒性較高。同樣，直接作用於HBV之抗病毒劑，即HBV聚合酶抑制劑恩替卡韋(entecavir)及替諾福韋(tenofovir)，作為單藥療法有效誘導病毒抑制作用且針對耐藥性突變體之出現具有較高基因屏障作用，且由此預防肝病之發展。然而，用此類HBV聚合酶抑制劑很少能實現由HBsAg喪失或血清轉化定義的慢性B型肝炎之治癒。因此，此等抗病毒劑理論上需要無限期投與以預防肝病之復發，與針對人類免疫缺陷病毒(HIV)之抗反轉錄病毒療法類似。

治療性疫苗接種有可能消除長期感染患者之HBV (Michel等人J. Hepatol. (2011) 54(6), 1286-1296)。已經研究許多策略，但迄今為止，尚未證實治療性疫苗接種之成功性。

因此，由於具有較高治癒率的良好耐受之治療有限，對於B型肝炎病毒(HBV)，特別是慢性HBV治療之醫療需求尚未得到滿足。本發明藉由提供用於誘發針對B型肝炎病毒(HBV)感染之免疫反應的治療性組合物及方法滿足此需求。本發明之免疫原性組合物/組合及方法可以用於向個體，諸如患有慢性HBV感染之個體提供治療性免疫。

在一通用態樣中，本申請案係關於一種自我複製RNA分子，其包含編碼HBV抗原之一或多個聚核苷酸，用於治療有需要之個體的HBV感染。

在一個實施例中，自我複製RNA分子包含以下中之至少一者： a) 編碼截短HBV核心抗原的第一聚核苷酸序列，該截短HBV核心抗原由與SEQ ID NO:2至少95%、96%、97%、98%、99%或100%一致之胺基酸序列組成；或 b)編碼HBV聚合酶抗原之第二聚核苷酸序列，該HBV聚合酶抗原由與SEQ ID NO:7至少90%，諸如至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致之胺基酸序列組成，其中該HBV聚合酶抗原不具有逆轉錄酶活性及核糖核酸酶H活性。

在一個實施例中，自我複製RNA分子包含編碼截短HBV核心抗原的第一聚核苷酸序列，該截短HBV核心抗原由與SEQ ID NO:2至少95%一致之胺基酸序列組成。在另一實施例中，自我複製RNA分子包含編碼HBV聚合酶抗原之第二聚核苷酸序列，該HBV聚合酶抗原由與SEQ ID NO:7至少90%一致之胺基酸序列組成。

在實施例中，自我複製RNA分子包含： a)編碼截短HBV核心抗原的第一聚核苷酸序列，該截短HBV核心抗原由與SEQ ID NO:2至少95%、96%、97%、98%、99%或100%一致之胺基酸序列組成；及 b)編碼HBV聚合酶抗原之第二聚核苷酸序列，該HBV聚合酶抗原由與SEQ ID NO:7至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致之胺基酸序列組成，其中該HBV聚合酶抗原不具有逆轉錄酶活性及核糖核酸酶H活性。

在某些實施例中，第一聚核苷酸序列進一步包含編碼可操作地將信號序列連接至截短HBV核心抗原之N端的聚核苷酸序列，且第二聚核苷酸序列進一步包含編碼可操作地將信號序列連接至HBV聚合酶抗原之N端的聚核苷酸序列，較佳地，該信號序列獨立地包含SEQ ID NO:9或SEQ ID NO:15之胺基酸序列，較佳地，該信號序列獨立地分別由SEQ ID NO:8或SEQ ID NO:14之聚核苷酸序列編碼。

在某些實施例中，編碼截短HBV核心抗原的第一聚核苷酸序列由SEQ ID NO:2之胺基酸序列組成；且編碼HBV聚合酶抗原的第二聚核苷酸序列由SEQ ID NO:7之胺基酸序列組成。較佳地，自我複製RNA分子包含a)編碼截短HBV核心抗原之第一聚核苷酸序列，該截短HBV核心抗原由SEQ ID NO:2或SEQ ID NO:4之胺基酸序列組成；及b)編碼HBV聚合酶抗原之第二聚核苷酸序列，該HBV聚合酶抗原具有SEQ ID NO:7之胺基酸序列。

在某些實施例中，第一聚核苷酸序列包含與SEQ ID NO:1或SEQ ID NO:3具有至少90%，諸如至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列一致性之聚核苷酸序列。

在某些實施例中，第二聚核苷酸序列包含與SEQ ID NO:5或SEQ ID NO:6具有至少90%，諸如至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列一致性之聚核苷酸序列。

在一個實施例中，自我複製RNA分子編碼包含將截短HBV核心抗原可操作地連接至HBV聚合酶抗原之融合蛋白。在某些實施例中，融合蛋白包含將該截短HBV核心抗原經由連接子可操作地連接至該HBV聚合酶抗原。較佳地，該連接子包含胺基酸序列(AlaGly)n，且n為2至5之整數，較佳地，該連接子係由包含SEQ ID NO:11之聚核苷酸序列編碼。較佳地，融合蛋白包含SEQ ID NO:16之胺基酸序列。

在某些實施例中，自我複製RNA分子為α病毒衍生之RNA複製子。在某些實施例中，RNA複製子包含一或多種α病毒非結構蛋白基因。在某些實施例中，RNA複製子包含RNA複製所需之基因元件且缺乏編碼病毒粒子組件所需之基因產物之彼等基因元件，且在不含病毒蛋白之組合物中，諸如在脂質組合物(例如脂質奈米顆粒)或另一適合之組合物中，將RNA複製子遞送至個體。在其他實施例中，RNA複製子包含RNA複製所需之基因元件及編碼病毒粒子組件所需之基因產物的彼等基因元件，且在含有一或多種病毒蛋白(諸如病毒樣粒子)之組合物中，將RNA複製子遞送至個體。在其他實施例中，RNA複製子包含一或多種促進基因表現及/或賦予先天性免疫系統抗性之修飾，諸如在亞基因體啟動子控制下增強RNA轉譯之莖環或下游環(DLP基元)(Fovlov等人, J Virol. 1996, 70:1182-90)。

在某些實施例中，自我複製RNA分子、組合物及產生及使用此類分子以遞送相關基因之方法之實例描述於美國專利申請公開案US2018/0104359、US2013/0177639、US2013/0149375、US 2014/0242152、國際專利申請公開案WO2018/075235或美國專利10,022,435中，其內容以全文引用之方式併入本文中。

舉例而言，RNA複製物可包括一或多種組分，諸如5'UTR、病毒衣殼強化子下游環(DLP)及舊世界α病毒nsP3高變域或含有新世界α病毒nsP3高變域之一部分及源於舊世界α病毒nsP3高變域之另一部分的嵌合nsP3高變域，如美國專利申請公開案US2018/0104359、US2018/0171340及美國專利申請案第62/742,868號中分別描述，其各者以全文引用之方式併入本文中。

在某些實施例中，自我複製RNA分子包含： a) 一或多個非結構基因nsP1、nsP2、nsP3及nsP4； b)下游環(DLP基元)及經修飾之5'-非轉譯區(5'-UTR)中之至少一者； c) 亞基因體啟動子；及 d)可操作地連接至亞基因體啟動子之以下中之至少一者： i. 編碼截短HBV核心抗原的第一聚核苷酸序列，該截短HBV核心抗原由與SEQ ID NO:2至少95%一致之胺基酸序列組成；或 ii. 編碼HBV聚合酶抗原之第二聚核苷酸序列，該HBV聚合酶抗原由與SEQ ID NO:7至少90%一致之胺基酸序列組成，其中該HBV聚合酶抗原不具有逆轉錄酶活性及核糖核酸酶H活性。

RNA複製子適用於投與生物治療分子，諸如蛋白質及肽，其中本發明之複製子係投與至具有由複製子編碼之生物治療劑的人類或動物，且經編碼生物治療劑(例如異源蛋白質或肽)表現於人類或動物中。

在一個態樣中，本文揭示一種核酸分子，其包括編碼本文所描述之HBV抗原的經修飾之複製子RNA，其中經修飾之複製子RNA包括經修飾之5'-UTR且不含編碼病毒結構蛋白之核酸序列的至少一部分。在一些實施例中，經修飾之5'-UTR包括位置1、2、4處之一或多個核苷酸取代或其組合。在一些實施例中，至少一個核苷酸取代為在經修飾之5'-UTR之位置2處的核苷酸取代。在一些實施例中，經修飾之5'-UTR之位置2處的核苷酸取代為U-＞G取代。

在一些實施例中，如本文所揭示之核酸分子包括經修飾之α病毒基因體或複製子RNA，該經修飾之α病毒基因體或複製子RNA包括經修飾之α病毒基因體或複製子RNA，其中核酸分子包含與SEQ ID NO:1之核酸序列展示至少80%序列一致性之核苷酸序列，經修飾之α病毒基因體或複製子RNA包含5'-非轉譯區(5'-UTR)之位置2處之U-＞G取代且不含編碼病毒結構蛋白之序列的至少一部分。在一些實施例中，核酸分子包含與SEQ ID NO:25之核酸序列展現至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的核苷酸序列。

在一些實施例中，如本文所揭示之核酸分子包括經修飾之α病毒基因體或複製子RNA，其中經修飾之α病毒基因體或複製子RNA包含與SEQ ID NO:26-42中之至少一者之核酸序列展示至少80%序列一致性之5'-UTR及5'-UTR之位置2處之U-＞G取代，且其中經修飾之α病毒基因體或複製子RNA不含編碼病毒結構蛋白之序列的至少一部分。在一些實施例中，經修飾之α病毒基因體或複製子RNA包含與SEQ ID NO:26-42中之至少一者之核酸序列展示至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之5'-UTR。在某些實施例中，經修飾之α病毒基因體或複製子RNA不含編碼病毒結構蛋白之核酸序列之實質性部分。在某些實施例中，經修飾之α病毒基因體或複製子RNA不包含編碼病毒結構蛋白之核酸序列。

根據本發明之方法之實施例的實施方式可包括以下特徵中之一或多者。在一些實施例中，經修飾之複製子RNA為經修飾之α病毒複製子RNA。在一些實施例中，經修飾之α病毒複製子RNA包括經修飾之α病毒基因體。在一些實施例中，經修飾之5'-UTR包括位置1、2、4處之一或多個核苷酸取代或其組合。在一些實施例中，至少一個核苷酸取代為在經修飾之5'-UTR之位置2處的核苷酸取代。在一些實施例中，經修飾之5'-UTR之位置2處的核苷酸取代為U-＞G取代。在某些實施例中，經修飾之複製子RNA不含編碼病毒結構蛋白之核酸序列之實質性部分。在一些實施例中，經修飾之α病毒基因體或複製子RNA不包括編碼病毒結構蛋白之核酸序列。

在一些實施例中，核酸分子包括經修飾之α病毒基因體或複製子RNA，其中經修飾之α病毒基因體或複製子RNA包含與SEQ ID NO:25之核酸序列展示至少80%序列一致性之5'-UTR及5'-UTR之位置2處之U-＞G取代，且其中經修飾之α病毒基因體或複製子RNA不含編碼病毒結構蛋白之序列的至少一部分。在一些實施例中，核酸分子與SEQ ID NO:25之核酸序列展現至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。在一些實施例中，核酸分子包括經修飾之α病毒基因體或複製子RNA，其中經修飾之α病毒基因體或複製子RNA包含與SEQ ID NO:26-42中之至少一者之核酸序列展示至少80%序列一致性之5'-UTR及5'-UTR之位置2處之U-＞G取代，且其中經修飾之α病毒基因體或複製子RNA不含編碼病毒結構蛋白之序列的至少一部分。在一些實施例中，經修飾之α病毒基因體或複製子RNA包括與SEQ ID NO:26-42中之至少一者之核酸序列展示至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之5'-UTR。

在一個態樣中，本文揭示之一些實施例係關於核酸分子，其包括(i)編碼病毒衣殼強化子之一或多個RNA莖環的第一核酸序列(圖6)或其變體；及(ii)可操作地連接至第一核酸序列之第二核酸序列，其中該第二核酸序列包含編碼本發明之HBV核心及/或HBV聚合酶之相關基因(GOI)的編碼序列。

根據本發明之核酸分子之實施例的實施方式可包括以下特徵中之一或多者。在一些實施例中，第一核酸序列可操作地將上游連接至GOI之編碼序列(例如本文所描述之一或多種HBV抗原)。在一些實施例中，核酸分子進一步包括可操作地將上游連接至第一核酸序列之啟動子。在一些實施例中，核酸分子進一步包括可操作地將上游連接至第一核酸序列之5' UTR序列。在一些實施例中，5' UTR序列可操作地將下游連接至啟動子且將上游連接至第一核酸序列。在一些實施例中，核酸分子進一步包括可操作地將上游連接至第二核酸序列之自我蛋白酶肽之編碼序列。在一些實施例中，用於自我蛋白酶肽之編碼序列可操作地將下游連接至第一核酸序列且將上游連接至第二核酸序列。

在一些實施例中，自我蛋白酶肽包含選自由以下組成之群的肽序列：豬鐵士古病毒-1 2A(P2A)、口蹄疫病毒(FMDV) 2A(F2A)、馬鼻炎A病毒(ERAV) 2A(E2A)、明脈扁刺蛾病毒2A(T2A)、細胞質多角體病毒2A(BmCPV2A)、軟化病病毒2A(BmIFV2A)及其組合。在一些實施例中，核酸分子進一步包括可操作地將下游連接至第二序列核酸序列之3' UTR序列。

在一些實施例中，病毒衣殼強化子源於屬於披膜病毒科之病毒物種之衣殼基因。在一些實施例中，α病毒物種為東部馬腦炎病毒(EEEV)、委內瑞拉馬腦炎病毒(VEEV)、沼澤地病毒(EVEV)、穆坎布病毒(Mucambo virus，MUCV)、勝利基森林病毒(Semliki forest virus，SFV)、皮春納病毒(Pixuna virus，PIXV)、米德爾堡病毒(Middleburg virus，MIDV)、屈公病毒(CHIKV)、奧-奈氏病毒(O'Nyong-Nyong virus，ONNV)、羅斯河病毒(Ross River virus，RRV)、巴馬森林病毒(Barmah Forest virus，BF)、蓋塔病毒(Getah virus，GET)、鷺山病毒(SAGV)、貝巴魯病毒(Bebaru virus，BEBV)、馬雅羅病毒(MAYV)、烏納病毒(Una virus，UNAV)、辛得比斯病毒(Sindbis virus，SINV)、奧拉病毒(Aura virus，AURAV)、沃達羅河病毒(Whataroa virus，WHAV)、巴班基病毒(Babanki virus，BABV)、克孜拉格赫病毒(Kyzylagach virus，KYZV)、西部馬腦炎病毒(WEEV)、高地J病毒(Highland J virus，HJV)、摩根堡病毒(FMV)、恩杜穆(Ndumu，NDUV)、鮭科魚α病毒(SAV)或車溪病毒。在一些實施例中，病毒衣殼強化子包含病毒物種之下游環(DLP)基元，且DLP基元包含一或多個RNA莖環。在一些實施例中，病毒衣殼強化子包含與SEQ ID NO:43-50中之至少一者展現至少80%序列一致性之核酸序列。在一些實施例中，核酸序列展現與SEQ ID NO:43-50中之至少一者至少95%之序列一致性。

在一些實施例中，本發明之核酸分子進一步包括編碼第二病毒衣殼強化子或其變體之一或多個RNA莖環的第三核酸序列；及可操作地連接至第三核酸序列之第四核酸序列，其中第四核酸序列包含相關第二基因(GOI)之編碼序列。在一些實施例中，核酸分子進一步包括第二自我蛋白酶肽之編碼序列，該第二自我蛋白酶肽可操作地將下游連接至第三核酸序列且將上游連接至第四核酸序列。

在某些實施例中，自我複製RNA分子含有新世界α病毒非結構蛋白nsP1、nsP2及nsP4；及α病毒nsP3蛋白宏域、中心域及高變域。經編碼的高變域可具有源於舊世界α病毒nsP3高變域之胺基酸序列，或可具有源於新世界α病毒nsP3高變域之一部分的胺基酸序列，且另一部源於舊世界α病毒nsP3高變域，亦即嵌合nsP3高變域。發現當基於新世界α病毒之複製子經修飾時，由編碼之異源蛋白質或肽引起之免疫反應，諸如HBV核心及聚合酶抗原中之至少一者減弱或消除。

在一個實施例中，α病毒nsP3宏域及α病毒nsP3中心域來自新世界α病毒，但在另一實施例中，α病毒nsP3宏域及α病毒nsP3中心域來自舊世界α病毒。在各種實施例中，舊世界α病毒係選自由以下組成之群：CHIKV、SINV及SFV。新世界α病毒可為委內瑞拉馬腦炎病毒(VEEV)或西部馬腦炎病毒(WEEV)、或東部馬腦炎病毒(EEEV)。在各種實施例中，舊世界α病毒可為辛得比斯病毒(SINV)、基孔肯雅病毒(Chickungunya virus，CHIKV)、勝利基森林病毒(SFV)、羅斯河病毒(RRV)、鷺山病毒(SAGV)、蓋塔病毒(GETV)、米德爾堡病毒(MIDV)、貝巴魯病毒(BEBV)、奧-奈氏病毒(ONNV)、恩杜穆(NDUV)及巴馬森林病毒(BFV)中之任一者。

在一個實施例中，源於舊世界α病毒nsP3高變域之部分包含選自由以下組成之群的基元：FGDF及FGSF。源於舊世界α病毒nsP3高變域之部分可具有選自由以下組成之群的重複序列：FGDF/FGDF重複序列、FGSF/FGSF重複序列、FGDF/FGSF重複序列及FGSF/FGDF重複序列；且該等重複序列係藉由至少10個且不超過25個胺基酸間隔。在一些實施例中，該等重複序列藉由源於由以下組成之群的胺基酸序列間隔：SEQ ID NO: 56: NEGEIESLSSELLT、SEQ ID NO: 57: SDGEIDELSRRVTTESEPVL及SEQ ID NO: 58: DEHEVDALASGIT。

在RNA複製子之實施例中之任一者中，源於舊世界α病毒高變域之部分可具有：CHIKV nsP3 HVD之胺基酸479-482或497-500或479-500或335-517中之任一者；或SFV nsP3 HVD之胺基酸451-454或468-471或451-471中之任一者；或SINV nsP3 HVD之胺基酸490-493或513-516或490-516或335-538。在此等實施例中之任一者中(或在本文中所描述之任何實施例中)，新世界α病毒可為VEEV且源於新世界α病毒高變域之部分不包含VEEV nsP3高變域之胺基酸478-518；或不包含VEEV nsP3高變域之胺基酸478-545；或不包含VEEV nsP3高變域之胺基酸335-518。在其他實施例中，新世界α病毒可為EEEV且源於新世界α病毒高變域之部分不包含EEEV高變域之胺基酸531-547。或新世界α病毒可為WEEV，且源於新世界α病毒高變域之部分不包含WEEV高變域之胺基酸504-520。

在複製子之一些具體實施例中，新世界α病毒為VEEV，且源於新世界α病毒nsP3高變域之部分不包含VEEV nsP3高變域之胺基酸335-518，且源於舊世界α病毒nsP3高變域之部分包含SINV nsP3 HVD之胺基酸490-516；或舊世界α病毒為SINV，且源於舊世界α病毒nsP3高變域之部分包含SINV nsP3 HVD之胺基酸335-538。

在某些實施例中，適用於本發明之RNA複製子包含編碼源於新世界α病毒非結構蛋白nsP1、nsP2及nsP4之胺基酸序列的RNA子序列；及編碼源於舊世界α病毒nsP3蛋白質之胺基酸序列的RNA子序列，且其中nsP3蛋白之N端及/或C端側上之前1-6個胺基酸源於新世界α病毒序列。因此，1-6個胺基酸可存在於nsP2與nsP3之間的接合點上；或1-6個胺基酸可存在於nsP3與nsP4之間的接合點上。在各種實施例中，舊世界α病毒可為本文所描述之任何病毒。當新世界α病毒為VEEV時，nsP2/nsP3序列可為(SEQ ID NO:62) LHEAGC/APSY；當接合點為nsP3/nsP4接合點時，該序列可為(SEQ ID NO:63) RFDAGA/YIFS。在實施例中之任一者中，可保留倒數第二個甘胺酸(亦藉由其單一字母代碼「G」來指代)且剩餘nsP3胺基酸如本文中所描述而變化。接合點序列可視情況位於終止密碼子(TGA)之前，該終止密碼子可為連讀終止密碼子。在新世界α病毒為EEEV之其他實施例中，nsP2/nsP3序列可為(SEQ ID NO:64) QHEAGR/APAY，且保留倒數第二個G。當新世界α病毒為EEEV時，nsP3/nsP4接合點處之序列可為(SEQ ID NO:65) RYEAGA/YIFS，且倒數第二個甘胺酸可視情況保留，而其餘nsP3胺基酸如本文中所描述而變化。此等序列亦可在通讀終止密碼子(TGA)之前。在其他實施例中，新世界α病毒為WEEV，且nsP2/nsP3接合點可為(SEQ ID NO:66) RYEAGR/APAY，且保留倒數第二個G，而nsP2/nsP3接合點中之其餘胺基酸如本文所描述而變化。對於WEEV之nsP3/nsP4接合點，該序列可為(SEQ ID NO:67) RYEAGA/YIFS，其中保留倒數第二個甘胺酸，且其餘nsP3胺基酸如本文中所描述而變化；此等序列亦可位於通讀終止密碼子(TGA)之前。在各種實施例中，序列(SEQ ID NO:62-67)亦可在N端及/或C端側上含有一或兩個或三個取代。

在一些實施例中亦揭示一種用於產生細胞中之相關多肽之方法，其包括將根據本發明之核酸分子引入至細胞中，由此產生由該細胞中之GOI編碼之多肽。在又一相關態樣中，本文揭示之一些實施例係關於用於在細胞中產生相關多肽之方法，其包括將RNA分子引入至細胞中，其中RNA分子包含病毒衣殼強化子或其變體之一或多個RNA莖環，及相關多肽之編碼序列，由此在細胞中產生相關多肽。

在另一通用態樣中，本申請案係關於一種組合物，其包含本申請案之自我複製RNA分子及醫藥學上可接受之載劑。

在某些實施例中，該組合物包含編碼截短HBV核心抗原的第一聚核苷酸、編碼HBV聚合酶抗原的第二聚核苷酸序列及醫藥學上可接受之載劑，其中第一及第二聚核苷酸不包含於同一自我複製RNA分子中。在另一個實施例中，第一及第二聚核苷酸包含於同一自我複製RNA分子中。

在一個實施例中，自我複製RNA分子囊封在脂質體、脂複合體、脂質奈米顆粒或其組合中，結合至脂質體、脂複合體、脂質奈米顆粒或其組合或吸附於脂質體、脂複合體、脂質奈米顆粒或其組合上。較佳地，自我複製RNA分子囊封於脂質奈米顆粒中。

本申請案進一步係關於一種用於治療有需要之個體的HBV誘發之疾病的本申請案之套組；及本申請案之套組的用途，其用於製造用於治療有需要之個體的HBV誘發之疾病的藥劑。該用途可以進一步包含與另一治療劑，較佳地另一抗HBV抗原之組合。較佳地，該個體患有慢性HBV感染，且HBV誘發之疾病係選自由晚期纖維化、肝硬化及肝細胞癌(HCC)組成之群。

本申請案亦係關於一種誘發針對HBV之免疫反應的方法或一種治療HBV感染或HBV誘發之疾病的方法，其包含向有需要之個體投與根據本發明之實施例之自我複製RNA或組合物。本申請案進一步關於本申請案之自我複製RNA分子或本申請案之組合物，其用於治療有需要之個體的HBV感染或HBV誘發之疾病。

自以下揭示內容，包括本發明之詳細說明及其較佳實施例以及所附申請專利範圍，將易於瞭解本發明之其他態樣、特徵及優勢。

相關申請之交叉引用本申請案主張申請於2020年4月8日之美國臨時申請案第63/006,925號及申請於2019年6月20日之美國臨時申請案第62/863,961號之優先權，其各者之揭示內容以全文引用之方式併入。

對以電子方式提交之序列表之引用本申請案含有序列表，該序列表係以2020年6月11日創建的檔案名稱為「065814.11217_9TW1 Sequence Listing」且大小為172 kb之ASCII格式序列表經由EFS-Web以電子方式提交。此經由EFS-Web提交之序列表係說明書之一部分且以全文引用的方式併入本文中。

先前技術及本說明書通篇引用或描述各種出版物、文章及專利；該等參考文獻各自以全文引用的方式併入本文中。本說明書中所包括的文獻、操作、材料、器件、文章或類似物之論述係出於提供本發明之內容的目的。此類論述並非承認任何或所有此等內容形成關於所揭示或所主張之任何發明之現有技術的一部分。

除非另外定義，否則本文所用的所有技術及科學術語均具有與本發明所屬領域的一般技術者通常所理解相同的含義。另外，本文中使用之某些術語具有如本說明書中所述之含義。本文中引用的所有專利、公開之專利申請案及出版物均以引用的方式併入，就如同在本文中完整闡述一般。

必須注意的是，除非上下文另外明確指示，否則如本文及所附申請專利範圍中所使用，單數形式「一個(種)(a/an)」及「該(the)」包括複數個(種)指示物。

除非另外指示，否則在一系列要素之前的術語「至少」應理解為指系列中之每一要素。熟習此項技術者將認識到或能夠僅使用常規實驗確定本文所描述之本發明特定實施例的許多等效物。本發明意欲涵蓋此類等效物。

在整個本說明書及隨後之申請專利範圍中，除非本文另有規定，否則「包含(comprise)」一詞及變化形式(諸如「包含(comprises/comprising)」)應理解為暗示包括所述整體或步驟或整體或步驟之群組但不排除任何其他整體或步驟或整體或步驟之群組。當在本文中使用時，術語「包含」可以用術語「含有」或「包括」取代，或有時當在本文中使用時，用術語「具有」取代。

當在本文中使用時，「由……組成」排除所主張要素中未規定之任何要素、步驟或成分。當在本文中使用時，「基本上由……組成」不排除不會實質上影響技術方案之基本及新穎特徵之材料或步驟。每當本文中在本申請案之態樣或實施例之上下文中使用時，前述術語「包含」、「含有」、「包括」及「具有」中之任一個可以用術語「由……組成」或「基本上由……組成」置換以改變本發明之範圍。

如本文中所用，多個所述要素之間的合取術語「及/或」理解為涵蓋個別及組合選項。舉例而言，當兩個要素藉由「及/或」連結時，第一個選擇係指第一要素之適用性，不含第二要素。第二個選擇係指第二要素之適用性，不含第一要素。第三個選擇係指第一要素與第二要素一起之適用性。此等選擇中之任一個應理解為在該含義之範圍內，且因此滿足如本文所使用之術語「及/或」之要求。該等選擇中多於一個之同時適用性亦應理解為在該含義之範圍內，且因此滿足術語「及/或」之要求。

除非另外規定，否則任何數值，諸如本文所描述之濃度或濃度範圍，應理解為在所有情況下以術語「約」修飾。因此，一個數值通常包括所述值之±10%。舉例而言，1 mg/mL濃度包括0.9 mg/mL至1.1 mg/mL。同樣，1 mg/mL至10 mg/mL之濃度範圍包括0.9 mg/mL至11 mg/mL。除非上下文另外明確地指示，否則如本文所使用，使用的數字範圍明確地包括所有可能的子範圍、在彼範圍內的所有個別數值，包括此類範圍內之整數及該等值之分數。

當參照胺基酸序列使用時，與構成胺基酸序列之總長度的胺基酸殘基之數量相比，短語「序列一致性百分比(%)」或「一致性%」或「與……一致%」描述兩個或更多個比對之胺基酸序列中匹配(「相配(hit))」的一致胺基酸之數量。在其他方面，當比較序列且比對達到最大對應性，使用此項技術中已知之序列比較演算法量測時，或當手動地比對並目視檢查時，使用比對，對於兩個或更多個序列，可以確定該等序列中相同胺基酸殘基之百分比(例如在胺基酸序列全長內90%、91%、92%、93%、94%、95%、97%、98%、99%或100%一致性)。因此，與確定序列一致性相比之序列可因此藉由胺基酸之取代、添加或缺失而不同。適合用於比對蛋白質序列之程式係熟習此項技術者已知的。蛋白質序列之序列一致性百分比可用諸如CLUSTALW、Clustal Omega、FASTA或BLAST之程式，例如使用NCBI BLAST演算法確定(Altschul SF等人(1997), Nucleic Acids Res. 25:3389-3402)。

如本文所用，在向個體投與兩種或更多種療法或組分之情形下，術語及短語「組合地」、「以及」、「共遞送」、及「與...一起投與」係指同時投與或連續投與兩種或更多種療法或組分，諸如兩種載體，例如RNA複製子、肽或治療組合及佐劑。「同時投與」可至少在同一天內投與兩種或更多種療法或組分。當兩種組分係「一起投與」或「組合投與」時，其可以在較短時間段內，諸如在24、20、16、12、8或4小時內或在1小時內以獨立組合物依序投與，或其可以單一組合物形式同時投與。「連續投與」可在同一天或在單獨天數投與兩種或更多種療法或組分。使用術語「與……組合」並不限定向個體投與療法或組分之次序。舉例而言，第一療法或組分(例如編碼HBV抗原之第一RNA複製子)可以在投與第二療法或組分(例如編碼HBV抗原之第二RNA複製子)之前(例如，5分鐘至一小時之前)、伴隨或同時或之後(例如，5分鐘至一小時之後)投與。在一些實施例中，在同一組合物中投與第一療法或組分(例如編碼HBV抗原之第一RNA複製子)及第二療法或組分(例如編碼HBV抗原之第二RNA複製子)。在其他實施例中，在獨立組合物，諸如兩個獨立組合物中投與第一療法或組分(例如編碼HBV抗原之第一RNA複製子)及第二療法或組分(例如編碼HBV抗原之第二RNA複製子)。

如本文所使用，「非天然存在之」核酸或多肽係指自然界中不存在的核酸或多肽。「非天然存在之」核酸或多肽可以為經合成、處理、製造及/或以其他方式在實驗室及/或製造環境中操作。在一些情況下，非天然存在之核酸或多肽可以包含經處理、加工或操作而展現在處理之前天然存在之核酸或多肽中不存在之特性的天然存在之核酸或多肽。如本文所使用，「非天然存在之」核酸或多肽可以為自發現其之天然來源分離或分開的核酸或多肽，且其與在天然來源中與其關聯之序列不具有共價鍵。「非天然存在之」核酸或多肽可以重組方式或其他方法，諸如化學合成製備。

如本文所用，「個體」意謂將利用根據本申請案之實施例的方法治療或已利用該方法治療的任何動物，較佳為哺乳動物，最佳為人類。如本文所用，術語「哺乳動物」涵蓋任何哺乳動物。哺乳動物之實例包括但不限於牛、馬、綿羊、豬、貓、狗、小鼠、大鼠、兔、天竺鼠、非人類靈長類動物(NHP)諸如猴或猿、人類等，更佳為人類。

如本文所使用，術語「可操作地連接」係指鍵聯或併接，其中如此描述之組分係呈允許其以其預期方式發揮作用的關係。舉例而言，可操作地連接至相關核酸序列之調控序列能夠引導該相關核酸序列之轉錄，或可操作地連接至相關胺基酸序列之信號序列能夠將該相關胺基酸序列分泌或轉位至膜上。

為了幫助本申請案之讀者，說明書分成各種段落或部分，或針對本申請案之各種實施例。該等分離不應認為一個段落或部分或實施例之物質與另一段或部分或實施例之物質無關聯。相反，熟習此項技術者應理解，本說明書具有廣泛應用且涵蓋可以涵蓋之各種部分、段落及語句之所有組合。任何實施例之論述僅意欲為例示性的，且並不意欲表明本發明之範疇，包括申請專利範圍，侷限於此等實例。舉例而言，儘管本文所描述之本申請案之HBV載體(例如RNA複製子或病毒載體)的實施例可含有特定組分，包括但不限於以特定次序配置之某些啟動子序列、強化子或調控序列、信號肽、HBV抗原之編碼序列、聚腺苷酸化信號序列等，但一般技術者應瞭解，本文所揭示之概念可同樣適用於以可用於本申請案之HBV載體中之其他次序配置的其他組分。本申請案涵蓋使用具有可以用於本申請案之HBV載體中之任何序列的呈任何組合形式之可應用組分中之任一種，無論是否明確地描述特定組合。本發明大體上係關於編碼一或多種HBV抗原之自我複製RNA分子。

B 型肝炎病毒 (HBV)如本文所使用，「B型肝炎病毒」或「HBV」係指肝DNA病毒科之病毒。 HBV為編碼四個開放閱讀框架及七種蛋白質的親肝性小(例如3.2 kb)DNA病毒。HBV編碼之七種蛋白質包括小(S)、中等(M)及大(L)表面抗原(HBsAg)或包膜(Env)蛋白質、前核心蛋白、核心蛋白、病毒聚合酶(Pol)及HBx蛋白質。HBV表現三種表面抗原，或包膜蛋白，即L、M及S，其中S最小且L最大。M及L蛋白質中之額外域分別命名為前S2及前S1。核心蛋白為病毒核衣殼之亞單元。 Pol為合成病毒DNA(逆轉錄酶、核糖核酸酶H及引子)所需，其發生在位於受感染肝細胞之細胞質的核衣殼中。前核心蛋白係具有N端信號肽之核心蛋白且在自受感染細胞分泌之前，在其N及C端經歷蛋白水解加工為所謂的B型肝炎e抗原(HBeAg)。HBx蛋白質係共價閉合環狀DNA(cccDNA)高效轉錄所需的。HBx並非病毒結構蛋白。除共有mRNA之核心及聚合酶外，HBV之所有病毒蛋白均具有其自身mRNA。除前核心蛋白之外，該等HBV病毒蛋白均不經歷轉譯後蛋白質水解加工。

HBV病毒粒子含有病毒包膜、核衣殼，及部分呈雙股之DNA基因體的單一複本。核衣殼包含120個核心蛋白二聚體且經內嵌有S、M及L病毒包膜或表面抗原蛋白質之衣殼膜覆蓋。在進入細胞之後，病毒去殼且與病毒聚合酶共價結合的含衣殼之鬆環DNA(rcDNA)遷移至核中。在彼過程期間，核心蛋白磷酸化誘導結構變化，暴露出核定位信號，使得衣殼能夠與所謂的輸入蛋白(importin)相互作用。此等輸入蛋白介導核心蛋白與核孔複合物之結合，在結合後，衣殼解離且聚合酶/rcDNA複合物釋放至核中。在核內，rcDNA變得去蛋白化(移除聚合酶)且經宿主DNA修復機構轉變成共價閉合環狀DNA(cccDNA)基因體，自該基因體，重疊之轉錄本編碼HBeAg、HBsAg、核心蛋白、病毒聚合酶及HBx蛋白質。核心蛋白、病毒聚合酶及前基因體RNA(pgRNA)在細胞質中締合並自組裝成不成熟的含pgRNA之衣殼粒子，該等衣殼粒子進一步轉化成為成熟rcDNA-衣殼且充當共同中間物，經包覆且以感染病毒粒子形式分泌，或轉運回到核中以補充及維持穩定cccDNA池。

迄今為止，HBV基於包膜蛋白上存在之抗原性抗原決定基而分成四種血清型(adr、adw、ayr、ayw)，且基於病毒基因體之序列而分成八種基因型(A、B、C、D、E、F、G及H)。 HBV基因型分佈在不同地理區域上。舉例而言，亞洲最流行基因型為基因型B及C。基因型D主要存在於非洲、中東及印度，而基因型A在北歐、撒哈拉沙漠以南非洲(sub-Saharan Africa)及西非較為普遍。

HBV 抗原如本文所使用，術語「HBV抗原」、「HBV之抗原性多肽」、「HBV抗原性多肽」、「HBV抗原蛋白質」、「HBV免疫原性多肽」及「HBV免疫原」皆指能夠在個體中誘發針對HBV之免疫反應，例如體液及/或細胞介導之反應的多肽。HBV抗原可以為HBV多肽、其片段或抗原決定基，或多個HBV多肽、其部分或衍生物之組合。HBV抗原能夠在宿主中產生保護性免疫反應，例如誘發針對病毒性疾病或感染之免疫反應，及/或使個體針對病毒性疾病或感染產生免疫(亦即，接種疫苗)，由此保護個體免受病毒性疾病或感染影響。舉例而言，HBV抗原可以包含來自源於任何HBV基因型，例如基因型A、B、C、D、E、F、G及/或H之任何HBV蛋白質，諸如HBeAg、前核心蛋白、HBsAg(S、M或L蛋白質)、核心蛋白、病毒聚合酶或HBx蛋白質，或其組合的多肽或其免疫原性片段。

( 1 ) HBV 核心抗原如本文所使用，術語「HBV核心抗原」、「HBc」及「核心抗原」均係指能夠在個體中誘發針對HBV核心蛋白之免疫反應，例如體液及/或細胞介導之反應的HBV抗原。術語「核心」、「核心多肽」及「核心蛋白」均係指HBV病毒核心蛋白。全長核心抗原通常係183個胺基酸長度且包括組裝域(胺基酸1至149)及核酸結合域(胺基酸150至183)。34個殘基之核酸結合域為前基因體RNA衣殼化所需的。此域亦用作核輸入信號。其包含17個精胺酸殘基且具有較高鹼性，與其功能相符。HBV核心蛋白在溶液中呈二聚體形式，且二聚體自組裝成二十面體衣殼。每個核心蛋白二聚體具有在任一側上側接一個α-螺旋域的四個α-螺旋束。不含核酸結合域的截短之HBV核心蛋白亦能夠形成衣殼。

在本申請案之一個實施例中，HBV抗原為截短HBV核心抗原。如本文所使用，「截短HBV核心抗原」係指不含全長之HBV核心蛋白但能夠在個體中誘發針對HBV核心蛋白之免疫反應的HBV抗原。舉例而言，HBV核心抗原可以經修飾成使核心抗原中通常含有十七個精胺酸(R)殘基的帶大量正電荷(富含精胺酸)之C端核酸結合域的一或多個胺基酸缺失。本申請案的截短HBV核心抗原較佳為不包含HBV核心核輸入信號的C端截短之HBV核心蛋白及/或已缺失C端HBV核心核輸入信號的截短之HBV核心蛋白。在一個實施例中，截短HBV核心抗原包含C端核酸結合域中之缺失，諸如缺失C端核酸結合域之1至34個胺基酸殘基，例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33或34個胺基酸殘基，較佳缺失全部34個胺基酸殘基。在較佳實施例中，截短HBV核心抗原包含C端核酸結合域中之缺失，較佳所有34個胺基酸殘基之缺失。

本申請案之HBV核心抗原可以為源於多種HBV基因型(例如基因型A、B、C、D、E、F、G及H)之共同序列。如本文所使用，「共同序列」意謂基於同源蛋白質之胺基酸序列比對，例如藉由比對(例如使用Clustal Omega)同源蛋白質之胺基酸序列所測定的人工胺基酸序列。其可以為基於來自至少100個天然HBV分離株之HBV抗原(例如核心、pol等)之序列計算的在序列比對中各位置處所發現的最常見胺基酸殘基之次序。共同序列可以為非天然存在的且不同於原生病毒序列。共同序列可以藉由使用多序列比對工具比對來自不同來源之多個HBV抗原序列，且在有變化之比對位置選擇最常見的胺基酸來設計。較佳地，HBV抗原之共同序列係源於HBV基因型B、C及D。術語「共同抗原」用以指具有共同序列之抗原。

根據本申請案之例示性截短HBV核心抗原不具有核酸結合功能，且能夠在哺乳動物中誘發針對至少兩種HBV基因型之免疫反應。較佳地，截短HBV核心抗原能夠在哺乳動物中誘發針對至少HBV基因型B、C及D之T細胞反應。更佳地，截短HBV核心抗原能夠在人類個體中誘發針對至少HBV基因型A、B、C及D之CD8+ T細胞反應。

較佳地，本申請案之HBV核心抗原為共同抗原，較佳為源於HBV基因型B、C及D之共同抗原，更佳為源於HBV基因型B、C及D之截短之共同抗原。根據本申請案之例示性截短之HBV核心共同抗原由與SEQ ID NO:2或SEQ ID NO:4至少90%一致，諸如與SEQ ID NO:2或SEQ ID NO:4至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致之胺基酸序列組成。SEQ ID NO:2及SEQ ID NO:4為源於HBV基因型B、C及D之核心共同抗原。SEQ ID NO:2及SEQ ID NO:4各自含有天然核心抗原之帶大量正電荷(富含精胺酸)之核酸結合域的34-胺基酸C端缺失。

在本申請案之一個實施例中，HBV核心抗原係由SEQ ID NO:2之胺基酸序列組成的截短之HBV抗原。在另一實施例中，HBV核心抗原係由SEQ ID NO:4之胺基酸序列組成的截短之HBV抗原。在另一實施例中，HBV核心抗原另外含有可操作地連接至成熟HBV核心抗原序列之N端的信號序列，諸如SEQ ID NO:2或SEQ ID NO:4之胺基酸序列。較佳地，信號序列具有SEQ ID NO:9或SEQ ID NO:15之胺基酸序列。

( 2 ) HBV 聚合酶抗原如本文所使用，術語「HBV聚合酶抗原」、「HBV Pol抗原」或「HBV pol抗原」係指能夠在個體中誘發針對HBV聚合酶的免疫反應，例如體液及/或細胞介導之反應的HBV抗原。術語「聚合酶」、「聚合酶多肽」、「Pol」及「pol」均係指HBV病毒DNA聚合酶。HBV病毒DNA聚合酶具有四個域，自N端至C端，包括充當負股DNA合成之引子的末端蛋白質(TP)域；對於聚合酶功能不重要的間隔子；用於轉錄之逆轉錄酶(RT)域；以及核糖核酸酶H域。

在本申請案之一個實施例中，HBV抗原包含HBV Pol抗原，或其任何免疫原性片段或組合。HBV Pol抗原可以含有改善抗原之免疫原性的其他修飾，諸如藉由將突變引入聚合酶及/或核糖核酸酶域之活性位點中以降低或基本上除去某些酶活性。

較佳地，本申請案之HBV Pol抗原不具有逆轉錄酶活性及核糖核酸酶H活性，且能夠在哺乳動物中誘發針對至少兩種HBV基因型之免疫反應。較佳地，HBV Pol抗原能夠在哺乳動物中誘發針對至少HBV基因型B、C及D之T細胞反應。更佳地，HBV Pol抗原能夠在人類個體中誘發針對至少HBV基因型A、B、C及D之CD8+ T細胞反應。

因此，在一些實施例中，HBV Pol抗原為失活之Pol抗原。在一個實施例中，失活之HBV Pol抗原在聚合酶域之活性位點中包含一或多個胺基酸突變。在另一個實施例中，失活之HBV Pol抗原在核糖核酸酶H域之活性位點中包含一或多個胺基酸突變。在一個較佳實施例中，失活之HBV pol抗原在聚合酶域及核糖核酸酶H域兩者之活性位點中包含一或多個胺基酸突變。舉例而言，可以例如藉由用天冬醯胺殘基(N)置換一或多個天冬胺酸殘基(D)，消除或降低金屬配位功能，使HBV pol抗原之聚合酶域中核苷酸/金屬離子結合所需之「YXDD」基元突變，由此降低或基本上消除逆轉錄酶功能。作為「YXDD」基元突變之置換或除該突變之外，可以例如藉由用天冬醯胺殘基(N)置換一或多個天冬胺酸殘基(D)及/或用麩醯胺酸(Q)置換麩胺酸殘基(E)，使HBV pol抗原之核糖核酸酶H域中Mg2+配位所需之「DEDD」基元突變，由此降低或基本上消除核糖核酸酶H功能。在一個特定實施例中，HBV pol抗原係藉由以下方式修飾：(1)使聚合酶域之「YXDD」基元中的天冬胺酸殘基(D)突變成天冬醯胺殘基(N)；以及(2)使核糖核酸酶H域之「DEDD」基元中的第一個天冬胺酸殘基(D)突變成天冬醯胺殘基(N)及使第一個麩胺酸殘基(E)突變成麩醯胺酸殘基(N)，由此降低或基本上消除pol抗原之逆轉錄酶及核糖核酸酶H功能。

在本申請案之一個較佳實施例中，HBV pol抗原為共同抗原，較佳為源於HBV基因型B、C及D之共同抗原，更佳為源於HBV基因型B、C及D的失活之共同抗原。根據本申請案之例示性HBV pol共同抗原包含與SEQ ID NO:7至少90%一致，諸如與SEQ ID NO:7至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致；較佳地為與SEQ ID NO:7至少98%一致，諸如與SEQ ID NO:7至少98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致之胺基酸序列SEQ ID NO:7為在聚合酶及核糖核酸酶H域之活性位點中包含四個突變的源於HBV基因型B、C及D之pol共同抗原。詳言之，四個突變包括聚合酶域之「YXDD」基元中的天冬胺酸殘基(D)突變成天冬醯胺殘基(N)；以及核糖核酸酶H域之「DEDD」基元中的第一個天冬胺酸殘基(D)突變成天冬醯胺殘基(N)及麩胺酸殘基(E)突變成麩醯胺酸殘基(Q)。

在本申請案之一個特定實施例中，HBV pol抗原包含SEQ ID NO:7之胺基酸序列。在本申請案之其他實施例中，HBV pol抗原由SEQ ID NO:7之胺基酸序列組成。在另一實施例中，HBV pol抗原另外含有可操作地連接至成熟HBV核心抗原序列之N端的信號序列，諸如SEQ ID NO:7之胺基酸序列。較佳地，信號序列具有SEQ ID NO:9或SEQ ID NO:15之胺基酸序列。

( 3 ) HBV 核心抗原與 HBV 聚合酶抗原之融合如本文所使用，術語「融合蛋白」或「融合物」係指具有至少兩個通常不存在於單一天然多肽中之多肽域的單一多肽鏈。

在本申請案之一個實施例中，HBV抗原包含融合蛋白，該融合蛋白包含較佳地經由連接子將截短HBV核心抗原可操作地連接至HBV Pol抗原或將HBV Pol抗原可操作地連接至截短HBV核心抗原。

舉例而言，在含有第一多肽及第二異源多肽之融合蛋白中，連接子主要用作第一與第二多肽之間的間隔子。在一個實施例中，連接子係由經肽鍵連接在一起的胺基酸組成，較佳由經肽鍵連接的1至20個胺基酸組成，其中胺基酸係選自20種天然存在之胺基酸。在一個實施例中，1至20個胺基酸係選自甘胺酸、丙胺酸、脯胺酸、天冬醯胺、麩醯胺酸及離胺酸。較佳地，連接子係由大量無空間位阻之胺基酸，諸如甘胺酸及丙胺酸構成。例示性連接子為聚甘胺酸，尤其是(Gly)5、(Gly)8；聚(Gly-Ala)及聚丙胺酸。如以下實例中所示的一種例示性適合連接子為(AlaGly)n，其中n為2至5之整數。

較佳地，本申請案之融合蛋白能夠在哺乳動物中誘發針對至少兩種HBV基因型之HBV核心及HBV Pol的免疫反應。較佳地，融合蛋白能夠在哺乳動物中誘發針對至少HBV基因型B、C及D之T細胞反應。更佳地，融合蛋白能夠在人類個體中誘發針對至少HBV基因型A、B、C及D之CD8+ T細胞反應。

在本申請案之一個實施例中，融合蛋白包含截短HBV核心抗原，該截短HBV核心抗原具有與SEQ ID NO:2或SEQ ID NO:4至少90%，諸如至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致之胺基酸序列；及HBV Pol抗原，該HBV Pol抗原具有與SEQ ID NO:7至少90%，諸如至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致之胺基酸序列。

在本申請案之一個較佳實施例中，融合蛋白包含由SEQ ID NO:2或SEQ ID NO:4之胺基酸序列組成之截短HBV核心抗原；包含(AlaGly)n之連接子，其中n為2至5之整數；及具有SEQ ID NO:7之胺基酸序列的HBV Pol抗原。更佳地，根據本申請案之實施例的融合蛋白包含SEQ ID NO:16之胺基酸序列。

在本申請案之一個實施例中，融合蛋白進一步包含可操作地連接至融合蛋白之N端的信號序列。較佳地，信號序列具有SEQ ID NO:9或SEQ ID NO:15之胺基酸序列。在一個實施例中，融合蛋白包含SEQ ID NO:17之胺基酸序列。

可用於本發明之HBV疫苗的額外揭示內容描述於2018年12月18日申請之美國專利申請案第16/223,251號中，該申請案之內容，更佳該等實例以全文引用的方式併入本文中。

聚核苷酸及載體在另一通用態樣中，本申請案提供編碼根據本申請案之實施例適用於本發明之HBV抗原的非天然存在之核酸分子，及包含非天然存在之核酸的載體。第一或第二非天然存在之核酸分子可以包含編碼可用於本申請案之HBV抗原的任何聚核苷酸序列，其可以根據本發明使用此項技術中已知之方法製備。較佳地，第一或第二聚核苷酸編碼本申請案之截短HBV核心抗原及HBV聚合酶抗原中的至少一種。聚核苷酸可以呈藉由重組技術(例如選殖)獲得或合成地製造(例如化學合成)之RNA形式或DNA形式。DNA可以為單股或雙股的，或者可以含有雙股及單股序列之部分。DNA可以例如包含基因體DNA、cDNA或其組合。聚核苷酸亦可為DNA/RNA雜合體。本申請案之聚核苷酸及載體可以用於製造重組蛋白、在宿主細胞中表現蛋白質或製造病毒粒子。較佳地，聚核苷酸為RNA。

在本申請案之一個實施例中，第一非天然存在之核酸分子包含編碼截短HBV核心抗原的第一聚核苷酸序列，該截短HBV核心抗原由與SEQ ID NO:2或SEQ ID NO:4至少90%一致，諸如與SEQ ID NO:2至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致，較佳地與SEQ ID NO:2或SEQ ID NO:4 98%、99%或100%一致之胺基酸序列組成。在本申請案之一個特定實施例中，第一非天然存在之核酸分子包含編碼截短HBV核心抗原的第一聚核苷酸序列，該截短HBV核心抗原由SEQ ID NO:2或SEQ ID NO:4之胺基酸序列組成。

編碼由SEQ ID NO:2或SEQ ID NO:4之胺基酸序列組成的截短HBV核心抗原的本申請案之聚核苷酸序列之實例包括但不限於與SEQ ID NO:1或SEQ ID NO:3至少90%一致，諸如與SEQ ID NO:1或SEQ ID NO:3至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致，較佳地SEQ ID NO: 1或SEQ ID NO:3 98%、99%或100%一致之胺基酸序列。編碼截短HBV核心抗原的例示性非天然存在之核酸分子具有SEQ ID NO:1或3之聚核苷酸序列。

在另一實施例中，第一非天然存在之核酸分子進一步包含可操作地連接至該HBV核心抗原序列之N端的信號序列之編碼序列。較佳地，信號序列具有SEQ ID NO:9或SEQ ID NO:15之胺基酸序列。更佳地，信號序列之編碼序列包含SEQ ID NO:8或SEQ ID NO:14之聚核苷酸序列。

在本申請案之一個實施例中，第二非天然存在之核酸分子包含編碼HBV聚合酶抗原之第二聚核苷酸序列，該HBV聚合酶抗原包含與SEQ ID NO:7至少90%一致，諸如與SEQ ID NO:7至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致，較佳地與SEQ ID NO:7 100%一致胺基酸序列。在本申請案之一個特定實施例中，第二非天然存在之核酸分子包含編碼HBV聚合酶抗原之第二聚核苷酸序列，該HBV聚合酶抗原由SEQ ID NO:7之胺基酸序列組成。

編碼包含與SEQ ID NO:7至少90%一致之胺基酸序列的HBV Pol抗原的本申請案之聚核苷酸序列的實例包括但不限於與SEQ ID NO:5或SEQ ID NO:6至少90%一致，諸如與SEQ ID NO:5或SEQ ID NO:6至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致，較佳地SEQ ID NO:5或SEQ ID NO:6 98%、99%或100%一致之胺基酸序列。編碼HBV pol抗原之例示性非天然存在之核酸分子具有SEQ ID NO:5或6之聚核苷酸序列。

在另一個實施例中，第二非天然存在之核酸分子進一步包含信號序列之編碼序列，該信號序列可操作地連接至HBV pol抗原序列，諸如SEQ ID NO:7之胺基酸序列之N端。較佳地，信號序列具有SEQ ID NO:9或SEQ ID NO:15之胺基酸序列。更佳地，信號序列之編碼序列包含SEQ ID NO:8或SEQ ID NO:14之聚核苷酸序列。

在本申請案之另一實施例中，非天然存在之核酸分子編碼包含將截短HBV核心抗原可操作地連接至HBV Pol抗原或將HBV Pol抗原可操作地連接至截短HBV核心抗原的融合蛋白。在一個特定實施例中，本申請案之非天然存在之核酸分子編碼截短HBV核心抗原，該截短HBV核心抗原由以下組成：與SEQ ID NO:2或SEQ ID NO:4至少90%一致，諸如與SEQ ID NO:2或SEQ ID NO:4至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致，較佳地與SEQ ID NO:2或SEQ ID NO:4 100%一致，更佳地與SEQ ID NO:2或SEQ ID NO:4 100%一致之胺基酸序列；連接子；及HBV聚合酶抗原，其包含與SEQ ID NO:7至少90%一致，諸如與SEQ ID NO:7至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致，較佳地與SEQ ID NO:7 98%、99%或100%一致之胺基酸序列。在本申請案之一個特定實施例中，非天然存在之核酸分子編碼融合蛋白，該融合蛋白包含由SEQ ID NO:2或SEQ ID NO:4之胺基酸序列組成的截短HBV核心抗原；包含(AlaGly)n之連接子，其中n為2至5之整數；以及包含SEQ ID NO: 7之胺基酸序列的HBV Pol抗原。在本申請案之一個特定實施例中，非天然存在之核酸分子編碼包含SEQ ID NO:16之胺基酸序列的HBV抗原融合蛋白。

編碼HBV抗原融合蛋白之本申請案之聚核苷酸序列之實例包括但不限於與SEQ ID NO:1或SEQ ID NO:3至少90%一致，諸如與SEQ ID NO:1或SEQ ID NO:3至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致，較佳地與SEQ ID NO:1或SEQ ID NO:3 98%、99%或100%一致之聚核苷酸序列，該聚核苷酸序列可操作地連接至與SEQ ID NO:11至少90%一致，諸如與SEQ ID NO:11至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致，較佳與SEQ ID NO:11 98%、99%或100%一致之連接子編碼序列，該聚核苷酸序列進一步可操作地連接至與SEQ ID NO:5或SEQ ID NO:6至少90%一致，諸如與SEQ ID NO:5或SEQ ID NO:6至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.9%、99.7%、99.8%、99.9%或100%一致，較佳地與SEQ ID NO:5或SEQ ID NO:6 98%、99%或100%一致之聚核苷酸序列。在本申請案之特定實施例中，編碼HBV抗原融合蛋白之非天然存在之核酸分子包含SEQ ID NO:1或SEQ ID NO:3，其可操作地連接至SEQ ID NO:11，其進一步可操作地連接至SEQ ID NO:5或SEQ ID NO:6。

在另一實施例中，編碼HBV融合體之非天然存在之核酸分子進一步包含可操作地連接至HBV融合序列，諸如SEQ ID NO:16之胺基酸序列之N端的信號序列的編碼序列。較佳地，信號序列具有SEQ ID NO:9或SEQ ID NO:15之胺基酸序列。更佳地，信號序列之編碼序列包含SEQ ID NO:8或SEQ ID NO:14之聚核苷酸序列。在一個實施例中，具有信號序列之經編碼融合蛋白包含SEQ ID NO:17之胺基酸序列。

本申請案亦關於一種載體，其包含第一及/或第二非天然存在之核酸分子。如本文所使用，「載體」係用於將遺傳物質載運至另一細胞中的核酸分子，其中其可以複製及/或表現。本申請案之載體可以為表現載體。如本文所使用，術語「表現載體」係指包含編碼能夠轉錄之RNA之核酸的任何類型之基因構築體。表現載體包括但不限於用於重組蛋白表現之載體，諸如RNA複製子或病毒載體，及用於將核酸遞送至個體中以用於在個體之組織中表現之載體，諸如RNA複製子或病毒載體。熟習此項技術者應瞭解，表現載體之設計可取決於諸如待轉型宿主細胞之選擇、所需蛋白質之表現量等因素。

本申請案之載體可以含有多種調控序列。如本文所使用，術語「調控序列」係指允許、促成或調控核酸分子之功能性調控，包括宿主細胞或生物體中核酸或其衍生物之一(亦即，mRNA)之複製、重複、轉錄、剪接、轉譯、穩定性及/或運輸的任何序列。在本發明的上下文中，此術語涵蓋啟動子、強化子及其他表現控制元件(例如聚腺苷酸化信號及影響mRNA穩定性之元件)。

較佳地，載體為自我複製RNA複製子。

如本文所用，可與「自我擴增RNA分子」或「RNA複製子」或「複製子RNA」或「saRNA」互換使用之「自我複製RNA分子」係指由正股RNA病毒之基因體工程改造之RNA分子，該RNA分子含有在允許的細胞內指導自身擴增或自我複製所需的所有遺傳資訊。自我複製RNA分子類似於mRNA。其為單股的、5'-加帽及3'-聚腺苷酸化的且具有正取向。為指導其自身複製，RNA分子1)編碼聚合酶、複製酶或可與病毒或宿主細胞衍生之蛋白質、核酸或核糖核蛋白相互作用以催化RNA擴增過程之其他蛋白質；及2)含有亞基因體複製子編碼之RNA之複製及轉錄所需的順式作用RNA序列。因此，所遞送之RNA引起多個子RNA之產生。此等子RNA以及共線亞基因體轉錄物可經轉譯自身以提供相關基因之原位表現，或可經轉錄以提供與經轉譯以提供相關基因之原位表現之所遞送RNA具有相同意義的其他轉錄物。此轉錄物序列之總體結果為在引入之複製子RNA之數目方面的巨大擴增，且因此相關經編碼基因變成細胞之主要多肽產物。

在某些實施例中，自我複製RNA分子編碼包含RNA-依賴性RNA-聚合酶功能、解旋酶、加帽及聚腺苷酸化活性之自我擴增之酶複合物(複製酶聚合蛋白)。處於亞基因體啟動子控制下之複製酶下游之病毒結構基因可由相關基因(GOI)置換。在轉染時，複製酶立即轉譯，與基因體RNA之5'及3'端相互作用，且合成互補基因體RNA複本。彼等充當合成新穎正股、加帽及聚腺苷酸化基因體複本及亞基因體轉錄物之模板(圖4)。擴增最終產生每個細胞至多2×10 ⁵個複本之極高RNA複本數。因此，與習知mRNA相比低得多的量的saRNA足以實現有效的基因轉移及保護性疫苗接種(Beissert等人, Hum Gene Ther. 2017, 28(12): 1138-1146)。

亞基因體RNA為長度或尺寸小於其所來源之基因體RNA的RNA分子。病毒亞基因體RNA可自內部啟動子轉錄，該內部啟動子之序列存在於基因體RNA或其補體內。亞基因體RNA之轉錄可藉由與宿主細胞編碼之蛋白質、核糖核蛋白或其組合相關的經病毒編碼之聚合酶介導。多個RNA病毒產生亞基因體mRNA(sgRNA)以用於表現其3'近端基因。

在本發明之一些實施例中，一或多個相關基因(例如HBV抗原基因)在亞基因體啟動子之控制下表現。在某些實施例中，代替天然亞基因體啟動子，亞基因體RNA可處於源於腦心肌炎病毒(EMCV)、牛病毒腹瀉病毒(BVDV)、脊髓灰白質炎病毒、口蹄疫病毒(FMD)、腸病毒71或C型肝炎病毒之內部核糖體入口位點(IRES)的控制下。亞基因體啟動子在24個核苷酸(辛得比斯病毒)至超過100個核苷酸(甜菜壞死黃脈病毒)之範圍內且通常在轉錄起始之上游發現。

在一些實施例中，RNA複製子包括用於至少一種、至少兩種、至少三種或至少四種非結構性病毒蛋白(例如nsP1、nsP2、nsP3、nsP4)之編碼序列。在一些實施例中，RNA複製子包括至少一種非結構病毒蛋白之一部分之編碼序列。舉例而言，RNA複製子可包括至少一種非結構性病毒蛋白之編碼序列之約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、100%或在此等值中之任兩者之間的範圍內。在一些實施例中，RNA複製子可包括至少一種非結構病毒蛋白之實質部分之編碼序列。如本文所用，編碼非結構病毒蛋白之核酸序列之「實質性部分」包含足夠的編碼非結構病毒蛋白之核酸序列，以藉由熟習此項技術者手動評估序列或藉由計算機自動化序列比較，得到彼蛋白質的假定鑑別及使用諸如BLAST之演算法的鑑別(參見例如在「Basic Local Alignment Search Tool」中；Altschul S F等人, J. Mol. Biol. 215:403-410, 1993)。在一些實施例中，RNA複製子可包括至少一種非結構蛋白之整個編碼序列。在一些實施例中，RNA複製子包含天然病毒非結構蛋白質之基本上所有編碼序列。在某些實施例中，一或多種非結構病毒蛋白質源於相同病毒。在其他實施例中，一或多種非結構蛋白質源於不同病毒。

RNA複製子可源於任何適合之正股RNA病毒，諸如α病毒或黃病毒。較佳地，RNA複製子源於α病毒。術語「α病毒」描述披膜病毒科之包膜單股正義RNA病毒。α病毒屬含有約30種成分，其可感染人類以及其他動物。α病毒粒子通常具有70 nm直徑，傾向於為球形或略微多晶型，且具有40 nm等角核衣殼。α病毒之總基因體長度在11,000與12,000個核苷酸之間的範圍內且具有5'帽及3'多聚腺苷酸尾。在基因體、非結構(ns)及結構中存在兩個開放閱讀框架(ORF's)。ns ORF編碼病毒RNA之轉錄及複製所需的蛋白質(nsP1-nsP4)。結構ORF編碼三種結構蛋白：核心核衣殼蛋白C及作為異二聚體締合之包膜蛋白P62及El。病毒膜錨定之表面糖蛋白負責受體識別及經由膜融合進入目標細胞中。四個ns蛋白質基因由基因體中之5'三分之二基因編碼，而三個結構蛋白由與基因體之3'三分之一同線性的亞基因體mRNA轉譯。α病毒基因體之例示性描述展示於圖4A中。

在一些實施例中，適用於本發明之自我複製RNA為源於α病毒病毒物種之RNA複製子。在一些實施例中，α病毒RNA複製子具有屬於VEEV/EEEV群組或SF群組或SIN群組之α病毒。 SF群組α病毒之非限制性實例包括勝利基森林病毒(Semliki Forest virus)、奧-奈氏病毒(O'Nyong-virus)、羅斯河病毒(Ross River virus)、米德爾堡病毒(Middleburg virus)、屈公病毒(Chikungunya virus)、巴馬森林病毒(Barmah Forest virus)、蓋塔病毒(Getah virus，GET)、馬雅羅病毒(Mayaro virus)、鷺山病毒、貝巴魯病毒(Bebaru virus)及烏納病毒(Una virus)。SIN群組α病毒之非限制性實例包括辛得比斯病毒(Sindbis virus)、基德烏S.A.病毒(Girdwood S. A. virus)、南非蟲媒病毒第86號、奧克爾博病毒(Ockelbo virus)、奧拉病毒(Aura virus)、巴班基病毒(Babanki virus)、沃達羅河病毒(Whataroa virus)及克孜拉格赫病毒(Kyzylagach virus)。 VEEV/EEEV群組α病毒之非限制性實例包括東部馬腦炎病毒(EEEV)、委內瑞拉馬腦炎病毒(VEEV)、沼澤地病毒(EVEV)、穆坎布病毒(Mucambo virus，MUCV)、皮春納病毒(Pixuna virus，PIXV)、米德爾堡病毒(MIDV)、屈公病毒(CHIKV)、奧-奈氏病毒(ONNV)、羅斯河病毒(RRV)、巴馬森林病毒(BF)、蓋塔病毒(GET)、鷺山病毒(SAGV)、貝巴魯病毒(BEBV)、馬雅羅病毒(MAYV)及烏納病毒(UNAV)。

α病毒物種之非限制性實例包括東部馬腦炎病毒(EEEV)、委內瑞拉馬腦炎病毒(VEEV)、沼澤地病毒(EVEV)、穆坎布病毒(MUCV)、勝利基森林病毒(SFV)、皮春納病毒(PIXV)、米德爾堡病毒(MIDV)、屈公病毒(CHIKV)、奧-奈氏病毒(ONNV)、羅斯河病毒(RRV)、巴馬森林病毒(BF)、蓋塔病毒(GET)、鷺山病毒(SAGV)、貝巴魯病毒(BEBV)、馬雅羅病毒(MAYV)、烏納病毒(UNAV)、辛得比斯病毒(SINV)、奧拉病毒(AURAV)、沃達羅河病毒(WHAV)、巴班基病毒(BABV)、克孜拉格赫病毒(KYZV)、西部馬腦炎病毒(WEEV)、高地J病毒(Highland J virus，HJV)、摩根堡病毒(FMV)、恩杜穆(Ndumu，NDUV)及車溪病毒。有毒性的及無毒α病毒株均為適合的。在一些實施例中，α病毒RNA複製子為辛得比斯病毒(SIN)、勝利基森林病毒(SFV)、羅斯河病毒(RRV)、委內瑞拉馬腦炎病毒(VEEV)或東部馬腦炎病毒(EEEV)。在一些實施例中，α病毒RNA複製子屬於委內瑞拉馬腦炎病毒(VEEV)。

在某些實施例中，自我複製RNA分子包含編碼一或多種非結構蛋白nsP1-4之聚核苷酸、亞基因體啟動子(諸如26S亞基因體啟動子)及編碼本文所述之HBV抗原中之一或多者的相關基因。

自我複製RNA分子可具有5'帽(例如7-甲基鳥苷)。此帽可增強RNA之活體內轉譯。

適用於本發明之自我複製RNA分子之5'核苷酸可具有5'三磷酸基團。在加帽RNA中，此可經由5'-至-5'橋接器連接至7-甲基鳥苷。 5'三磷酸可增強RIG-I結合。

自我複製RNA分子可具有3'多聚腺苷酸尾。其亦可包括靠近其3'端之多聚腺苷酸聚合酶識別序列(例如AAUAAA)。

在一些實施例中，複製子RNA不含結構病毒蛋白中之至少一者之編碼序列。在此等情況下，編碼結構基因之序列可經一或多個異源序列，諸如相關基因(例如HBV抗原)之編碼序列取代。參見圖4B。

在將複製子RNA包裝至重組α病毒粒子中之彼等情況下，其必須含有一或多個所謂包裝信號之序列，其用以起始與產生粒子形成之α病毒結構蛋白之相互作用。在某些實施例中，α病毒粒子包含源於一或多種α病毒之RNA；及結構蛋白，其中該等結構蛋白中之至少一者源於兩種或更多種α病毒。

在saRNA轉譯期間會形成雙鏈雙股(dsRNA)中間物。 dsRNA中間物為細胞質RNA感測器(諸如Rig-I、MDA5及蛋白激酶R(PKR))之天然配位體。 dsRNA與細胞質RNA感測器之間的相互作用會引起干擾素反應基因之活化及saRNA之較強固有佐劑活性。然而，細胞質RNA感測器(尤其PKR)之活化亦引起轉譯之一般抑制。活化PKR會使真核起始因子2α亞單元(eIF2α)磷酸化，由此阻斷加帽依賴性轉譯，包括saRNA之轉譯。作為挽救轉譯之相反機制，α病毒進化跨越衣殼ORF之5'-端102個核苷酸(34個胺基酸)之衣殼起始密碼子(下游環，DLP)下游的RNA莖環結構，提供eIF2α非依賴性轉譯。用GOI置換衣殼ORF可產生缺乏DLP的重組型saRNA且恢復對活化PKR之敏感性，導致抑制GOI之表現。然而，跨越衣殼之部分至GOI之DLP之融合會產生對GOI之功能改變之風險(Beissert等人, Hum Gene Ther. 2017, 28(12): 1138-1146)。

在某些實施例中，本申請案之自我複製RNA載體包含一或多個特徵以賦予先天性免疫系統之轉譯抑制抗性或以其他方式增加GOI(例如HBV基因)之表現。舉例而言，本申請案之自我複製RNA可與編碼牛痘病毒免疫逃避蛋白E3、K3及B18之非複製mRNA共同遞送。據顯示，作為PKR活化及干擾素(IFN)-β上調之高度有效阻斷劑，E3優於K3或B18。相比之下，B18在控制OAS1(一種與病毒RNA降解有關之關鍵IFN誘導性基因)方面較優。藉由組合所有三種牛痘蛋白質，可實現活體外PKR及IFN路徑活化之顯著抑制，導致活體外及活體內相關基因之表現增強(Beissert等人, Hum Gene Ther. 2017, 28(12): 1138-1146)。

在某些實施例中，RNA序列可以經密碼子優化以提高轉譯效率。 RNA分子可以根據本發明，藉由此項技術中已知之任何方法，諸如藉由添加例如具有至少30個腺苷殘基之多聚腺苷酸尾；及/或用經修飾之核糖核苷酸，例如7-甲基鳥苷帽對5端加帽進行修飾以增進穩定性及/或轉譯，該經修飾之核糖核苷酸可以在RNA合成期間併入或在RNA轉錄之後以酶方式進行工程改造。

在某些實施例中，本申請案之自我複製RNA載體包含DLP基元。

如本文所用，「下游環」或「DLP基元」係指包含至少一個RNA莖環的聚核苷酸序列，相比於無DLP基元之另外一致構築體，其在置放於開放閱讀框架(ORF)之起始密碼子下游時提供增加的ORF轉譯。舉例而言，DLP基元可提供eIF2α非依賴性轉譯。在一個實施例中，DLP基元源於屬於披膜病毒科之病毒物種之衣殼基因。在一個實施例中，自我複製RNA分子亦含有可操作地連接於DLP基元下游及GOI上游之自我蛋白酶肽之編碼序列。自我蛋白酶肽之實例包括但不限於選自由以下組成之群的肽序列：豬鐵士古病毒-1 2A(P2A)、口蹄疫病毒(FMDV) 2A(F2A)、馬鼻炎A病毒(ERAV) 2A(E2A)、明脈扁刺蛾病毒2A(T2A)、細胞質多角體病毒2A(BmCPV2A)、軟化病病毒2A(BmIFV2A)及其組合。包含DLP基元之自我複製RNA載體之實例描述於美國專利申請公開案US2018/0171340及國際專利申請公開案WO2018106615中，其內容以全文引用之方式併入本文中。

在另一個實施例中，本申請案之自我複製RNA複製子包含經修飾之5'非轉譯區(5'-UTR)，較佳地，RNA複製子不含編碼病毒結構蛋白之核酸序列之至少一部分。舉例而言，經修飾之5'-UTR可包含位置1、2、4處之一或多個核苷酸取代或其組合。較佳地，經修飾之5'-UTR包含位置2處之核苷酸取代，更佳地，經修飾之5'-UTR具有位置2處之U-＞G取代。此類自我複製RNA分子之實例描述於美國專利申請公開案US2018/0104359及國際專利申請公開案WO2018075235中，其內容以全文引用之方式併入本文中。

α病毒之5'-非轉譯區(5'-UTR)之先前詳細分析已揭示極端5'核苷酸支持RNA複製及轉錄的絕對重要性。特定言之，在所有α病毒中注意到分別在5'UTR序列之核苷酸位置1及2處的AU二核苷酸之保守性，表明此等核苷酸之重要性。如本文所使用，「A1」係指5'-UTR(例如α病毒5'-UTR)之核苷酸位置1處的保守性A核苷酸，且「U2」係指5'-UTR(例如α病毒5'-UTR)之核苷酸位置2處的保守性U核苷酸。此外，對於委內瑞拉馬腦炎病毒(VEEV)而言，已進行對此序列剛剛發現之5'大多數三個核苷酸以及莖環區的詳細分析。特定言之，先前已確定將U殘基維持在5'UTR之位置2處的重要性(Kulasegaran-Shylini等人, J. Virol. 83:17 p 8327-8339, 2009a;及Kulasegaran-Shylini等人J. Virol. 83:17 p 8327-8339, 2009b)。具體言之，相比於來自野生型VEE/SINV感染性純系之活體外轉錄RNA，在5'UTR中含有單一U2-＞G變化之來自指定(G2) VEE/SINV之全長感染性純系的活體外轉錄RNA展示幾乎三種感染性記錄之損失。此報導很大程度上表明位置2處之U對於RNA複製至關重要且無法經G置換。然而，如本文詳細地描述，在5'UTR中具有U2-＞G變化之VEEV複製子意外地且與此先前報導直接矛盾，與在位置2處含有U殘基之野生型5'UTR相比，不僅完全能夠穩定複製，而且引起VEEV複製子之三倍表現潛力。

大部分RNA病毒之極端5'及3'序列受到高度限制且幾乎不耐受(若任何變化為耐受的)；大部分修飾引起針對RNA複製之嚴重毀壞或致死結果。 Kulasegaran-Shylini等人完成對嵌合VEEV/SINV感染性純系之RNA複製至關重要的5'核苷酸序列之深度分析，該純系表示所有α病毒(Kulasegaran-Shylini等人2009a，同前文獻)。特定言之Kulasegaran-Shylini等人2009b論文(J. Virol. 83:17 p 8327-8339, 2009)陳述/顯示，將5'UTR中之核苷酸2自U殘基改變成G殘基(U2-＞G)明顯降低彼感染性純系RNA之存活率。亦即，5'-UTR之特異性變化使感染性純系RNA之生物活性降低近3個數量級。如本文所揭示，併入至VEEV(菌株TC83)複製子RNA中之5'-UTR之變化(例如U2-＞G變化)不僅破壞複製子之複製，而且可實際上提高複製子之生物活性。舉例而言，在一些實施例中，包含U2-＞G取代之複製子可引起相關蛋白之表現超過表現相同蛋白之野生型複製子三倍。此結果為出人意料的且尚未預測攜帶U2-＞G變化之複製子之生物活性提高。此經修飾之複製子有可能為支持疫苗及治療應用兩者之優良RNA表現平台。

已在α病毒亞型之所有基因體RNA中觀察到5'大多數2個核苷酸之保留。亦已證實保留之AU二核苷酸(A1及U2)為RNA複製關鍵所需的(Kulasegaran-Shylini等人2009a及2009b，同前文獻)。證實在極端5'端處攜帶AG二核苷酸之α病毒複製子RNA不僅為完全功能性的，但證實增強之生物活性為出人意料的且與領域中之信條完全相反。

單基因性或多基因性α病毒表現系統可藉由使用具有表現/轉譯增強活性之經修飾之複製子RNA，諸如含有經修飾之5'-UTR之複製子RNA來產生。在一些實施例中，如本文所描述之病毒(例如，α病毒)表現系統另外不含用於一或多種病毒結構蛋白之部分或整個編碼區。舉例而言，對於病毒衣殼蛋白C、E1糖蛋白、E2糖蛋白、E3蛋白及6K蛋白中之一或多者而言，α病毒表現系統可不含一部分或全部編碼序列。在一些實施例中，在複製子RNA之情形下，與具有野生型5'UTR序列之VEEV複製子相比，在委內瑞拉馬腦炎病毒(VEEV) 5'UTR序列自胸腺嘧啶(T)核苷酸至鳥嘌呤(G)核苷酸(T2-＞G突變)之cDNA複本中之位置2處的核苷酸修飾給予複製子顯著更高蛋白表現潛力。

在一些實施例中，相對於自對應未經修飾之複製子(例如具有野生型5'UTR之複製子)偵測之表現量，如本文所揭示之經修飾之複製子RNA之表現量及/或轉譯增強活性為至少1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2(2倍)、3、4、5、6、7、8或更多倍。在不受任何特定理論限制的情況下，增強的轉譯可歸因於增加的轉錄，其使得增加的轉錄量可用於轉譯及/或可獨立於轉錄且此係由於例如增強的核糖體結合。增強活性量可藉由此項技術中已知之任何便利方法及技術量測，包括但不限於轉錄物量、蛋白質量、蛋白質活性等。

在一個態樣中，本文揭示包括經修飾之複製子RNA之新穎核酸分子。舉例而言，經修飾之複製子RNA可包含親本複製子RNA之一或多個初始基因體區(例如開放閱讀框架(ORF)及/或非編碼區(例如啟動子序列))中之一或多個突變、缺失、取代及/或插入。在一些實施例中，經修飾之複製子RNA包括經修飾之5'-非轉譯區(5'-UTR)。在一些實施例中，經修飾之5'-UTR包括位置1、2、4處之一或多個核苷酸取代或其組合。在一些實施例中，至少一個核苷酸取代為在經修飾之5'-UTR之位置1處的核苷酸取代。在一些實施例中，至少一個核苷酸取代為在經修飾之5'-UTR之位置2處的核苷酸取代。在一些實施例中，至少一個核苷酸取代為在經修飾之5'-UTR之位置4處的核苷酸取代。在一些實施例中，經修飾之5'-UTR之位置2處的核苷酸取代為U-＞G取代。在一些實施例中，經修飾之5'-UTR之位置2處的核苷酸取代為U-＞A取代。在一些實施例中，經修飾之5'-UTR之位置2處的核苷酸取代為U-＞C取代。

在一些實施例中，如本文所揭示之核酸分子包括經修飾之α病毒基因體或複製子RNA，其中經修飾之α病毒基因體或複製子RNA包含與本文所揭示之5'-UTR中之至少一者之核酸序列展示至少80%序列一致性之5'-UTR及5'-UTR之位置2處之U-＞G取代，且其中經修飾之α病毒基因體或複製子RNA不含編碼病毒結構蛋白之序列的至少一部分。在一些實施例中，經修飾之α病毒基因體或複製子RNA包含與SEQ ID NO:26-42中所闡述之序列中之至少一者展現至少80%序列一致性之5'-UTR。在一些實施例中，經修飾之α病毒基因體或複製子RNA包含與SEQ ID NO:26-42中所闡述之序列中之至少一者展示至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之5'-UTR。在一些實施例中，經修飾之α病毒基因體或複製子RNA包含與序列表之SEQ ID NO:26-42中所闡述之序列中之至少一者展現100%序列一致性之5'-UTR。

在本文所揭示之各種實施例中，本文所揭示之核酸分子可包括以下特徵中之一或多者。在一些實施例中，經修飾之複製子RNA為經修飾之α病毒複製子RNA。在一些實施例中，經修飾之α病毒複製子RNA包括經修飾之α病毒基因體。在一些實施例中，經修飾之5'-UTR包括位置1、2、4處之一或多個核苷酸取代或其組合。在某些實施例中，至少一個核苷酸取代為在經修飾之5'-UTR之位置2處的核苷酸取代。在一些具體實施例中，經修飾之5'-UTR之位置2處的核苷酸取代為U-＞G取代。

在一個實施例中，本文揭示之核酸分子為包含經修飾之5'-UTR且不含編碼病毒結構蛋白之核酸序列之至少一部分的經修飾之複製子RNA。在另一實施例中，經修飾之5'-UTR包含位置1、2、4處之一或多個核苷酸取代或其組合。在另一實施例中，經修飾之5'-UTR之位置2處的核苷酸取代為U-＞G取代。在另一實施例中，複製子RNA包含一或多個表現卡匣，其中表現卡匣中之各者包含可操作地連接至異源核酸序列之啟動子。在一個實施例中，經修飾之複製子RNA(a)展現與SEQ ID NO:25之核酸序列至少80%序列一致性，其中經修飾之複製子RNA包含5'-非轉譯區(5'-UTR)之位置2處之U-＞G取代且不含編碼病毒結構蛋白之序列之至少一部分；或(b)包含5'-UTR，其展現與SEQ ID NO:26至42中之至少一者之核酸序列之至少80%序列一致性及5'-UTR之位置2之U-＞G取代，且其中經修飾之複製子RNA不含編碼病毒結構蛋白之序列之至少一部分。

一些病毒具有能夠形成一或多個調節(例如提高)衣殼基因表現之莖環結構的序列。術語「病毒衣殼強化子」係在本文中用於指代包含能夠形成此類莖環結構之序列的調控元件。在一些實例中，莖環結構係藉由衣殼蛋白質之編碼序列內且稱為下游環(DLP)序列之序列形成。如本文所揭示，此等莖環結構或其變體可用於調節(例如增加)相關基因之表現量。舉例而言，此等莖環結構或其變體可用於重組載體(例如在異源病毒基因體中)中以用於增強可操作地將下游連接於其上之編碼序列之轉錄及/或轉譯。作為一實例，α病毒屬之成員可藉助於病毒26S轉錄物內存在之顯著RNA結構抵抗抗病毒RNA活化蛋白激酶(PKR)之活化，其允許此等mRNA之eIF2非依賴性轉譯起始。稱為下游環(DLP)之此結構位於SINV 26S mRNA中之AUG下游及α病毒屬之其他成分中。在辛得比斯病毒之情況下，DLP基元發現於第一約150 nt辛得比斯亞基因體RNA中。髮夾結構位於辛得比斯衣殼AUG起始密碼子下游(AUG在辛得比斯亞基因體RNA之nt 50處排序)。序列比較及結構RNA分析之先前研究揭露DLP在SINV中之進化保留，且預測α病毒屬之許多成分中存在等效DLP結構(參見例如Ventoso, J. Virol. 9484-9494，第86卷，2012年9月)。

PKR使真核轉譯起始因子2α(eIF2 α)磷酸化。eIF2 α之磷酸化阻斷mRNA之轉譯起始且藉此使得病毒完成富有成效的複製循環。 PKR藉由干擾素及雙股RNA活化。已知宿主細胞中之α病毒複製誘導雙股RNA依賴性蛋白激酶(PKR)。舉例而言，細胞之辛得比斯病毒感染誘導使得eIF2 α磷酸化的PKR，而病毒亞基因體mRNA經有效轉譯，同時所有其他細胞mRNA之轉譯受到限制。辛得比斯病毒之亞基因體mRNA具有位於病毒衣殼蛋白之野生型AUG引發密碼子下游的穩定RNA髮夾結構環(例如衣殼強化子)。此髮夾結構環(亦稱為莖環)，RNA結構，通常稱為下游環結構(或DLP基元)。已報導DLP結構可在野生型AUG上暫停核糖體且此支持亞基因體mRNA之轉譯而無需功能性eIF2 α。因此，即使在具有使得eIF2α完全磷酸化之細胞中，辛得比斯病毒(SINV)以及其他α病毒之亞基因體mRNA仍有效轉譯。

DLP結構首先表徵於辛得比斯病毒(SINV) 26S mRNA中且亦在勝利基森林病毒(SFV)中偵測。已報導類似DLP結構存在於包括新世界(例如，MAYV、UNAV、EEEV(NA)、EEEV(SA)、AURAV)及舊世界(SV、SFV、BEBV、RRV、SAG、GETV、MIDV、CHIKV及ONNV)成分之α病毒屬之至少14個其他成分中。此等α病毒26S mRNA之預測結構基於SHAPE(選擇性2' -羥基醯化及引子延伸)資料構築(Toribio等人,Nucleic Acids Res. 5月19日; 44(9):4368-80, 2016)，其內容以引用的方式併入本文中。在除CHIKV及ONNV外之所有情況下偵測穩定莖環結構，而MAYV及EEEV顯示更低穩定性之DLP(Toribio等人，2016同前文獻)。報導含有最穩定之DLP結構的彼等α病毒之最高DLP活性。在一些情況下，DLP活性取決於DLP基元與起始密碼子AUG(AUGi)之間的距離。以允許將AUGi置放於藉由DLP停止之40S亞單元的P位點中的方式，將α病毒26S mRNA中之AUG-DLP間隔調整至核糖體18S rRNA之ES6S區域的拓樸結構，從而允許在不參與eIF2的情況下併入Met-tRNA。偵測到兩種主要拓樸結構：SFV分枝系中之緊湊及穩定結構，及SINV群組中之更多延伸結構。在兩種情況下，觀察到DLP結構之前為密集SHAPE反應性之區域，表明AUG-DLP延伸之單股構形。因此，此區域展示高含量之A及低含量之G，當與在整個小鼠mRNA轉錄組中或在缺乏DLP之彼等α病毒mRNA中之等效位置相比較時，其產生低傾向形成二級結構。由Toribio等人報告之此等結果(2016，同前文獻)表明DLP在α病毒中之出現很可能與先前區域之平坦化有關，產生用於mRNA之此區域的閥-峰拓樸結構。

在辛得比斯病毒之情況下，DLP基元發現於第一約150 nt辛得比斯亞基因體RNA中。髮夾結構位於辛得比斯衣殼AUG起始密碼子(辛得比斯亞基因體RNA之nt 50處之AUG)下游且使得核糖體停止以使得正確衣殼基因AUG用於起始轉譯。此係因為髮夾結構使核糖體暫停eIF2α而不需要支持轉譯起始。不受任何特定理論束縛，咸信將DLP基元置放在任何GOI之編碼序列上游通常產生在髮夾結構區中編碼之N端衣殼胺基酸與GOI編碼蛋白之融合蛋白，因為在衣殼AUG而非GOI AUG上起始發生。在本文所揭示之一些實施例中，豬鐵士古病毒屬-1 2A(P2A)肽序列緊接在DLP序列之後框內且緊接在所有GOI上游框內工程改造。將P2A肽併入本發明之經修飾之病毒RNA複製子中允許自衣殼-GOI融合物釋放幾乎原始GOI蛋白；將單脯胺酸殘基添加至所有GOI蛋白中。

不受任何特定理論束縛，咸信DLP允許轉譯以eIF2α非依賴性方式發生，經工程改造以使用其引發非結構蛋白之轉譯的核酸分子及表現載體(例如RNA複製子載體)在先天性免疫系統活化之細胞中具有增加之功能性。因此，預期經DLP工程改造之核酸分子及表現載體(例如RNA複製子載體)在不同細胞、個人或個人群體中亦用較高均勻性起作用，因為各體內之先天性免疫活化水準之差異將自然引起變化。在一些實施例中，DLP可幫助移除彼變化性，因為RNA複製子載體之轉譯及複製(以及GOI表現)可受預先存在之先天性免疫反應影響較小。本文所揭示之組合物及方法之顯著價值之一為疫苗功效可在處於慢性或急性免疫活化狀態之個人中提高。可在患有亞臨床或臨床感染之個人或進行針對癌症或其他疾病(例如，糖尿病、營養不良、高血壓、心臟病、克羅恩氏病(Crohn's disease)、肌肉硬化症等)之醫學治療的個人中發現慢性或急性免疫活化之原因。

如本文所描述，本文所揭示之含DLP之核酸分子(例如，轉錄及表現載體(例如，RNA病毒複製子))可適用於賦予個體之先天性免疫系統抗性。未經修飾之RNA複製子對將其引入至其中之細胞的初始先天性免疫系統狀態敏感。若細胞/個人處於高度活性先天性免疫系統狀態下，則RNA複製子效能(例如GOI之複製及表現)可受不利影響。藉由工程改造DLP以控制蛋白質轉譯，尤其非結構蛋白質之起始，移除或減輕影響高效RNA複製子複製之先天性免疫系統之預先存在之活化狀態的效果。結果為可影響治療之疫苗療效或治療效果之GOI之較均一及/或增強之表現。

由於先天性免疫活化可由於許多不同刺激而發生，因此依賴於用以表現抗原或治療性GOI之自我擴增RNA複製子之疫苗方法可不利地受與eIF2α之PKR磷酸化相關之整體宿主蛋白關閉影響。在其中抑制宿主蛋白轉譯之細胞環境中起作用之工程改造RNA複製子將提供具有優於標準RNA複製子系統之顯著優勢的彼等系統。

因此，受先天性免疫反應不利影響之RNA複製子系統，諸如源於α病毒及動脈炎病毒之系統，在經工程改造以含有DLP基元時，可在表現其編碼之GOI方面更有效。 DLP基元在其中細胞mRNA轉譯受到抑制之細胞環境中賦予有效mRNA轉譯。當DLP與複製子載體非結構蛋白基因之轉譯有關時，複製酶及轉錄酶蛋白質能夠在PKR活化細胞環境中起始功能性複製。當DLP與亞基因體之轉譯相關時，即使當細胞mRNA由於先天性免疫活化而受限時，穩定GOI表現亦為可能的。因此，含有DLP結構以幫助驅動非結構蛋白基因及亞基因體mRNA兩者之轉譯的工程改造複製子提供克服先天性免疫活化之又一強大方式。

本發明之一些實施例係關於已經工程改造以支持源於兩種不同病毒(委內瑞拉馬腦炎病毒(VEEV)及馬動脈炎病毒(EAV))之複製子載體之病毒非結構基因轉譯的DLP結構，由此將先天性免疫反應逃逸傳達至系統。如下文更詳細地描述，將DLP結構併入至使其對干擾素(IFN)治療具有抗性且亦出乎意料地引起GOI表現潛能之總體增加的複製子載體中。藉由將DLP工程改造至RNA複製子系統中賦予之IFN抗性及優良蛋白表現潛力之組合使其適用於其中偶然或長期存在先天性免疫活化之個人或群體。

本發明之一些態樣係關於核酸分子，諸如合成或重組核酸分子，其包括一或多個DLP基元、一或多個DLP基元之編碼序列或其組合。在一些實施例中，本發明之核酸分子可包括可操作地將相關基因(GOI)連接至DLP基元之編碼序列及/或用於DLP基元之編碼序列。

在一個態樣中，本文揭示一種核酸分子，其包含(i)編碼病毒衣殼強化子或其變體之一或多個結構元素的第一核酸序列及(ii)可操作地連接至第一核酸序列之第二核酸序列，其中該第二核酸序列包含相關基因(GOI)之編碼序列。在一些實施例中，病毒衣殼強化子之一或多種結構元素中之至少一者包含一或多個RNA莖環。在一些實施例中，一或多個RNA莖環中之至少一者由第一核酸序列中存在之DLP基元包含。在一些實施例中，病毒衣殼強化子之一或多種結構元素中之至少一者不包含任何RNA莖環。

如上文所描述，病毒衣殼強化子包含在5'非編碼序列及/或5'編碼序列(較佳5'編碼序列)內增強與其可操作地連接之序列之表現(例如轉錄及/或轉譯)的序列。在本發明之一些實施例中，病毒衣殼強化子之一或多種結構元素包括病毒衣殼強化子之一或兩個RNA莖環。在一些實施例中，本發明之病毒衣殼強化子包括含有26S亞基因體啟動子之序列。在一些實施例中，本發明之病毒衣殼強化子含有以病毒26S RNA之約20至250個核苷酸、約20至200個核苷酸、約20至150個核苷酸、約20至100個核苷酸、或約50至250個核苷酸、約100至250個核苷酸、約50至200個核苷酸、約75至250個核苷酸、約75至200個核苷酸、約75至150個核苷酸、約77至139個核苷酸、或約100至250個核苷酸、約150至250個核苷酸、約100至150個核苷酸、約100至200個核苷酸之5'編碼序列，其可形成髮夾結構。在一些實施例中，編碼病毒衣殼強化子之一或多個結構元素之第一核酸序列對於增強可操作地連接於其上之異源序列之表現至關重要。在一些實施例中，第一核酸序列包括病毒衣殼強化子之一或多個RNA莖環的編碼序列。在一些實施例中，編碼病毒衣殼強化子之一或多個結構元素之第一核酸序列對於增強可操作地連接於其上之異源序列的轉譯至關重要。在一些實施例中，編碼病毒衣殼強化子之一或多個結構元素之第一核酸序列對於增強可操作地連接於其上之異源序列的轉錄至關重要。

在一些實施例中，核酸分子之第一核酸序列包括來自病毒衣殼蛋白之5'編碼序列的至少約50、約75、約100、約150、約200、約300或更多個核苷酸。在一些實施例中，核酸分子之第一核酸序列包括來自病毒衣殼蛋白之5'編碼序列之約50、約75、約100、約150、約200、約300或更多個或在此等值中之任兩者之間的範圍內的核苷酸。在一些實施例中，病毒衣殼強化子為源於選自由以下組成之群的α病毒物種的衣殼基因：東部馬腦炎病毒(EEEV)、委內瑞拉馬腦炎病毒(VEEV)、沼澤地病毒(EVEV)、穆坎布病毒(MUCV)、勝利基森林病毒(SFV)、皮春納病毒(PIXV)、米德爾堡病毒(MIDV)、屈公病毒(CHIKV)、奧-奈氏病毒(ONNV)、羅斯河病毒(RRV)、巴馬森林病毒(BF)、蓋塔病毒(GET)、鷺山病毒(SAGV)、貝巴魯病毒(BEBV)、馬雅羅病毒(MAYV)、烏納病毒(UNAV)、辛得比斯病毒(SINV)、奧拉病毒(AURAV)、沃達羅河病毒(WHAV)、巴班基病毒(BABV)、克孜拉格赫病毒(KYZV)、西部馬腦炎病毒(WEEV)、高地J病毒(HJV)、摩根堡病毒(FMV)、恩杜穆(NDUV)及車溪病毒。在一些實施例中，病毒衣殼強化子源於辛得比斯病毒物種或勝利基森林病毒物種之衣殼基因。在一些特定實施例中，病毒衣殼強化子源於辛得比斯病毒物種之衣殼基因。另外，一般熟習此項技術者應瞭解，可在來自病毒衣殼蛋白之5'編碼序列中進行修飾而不實質上降低其增強活性。就此而言，可在例如以下中找到更多資訊： Frolov等人, J. Virology 70:1182, 1994；Frolov等人, J. Virology 68:8111, 1994。在一些實施例中，對於此類突變，實質上保留由5'衣殼編碼序列形成之RNA髮夾結構可為有利的。

在一些實施例中，本文揭示之病毒衣殼強化子不含有處於髮夾結構上游之衣殼蛋白之5'鹼基編碼序列中之一或多者或全部。在一些實施例中，本文揭示之病毒衣殼強化子不含有處於髮夾結構上游之病毒衣殼蛋白之全部5'編碼序列。在一些實施例中，病毒衣殼強化子序列可編碼全部或部分衣殼蛋白。因此，在本文所揭示之一些實施例中，衣殼強化子區域將不編碼整個病毒衣殼蛋白。在一些實施例中，病毒衣殼強化子序列編碼來自病毒衣殼蛋白質之胺基端片段。在其他功能性衣殼蛋白由衣殼強化子序列編碼之彼等實施例中，可能需要剝蝕衣殼自我蛋白酶活性。降低或消除衣殼蛋白之自我蛋白酶活性之衣殼突變為此項技術中已知的(參見例如WO1996/37616)。另外或置換地，衣殼蛋白中之胺基酸殘基中之一或多者可經改變以減少衣殼蛋白酶活性。

如上所指出，序列比較及結構RNA分析之先前研究揭示在α病毒屬之許多成分中之DLP基元之進化保留(參見例如Ventoso, 2012同前文獻)。因此，在一些其他實施例中，本發明之病毒衣殼強化子序列可具有可在功能上或結構上等效於一或多個經預測用於病毒衣殼強化子之RNA莖環的任何其他變異序列，諸如合成序列或異源序列，且其可用以增強可操作地連接至其下游之RNA序列(例如，相關基因之編碼序列)之轉譯。在一些實施例中，本發明之核酸分子包括α病毒衣殼強化子，其源於如辛得比斯病毒(SINV；NC 001547.1)、奧拉病毒(AURAV；AF126284)、屈公病毒(CHIKV；NC 004162)、奧-奈氏病毒(ONNV；NC 001512)、東部馬腦炎病毒(EEEV(SA)；AF159559及EEEV (NA)；U01558)、馬雅羅病毒(MAYV；DQ001069)、勝利基森林病毒(SFV；NC 003215)、羅斯河病毒(RRV；DQ226993)及鷺山病毒(SAGV；AB032553)、蓋塔病毒(GETV；NC 006558)、米德爾堡病毒(MIDV；EF536323)、烏納病毒(UNAV、AF33948)或貝巴魯病毒(BEBV；AF339480)，如Toribio等人, 2016同前文獻中所描述，其內容或其變體特此以全文引用之方式併入。

與本文揭示之病毒衣殼強化子之編碼序列具有高度序列一致性(例如至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性)之核酸分子可藉由使用以下鑑別及/或分離：本文所描述之序列(例如SEQ ID NO:43)或如此項技術中已知之任何其他α病毒衣殼蛋白，舉例而言，藉由使用以下之序列：辛得比斯病毒(SINV；NC 001547.1)、奧拉病毒(AURAV；AF126284)、屈公病毒(CHIKV；NC 004162)、奧-奈氏病毒(ONNV；NC 001512)、東部馬腦炎病毒(EEEV(SA)；AF159559及EEEV (NA)；U01558)、馬雅羅病毒(MAYV；DQ001069)、勝利基森林病毒(SFV；NC 003215)、羅斯河病毒(RRV；DQ226993)及鷺山病毒(SAGV；AB032553)、蓋塔病毒(GETV；NC 006558)、米德爾堡病毒(MIDV；EF536323)、烏納病毒(UNAV；AF33948)及貝巴魯病毒(BEBV；AF339480)，藉由來自個別α病毒基因體中鑑別之序列的基因體序列分析、雜交及/或與簡併引子或基因-特異性引子的PCR。舉例而言，病毒衣殼強化子可包含或由來自屬於披膜病毒科(例如α病毒物種或風疹病毒屬物種)之病毒物種的DLP基元組成。在一些實施例中，本發明之核酸分子包括具有與病毒衣殼蛋白之5'CDS部分展現至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之核酸序列的α病毒衣殼強化子。在一些實施例中，α病毒衣殼蛋白之5'CDS部分包含α病毒衣殼蛋白之編碼序列之至少前25、50、75、80、100、150或200個核苷酸。在一些實施例中，本發明之核酸分子包括具有與SEQ ID NO:43-50中之任一者之核酸序列展現至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之核酸序列的病毒衣殼強化子。在一些實施例中，核酸分子包含病毒衣殼強化子，其具有與SEQ ID NO:43-50中之任一者之核酸序列展現80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或在此等值中之任兩者之間的範圍內的序列一致性之核酸序列。在一些實施例中，本發明之核酸分子包括病毒衣殼強化子，其具有與本文所揭示之SEQ ID NO:43之序列展現至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之核酸序列。在一些實施例中，本發明之核酸分子包括病毒衣殼強化子，其具有與由Toribio等人之公開案(2016，同前文獻)中所描述之序列中之任一者展現至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的核酸序列，其內容以全文引用之方式併入本文中。

因此，在一些實施例中，本發明之核酸分子包括具有與本文中所揭示之SEQ ID NO:44-50中之任一者之序列展現至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之核酸序列的病毒衣殼強化子。在一些實施例中，本發明之核酸分子包括病毒衣殼強化子，其具有與本文揭示之SEQ ID NO:44中所闡述之序列展現至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之核酸序列。在一些實施例中，本發明之核酸分子包括病毒衣殼強化子，其具有與本文所揭示之SEQ ID NO:45中所闡述之序列展現至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之核酸序列。在一些實施例中，本發明之核酸分子包括具有與本文所揭示之SEQ ID NO:46中所闡述之序列展現至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之核酸序列的病毒衣殼強化子。在一些實施例中，本發明之核酸分子包括具有與本文揭示之SEQ ID NO:47中所闡述之序列展現至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之核酸序列的病毒衣殼強化子。在一些實施例中，本發明之核酸分子包括具有與本文所揭示之SEQ ID NO:48中所闡述之序列展現至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之核酸序列的病毒衣殼強化子。在一些實施例中，本發明之核酸分子包括具有與本文揭示之SEQ ID NO:49中所闡述之序列展現至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之核酸序列的病毒衣殼強化子。在一些實施例中，本發明之核酸分子包括具有與本文所揭示之SEQ ID NO:50中所闡述之序列展現至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之核酸序列的病毒衣殼強化子。

在根據本發明之一些實施例之核酸分子中，一或多個RNA莖環可操作地安置於用於第二核酸序列之GOI之編碼序列上游。在一些實施例中，一或多個RNA莖環可操作地安置於GOI之編碼序列上游約1至約50個核苷酸、約10至約75個核苷酸、約30至約100個核苷酸、約40至約150個核苷酸、約50至約200個核苷酸、約60至約250個核苷酸、約100至約300個核苷酸或約150至約500個核苷酸處。在一些實施例中，一或多個RNA莖環可操作地安置於GOI之編碼序列上游約1、約2、約5、約10、約15、約20、約25、約30、約40、約50、約60、約70、約80、約90、約100、約200、約300、約400、約500或在此等值中之任兩者之間的範圍內的核苷酸處。在一些實施例中，一或多個RNA莖環可操作地緊密安置於GOI之編碼序列上游。

在一些實施例中，本發明之核酸分子進一步包括用於自我蛋白酶肽(例如自催化自裂解肽)之編碼序列，其中自我蛋白酶之編碼序列視情況可操作地將上游連接至第二核酸序列。一般而言，可將此項技術中已知之任何蛋白水解裂解位點併入本發明之核酸分子中，且可為例如藉由蛋白酶在產生後裂解之蛋白水解裂解序列。其他適合之蛋白水解裂解位點亦包括可在添加外部蛋白酶之後裂解之蛋白水解裂解序列。如本文所用，術語「自我蛋白酶」係指具有自我蛋白分解活性且能夠自較大多肽部分自身裂解之「自裂解」肽。首先在口蹄疫(FMDV)，小核糖核酸病毒群之成員中鑑別，隨後已鑑別數種自我蛋白酶，諸如來自馬鼻炎A病毒(E2A)、豬鐵士古病毒屬-1(P2A)及明脈扁刺蛾病毒(T2A)之「2A類」肽，且其在蛋白水解裂解中之活性已經展示於各種活體外及活體內真核系統中。因此，在已鑑別出許多天然存在之自我蛋白酶系統之情況下，熟習此項技術者可瞭解自我蛋白酶之概念。經良好研究之自我蛋白酶系統為例如病毒蛋白酶、發育蛋白(例如HetR、刺蝟蛋白)、RumA自我蛋白酶域、UmuD等。適合於本發明之組合物及方法之自我蛋白酶肽之非限制性實例包括來自以下之肽序列：豬鐵士古病毒-1 2A(P2A)、口蹄疫病毒(FMDV) 2A(F2A)、馬鼻炎A病毒(ERAV) 2A(E2A)、明脈扁刺蛾病毒2A(T2A)、細胞質多角體病毒2A(BmCPV2A)、軟化病病毒2A(BmIFV2A)或其組合。

在一些實施例中，自我蛋白酶肽之編碼序列將下游可操作地連接至第一核酸序列且將上游可操作地連接至第二核酸序列。在一些實施例中，自我蛋白酶肽包含或由以下組成：選自由以下組成之群的肽序列：豬鐵士古病毒-1 2A(P2A)、口蹄疫病毒(FMDV) 2A(F2A)、馬鼻炎A病毒(ERAV) 2A(E2A)、明脈扁刺蛾病毒2A(T2A)、細胞質多角體病毒2A(BmCPV2A)、軟化病病毒2A(BmIFV2A)及其組合。在一些實施例中，自我蛋白酶肽包括豬鐵士古病毒屬-1 2A(P2A)之肽序列。

熟習此項技術者應瞭解，可採用病毒衣殼強化子序列、編碼自我蛋白酶肽之序列及編碼相關基因之序列之不同組態，只要衣殼強化子序列增強異源核酸序列(例如，GOI之編碼序列)之表現即可，如與在不存在衣殼強化子序列之情況下所見之水準相比較。此等序列將通常經組態以使得由相關基因編碼之多肽可在由自我蛋白酶裂解之後自我蛋白酶及任何衣殼蛋白序列釋放。

不受任何特定理論束縛，咸信在一些實施例中，病毒DLP基元之轉譯增強活性可視病毒DLP基元與起始AUGi密碼子之間的距離而定(Toribio等人，2016同前文獻)。因此，在一些實施例中，第一核酸序列可操作地定位於經修飾之病毒RNA複製子之起始密碼子AUGi下游約10至100個核苷酸之區域中。在一些實施例中，第一核酸序列可操作地定位於經修飾之病毒RNA複製子之起始密碼子AUGi下游約10至75、約10至50、約10至25、15至75、約15至50、約15至25、約25至75、約25至50、約25至100個核苷酸之區域內。在一些實施例中，第一核酸序列可操作地安置於經修飾之病毒RNA複製子之起始密碼子AUGi下游約25、28、31、34、37、37、40、43、46、49、50或在此等值中之任兩者之間的範圍內的核苷酸之區域內。

在一些實施例中，如本文所揭示之核酸分子可進一步包含編碼第二病毒衣殼強化子(例如DLP基元)之一或多個結構元素之第三核酸序列，其中該第三核酸序列將上游可操作地連接至GOI之編碼序列。第二DLP基元可與安置於非結構蛋白質之編碼序列上游之第一DLP基元相同或可不同。因此，在一些實施例中，第二DLP基元與安置於非結構蛋白質之編碼序列上游之第一DLP基元相同。在一些實施例中，第二DLP基元與安置於非結構蛋白質之編碼序列上游之第一DLP基元不同。

在其中引入之核酸分子為載體，諸如RNA複製子之一些實施例中，可產生包括將相關基因之編碼序列可操作地連接至一或多個DLP基元之新mRNA複本。一旦將含DLP載體或複製子引入至細胞中，將一或多個DLP基元併入載體(例如RNA複製子)中可隨後賦予基因表現預期之增強。

在一個實施例中，本發明為一種核酸分子，其包含：編碼病毒衣殼強化子之一或多個RNA莖環或其變體之第一核酸序列；及可操作地連接至第一核酸序列之第二核酸序列，其中該第二核酸序列包含相關基因(GOI)之編碼序列。在另一態樣中，第一核酸序列將上游可操作地連接至GOI之編碼序列。在另一態樣中，核酸分子進一步包含將上游可操作地連接至第二核酸序列之自我蛋白酶肽之編碼序列；該自我蛋白酶肽之編碼序列將下游可操作地連接至第一核酸序列且將上游可操作地連接至第二核酸序列；且自我蛋白酶肽包含選自由以下組成之群的肽序列：豬鐵士古病毒-1 2A(P2A)、口蹄疫病毒(FMDV) 2A(F2A)、馬鼻炎A病毒(ERAV) 2A(E2A)、明脈扁刺蛾病毒2A(T2A)、細胞質多角體病毒2A(BmCPV2A)、軟化病病毒2A(BmIFV2A)及其組合。在另一態樣中，病毒衣殼強化子源於屬於披膜病毒科之病毒物種之衣殼基因，其中病毒衣殼強化子包含病毒物種之下游環(DLP)基元，且DLP基元包含一或多個RNA莖環中之至少一者。在另一態樣中，病毒衣殼強化子包含與SEQ ID NO:43-50中之至少一者展現至少80%序列一致性之核酸序列。在另一態樣中，核酸分子進一步包含編碼第二病毒衣殼強化子之一或多個RNA莖環或其變體之第三核酸序列；及可操作地連接至第三核酸序列之第四核酸序列，其中第四核酸序列包含第二相關基因(GOI)之編碼序列。核酸分子可為信使RNA(mRNA)分子或RNA複製子。在另一態樣中，核酸分子包含編碼經修飾之病毒RNA複製子之核酸序列，其中經修飾之病毒RNA複製子包含：編碼病毒衣殼強化子或其變體之一或多個結構元素之第一核酸序列，其中病毒衣殼強化子源於第一病毒物種，及源於編碼至少一個非結構病毒蛋白或其部分之第二病毒物種的第二核酸序列，其中第一核酸序列可操作地連接至第二核酸序列之上游。病毒衣殼強化子包含第一病毒物種之下游環(DLP)基元，且其中DLP基元包含一或多個RNA莖環中之至少一者。病毒衣殼強化子包含與SEQ ID NO:43-50中之至少一者展現至少80%序列一致性之核酸序列。

在一些實施例中，適用於本發明之RNA複製子含有編碼異源蛋白或肽，諸如HBV抗原之RNA子序列，及編碼源於新的世界α病毒nsP1、nsP2及nsP4蛋白之胺基酸序列的RNA子序列。複製子亦具有編碼源於α病毒nsP3宏域之胺基酸序列的RNA子序列，及編碼源於α病毒nsP3中心域之胺基酸序列的RNA子序列。本發明之RNA複製子亦可具有編碼完全源於舊世界α病毒nsP3高變域之胺基酸序列的RNA子序列；或可具有胺基酸序列，該胺基酸序列具有源於新世界α病毒nsP3高變域之一部分及源於舊世界α病毒nsP3高變域之一部分。亦即HVD可為雜交或嵌合的新世界/舊世界序列。

由複製子編碼之nsP1、nsP2、nsP3及nsP4蛋白為功能性或生物活性蛋白。本發明之RNA複製子亦可編碼3'非轉譯區(UTR)及5'UTR，該等UTR可為α病毒3'及5'UTR。 RNA複製子亦可編碼控制元素(例如一或多個亞基因體啟動子)及多聚腺苷酸尾。編碼異源蛋白質或肽之啟動子、5'及/或3'UTR及RNA子序列可以操作地連接以使得複製子RNA自我放大且異源蛋白質或肽在生物體中表現。

本發明人發現，出人意料地，在源於新世界α病毒基因體之RNA複製子中，若編碼nsP3蛋白之RNA之至少一部分經編碼源於舊世界α病毒(OW)之nsP3之至少一部分的RNA取代，則哺乳動物中對在複製子中編碼之異源蛋白或肽的免疫原性顯著減少或消除。因此，在複製子之一些實施例中，nsP3宏域及中心域可源於新世界α病毒序列，而HVD a)係源於舊世界α病毒HVD序列，或b)具有源於舊世界α病毒HVD序列之部分及源於新世界α病毒HVD序列之部分。

在另一實施例中，宏及中心域係源於舊世界α病毒宏及中心域序列，且HVD a)係源於舊世界α病毒HVD序列，或b)具有源於舊世界α病毒HVD序列之一部分及源於新世界α病毒HVD序列之一部分。

在另一實施例中，宏域源於新世界α病毒宏域序列，中心域源於舊世界α病毒中心域序列，且HVD a)係源於舊世界α病毒HVD序列，或b)具有源於舊世界α病毒HVD序列之一部分及源於新世界α病毒HVD序列之一部分。

在另一實施例中，宏域源於舊世界α病毒宏域序列，中心域源於新世界α病毒中心域序列，且HVD a)係源於舊世界α病毒HVD序列，或b)具有源於舊世界α病毒HVD序列之一部分及源於新世界α病毒HVD序列之一部分。

在一些實施例中，複製子編碼HVD，其為具有源於新世界α病毒HVD序列之部分及源於舊世界HVD序列之部分的雜交或嵌合新世界/舊世界序列。在各種實施例中，舊世界部分可為至少5個或至少10個或至少15個或至少20個或至少25個或至少30個或至少52個或至少53個或至少75個或至少100個或至少125個或至少150個或至少175個或至少200個胺基酸。部分一起可包含長度與野生型舊世界或新世界α病毒HVD序列相同的HVD，或可為比野生型舊世界或新世界α病毒HVD序列短至多10個或至多20個或至多30個胺基酸；或可為比野生型舊世界或新世界α病毒HVD序列長至多10個或至多20個或至多30個或至多40個或至多50個或至多60個或至多70個或至多80個或至多90個或至多100個胺基酸。

在一些實施例中，HVD之N端部分可源於新世界nsP3 HVD序列，且HVD之C端胺基酸可源於野生型OW α病毒HVD胺基酸序列，例如至少5或至少10或至少15或至少20或至少25或至少30或至少31或至少32或至少33或至少34或至少35或35-55或35-65或至少40或至少45或至少50或至少52或至少53或至少60或至少70或至少80或至少100或至少125或至少150或至少175個。HVD之C端胺基酸可為源於OW HVD之胺基酸(且視情況與其對應)的胺基酸序列；在此等實施例中之任一者中，HVD之長度亦可小於200個或小於175個或小於150個或小於125個或小於100個或小於80個胺基酸。在其他實施例中，C端胺基酸可保留自NW α病毒C端HVD序列，諸如端1-5或5或5-10或10-12或10-13或10-15或15-20個胺基酸，而其餘的C端胺基酸可源於如所描述之OW α病毒HVD。

在本文所描述之任一實施例中，新世界α病毒可為VEEV或EEEV或WEEV或本文所描述之任何新世界α病毒，且舊世界α病毒可為CHIKV、SINV或SFV或本文所描述之任何舊世界α病毒。新世界及舊世界α病毒可以任何組合用於本發明中，且如同本文中充分闡述，揭示所有可能的組合及子組合。

α病毒在病毒之第IV組披膜病毒科中進行分類。此等病毒攜帶正義單股RNA基因體，其通常在11 kb-12 kb範圍內。本發明之α病毒複製子之長度可為11 kb-12 kb，或長度為10-13 kb、或7-20 kb或7-25 kb，且可具有5'帽及3'多聚腺苷酸尾，其可為α病毒5'帽及3'多聚腺苷酸尾。5'帽可為熟習此項技術者已知的，例如，7-甲基鳥苷酸帽或抗-反帽類似物3'-O-Me-m7G(5')ppp(5')G或另一類似物帽結構。其通常為包膜病毒且形狀為球形，具有約70 nm之直徑。其亦可具有等角核衣殼。可在單個RNA片段上編碼複製子。α病毒基因體及複製子具有兩個開放閱讀框架(ORF)，非結構性及結構性。基因體之非結構性部分編碼蛋白質nsP1-nsP4，其在病毒RNA之轉錄及複製中起作用且以聚合蛋白形式產生且為病毒複製機制。但複製子可具有一個或兩個或更多個開放閱讀框架。本發明之α病毒複製子中之任一者可缺乏或不包含或不包含於以下中或與以下相關：衣殼、核衣殼、鞘蛋白或核蛋白。α病毒複製子可為RNA分子。

基因體之結構性部分編碼核心核衣殼蛋白C、包膜蛋白P62及作為異二聚體締合之E1。本發明之RNA複製子可具有α病毒之所描述特徵中之任何一或多者。在一些實施例中，本發明之RNA複製子缺乏編碼α病毒結構蛋白之序列；或不編碼α病毒(或視情況存在之任何其他)結構蛋白。在一些實施例中，本發明之RNA複製子不編碼蛋白質C、P62、6K及E1中之任何一或多者，包括如本文中充分闡述之所有組合及子組合。在一些實施例中，本發明之RNA複製子不編碼蛋白質C、P62、6K及E1中之任一者。

α病毒科之地理分離可為此等病毒演化及適應其獨特環境之因素。循環α病毒血清-複合物可進一步分類為舊世界或新世界α病毒。舊世界及新世界α病毒具有可用於如本文所描述之本發明中之序列。新世界α病毒包括任何新世界α病毒，例如東部馬腦炎病毒(EEEV)、委內瑞拉馬腦炎病毒(VEEV)、西部馬腦炎病毒(WEEV)、摩根堡病毒(FMV)、高地J病毒(HJV)、車溪病毒(BCRV)、穆坎布病毒(MUCV)及皮春納病毒(PIXV)。舊世界α病毒包括任何舊世界α病毒，例如辛得比斯病毒(SIN)、勝利基森林病毒(SFV)、屈公病毒(CHIKV)、貝巴魯病毒(BEBV)、奧-奈氏病毒(ONNV)、羅斯河病毒(RRV)、鷺山病毒(SAGV)、蓋塔病毒(GET)、米德爾堡病毒(MIDV)、恩杜穆(NDUV)、巴馬森林病毒(BFV)、馬雅羅病毒(MAYV)、奧拉病毒(AURA)、烏納病毒(UNAV)、沃達羅河病毒、巴班基病毒及克孜拉格赫病毒。新世界及舊世界α病毒及其序列可以任何組合或子組合用於本發明之RNA複製子中，且揭示於所有可能組合及子組合中，如同本文中充分闡述一般。

本發明之RNA複製子可源於α病毒基因體，意謂其具有α病毒基因體之一些結構性特徵，或與其類似。本發明之RNA複製子可為經修飾之α病毒基因體。在本文所揭示之複製子之一些實施例中，複製子之一或多個序列可以「反式」提供複製子，亦即複製子之序列提供於超過一個RNA分子上。在其他實施例中，複製子之所有序列存在於單一RNA分子上，其亦可投與如本文所描述之待治療之哺乳動物。

本發明之RNA複製子可含有來自以下之RNA序列(或由以下編碼之胺基酸序列)：野生型新世界或舊世界α病毒基因體。本文所揭示之本發明之RNA複製子中之任一者可含有「源於」或「基於」野生型α病毒基因體序列之RNA序列，意謂其具有與來自野生型RNA α病毒基因體(其可為新世界或舊世界α病毒基因體)之RNA序列(其可為對應RNA序列)至少60%或至少65%或至少68%或至少70%或至少80%或至少85%或至少90%或至少95%或至少97%或至少98%或至少99%或100%或80-99%或90-100%或95-99%或95-100%或97-99%或98-99%之序列一致性。本文所揭示之核酸或胺基酸序列中之任一者可為功能性或生物活性的且可操作地連接至α病毒或複製子之自我複製所需之另一序列。若分子執行與其天然(或野生型)對應分子至少50%相同之活性，則其具有功能性或生物活性，但功能分子亦可執行與其天然(或野生型)對應分子至少60%或至少70%或至少90%或至少95%或100%相同之活性。RNA複製子亦可編碼源於或基於野生型α病毒胺基酸序列之胺基酸序列，意謂其具有與由野生型RNA α病毒基因體(其可為新世界或舊世界α病毒基因體)編碼之胺基酸序列(其可為對應序列)至少60%或至少65%或至少68%或至少70%或至少80%至少70%或至少80%或至少90%或至少95%或至少97%或至少98%或至少99%或100%或80-99%或90-100%或95-99%或95-100%或97-99%或98-99%之序列一致性。源於其他序列之序列可比原始序列長或短至多5%或至多10%或至多20%或至多30%。在任何實施例中，對於其上編碼G3BP或FXR結合位點之任何核苷酸序列(或具有G3BP或FXR結合位點之胺基酸序列)，序列一致性可為至少95%或至少97%或至少98%或至少99%或100%。此等序列亦可比原始序列長或短至多5%或至多10%或至多20%或至多30%。

舉例而言，在一些實施例中，編碼nsP1、nsP2、nsP3宏域、nsP3中心域、nsP3高變域及/或nsP4蛋白中之任何一或多者的RNA序列可源於對應野生型α病毒序列。「對應」序列可為另一類型之α病毒中之類似序列。對應序列揭示於本文中且亦可經由一般技術者已知之序列比對工具(例如Clustal Omega)確定。圖7顯示序列比對，其說明來自舊世界及新世界α病毒之代表性成分的nsP3蛋白之對應序列，該序列比對係使用Clustal Omega獲得。但亦可使用一般熟習此項技術者所接受之其他序列比對工具。適用於進行序列比對之程式亦見於分子Molecular Systems Biology (2011) 7, 539中。因此，來自新世界α病毒的nsP1、nsP2、nsP3、nsP4序列分別「對應於」來自舊世界α病毒的nsP1、nsP2、nsP3、nsP4序列。子序列亦可為對應序列。對應胺基酸序列可為至少5個或至少10個或至少15個或至少20個或至少25個或至少30個或至少52個或至少53個或至少75個或至少100個或至少125個或至少150個或至少175個或至少200個胺基酸，且比初始序列長或短至多5%或至多10%或至多20%或至多30%；對應核酸序列可為至少15個或至少30個或至少45個或至少60個或至少75個或至少90個或至少156個或至少159個或至少225個或至少300個或至少375個或至少450個或至少525個或至少600個核苷酸。此類序列可比原始序列長或短至多5%或至多10%或至多20%或至多30%。

在複製子之一些實施例中，nsP1、nsP2及nsP4序列中之每一者可源於或基於新世界α病毒基因體。在一些實施例中，源於或基於野生型新世界α病毒基因體之RNA複製子可含有至少一個RNA序列(除至少一個異源蛋白或肽以外)，該RNA序列不來自野生型新世界α病毒基因體，其可為nsP3之序列，或具有nsP3之中心域及/或宏域或HVD之至少一部分。在一些實施例中，源於新世界α病毒基因體之RNA複製子可具有編碼nsP3之RNA序列或nsP3之域，或經來自野生型舊世界α病毒基因體之對應序列取代之nsP3之域的一部分。當提及完整複製子，「源於」或「基於」並不對編碼至少一種異源蛋白質或肽之RNA的子序列進行計數，且視情況，亦不會對在任何組合或子組合中之編碼nsP3蛋白之序列或任何一或多個宏域、中心域及/或nsP3之HVD域進行計數。

術語「RNA複製子」係指含有指導其在容許細胞(其可為人類、哺乳動物或動物細胞)內之自我擴增或自我複製所需之所有遺傳資訊的RNA。RNA複製子1)編碼RNA依賴性RNA聚合酶，其可與病毒或宿主細胞衍生之蛋白質、核酸或核糖核蛋白相互作用以催化RNA擴增過程。非結構蛋白包括nsP1、nsP2、nsP3、nsP4；及2)含有基因體及亞基因體RNA之複製及轉錄所需的順式作用RNA序列，諸如3'及5'UTR(用於非結構蛋白介導之擴增的α病毒核苷酸序列)，及/或亞基因體啟動子。此等序列可在複製過程期間結合至自我編碼蛋白質或非自我編碼細胞衍生之蛋白質、核酸或核糖核蛋白，或此等組分中之任一者之間的複合物。在一些實施例中，經修飾之RNA複製子分子通常含有以下有序要素：順式複製所需之5'病毒RNA序列(例如5'UTR及5'CSE)；編碼生物活性非結構蛋白之序列(例如nsP1234)；用於轉錄亞基因體RNA之啟動子；式複製所需之3'病毒序列(例如3'UTR)；及聚腺苷酸化管道，及視情況選用之編碼在控制亞基因體啟動子之後或處於亞基因體啟動子控制下之異源蛋白質或肽的序列(或兩種或更多種序列)。另外，術語RNA複製子可指正義(或信使有義)分子且RNA複製子之長度可不同於任何已知天然存在之RNA病毒之長度。在本發明之任一實施例中，RNA複製子可缺乏(或不含有)至少一個(或所有)結構病毒蛋白(例如核衣殼蛋白C及包膜蛋白P62、6K及E1)之序列。在此等實施例中，編碼一或多個結構基因之序列可經一或多個異源序列取代，該等異源序列諸如至少一個異源蛋白質或肽(或其他相關基因(GOI))之編碼序列。

在各種實施例中，本文揭示之RNA複製子可經工程改造、合成或重組RNA複製子。如本文所用，術語重組意謂任何分子(例如DNA、RNA等)，然而間接為或產生聚核苷酸之人類操縱。作為非限制性實例，cDNA為重組DNA分子，正如已藉由活體外聚合酶反應產生或連接子已附接或已整合至載體中之任何核酸分子，諸如選殖載體或表現載體。作為非限制性實例，重組RNA複製子可為以下中之一或多者：1)例如使用化學或酶技術活體外合成或修飾，例如藉由使用化學核酸合成，或藉由使用酶進行核酸分子之複製、聚合、核酸外切酶消化、核酸內切酶消化、接合、反轉錄、轉錄、鹼基修飾(包括例如甲基化)或重組(包括同源及位點特異性重組)核酸； 2)為自然界中不接合之經結合之核苷酸序列；3)使用分子選殖技術工程改造以使得其相對於天然存在之核苷酸序列缺乏一或多個核苷酸；及4)使用分子選殖技術操控以使得其具有相對於天然存在之核苷酸序列的一或多個序列改變或重排。

在揭示本文中之核酸或多肽序列中，例如，nsP1、nsP2、nsP3、nsP3宏域、nsP3中心域、nsP3高變域、nsP4、RdRp、P1234之序列，亦揭示認為係基於或源於原始序列之序列。因此所揭示之序列包括多肽序列，其具有與SEQ ID NO:51-67中之任一者之全長多肽序列(及編碼SEQ ID NO:51-67中之任一者之核苷酸序列)及其片段至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%或至少85%序列一致性，舉例而言至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%或85-99%或85-95%或90-99%或95-99%或97-99%或98-99%序列一致性。亦揭示本文所揭示之序列中之任一者之片段或部分。序列之片段或部分可包括具有至少5個或至少7個或至少10個或至少20個或至少30個、至少50個、至少75個、至少100個、至少125個、150個或更多個或5-10個或10-12個或10-15個或15-20個或20-40個或20-50個或30-50個或30-75個或30-100個完整序列之胺基酸殘基(或編碼此類片段之核酸)，或至少100個或至少200個或至少300個或至少400個或至少500個或至少600個或至少700個或至少800個或至少900個或至少1000個或100-200個或100-500個或100-1000個或500-1000個胺基酸殘基(或編碼此類片段之核酸)，或此等量中之任一者但小於500或小於700或小於1000或小於2000個SEQ ID NO:51-67或本文所揭示之任何片段之連續胺基酸，或編碼此類片段之核酸。亦揭示此類序列之變體，例如其中至少一個或兩個或三個或四個或五個胺基酸殘基已將N端及/或C端插入至所揭示序列及/或在所揭示序列內，該所揭示序列含有插入及取代及編碼此類變體之核酸序列。所涵蓋之變體可另外或置換地包括藉由例如同源重組或定標或PCR突變誘發含有預定突變之變體及其他物種之相應多肽或核酸，包括但不限於本文所描述之彼等，含有插入及取代之多肽或核酸家族之對偶基因或其他天然存在之變體；及/或衍生物，其中多肽已藉由用除天然存在之胺基酸以外的含有插入及取代之部分(例如可偵測部分，諸如酶)取代、化學、酶催化或其他適當方式共價修飾。本文所描述之核酸序列可為RNA序列。

RNA複製子之組分或序列中之任一者可操作地連接至任何其他組分或序列。 RNA複製子之組分或序列可操作地連接以在宿主細胞或經處理生物體中表現至少一種異源蛋白或肽(或生物治療劑)及/或使複製子能夠自我複製。術語「可操作地連接」表示經組態以執行其常見功能之兩個或更多個序列之間的功能鍵。因此，當存在適當酶時，可操作地連接至編碼序列之啟動子或UTR能夠實現編碼序列之轉錄及表現。啟動子不必與編碼序列相鄰，只要其用於引導其表現即可。因此，編碼異源蛋白質或肽之RNA序列與調控序列(例如啟動子或UTR)之間的可操作鍵係允許表現相關聚核苷酸之功能鍵。可操作地連接亦可指諸如編碼RdRp(例如nsP4)、nsP1-4、UTR、啟動子之序列，且在RNA複製子中編碼之其他序列經連接以使得其能夠轉錄及轉譯生物治療分子及/或複製複製子之序列。 UTR可以藉由提供其他經編碼序列之核糖體識別及轉譯所必需的序列及間隔來可操作地連接。

α病毒基因體編碼非結構蛋白nsP1、nsP2、nsP3及nsP4，其以單一聚合蛋白前驅體形式產生，有時稱為P1234(或nsP1-4或nsP1234)，且經由蛋白水解處理而裂解成成熟蛋白。 nsP1可為約60 kDa尺寸且可具有甲基轉移酶活性且參與病毒覆蓋反應。nsP2具有約90 kDa之尺寸且可具有解旋酶及蛋白酶活性，而nsP3為約60 kDa且含有三個域：宏域、中心(或α病毒獨特)域及高變域(HVD)。nsP4為約70 kDa尺寸，且含有核心RNA依賴性RNA聚合酶(RdRp)催化域。感染後，轉譯α病毒基因體RNA，得到P1234聚合蛋白，其裂解成個別蛋白質。

α病毒nsP3蛋白含有三個域；a)宏域，b)中心(或)域，及c)高變域(HVD)。在各種實施例中，本發明之複製子具有編碼源於野生型α病毒nsP3之nsP3宏域及源於野生型α病毒nsP3之nsP3中心域的RNA序列。在各種實施例中，宏及中心域皆可源於新世界野生型α病毒nsP3，或皆可源於舊世界野生型α病毒nsP3蛋白質。在更多實施例中，宏域可源於新世界野生型α病毒宏域，且中心域可源於舊世界野生型α病毒中心域，或反之亦然。各種域可具有本文所描述之任何序列。

在一些實施例中，複製子可具有新世界α病毒HVD，其中可刪除FXR結合位點開始之胺基酸之C端側的序列且用舊世界野生型α病毒HVD序列或其部分之置換序列置換。本文描述舊世界α病毒置換序列。因此，當新世界α病毒為VEEV時，胺基酸478之C端側之彼等胺基酸可缺失；當新世界α病毒為EEEV時，胺基酸531之C端側之彼等胺基酸可缺失；且當新世界α病毒為WEEV時，胺基酸504之C端側之彼等胺基酸可缺失。在此等實施例中之任一者中，置換序列可如本文所述經取代。如本文另外描述，新世界α病毒HVD之C端胺基酸的一部分仍然可保留在舊世界序列之C端側。

在一些實施例中，新世界α病毒中編碼FXR結合位點之序列的至少一部分可缺失且用本文所描述之置換序列置換。因此，當NW α病毒為VEEV時，胺基酸478-517或478-545可缺失且用OW α病毒之置換序列置換。或當NW α病毒為VEEV時，胺基酸478-545之間存在的重複序列中之至少一者可缺失且視情況經OW α病毒置換序列置換。當NW α病毒為EEEV時，胺基酸531-547可缺失且經置換序列置換。當NW α病毒為WEEV時，胺基酸504-520可缺失且用置換序列置換。在其他實施例中，編碼FXR結合位點之整個序列可缺失，或可缺失至少50%或至少70%或至少80%或至少90%FXR結合位點，且視情況用置換序列置換。在任一實施例中，所指示之序列可缺失且無置換序列插入。

OW α病毒置換序列可包含具有一或多個G3BP結合位點或G3BP結合位點之至少一部分的胺基酸片段。因此，置換序列可為FGDF或FGSF。置換序列亦可源於舊世界α病毒之野生型nsP3高變域之至少一部分。 OW α病毒置換序列之其他實例描述於下文中。 OW α病毒置換序列可用於具有本文所描述之新世界α病毒HVD序列中之任一者之序列的複製子中。在任一實施例中，新世界α病毒可為VEEV、EEEV、WEEV或本文所描述之任何新世界α病毒。

當OW α病毒為CHIKV時，置換序列可為CHIKV nsP3之胺基酸479-582或479-500或479-500。

當OW α病毒為SINV時，置換序列可為包含SINV nsP3之胺基酸490-493或513-516或490-516之序列。

當OW α病毒為SFV時，置換序列可為包含SFV nsP3之胺基酸451-471或451-454或468-471的序列。

當OW α病毒為MAYV時，置換序列可為包含MAYV nsP3之胺基酸470-473之序列。

當OW α病毒為RRV時，置換序列可為包含RRV nsP3之胺基酸412-426或512-515或523-526的序列。

當OW α病毒為ONNV時，置換序列可為包含ONNV nsP3之胺基酸519-540或519-522或537-540的序列。

當OW α病毒為BFV時，置換序列可為包含BFV nsP3之胺基酸429-450，或429-432，或447-450之序列。

新世界及舊世界α病毒可為本文所描述之任何病毒且可以任何可能的組合或子組合進行組合，其皆揭示於本文中，如同在本文中充分闡述一般。

α病毒基因體編碼nsP4中之核心RNA依賴性RNA聚合酶。聚合蛋白之裂解可出現在nsP2/3接合點處，影響在基因體複製期間使用之RNA模板。在裂解之後，nsP3可產生環結構，所述環結構包圍nsP2，且此等兩種蛋白質具有實質性界面。因此，圍繞nsP2/3及/或nsP3/4之接合點的序列的保存可為適用的。

因此，在一些實施例中，nsP3蛋白之宏及/或中心及/或HVD域可具有C端部分及/或N端部分(如本文中所描述)，其為源於新世界α病毒之胺基酸序列，而域之剩餘部分係源於舊世界α病毒序列。舉例而言，宏域及/或中心域及/或HVD域可具有源於對應舊世界α病毒域但具有nsP3之N端及/或C端之前4個或5個或6個或4-6個或6-8個或6-10個胺基酸之序列，該nsP3源於新世界α病毒序列(其可為衍生出nsP1、nsP2及nsP4的新世界α病毒)。因此，複製子可如本文中所描述具有編碼源於舊世界α病毒nsP3宏域及/或中心域及/或HVD域之胺基酸序列的RNA子序列，且域之N端及/或C端側上之前1-3個或1-4個或1-5個或1-6個或1-7個或1-8個胺基酸源於新世界α病毒域或可在其上具有一或兩個或三個取代。如在此情形下所用，術語「C端」及「N端」不指示真實末端，但指示nsP將裂解成各別多肽的點。編碼非特異性蛋白質(nsP)之序列以終止密碼子為特徵且通常轉錄將在彼點終止。但當終止密碼子經處理為連讀終止密碼子時，端可為SEQ ID NO:12-17中所指示之「/」，其可表示nsP之N端及/或C端。接合點序列可為位於端之任一側上，例如位於nsP3側上之彼等1-6個胺基酸。此等實施例允許nsP3序列源於舊世界序列，但保留在nsP2/nsP3之間與nsP3/nsP4之間的接合點。保留此等接合點可允許使用新世界α病毒酶裂解P1234蛋白質接合點。在一些實施例中，倒數第二個甘胺酸保留在接合點處。舊世界α病毒可為本文所描述之任何病毒。舉例而言，當新世界α病毒為VEEV時，nsP2/nsP3序列可為(SEQ ID NO:62) LHEAGC/APSY，其中斜線(「/」)表示nsP2與nsP3之間的邊緣，且其中倒數第二個G得以保留，而nsP2/nsP3接合點中之其餘胺基酸如本文所描述而變化。在VEEV之nsP3/nsP4接合點之情況下，序列可為(SEQ ID NO:63) RFDAGA/YIFS，其中倒數第二個甘胺酸再次保留且剩餘nsP3胺基酸如本文中所描述而變化。此等序列亦可位於終止密碼子(TGA)之前，如上文所提及，其有時可視為連讀終止密碼子。當新世界α病毒為EEEV時，nsP2/nsP3序列可為(SEQ ID NO:64) QHEAGR/APAY，其中斜線(「/」)表示nsP2與nsP3之間的邊緣，且其中倒數第二個G得以保留，而nsP2/nsP3接合點中之其餘胺基酸如本文所描述而變化。在VEEV之nsP3/nsP4接合點之情況下，序列可為(SEQ ID NO:65) RYEAGA/YIFS，其中倒數第二個甘胺酸再次保留，且其餘nsP3胺基酸如本文中所描述而變化。如上，此等序列亦可在通讀之終止密碼子(TGA)之前。當新世界α病毒為WEEV時，nsP2/nsP3序列可為(SEQ ID NO:66) RYEAGR/APAY，其中斜線(「/」)表示nsP2之端(end)或端(terminus)(及nsP2與nsP3之間的接合點)，且其中倒數第二個G得以保留，而nsP2/nsP3接合點中之其餘胺基酸如本文所描述而變化。在WEEV之nsP3/nsP4接合點之情況下，序列可為(SEQ ID NO:67) RYEAGA/YIFS，其中倒數第二個甘胺酸再次保留且其餘nsP3胺基酸如本文中所描述而變化。如本文中所解釋，此等序列亦可在通讀之終止密碼子(TGA)之前。此等序列(SEQ ID NO:62-67)中之任一者亦可在N端及/或C端側上含有一或兩個或三個取代。

α病毒可含有保守序列要素(CSEM)，其為物種中核酸序列或多肽中之類似或一致子序列。CSE可發生在新世界或舊世界α病毒nsP3之HVD中且為此項技術中已知的。

舊世界α病毒亦可含有FGDF或FGSF胺基酸基元，其可在序列中重複以形成重複序列或重複基元。在本發明之RNA複製子之任何實施例中，OW α病毒之HVD可含有FGDF/FGDF重複序列、或FGSF/FGSF重複序列、或FGDF/FGSF重複序列、或FGSF/FGDF重複序列。在重複序列存在之所有實施例中，兩個重複基元可由一或多個胺基酸殘基間隔。在各種實施例中，兩個重複基元可由5或6或7或8或9或10或至少10或11或12或13或14或15或16或17或18或19或20或21或22或23或24或25個胺基酸殘基或由超過25個胺基酸殘基間隔，其在一個實施例中可為隨機胺基酸。在一個實施例中，基元或重複基元由至少10個且不超過25個胺基酸間隔，該胺基酸亦可為隨機胺基酸。在各種實施例中，兩個重複基元可由SEQ ID No: 56: NEGEIESLSSELLT或SEQ ID NO: 57: SDGEIDELSRRVTTESEPVL或SEQ ID NO: 58: DEHEVDALASGIT或源於其任一者之序列分開，該等兩個基元可具有相同長度；因此，所揭示之係由SEQ NO:56、57或58間隔之重複基元，其具有1)在兩端之FGDF基元；2)在兩端之FGSF基元；3)在3'或5'端之FGDF基元及在相對端之FGSF基元。在各種實施例中，胺基酸序列亦可在第二基元之後。實例包括胺基酸序列SEQ ID NO: 61: DDVLRLGRAGA或SEQ ID NO: 60: EPGEVNSIISSRSAVSFPLRKQRRRRRSRRTEY或SEQ ID NO: 59: LPGEVDDLTDSDWSTCSDTDDELRLDRAGG或源於其任一者之序列，其中任一者可遵循本文所揭示之基元或重複基元。

本發明之複製子中之任一者亦可包含5'及3'非轉譯區(UTR)。 UTR可為野生型新世界或舊世界α病毒UTR序列，或源於其中任一者的序列。在各種實施例中，5'UTR可具有任何適合之長度，諸如約60個nt或50-70個nt或40-80個nt。在一些實施例中，5'UTR亦可具有保留一級或二級結構(例如一或多個莖環)且可參與α病毒或複製子RNA之複製。在一些實施例中，3'UTR可為至多幾百個核苷酸，例如其可為50-900或100-900或50-800或100-700或200 nt-700 nt。3'UTR亦可具有二級結構，例如步驟環，且之後可為聚腺苷酸化道或多聚腺苷酸尾。在本發明之實施例中之任一者中，5'及3'非轉譯區可操作地連接至由複製子編碼之其他序列中之任一者。UTR可藉由提供其他經編碼序列之識別及轉錄所必需的序列及間隔而可操作地連接至編碼異源蛋白質或肽之啟動子及/或序列。

在一個實施例中，本發明之RNA複製子可具有編碼異源蛋白或肽(例如單株抗體或生物治療蛋白或肽)之RNA序列；編碼源於野生型新世界α病毒nsP1、nsP2及nsP4蛋白序列之胺基酸序列的RNA序列；以及5'及3'UTR序列(對於非結構蛋白介導之擴增)。RNA複製子亦可具有5'帽及聚腺苷酸(或poly-A)尾。RNA複製子亦可編碼源於新世界α病毒宏域之胺基酸序列、源於新世界α病毒中心域之胺基酸序列及源於舊世界α病毒高變域之胺基酸序列。在置換實施例中，RNA複製子可編碼具有源於新世界高變域之胺基酸序列的部分，及具有源於舊世界α病毒高變域之胺基酸序列的另一部分，如本文所描述。

異源蛋白或肽之免疫原性可藉由一般技術者已知之多種分析測定，例如對細胞內細胞介素或由抗原決定基特異性T細胞群體分泌之細胞介素進行免疫染色，或藉由量化抗原決定基特異性T細胞之頻率及總數且表徵其分化及活化狀態，例如半衰期短之效應及記憶前驅效應CD8+ T細胞。免疫原性亦可藉由量測抗體介導之免疫反應，例如藉由量測血清IgA或IgG力價產生抗體來測定。

本發明中之RNA複製子可具有以下態樣：態樣1. 包含編碼異源蛋白質或肽之RNA子序列的RNA複製子；5'及3' α病毒非轉譯區；編碼源於新世界α病毒非結構蛋白nsP1、nsP2及nsP4之胺基酸序列的RNA子序列；及編碼源於α病毒nsP3宏域之胺基酸序列的RNA子序列；編碼源於α病毒nsP3中心域之胺基酸序列的RNA子序列；及編碼包含以下之高變域的RNA子序列： a. 源於舊世界α病毒nsP3高變域之胺基酸序列；或 b. 包含源於新世界α病毒nsP3高變域之一部分及源於舊世界α病毒nsP3高變域之一部分的胺基酸序列。態樣2. 如態樣1之RNA複製子，其中α病毒nsP3宏域及α病毒nsP3中心域來自新世界α病毒。態樣3. 如態樣1之RNA複製子，其中α病毒nsP3宏域及α病毒nsP3中心域來自舊世界α病毒。態樣4. 如態樣1之RNA複製子，其包含源於舊世界α病毒nsP3高變域之胺基酸序列。態樣5. 如態樣4之RNA複製子，其中舊世界α病毒係選自由以下組成之群：CHIKV、SINV及SFV。態樣6. 如態樣4之RNA複製子，其中新世界α病毒為委內瑞拉馬腦炎病毒(VEEV)。態樣7. 如態樣1之RNA複製子，其中新世界α病毒為委內瑞拉馬腦炎病毒(VEEV)。態樣8. 如態樣1之RNA複製子，其中新世界α病毒係選自由以下組成之群：委內瑞拉馬腦炎病毒(VEEV)、西部馬腦炎病毒(WEEV)及東部馬腦炎病毒(EEEV)。態樣9. 如態樣8之RNA複製子，舊世界α病毒係選自由以下組成之群：辛得比斯病毒(SINV)、基孔肯雅病毒(CHIKV)、勝利基森林病毒(SFV)、羅斯河病毒(RRV)、鷺山病毒(SAGV)、蓋塔病毒(GETV)、米德爾堡病毒(MIDV)、貝巴魯病毒(BEBV)、奧-奈氏病毒(ONNV)、恩杜穆(NDUV)及巴馬森林病毒(BFV)。態樣10. 如態樣1之RNA複製子，源於舊世界α病毒nsP3高變域之部分包含選自由以下組成之群的基元：FGDF及FGSF。態樣11. 如態樣1之RNA複製子，其中源於舊世界α病毒nsP3高變域之部分包含選自由以下組成之群的重複序列：FGDF/FGDF重複序列、FGSF/FGSF重複序列、FGDF/FGSF重複序列及FGSF/FGDF重複序列；且另外其中該等重複序列藉由至少10個且不超過25個胺基酸間隔。態樣12. 如態樣11之RNA複製子，其中該等重複序列由源於由以下組成之群之胺基酸序列間隔：SEQ ID NO:56: NEGEIESLSSELLT及SEQ ID NO:57: SDGEIDELSRRVTTESEPVL及SEQ ID NO: 58: DEHEVDALASGIT。態樣13.如態樣10之RNA複製子，其中源於舊世界α病毒高變域之部分包含 a. CHIKV nsP3 HVD之胺基酸479-482或497-500或479-500或335-517；或 b. SFV nsP3 HVD之胺基酸451-454或468-471或451-471；或 c. SINV nsP3 HVD之胺基酸490-493或513-516或490-516或335-538。態樣14. 如態樣11之RNA複製子，其中源於舊世界α病毒高變域之部分包含 a. CHIKV nsP3 HVD之胺基酸479-500或335-517；或 b. SFV nsP3 HVD之胺基酸451-471；或 c. SFV nsP3 HVD之胺基酸490-516。態樣15. 如態樣13之RNA複製子，其中新世界α病毒為VEEV且源於新世界α病毒高變域之部分不包含VEEV nsP3高變域之胺基酸478-518。態樣16. 如態樣13之RNA複製子，其中新世界α病毒為VEEV且源於新世界α病毒高變域之部分不包含VEEV nsP3高變域之胺基酸478-545。態樣17. 如態樣13之RNA複製子，其中新世界α病毒為VEEV且源於新世界α病毒高變域之部分不包含VEEV nsP3高變域之胺基酸335-518。態樣18. 如態樣17之RNA複製子，其中舊世界α病毒為CHIKV且源於舊世界α病毒高變域之部分包含CHIKV之胺基酸335-517。態樣19. 如態樣17之RNA複製子，其中舊世界α病毒為SINV且源於舊世界α病毒高變域之部分包含SINV之胺基酸335-538。態樣20. 如態樣13之RNA複製子，其進一步包含，新世界α病毒為EEEV且源於新世界α病毒高變域之部分不包含EEEV高變域之胺基酸531-547。態樣21. 如態樣20之RNA複製子，其中新世界α病毒為EEEV，且源於新世界α病毒高變域之部分不包含EEEV高變域之胺基酸531-547，且其中源於舊世界α病毒高變域之部分包含 a. CHIKV nsP3 HVD之胺基酸479-500；或 b. SFV nsP3 HVD之胺基酸451-471；或 c. SINV nsP3 HVD之胺基酸490-516。態樣22. 如態樣13之RNA複製子，其進一步包含，新世界α病毒為WEEV，且源於新世界α病毒高變域之部分不包含WEEV高變域之胺基酸504-520。態樣23. 如態樣22之RNA複製子，其中新世界α病毒為WEEV，且源於新世界α病毒高變域之部分不包含WEEV高變域之胺基酸504-520，且其中源於舊世界α病毒高變域之部分包含 a. CHIKV nsP3 HVD之胺基酸479-500；或 b. SFV nsP3 HVD之胺基酸451-471；或 c. SINV nsP3 HVD之胺基酸490-516。態樣24. 如態樣1之RNA複製子，其進一步包含可操作地連接至編碼異源蛋白之RNA序列且調控編碼異源蛋白之RNA序列之轉譯的亞基因體啟動子。態樣25. 如態樣1之RNA複製子，其進一步包含5'帽及3'聚腺苷酸尾。態樣26. 如態樣1之RNA複製子，其中該複製子包含正義單股RNA。態樣27. 如態樣25之RNA複製子，其中該複製子包含10-12 kb RNA且直徑為30-50 nm。態樣28. 如態樣1之RNA複製子，其中異源蛋白為生物治療蛋白或肽。態樣29. 如態樣1之RNA複製子，其中異源蛋白質為抗體。態樣30. 如態樣1之RNA複製子，其中新世界α病毒為VEEV，且源於新世界α病毒nsP3高變域之部分不包含VEEV nsP3高變域之胺基酸335-518，且其中源於舊世界α病毒nsP3高變域之部分包含SINV nsP3 HVD之胺基酸490-493或513-516或490-516或335-538。態樣31. 如態樣30之RNA複製子，其中源於舊世界α病毒nsP3高變域之部分包含SINV nsP3 HVD之胺基酸490-516。態樣32. 如態樣30之RNA複製子，其中舊世界α病毒為SINV且源於舊世界α病毒nsP3高變域之部分包含SINV nsP3 HVD之胺基酸335-538。態樣33. 如態樣1之RNA複製子，其中編碼異源蛋白或肽之RNA序列可操作地連接至編碼nsP1、nsP2及nsP4之RNA序列。態樣34. 一種RNA複製子，其包含編碼異源蛋白或肽之RNA子序列；編碼源於新世界α病毒非結構蛋白nsP1、nsP2及nsP4之胺基酸序列的RNA子序列；及編碼源於舊世界α病毒nsP3蛋白質之胺基酸序列的RNA子序列，且其中在nsP3蛋白之N端及/或C端側上之前1-6個胺基酸源於新世界α病毒序列。

本申請案之自我複製RNA載體可為病毒載體。一般而言，病毒載體係載運經修飾病毒DNA或RNA的經遺傳工程改造之病毒，該病毒DNA或RNA已呈現非感染性，但仍含有病毒啟動子及轉殖基因，由此允許經由病毒啟動子轉譯轉殖基因。由於病毒載體常常缺乏感染性序列，故其需要輔助病毒或包裝株來進行大規模轉染。

適用於本發明之自我複製RNA複製子可包含用以建立載體之習知功能的任何調控元件，包括但不限於由載體之聚核苷酸序列編碼之HBV抗原之複製及表現。調控元件包括但不限於啟動子、強化子、聚腺苷酸化信號、轉譯終止密碼子、核糖體結合元件、轉錄終止子、選擇標記物、複製起點等。載體可以包含一或多個表現卡匣。「表現卡匣」係載體中引導細胞機構製備RNA及蛋白質的部分。表現卡匣通常包含三種組分：啟動子序列、開放閱讀框架，及視情況包含聚腺苷酸化信號之3'非轉譯區(UTR)。開放閱讀框架(ORF)為含有自起始密碼子至終止密碼子之相關蛋白質(例如HBV抗原)之編碼序列的閱讀框架。表現卡匣之調控元件可以可操作地連接至編碼相關HBV抗原之聚核苷酸序列。如本文所使用，術語「可操作地連接」係以最廣泛合理的內容解釋，且指呈功能關係的聚核苷酸元件之連接。當聚核苷酸放置成與另一聚核苷酸具有功能關係時，其為「可操作地連接」。舉例而言，若啟動子影響編碼序列之轉錄，則其可操作地連接至該編碼序列。適用於本文所描述之表現卡匣中的任何組件可以任何組合形式且按任何次序使用以製備本申請案之載體。

載體可以包含啟動子序列，較佳地在表現卡匣內包含啟動子序列，用以控制相關HBV抗原之表現。術語「啟動子」係以習知意義使用，且指起始可操作地連接之核苷酸序列之轉錄的核苷酸序列。啟動子係與其轉錄之核苷酸序列位於相同股上，且鄰近該核苷酸序列。啟動子可為組成性、誘導性或阻遏性的。啟動子可以為天然存在的或合成的。啟動子可以源於包括病毒、細菌、真菌、植物、昆蟲及動物之來源。啟動子可為同源啟動子(亦即，源於與載體相同之基因來源)或異源啟動子(亦即，源於不同載體或基因來源)。較佳地，啟動子係位於表現卡匣內編碼HBV抗原之聚核苷酸的上游。舉例而言，啟動子可為α病毒之亞基因體啟動子。累積實驗證據表明，VEEV及其他α病毒基因體之複製/擴增及其缺陷性干擾(DI) RNA係藉由三個啟動子要素測定：(i)保存性3'端序列元件(3'CSE)及以下聚腺苷酸尾；(ii) 5'UTR，其充當負股及正股RNA合成兩者之關鍵啟動子要素；及(iii)51-nt保存性序列元件(51-nt CSE)，其位於nsP1-編碼序列中且充當α病毒基因體複製之強化子(Kim等人, PNAS, 2014, 111: 10708-10713及於其中之參考) 。

載體可以包含使表現之轉錄物穩定，促進RNA轉錄物之核輸出及/或改善轉錄-轉譯偶聯之其他聚核苷酸序列。此類序列之實例包括聚腺苷酸化信號及強化子序列。聚腺苷酸化信號通常位於載體之表現卡匣內相關蛋白質(例如HBV抗原)之編碼序列的下游。強化子序列係當經轉錄因子結合時促進相關聯之基因之轉錄的調控性DNA序列。強化子序列較佳在載體之表現卡匣內位於編碼HBV抗原之聚核苷酸序列的上游，但在啟動子序列的下游。

根據本發明，熟習此項技術者已知之任何聚腺苷酸化信號均可使用。例如，聚腺苷酸化信號可為SV40聚腺苷酸化信號、LTR聚腺苷酸化信號、牛生長激素(bGH)聚腺苷酸化信號、人類生長激素(hGH)聚腺苷酸化信號或人類β-血球蛋白聚腺苷酸化信號。較佳地，聚腺苷酸化信號為牛生長激素(bGH)聚腺苷酸化信號或SV40聚腺苷酸化信號。例示性bGH聚腺苷酸化信號之核苷酸序列展示於SEQ ID NO:20中。例示性SV40聚腺苷酸化信號之核苷酸序列展示於SEQ ID NO:13中。

根據本發明，熟習此項技術者已知之任何強化子序列均可使用。舉例而言，強化子序列可以為人類肌動蛋白、人類肌凝蛋白、人類血紅蛋白、人類肌肉肌酸，或病毒強化子，諸如來自CMV、HA、RSV或EBV之強化子。特定強化子之實例包括但不限於土拔鼠HBV轉錄後調控元件(WPRE)、源於人類載脂蛋白A1前驅體(ApoAI)之內含子/外顯子序列、1型人類T細胞白血病病毒(HTLV-1)長末端重複序列(LTR)之非轉譯R-U5域、剪接強化子、合成兔β-血球蛋白內含子或其任何組合。較佳地，強化子序列為HTLV-1 LTR之非轉譯R-U5域、兔β-血球蛋白內含子及剪接強化子三個連續元件構成的複合序列，在本文中稱作「三強化子序列」。例示性三強化子序列之核苷酸序列展示於SEQ ID NO:10中。另一例示性強化子序列為SEQ ID NO:12中所示之ApoAI基因片段。

載體可以包含編碼信號肽序列之聚核苷酸序列。較佳地，編碼信號肽序列之聚核苷酸序列位於編碼HBV抗原之聚核苷酸序列的上游。信號肽通常引導蛋白質之定位，促進產生蛋白質之細胞分泌蛋白質，及/或改善抗原表現及交叉呈現至抗原呈現細胞。當自載體表現時，信號肽可以存在於HBV抗原之N端，但例如在自細胞分泌時，經信號肽酶裂解。信號肽已裂解之經表現蛋白質通常稱為「成熟蛋白」。根據本發明，此項技術中已知之任何信號肽均可使用。舉例而言，信號肽可以為胱抑素S信號肽；免疫球蛋白(Ig)分泌信號，諸如Ig重鏈γ信號肽SPIgG或Ig重鏈ε信號肽SPIgE。

較佳地，信號肽序列為胱抑素S信號肽。胱抑素S信號肽之例示性核酸及胺基酸序列分別展示於SEQ ID NO:8及9中。免疫球蛋白分泌信號之例示性核酸及胺基酸序列分別展示於SEQ ID NO:14及15中。

在本申請案之一個特定實施例中，自我複製複製子包含表現卡匣，其包括編碼選自由以下組成之群之HBV抗原中之至少一者的聚核苷酸： HBV pol抗原，其包含與SEQ ID NO:7至少90%，諸如90%、91%、92%、93%、94%、95%、96%、97%，較佳至少98%，諸如至少98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致之胺基酸序列，及截短HBV核心抗原，其由與SEQ ID NO:2或SEQ ID NO:4至少95%，諸如95%、96%、97%，較佳至少98%，諸如至少98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致之胺基酸序列組成；可操作地連接至編碼HBV抗原之聚核苷酸的上游序列，該序列包含自5'端至3'端，啟動子序列，較佳亞基因體啟動子，及編碼信號肽序列，較佳胱抑素S信號肽的聚核苷酸序列，該序列具有SEQ ID NO:9之胺基酸序列之；及可操作地連接至編碼HBV抗原之聚核苷酸的下游序列，該聚核苷酸包含聚腺苷酸化信號，較佳SEQ ID NO:20之bGH聚腺苷酸化信號。此類載體進一步包含表現卡匣，其包括編碼複製蛋白之聚核苷酸，該等複製蛋白包含一或多種驅動RNA複製子複製之病毒非結構蛋白(nsP1、nsP2、nsP3及nspP4)。

在本申請案之一個實施例中，自我複製RNA分子編碼具有SEQ ID NO:7之胺基酸序列的HBV Pol抗原。較佳地，自我複製RNA分子包含HBV Pol抗原之編碼序列，該編碼序列與SEQ ID NO:5或6之聚核苷酸序列至少90%一致，諸如與SEQ ID NO:5或6 90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致，較佳地與SEQ ID NO:5或6 100%一致。

在本申請案之一個實施例中，自我複製RNA分子編碼由SEQ ID NO:2或SEQ ID NO:4之胺基酸序列組成的截短HBV核心抗原。較佳地，自我複製RNA分子包含與SEQ ID NO:1或SEQ ID NO:3之聚核苷酸序列至少90%一致，諸如與SEQ ID NO:1或SEQ ID NO:3 90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致，較佳地與SEQ ID NO:1或SEQ ID NO:3 100%一致之截短HBV核心抗原的編碼序列。

在本申請案之又一實施例中，自我複製RNA分子編碼包含具有SEQ ID NO:7之胺基酸序列的HBV Pol抗原及由SEQ ID NO:1或SEQ ID NO:3之胺基酸序列組成的截短HBV核心抗原的融合蛋白。較佳地，自我複製RNA分子包含融合物之編碼序列，其含有與SEQ ID NO:1或SEQ ID NO:3至少90%一致，諸如與SEQ ID NO:1或SEQ ID NO:3至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.9%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致，較佳與SEQ ID NO:1或SEQ ID NO:3 98%、99%或100%一致之截短HBV核心抗原的編碼序列，更佳SEQ ID NO:1或SEQ ID NO:3，可操作地連接至與SEQ ID NO:5或SEQ ID NO:6至少90%一致，諸如與SEQ ID NO:5或SEQ ID NO:6至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.9%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致，較佳與SEQ ID NO:5或SEQ ID NO:6 98%、99%或100%一致之HBV Pol抗原之編碼序列，更佳SEQ ID NO:5或SEQ ID NO:6。較佳地，截短HBV核心抗原之編碼序列經由連接子之編碼序列可操作地連接至HBV Pol抗原之編碼序列，該連接子之編碼序列與SEQ ID NO:11至少90%一致，諸如至少與SEQ ID NO:11 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%或100%一致，較佳與SEQ ID NO:11 98%、99%或100%一致。在本申請案之特定實施例中，自我複製RNA分子包含具有將SEQ ID NO:1或SEQ ID NO:3可操作地連接至SEQ ID NO:11之融合物的編碼序列，該序列進一步可操作地連接至SEQ ID NO:5或SEQ ID NO:6。

編碼本申請案之HBV抗原的聚核苷酸及表現載體可以根據本發明，利用此項技術中已知之任何方法製備。舉例而言，可以使用熟習此項技術者熟知的標準分子生物學技術，例如聚合酶鏈反應(PCR)等將編碼HBV抗原之聚核苷酸引入或「選殖」至表現載體中。

組合物、治療組合及疫苗本申請案亦係關於組合物、治療組合，更特定言之套組及疫苗，其包含根據本申請案之一或多種HBV抗原、聚核苷酸及/或編碼一或多種HBV抗原之載體。本文所描述之本申請案之HBV抗原、聚核苷酸及/或載體中之任一者可用於本申請案之組合物、治療組合或套組及疫苗中。

在本申請案之一個實施例中，組合物包含自我複製RNA分子，其包含編碼截短HBV核心抗原的聚核苷酸，該截短HBV核心抗原由與SEQ ID NO:2或SEQ ID NO:4至少90%一致，較佳與SEQ ID NO:2或SEQ ID NO:4 100%一致之胺基酸序列組成。

在本申請案之一個實施例中，組合物包含自我複製RNA分子，其包含編碼HBV Pol抗原之聚核苷酸，該HBV Pol抗原包含與SEQ ID NO:7至少90%一致，較佳與SEQ ID NO:7 100%一致之胺基酸序列。

在本申請案之一個實施例中，組合物包含自我複製RNA分子，其包含編碼截短HBV核心抗原之聚核苷酸，該截短HBV核心抗原由與SEQ ID NO:2或SEQ ID NO:4至少90%一致，較佳與SEQ ID NO:2或SEQ ID NO:4 100%一致之胺基酸序列組成；及自我複製RNA分子，其包含編碼HBV Pol抗原之聚核苷酸，該HBV Pol抗原包含與SEQ ID NO:7至少90%一致，較佳地與SEQ ID NO:7 100%一致之胺基酸序列。包含截短HBV核心抗原之編碼序列的自我複製RNA分子及包含HBV Pol抗原之編碼序列的自我複製RNA分子可為相同自我複製RNA分子，或兩種不同自我複製RNA分子。

在本申請案之一個實施例中，組合物包含自我複製RNA分子，其包含編碼融合蛋白之聚核苷酸，該融合蛋白包含由與SEQ ID NO:2或SEQ ID NO:4至少90%一致，較佳與SEQ ID NO:2或SEQ ID NO:4 100%一致之胺基酸序列組成的截短HBV核心抗原，可操作地連接至包含與SEQ ID NO:7至少90%一致，較佳地與SEQ ID NO:7 100%一致之胺基酸序列的HBV Pol抗原，或反之亦然。較佳地，該融合蛋白進一步包含將截短HBV核心抗原可操作地連接至HBV Pol抗原的連接子，或反之亦然。較佳地該連接子具有胺基酸序列(AlaGly)n，其中n為2至5之整數。

本申請案亦關於一種治療組合或套組，其包含根據本申請案之實施例之表現截短HBV核心抗原及HBV pol抗原之自我複製RNA。編碼本文所描述之本申請案之HBV核心及pol抗原的任何自我複製RNA分子均可用於本申請案之治療組合或套組中。

在本申請案之一個特定實施例中，治療組合或套組包含自我複製RNA複製子，其包含：i)編碼由與SEQ ID NO:2至少95%一致之胺基酸序列組成的截短HBV核心抗原之第一聚核苷酸序列；及ii)編碼具有與SEQ ID NO:7至少90%一致之胺基酸序列之HBV聚合酶抗原的第二聚核苷酸序列，其中該HBV聚合酶抗原不具有逆轉錄酶活性及核糖核酸酶H活性。

根據本申請案之實施例，疫苗組合或套組中之聚核苷酸可以連接或分開，由此使自此類聚核苷酸表現之HBV抗原融合在一起或作為獨立蛋白質產生，無論自相同抑或不同聚核苷酸表現。在一個實施例中，第一及第二聚核苷酸存在於單獨載體，例如RNA複製子中，其以組合形式使用於相同或單獨組合物中，使得所表現之蛋白質亦為單獨的蛋白質，但以組合形式使用。在另一個實施例中，由第一及第二聚核苷酸編碼的HBV抗原可以由同一載體表現，例如由此產生HBV核心-pol融合抗原。視情況，核心及pol抗原可以藉由短連接子接合或融合在一起。或者，由第一及第二聚核苷酸編碼的HBV抗原可以使用在核心與pol抗原編碼序列之間的核糖體滑移位點(又稱為順式水解酶位點)，獨立地由單一載體表現。此策略產生雙順反子表現載體，其中個別核心及pol抗原係由單一mRNA轉錄物產生。取決於mRNA轉錄物上編碼序列之次序，由此類雙順反子表現載體產生之核心及pol抗原可以具有其他N端或C端殘基。可用於此目的的核糖體滑移位點之實例包括但不限於來自口蹄疫病毒(FMDV)之FA2滑移位點。另一種可能係由第一及第二聚核苷酸編碼之HBV抗原可以獨立地由兩個獨立載體表現，一個載體編碼HBV核心抗原且一個編碼HBV pol抗原。

在一個較佳實施例中，第一及第二聚核苷酸存在於獨立自我複製RNA分子中。較佳地，獨立自我複製RNA分子存在於相同組合物中。

根據本申請案之較佳實施例，治療組合或套組包含存在於第一自我複製RNA分子中之第一聚核苷酸及存在於第二自我複製RNA分子中之第二聚核苷酸。第一及第二自我複製RNA分子可相同或不同。

在另一較佳實施例中，第一及第二聚核苷酸存在於單獨自我複製RNA分子中。

當本申請案之治療組合包含第一自我複製RNA分子及第二自我複製RNA分子時，第一及第二自我複製RNA分子中之各者之量不受特定限制。舉例而言，第一自我複製RNA分子及第二自我複製RNA分子可以按重量計10:1至1:10之比率存在，諸如按重量計10:1、9:1、8:1、7:1、6:1、5:1、4:1、3:1、2:1、1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9或1:10。較佳地，第一及第二自我複製RNA分子以按重量計1:1之比率存在。本申請案之治療組合可以進一步包含編碼適用於治療HBV感染之第三活性劑的第三載體。

本申請案之組合物及治療組合可以包含編碼其他HBV抗原及/或其他HBV抗原或其免疫原性片段之其他聚核苷酸或載體，諸如HBsAg、HBV L蛋白質或HBV包膜蛋白，或編碼其之聚核苷酸序列。然而，在特定實施例中，本申請案之組合物及治療組合不包含某些抗原。

在一個特定實施例中，本申請案之組合物或治療組合或套組不包含HBsAg或編碼HBsAg之聚核苷酸序列。

在另一特定實施例中，本申請案之組合物或治療組合或套組不包含HBV L蛋白或編碼HBV L蛋白之聚核苷酸序列。

在本申請案之又一特定實施例中，本申請案之組合物或治療組合不包含HBV包膜蛋白或編碼HBV包膜蛋白之聚核苷酸序列。

本申請案之組合物及治療組合亦可包含醫藥學上可接受之載劑。醫藥學上可接受之載劑係無毒的且不應干擾活性成分之功效。醫藥學上可接受之載劑可包括一或多種賦形劑，諸如黏合劑、崩解劑、膨潤劑、懸浮劑、乳化劑、潤濕劑、潤滑劑、調味劑、甜味劑、防腐劑、染料、增溶劑及包覆劑。醫藥學上可接受之載劑可包括媒劑，諸如脂質奈米顆粒(LNP)。載劑或其他材料之確切性質可取決於投與途徑，例如肌肉內、皮內、皮下、經口、靜脈內、皮膚、黏膜內(例如腸)、鼻內或腹膜內途徑。對於液體可注射製劑，例如懸浮液及溶液，適合的載劑及添加劑包括水、乙二醇、油、醇、防腐劑、著色劑及其類似物。對於固體口服製劑，例如散劑、膠囊、囊片、膠囊錠及錠劑，適合的載劑及添加劑包括澱粉、糖、稀釋劑、成粒劑、潤滑劑、黏合劑、崩解劑及其類似物。對於鼻噴霧劑/吸入劑混合物，水溶液/懸浮液可包含水、乙二醇、油、潤滑劑、穩定劑、潤濕劑、防腐劑、芳族化合物、調味劑及其類似物作為適合的載劑及添加劑。

本申請案之組合物及治療組合可以適合於向個體投與之任何物質調配以促進投與及改善功效，包括但不限於經口(經腸)投與及非經腸注射。非經腸注射包括靜脈內注射或輸注、皮下注射、皮內注射及肌肉內注射。本申請案之組合物亦可調配用於其他投與途徑，包括經黏膜、眼、直腸、長效植入、舌下投與(即在舌頭下方，自口腔黏膜投與，繞過門脈循環)、吸入或鼻內投與。

在本申請案之一個較佳實施例中，本申請案之組合物及治療組合係調配用於非經腸注射，較佳經皮下、皮內注射或肌肉內注射，更佳肌肉內注射。

根據本申請案之實施例，供投與之組合物及治療組合通常將包含於醫藥學上可接受之載劑，例如水性載劑中之緩衝溶液，諸如緩衝生理食鹽水及類似物，例如磷酸鹽緩衝生理食鹽水(PBS)。視需要，該等組合物及治療組合亦可含有醫藥學上可接受之物質以接近生理條件，諸如pH調節及緩衝劑。舉例而言，包含自我複製RNA分子之本申請案的組合物或治療組合可含有作為醫藥學上可接受之載劑的磷酸鹽緩衝生理食鹽水(PBS)。

本申請案之組合物及治療組合可根據此項技術中熟知之方法調配為疫苗(亦稱為「免疫原性組合物」)。此類組合物可以包括用以增強免疫反應之佐劑。根據本發明，調配物中各組分之最佳比率可以藉由熟習此項技術者熟知之技術測定。

在某些實施例中，另一佐劑可包括於本申請案之組合物或治療組合中，或與本申請案之組合物或治療組合共投與。另一佐劑之使用係可選的，且當組合物係用於疫苗接種目的時，其可以進一步增強免疫反應。適於共投與或包括在根據本申請案之組合物中的其他佐劑應較佳地為可能安全、具有良好耐受性且在人類中有效之佐劑。佐劑可以為小分子或抗體，包括但不限於免疫檢查點抑制劑(例如抗PD1、抗TIM-3等)、鐸樣受體促效劑(例如TLR7促效劑及/或TLR8促效劑)、RIG-1促效劑、IL-15超級促效劑(Altor Bioscience)、突變IRF3及IRF7基因佐劑、STING促效劑(Aduro)、FLT3L基因佐劑及IL-7-hyFc。舉例而言，佐劑亦可例如選自在以下中之抗HBV劑：HBV DNA聚合酶抑制劑；免疫調節劑；鐸樣受體7調節劑；鐸樣受體8調節劑；鐸樣受體3調節劑；干擾素α受體配體；玻尿酸酶抑制劑；IL-10調節劑；HBsAg抑制劑；鐸樣受體9調節劑；親環蛋白抑制劑；HBV預防性疫苗；HBV治療性疫苗；HBV病毒進入抑制劑；靶向病毒mRNA之反義寡核苷酸，更特定言之抗HBV反義寡核苷酸；短干擾RNA (siRNA)，更特定言之抗HBV siRNA；核酸內切酶調節劑；核糖核苷酸還原酶抑制劑；B型肝炎病毒E抗原抑制劑；靶向B型肝炎病毒之表面抗原的HBV抗體；HBV抗體；CCR2趨化因子拮抗劑；胸腺素促效劑；細胞介素，諸如IL12；衣殼組裝調節劑、核蛋白抑制劑(HBV核心或衣殼蛋白抑制劑)；核酸聚合物(NAP)；視黃酸誘導性基因1之刺激劑；NOD2刺激劑；重組胸腺素α-1；B型肝炎病毒複製抑制劑；PI3K抑制劑；cccDNA抑制劑；免疫檢查點抑制劑，諸如PD-L1抑制劑、PD-1抑制劑、TIM-3抑制劑、TIGIT抑制劑、Lag3抑制劑及CTLA-4抑制劑；在免疫細胞(更特定言之T細胞)上表現之共刺激受體，諸如CD27、CD28等的促效劑；BTK抑制劑；用於治療HBV之其他藥物；IDO抑制劑；精胺酸酶抑制劑；以及KDM5抑制劑。

在某些實施例中，第一及第二非天然存在之核酸分子中之各者獨立地與脂質奈米顆粒(LNP)調配。

本申請案亦提供製備本申請案之組合物及治療組合的方法。一種產生組合物或治療組合之方法，其包含將編碼本申請案之HBV抗原、載體及/或多肽的經分離聚核苷酸與一或多種醫藥學上可接受之載劑混合。一般熟習此項技術者將熟悉用於製備此類組合物之習知技術。

誘導免疫反應或治療 HBV 感染之方法本申請案亦提供在有需要之個體中誘發針對B型肝炎病毒(HBV)之免疫反應的方法，其包含向該個體投與免疫原性有效量的本申請案之組合物或免疫性組合物。本文所描述之本申請案之組合物及治療組合中之任一者可用於本申請案之方法中。

如本文所使用，術語「感染」係指致病原對宿主之侵襲。當致病原能夠侵襲宿主，且在宿主內複製或繁殖時，認為其具有「感染性」。感染劑之實例包括病毒，例如HBV及某些物種之腺病毒、朊病毒、細菌、真菌、原蟲及類似物。「HBV感染」特指HBV對宿主生物體，諸如宿主生物體之細胞及組織之侵襲。

當關於本文所描述之方法使用時，短語「誘發免疫反應」涵蓋在有需要之個體中引起針對感染，例如HBV感染之所需免疫反應或作用。「誘發免疫反應」亦涵蓋提供針對病原體，例如HBV之治療性免疫以進行治療。如本文所使用，術語「治療性免疫」或「治療性免疫反應」意思指經疫苗接種之個體能夠控制疫苗接種所針對之病原體感染，例如藉由用HBV疫苗進行疫苗接種引起針對HBV感染之免疫。在一個實施例中，「誘發免疫反應」意謂在有需要之個體中產生免疫，例如以提供針對疾病，諸如HBV感染之治療作用。在某些實施例中，「誘發免疫反應」係指引起或改善針對HBV感染之細胞免疫，例如T細胞反應。在某些實施例中，「誘發免疫反應」係指引起或改善針對HBV感染之體液免疫反應。在某些實施例中，「誘發免疫反應」係指引起或改善針對HBV感染之細胞及體液免疫反應。

如本文所使用，術語「保護性免疫」或「保護性免疫反應」意思指經疫苗接種之個體能夠控制該疫苗接種所針對之病原體感染。通常，產生「保護性免疫反應」之個體僅產生輕度至中度臨床症狀或完全無症狀。通常，針對某一病原體具有「保護性免疫反應」或「保護性免疫」之個體將不會死於該病原體感染。

通常，本申請案之組合物及治療組合的投與將具有治療目的，以在HBV感染或發展HIV感染特有之症狀之後產生針對HBV之免疫反應，例如用於治療性疫苗接種。

如本文所使用，「免疫原性有效量」或「免疫有效量」意謂足以在有需要之個體中誘發所需免疫作用或免疫反應的組合物、聚核苷酸、載體或抗原之量。免疫原性有效量可以為足以在有需要之個體中誘發免疫反應的量。免疫原性有效量可以為足以在有需要之個體中產生免疫性，例如針對疾病，諸如HBV感染提供治療作用的量。免疫原性有效量可以取決於多種因素而變化，諸如個體之身體狀況，年齡、體重、健康狀況等；具體應用，例如提供保護性免疫或治療性免疫；以及免疫需要針對之具體疾病，例如病毒感染。一般熟習此項技術者根據本發明可以容易地確定免疫原性有效量。

在本申請案之具體實施例中，免疫原性有效量係指足以達成以下效果中之至少一個、兩個、三個、四個或更多個之組合物或治療組合之量：(i)降低或改善HBV感染或其相關症狀之嚴重程度；(ii)降低HBV感染或其相關症狀之持續時間；(iii)預防HBV感染或其相關症狀之進展；(iv)使得HBV感染或其相關症狀消退；(v)預防HBV感染或其相關症狀之發展或發作；(vi)預防HBV感染或其相關症狀復發；(vii)減少患有HBV感染之個體住院；(viii)降低患有HBV感染之個體之住院時長；(ix)提高患有HBV感染之個體之存活率；(x)消除個體中之HBV感染；(xi)抑制或降低個體中之HBV複製；及/或(xii)增強或改善另一療法之預防性或治療效果。

免疫原性有效量亦可為足以減小HBsAg含量以符合臨床血清轉化之發展；利用個體之免疫系統實現持久HBsAg清除以及減少受感染肝細胞；誘導HBV抗原特異性活化之T細胞群體；及/或在12個月內實現持久的HBsAg喪失的量。目標指標之實例包括下限HBsAb低於500個複本之HBsAg國際單位(IU)之臨限值及/或更高CD8計數。

預期屬於相對較寬範圍內的量可以經由常規試驗確定。本發明之組合物之RNA含量一般將根據每劑量RNA之量來表示。舉例而言，劑量可具有≦10 μg RNA，且可在低得多的含量下看到表現，例如≦1 μg/劑量、≦100 ng/劑量、≦10 ng/劑量、≦1 ng/劑量等。

免疫原性有效量可以來自一個載體或來自多個載體。作為其他通用指導，在參考肽使用時，免疫原性有效量可在每次投與約10 μg至1 mg範圍內，諸如每次投與10、20、50、100、200、300、400、500、600、700、800、9000或1000 μg。免疫原性有效量可以經單一組合物或經多種組合物，諸如1、2、3、4、5、6、7、8、9或10種組合物(例如錠劑、膠囊或可注射劑，或適於皮內遞送，例如適於使用皮內遞送貼片皮內遞送的任何組合物)投與，其中多個膠囊或多次注射液的投與總體向個體提供免疫原性有效量。亦可按所謂的初打-加打方案，向個體投與免疫原性有效量，且隨後向該個體投與另一劑免疫原性有效量。此初打-加打方案之通用概念係熟習疫苗領域之技術者熟知的。視需要，可以視情況在該方案中添加其他追加劑投與。

包含兩個自我複製RNA分子，例如編碼HBV核心抗原之第一自我複製RNA分子及編碼HBV pol抗原之第二自我複製RNA分子的治療組合可藉由混合兩種複製子且將混合物遞送至單一解剖部位來投與至個體。或者，可進行兩次獨立的免疫接種，分別遞送單一表現複製子。在此類實施例中，無論兩個質體係作為混合物以單次免疫接種投與抑或兩次獨立的免疫接種投與，第一自我複製RNA分子及第二自我複製RNA分子可以按重量計10:1至1:10，諸如10:1、9:1、8:1、7:1、6:1、5:1、4:1、3:1、2:1、1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、或1:10之比率投與。較佳地，第一及第二自我複製RNA分子以按重量計1:1之比率投與。

較佳地，根據本申請案之方法的待治療個體係感染HBV之個體，特別是患有慢性HBV感染之個體。急性HBV感染之特徵在於先天免疫系統之高效活化加上隨後的廣泛適應性反應(例如HBV特異性T細胞、中和抗體)，由此通常引起複製之成功抑制或受感染肝細胞之移除。相比之下，此類反應由於高病毒及抗原負荷而減弱或減小，例如HBV包膜蛋白大量產生且可以相對於感染性病毒1,000倍過量釋放於亞病毒粒子中。

慢性HBV感染係分階段描述的，以病毒負荷、肝酶含量(壞死性炎症活動)、HBeAg或HBsAg負荷，或者針對該等抗原之抗體之存在表徵。cccDNA含量保持相對恆定，每個細胞有約10至50個複本，即使病毒血症可能變化極大。 cccDNA物種之存留使得慢性化。更具體言之，慢性HBV感染之階段包括：(i)免疫耐受期，以高病毒負荷及正常或升高極小之肝酶為特徵；(ii)免疫活化HBeAg陽性期，在此階段觀察到較低或下降水準之病毒複製及明顯升高之肝酶；(iii)非活動性HBsAg攜帶期，該階段係具有較低病毒負荷之低複製狀態且在血清中具有可以遵循HBeAg血清轉化之正常肝酶含量；以及(iv)HBeAg陰性期，在該階段中，定期發生病毒複製(再活化)且伴隨肝酶含量之波動，在前核心及/或基礎核心啟動子中之突變係常見的，使得受感染細胞無法產生HBeAg。

如本文所使用，「慢性HBV感染」係指個體中可偵測到HBV存在超過6個月。患有慢性HBV感染之個體可以處於慢性HBV感染之任何階段。慢性HBV感染係根據其在領域中之一般含義理解。慢性HBV感染可例如以急性HBV感染之後HBsAg存留達6個月或更長時間為特徵。舉例而言，本文所提及的慢性HBV感染遵循疾病控制與預防中心(Centers for Disease Control and Prevention，CDC)所公開之定義，根據該定義，慢性HBV感染可藉由實驗室標準表徵，諸如：(i)針對B型肝炎核心抗原之IgM抗體呈陰性(IgM抗HBc)及針對B型肝炎表面抗原(HBsAg)、B型肝炎e抗原(HBeAg)或有關B型肝炎病毒DNA之核酸測試呈陽性；或(ii)針對HBsAg或有關HBV DNA之核酸測試呈陽性，或間隔至少6個月兩次針對HBeAg呈陽性。

較佳地，免疫原性有效量係指足以治療慢性HBV感染的本申請案之組合物或治療組合之量。

在一些實施例中，患有慢性HBV感染之個體正在經歷核苷類似物(NUC)治療，且受NUC抑制。如本文所使用，「受NUC抑制」係指個體具有不可偵測之HBV病毒含量及穩定丙胺酸轉胺酶(ALT)含量達至少六個月。核苷/核苷酸類似物治療之實例包括HBV聚合酶抑制劑，諸如恩替卡韋及替諾福韋。較佳地，患有慢性HBV感染之個體不會患上晚期肝纖維化或肝硬化。此類個體通常會具有小於3分的針對纖維化之METAVIR分數及小於9 kPa之肝纖維化掃描(fibroscan)結果。 METAVIR評分係藉由B型肝炎患者之肝切片之組織病理學評價來評估炎症及纖維化程度的一種常用評分系統。該評分系統指定兩個標準化數值：一個反映炎症之程度且一個反映纖維化之程度。

咸信消除或減輕慢性HBV可以允許包括病毒誘發肝硬化及肝細胞癌在內之重度肝病的早期疾病攔截。因此，本申請案之方法亦可用作治療HBV誘發之疾病的療法。 HBV誘發疾病之實例包括但不限於肝硬化、癌症(例如肝細胞癌)及纖維化，特別是以針對纖維化之METAVIR分數係3分或更高為特徵的晚期纖維化。在此類實施例中，免疫原性有效量係足以在12個月內達成HBsAg之持久喪失且明顯減輕臨床疾病(例如肝硬化、肝細胞癌等)的量。

根據本申請案之實施例的方法進一步包含向有需要之個體投與另一免疫原性藥劑(諸如另一HBV抗原或其他抗原)或另一抗HBV劑(諸如核苷類似物或其他抗HBV劑)與本申請案之組合物的組合。舉例而言，另一抗HBV劑或免疫原性劑可以為小分子或抗體，包括但不限於免疫檢查點抑制劑(例如，抗PD1、抗TIM-3等)、鐸樣受體促效劑(例如，TLR7促效劑及/或TLR8促效劑)、RIG -1促效劑、IL-15超級促效劑(Altor Bioscience)、突變IRF3及IRF7基因佐劑、STING促效劑(Aduro)、FLT3L基因佐劑、IL12基因佐劑IL-7-hyFc；與HBV env結合之CAR-T(S-CAR細胞)；衣殼組裝調節劑；cccDNA抑制劑、HBV聚合酶抑制劑(例如恩替卡韋及替諾福韋)。一種或其他抗HBV活性劑可以例如為小分子、抗體或其抗原結合片段、多肽、蛋白質或核酸。一或其他抗HBV劑可例如選自以下中：HBV DNA聚合酶抑制劑；免疫調節劑；鐸樣受體7調節劑；鐸樣受體8調節劑；鐸樣受體3調節劑；干擾素α受體配體；玻尿酸酶抑制劑；IL-10調節劑；HBsAg抑制劑；鐸樣受體9調節劑；親環蛋白抑制劑；HBV預防性疫苗；HBV治療性疫苗；HBV病毒進入抑制劑；靶向病毒mRNA之反義寡核苷酸，更特定言之抗HBV反義寡核苷酸；短干擾RNA (siRNA)，更特定言之抗HBV siRNA；核酸內切酶調節劑；核糖核苷酸還原酶抑制劑；B型肝炎病毒E抗原抑制劑；靶向B型肝炎病毒之表面抗原的HBV抗體；HBV抗體；CCR2趨化因子拮抗劑；胸腺素促效劑；細胞介素，諸如IL12；衣殼組裝調節劑、核蛋白抑制劑(HBV核心或衣殼蛋白抑制劑)；核酸聚合物(NAP)；視黃酸誘導性基因1之刺激劑；NOD2刺激劑；重組胸腺素α-1；B型肝炎病毒複製抑制劑；PI3K抑制劑；cccDNA抑制劑；免疫檢查點抑制劑，諸如PD-L1抑制劑、PD-1抑制劑、TIM-3抑制劑、TIGIT抑制劑、Lag3抑制劑及CTLA-4抑制劑；在免疫細胞(更特定言之T細胞)上表現之共刺激受體，諸如CD27、CD28等的促效劑；BTK抑制劑；用於治療HBV之其他藥物；IDO抑制劑；精胺酸酶抑制劑；以及KDM5抑制劑。

遞送方法本申請案之組合物及治療組合可以根據本發明，藉由此項技術中已知之任何方法向個體投與，包括但不限於非經腸投與(例如肌肉內、皮下、靜脈內或皮內注射)、經口投與、經皮投與及鼻投與。較佳地，組合物及治療組合係非經腸(例如藉由肌肉內注射或皮內注射)或經皮投與。

本發明之分子及/或組合物可使用一或多種脂質體、脂複合體及/或脂質奈米顆粒調配。在一個實施例中，本發明之分子及/或組合物之醫藥調配物包括脂質體(參見例如圖5A及圖5B)。脂質體為經人工製備之囊泡，其可主要由脂質雙層構成且可用作遞送媒劑以用於投與營養物質及醫藥調配物。脂質體可具有不同尺寸，諸如但不限於直徑可為數百奈米且可含有由狹窄水性隔室分離之一系列同心雙層的多層囊泡(MLV)、直徑可小於50 nm之小的單層囊泡(SUV)及直徑可在50 nm與500 nm之間的大的單層囊泡(LUV)。脂質體設計可包括但不限於調理素或配位體，以便改良脂質體連接至不健康組織或活化事件，諸如但不限於內飲作用。脂質體可含有低或高pH以便改良醫藥調配物之遞送。

脂質體之形成可視物理化學特徵而定，諸如但不限於：醫藥包覆調配物及脂質體成分；脂質囊泡分散於其中之介質之本質；包覆之物質之有效濃度及其潛在毒性；在囊泡之應用及/或遞送期間所涉及之任何其他方法；用於預期應用之囊泡之有效大小、多分散性及儲存期限；及批次間再現性及大規模產生安全及高效脂質產品的可能性。

在一些實施例中，本發明之分子及/或組合物可調配於脂質囊泡中，其可在官能化脂質雙層之間具有交聯。在一些實施例中，本發明之分子及/或組合物可調配於脂質-聚陽離子複合物中。脂質-聚陽離子複合物之形成可藉由此項技術中已知之方法實現。作為非限制性實例，聚陽離子可包括陽離子肽或多肽，諸如但不限於聚離胺酸、聚鳥胺酸及/或聚精胺酸及陽離子肽。在一些實施例中，本文揭示之核酸分子及/或組合物可調配於脂質聚陽離子複合物中，其可進一步包括中性脂質，諸如但不限於膽固醇或二油醯基磷脂醯乙醇胺(DOPE)。脂質體調配物可能受以下影響，但不限於陽離子脂質組分之選擇、陽離子脂質飽和程度、PEG化之性質、所有組分之比率及生理參數(諸如大小)。

在一些實施例中，脂質奈米顆粒(LNP)調配物中PEG之比率可增加或降低及/或PEG脂質之碳鏈長度可自C14至C18修飾以改變LNP調配物之藥物動力學及/或生物分佈。作為非限制性實例，相比於陽離子脂質、DSPC及膽固醇，LNP調配物可含有1-5% PEG-c-DOMG之脂質莫耳比。在另一實施例中，PEG-c-DOMG可用PEG脂質，諸如但不限於用PEG-DSG(1,2-二硬脂醯基-sn-甘油、甲氧基聚乙二醇)或PEG-DPG(1,2-二軟脂醯基-sn-甘油、甲氧基聚乙二醇)置換。陽離子脂質可選自此項技術中已知之任何脂質，諸如但不限於DLin-MC3-DMA、DLin-DMA、C12-200及DLin-KC2-DMA。

在一些實施例中，本文所述之LNP調配物可包含聚陽離子組合物。在一些實施例中，包含聚陽離子組合物之LNP調配物可用於活體內及/或活體外遞送本文所述之經修飾之RNA。在一些實施例中，本文所述之LNP調配物可另外包含滲透性增強劑分子。奈米顆粒調配物可為包含碳水化合物載體及經修飾之核酸分子(例如mRNA)之碳水化合物奈米顆粒。作為非限制性實例，碳水化合物載劑可包括但不限於經酸酐修飾之植物糖原或糖原型材料、植物糖原辛烯基丁二酸鹽、植物糖原β-糊精及經酸酐修飾之植物糖原β-糊精。

脂質奈米顆粒調配物可藉由用稱為快速排除之脂質奈米顆粒(reLNP)之可生物降解陽離子脂質置換陽離子脂質來改良。諸如但不限於DLinDMA、DLin-KC2-DMA及DLin-MC3-DMA之可電離陽離子脂質已展示隨時間推移積聚於血漿及組織中且可為潛在毒性來源。快速消除之脂質之快速代謝可藉由在大鼠中1 mg/kg劑量至10 mg/kg劑量之數量級改良脂質奈米顆粒之耐受性及治療指數。包括酶促降解之酯鍵可改良陽離子組分之降解及代謝曲線，同時仍維持reLNP調配物之活性。酯鍵可內部位於脂鏈內或其可端部位於脂鏈之末端。內部酯鍵可置換脂鏈中之任何碳。

可用於遞送編碼一或多種HBV抗原之核酸分子之脂質組合物的其他揭示內容可自2019年6月20日申請之標題為「Lipid Nanoparticle or Liposome Delivery of Hepatitis B Virus (HBV) Vaccines」之美國臨時專利申請案第62/863,958號發現，其內容特此以全文引用之方式併入。

本發明之分子及/或組合物亦可使用聚合物、脂質及/或其他可生物降解劑(諸如但不限於磷酸鈣聚合物)之組合調配為奈米顆粒。組分可組合於核殼、混合型及/或逐層架構中，以允許奈米顆粒之微調，使得可增強本發明之分子及/或組合物之遞送。

可用於遞送編碼一或多種HBV抗原之核酸分子之組合物的其他揭示內容可自2019年6月20日申請之標題為「Carbohydrate Nanoparticle Delivery of Hepatitis B Virus (HBV) Vaccines」之美國臨時專利申請案第62/863,950號發現，其內容特此以全文引用之方式併入。

遞送方法不限於上述實施例，且用於細胞內遞送之任何手段均可使用。

佐劑在本申請案之一些實施例中，誘發針對HBV之免疫反應的方法進一步包含投與佐劑。術語「佐劑」與「免疫刺激劑」在本文中可互換地使用，且定義為刺激免疫系統之一或多種物質。在此情形下，佐劑係用於增強針對本申請案之HBV抗原及抗原性HBV多肽之免疫反應。

根據本申請案之實施例，佐劑可以存在於本申請案之治療組合或組合物中，或以獨立組合物形式投與。佐劑可以為例如小分子或抗體。適用於本申請案之佐劑之實例包括但不限於免疫檢查點抑制劑(例如抗PD1、抗TIM-3等)、鐸樣受體促效劑(例如TLR7促效劑及/或TLR8促效劑)、RIG-1促效劑、IL-15超級促效劑(Altor Bioscience)、突變IRF3及IRF7基因佐劑、STING促效劑(Aduro)、FLT3L基因佐劑、IL12基因佐劑及IL-7-hyFc。佐劑之實例可例如選自在以下中之抗HBV劑：HBV DNA聚合酶抑制劑；免疫調節劑；鐸樣受體7調節劑；鐸樣受體8調節劑；鐸樣受體3調節劑；干擾素α受體配體；玻尿酸酶抑制劑；IL-10調節劑；HBsAg抑制劑；鐸樣受體9調節劑；親環蛋白抑制劑；HBV預防性疫苗；HBV治療性疫苗；HBV病毒進入抑制劑；靶向病毒mRNA之反義寡核苷酸，更特定言之抗HBV反義寡核苷酸；短干擾RNA (siRNA)，更特定言之抗HBV siRNA；核酸內切酶調節劑；核糖核苷酸還原酶抑制劑；B型肝炎病毒E抗原抑制劑；靶向B型肝炎病毒之表面抗原的HBV抗體；HBV抗體；CCR2趨化因子拮抗劑；胸腺素促效劑；細胞介素，諸如IL12；衣殼組裝調節劑、核蛋白抑制劑(HBV核心或衣殼蛋白抑制劑)；核酸聚合物(NAP)；視黃酸誘導性基因1之刺激劑；NOD2刺激劑；重組胸腺素α-1；B型肝炎病毒複製抑制劑；PI3K抑制劑；cccDNA抑制劑；免疫檢查點抑制劑，諸如PD-L1抑制劑、PD-1抑制劑、TIM-3抑制劑、TIGIT抑制劑、Lag3抑制劑及CTLA-4抑制劑；在免疫細胞(更特定言之T細胞)上表現之共刺激受體，諸如CD27、CD28等的促效劑；BTK抑制劑；用於治療HBV之其他藥物；IDO抑制劑；精胺酸酶抑制劑；以及KDM5抑制劑。

本申請案之組合物及治療組合亦可與至少一種其他抗HBV劑組合投與。適合用於本申請案的抗HBV劑之實例包括但不限於小分子、抗體，及/或結合HBV env之CAR-T療法(S-CAR細胞)、衣殼組裝調節劑、TLR促效劑(例如TLR7及/或TLR8促效劑)、cccDNA抑制劑、HBV聚合酶抑制劑(例如恩替卡韋及替諾福韋)及/或免疫檢查點抑制劑等。

至少一種抗HBV劑可例如選自以下中：HBV DNA聚合酶抑制劑；免疫調節劑；鐸樣受體7調節劑；鐸樣受體8調節劑；鐸樣受體3調節劑；干擾素α受體配體；玻尿酸酶抑制劑；IL-10調節劑；HBsAg抑制劑；鐸樣受體9調節劑；親環蛋白抑制劑；HBV預防性疫苗；HBV治療性疫苗；HBV病毒進入抑制劑；靶向病毒mRNA之反義寡核苷酸，更特定言之抗HBV反義寡核苷酸；短干擾RNA (siRNA)，更特定言之抗HBV siRNA；核酸內切酶調節劑；核糖核苷酸還原酶抑制劑；B型肝炎病毒E抗原抑制劑；靶向B型肝炎病毒之表面抗原的HBV抗體；HBV抗體；CCR2趨化因子拮抗劑；胸腺素促效劑；細胞介素，諸如IL12；衣殼組裝調節劑、核蛋白抑制劑(HBV核心或衣殼蛋白抑制劑)；核酸聚合物(NAP)；視黃酸誘導性基因1之刺激劑；NOD2刺激劑；重組胸腺素α-1；B型肝炎病毒複製抑制劑；PI3K抑制劑；cccDNA抑制劑；免疫檢查點抑制劑，諸如PD-L1抑制劑、PD-1抑制劑、TIM-3抑制劑、TIGIT抑制劑、Lag3抑制劑及CTLA-4抑制劑；在免疫細胞(更特定言之T細胞)上表現之共刺激受體，諸如CD27、CD28等的促效劑；BTK抑制劑；用於治療HBV之其他藥物；IDO抑制劑；精胺酸酶抑制劑；以及KDM5抑制劑。此類抗HBV劑可以與本申請案之組合物及治療組合同時或依序投與。

初打 / 加打免疫接種方法本申請案之實施例亦涵蓋在所謂的初打-加打方案中，向個體投與免疫原性有效量之組合物或治療組合，且隨後向該個體投與另一劑量之免疫原性有效量之組合物或治療組合。因此，在一個實施例中，本申請案之組合物或治療組合係用於引發免疫反應之初打疫苗。在另一個實施例中，本申請案之組合物或治療組合係用於增強免疫反應之加打疫苗。本申請案之初打及加打疫苗可以用於本文所描述的本申請案之方法中。此初打-加打方案之通用概念係熟習疫苗領域之技術者熟知的。本文所描述之本申請案之組合物及治療組合中之任一種可以用作初打及/或加打疫苗以引發及/或增強針對HBV之免疫反應。

在本申請案之一些實施例中，本申請案之組合物或治療組合可以投與用於初打免疫接種。組合物或治療組合可以再投與用於加打免疫接種。視需要，組合物或疫苗組合之進一步加打投與可以視情況添加至該方案中。佐劑可以存在於用於加打免疫接種的本申請案之組合物中，存在於欲投與本申請案之組合物或治療組合一起投與以用於加打免疫接種的獨立組合物中，或獨自投與作為加打免疫接種。在該方案中包括佐劑的彼等實施例中，佐劑較佳用於加打免疫接種。

初打-加打方案之說明性且非限制性實例包括向個體投與單次劑量的免疫原性有效量之本申請案之組合物或治療組合以引發免疫反應；且隨後投與另一劑量之免疫原性有效量的本申請案之組合物或治療組合以增強免疫反應，其中該加打免疫接種首次係在初始投與初打免疫接種之後約兩至六週，較佳四週投與。視情況，在初始投與初打免疫接種之後約10至14週，較佳12週，投與組合物或治療組合或其他佐劑之其他加打免疫接種。

套組本文亦提供一種套組，其包含本申請案之自我複製RNA分子。在一或多種獨立組合物中，套組可包含編碼第一聚核苷酸之自我複製RNA分子及編碼之第二聚核苷酸的自我複製RNA分子，或在單一組合物中，套組可包含編碼第一聚核苷酸之自我複製RNA分子及編碼第二聚核苷酸的自我複製RNA分子。套組可以進一步包含一或多種佐劑或免疫刺激劑，及/或其他抗HBV劑。

在向動物或人類生物體投與時誘發或刺激抗HBV免疫反應的能力可以使用此項技術中之多種標準分析法在活體外或活體內評價。有關可用於評價免疫反應之起始及活化之技術的大體描述，參見例如Coligan等人(1992及1994年, Current Protocols in Immunology; ed. J Wiley & Sons Inc, National Institute of Health)。細胞免疫之量測可藉由量測由活化之效應細胞，包括源於CD4+及CD8+ T細胞之該等細胞所分泌之細胞介素曲線(例如藉由ELISPOT定量產生IL-10或IFN γ之細胞)、藉由確定免疫效應細胞之活化狀態(例如藉由經典的[ ³H]胸苷吸收或基於流式細胞測量術進行之T細胞增殖分析)、藉由分析致敏個體中之抗原特異性T淋巴細胞(例如細胞毒性分析中之肽特異性溶解等)進行。

刺激細胞及/或體液反應之能力可藉由抗體結合及/或結合之競爭測定(參見例如Harlow, 1989, Antibodies, Cold Spring Harbor Press)。舉例而言，可以藉由酶聯結免疫吸附分析法(ELISA)量測響應於提供免疫原之組合物之投與而產生之抗體的力價。亦可藉由中和抗體分析法量測免疫反應，其中病毒之中和定義為經由特異性抗體對該病毒之反應/抑制/中和引起之感染性損失。免疫反應可進一步藉由抗體依賴性細胞吞噬作用(ADCP)分析法量測。

實施例本發明亦提供以下非限制性實施例。

實施例1為自我複製RNA分子，其包含以下中之至少一者： a) 編碼截短HBV核心抗原的第一聚核苷酸序列，該截短HBV核心抗原由與SEQ ID NO:2至少95%一致之胺基酸序列組成；及 b) 編碼HBV聚合酶抗原之第二聚核苷酸序列，該HBV聚合酶抗原由與SEQ ID NO:7至少90%一致之胺基酸序列組成，其中該HBV聚合酶抗原不具有逆轉錄酶活性及核糖核酸酶H活性。

實施例1a為如實施例1之自我複製RNA分子，其中在將該自我複製RNA分子投與細胞時，該自我複製RNA分子包含增強該經編碼之截短HBV核心抗原或該經編碼之HBV聚合酶抗原之表現的特徵。

實施例1b為如實施例1a之自我複製RNA分子，其包含： a) 一或多個非結構基因nsP1、nsP2、nsP3及nsP4； b) DLP基元及經修飾之5'-UTR中之至少一者； c) 亞基因體啟動子；及 d)可操作地連接至亞基因體啟動子之以下中之至少一者： i. 編碼截短HBV核心抗原的第一聚核苷酸序列，該截短HBV核心抗原由與SEQ ID NO:2至少95%一致之胺基酸序列組成；及 ii. 編碼HBV聚合酶抗原之第二聚核苷酸序列，該HBV聚合酶抗原由與SEQ ID NO:7至少90%一致之胺基酸序列組成，其中該HBV聚合酶抗原不具有逆轉錄酶活性及核糖核酸酶H活性。

實施例2為如實施例1-1b中任一項之自我複製RNA分子，其包含編碼截短HBV核心抗原的第一聚核苷酸序列，該截短HBV核心抗原由與SEQ ID NO:2至少95%一致之胺基酸序列組成。

實施例3為如實施例2之自我複製RNA分子，其包含編碼HBV聚合酶抗原之第二聚核苷酸序列，該HBV聚合酶抗原由與SEQ ID NO:7至少90%一致之胺基酸序列組成，其中該HBV聚合酶抗原不具有逆轉錄酶活性及核糖核酸酶H活性。

實施例4為如實施例3之自我複製RNA分子，其包含： a) 編碼截短HBV核心抗原的第一聚核苷酸序列，該截短HBV核心抗原由SEQ ID NO:2之胺基酸序列組成；及 b) 編碼HBV聚合酶抗原之第二聚核苷酸序列，該HBV聚合酶抗原包含SEQ ID NO:7之胺基酸序列，其中該HBV聚合酶抗原不具有逆轉錄酶活性及核糖核酸酶H活性。

實施例5為如實施例1-4中任一項之自我複製RNA分子，其中該第一聚核苷酸進一步包含編碼可操作地連接至該截短HBV核心抗原之N端的信號序列的聚核苷酸序列。

實施例5a為如實施例1-5中任一項之自我複製RNA分子，其中該第二聚核苷酸進一步包含編碼可操作地連接至該HBV聚合酶抗原之N端的信號序列之聚核苷酸序列。

實施例5b為如實施例5或5a之自我複製RNA分子，其中該信號序列獨立地包含SEQ ID NO:9或SEQ ID NO:15之胺基酸序列。

實施例5c為如實施例5或5a之自我複製RNA分子，其中該信號序列獨立地由SEQ ID NO:8或SEQ ID NO:14之聚核苷酸序列編碼。

實施例6為如實施例1-5c中任一項之自我複製RNA分子，其中該HBV聚合酶抗原包含與SEQ ID NO:7至少98%，諸如至少98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致之胺基酸序列。

實施例6a為如實施例6之自我複製RNA分子，其中該HBV聚合酶抗原包含SEQ ID NO:7之胺基酸序列。

實施例6b為如實施例1至6a中任一項之自我複製RNA分子，其中該截短HBV核心抗原由以下組成：與SEQ ID NO:2至少98%，諸如至少98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致之胺基酸序列。

實施例6c為如實施例6b之自我複製RNA分子，其中該截短之HBV抗原由以下組成：SEQ ID NO:2或SEQ ID NO:4之胺基酸序列。

實施例7為如實施例1-6c中任一項之自我複製RNA分子，其中該第一聚核苷酸序列包含與SEQ ID NO:1或SEQ ID NO:3具有至少90%、諸如至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列一致性之聚核苷酸序列。

實施例7a為如實施例7之自我複製RNA分子，其中該第一聚核苷酸序列包含與SEQ ID NO:1或SEQ ID NO:3具有至少98%，諸如至少98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%序列一致性之聚核苷酸序列。

實施例8為如實施例7a之自我複製RNA分子，其中該第一聚核苷酸序列包含SEQ ID NO:1或SEQ ID NO:3之聚核苷酸序列。

實施例9為如實施例1至8中任一項之自我複製RNA分子，其中該第二聚核苷酸序列包含與SEQ ID NO:5或SEQ ID NO:6具有至少90%、諸如至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列一致性之聚核苷酸序列。

實施例9a為如實施例9之自我複製RNA分子，其中該第二聚核苷酸序列包含與SEQ ID NO:5或SEQ ID NO:6具有至少98%，諸如至少98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%序列一致性之聚核苷酸序列。

實施例10為如實施例9a之自我複製RNA分子，其中該第二聚核苷酸序列包含SEQ ID NO:5或SEQ ID NO:6之聚核苷酸序列。

實施例11為如實施例1至10中任一項之自我複製RNA分子，其編碼包含將該截短HBV核心抗原可操作地連接至該HBV聚合酶抗原之融合蛋白。

實施例12為如實施例11之自我複製RNA分子，其中該融合蛋白包含將該截短HBV核心抗原經由連接子可操作地連接至該HBV聚合酶抗原。

實施例13為如實施例12之自我複製RNA分子，其中該連接子包含胺基酸序列(AlaGly) _n，且n為2至5之整數。

實施例13a為如實施例13之自我複製RNA分子，其中該連接子由與SEQ ID NO:11至少90%一致，諸如與SEQ ID NO:11至少90%、91%、92%、93%、94%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致之聚核苷酸序列編碼。

實施例13b為如實施例13a之自我複製RNA分子，其中該連接子係由包含SEQ ID NO:11之聚核苷酸序列編碼。

實施例14為如實施例13-13b中任一項之自我複製RNA，其中該融合蛋白包含SEQ ID NO:16之胺基酸序列。

實施例15為如實施例1-14中任一項之自我複製RNA分子，其中該自我複製RNA為α病毒衍生之RNA複製子。

實施例15a為如實施例15之自我複製RNA分子，其中該自我複製RNA包含DLP基元。

實施例15b為如實施例15a之自我複製RNA分子，其中DLP基元源於屬於披膜病毒科之病毒物種之衣殼基因。

實施例15c為如實施例15a或15b之自我複製RNA分子，其中該自我複製RNA分子進一步包含用於可操作地連接DLP基元之下游及編碼HBV蛋白之第一或第二聚核苷酸之上游之自我蛋白酶肽的編碼序列。

實施例15d為如實施例15c之自我複製RNA分子，其中該自我蛋白酶肽係選自由以下組成之群：豬鐵士古病毒-1 2A(P2A)、口蹄疫病毒(FMDV) 2A(F2A)、馬鼻炎A病毒(ERAV) 2A(E2A)、明脈扁刺蛾病毒2A(T2A)、細胞質多角體病毒2A(BmCPV2A)、軟化病病毒2A(BmIFV2A)及其組合。

實施例15e為如實施例15a之自我複製RNA分子，其中RNA之複製子之DLP基元及其他基因元件描述於美國專利申請公開案US2018/0171340及國際專利申請公開案WO2018106615中，其以引用的方式併入本文中。

實施例16為如實施例1至15e中任一項之自我複製RNA分子，其中該RNA複製子包含α病毒非結構蛋白nsP1、nsP2、nsP3及nsP4。

實施例16a為如實施例16之自我複製RNA分子，其中RNA複製子不編碼功能性α病毒結構蛋白。

實施例16b為如實施例16之自我複製RNA分子，其中該RNA複製子編碼一或多種功能性α病毒結構蛋白。

實施例16c為如實施例16之自我複製RNA分子，其包含經修飾之5'非轉譯區(5'-UTR)。

實施例16d為如實施例16c之自我複製RNA分子，其中經修飾之5'-UTR在位置1、2、4處包含一或多個核苷酸取代或其組合。

實施例16e為如實施例16d之自我複製RNA分子，其中經修飾之5'-UTR包含位置2處之核苷酸取代，較佳地，經修飾之5'-UTR在位置2處具有U-＞G取代。

實施例16f為如實施例15c之自我複製RNA分子，其中RNA複製子之經修飾之5'-UTR及其他基因元件描述於美國專利申請公開案US2018/0104359及國際專利申請公開案WO2018075235中，其各者之內容以全文引用之方式併入本文中。

實施例16g為如實施例1之自我複製RNA分子，其進一步包含具有與SEQ ID NO:25至42中之任一者之核酸序列展示至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性之核苷酸序列的核酸分子，及在5'-UTR之位置2處的U-＞G取代，且其中經修飾之α病毒基因體或複製子RNA不含編碼病毒結構蛋白之序列的至少一部分。

實施例17為核酸分子，其包含(i)編碼病毒衣殼強化子之一或多個RNA莖環的第一核酸序列(圖6)或其變體；及(ii)可操作地連接至該第一核酸序列之第二核酸序列，其中該第二核酸序列編碼由與SEQ ID NO:2至少95%一致之胺基酸序列組成的截短HBV核心抗原；及由與SEQ ID NO:7至少90%一致之胺基酸序列組成的HBV聚合酶抗原，其中該HBV聚合酶抗原不具有逆轉錄酶活性及核糖核酸酶H活性。

實施例17a為如實施例17之核酸分子，其進一步包含將上游可操作地連接至第二核酸序列之自我蛋白酶肽之編碼序列；較佳地將下游可操作地連接至第一核酸序列且將上游可操作地連接至第二核酸序列之自我蛋白酶肽之編碼序列。

實施例17b為如實施例17a之核酸分子，其中該自我蛋白酶肽包含選自由以下組成之群的肽序列：豬鐵士古病毒-1 2A(P2A)、口蹄疫病毒(FMDV) 2A(F2A)、馬鼻炎A病毒(ERAV) 2A(E2A)、明脈扁刺蛾病毒2A(T2A)、細胞質多角體病毒2A(BmCPV2A)、軟化病病毒2A(BmIFV2A)及其組合。

實施例17c為如實施例17-17b中任一項之核酸分子，其中該病毒衣殼強化子源於屬於披膜病毒科之病毒物種之衣殼基因。在一些實施例中，α病毒物種為東部馬腦炎病毒(EEEV)、委內瑞拉馬腦炎病毒(VEEV)、沼澤地病毒(EVEV)、穆坎布病毒(MUCV)、勝利基森林病毒(SFV)、皮春納病毒(PIXV)、米德爾堡病毒(MIDV)、屈公病毒(CHIKV)、奧-奈氏病毒(ONNV)、羅斯河病毒(RRV)、巴馬森林病毒(BF)、蓋塔病毒(GET)、鷺山病毒(SAGV)、貝巴魯病毒(BEBV)、馬雅羅病毒(MAYV)、烏納病毒(UNAV)、辛得比斯病毒(SINV)、奧拉病毒(AURAV)、沃達羅河病毒(WHAV)、巴班基病毒(BABV)、克孜拉格赫病毒(KYZV)、西部馬腦炎病毒(WEEV)、高地J病毒(HJV)、摩根堡病毒(FMV)、恩杜穆(NDUV)、鮭科魚α病毒(SAV)或車溪病毒，較佳地該病毒衣殼強化子包含病毒物種之下游環(DLP)基元。

實施例17d為如實施例17-17c中任一項之核酸分子，其中該病毒衣殼強化子包含與SEQ ID NO:43-50中之至少一者展現至少80%、85%、90%、95%或100%序列一致性的核酸序列。

實施例17e為如實施例17-17d中之任一者之核酸分子，其進一步包含第三核酸序列，該第三核酸序列編碼第二病毒衣殼強化子或其變體之一或多個RNA衣殼環，及可操作地連接於第三核酸序列之第四核酸序列，其中該第四核酸序列包含用於相關第二基因(GOI)之編碼序列。

實施例17f為如實施例17e之核酸分子，其進一步包含第二自我蛋白酶肽之編碼序列，該第二自我蛋白酶肽可操作地將下游連接至第三核酸序列且將上游連接至第四核酸序列。

實施例17g為如實施例17至17f中任一項之核酸分子，其中該自我複製RNA分子含有新世界α病毒非結構蛋白nsP1、nsP2及nsP4；及α病毒nsP3蛋白宏域、中心域及高變域，其中該高變域源於舊世界α病毒nsP3高變域，或嵌合nsP3高變域源於新世界α病毒nsP3高變域之一部分及來自舊世界α病毒nsP3高變域的另一部分。

實施例17h為如實施例17g之核酸分子，其中α病毒nsP3宏域及α病毒nsP3中心域來自新世界α病毒。

實施例17i為如實施例17g之核酸分子，其中α病毒nsP3宏域及α病毒nsP3中心域來自舊世界α病毒。

實施例17j為如實施例17g至17i中任一項之核酸分子，其中源於舊世界α病毒nsP3高變域之部分包含選自由FGDF及FGSF組成之群的基元。

實施例17k為如實施例17j之核酸分子，其中舊世界α病毒nsP3高變域包含選自由以下組成之群的重複序列：FGDF/FGDF重複序列、FGSF/FGSF重複序列、FGDF/FGSF重複序列及FGSF/FGDF重複序列，較佳地該等重複序列藉由至少10個且不超過25個胺基酸間隔。

實施例17l為如實施例17k之核酸分子，其中該等重複序列由源於由以下組成之群的胺基酸序列間隔：SEQ ID NO:56:NEGEIESLSSELLT及SEQ ID NO:57:SDGEIDELSRRVTTESEPVL及SEQ ID NO:58:DEHEVDALASGIT。

實施例17m為如實施例17g至17l中任一項之核酸分子，其中源於舊世界α病毒高變域之部分可具有CHIKV nsP3 HVD之胺基酸479-482或497-500或479-500或335-517中之任一者；或SFV nsP3 HVD之胺基酸451-454或468-471或451-471中之任一者；或SFV nsP3 HVD之胺基酸490-493或513-516或490-516或335-538。

實施例17m為如實施例17g至17m中之任一項之核酸分子，其中新世界α病毒可為VEEV且源於新世界α病毒高變域之部分不包含VEEV nsP3高變域之胺基酸478-518；或不包含VEEV nsP3高變域之胺基酸478-545；或不包含VEEV nsP3高變域之胺基酸335-518。

實施例17n為如實施例17g至17m中之任一項之核酸分子，其中新世界α病毒可為EEEV，且源於新世界α病毒高變域之部分不包含EEEV高變域之胺基酸531-547，或新世界α病毒可為WEEV，且源於新世界α病毒高變域之部分不包含WEEV高變域之胺基酸504-520。

實施例17o為如實施例17g至17n中之任一項之核酸分子，其中新世界α病毒為EEEV，nsP2/nsP3序列可為(SEQ ID NO:64) QHEAGR/APAY，且保留有倒數第二個G，較佳地，在nsP3/nsP4接合點處之序列可為(SEQ ID NO:65) RYEAGA/YIFS，且倒數第二個甘胺酸可視情況保留，同時其餘的nsP3胺基酸如本文所述變化；此等序列亦可位於通讀終止密碼子(TGA)之前。

實施例17p為如實施例17g至17n中之任一項之核酸分子，其中新世界α病毒為WEEV，且nsP2/nsP3接合點可為(SEQ ID NO:66) RYEAGR/APAY，且保留倒數第二個G，同時nsP2/nsP3接合點，較佳地WEEV之nsP3/nsP4接合點中之其餘胺基酸如本文所述變化，序列可為(SEQ ID NO:67)RYEAGA/YIFS，其中保留倒數第二個甘胺酸，且其餘nsP3胺基酸如本文所述變化，此等序列亦可位於通讀終止密碼子(TGA)之前。

實施例17q為如實施例17o或17p之核酸分子，其中SEQ ID NO:62-67之序列亦可在N端及/或C端側上含有一或兩個或三個取代。

實施例18為一種組合物，其包含如實施例1至17p中任一項之自我複製RNA及醫藥學上可接受之載劑。

實施例19為如實施例18之組合物，其中自我複製RNA分子囊封在脂質體、脂複合體、脂質奈米顆粒或其組合中，結合至脂質體、脂複合體、脂質奈米顆粒或其組合或吸附於脂質體、脂複合體、脂質奈米顆粒或其組合上。

實施例20為如實施例19之組合物，其中該自我複製RNA分子囊封於脂質奈米顆粒中。

實施例21為一種套組，其包含如實施例1至17p中任一項之自我複製RNA分子或如實施例19至20中任一項之組合物，及在治療有需要之個體之B型肝炎病毒(HBV)感染中使用該治療組合的說明書。

實施例22為一種治療有需要之個體之B型肝炎病毒(HBV)感染的方法，其包含向該個體投與如實施例1至17p中任一項之自我複製RNA分子或如實施例19至20中任一項之組合物。

實施例22a為如實施例22之方法，其中該治療在有需要之個體中誘發針對B型肝炎病毒之免疫反應，較佳該個體患有慢性HBV感染。

實施例22b為如實施例22或22a之方法，其中該個體患有慢性HBV感染。

實施例22c為如實施例22至22b中任一項之方法，其中該個體需要治療選自由晚期纖維化、肝硬化及肝細胞癌(HCC)組成之群的HBV誘發之疾病。

實施例22d為如實施例22-22c中任一項之方法，其中該組合物係藉由注射經由皮膚投與，例如肌肉內或皮內注射，較佳肌肉內注射。

實例熟習此項技術者應瞭解，在不脫離本發明之較廣泛發明概念之情況下，可對上述具體實例作出改變。因此，應理解，本發明不限於所揭示之特定實施例，而是意圖涵蓋在本發明說明所限定的本發明精神及範圍內之修改。

實例 1 . HBV 核心質體及 HBV pol 質體pDK-pol及pDK-核心載體之示意性表示分別展示於圖1A及1B中。使用標準分子生物學技術將含有CMV啟動子(SEQ ID NO:18)、剪接強化子(參複合序列) (SEQ ID NO:10)、胱抑素S前驅體信號肽SPCS(NP_0018901.1) (SEQ ID NO:9)及pol(SEQ ID NO:5)或核心(SEQ ID NO:2)基因之HBV核心或pol抗原最佳化之表現卡匣引入至pDK質體主鏈中。

藉由西方墨點分析，使用核心及pol特異性抗體，針對核心及pol抗原表現在活體外測試該等質體，且顯示其以提供針對細胞及所分泌之核心及pol抗原的一致表現圖譜(資料未顯示)。

實例 2 ： 表現截短 HBV 核心抗原與 HBV Pol 抗原之融合物的腺病毒載體之產生產生一種經設計為自單一開放閱讀框架表現融合蛋白的腺病毒載體。亦可設想例如使用兩個獨立表現卡匣，或使用2A樣序列分開兩個序列以表現兩種蛋白質之其他組態。

有關腺病毒載體之表現卡匣的設計表現卡匣(圖解於圖2A及圖2B中)包含CMV啟動子(SEQ ID NO:19)、內含子(SEQ ID NO:12)(源於人類ApoAI基因之片段-Genbank寄存號X01038鹼基對295-523，帶有ApoAI第二內含子)，隨後為在人類免疫球蛋白分泌信號編碼序列(SEQ ID NO:14)之後的經優化編碼序列，即單獨核心或核心與聚合酶融合蛋白，且隨後為SV40聚腺苷酸化信號(SEQ ID NO:13)。

包括分泌信號係歸因於過去一些含有分泌型轉殖基因的腺病毒載體顯示可製造性之改良，同時不影響所引發之T細胞反應的經驗(小鼠實驗)。

核心蛋白的最後兩個殘基(VV)及聚合酶蛋白質之前兩個殘基(MP)若融合，則產生接合序列(VVMP)，其存在於人類多巴胺受體蛋白(D3同功異型物)以及側接同源序列上。

核心與聚合酶序列之間AGAG連接子之插入消除此同源序列且恢復成在人類蛋白質組之Blast中無其他匹配(hit)。

實例 3 . 小鼠中之 DNA 疫苗之活體內免疫原性研究在小鼠中測試含有編碼HBV核心抗原或HBV聚合酶抗原之DNA質體的免疫治療性DNA疫苗。本研究之目的係設計用於偵測該疫苗在經由電穿孔肌肉內遞送至BALB/c小鼠中之後誘發的T細胞反應。初始免疫原性研究集中在確定由引入之HBV抗原引發的細胞免疫反應。

詳言之，測試質體包括pDK-Pol質體及pDK-核心質體，分別如圖1A及圖1B中所示且如上文在實例1中所描述。 pDK-Pol質體編碼具有SEQ ID NO:7之胺基酸序列的聚合酶抗原，且pDK-核心質體編碼具有SEQ ID NO:2之胺基酸序列的核心抗原。首先，個別地測試由各質體誘發之T細胞反應。使用適合用於小鼠模型中之脛前肌中的可商購之TriGrid ^TM遞送系統-肌肉內(TDS-IM)，將DNA質體(pDNA)疫苗經由電穿孔肌肉內遞送至Balb/c小鼠中。有關藉由電穿孔將DNA肌肉內遞送至小鼠之方法及裝置的其他描述，參見國際專利申請公開案WO2017172838，及2017年12月19日申請之標題為「用於遞送B型肝炎病毒(HBV)疫苗之方法及裝置(Method and Apparatus for the Delivery of Hepatitis B Virus(HBV)Vaccines)」的美國專利申請案第62/607,430號，其揭示內容以全文引用的方式併入本文中。詳言之，將具有電極之間之間距為2.5 mm及電極直徑為0.030吋之電極陣列的TDS-IM v1.0裝置之TDS-IM陣列經皮插入選定之肌肉中，其中導電長度為3.2 mm及有效穿透深度為3.2 mm，且其中電極之菱形組態的長軸平行於肌纖維取向。在電極插入之後，起始注射以將DNA(例如0.020 ml)分配於肌肉中。在完成IM注射之後，在約400 ms之總持續時間內，以10%工作循環(亦即，在約400 ms持續時間內，有效地施加電壓總計約40 ms)局部施加250 V/cm電場(施加之電壓為59.4-65.6 V，施加電流之限值小於4 A，0/16 A/sec)，總計6次脈衝。在完成電穿孔程序之後，移除TriGridTM陣列且使動物恢復。如表1中所概述，向BALB/c小鼠投與高劑量(20 µg)。向六隻小鼠投與編碼HBV核心抗原之質體DNA(pDK-核心；第1組)，向六隻小鼠投與編碼HBV pol抗原之質體DNA(pDK-pol；第2組)，且兩隻小鼠接受空載體作為陰性對照。動物間隔兩週接受兩次DNA免疫接種且在最後一次免疫接種之後一週收集脾細胞。表 1 ： 預備試驗之小鼠免疫接種實驗設計 .

組	N	pDNA	單側投與部位 ( 每側交替投與 )	劑量	體積	投與天數	終點 ( 收集脾 ) 日
1	6	核心	CT + EP	20 µg	20 µL	0, 14	21
2	6	Pol	CT + EP	20 µg	20 µL	0, 14	21
3	2	空載體(陰性對照)	CT + EP	20 µg	20 µL	0, 14	21

CT，脛前肌；EP，電穿孔。

藉由IFN-γ酶聯免疫斑點(ELISPOT)分析及定量抗原特異性反應。在此分析法中，將自經免疫接種之動物分離的脾細胞與包含核心蛋白、Pol蛋白質或小肽前導序列及接合序列(每種肽2 μg/ml)的肽池一起培育隔夜。該等池由重疊11個殘基之15聚體肽組成，該等殘基匹配核心及Pol疫苗載體之基因型BCD共同序列。將較大的94 kDa HBV Pol蛋白質自中間分裂至兩個肽池中。用同源肽池刺激抗原特異性T細胞且使用ELISPOT分析法評估IFN-γ陽性T細胞。利用適當抗體且隨後顯色偵測來觀測在微量盤上呈有色斑點(稱為斑點形成細胞(SFC))形式的單一抗原特異性T細胞釋放之IFN-γ。

在用DNA疫苗質體pDK-核心(第1組)免疫接種之小鼠中獲得針對HBV核心之顯著T細胞反應，達到每10 ⁶個細胞1,000個SFC(圖3)。針對Pol 1肽池的Pol T細胞反應較強(每10 ⁶個細胞約1,000個SFC)。針對Pol-2之抗Pol細胞反應較弱可能歸因於小鼠中有限之MHC多樣性，此現象稱為T細胞免疫顯性，定義為一種抗原中之不同抗原決定基的不等識別。進行確證研究以確認本研究中獲得的結果(資料未顯示)。

以上結果展示，用編碼HBV抗原之DNA質體疫苗進行疫苗接種誘發針對在小鼠中投與之HBV抗原的細胞免疫反應。亦用非人類靈長類動物獲得類似結果(資料未展示)。

實例 4 - 基於 VEEV 複製子之免疫原性藉由用編碼VEEV nsP3之胺基酸335-518的核苷酸序列置換編碼Chikungunya nsP3之胺基酸335-517的核苷酸序列來構築編碼突變nsP3之基於VEEV之α病毒複製子，以產生表現VEEV/CHIKV nsP3嵌合體之基於VEEV的複製子。此置換移除來自VEEV之重複序列的第一基元，且將其置換為來自CHIKV基因體之FGDF/FGDF重複序列(在胺基酸479-482及497-500處)。在平行實驗中，用辛德比病毒nsP3胺基酸(HVD區)之胺基酸335-538置換VEEV nsP3(HVD區)之胺基酸335-538以產生編碼VEEV/SINV nsP3嵌合體之複製子(圖8及圖12)。此置換移除來自VEEV之重複序列且將其置換為來自SINV之FGSF/FGSF重複序列。藉由電穿孔將含有VEEV/CHIKV或VEEV/SINV嵌合nsP3及表現來自亞基因體RNA之紅色螢火蟲螢光素酶(rFF)報導子之複製子一式三份地遞送至BHK-21細胞中。在電穿孔之後，將一部分細胞塗佈於6孔盤之一個孔及96孔盤之一個孔中，且使其恢復20小時。將經電穿孔之細胞針對dsRNA之存在染色且藉由流式細胞測量術分析，以測定作為複製子擴增之量度之dsRNA陽性細胞之頻率。吾人發現含有突變nsP3之複製子複製至與含有WT nsP3之複製子相同的含量(圖8B)。當分析螢光素酶活性時，在含有WT之複製子或nsP3之指定突變體形式之間未發現差異(圖8C)。

實例 5 - 異源蛋白質自複製子之表現此實例檢測來自編碼如圖8A中所描述之突變nsP3之複製子(實例4)的重組螢火蟲螢光素酶(rFF)之活體內表現。將含一或十個微克複製子RNA之生理鹽水肌肉內遞送(IM)至BALB/c小鼠之四頭肌肌肉中。在指定時間點，使用可商購之活體內成像系統活體內監測螢光素酶活性且以總通量報導(圖9A及9B)。資料顯示，表現nsP3之突變形式的複製子與含有來自VEEV之野生型nsP3的複製子相比展現類似的活體內螢光素酶活性含量。

實例 6 - 免疫原性此實例檢驗相對於使用野生型(wt)VEEV nsP3之複製子之免疫原性，編碼nsP3之VEEV/CHIKV嵌合形式之基於VEEV之複製子之免疫原性(來自實例4)。來自流感之H5N1株之各複製子編碼及表現HA作為異源蛋白。在第0天將2.0 ug或0.2 ug含RNA之生理鹽水肌肉內遞送至BALB/c小鼠之四頭肌肌肉且在第28天用相同複製子RNA及劑量加打。在加打後兩週(初打後第42天)收集脾臟及血清。藉由ELISA分析血清之HA特異性抗體(圖10)。資料顯示，相較於具有野生型nsP3之複製子，編碼VEEV/CHIKV nsP3嵌合體之複製子顯著減少HA特異性IgG力價。

對比而言，對半衰期短之效應及記憶前驅體效應子CD8+ T細胞之分析展示在所測試之不同複製子之間HA特異性細胞之頻率無差異(圖9B及C)。圖11A顯示在野生型、VEEV/SINV nsP3與VEEV/CHIKV nsP3 RNA複製子之間的類似頻率之HA特異性半衰期短之效應CD8+ T細胞。圖11B展示記憶效應CD8+ T細胞之類似結果。

應理解，本文所描述之實例及實施例僅出於說明之目的，且在不背離其廣義發明概念情況下，可以對以上描述之實施例作出改變。因此，應理解，本發明不限於所揭示之特定實施例，而是意圖涵蓋在所附申請專利範圍所限定之本發明精神及範圍內之修改。

當結合隨附圖式閱讀時，將更好地理解本申請案之前述發明內容以及較佳實施例之以下詳細描述。然而應理解，本申請案不限於附圖中顯示之精確實施例。

圖1A及圖1B顯示根據本申請案之實施例之DNA質體的示意性表示；圖1A 顯示根據本申請案之實施例的編碼HBV核心抗原之DNA質體；圖1B顯示根據本申請案之實施例的編碼HBV聚合酶(pol)抗原之DNA質體；HBV核心及pol抗原係在CMV啟動子控制下表現，該CMV啟動子具有在自細胞分泌後自所表現之抗原裂解的N端胱抑素S信號肽；該質體之轉錄調控元件包括位於CMV啟動子與編碼HBV抗原之聚核苷酸序列之間的強化子序列及位於編碼HBV抗原之聚核苷酸序列下游的bGH聚腺苷酸化序列；第二表現卡匣以逆向取向包括於質體中，該逆向取向包括在Ampr(bla)啟動子之控制下之卡那黴素抗性基因；複製起點(pUC)亦以反向取向包括在內。

圖2A及圖2B顯示根據本申請案之實施例的腺病毒載體中之表現卡匣之示意性表示；圖2A顯示截短HBV核心抗原的表現卡匣，其含有CMV啟動子、內含子(源於人類ApoAI基因之片段-GenBank寄存編號X01038鹼基對295-523，帶有ApoAI第二內含子)、人類免疫球蛋白分泌信號，隨後為截短HBV核心抗原的編碼序列及SV40聚腺苷酸化信號；圖2B顯示將截短HBV核心抗原可操作地連接至HBV聚合酶抗原之融合蛋白的表現卡匣，除HBV抗原外，其在其他方面與截短HBV核心抗原之表現卡匣一致。

圖3顯示如實例3中所述，用表現HBV核心抗原或HBV pol抗原之不同DNA質體免疫接種之Balb/c小鼠的ELISPOT反應；用於刺激自各種經疫苗接種動物組分離之脾細胞的肽池以灰度階指示；反應性T細胞之數目在Y軸上表示為每10 ⁶個脾細胞之斑點形成細胞(SFC)。

圖4A展示勝利基森林病毒之α病毒基因體、在5'端編碼非結構性聚合蛋白及在3'端編碼結構性基因(衣殼及糖蛋白)之陽性感測的單股RNA(nsP1-nsP4；複製酶)之示意性圖示；且圖4B展示源於α病毒複製子之例示性自我擴增RNA(saRNA)之示意性表示，其中在亞基因體啟動子(SGP)之轉錄控制下，病毒結構性基因由相關之異源基因置換。5'及3'端處之保留序列元件(CSE)充當負股及正股RNA轉錄之啟動子。在將saRNA遞送至細胞中之後，自活體外轉錄之saRNA轉譯非結構性聚合蛋白前驅體(nsP1234)。 nsP1234在早期以自我蛋白分解方式處理成片段nsP123及nsP4，該等片段轉錄為saRNA之負股複本。隨後，nsP123完全處理成單以蛋白質，其組裝成(+)股複製酶以轉錄新的陽性多鏈基因體複本，以及編碼相關基因之(+)股亞基因體轉錄物。亞基因體RNA以及新的基因體RNA經加帽且聚腺苷酸化。惰性啟動子為虛線箭頭；活性啟動子為實線箭頭(Beisser等人, Hum Gene Ther. 2017, 28(12): 1138-1146)。

圖5A為源於α病毒之自我擴增RNA之示意性說明，該病毒含有5'帽、非結構基因(NSP1-4)、26S亞基因體啟動子(灰色箭頭)、相關基因(GOI)及3'聚腺苷酸化尾部；且圖5B為囊封自我擴增RNA之脂質奈米顆粒(LNP)的示意性說明，其中脂質組分之莫耳百分比比率如所指示(Geall等人, PNAS, 2012, 109:14604-14609)。

圖6為α病毒衣殼強化子(例如DLP基元)之非限制性例示性莖環RNA結構之圖解說明。

圖7提供新世界及舊世界α病毒之代表性成分的nsP3蛋白質之域結構及序列比對的部分。 nsP3蛋白之示意性表示展示三個預測之結構性域：宏域、域及HVD。不同α病毒之nsP3蛋白之序列比對係用Clustal Omega進行。域序列加下劃線，其中顏色與用於示意性呈現之顏色相同。序列源於以下病毒：VEEV(GenBank寄存編號P27282.2)、SINV(GenBank寄存編號P03317.1)、SFV(GenBank寄存編號NP_740667.1)、CHIKV(GenBank寄存編號NP_690588.1)及EEEV(GenBank寄存編號Q4QXJ8.2)。圖像獲自Foy等人 Journal of Virology,第87卷，第4號，第1997-2010頁(2013)。

圖8A為編碼紅螢火蟲螢光素酶(rFF)之基於VEEV之α病毒複製子之圖解說明。描繪三個實施例：一個具有nsP3之野生型VEEV HVD；一個具有SINV之HVD之部分的VEEV/SINV雜合體(藉由用SINV HVD之胺基酸335-538取代VEEV之胺基酸殘基335-538)；且另一個雜合體具有CHIKV HVD之部分(藉由用CHIKV HVD之胺基酸335-517取代VEEV HVD之胺基酸殘基335-518)。圖8B為顯示含有突變型nsP3蛋白之複製子複製與含有野生型nsP3之複製子相同量的圖解說明，且圖8C為展示含有突變型nsP3蛋白之複製子表現與含有野生型nsP3之複製子相同含量之rFF的圖解說明。

圖9A為顯示監測活體內螢光素酶活性之結果且報導為總通量之圖。將10 μg含複製子RNA之生理鹽水肌肉內遞送至BALB/c小鼠之四頭肌肌肉中。圖9B顯示監測相同但用1 μg複製子RNA的結果。表現nsP3之突變體形式的複製子展現與具有野生型nsP3之複製子類似含量的螢光素酶活性。

圖10為顯示表現來自H5N1流感病毒之HA的基於VEEV複製子之活體內研究結果的曲線圖及條形圖。資料顯示，相較於表現野生型HVD之複製子，編碼VEEV/CHIKV HVD嵌合體之複製子不誘發HA特異性IgG力價。

圖11A提供顯示用表現H5N1 HA之指定複製子免疫接種之BALB/c小鼠中HA特異性短效效應CD8+ T細胞(SLEC)之頻率的圖形格式之曲線圖。圖11B提供顯示經表現H5N1 HA之指定複製子免疫之BALB/c小鼠中HA特異性記憶前驅體效應CD8+ T細胞(MPEC)之頻率的圖形格式之曲線圖。

圖12提供展示各種新世界及舊世界α病毒之編碼P1234蛋白質之不同區域的說明。對於以下舊世界α病毒P1234蛋白，G3BP結合位點存在：對於MAYV，胺基酸470-473；對於RRV，胺基酸512-515及523-526；對於SFV，胺基酸451-454及468-471；對於CHIKV，胺基酸479-482及497-500；對於ONNV，胺基酸519-522及537-540；對於BFV，胺基酸429-432及447-450；對於SINV，胺基酸490-493及513-516。對於新世界P1234病毒蛋白G3BP(及FXR)結合位點如下存在：對於VEEV，胺基酸478-545具有FXR結合位點；對於EEEV，胺基酸471-483具有G3BP結合位點且胺基酸531-547編碼FXR結合位點；對於WEEV，胺基酸504-520具有FXR結合位點。


          <![CDATA[<110>  愛爾蘭商健生科學愛爾蘭無限公司(Janssen Sciences Ireland Unlimited Company)]]>
          <![CDATA[<120>  用作B型肝炎病毒(HBV)疫苗之自我複製RNA分子及其用途]]>
          <![CDATA[<140>  ]]>
          <![CDATA[<141>  2020-06-19]]>
          <![CDATA[<150>  US 63/006,925]]>
          <![CDATA[<151>  2020-04-08]]>
          <![CDATA[<150>  US 62/863,961]]>
          <![CDATA[<151>  2019-06-20]]>
          <![CDATA[<160>  67    ]]>
          <![CDATA[<170>  PatentIn version 3.5]]>
          <![CDATA[<210>  1]]>
          <![CDATA[<211>  444]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  HBV截短之核心抗原基因]]>
          <![CDATA[<400>  1]]>
          gacatcgacc cttacaagga gttcggcgcc agcgtggaac tgctgtcttt tctgcccagt       60
          gatttctttc cttccattcg agacctgctg gataccgcct ctgctctgta tcgggaagcc      120
          ctggagagcc cagaacactg ctccccacac cataccgctc tgcgacaggc aatcctgtgc      180
          tggggggagc tgatgaacct ggccacatgg gtgggatcga atctggagga ccccgcttca      240
          cgggaactgg tggtcagcta cgtgaacgtc aatatgggcc tgaaaatccg ccagctgctg      300
          tggttccata ttagctgcct gacttttgga cgagagaccg tgctggaata cctggtgtcc      360
          ttcggcgtct ggattcgcac tccccctgct tatcgaccac ccaacgcacc aattctgtcc      420
          accctgcccg agaccacagt ggtc                                             444
          <![CDATA[<210>  2]]>
          <![CDATA[<211>  148]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  HBV截短之核心抗原]]>
          <![CDATA[<400>  2]]>
          Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser 
          1               5                   10                  15      
          Phe Leu Pro Ser Asp Phe Phe Pro Ser Ile Arg Asp Leu Leu Asp Thr 
                      20                  25                  30          
          Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser 
                  35                  40                  45              
          Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu 
              50                  55                  60                  
          Met Asn Leu Ala Thr Trp Val Gly Ser Asn Leu Glu Asp Pro Ala Ser 
          65                  70                  75                  80  
          Arg Glu Leu Val Val Ser Tyr Val Asn Val Asn Met Gly Leu Lys Ile 
                          85                  90                  95      
          Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu 
                      100                 105                 110         
          Thr Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro 
                  115                 120                 125             
          Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu 
              130                 135                 140                 
          Thr Thr Val Val 
          145             
          <![CDATA[<210>  3]]>
          <![CDATA[<211>  447]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  HBV截短之核心抗原基因]]>
          <![CDATA[<400>  3]]>
          atggacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc       60
          agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa      120
          gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg      180
          tgctgggggg agctgatgaa cctggccaca tgggtgggat ccaatctgga ggaccccgct      240
          tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg      300
          ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg      360
          tccttcggcg tctggatccg cactccccct gcttatcgac cacccaacgc accaattctg      420
          tccaccctgc ccgagaccac agtggtc                                          447
          <![CDATA[<210>  4]]>
          <![CDATA[<211>  149]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  HBV截短之核心抗原]]>
          <![CDATA[<400>  4]]>
          Met Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu 
          1               5                   10                  15      
          Ser Phe Leu Pro Ser Asp Phe Phe Pro Ser Ile Arg Asp Leu Leu Asp 
                      20                  25                  30          
          Thr Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys 
                  35                  40                  45              
          Ser Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu 
              50                  55                  60                  
          Leu Met Asn Leu Ala Thr Trp Val Gly Ser Asn Leu Glu Asp Pro Ala 
          65                  70                  75                  80  
          Ser Arg Glu Leu Val Val Ser Tyr Val Asn Val Asn Met Gly Leu Lys 
                          85                  90                  95      
          Ile Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg 
                      100                 105                 110         
          Glu Thr Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr 
                  115                 120                 125             
          Pro Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro 
              130                 135                 140                 
          Glu Thr Thr Val Val 
          145                 
          <![CDATA[<210>  5]]>
          <![CDATA[<211>  2529]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  HBV截短之核心抗原基因]]>
          <![CDATA[<400>  5]]>
          atgcccctgt cttaccagca ctttagaaag cttctgctgc tggacgatga agccgggcct       60
          ctggaggaag agctgccaag gctggcagac gaggggctga accggagagt ggccgaagat      120
          ctgaatctgg gaaacctgaa cgtgagcatc ccttggactc ataaagtcgg caacttcacc      180
          gggctgtaca gctccacagt gcctgtcttc aatccagagt ggcagacacc atcctttccc      240
          aacattcacc tgcaggagga catcattaat agatgcgaac agttcgtggg acctctgaca      300
          gtcaacgaaa agaggcgcct gaaactgatc atgcctgcca ggttttaccc aaatgtgact      360
          aagtatctgc cactggataa gggcatcaag ccttactatc cagagcacct ggtgaaccat      420
          tacttccaga ctagacacta tctgcatacc ctgtggaagg ccggaatcct gtacaaacga      480
          gaaactaccc ggagtgcttc attttgtggc tccccatatt cttgggaaca ggagctgcag      540
          catggcaggc tggtgttcca gaccagcaca cgccacgggg atgagtcctt ttgccagcag      600
          tctagtggca tcctgagcag atcccccgtg gggccttgtc tgcagtctca gctgcggaag      660
          agtagactgg gactgcagcc acagcaggga cacctggcac gacggcagca gggaaggtct      720
          ggcagtatcc gggctagagt gcatcccaca actagaaggc ctttcggcgt cgagccatca      780
          ggaagcggcc acaccacaaa caccgcatca agctcctcta gttgcctgca tcagtcagcc      840
          gtgagaaagg ccgcttacag ccacctgtcc acatctaaaa ggcactcaag ctccgggcat      900
          gctgtggagc tgcacaacat ccctccaaat tctgcacgca gtcagtcaga aggacccgtg      960
          ttcagctgct ggtggctgca gtttcggaac tcaaagcctt gcagcgacta ttgtctgagc     1020
          catattgtga atctgctgga ggattggggc ccttgtaccg agcacgggga acaccatatc     1080
          aggattccac gaacaccagc acgagtgact ggaggggtgt tcctggtgga caagaacccc     1140
          cacaatacta ccgagagccg gctggtggtc gatttcagtc agttttcaag aggcaacaca     1200
          agggtgtcat ggcccaaatt cgccgtccct aatctgcaga gtctgactaa cctgctgtct     1260
          agtaatctga gctggctgtc cctggacgtg tccgcagcct tttaccacct gcctctgcat     1320
          ccagctgcaa tgccccatct gctggtgggg tcaagcggac tgagtcgcta cgtcgcccga     1380
          ctgtcctcta actcacgcat cattaatcac cagcatggca ccatgcagaa cctgcacgat     1440
          agctgttccc ggaatctgta cgtgtctctg ctgctgctgt ataagacatt cggcagaaaa     1500
          ctgcacctgt acagccatcc tatcattctg gggtttagga agatcccaat gggagtggga     1560
          ctgagcccct tcctgctggc acagtttacc tccgccattt gctctgtggt ccgccgagcc     1620
          ttcccacact gtctggcttt ttcctatatg aacaatgtgg tcctgggcgc caaatccgtg     1680
          cagcatctgg agtctctgtt cacagctgtc actaactttc tgctgagcct ggggatccac     1740
          ctgaacccaa ataagactaa acgctggggg tacagcctga atttcatggg atatgtgatt     1800
          ggatcctggg ggaccctgcc acaggagcac atcgtgcaga agatcaagga atgctttcgg     1860
          aagctgcccg tcaacagacc tatcgactgg aaagtgtgcc agcggattgt cggactgctg     1920
          ggcttcgccg ctccctttac ccagtgcggg tacccagcac tgatgcccct gtatgcctgt     1980
          atccagtcta agcaggcttt cacctttagt cctacataca aggcattcct gtgcaaacag     2040
          tacctgaacc tgtatccagt ggcaaggcag cgacctggac tgtgccaggt ctttgcaaat     2100
          gccactccta ccggctgggg gctggctatc ggacatcagc gaatgcgggg cacattcgtg     2160
          gcccccctgc ctattcacac tgctcagctg ctggcagcct gctttgctag atctaggagt     2220
          ggagcaaagc tgatcggcac cgacaatagt gtggtcctgt caagaaaata cacatccttc     2280
          ccatggctgc tgggatgtgc tgcaaactgg attctgaggg gcaccagctt cgtgtacgtc     2340
          ccctcagccc tgaatcctgc tgacgatcca tcccgcgggc gactgggact gtaccgacct     2400
          ctgctgagac tgcccttcag gcctacaact ggccggacat ctctgtatgc cgattcacca     2460
          agcgtgccct cacacctgcc tgacagagtc cactttgctt cacccctgca cgtcgcttgg     2520
          cggcctcca                                                             2529
          <![CDATA[<210>  6]]>
          <![CDATA[<211>  2529]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  HBV pol抗原基因]]>
          <![CDATA[<400>  6]]>
          atgcccctgt cttaccagca ctttagaaag ctgctgctgc tggacgatga agccgggcct       60
          ctggaggaag agctgccaag gctggcagac gaggggctga accggagagt ggccgaagat      120
          ctgaatctgg gaaacctgaa cgtgagcatc ccttggactc ataaagtcgg caacttcacc      180
          gggctgtaca gctccacagt gcctgtcttc aatccagagt ggcagacacc atcctttccc      240
          aacattcacc tgcaggagga catcattaat agatgcgaac agttcgtggg acctctgaca      300
          gtcaacgaaa agaggcgcct gaaactgatc atgcctgcca ggttttaccc aaatgtgact      360
          aagtatctgc cactggataa gggcatcaag ccttactatc cagagcacct ggtgaaccat      420
          tacttccaga ctagacacta tctgcatacc ctgtggaagg ccggaatcct gtacaaacga      480
          gaaactaccc ggagtgcttc attttgtggc tccccatatt cttgggaaca ggagctgcag      540
          catggcaggc tggtgttcca gaccagcaca cgccacgggg atgagtcctt ttgccagcag      600
          tctagtggca tcctgagcag atcccccgtg gggccttgtc tgcagtctca gctgcggaag      660
          agtagactgg gactgcagcc acagcaggga cacctggcac gacggcagca gggaaggtct      720
          ggcagtatcc gggctagagt gcatcccaca actagaaggc ctttcggcgt cgagccatca      780
          ggaagcggcc acaccacaaa caccgcatca agctcctcta gttgcctgca tcagtcagcc      840
          gtgagaaagg ccgcttacag ccacctgtcc acatctaaaa ggcactcaag ctccgggcat      900
          gctgtggagc tgcacaacat ccctccaaat tctgcacgca gtcagtcaga aggacccgtg      960
          ttcagctgct ggtggctgca gtttcggaac tcaaagcctt gcagcgacta ttgtctgagc     1020
          catattgtga atctgctgga ggattggggc ccttgtaccg agcacgggga acaccatatc     1080
          aggattccac gaacaccagc acgagtgact ggaggggtgt tcctggtgga caagaacccc     1140
          cacaatacta ccgagagccg gctggtggtc gatttcagtc agttttcaag aggcaacaca     1200
          agggtgtcat ggcccaaatt cgccgtccct aatctgcaga gtctgactaa cctgctgtct     1260
          agtaatctga gctggctgtc cctggacgtg tccgcagcct tttaccacct gcctctgcat     1320
          ccagctgcaa tgccccatct gctggtgggg tcaagcggac tgagtcgcta cgtcgcccga     1380
          ctgtcctcta actcacgcat cattaatcac cagcatggca ccatgcagaa cctgcacgat     1440
          agctgttccc ggaatctgta cgtgtctctg ctgctgctgt ataagacatt cggcagaaaa     1500
          ctgcacctgt acagccatcc tatcattctg gggtttagga agatcccaat gggagtggga     1560
          ctgagcccct tcctgctggc acagtttacc tccgccattt gctctgtggt ccgccgagcc     1620
          ttcccacact gtctggcttt ttcctatatg aacaatgtgg tcctgggcgc caaatccgtg     1680
          cagcatctgg agtctctgtt cacagctgtc actaactttc tgctgagcct ggggatccac     1740
          ctgaacccaa ataagactaa acgctggggg tacagcctga atttcatggg atatgtgatt     1800
          ggatcctggg ggaccctgcc acaggagcac atcgtgcaga agatcaagga atgctttcgg     1860
          aagctgcccg tcaacagacc tatcgactgg aaagtgtgcc agcggattgt cggactgctg     1920
          ggcttcgccg ctccctttac ccagtgcggg tacccagcac tgatgcccct gtatgcctgt     1980
          atccagtcta agcaggcttt cacctttagt cctacataca aggcattcct gtgcaaacag     2040
          tacctgaacc tgtatccagt ggcaaggcag cgacctggac tgtgccaggt ctttgcaaat     2100
          gccactccta ccggctgggg gctggctatc ggacatcagc gaatgcgggg cacattcgtg     2160
          gcccccctgc ctattcacac tgctcagctg ctggcagcct gctttgctag atctaggagt     2220
          ggagcaaagc tgatcggcac cgacaatagt gtggtcctgt caagaaaata cacatccttc     2280
          ccatggctgc tgggatgtgc tgcaaactgg attctgaggg gcaccagctt cgtgtacgtc     2340
          ccctcagccc tgaatcctgc tgacgatcca tcccgcgggc gactgggact gtaccgacct     2400
          ctgctgagac tgcccttcag gcctacaact ggccggacat ctctgtatgc cgattcacca     2460
          agcgtgccct cacacctgcc tgacagagtc cactttgctt cacccctgca cgtcgcttgg     2520
          cggcctcca                                                             2529
          <![CDATA[<210>  7]]>
          <![CDATA[<211>  843]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  HBV pol抗原]]>
          <![CDATA[<400>  7]]>
          Met Pro Leu Ser Tyr Gln His Phe Arg Lys Leu Leu Leu Leu Asp Asp 
          1               5                   10                  15      
          Glu Ala Gly Pro Leu Glu Glu Glu Leu Pro Arg Leu Ala Asp Glu Gly 
                      20                  25                  30          
          Leu Asn Arg Arg Val Ala Glu Asp Leu Asn Leu Gly Asn Leu Asn Val 
                  35                  40                  45              
          Ser Ile Pro Trp Thr His Lys Val Gly Asn Phe Thr Gly Leu Tyr Ser 
              50                  55                  60                  
          Ser Thr Val Pro Val Phe Asn Pro Glu Trp Gln Thr Pro Ser Phe Pro 
          65                  70                  75                  80  
          Asn Ile His Leu Gln Glu Asp Ile Ile Asn Arg Cys Glu Gln Phe Val 
                          85                  90                  95      
          Gly Pro Leu Thr Val Asn Glu Lys Arg Arg Leu Lys Leu Ile Met Pro 
                      100                 105                 110         
          Ala Arg Phe Tyr Pro Asn Val Thr Lys Tyr Leu Pro Leu Asp Lys Gly 
                  115                 120                 125             
          Ile Lys Pro Tyr Tyr Pro Glu His Leu Val Asn His Tyr Phe Gln Thr 
              130                 135                 140                 
          Arg His Tyr Leu His Thr Leu Trp Lys Ala Gly Ile Leu Tyr Lys Arg 
          145                 150                 155                 160 
          Glu Thr Thr Arg Ser Ala Ser Phe Cys Gly Ser Pro Tyr Ser Trp Glu 
                          165                 170                 175     
          Gln Glu Leu Gln His Gly Arg Leu Val Phe Gln Thr Ser Thr Arg His 
                      180                 185                 190         
          Gly Asp Glu Ser Phe Cys Gln Gln Ser Ser Gly Ile Leu Ser Arg Ser 
                  195                 200                 205             
          Pro Val Gly Pro Cys Leu Gln Ser Gln Leu Arg Lys Ser Arg Leu Gly 
              210                 215                 220                 
          Leu Gln Pro Gln Gln Gly His Leu Ala Arg Arg Gln Gln Gly Arg Ser 
          225                 230                 235                 240 
          Gly Ser Ile Arg Ala Arg Val His Pro Thr Thr Arg Arg Pro Phe Gly 
                          245                 250                 255     
          Val Glu Pro Ser Gly Ser Gly His Thr Thr Asn Thr Ala Ser Ser Ser 
                      260                 265                 270         
          Ser Ser Cys Leu His Gln Ser Ala Val Arg Lys Ala Ala Tyr Ser His 
                  275                 280                 285             
          Leu Ser Thr Ser Lys Arg His Ser Ser Ser Gly His Ala Val Glu Leu 
              290                 295                 300                 
          His Asn Ile Pro Pro Asn Ser Ala Arg Ser Gln Ser Glu Gly Pro Val 
          305                 310                 315                 320 
          Phe Ser Cys Trp Trp Leu Gln Phe Arg Asn Ser Lys Pro Cys Ser Asp 
                          325                 330                 335     
          Tyr Cys Leu Ser His Ile Val Asn Leu Leu Glu Asp Trp Gly Pro Cys 
                      340                 345                 350         
          Thr Glu His Gly Glu His His Ile Arg Ile Pro Arg Thr Pro Ala Arg 
                  355                 360                 365             
          Val Thr Gly Gly Val Phe Leu Val Asp Lys Asn Pro His Asn Thr Thr 
              370                 375                 380                 
          Glu Ser Arg Leu Val Val Asp Phe Ser Gln Phe Ser Arg Gly Asn Thr 
          385                 390                 395                 400 
          Arg Val Ser Trp Pro Lys Phe Ala Val Pro Asn Leu Gln Ser Leu Thr 
                          405                 410                 415     
          Asn Leu Leu Ser Ser Asn Leu Ser Trp Leu Ser Leu Asp Val Ser Ala 
                      420                 425                 430         
          Ala Phe Tyr His Leu Pro Leu His Pro Ala Ala Met Pro His Leu Leu 
                  435                 440                 445             
          Val Gly Ser Ser Gly Leu Ser Arg Tyr Val Ala Arg Leu Ser Ser Asn 
              450                 455                 460                 
          Ser Arg Ile Ile Asn His Gln His Gly Thr Met Gln Asn Leu His Asp 
          465                 470                 475                 480 
          Ser Cys Ser Arg Asn Leu Tyr Val Ser Leu Leu Leu Leu Tyr Lys Thr 
                          485                 490                 495     
          Phe Gly Arg Lys Leu His Leu Tyr Ser His Pro Ile Ile Leu Gly Phe 
                      500                 505                 510         
          Arg Lys Ile Pro Met Gly Val Gly Leu Ser Pro Phe Leu Leu Ala Gln 
                  515                 520                 525             
          Phe Thr Ser Ala Ile Cys Ser Val Val Arg Arg Ala Phe Pro His Cys 
              530                 535                 540                 
          Leu Ala Phe Ser Tyr Met Asn Asn Val Val Leu Gly Ala Lys Ser Val 
          545                 550                 555                 560 
          Gln His Leu Glu Ser Leu Phe Thr Ala Val Thr Asn Phe Leu Leu Ser 
                          565                 570                 575     
          Leu Gly Ile His Leu Asn Pro Asn Lys Thr Lys Arg Trp Gly Tyr Ser 
                      580                 585                 590         
          Leu Asn Phe Met Gly Tyr Val Ile Gly Ser Trp Gly Thr Leu Pro Gln 
                  595                 600                 605             
          Glu His Ile Val Gln Lys Ile Lys Glu Cys Phe Arg Lys Leu Pro Val 
              610                 615                 620                 
          Asn Arg Pro Ile Asp Trp Lys Val Cys Gln Arg Ile Val Gly Leu Leu 
          625                 630                 635                 640 
          Gly Phe Ala Ala Pro Phe Thr Gln Cys Gly Tyr Pro Ala Leu Met Pro 
                          645                 650                 655     
          Leu Tyr Ala Cys Ile Gln Ser Lys Gln Ala Phe Thr Phe Ser Pro Thr 
                      660                 665                 670         
          Tyr Lys Ala Phe Leu Cys Lys Gln Tyr Leu Asn Leu Tyr Pro Val Ala 
                  675                 680                 685             
          Arg Gln Arg Pro Gly Leu Cys Gln Val Phe Ala Asn Ala Thr Pro Thr 
              690                 695                 700                 
          Gly Trp Gly Leu Ala Ile Gly His Gln Arg Met Arg Gly Thr Phe Val 
          705                 710                 715                 720 
          Ala Pro Leu Pro Ile His Thr Ala Gln Leu Leu Ala Ala Cys Phe Ala 
                          725                 730                 735     
          Arg Ser Arg Ser Gly Ala Lys Leu Ile Gly Thr Asp Asn Ser Val Val 
                      740                 745                 750         
          Leu Ser Arg Lys Tyr Thr Ser Phe Pro Trp Leu Leu Gly Cys Ala Ala 
                  755                 760                 765             
          Asn Trp Ile Leu Arg Gly Thr Ser Phe Val Tyr Val Pro Ser Ala Leu 
              770                 775                 780                 
          Asn Pro Ala Asp Asp Pro Ser Arg Gly Arg Leu Gly Leu Tyr Arg Pro 
          785                 790                 795                 800 
          Leu Leu Arg Leu Pro Phe Arg Pro Thr Thr Gly Arg Thr Ser Leu Tyr 
                          805                 810                 815     
          Ala Asp Ser Pro Ser Val Pro Ser His Leu Pro Asp Arg Val His Phe 
                      820                 825                 830         
          Ala Ser Pro Leu His Val Ala Trp Arg Pro Pro 
                  835                 840             
          <![CDATA[<210>  8]]>
          <![CDATA[<211>  63]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  胱抑素S信號肽編碼序列]]>
          <![CDATA[<400>  8]]>
          atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc       60
          agc                                                                     63
          <![CDATA[<210>  9]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  胱抑素S信號肽序列]]>
          <![CDATA[<400>  9]]>
          Met Ala Arg Pro Leu Cys Thr Leu Leu Leu Leu Met Ala Thr Leu Ala 
          1               5                   10                  15      
          Gly Ala Leu Ala Ser 
                      20      
          <![CDATA[<210>  10]]>
          <![CDATA[<211>  378]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  三強化子調控序列]]>
          <![CDATA[<400>  10]]>
          ggctcgcatc tctccttcac gcgcccgccg ccctacctga ggccgccatc cacgccggtt       60
          gagtcgcgtt ctgccgcctc ccgcctgtgg tgcctcctga actgcgtccg ccgtctaggt      120
          aagtttaaag ctcaggtcga gaccgggcct ttgtccggcg ctcccttgga gcctacctag      180
          actcagccgg ctctccacgc tttgcctgac cctgcttgct caactctagt tctctcgtta      240
          acttaatgag acagatagaa actggtcttg tagaaacaga gtagtcgcct gcttttctgc      300
          caggtgctga cttctctccc ctgggctttt ttctttttct caggttgaaa agaagaagac      360
          gaagaagacg aagaagac                                                    378
          <![CDATA[<210>  11]]>
          <![CDATA[<211>  12]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  連接子編碼序列]]>
          <![CDATA[<400>  11]]>
          gccggagctg gc                                                           12
          <![CDATA[<210>  12]]>
          <![CDATA[<211>  248]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  ApoAI基因片段]]>
          <![CDATA[<400>  12]]>
          ttggccgtgc tcttcctgac gggtaggtgt cccctaacct agggagccaa ccatcggggg       60
          gccttctccc taaatccccg tggcccaccc tcctgggcag aggcagcagg tttctcactg      120
          gccccctctc ccccacctcc aagcttggcc tttcggctca gatctcagcc cacagctggc      180
          ctgatctggg tctcccctcc caccctcagg gagccaggct cggcatttcg tcgacaagct      240
          tagccacc                                                               248
          <![CDATA[<210>  13]]>
          <![CDATA[<211>  130]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  SV40聚腺苷酸化信號序列]]>
          <![CDATA[<400>  13]]>
          aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca       60
          aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct      120
          tatcatgtct                                                             130
          <![CDATA[<210>  14]]>
          <![CDATA[<211>  81]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  人類免疫球蛋白分泌信號編碼序列]]>
          <![CDATA[<400>  14]]>
          atggagttcg gcctgtcttg ggtctttctg gtggcaatcc tgaagggcgt gcagtgtgaa       60
          gtgcagctgc tggagtctgg a                                                 81
          <![CDATA[<210>  15]]>
          <![CDATA[<211>  27]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  人類免疫球蛋白分泌信號序列]]>
          <![CDATA[<400>  15]]>
          Met Glu Phe Gly Leu Ser Trp Val Phe Leu Val Ala Ile Leu Lys Gly 
          1               5                   10                  15      
          Val Gln Cys Glu Val Gln Leu Leu Glu Ser Gly 
                      20                  25          
          <![CDATA[<210>  16]]>
          <![CDATA[<211>  996]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  HBV核心-pol融合抗原序列]]>
          <![CDATA[<400>  16]]>
          Met Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu 
          1               5                   10                  15      
          Ser Phe Leu Pro Ser Asp Phe Phe Pro Ser Ile Arg Asp Leu Leu Asp 
                      20                  25                  30          
          Thr Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys 
                  35                  40                  45              
          Ser Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu 
              50                  55                  60                  
          Leu Met Asn Leu Ala Thr Trp Val Gly Ser Asn Leu Glu Asp Pro Ala 
          65                  70                  75                  80  
          Ser Arg Glu Leu Val Val Ser Tyr Val Asn Val Asn Met Gly Leu Lys 
                          85                  90                  95      
          Ile Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg 
                      100                 105                 110         
          Glu Thr Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr 
                  115                 120                 125             
          Pro Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro 
              130                 135                 140                 
          Glu Thr Thr Val Val Ala Gly Ala Gly Met Pro Leu Ser Tyr Gln His 
          145                 150                 155                 160 
          Phe Arg Lys Leu Leu Leu Leu Asp Asp Glu Ala Gly Pro Leu Glu Glu 
                          165                 170                 175     
          Glu Leu Pro Arg Leu Ala Asp Glu Gly Leu Asn Arg Arg Val Ala Glu 
                      180                 185                 190         
          Asp Leu Asn Leu Gly Asn Leu Asn Val Ser Ile Pro Trp Thr His Lys 
                  195                 200                 205             
          Val Gly Asn Phe Thr Gly Leu Tyr Ser Ser Thr Val Pro Val Phe Asn 
              210                 215                 220                 
          Pro Glu Trp Gln Thr Pro Ser Phe Pro Asn Ile His Leu Gln Glu Asp 
          225                 230                 235                 240 
          Ile Ile Asn Arg Cys Glu Gln Phe Val Gly Pro Leu Thr Val Asn Glu 
                          245                 250                 255     
          Lys Arg Arg Leu Lys Leu Ile Met Pro Ala Arg Phe Tyr Pro Asn Val 
                      260                 265                 270         
          Thr Lys Tyr Leu Pro Leu Asp Lys Gly Ile Lys Pro Tyr Tyr Pro Glu 
                  275                 280                 285             
          His Leu Val Asn His Tyr Phe Gln Thr Arg His Tyr Leu His Thr Leu 
              290                 295                 300                 
          Trp Lys Ala Gly Ile Leu Tyr Lys Arg Glu Thr Thr Arg Ser Ala Ser 
          305                 310                 315                 320 
          Phe Cys Gly Ser Pro Tyr Ser Trp Glu Gln Glu Leu Gln His Gly Arg 
                          325                 330                 335     
          Leu Val Phe Gln Thr Ser Thr Arg His Gly Asp Glu Ser Phe Cys Gln 
                      340                 345                 350         
          Gln Ser Ser Gly Ile Leu Ser Arg Ser Pro Val Gly Pro Cys Leu Gln 
                  355                 360                 365             
          Ser Gln Leu Arg Lys Ser Arg Leu Gly Leu Gln Pro Gln Gln Gly His 
              370                 375                 380                 
          Leu Ala Arg Arg Gln Gln Gly Arg Ser Gly Ser Ile Arg Ala Arg Val 
          385                 390                 395                 400 
          His Pro Thr Thr Arg Arg Pro Phe Gly Val Glu Pro Ser Gly Ser Gly 
                          405                 410                 415     
          His Thr Thr Asn Thr Ala Ser Ser Ser Ser Ser Cys Leu His Gln Ser 
                      420                 425                 430         
          Ala Val Arg Lys Ala Ala Tyr Ser His Leu Ser Thr Ser Lys Arg His 
                  435                 440                 445             
          Ser Ser Ser Gly His Ala Val Glu Leu His Asn Ile Pro Pro Asn Ser 
              450                 455                 460                 
          Ala Arg Ser Gln Ser Glu Gly Pro Val Phe Ser Cys Trp Trp Leu Gln 
          465                 470                 475                 480 
          Phe Arg Asn Ser Lys Pro Cys Ser Asp Tyr Cys Leu Ser His Ile Val 
                          485                 490                 495     
          Asn Leu Leu Glu Asp Trp Gly Pro Cys Thr Glu His Gly Glu His His 
                      500                 505                 510         
          Ile Arg Ile Pro Arg Thr Pro Ala Arg Val Thr Gly Gly Val Phe Leu 
                  515                 520                 525             
          Val Asp Lys Asn Pro His Asn Thr Thr Glu Ser Arg Leu Val Val Asp 
              530                 535                 540                 
          Phe Ser Gln Phe Ser Arg Gly Asn Thr Arg Val Ser Trp Pro Lys Phe 
          545                 550                 555                 560 
          Ala Val Pro Asn Leu Gln Ser Leu Thr Asn Leu Leu Ser Ser Asn Leu 
                          565                 570                 575     
          Ser Trp Leu Ser Leu Asp Val Ser Ala Ala Phe Tyr His Leu Pro Leu 
                      580                 585                 590         
          His Pro Ala Ala Met Pro His Leu Leu Val Gly Ser Ser Gly Leu Ser 
                  595                 600                 605             
          Arg Tyr Val Ala Arg Leu Ser Ser Asn Ser Arg Ile Ile Asn His Gln 
              610                 615                 620                 
          His Gly Thr Met Gln Asn Leu His Asp Ser Cys Ser Arg Asn Leu Tyr 
          625                 630                 635                 640 
          Val Ser Leu Leu Leu Leu Tyr Lys Thr Phe Gly Arg Lys Leu His Leu 
                          645                 650                 655     
          Tyr Ser His Pro Ile Ile Leu Gly Phe Arg Lys Ile Pro Met Gly Val 
                      660                 665                 670         
          Gly Leu Ser Pro Phe Leu Leu Ala Gln Phe Thr Ser Ala Ile Cys Ser 
                  675                 680                 685             
          Val Val Arg Arg Ala Phe Pro His Cys Leu Ala Phe Ser Tyr Met Asn 
              690                 695                 700                 
          Asn Val Val Leu Gly Ala Lys Ser Val Gln His Leu Glu Ser Leu Phe 
          705                 710                 715                 720 
          Thr Ala Val Thr Asn Phe Leu Leu Ser Leu Gly Ile His Leu Asn Pro 
                          725                 730                 735     
          Asn Lys Thr Lys Arg Trp Gly Tyr Ser Leu Asn Phe Met Gly Tyr Val 
                      740                 745                 750         
          Ile Gly Ser Trp Gly Thr Leu Pro Gln Glu His Ile Val Gln Lys Ile 
                  755                 760                 765             
          Lys Glu Cys Phe Arg Lys Leu Pro Val Asn Arg Pro Ile Asp Trp Lys 
              770                 775                 780                 
          Val Cys Gln Arg Ile Val Gly Leu Leu Gly Phe Ala Ala Pro Phe Thr 
          785                 790                 795                 800 
          Gln Cys Gly Tyr Pro Ala Leu Met Pro Leu Tyr Ala Cys Ile Gln Ser 
                          805                 810                 815     
          Lys Gln Ala Phe Thr Phe Ser Pro Thr Tyr Lys Ala Phe Leu Cys Lys 
                      820                 825                 830         
          Gln Tyr Leu Asn Leu Tyr Pro Val Ala Arg Gln Arg Pro Gly Leu Cys 
                  835                 840                 845             
          Gln Val Phe Ala Asn Ala Thr Pro Thr Gly Trp Gly Leu Ala Ile Gly 
              850                 855                 860                 
          His Gln Arg Met Arg Gly Thr Phe Val Ala Pro Leu Pro Ile His Thr 
          865                 870                 875                 880 
          Ala Gln Leu Leu Ala Ala Cys Phe Ala Arg Ser Arg Ser Gly Ala Lys 
                          885                 890                 895     
          Leu Ile Gly Thr Asp Asn Ser Val Val Leu Ser Arg Lys Tyr Thr Ser 
                      900                 905                 910         
          Phe Pro Trp Leu Leu Gly Cys Ala Ala Asn Trp Ile Leu Arg Gly Thr 
                  915                 920                 925             
          Ser Phe Val Tyr Val Pro Ser Ala Leu Asn Pro Ala Asp Asp Pro Ser 
              930                 935                 940                 
          Arg Gly Arg Leu Gly Leu Tyr Arg Pro Leu Leu Arg Leu Pro Phe Arg 
          945                 950                 955                 960 
          Pro Thr Thr Gly Arg Thr Ser Leu Tyr Ala Asp Ser Pro Ser Val Pro 
                          965                 970                 975     
          Ser His Leu Pro Asp Arg Val His Phe Ala Ser Pro Leu His Val Ala 
                      980                 985                 990         
          Trp Arg Pro Pro 
                  995     
          <![CDATA[<210>  17]]>
          <![CDATA[<211>  1023]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  HBV核心-pol融合抗原序列與Ig信號序列]]>
          <![CDATA[<400>  17]]>
          Met Glu Phe Gly Leu Ser Trp Val Phe Leu Val Ala Ile Leu Lys Gly 
          1               5                   10                  15      
          Val Gln Cys Glu Val Gln Leu Leu Glu Ser Gly Met Asp Ile Asp Pro 
                      20                  25                  30          
          Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser Phe Leu Pro Ser 
                  35                  40                  45              
          Asp Phe Phe Pro Ser Ile Arg Asp Leu Leu Asp Thr Ala Ser Ala Leu 
              50                  55                  60                  
          Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser Pro His His Thr 
          65                  70                  75                  80  
          Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu Met Asn Leu Ala 
                          85                  90                  95      
          Thr Trp Val Gly Ser Asn Leu Glu Asp Pro Ala Ser Arg Glu Leu Val 
                      100                 105                 110         
          Val Ser Tyr Val Asn Val Asn Met Gly Leu Lys Ile Arg Gln Leu Leu 
                  115                 120                 125             
          Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu Thr Val Leu Glu 
              130                 135                 140                 
          Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro Pro Ala Tyr Arg 
          145                 150                 155                 160 
          Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu Thr Thr Val Val 
                          165                 170                 175     
          Ala Gly Ala Gly Met Pro Leu Ser Tyr Gln His Phe Arg Lys Leu Leu 
                      180                 185                 190         
          Leu Leu Asp Asp Glu Ala Gly Pro Leu Glu Glu Glu Leu Pro Arg Leu 
                  195                 200                 205             
          Ala Asp Glu Gly Leu Asn Arg Arg Val Ala Glu Asp Leu Asn Leu Gly 
              210                 215                 220                 
          Asn Leu Asn Val Ser Ile Pro Trp Thr His Lys Val Gly Asn Phe Thr 
          225                 230                 235                 240 
          Gly Leu Tyr Ser Ser Thr Val Pro Val Phe Asn Pro Glu Trp Gln Thr 
                          245                 250                 255     
          Pro Ser Phe Pro Asn Ile His Leu Gln Glu Asp Ile Ile Asn Arg Cys 
                      260                 265                 270         
          Glu Gln Phe Val Gly Pro Leu Thr Val Asn Glu Lys Arg Arg Leu Lys 
                  275                 280                 285             
          Leu Ile Met Pro Ala Arg Phe Tyr Pro Asn Val Thr Lys Tyr Leu Pro 
              290                 295                 300                 
          Leu Asp Lys Gly Ile Lys Pro Tyr Tyr Pro Glu His Leu Val Asn His 
          305                 310                 315                 320 
          Tyr Phe Gln Thr Arg His Tyr Leu His Thr Leu Trp Lys Ala Gly Ile 
                          325                 330                 335     
          Leu Tyr Lys Arg Glu Thr Thr Arg Ser Ala Ser Phe Cys Gly Ser Pro 
                      340                 345                 350         
          Tyr Ser Trp Glu Gln Glu Leu Gln His Gly Arg Leu Val Phe Gln Thr 
                  355                 360                 365             
          Ser Thr Arg His Gly Asp Glu Ser Phe Cys Gln Gln Ser Ser Gly Ile 
              370                 375                 380                 
          Leu Ser Arg Ser Pro Val Gly Pro Cys Leu Gln Ser Gln Leu Arg Lys 
          385                 390                 395                 400 
          Ser Arg Leu Gly Leu Gln Pro Gln Gln Gly His Leu Ala Arg Arg Gln 
                          405                 410                 415     
          Gln Gly Arg Ser Gly Ser Ile Arg Ala Arg Val His Pro Thr Thr Arg 
                      420                 425                 430         
          Arg Pro Phe Gly Val Glu Pro Ser Gly Ser Gly His Thr Thr Asn Thr 
                  435                 440                 445             
          Ala Ser Ser Ser Ser Ser Cys Leu His Gln Ser Ala Val Arg Lys Ala 
              450                 455                 460                 
          Ala Tyr Ser His Leu Ser Thr Ser Lys Arg His Ser Ser Ser Gly His 
          465                 470                 475                 480 
          Ala Val Glu Leu His Asn Ile Pro Pro Asn Ser Ala Arg Ser Gln Ser 
                          485                 490                 495     
          Glu Gly Pro Val Phe Ser Cys Trp Trp Leu Gln Phe Arg Asn Ser Lys 
                      500                 505                 510         
          Pro Cys Ser Asp Tyr Cys Leu Ser His Ile Val Asn Leu Leu Glu Asp 
                  515                 520                 525             
          Trp Gly Pro Cys Thr Glu His Gly Glu His His Ile Arg Ile Pro Arg 
              530                 535                 540                 
          Thr Pro Ala Arg Val Thr Gly Gly Val Phe Leu Val Asp Lys Asn Pro 
          545                 550                 555                 560 
          His Asn Thr Thr Glu Ser Arg Leu Val Val Asp Phe Ser Gln Phe Ser 
                          565                 570                 575     
          Arg Gly Asn Thr Arg Val Ser Trp Pro Lys Phe Ala Val Pro Asn Leu 
                      580                 585                 590         
          Gln Ser Leu Thr Asn Leu Leu Ser Ser Asn Leu Ser Trp Leu Ser Leu 
                  595                 600                 605             
          Asp Val Ser Ala Ala Phe Tyr His Leu Pro Leu His Pro Ala Ala Met 
              610                 615                 620                 
          Pro His Leu Leu Val Gly Ser Ser Gly Leu Ser Arg Tyr Val Ala Arg 
          625                 630                 635                 640 
          Leu Ser Ser Asn Ser Arg Ile Ile Asn His Gln His Gly Thr Met Gln 
                          645                 650                 655     
          Asn Leu His Asp Ser Cys Ser Arg Asn Leu Tyr Val Ser Leu Leu Leu 
                      660                 665                 670         
          Leu Tyr Lys Thr Phe Gly Arg Lys Leu His Leu Tyr Ser His Pro Ile 
                  675                 680                 685             
          Ile Leu Gly Phe Arg Lys Ile Pro Met Gly Val Gly Leu Ser Pro Phe 
              690                 695                 700                 
          Leu Leu Ala Gln Phe Thr Ser Ala Ile Cys Ser Val Val Arg Arg Ala 
          705                 710                 715                 720 
          Phe Pro His Cys Leu Ala Phe Ser Tyr Met Asn Asn Val Val Leu Gly 
                          725                 730                 735     
          Ala Lys Ser Val Gln His Leu Glu Ser Leu Phe Thr Ala Val Thr Asn 
                      740                 745                 750         
          Phe Leu Leu Ser Leu Gly Ile His Leu Asn Pro Asn Lys Thr Lys Arg 
                  755                 760                 765             
          Trp Gly Tyr Ser Leu Asn Phe Met Gly Tyr Val Ile Gly Ser Trp Gly 
              770                 775                 780                 
          Thr Leu Pro Gln Glu His Ile Val Gln Lys Ile Lys Glu Cys Phe Arg 
          785                 790                 795                 800 
          Lys Leu Pro Val Asn Arg Pro Ile Asp Trp Lys Val Cys Gln Arg Ile 
                          805                 810                 815     
          Val Gly Leu Leu Gly Phe Ala Ala Pro Phe Thr Gln Cys Gly Tyr Pro 
                      820                 825                 830         
          Ala Leu Met Pro Leu Tyr Ala Cys Ile Gln Ser Lys Gln Ala Phe Thr 
                  835                 840                 845             
          Phe Ser Pro Thr Tyr Lys Ala Phe Leu Cys Lys Gln Tyr Leu Asn Leu 
              850                 855                 860                 
          Tyr Pro Val Ala Arg Gln Arg Pro Gly Leu Cys Gln Val Phe Ala Asn 
          865                 870                 875                 880 
          Ala Thr Pro Thr Gly Trp Gly Leu Ala Ile Gly His Gln Arg Met Arg 
                          885                 890                 895     
          Gly Thr Phe Val Ala Pro Leu Pro Ile His Thr Ala Gln Leu Leu Ala 
                      900                 905                 910         
          Ala Cys Phe Ala Arg Ser Arg Ser Gly Ala Lys Leu Ile Gly Thr Asp 
                  915                 920                 925             
          Asn Ser Val Val Leu Ser Arg Lys Tyr Thr Ser Phe Pro Trp Leu Leu 
              930                 935                 940                 
          Gly Cys Ala Ala Asn Trp Ile Leu Arg Gly Thr Ser Phe Val Tyr Val 
          945                 950                 955                 960 
          Pro Ser Ala Leu Asn Pro Ala Asp Asp Pro Ser Arg Gly Arg Leu Gly 
                          965                 970                 975     
          Leu Tyr Arg Pro Leu Leu Arg Leu Pro Phe Arg Pro Thr Thr Gly Arg 
                      980                 985                 990         
          Thr Ser Leu Tyr Ala Asp Ser Pro  Ser Val Pro Ser His  Leu Pro Asp 
                  995                 1000                 1005             
          Arg Val  His Phe Ala Ser Pro  Leu His Val Ala Trp  Arg Pro Pro 
              1010                 1015                 1020             
          <![CDATA[<210>  18]]>
          <![CDATA[<211>  584]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  hCMV啟動子]]>
          <![CDATA[<400>  18]]>
          tgacattgat tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc       60
          ccatatatgg agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc      120
          aacgaccccc gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg      180
          actttccatt gacgtcaatg ggtggactat ttacggtaaa ctgcccactt ggcagtacat      240
          caagtgtatc atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc      300
          tggcattatg cccagtacat gaccttatgg gactttccta cttggcagta catctacgta      360
          ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag      420
          cggtttgact cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt      480
          tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa      540
          atgggcggta ggcgtgtacg gtgggaggtc tatataagca gagc                       584
          <![CDATA[<210>  19]]>
          <![CDATA[<211>  684]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  hCMV啟動子序列]]>
          <![CDATA[<400>  19]]>
          accgccatgt tgacattgat tattgactag ttattaatag taatcaatta cggggtcatt       60
          agttcatagc ccatatatgg agttccgcgt tacataactt acggtaaatg gcccgcctgg      120
          ctgaccgccc aacgaccccc gcccattgac gtcaataatg acgtatgttc ccatagtaac      180
          gccaataggg actttccatt gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt      240
          ggcagtacat caagtgtatc atatgccaag tacgccccct attgacgtca atgacggtaa      300
          atggcccgcc tggcattatg cccagtacat gaccttatgg gactttccta cttggcagta      360
          catctacgta ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt acatcaatgg      420
          gcgtggatag cggtttgact cacggggatt tccaagtctc caccccattg acgtcaatgg      480
          gagtttgttt tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca actccgcccc      540
          attgacgcaa atgggcggta ggcgtgtacg gtgggaggtc tatataagca gagctcgttt      600
          agtgaaccgt cagatcgcct ggagacgcca tccacgctgt tttgacctcc atagaagaca      660
          ccgggaccga tccagcctcc gcgg                                             684
          <![CDATA[<210>  20]]>
          <![CDATA[<211>  225]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  bGH聚腺苷酸信號]]>
          <![CDATA[<400>  20]]>
          ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc       60
          tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc      120
          tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt      180
          gggaagacaa tagcaggcat gctggggatg cggtgggctc tatgg                      225
          <![CDATA[<210>  21]]>
          <![CDATA[<211>  671]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  pUC ORI]]>
          <![CDATA[<400>  21]]>
          cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc       60
          ttgcaaacaa aaaaaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact      120
          ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt tcttctagtg      180
          tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg      240
          ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac      300
          tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca      360
          cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga      420
          gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc      480
          ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct      540
          gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg      600
          agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct      660
          tttgctcaca t                                                           671
          <![CDATA[<210>  22]]>
          <![CDATA[<211>  795]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  KanR編碼序列]]>
          <![CDATA[<400>  22]]>
          atgattgagc aagatggtct tcacgctggc tcgccagctg cgtgggtgga acgcctgttt       60
          ggttatgatt gggcgcagca gactattgga tgttccgacg cggctgtatt tcggctgtct      120
          gctcagggtc gccccgtgct gtttgtgaag acggatttgt ctggcgcatt aaatgagtta      180
          caggacgagg cggctcgtct gagttggttg gccaccaccg gcgtgccctg cgccgcagtg      240
          ctggatgtcg tgacagaagc aggccgcgat tggctccttc tcggcgaagt gccgggccag      300
          gacctgctca gcagccactt ggcaccggca gaaaaagttt ctatcatggc cgacgccatg      360
          cgtcgtcttc acactctcga tccggccacg tgcccctttg accaccaggc caagcatcgt      420
          attgaacgtg cgcgtactcg gatggaagca ggtttagtag accaggacga tttggatgag      480
          gaacatcaag gcctggcccc ggctgaactg tttgcgcgct taaaagcgtc gatgccagat      540
          ggcgaagatt tggtagtcac ccatggagat gcgtgtttgc caaacatcat ggttgaaaat      600
          ggccgcttct caggctttat tgactgtggg cgcctgggtg ttgccgaccg ctatcaagat      660
          attgcgctcg caactcgtga catcgctgaa gagctgggcg gagaatgggc tgaccgtttc      720
          ctggtactgt atggcattgc agcgcccgat tcccaacgca tcgcatttta tcgtctgctg      780
          gatgagtttt tctaa                                                       795
          <![CDATA[<210>  23]]>
          <![CDATA[<211>  264]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  密碼子優化Kanr]]>
          <![CDATA[<400>  23]]>
          Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val 
          1               5                   10                  15      
          Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser 
                      20                  25                  30          
          Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe 
                  35                  40                  45              
          Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala 
              50                  55                  60                  
          Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val 
          65                  70                  75                  80  
          Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu 
                          85                  90                  95      
          Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys 
                      100                 105                 110         
          Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro 
                  115                 120                 125             
          Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala 
              130                 135                 140                 
          Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu 
          145                 150                 155                 160 
          Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala 
                          165                 170                 175     
          Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys 
                      180                 185                 190         
          Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp 
                  195                 200                 205             
          Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala 
              210                 215                 220                 
          Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe 
          225                 230                 235                 240 
          Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe 
                          245                 250                 255     
          Tyr Arg Leu Leu Asp Glu Phe Phe 
                      260                 
          <![CDATA[<210>  24]]>
          <![CDATA[<211>  99]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  bla啟動子]]>
          <![CDATA[<400>  24]]>
          acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa       60
          ccctgataaa tgcttcaata atattgaaaa aggaagagt                              99
          <![CDATA[<210>  25]]>
          <![CDATA[<211>  8364]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  α病毒基因體序列]]>
          <![CDATA[<400>  25]]>
          taatacgact cactatagag aggcggcgca tgagagaagc ccagaccaat tacctaccca       60
          aaatggagaa agttcacgtt gacatcgagg aagacagccc attcctcaga gctttgcagc      120
          ggagcttccc gcagtttgag gtagaagcca agcaggtcac tgataatgac catgctaatg      180
          ccagagcgtt ttcgcatctg gcttcaaaac tgatcgaaac ggaggtggac ccatccgaca      240
          cgatccttga cattggaagt gcgcccgccc gcagaatgta ttctaagcac aagtatcatt      300
          gtatctgtcc gatgagatgt gcggaagatc cggacagatt gtataagtat gcaactaagc      360
          tgaagaaaaa ctgtaaggaa ataactgata aggaattgga caagaaaatg aaggagctcg      420
          ccgccgtcat gagcgaccct gacctggaaa ctgagactat gtgcctccac gacgacgagt      480
          cgtgtcgcta cgaagggcaa gtcgctgttt accaggatgt atacgcggtt gacggaccga      540
          caagtctcta tcaccaagcc aataagggag ttagagtcgc ctactggata ggctttgaca      600
          ccaccccttt tatgtttaag aacttggctg gagcatatcc atcatactct accaactggg      660
          ccgacgaaac cgtgttaacg gctcgtaaca taggcctatg cagctctgac gttatggagc      720
          ggtcacgtag agggatgtcc attcttagaa agaagtattt gaaaccatcc aacaatgttc      780
          tattctctgt tggctcgacc atctaccacg agaagaggga cttactgagg agctggcacc      840
          tgccgtctgt atttcactta cgtggcaagc aaaattacac atgtcggtgt gagactatag      900
          ttagttgcga cgggtacgtc gttaaaagaa tagctatcag tccaggcctg tatgggaagc      960
          cttcaggcta tgctgctacg atgcaccgcg agggattctt gtgctgcaaa gtgacagaca     1020
          cattgaacgg ggagagggtc tcttttcccg tgtgcacgta tgtgccagct acattgtgtg     1080
          accaaatgac tggcatactg gcaacagatg tcagtgcgga cgacgcgcaa aaactgctgg     1140
          ttgggctcaa ccagcgtata gtcgtcaacg gtcgcaccca gagaaacacc aataccatga     1200
          aaaattacct tttgcccgta gtggcccagg catttgctag gtgggcaaag gaatataagg     1260
          aagatcaaga agatgaaagg ccactaggac tacgagatag acagttagtc atggggtgtt     1320
          gttgggcttt tagaaggcac aagataacat ctatttataa gcgcccggat acccaaacca     1380
          tcatcaaagt gaacagcgat ttccactcat tcgtgctgcc caggataggc agtaacacat     1440
          tggagatcgg gctgagaaca agaatcagga aaatgttaga ggagcacaag gagccgtcac     1500
          ctctcattac cgccgaggac gtacaagaag ctaagtgcgc agccgatgag gctaaggagg     1560
          tgcgtgaagc cgaggagttg cgcgcagctc taccaccttt ggcagctgat gttgaggagc     1620
          ccactctgga agccgatgtc gacttgatgt tacaagaggc tggggccggc tcagtggaga     1680
          cacctcgtgg cttgataaag gttaccagct acgatggcga ggacaagatc ggctcttacg     1740
          ctgtgctttc tccgcaggct gtactcaaga gtgaaaaatt atcttgcatc caccctctcg     1800
          ctgaacaagt catagtgata acacactctg gccgaaaagg gcgttatgcc gtggaaccat     1860
          accatggtaa agtagtggtg ccagagggac atgcaatacc cgtccaggac tttcaagctc     1920
          tgagtgaaag tgccaccatt gtgtacaacg aacgtgagtt cgtaaacagg tacctgcacc     1980
          atattgccac acatggagga gcgctgaaca ctgatgaaga atattacaaa actgtcaagc     2040
          ccagcgagca cgacggcgaa tacctgtacg acatcgacag gaaacagtgc gtcaagaaag     2100
          aactagtcac tgggctaggg ctcacaggcg agctggtgga tcctcccttc catgaattcg     2160
          cctacgagag tctgagaaca cgaccagccg ctccttacca agtaccaacc ataggggtgt     2220
          atggcgtgcc aggatcaggc aagtctggca tcattaaaag cgcagtcacc aaaaaagatc     2280
          tagtggtgag cgccaagaaa gaaaactgtg cagaaattat aagggacgtc aagaaaatga     2340
          aagggctgga cgtcaatgcc agaactgtgg actcagtgct cttgaatgga tgcaaacacc     2400
          ccgtagagac cctgtatatt gacgaagctt ttgcttgtca tgcaggtact ctcagagcgc     2460
          tcatagccat tataagacct aaaaaggcag tgctctgcgg ggatcccaaa cagtgcggtt     2520
          tttttaacat gatgtgcctg aaagtgcatt ttaaccacga gatttgcaca caagtcttcc     2580
          acaaaagcat ctctcgccgt tgcactaaat ctgtgacttc ggtcgtctca accttgtttt     2640
          acgacaaaaa aatgagaacg acgaatccga aagagactaa gattgtgatt gacactaccg     2700
          gcagtaccaa acctaagcag gacgatctca ttctcacttg tttcagaggg tgggtgaagc     2760
          agttgcaaat agattacaaa ggcaacgaaa taatgacggc agctgcctct caagggctga     2820
          cccgtaaagg tgtgtatgcc gttcggtaca aggtgaatga aaatcctctg tacgcaccca     2880
          cctctgaaca tgtgaacgtc ctactgaccc gcacggagga ccgcatcgtg tggaaaacac     2940
          tagccggcga cccatggata aaaacactga ctgccaagta ccctgggaat ttcactgcca     3000
          cgatagagga gtggcaagca gagcatgatg ccatcatgag gcacatcttg gagagaccgg     3060
          accctaccga cgtcttccag aataaggcaa acgtgtgttg ggccaaggct ttagtgccgg     3120
          tgctgaagac cgctggcata gacatgacca ctgaacaatg gaacactgtg gattattttg     3180
          aaacggacaa agctcactca gcagagatag tattgaacca actatgcgtg aggttctttg     3240
          gactcgatct ggactccggt ctattttctg cacccactgt tccgttatcc attaggaata     3300
          atcactggga taactccccg tcgcctaaca tgtacgggct gaataaagaa gtggtccgtc     3360
          agctctctcg caggtaccca caactgcctc gggcagttgc cactggaaga gtctatgaca     3420
          tgaacactgg tacactgcgc aattatgatc cgcgcataaa cctagtacct gtaaacagaa     3480
          gactgcctca tgctttagtc ctccaccata atgaacaccc acagagtgac ttttcttcat     3540
          tcgtcagcaa attgaagggc agaactgtcc tggtggtcgg ggaaaagttg tccgtcccag     3600
          gcaaaatggt tgactggttg tcagaccggc ctgaggctac cttcagagct cggctggatt     3660
          taggcatccc aggtgatgtg cccaaatatg acataatatt tgttaatgtg aggaccccat     3720
          ataaatacca tcactatcag cagtgtgaag accatgccat taagcttagc atgttgacca     3780
          agaaagcttg tctgcatctg aatcccggcg gaacctgtgt cagcataggt tatggttacg     3840
          ctgacagggc cagcgaaagc atcattggtg ctatagcgcg gcagttcaag ttttcccggg     3900
          tatgcaaacc gaaatcctca cttgaagaga cggaagttct gtttgtattc attgggtacg     3960
          atcgcaaggc ccgtacgcac aatccttaca agctttcatc aaccttgacc aacatttata     4020
          caggttccag actccacgaa gccggatgtg caccctcata tcatgtggtg cgaggggata     4080
          ttgccacggc caccgaagga gtgattataa atgctgctaa cagcaaagga caacctggcg     4140
          gaggggtgtg cggagcgctg tataagaaat tcccggaaag cttcgattta cagccgatcg     4200
          aagtaggaaa agcgcgactg gtcaaaggtg cagctaaaca tatcattcat gccgtaggac     4260
          caaacttcaa caaagtttcg gaggttgaag gtgacaaaca gttggcagag gcttatgagt     4320
          ccatcgctaa gattgtcaac gataacaatt acaagtcagt agcgattcca ctgttgtcca     4380
          ccggcatctt ttccgggaac aaagatcgac taacccaatc attgaaccat ttgctgacag     4440
          ctttagacac cactgatgca gatgtagcca tatactgcag ggacaagaaa tgggaaatga     4500
          ctctcaagga agcagtggct aggagagaag cagtggagga gatatgcata tccgacgact     4560
          cttcagtgac agaacctgat gcagagctgg tgagggtgca tccgaagagt tctttggctg     4620
          gaaggaaggg ctacagcaca agcgatggca aaactttctc atatttggaa gggaccaagt     4680
          ttcaccaggc ggccaaggat atagcagaaa ttaatgccat gtggcccgtt gcaacggagg     4740
          ccaatgagca ggtatgcatg tatatcctcg gagaaagcat gagcagtatt aggtcgaaat     4800
          gccccgtcga agagtcggaa gcctccacac cacctagcac gctgccttgc ttgtgcatcc     4860
          atgccatgac tccagaaaga gtacagcgcc taaaagcctc acgtccagaa caaattactg     4920
          tgtgctcatc ctttccattg ccgaagtata gaatcactgg tgtgcagaag atccaatgct     4980
          cccagcctat attgttctca ccgaaagtgc ctgcgtatat tcatccaagg aagtatctcg     5040
          tggaaacacc accggtagac gagactccgg agccatcggc agagaaccaa tccacagagg     5100
          ggacacctga acaaccacca cttataaccg aggatgagac caggactaga acgcctgagc     5160
          cgatcatcat cgaagaggaa gaagaggata gcataagttt gctgtcagat ggcccgaccc     5220
          accaggtgct gcaagtcgag gcagacattc acgggccgcc ctctgtatct agctcatcct     5280
          ggtccattcc tcatgcatcc gactttgatg tggacagttt atccatactt gacaccctgg     5340
          agggagctag cgtgaccagc ggggcaacgt cagccgagac taactcttac ttcgcaaaga     5400
          gtatggagtt tctggcgcga ccggtgcctg cgcctcgaac agtattcagg aaccctccac     5460
          atcccgctcc gcgcacaaga acaccgtcac ttgcacccag cagggcctgc tcgagaacca     5520
          gcctagtttc caccccgcca ggcgtgaata gggtgatcac tagagaggag ctcgaggcgc     5580
          ttaccccgtc acgcactcct agcaggtcgg tctcgagaac cagcctggtc tccaacccgc     5640
          caggcgtaaa tagggtgatt acaagagagg agtttgaggc gttcgtagca caacaacaat     5700
          gacggtttga tgcgggtgca tacatctttt cctccgacac cggtcaaggg catttacaac     5760
          aaaaatcagt aaggcaaacg gtgctatccg aagtggtgtt ggagaggacc gaattggaga     5820
          tttcgtatgc cccgcgcctc gaccaagaaa aagaagaatt actacgcaag aaattacagt     5880
          taaatcccac acctgctaac agaagcagat accagtccag gaaggtggag aacatgaaag     5940
          ccataacagc tagacgtatt ctgcaaggcc tagggcatta tttgaaggca gaaggaaaag     6000
          tggagtgcta ccgaaccctg catcctgttc ctttgtattc atctagtgtg aaccgtgcct     6060
          tttcaagccc caaggtcgca gtggaagcct gtaacgccat gttgaaagag aactttccga     6120
          ctgtggcttc ttactgtatt attccagagt acgatgccta tttggacatg gttgacggag     6180
          cttcatgctg cttagacact gccagttttt gccctgcaaa gctgcgcagc tttccaaaga     6240
          aacactccta tttggaaccc acaatacgat cggcagtgcc ttcagcgatc cagaacacgc     6300
          tccagaacgt cctggcagct gccacaaaaa gaaattgcaa tgtcacgcaa atgagagaat     6360
          tgcccgtatt ggattcggcg gcctttaatg tggaatgctt caagaaatat gcgtgtaata     6420
          atgaatattg ggaaacgttt aaagaaaacc ccatcaggct tactgaagaa aacgtggtaa     6480
          attacattac caaattaaaa ggaccaaaag ctgctgctct ttttgcgaag acacataatt     6540
          tgaatatgtt gcaggacata ccaatggaca ggtttgtaat ggacttaaag agagacgtga     6600
          aagtgactcc aggaacaaaa catactgaag aacggcccaa ggtacaggtg atccaggctg     6660
          ccgatccgct agcaacagcg tatctgtgcg gaatccaccg agagctggtt aggagattaa     6720
          atgcggtcct gcttccgaac attcatacac tgtttgatat gtcggctgaa gactttgacg     6780
          ctattatagc cgagcacttc cagcctgggg attgtgttct ggaaactgac atcgcgtcgt     6840
          ttgataaaag tgaggacgac gccatggctc tgaccgcgtt aatgattctg gaagacttag     6900
          gtgtggacgc agagctgttg acgctgattg aggcggcttt cggcgaaatt tcatcaatac     6960
          atttgcccac taaaactaaa tttaaattcg gagccatgat gaaatctgga atgttcctca     7020
          cactgtttgt gaacacagtc attaacattg taatcgcaag cagagtgttg agagaacggc     7080
          taaccggatc accatgtgca gcattcattg gagatgacaa tatcgtgaaa ggagtcaaat     7140
          cggacaaatt aatggcagac aggtgcgcca cctggttgaa tatggaagtc aagattatag     7200
          atgctgtggt gggcgagaaa gcgccttatt tctgtggagg gtttattttg tgtgactccg     7260
          tgaccggcac agcgtgccgt gtggcagacc ccctaaaaag gctgtttaag cttggcaaac     7320
          ctctggcagc agacgatgaa catgatgatg acaggagaag ggcattgcat gaagagtcaa     7380
          cacgctggaa ccgagtgggt attctttcag agctgtgcaa ggcagtagaa tcaaggtatg     7440
          aaaccgtagg aacttccatc atagttatgg ccatgactac tctagctagc agtgttaaat     7500
          cattcagcta cctgagaggg gcccctataa ctctctacgg ctaacctgaa tggactacga     7560
          catagtctag tccgccaaga tatcatcgat acagcagcaa ttggcaagct gcttacatag     7620
          aaggcgcgcc gtttaaacgg ccggccttaa ttaagtaacg atacagcagc aattggcaag     7680
          ctgcttacat agaactcgcg gcgattggca tgccgcttta aaatttttat tttatttttc     7740
          ttttcttttc cgaatcggat tttgttttta atatttcaaa aaaaaaaaaa aaaaaaaaaa     7800
          aaaaaaaaaa aaaaaaaccc ctctctaaac ggaggggttt ttttcagcgt aactggactg     7860
          gccacagtta ggcggccgcg catgttcatc atcagtaacc cgtatcgtga gcatcctctc     7920
          tcgtttcatc ggtatcatta cctccatgaa cagaaatccc ccttacacgg aggcatcagt     7980
          gaccaaacag gaaaaaaccg cccttaacat ggcccgcttt atcagaagcc agacattaac     8040
          gcttctggag aaactcaacg agctggacgc ggatgaacag gcagacatct gtgaatcgct     8100
          tcacgaccac gctgatgagc tttaccgcag ctgcctcgcg cgtttcggtg atgacggtga     8160
          aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag cggatgccgg     8220
          gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg gcgcagccat     8280
          gacccagtca cgtagcgata gcggagtgta tactggctta actatgcggc atcagagcag     8340
          attgtactga gagtgcacca tatg                                            8364
          <![CDATA[<210>  26]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  奧拉病毒之5' UTR]]>
          <![CDATA[<400>  26]]>
          atagcggacg gactagtact tgtactacag aattaactgc cgtgtgccgc                  50
          <![CDATA[<210>  27]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  屈公病毒之5' UTR]]>
          <![CDATA[<400>  27]]>
          atggctgcgt gagacacacg tagcctacca gtttcttact gctctactct                  50
          <![CDATA[<210>  28]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  奧-奈氏病毒之5' UTR]]>
          <![CDATA[<400>  28]]>
          atagctgcgt gatacacaca cgcagcttac gggtttcata ctgctctact                  50
          <![CDATA[<210>  29]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  貝巴魯病毒之5' UTR]]>
          <![CDATA[<400>  29]]>
          atggcggctg tgtgacacac gagccgtcga tttcaacctt cttgctccct                  50
          <![CDATA[<210>  30]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  勝利基森林病毒之5' UTR]]>
          <![CDATA[<400>  30]]>
          atggcggatg tgtgacatac acgacgccaa aagattttgt tccagctcct                  50
          <![CDATA[<210>  31]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  馬雅羅病毒之5' UTR]]>
          <![CDATA[<400>  31]]>
          atggcgggca agtgacactt gttccgccgg tcgtctctaa gctcttcctc                  50
          <![CDATA[<210>  32]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  蓋塔病毒之5' UTR]]>
          <![CDATA[<400>  32]]>
          atggcggacg tgtgacatca ccgttcgctc tttctaggat cctttgctac                  50
          <![CDATA[<210>  33]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  鷺山病毒之5' UTR]]>
          <![CDATA[<400>  33]]>
          atggcggacg tgtgacatca ccgttcgctc tttctaggat cctttgctac                  50
          <![CDATA[<210>  34]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  恩杜穆病毒之5' UTR]]>
          <![CDATA[<400>  34]]>
          atggtgcgga gttgagagac gaagcaccaa acaactacgc ggctcaccat                  50
          <![CDATA[<210>  35]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  米德爾堡病毒之5' UTR]]>
          <![CDATA[<400>  35]]>
          attggtggtt acgtacacgt gccaccaccc cccaccctcc aagcgatcca                  50
          <![CDATA[<210>  36]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  東部馬腦炎病毒之5' UTR]]>
          <![CDATA[<400>  36]]>
          atagggtacg gtgtagaggc aaccacccta tttccaccta tccaaaatgg                  50
          <![CDATA[<210>  37]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  摩根堡病毒之5' UTR]]>
          <![CDATA[<400>  37]]>
          atagggtatg gtttagaggc gcctacccta cttaaccgat ccaaacatgg                  50
          <![CDATA[<210>  38]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  車溪病毒之5' UTR]]>
          <![CDATA[<400>  38]]>
          atagggtatg gtttagaggc gcctacccta cttaaccgat ccaaacatgg                  50
          <![CDATA[<210>  39]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  委內瑞拉馬腦炎病毒之5' UTR]]>
          <![CDATA[<400>  39]]>
          atgggcggcg caagagagaa gcccaaacca attacctacc caaaatggag                  50
          <![CDATA[<210>  40]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  沃達羅河病毒之5' UTR]]>
          <![CDATA[<400>  40]]>
          attggcggca tagtacatac tatataaaag aaacagccga ccaattgcac                  50
          <![CDATA[<210>  41]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  辛得比斯病毒之5' UTR]]>
          <![CDATA[<400>  41]]>
          attgacggcg tagtacacac tattgaatca aacagccgac caattgcact                  50
          <![CDATA[<210>  42]]>
          <![CDATA[<211>  50]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  貝巴魯病毒之5' UTR]]>
          <![CDATA[<400>  42]]>
          attggcggcg tagtacacac tattgaatca aacagccgac caattgcact                  50
          <![CDATA[<210>  43]]>
          <![CDATA[<211>  145]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  來自辛得比斯病毒DLP]]>
          <![CDATA[<400>  43]]>
          atagtcagca tagtacattt catctgacta atactacaac accaccacca tgaatagagg       60
          attctttaac atgctcggcc gccgcccctt cccggccccc actgccatgt ggaggccgcg      120
          gagaaggagg caggcggccc cgatg                                            145
          <![CDATA[<210>  44]]>
          <![CDATA[<211>  104]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  來自辛得比斯病毒DLP]]>
          <![CDATA[<400>  44]]>
          atgaatagag gattctttaa catgctcggc cgccgcccct tcccggcccc cactgccatg       60
          tggaggccgc ggagaaggag gcaggcggcc ccgatgcctg cccg                       104
          <![CDATA[<210>  45]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  來自奧拉病毒之DLP]]>
          <![CDATA[<400>  45]]>
          atgaactctg tcttttacaa tccgtttggc cgaggtgcct acgctcaacc tccaatagca       60
          tggaggccaa gacgtagggc tgcacctgcg cctcgaccat ccgggttgac tacccagatc      120
          <![CDATA[<210>  46]]>
          <![CDATA[<211>  71]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  來自東部馬腦炎病毒SA之DLP]]>
          <![CDATA[<400>  46]]>
          atgtttccgt atccaacatt gaactacccg cctatggcac cggttaatcc gatggcatac       60
          agggacccca a                                                            71
          <![CDATA[<210>  47]]>
          <![CDATA[<211>  91]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  來自奧-奈氏病毒之DLP]]>
          <![CDATA[<400>  47]]>
          atggagttca taccagcaca aacttactac aatagaagat accagcctag accctggact       60
          caacgcccta ctatccaggt gatcaggcca a                                      91
          <![CDATA[<210>  48]]>
          <![CDATA[<211>  67]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  來自勝利基森林病毒之DLP]]>
          <![CDATA[<400>  48]]>
          atgaattaca tccctacgca aacgttttac ggccgccggt ggcgcccgcg cccggcggcc       60
          cgtcctt                                                                 67
          <![CDATA[<210>  49]]>
          <![CDATA[<211>  69]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  來自羅斯河病毒之DLP]]>
          <![CDATA[<400>  49]]>
          atgaattaca taccaaccca gactttttac ggacgccgtt ggcggcctcg cccggcgttc       60
          cgtccatgg                                                               69
          <![CDATA[<210>  50]]>
          <![CDATA[<211>  91]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  來自馬雅羅病毒之DLP]]>
          <![CDATA[<400>  50]]>
          atggatttcc taccaacaca agtgttttat ggcaggcgat ggagaccacg aatgccgcca       60
          cgcccttgga ggccacgccc acctacaatt c                                      91
          <![CDATA[<210>  51]]>
          <![CDATA[<211>  2492]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  非結構性聚合蛋白(P1234)，PRT，委內瑞拉馬腦炎病毒(VEEV)]]>
          <![CDATA[<400>  51]]>
          Met Glu Lys Val His Val Asp Ile Glu Glu Asp Ser Pro Phe Leu Arg 
          1               5                   10                  15      
          Ala Leu Gln Arg Ser Phe Pro Gln Phe Glu Val Glu Ala Lys Gln Val 
                      20                  25                  30          
          Thr Asp Asn Asp His Ala Asn Ala Arg Ala Phe Ser His Leu Ala Ser 
                  35                  40                  45              
          Lys Leu Ile Glu Thr Glu Val Asp Pro Ser Asp Thr Ile Leu Asp Ile 
              50                  55                  60                  
          Gly Ser Ala Pro Ala Arg Arg Met Tyr Ser Lys His Lys Tyr His Cys 
          65                  70                  75                  80  
          Ile Cys Pro Met Arg Cys Ala Glu Asp Pro Asp Arg Leu Tyr Lys Tyr 
                          85                  90                  95      
          Ala Thr Lys Leu Lys Lys Asn Cys Lys Glu Ile Thr Asp Lys Glu Leu 
                      100                 105                 110         
          Asp Lys Lys Met Lys Glu Leu Ala Ala Val Met Ser Asp Pro Asp Leu 
                  115                 120                 125             
          Glu Thr Glu Thr Met Cys Leu His Asp Asp Glu Ser Cys Arg Tyr Glu 
              130                 135                 140                 
          Gly Gln Val Ala Val Tyr Gln Asp Val Tyr Ala Val Asp Gly Pro Thr 
          145                 150                 155                 160 
          Ser Leu Tyr His Gln Ala Asn Lys Gly Val Arg Val Ala Tyr Trp Ile 
                          165                 170                 175     
          Gly Phe Asp Thr Thr Pro Phe Met Phe Lys Asn Leu Ala Gly Ala Tyr 
                      180                 185                 190         
          Pro Ser Tyr Ser Thr Asn Trp Ala Asp Glu Thr Val Leu Thr Ala Arg 
                  195                 200                 205             
          Asn Ile Gly Leu Cys Ser Ser Asp Val Met Glu Arg Ser Arg Arg Gly 
              210                 215                 220                 
          Met Ser Ile Leu Arg Lys Lys Tyr Leu Lys Pro Ser Asn Asn Val Leu 
          225                 230                 235                 240 
          Phe Ser Val Gly Ser Thr Ile Tyr His Glu Lys Arg Asp Leu Leu Arg 
                          245                 250                 255     
          Ser Trp His Leu Pro Ser Val Phe His Leu Arg Gly Lys Gln Asn Tyr 
                      260                 265                 270         
          Thr Cys Arg Cys Glu Thr Ile Val Ser Cys Asp Gly Tyr Val Val Lys 
                  275                 280                 285             
          Arg Ile Ala Ile Ser Pro Gly Leu Tyr Gly Lys Pro Ser Gly Tyr Ala 
              290                 295                 300                 
          Ala Thr Met His Arg Glu Gly Phe Leu Cys Cys Lys Val Thr Asp Thr 
          305                 310                 315                 320 
          Leu Asn Gly Glu Arg Val Ser Phe Pro Val Cys Thr Tyr Val Pro Ala 
                          325                 330                 335     
          Thr Leu Cys Asp Gln Met Thr Gly Ile Leu Ala Thr Asp Val Ser Ala 
                      340                 345                 350         
          Asp Asp Ala Gln Lys Leu Leu Val Gly Leu Asn Gln Arg Ile Val Val 
                  355                 360                 365             
          Asn Gly Arg Thr Gln Arg Asn Thr Asn Thr Met Lys Asn Tyr Leu Leu 
              370                 375                 380                 
          Pro Val Val Ala Gln Ala Phe Ala Arg Trp Ala Lys Glu Tyr Lys Glu 
          385                 390                 395                 400 
          Asp Gln Glu Asp Glu Arg Pro Leu Gly Leu Arg Asp Arg Gln Leu Val 
                          405                 410                 415     
          Met Gly Cys Cys Trp Ala Phe Arg Arg His Lys Ile Thr Ser Ile Tyr 
                      420                 425                 430         
          Lys Arg Pro Asp Thr Gln Thr Ile Ile Lys Val Asn Ser Asp Phe His 
                  435                 440                 445             
          Ser Phe Val Leu Pro Arg Ile Gly Ser Asn Thr Leu Glu Ile Gly Leu 
              450                 455                 460                 
          Arg Thr Arg Ile Arg Lys Met Leu Glu Glu His Lys Glu Pro Ser Pro 
          465                 470                 475                 480 
          Leu Ile Thr Ala Glu Asp Val Gln Glu Ala Lys Cys Ala Ala Asp Glu 
                          485                 490                 495     
          Ala Lys Glu Val Arg Glu Ala Glu Glu Leu Arg Ala Ala Leu Pro Pro 
                      500                 505                 510         
          Leu Ala Ala Asp Val Glu Glu Pro Thr Leu Glu Ala Asp Val Asp Leu 
                  515                 520                 525             
          Met Leu Gln Glu Ala Gly Ala Gly Ser Val Glu Thr Pro Arg Gly Leu 
              530                 535                 540                 
          Ile Lys Val Thr Ser Tyr Ala Gly Glu Asp Lys Ile Gly Ser Tyr Ala 
          545                 550                 555                 560 
          Val Leu Ser Pro Gln Ala Val Leu Lys Ser Glu Lys Leu Ser Cys Ile 
                          565                 570                 575     
          His Pro Leu Ala Glu Gln Val Ile Val Ile Thr His Ser Gly Arg Lys 
                      580                 585                 590         
          Gly Arg Tyr Ala Val Glu Pro Tyr His Gly Lys Val Val Val Pro Glu 
                  595                 600                 605             
          Gly His Ala Ile Pro Val Gln Asp Phe Gln Ala Leu Ser Glu Ser Ala 
              610                 615                 620                 
          Thr Ile Val Tyr Asn Glu Arg Glu Phe Val Asn Arg Tyr Leu His His 
          625                 630                 635                 640 
          Ile Ala Thr His Gly Gly Ala Leu Asn Thr Asp Glu Glu Tyr Tyr Lys 
                          645                 650                 655     
          Thr Val Lys Pro Ser Glu His Asp Gly Glu Tyr Leu Tyr Asp Ile Asp 
                      660                 665                 670         
          Arg Lys Gln Cys Val Lys Lys Glu Leu Val Thr Gly Leu Gly Leu Thr 
                  675                 680                 685             
          Gly Glu Leu Val Asp Pro Pro Phe His Glu Phe Ala Tyr Glu Ser Leu 
              690                 695                 700                 
          Arg Thr Arg Pro Ala Ala Pro Tyr Gln Val Pro Thr Ile Gly Val Tyr 
          705                 710                 715                 720 
          Gly Val Pro Gly Ser Gly Lys Ser Gly Ile Ile Lys Ser Ala Val Thr 
                          725                 730                 735     
          Lys Lys Asp Leu Val Val Ser Ala Lys Lys Glu Asn Cys Ala Glu Ile 
                      740                 745                 750         
          Ile Arg Asp Val Lys Lys Met Lys Gly Leu Asp Val Asn Ala Arg Thr 
                  755                 760                 765             
          Val Asp Ser Val Leu Leu Asn Gly Cys Lys His Pro Val Glu Thr Leu 
              770                 775                 780                 
          Tyr Ile Asp Glu Ala Phe Ala Cys His Ala Gly Thr Leu Arg Ala Leu 
          785                 790                 795                 800 
          Ile Ala Ile Ile Arg Pro Lys Lys Ala Val Leu Cys Gly Asp Pro Lys 
                          805                 810                 815     
          Gln Cys Gly Phe Phe Asn Met Met Cys Leu Lys Val His Phe Asn His 
                      820                 825                 830         
          Glu Ile Cys Thr Gln Val Phe His Lys Ser Ile Ser Arg Arg Cys Thr 
                  835                 840                 845             
          Lys Ser Val Thr Ser Val Val Ser Thr Leu Phe Tyr Asp Lys Lys Met 
              850                 855                 860                 
          Arg Thr Thr Asn Pro Lys Glu Thr Lys Ile Val Ile Asp Thr Thr Gly 
          865                 870                 875                 880 
          Ser Thr Lys Pro Lys Gln Asp Asp Leu Ile Leu Thr Cys Phe Arg Gly 
                          885                 890                 895     
          Trp Val Lys Gln Leu Gln Ile Asp Tyr Lys Gly Asn Glu Ile Met Thr 
                      900                 905                 910         
          Ala Ala Ala Ser Gln Gly Leu Thr Arg Lys Gly Val Tyr Ala Val Arg 
                  915                 920                 925             
          Tyr Lys Val Asn Glu Asn Pro Leu Tyr Ala Pro Thr Ser Glu His Val 
              930                 935                 940                 
          Asn Val Leu Leu Thr Arg Thr Glu Asp Arg Ile Val Trp Lys Thr Leu 
          945                 950                 955                 960 
          Ala Gly Asp Pro Trp Ile Lys Thr Leu Thr Ala Lys Tyr Pro Gly Asn 
                          965                 970                 975     
          Phe Thr Ala Thr Ile Glu Glu Trp Gln Ala Glu His Asp Ala Ile Met 
                      980                 985                 990         
          Arg His Ile Leu Glu Arg Pro Asp  Pro Thr Asp Val Phe  Gln Asn Lys 
                  995                 1000                 1005             
          Ala Asn  Val Cys Trp Ala Lys  Ala Leu Val Pro Val  Leu Lys Thr 
              1010                 1015                 1020             
          Ala Gly  Ile Asp Met Thr Thr  Glu Gln Trp Asn Thr  Val Asp Tyr 
              1025                 1030                 1035             
          Phe Glu  Thr Asp Lys Ala His  Ser Ala Glu Ile Val  Leu Asn Gln 
              1040                 1045                 1050             
          Leu Cys  Val Arg Phe Phe Gly  Leu Asp Leu Asp Ser  Gly Leu Phe 
              1055                 1060                 1065             
          Ser Ala  Pro Thr Val Pro Leu  Ser Ile Arg Asn Asn  His Trp Asp 
              1070                 1075                 1080             
          Asn Ser  Pro Ser Pro Asn Met  Tyr Gly Leu Asn Lys  Glu Val Val 
              1085                 1090                 1095             
          Arg Gln  Leu Ser Arg Arg Tyr  Pro Gln Leu Pro Arg  Ala Val Ala 
              1100                 1105                 1110             
          Thr Gly  Arg Val Tyr Asp Met  Asn Thr Gly Thr Leu  Arg Asn Tyr 
              1115                 1120                 1125             
          Asp Pro  Arg Ile Asn Leu Val  Pro Val Asn Arg Arg  Leu Pro His 
              1130                 1135                 1140             
          Ala Leu  Val Leu His His Asn  Glu His Pro Gln Ser  Asp Phe Ser 
              1145                 1150                 1155             
          Ser Phe  Val Ser Lys Leu Lys  Gly Arg Thr Val Leu  Val Val Gly 
              1160                 1165                 1170             
          Glu Lys  Leu Ser Val Pro Gly  Lys Met Val Asp Trp  Leu Ser Asp 
              1175                 1180                 1185             
          Arg Pro  Glu Ala Thr Phe Arg  Ala Arg Leu Asp Leu  Gly Ile Pro 
              1190                 1195                 1200             
          Gly Asp  Val Pro Lys Tyr Asp  Ile Ile Phe Val Asn  Val Arg Thr 
              1205                 1210                 1215             
          Pro Tyr  Lys Tyr His His Tyr  Gln Gln Cys Glu Asp  His Ala Ile 
              1220                 1225                 1230             
          Lys Leu  Ser Met Leu Thr Lys  Lys Ala Cys Leu His  Leu Asn Pro 
              1235                 1240                 1245             
          Gly Gly  Thr Cys Val Ser Ile  Gly Tyr Gly Tyr Ala  Asp Arg Ala 
              1250                 1255                 1260             
          Ser Glu  Ser Ile Ile Gly Ala  Ile Ala Arg Gln Phe  Lys Phe Ser 
              1265                 1270                 1275             
          Arg Val  Cys Lys Pro Lys Ser  Ser Leu Glu Glu Thr  Glu Val Leu 
              1280                 1285                 1290             
          Phe Val  Phe Ile Gly Tyr Asp  Arg Lys Ala Arg Thr  His Asn Pro 
              1295                 1300                 1305             
          Tyr Lys  Leu Ser Ser Thr Leu  Thr Asn Ile Tyr Thr  Gly Ser Arg 
              1310                 1315                 1320             
          Leu His  Glu Ala Gly Cys Ala  Pro Ser Tyr His Val  Val Arg Gly 
              1325                 1330                 1335             
          Asp Ile  Ala Thr Ala Thr Glu  Gly Val Ile Ile Asn  Ala Ala Asn 
              1340                 1345                 1350             
          Ser Lys  Gly Gln Pro Gly Gly  Gly Val Cys Gly Ala  Leu Tyr Lys 
              1355                 1360                 1365             
          Lys Phe  Pro Glu Ser Phe Asp  Leu Gln Pro Ile Glu  Val Gly Lys 
              1370                 1375                 1380             
          Ala Arg  Leu Val Lys Gly Ala  Ala Lys His Ile Ile  His Ala Val 
              1385                 1390                 1395             
          Gly Pro  Asn Phe Asn Lys Val  Ser Glu Val Glu Gly  Asp Lys Gln 
              1400                 1405                 1410             
          Leu Ala  Glu Ala Tyr Glu Ser  Ile Ala Lys Ile Val  Asn Asp Asn 
              1415                 1420                 1425             
          Asn Tyr  Lys Ser Val Ala Ile  Pro Leu Leu Ser Thr  Gly Ile Phe 
              1430                 1435                 1440             
          Ser Gly  Asn Lys Asp Arg Leu  Thr Gln Ser Leu Asn  His Leu Leu 
              1445                 1450                 1455             
          Thr Ala  Leu Asp Thr Thr Asp  Ala Asp Val Ala Ile  Tyr Cys Arg 
              1460                 1465                 1470             
          Asp Lys  Lys Trp Glu Met Thr  Leu Lys Glu Ala Val  Ala Arg Arg 
              1475                 1480                 1485             
          Glu Ala  Val Glu Glu Ile Cys  Ile Ser Asp Asp Ser  Ser Val Thr 
              1490                 1495                 1500             
          Glu Pro  Asp Ala Glu Leu Val  Arg Val His Pro Lys  Ser Ser Leu 
              1505                 1510                 1515             
          Ala Gly  Arg Lys Gly Tyr Ser  Thr Ser Asp Gly Lys  Thr Phe Ser 
              1520                 1525                 1530             
          Tyr Leu  Glu Gly Thr Lys Phe  His Gln Ala Ala Lys  Asp Ile Ala 
              1535                 1540                 1545             
          Glu Ile  Asn Ala Met Trp Pro  Val Ala Thr Glu Ala  Asn Glu Gln 
              1550                 1555                 1560             
          Val Cys  Met Tyr Ile Leu Gly  Glu Ser Met Ser Ser  Ile Arg Ser 
              1565                 1570                 1575             
          Lys Cys  Pro Val Glu Glu Ser  Glu Ala Ser Thr Pro  Pro Ser Thr 
              1580                 1585                 1590             
          Leu Pro  Cys Leu Cys Ile His  Ala Met Thr Pro Glu  Arg Val Gln 
              1595                 1600                 1605             
          Arg Leu  Lys Ala Ser Arg Pro  Glu Gln Ile Thr Val  Cys Ser Ser 
              1610                 1615                 1620             
          Phe Pro  Leu Pro Lys Tyr Arg  Ile Thr Gly Val Gln  Lys Ile Gln 
              1625                 1630                 1635             
          Cys Ser  Gln Pro Ile Leu Phe  Ser Pro Lys Val Pro  Ala Tyr Ile 
              1640                 1645                 1650             
          His Pro  Arg Lys Tyr Leu Val  Glu Thr Pro Pro Val  Asp Glu Thr 
              1655                 1660                 1665             
          Pro Glu  Pro Ser Ala Glu Asn  Gln Ser Thr Glu Gly  Thr Pro Glu 
              1670                 1675                 1680             
          Gln Pro  Pro Leu Ile Thr Glu  Asp Glu Thr Arg Thr  Arg Thr Pro 
              1685                 1690                 1695             
          Glu Pro  Ile Ile Ile Glu Glu  Glu Glu Glu Asp Ser  Ile Ser Leu 
              1700                 1705                 1710             
          Leu Ser  Asp Gly Pro Thr His  Gln Val Leu Gln Val  Glu Ala Asp 
              1715                 1720                 1725             
          Ile His  Gly Pro Pro Ser Val  Ser Ser Ser Ser Trp  Ser Ile Pro 
              1730                 1735                 1740             
          His Ala  Ser Asp Phe Asp Val  Asp Ser Leu Ser Ile  Leu Asp Thr 
              1745                 1750                 1755             
          Leu Glu  Gly Ala Ser Val Thr  Ser Gly Ala Thr Ser  Ala Glu Thr 
              1760                 1765                 1770             
          Asn Ser  Tyr Phe Ala Lys Ser  Met Glu Phe Leu Ala  Arg Pro Val 
              1775                 1780                 1785             
          Pro Ala  Pro Arg Thr Val Phe  Arg Asn Pro Pro His  Pro Ala Pro 
              1790                 1795                 1800             
          Arg Thr  Arg Thr Pro Ser Leu  Ala Pro Ser Arg Ala  Cys Ser Arg 
              1805                 1810                 1815             
          Thr Ser  Leu Val Ser Thr Pro  Pro Gly Val Asn Arg  Val Ile Thr 
              1820                 1825                 1830             
          Arg Glu  Glu Leu Glu Ala Leu  Thr Pro Ser Arg Thr  Pro Ser Arg 
              1835                 1840                 1845             
          Ser Val  Ser Arg Thr Ser Leu  Val Ser Asn Pro Pro  Gly Val Asn 
              1850                 1855                 1860             
          Arg Val  Ile Thr Arg Glu Glu  Phe Glu Ala Phe Val  Ala Gln Gln 
              1865                 1870                 1875             
          Gln Arg  Phe Asp Ala Gly Ala  Tyr Ile Phe Ser Ser  Asp Thr Gly 
              1880                 1885                 1890             
          Gln Gly  His Leu Gln Gln Lys  Ser Val Arg Gln Thr  Val Leu Ser 
              1895                 1900                 1905             
          Glu Val  Val Leu Glu Arg Thr  Glu Leu Glu Ile Ser  Tyr Ala Pro 
              1910                 1915                 1920             
          Arg Leu  Asp Gln Glu Lys Glu  Glu Leu Leu Arg Lys  Lys Leu Gln 
              1925                 1930                 1935             
          Leu Asn  Pro Thr Pro Ala Asn  Arg Ser Arg Tyr Gln  Ser Arg Lys 
              1940                 1945                 1950             
          Val Glu  Asn Met Lys Ala Ile  Thr Ala Arg Arg Ile  Leu Gln Gly 
              1955                 1960                 1965             
          Leu Gly  His Tyr Leu Lys Ala  Glu Gly Lys Val Glu  Cys Tyr Arg 
              1970                 1975                 1980             
          Thr Leu  His Pro Val Pro Leu  Tyr Ser Ser Ser Val  Asn Arg Ala 
              1985                 1990                 1995             
          Phe Ser  Ser Pro Lys Val Ala  Val Glu Ala Cys Asn  Ala Met Leu 
              2000                 2005                 2010             
          Lys Glu  Asn Phe Pro Thr Val  Ala Ser Tyr Cys Ile  Ile Pro Glu 
              2015                 2020                 2025             
          Tyr Asp  Ala Tyr Leu Asp Met  Val Asp Gly Ala Ser  Cys Cys Leu 
              2030                 2035                 2040             
          Asp Thr  Ala Ser Phe Cys Pro  Ala Lys Leu Arg Ser  Phe Pro Lys 
              2045                 2050                 2055             
          Lys His  Ser Tyr Leu Glu Pro  Thr Ile Arg Ser Ala  Val Pro Ser 
              2060                 2065                 2070             
          Ala Ile  Gln Asn Thr Leu Gln  Asn Val Leu Ala Ala  Ala Thr Lys 
              2075                 2080                 2085             
          Arg Asn  Cys Asn Val Thr Gln  Met Arg Glu Leu Pro  Val Leu Asp 
              2090                 2095                 2100             
          Ser Ala  Ala Phe Asn Val Glu  Cys Phe Lys Lys Tyr  Ala Cys Asn 
              2105                 2110                 2115             
          Asn Glu  Tyr Trp Glu Thr Phe  Lys Glu Asn Pro Ile  Arg Leu Thr 
              2120                 2125                 2130             
          Glu Glu  Asn Val Val Asn Tyr  Ile Thr Lys Leu Lys  Gly Pro Lys 
              2135                 2140                 2145             
          Ala Ala  Ala Leu Phe Ala Lys  Thr His Asn Leu Asn  Met Leu Gln 
              2150                 2155                 2160             
          Asp Ile  Pro Met Asp Arg Phe  Val Met Asp Leu Lys  Arg Asp Val 
              2165                 2170                 2175             
          Lys Val  Thr Pro Gly Thr Lys  His Thr Glu Glu Arg  Pro Lys Val 
              2180                 2185                 2190             
          Gln Val  Ile Gln Ala Ala Asp  Pro Leu Ala Thr Ala  Tyr Leu Cys 
              2195                 2200                 2205             
          Gly Ile  His Arg Glu Leu Val  Arg Arg Leu Asn Ala  Val Leu Leu 
              2210                 2215                 2220             
          Pro Asn  Ile His Thr Leu Phe  Asp Met Ser Ala Glu  Asp Phe Asp 
              2225                 2230                 2235             
          Ala Ile  Ile Ala Glu His Phe  Gln Pro Gly Asp Cys  Val Leu Glu 
              2240                 2245                 2250             
          Thr Asp  Ile Ala Ser Phe Asp  Lys Ser Glu Asp Asp  Ala Met Ala 
              2255                 2260                 2265             
          Leu Thr  Ala Leu Met Ile Leu  Glu Asp Leu Gly Val  Asp Ala Glu 
              2270                 2275                 2280             
          Leu Leu  Thr Leu Ile Glu Ala  Ala Phe Gly Glu Ile  Ser Ser Ile 
              2285                 2290                 2295             
          His Leu  Pro Thr Lys Thr Lys  Phe Lys Phe Gly Ala  Met Met Lys 
              2300                 2305                 2310             
          Ser Gly  Met Phe Leu Thr Leu  Phe Val Asn Thr Val  Ile Asn Ile 
              2315                 2320                 2325             
          Val Ile  Ala Ser Arg Val Leu  Arg Glu Arg Leu Thr  Gly Ser Pro 
              2330                 2335                 2340             
          Cys Ala  Ala Phe Ile Gly Asp  Asp Asn Ile Val Lys  Gly Val Lys 
              2345                 2350                 2355             
          Ser Asp  Lys Leu Met Ala Asp  Arg Cys Ala Thr Trp  Leu Asn Met 
              2360                 2365                 2370             
          Glu Val  Lys Ile Ile Asp Ala  Val Val Gly Glu Lys  Ala Pro Tyr 
              2375                 2380                 2385             
          Phe Cys  Gly Gly Phe Ile Leu  Cys Asp Ser Val Thr  Gly Thr Ala 
              2390                 2395                 2400             
          Cys Arg  Val Ala Asp Pro Leu  Lys Arg Leu Phe Lys  Leu Gly Lys 
              2405                 2410                 2415             
          Pro Leu  Ala Ala Asp Asp Glu  His Asp Asp Asp Arg  Arg Arg Ala 
              2420                 2425                 2430             
          Leu His  Glu Glu Ser Thr Arg  Trp Asn Arg Val Gly  Ile Leu Ser 
              2435                 2440                 2445             
          Glu Leu  Cys Lys Ala Val Glu  Ser Arg Tyr Glu Thr  Val Gly Thr 
              2450                 2455                 2460             
          Ser Ile  Ile Val Met Ala Met  Thr Thr Leu Ala Ser  Ser Val Lys 
              2465                 2470                 2475             
          Ser Phe  Ser Tyr Leu Arg Gly  Ala Pro Ile Thr Leu  Tyr Gly 
              2480                 2485                 2490         
          <![CDATA[<210>  52]]>
          <![CDATA[<211>  2493]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  非結構性聚合蛋白(P1234)，PRT，東部馬腦炎病毒(EEEV)]]>
          <![CDATA[<400>  52]]>
          Met Glu Lys Val His Val Asp Leu Asp Ala Asp Ser Pro Phe Val Lys 
          1               5                   10                  15      
          Ser Leu Gln Arg Cys Phe Pro His Phe Glu Ile Glu Ala Thr Gln Val 
                      20                  25                  30          
          Thr Asp Asn Asp His Ala Asn Ala Arg Ala Phe Ser His Leu Ala Thr 
                  35                  40                  45              
          Lys Leu Ile Glu Gly Glu Val Asp Thr Asp Gln Val Ile Leu Asp Ile 
              50                  55                  60                  
          Gly Ser Ala Pro Val Arg His Thr His Ser Lys His Lys Tyr His Cys 
          65                  70                  75                  80  
          Ile Cys Pro Met Lys Ser Ala Glu Asp Pro Asp Arg Leu Tyr Arg Tyr 
                          85                  90                  95      
          Ala Asp Lys Leu Arg Lys Ser Asp Val Thr Asp Lys Cys Ile Ala Ser 
                      100                 105                 110         
          Lys Ala Ala Asp Leu Leu Thr Val Met Ser Thr Pro Asp Ala Glu Thr 
                  115                 120                 125             
          Pro Ser Leu Cys Met His Thr Asp Ser Thr Cys Arg Tyr His Gly Ser 
              130                 135                 140                 
          Val Ala Val Tyr Gln Asp Val Tyr Ala Val His Ala Pro Thr Ser Ile 
          145                 150                 155                 160 
          Tyr Tyr Gln Ala Leu Lys Gly Val Arg Thr Ile Tyr Trp Ile Gly Phe 
                          165                 170                 175     
          Asp Thr Thr Pro Phe Met Tyr Lys Asn Met Ala Gly Ala Tyr Pro Thr 
                      180                 185                 190         
          Tyr Asn Thr Asn Trp Ala Asp Glu Ser Val Leu Glu Ala Arg Asn Ile 
                  195                 200                 205             
          Gly Leu Gly Ser Ser Asp Leu His Glu Lys Ser Phe Gly Lys Val Ser 
              210                 215                 220                 
          Ile Met Arg Lys Lys Lys Leu Gln Pro Thr Asn Lys Val Ile Phe Ser 
          225                 230                 235                 240 
          Val Gly Ser Thr Ile Tyr Thr Glu Glu Arg Ile Leu Leu Arg Ser Trp 
                          245                 250                 255     
          His Leu Pro Asn Val Phe His Leu Lys Gly Lys Thr Ser Phe Thr Gly 
                      260                 265                 270         
          Arg Cys Asn Thr Ile Val Ser Cys Glu Gly Tyr Val Val Lys Lys Ile 
                  275                 280                 285             
          Thr Leu Ser Pro Gly Ile Tyr Gly Lys Val Asp Asn Leu Ala Ser Thr 
              290                 295                 300                 
          Met His Arg Glu Gly Phe Leu Ser Cys Lys Val Thr Asp Thr Leu Arg 
          305                 310                 315                 320 
          Gly Glu Arg Val Ser Phe Pro Val Cys Thr Tyr Val Pro Ala Thr Leu 
                          325                 330                 335     
          Cys Asp Gln Met Thr Gly Ile Leu Ala Thr Asp Val Ser Val Asp Asp 
                      340                 345                 350         
          Ala Gln Lys Leu Leu Val Gly Leu Asn Gln Arg Ile Val Val Asn Gly 
                  355                 360                 365             
          Arg Thr Gln Arg Asn Thr Asn Thr Met Gln Asn Tyr Leu Leu Pro Val 
              370                 375                 380                 
          Val Ala Gln Ala Phe Ser Arg Trp Ala Arg Glu His Arg Ala Asp Leu 
          385                 390                 395                 400 
          Glu Asp Glu Lys Gly Leu Gly Val Arg Glu Arg Ser Leu Val Met Gly 
                          405                 410                 415     
          Cys Cys Trp Ala Phe Lys Thr His Lys Ile Thr Ser Ile Tyr Lys Arg 
                      420                 425                 430         
          Pro Gly Thr Gln Thr Ile Lys Lys Val Pro Ala Val Phe Asn Ser Phe 
                  435                 440                 445             
          Val Ile Pro Gln Pro Thr Ser Tyr Gly Leu Asp Ile Gly Leu Arg Arg 
              450                 455                 460                 
          Arg Ile Lys Met Leu Phe Asp Ala Lys Lys Ala Pro Ala Pro Ile Ile 
          465                 470                 475                 480 
          Thr Glu Ala Asp Val Ala His Leu Lys Gly Leu Gln Asp Glu Ala Glu 
                          485                 490                 495     
          Ala Val Ala Glu Ala Glu Ala Val Arg Ala Ala Leu Pro Pro Leu Leu 
                      500                 505                 510         
          Pro Glu Val Asp Lys Glu Thr Val Glu Ala Asp Ile Asp Leu Ile Met 
                  515                 520                 525             
          Gln Glu Ala Gly Ala Gly Ser Val Glu Thr Pro Arg Arg His Ile Lys 
              530                 535                 540                 
          Val Thr Thr Tyr Pro Gly Glu Glu Met Ile Gly Ser Tyr Ala Val Leu 
          545                 550                 555                 560 
          Ser Pro Gln Ala Val Leu Asn Ser Glu Lys Leu Ala Cys Ile His Pro 
                          565                 570                 575     
          Leu Ala Glu Gln Val Leu Val Met Thr His Lys Gly Arg Ala Gly Arg 
                      580                 585                 590         
          Tyr Lys Val Glu Pro Tyr His Gly Arg Val Ile Val Pro Ser Gly Thr 
                  595                 600                 605             
          Ala Ile Pro Ile Leu Asp Phe Gln Ala Leu Ser Glu Ser Ala Thr Ile 
              610                 615                 620                 
          Val Phe Asn Glu Arg Glu Phe Val Asn Arg Tyr Leu His His Ile Ala 
          625                 630                 635                 640 
          Val Asn Gly Gly Ala Leu Asn Thr Asp Glu Glu Tyr Tyr Lys Val Val 
                          645                 650                 655     
          Lys Ser Thr Glu Thr Asp Ser Glu Tyr Val Phe Asp Ile Asp Ala Lys 
                      660                 665                 670         
          Lys Cys Val Lys Lys Gly Asp Ala Gly Pro Met Cys Leu Val Gly Glu 
                  675                 680                 685             
          Leu Val Asp Pro Pro Phe His Glu Phe Ala Tyr Glu Ser Leu Lys Thr 
              690                 695                 700                 
          Arg Pro Ala Ala Pro His Lys Val Pro Thr Ile Gly Val Tyr Gly Val 
          705                 710                 715                 720 
          Pro Gly Ser Gly Lys Ser Gly Ile Ile Lys Ser Ala Val Thr Lys Arg 
                          725                 730                 735     
          Asp Leu Val Val Ser Ala Lys Lys Glu Asn Cys Met Glu Ile Ile Lys 
                      740                 745                 750         
          Asp Val Lys Arg Met Arg Gly Met Asp Ile Ala Ala Arg Thr Val Asp 
                  755                 760                 765             
          Ser Val Leu Leu Asn Gly Val Lys His Ser Val Asp Thr Leu Tyr Ile 
              770                 775                 780                 
          Asp Glu Ala Phe Ala Cys His Ala Gly Thr Leu Leu Ala Leu Ile Ala 
          785                 790                 795                 800 
          Ile Val Lys Pro Lys Lys Val Val Leu Cys Gly Asp Pro Lys Gln Cys 
                          805                 810                 815     
          Gly Phe Phe Asn Met Met Cys Leu Lys Val His Phe Asn His Glu Ile 
                      820                 825                 830         
          Cys Thr Glu Val Tyr His Lys Ser Ile Ser Arg Arg Cys Thr Lys Thr 
                  835                 840                 845             
          Val Thr Ser Ile Val Ser Thr Leu Phe Tyr Asp Lys Arg Met Arg Thr 
              850                 855                 860                 
          Val Asn Pro Cys Asn Asp Lys Ile Ile Ile Asp Thr Thr Ser Thr Thr 
          865                 870                 875                 880 
          Lys Pro Leu Lys Asp Asp Ile Ile Leu Thr Cys Phe Arg Gly Trp Val 
                          885                 890                 895     
          Lys Gln Leu Gln Ile Asp Tyr Lys Asn His Glu Ile Met Thr Ala Ala 
                      900                 905                 910         
          Ala Ser Gln Gly Leu Thr Arg Lys Gly Val Tyr Ala Val Arg Tyr Lys 
                  915                 920                 925             
          Val Asn Glu Asn Pro Leu Tyr Ala Gln Thr Ser Glu His Val Asn Val 
              930                 935                 940                 
          Leu Leu Thr Arg Thr Glu Lys Arg Ile Val Trp Lys Thr Leu Ala Gly 
          945                 950                 955                 960 
          Asp Pro Trp Ile Lys Thr Leu Thr Ala Ser Tyr Pro Gly Asn Phe Thr 
                          965                 970                 975     
          Ala Thr Leu Glu Glu Trp Gln Ala Glu His Asp Ala Ile Met Ala Lys 
                      980                 985                 990         
          Ile Leu Glu Thr Pro Ala Ser Ser  Asp Val Phe Gln Asn  Lys Val Asn 
                  995                 1000                 1005             
          Val Cys  Trp Ala Lys Ala Leu  Glu Pro Val Leu Ala  Thr Ala Asn 
              1010                 1015                 1020             
          Ile Thr  Leu Thr Arg Ser Gln  Trp Glu Thr Ile Pro  Ala Phe Lys 
              1025                 1030                 1035             
          Asp Asp  Lys Ala Tyr Ser Pro  Glu Met Ala Leu Asn  Phe Phe Cys 
              1040                 1045                 1050             
          Thr Arg  Phe Phe Gly Val Asp  Ile Asp Ser Gly Leu  Phe Ser Ala 
              1055                 1060                 1065             
          Pro Thr  Val Pro Leu Thr Tyr  Thr Asn Glu His Trp  Asp Asn Ser 
              1070                 1075                 1080             
          Pro Gly  Pro Asn Met Tyr Gly  Leu Cys Met Arg Thr  Ala Lys Glu 
              1085                 1090                 1095             
          Leu Ala  Arg Arg Tyr Pro Cys  Ile Leu Lys Ala Val  Asp Thr Gly 
              1100                 1105                 1110             
          Arg Val  Ala Asp Val Arg Thr  Asp Thr Ile Lys Asp  Tyr Asn Pro 
              1115                 1120                 1125             
          Leu Ile  Asn Val Val Pro Leu  Asn Arg Arg Leu Pro  His Ser Leu 
              1130                 1135                 1140             
          Val Val  Thr His Arg Tyr Thr  Gly Asn Gly Asp Tyr  Ser Gln Leu 
              1145                 1150                 1155             
          Val Thr  Lys Met Thr Gly Lys  Thr Val Leu Val Val  Gly Thr Pro 
              1160                 1165                 1170             
          Met Asn  Ile Pro Gly Lys Arg  Val Glu Thr Leu Gly  Pro Ser Pro 
              1175                 1180                 1185             
          Gln Cys  Thr Tyr Lys Ala Glu  Leu Asp Leu Gly Ile  Pro Ala Ala 
              1190                 1195                 1200             
          Leu Gly  Lys Tyr Asp Ile Ile  Phe Ile Asn Val Arg  Thr Pro Tyr 
              1205                 1210                 1215             
          Arg His  His His Tyr Gln Gln  Cys Glu Asp His Ala  Ile His His 
              1220                 1225                 1230             
          Ser Met  Leu Thr Arg Lys Ala  Val Asp His Leu Asn  Lys Gly Gly 
              1235                 1240                 1245             
          Thr Cys  Ile Ala Leu Gly Tyr  Gly Thr Ala Asp Arg  Ala Thr Glu 
              1250                 1255                 1260             
          Asn Ile  Ile Ser Ala Val Ala  Arg Ser Phe Arg Phe  Ser Arg Val 
              1265                 1270                 1275             
          Cys Gln  Pro Lys Cys Ala Trp  Glu Asn Thr Glu Val  Ala Phe Val 
              1280                 1285                 1290             
          Phe Phe  Gly Lys Asp Asn Gly  Asn His Leu Gln Asp  Gln Asp Arg 
              1295                 1300                 1305             
          Leu Ser  Val Val Leu Asn Asn  Ile Tyr Gln Gly Ser  Thr Gln His 
              1310                 1315                 1320             
          Glu Ala  Gly Arg Ala Pro Ala  Tyr Arg Val Val Arg  Gly Asp Ile 
              1325                 1330                 1335             
          Thr Lys  Ser Asn Asp Glu Val  Ile Val Asn Ala Ala  Asn Asn Lys 
              1340                 1345                 1350             
          Gly Gln  Pro Gly Ser Gly Val  Cys Gly Ala Leu Tyr  Arg Lys Trp 
              1355                 1360                 1365             
          Pro Gly  Ala Phe Asp Lys Gln  Pro Val Ala Thr Gly  Lys Ala His 
              1370                 1375                 1380             
          Leu Val  Lys His Ser Pro Asn  Val Ile His Ala Val  Gly Pro Asn 
              1385                 1390                 1395             
          Phe Ser  Arg Leu Ser Glu Asn  Glu Gly Asp Gln Lys  Leu Ser Glu 
              1400                 1405                 1410             
          Val Tyr  Met Asp Ile Ala Arg  Ile Ile Asn Asn Glu  Arg Phe Thr 
              1415                 1420                 1425             
          Lys Val  Ser Ile Pro Leu Leu  Ser Thr Gly Ile Tyr  Ala Gly Gly 
              1430                 1435                 1440             
          Lys Asp  Arg Val Met Gln Ser  Leu Asn His Leu Phe  Thr Ala Met 
              1445                 1450                 1455             
          Asp Thr  Thr Asp Ala Asp Ile  Thr Ile Tyr Cys Leu  Asp Lys Gln 
              1460                 1465                 1470             
          Trp Glu  Ser Arg Ile Lys Glu  Ala Ile Thr Arg Lys  Glu Ser Val 
              1475                 1480                 1485             
          Glu Glu  Leu Thr Glu Asp Asp  Arg Pro Val Asp Ile  Glu Leu Val 
              1490                 1495                 1500             
          Arg Val  His Pro Leu Ser Ser  Leu Ala Gly Arg Pro  Gly Tyr Ser 
              1505                 1510                 1515             
          Thr Thr  Glu Gly Lys Val Tyr  Ser Tyr Leu Glu Gly  Thr Arg Phe 
              1520                 1525                 1530             
          His Gln  Thr Ala Lys Asp Ile  Ala Glu Ile Tyr Ala  Met Trp Pro 
              1535                 1540                 1545             
          Asn Lys  Gln Glu Ala Asn Glu  Gln Ile Cys Leu Tyr  Val Leu Gly 
              1550                 1555                 1560             
          Glu Ser  Met Asn Ser Ile Arg  Ser Lys Cys Pro Val  Glu Glu Ser 
              1565                 1570                 1575             
          Glu Ala  Ser Ser Pro Pro His  Thr Ile Pro Cys Leu  Cys Asn Tyr 
              1580                 1585                 1590             
          Ala Met  Thr Ala Glu Arg Val  Tyr Arg Leu Arg Met  Ala Lys Asn 
              1595                 1600                 1605             
          Glu Gln  Phe Ala Val Cys Ser  Ser Phe Gln Leu Pro  Lys Tyr Arg 
              1610                 1615                 1620             
          Ile Thr  Gly Val Gln Lys Ile  Gln Cys Ser Lys Pro  Val Ile Phe 
              1625                 1630                 1635             
          Ser Gly  Thr Val Pro Pro Ala  Ile His Pro Arg Lys  Phe Ala Ser 
              1640                 1645                 1650             
          Val Thr  Val Glu Asp Thr Pro  Val Val Gln Pro Glu  Arg Leu Val 
              1655                 1660                 1665             
          Pro Arg  Arg Pro Ala Pro Pro  Val Pro Val Pro Ala  Arg Ile Pro 
              1670                 1675                 1680             
          Ser Pro  Pro Cys Thr Ser Thr  Asn Gly Ser Thr Thr  Ser Ile Gln 
              1685                 1690                 1695             
          Ser Leu  Gly Glu Asp Gln Ser  Ala Ser Ala Ser Ser  Gly Ala Glu 
              1700                 1705                 1710             
          Ile Ser  Val Asp Gln Val Ser  Leu Trp Ser Ile Pro  Ser Ala Thr 
              1715                 1720                 1725             
          Gly Phe  Asp Val Arg Thr Ser  Ser Ser Leu Ser Leu  Glu Gln Pro 
              1730                 1735                 1740             
          Thr Phe  Pro Thr Met Val Val  Glu Ala Glu Ile His  Ala Ser Gln 
              1745                 1750                 1755             
          Gly Ser  Leu Trp Ser Ile Pro  Ser Ile Thr Gly Ser  Glu Thr Arg 
              1760                 1765                 1770             
          Ala Pro  Ser Pro Pro Ser Gln  Asp Ser Arg Pro Ser  Thr Pro Ser 
              1775                 1780                 1785             
          Ala Ser  Gly Ser His Thr Ser  Val Asp Leu Ile Thr  Phe Asp Ser 
              1790                 1795                 1800             
          Val Ala  Glu Ile Leu Glu Asp  Phe Ser Arg Ser Pro  Phe Gln Phe 
              1805                 1810                 1815             
          Leu Ser  Glu Ile Lys Pro Ile  Pro Ala Pro Arg Thr  Arg Val Asn 
              1820                 1825                 1830             
          Asn Met  Ser Arg Ser Ala Asp  Thr Ile Lys Pro Ile  Pro Lys Pro 
              1835                 1840                 1845             
          Arg Lys  Cys Gln Val Lys Tyr  Thr Gln Pro Pro Gly  Val Ala Arg 
              1850                 1855                 1860             
          Val Ile  Ser Ala Ala Glu Phe  Asp Glu Phe Val Arg  Arg His Ser 
              1865                 1870                 1875             
          Asn Arg  Tyr Glu Ala Gly Ala  Tyr Ile Phe Ser Ser  Glu Thr Gly 
              1880                 1885                 1890             
          Gln Gly  His Leu Gln Gln Lys  Ser Thr Arg Gln Cys  Lys Leu Gln 
              1895                 1900                 1905             
          Tyr Pro  Ile Leu Glu Arg Ser  Val His Glu Lys Phe  Tyr Ala Pro 
              1910                 1915                 1920             
          Arg Leu  Asp Leu Glu Arg Glu  Lys Leu Leu Gln Lys  Lys Leu Gln 
              1925                 1930                 1935             
          Leu Cys  Ala Ser Glu Gly Asn  Arg Ser Arg Tyr Gln  Ser Arg Lys 
              1940                 1945                 1950             
          Val Glu  Asn Met Lys Ala Ile  Thr Val Glu Arg Leu  Leu Gln Gly 
              1955                 1960                 1965             
          Ile Gly  Ser Tyr Leu Ser Ala  Glu Pro Gln Pro Val  Glu Cys Tyr 
              1970                 1975                 1980             
          Lys Val  Thr Tyr Pro Ala Pro  Met Tyr Ser Ser Thr  Ala Ser Asn 
              1985                 1990                 1995             
          Ser Phe  Ser Ser Ala Glu Val  Ala Val Lys Val Cys  Asn Leu Val 
              2000                 2005                 2010             
          Leu Gln  Glu Asn Phe Pro Thr  Val Ala Ser Tyr Asn  Ile Thr Asp 
              2015                 2020                 2025             
          Glu Tyr  Asp Ala Tyr Leu Asp  Met Val Asp Gly Ala  Ser Cys Cys 
              2030                 2035                 2040             
          Leu Asp  Thr Ala Thr Phe Cys  Pro Ala Lys Leu Arg  Ser Phe Pro 
              2045                 2050                 2055             
          Lys Lys  His Ser Tyr Leu Arg  Pro Glu Ile Arg Ser  Ala Val Pro 
              2060                 2065                 2070             
          Ser Pro  Ile Gln Asn Thr Leu  Gln Asn Val Leu Ala  Ala Ala Thr 
              2075                 2080                 2085             
          Lys Arg  Asn Cys Asn Val Thr  Gln Met Arg Glu Leu  Pro Val Leu 
              2090                 2095                 2100             
          Asp Ser  Ala Ala Phe Asn Val  Glu Cys Phe Lys Lys  Tyr Ala Cys 
              2105                 2110                 2115             
          Asn Asp  Glu Tyr Trp Asp Phe  Tyr Lys Thr Asn Pro  Ile Arg Leu 
              2120                 2125                 2130             
          Thr Ala  Glu Asn Val Thr Gln  Tyr Val Thr Lys Leu  Lys Gly Pro 
              2135                 2140                 2145             
          Lys Ala  Ala Ala Leu Phe Ala  Lys Thr His Asn Leu  Gln Pro Leu 
              2150                 2155                 2160             
          His Glu  Ile Pro Met Asp Arg  Phe Val Met Asp Leu  Lys Arg Asp 
              2165                 2170                 2175             
          Val Lys  Val Thr Pro Gly Thr  Lys His Thr Glu Glu  Arg Pro Lys 
              2180                 2185                 2190             
          Val Gln  Val Ile Gln Ala Ala  Asp Pro Leu Ala Thr  Ala Tyr Leu 
              2195                 2200                 2205             
          Cys Gly  Ile His Arg Glu Leu  Val Arg Arg Leu Asn  Ala Val Leu 
              2210                 2215                 2220             
          Leu Pro  Asn Ile His Thr Leu  Phe Asp Met Ser Ala  Glu Asp Phe 
              2225                 2230                 2235             
          Asp Ala  Ile Ile Ala Glu His  Phe Gln Phe Gly Asp  Ala Val Leu 
              2240                 2245                 2250             
          Glu Thr  Asp Ile Ala Ser Phe  Asp Lys Ser Glu Asp  Asp Ala Ile 
              2255                 2260                 2265             
          Ala Met  Ser Ala Leu Met Ile  Leu Glu Asp Leu Gly  Val Asp Gln 
              2270                 2275                 2280             
          Ala Leu  Leu Asn Leu Ile Glu  Ala Ala Phe Gly Asn  Ile Thr Ser 
              2285                 2290                 2295             
          Val His  Leu Pro Thr Gly Thr  Arg Phe Lys Phe Gly  Ala Met Met 
              2300                 2305                 2310             
          Lys Ser  Gly Met Phe Leu Thr  Leu Phe Ile Asn Thr  Val Val Asn 
              2315                 2320                 2325             
          Ile Met  Ile Ala Ser Arg Val  Leu Arg Glu Arg Leu  Thr Thr Ser 
              2330                 2335                 2340             
          Pro Cys  Ala Ala Phe Ile Gly  Asp Asp Asn Ile Val  Lys Gly Val 
              2345                 2350                 2355             
          Thr Ser  Asp Ala Leu Met Ala  Glu Arg Cys Ala Thr  Trp Leu Asn 
              2360                 2365                 2370             
          Met Glu  Val Lys Ile Ile Asp  Ala Val Val Gly Val  Lys Ala Pro 
              2375                 2380                 2385             
          Tyr Phe  Cys Gly Gly Phe Ile  Val Val Asp Gln Ile  Thr Gly Thr 
              2390                 2395                 2400             
          Ala Cys  Arg Val Ala Asp Pro  Leu Lys Arg Leu Phe  Lys Leu Gly 
              2405                 2410                 2415             
          Lys Pro  Leu Pro Leu Asp Asp  Asp Gln Asp Val Asp  Arg Arg Arg 
              2420                 2425                 2430             
          Ala Leu  His Asp Glu Ala Ala  Arg Trp Asn Arg Ile  Gly Ile Thr 
              2435                 2440                 2445             
          Glu Glu  Leu Val Lys Ala Val  Glu Ser Arg Tyr Glu  Val Asn Tyr 
              2450                 2455                 2460             
          Val Ser  Leu Ile Ile Thr Ala  Leu Thr Thr Leu Ala  Ser Ser Val 
              2465                 2470                 2475             
          Ser Asn  Phe Lys His Ile Arg  Gly His Pro Ile Thr  Leu Tyr Gly 
              2480                 2485                 2490             
          <![CDATA[<210>  53]]>
          <![CDATA[<211>  2431]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  非結構性聚合蛋白(P1234)，PRT，勝利基森林病毒(SFV)]]>
          <![CDATA[<400>  53]]>
          Met Ala Ala Lys Val His Val Asp Ile Glu Ala Asp Ser Pro Phe Ile 
          1               5                   10                  15      
          Lys Ser Leu Gln Lys Ala Phe Pro Ser Phe Glu Val Glu Ser Leu Gln 
                      20                  25                  30          
          Val Thr Pro Asn Asp His Ala Asn Ala Arg Ala Phe Ser His Leu Ala 
                  35                  40                  45              
          Thr Lys Leu Ile Glu Gln Glu Thr Asp Lys Asp Thr Leu Ile Leu Asp 
              50                  55                  60                  
          Ile Gly Ser Ala Pro Ser Arg Arg Met Met Ser Thr His Lys Tyr His 
          65                  70                  75                  80  
          Cys Val Cys Pro Met Arg Ser Ala Glu Asp Pro Glu Arg Leu Asp Ser 
                          85                  90                  95      
          Tyr Ala Lys Lys Leu Ala Ala Ala Ser Gly Lys Val Leu Asp Arg Glu 
                      100                 105                 110         
          Ile Ala Gly Lys Ile Thr Asp Leu Gln Thr Val Met Ala Thr Pro Asp 
                  115                 120                 125             
          Ala Glu Ser Pro Thr Phe Cys Leu His Thr Asp Val Thr Cys Arg Thr 
              130                 135                 140                 
          Ala Ala Glu Val Ala Val Tyr Gln Asp Val Tyr Ala Val His Ala Pro 
          145                 150                 155                 160 
          Thr Ser Leu Tyr His Gln Ala Met Lys Gly Val Arg Thr Ala Tyr Trp 
                          165                 170                 175     
          Ile Gly Phe Asp Thr Thr Pro Phe Met Phe Asp Ala Leu Ala Gly Ala 
                      180                 185                 190         
          Tyr Pro Thr Tyr Ala Thr Asn Trp Ala Asp Glu Gln Val Leu Gln Ala 
                  195                 200                 205             
          Arg Asn Ile Gly Leu Cys Ala Ala Ser Leu Thr Glu Gly Arg Leu Gly 
              210                 215                 220                 
          Lys Leu Ser Ile Leu Arg Lys Lys Gln Leu Lys Pro Cys Asp Thr Val 
          225                 230                 235                 240 
          Met Phe Ser Val Gly Ser Thr Leu Tyr Thr Glu Ser Arg Lys Leu Leu 
                          245                 250                 255     
          Arg Ser Trp His Leu Pro Ser Val Phe His Leu Lys Gly Lys Gln Ser 
                      260                 265                 270         
          Phe Thr Cys Arg Cys Asp Thr Ile Val Ser Cys Glu Gly Tyr Val Val 
                  275                 280                 285             
          Lys Lys Ile Thr Met Cys Pro Gly Leu Tyr Gly Lys Thr Val Gly Tyr 
              290                 295                 300                 
          Ala Val Thr Tyr His Ala Glu Gly Phe Leu Val Cys Lys Thr Thr Asp 
          305                 310                 315                 320 
          Thr Val Lys Gly Glu Arg Val Ser Phe Pro Val Cys Thr Tyr Val Pro 
                          325                 330                 335     
          Ser Thr Ile Cys Asp Gln Met Thr Gly Ile Leu Ala Thr Asp Val Thr 
                      340                 345                 350         
          Pro Glu Asp Ala Gln Lys Leu Leu Val Gly Leu Asn Gln Arg Ile Val 
                  355                 360                 365             
          Val Asn Gly Arg Thr Gln Arg Asn Thr Asn Thr Met Lys Asn Tyr Leu 
              370                 375                 380                 
          Leu Pro Ile Val Ala Val Ala Phe Ser Lys Trp Ala Arg Glu Tyr Lys 
          385                 390                 395                 400 
          Ala Asp Leu Asp Asp Glu Lys Pro Leu Gly Val Arg Glu Arg Ser Leu 
                          405                 410                 415     
          Thr Cys Cys Cys Leu Trp Ala Phe Lys Thr Arg Lys Met His Thr Met 
                      420                 425                 430         
          Tyr Lys Lys Pro Asp Thr Gln Thr Ile Val Lys Val Pro Ser Glu Phe 
                  435                 440                 445             
          Asn Ser Phe Val Ile Pro Ser Leu Trp Ser Thr Gly Leu Ala Ile Pro 
              450                 455                 460                 
          Val Arg Ser Arg Ile Lys Met Leu Leu Ala Lys Lys Thr Lys Arg Glu 
          465                 470                 475                 480 
          Leu Ile Pro Val Leu Asp Ala Ser Ser Ala Arg Asp Ala Glu Gln Glu 
                          485                 490                 495     
          Glu Lys Glu Arg Leu Glu Ala Glu Leu Thr Arg Glu Ala Leu Pro Pro 
                      500                 505                 510         
          Leu Val Pro Ile Ala Pro Ala Glu Thr Gly Val Val Asp Val Asp Val 
                  515                 520                 525             
          Glu Glu Leu Glu Tyr His Ala Gly Ala Gly Val Val Glu Thr Pro Arg 
              530                 535                 540                 
          Ser Ala Leu Lys Val Thr Ala Gln Pro Asn Asp Val Leu Leu Gly Asn 
          545                 550                 555                 560 
          Tyr Val Val Leu Ser Pro Gln Thr Val Leu Lys Ser Ser Lys Leu Ala 
                          565                 570                 575     
          Pro Val His Pro Leu Ala Glu Gln Val Lys Ile Ile Thr His Asn Gly 
                      580                 585                 590         
          Arg Ala Gly Gly Tyr Gln Val Asp Gly Tyr Asp Gly Arg Val Leu Leu 
                  595                 600                 605             
          Pro Cys Gly Ser Ala Ile Pro Val Pro Glu Phe Gln Ala Leu Ser Glu 
              610                 615                 620                 
          Ser Ala Thr Met Val Tyr Asn Glu Arg Glu Phe Val Asn Arg Lys Leu 
          625                 630                 635                 640 
          Tyr His Ile Ala Val His Gly Pro Ser Leu Asn Thr Asp Glu Glu Asn 
                          645                 650                 655     
          Tyr Glu Lys Val Arg Ala Glu Arg Thr Asp Ala Glu Tyr Val Phe Asp 
                      660                 665                 670         
          Val Asp Lys Lys Cys Cys Val Lys Arg Glu Glu Ala Ser Gly Leu Val 
                  675                 680                 685             
          Leu Val Gly Glu Leu Thr Asn Pro Pro Phe His Glu Phe Ala Tyr Glu 
              690                 695                 700                 
          Gly Leu Lys Ile Arg Pro Ser Ala Pro Tyr Lys Thr Thr Val Val Gly 
          705                 710                 715                 720 
          Val Phe Gly Val Pro Gly Ser Gly Lys Ser Ala Ile Ile Lys Ser Leu 
                          725                 730                 735     
          Val Thr Lys His Asp Leu Val Thr Ser Gly Lys Lys Glu Asn Cys Gln 
                      740                 745                 750         
          Glu Ile Val Asn Asp Val Lys Lys His Arg Gly Lys Gly Thr Ser Arg 
                  755                 760                 765             
          Glu Asn Ser Asp Ser Ile Leu Leu Asn Gly Cys Arg Arg Ala Val Asp 
              770                 775                 780                 
          Ile Leu Tyr Val Asp Glu Ala Phe Ala Cys His Ser Gly Thr Leu Leu 
          785                 790                 795                 800 
          Ala Leu Ile Ala Leu Val Lys Pro Arg Ser Lys Val Val Leu Cys Gly 
                          805                 810                 815     
          Asp Pro Lys Gln Cys Gly Phe Phe Asn Met Met Gln Leu Lys Val Asn 
                      820                 825                 830         
          Phe Asn His Asn Ile Cys Thr Glu Val Cys His Lys Ser Ile Ser Arg 
                  835                 840                 845             
          Arg Cys Thr Arg Pro Val Thr Ala Ile Val Ser Thr Leu His Tyr Gly 
              850                 855                 860                 
          Gly Lys Met Arg Thr Thr Asn Pro Cys Asn Lys Pro Ile Ile Ile Asp 
          865                 870                 875                 880 
          Thr Thr Gly Gln Thr Lys Pro Lys Pro Gly Asp Ile Val Leu Thr Cys 
                          885                 890                 895     
          Phe Arg Gly Trp Ala Lys Gln Leu Gln Leu Asp Tyr Arg Gly His Glu 
                      900                 905                 910         
          Val Met Thr Ala Ala Ala Ser Gln Gly Leu Thr Arg Lys Gly Val Tyr 
                  915                 920                 925             
          Ala Val Arg Gln Lys Val Asn Glu Asn Pro Leu Tyr Ala Pro Ala Ser 
              930                 935                 940                 
          Glu His Val Asn Val Leu Leu Thr Arg Thr Glu Asp Arg Leu Val Trp 
          945                 950                 955                 960 
          Lys Thr Leu Ala Gly Asp Pro Trp Ile Lys Val Leu Ser Asn Ile Pro 
                          965                 970                 975     
          Gln Gly Asn Phe Thr Ala Thr Leu Glu Glu Trp Gln Glu Glu His Asp 
                      980                 985                 990         
          Lys Ile Met Lys Val Ile Glu Gly  Pro Ala Ala Pro Val  Asp Ala Phe 
                  995                 1000                 1005             
          Gln Asn  Lys Ala Asn Val Cys  Trp Ala Lys Ser Leu  Val Pro Val 
              1010                 1015                 1020             
          Leu Asp  Thr Ala Gly Ile Arg  Leu Thr Ala Glu Glu  Trp Ser Thr 
              1025                 1030                 1035             
          Ile Ile  Thr Ala Phe Lys Glu  Asp Arg Ala Tyr Ser  Pro Val Val 
              1040                 1045                 1050             
          Ala Leu  Asn Glu Ile Cys Thr  Lys Tyr Tyr Gly Val  Asp Leu Asp 
              1055                 1060                 1065             
          Ser Gly  Leu Phe Ser Ala Pro  Lys Val Ser Leu Tyr  Tyr Glu Asn 
              1070                 1075                 1080             
          Asn His  Trp Asp Asn Arg Pro  Gly Gly Arg Met Tyr  Gly Phe Asn 
              1085                 1090                 1095             
          Ala Ala  Thr Ala Ala Arg Leu  Glu Ala Arg His Thr  Phe Leu Lys 
              1100                 1105                 1110             
          Gly Gln  Trp His Thr Gly Lys  Gln Ala Val Ile Ala  Glu Arg Lys 
              1115                 1120                 1125             
          Ile Gln  Pro Leu Ser Val Leu  Asp Asn Val Ile Pro  Ile Asn Arg 
              1130                 1135                 1140             
          Arg Leu  Pro His Ala Leu Val  Ala Glu Tyr Lys Thr  Val Lys Gly 
              1145                 1150                 1155             
          Ser Arg  Val Glu Trp Leu Val  Asn Lys Val Arg Gly  Tyr His Val 
              1160                 1165                 1170             
          Leu Leu  Val Ser Glu Tyr Asn  Leu Ala Leu Pro Arg  Arg Arg Val 
              1175                 1180                 1185             
          Thr Trp  Leu Ser Pro Leu Asn  Val Thr Gly Ala Asp  Arg Cys Tyr 
              1190                 1195                 1200             
          Asp Leu  Ser Leu Gly Leu Pro  Ala Asp Ala Gly Arg  Phe Asp Leu 
              1205                 1210                 1215             
          Val Phe  Val Asn Ile His Thr  Glu Phe Arg Ile His  His Tyr Gln 
              1220                 1225                 1230             
          Gln Cys  Val Asp His Ala Met  Lys Leu Gln Met Leu  Gly Gly Asp 
              1235                 1240                 1245             
          Ala Leu  Arg Leu Leu Lys Pro  Gly Gly Ile Leu Met  Arg Ala Tyr 
              1250                 1255                 1260             
          Gly Tyr  Ala Asp Lys Ile Ser  Glu Ala Val Val Ser  Ser Leu Ser 
              1265                 1270                 1275             
          Arg Lys  Phe Ser Ser Ala Arg  Val Leu Arg Pro Asp  Cys Val Thr 
              1280                 1285                 1290             
          Ser Asn  Thr Glu Val Phe Leu  Leu Phe Ser Asn Phe  Asp Asn Gly 
              1295                 1300                 1305             
          Lys Arg  Pro Ser Thr Leu His  Gln Met Asn Thr Lys  Leu Ser Ala 
              1310                 1315                 1320             
          Val Tyr  Ala Gly Glu Ala Met  His Thr Ala Gly Cys  Ala Pro Ser 
              1325                 1330                 1335             
          Tyr Arg  Val Lys Arg Ala Asp  Ile Ala Thr Cys Thr  Glu Ala Ala 
              1340                 1345                 1350             
          Val Val  Asn Ala Ala Asn Ala  Arg Gly Thr Val Gly  Asp Gly Val 
              1355                 1360                 1365             
          Cys Arg  Ala Val Ala Lys Lys  Trp Pro Ser Ala Phe  Lys Gly Ala 
              1370                 1375                 1380             
          Ala Thr  Pro Val Gly Thr Ile  Lys Thr Val Met Cys  Gly Ser Tyr 
              1385                 1390                 1395             
          Pro Val  Ile His Ala Val Ala  Pro Asn Phe Ser Ala  Thr Thr Glu 
              1400                 1405                 1410             
          Ala Glu  Gly Asp Arg Glu Leu  Ala Ala Val Tyr Arg  Ala Val Ala 
              1415                 1420                 1425             
          Ala Glu  Val Asn Arg Leu Ser  Leu Ser Ser Val Ala  Ile Pro Leu 
              1430                 1435                 1440             
          Leu Ser  Thr Gly Val Phe Ser  Gly Gly Arg Asp Arg  Leu Gln Gln 
              1445                 1450                 1455             
          Ser Leu  Asn His Leu Phe Thr  Ala Met Asp Ala Thr  Asp Ala Asp 
              1460                 1465                 1470             
          Val Thr  Ile Tyr Cys Arg Asp  Lys Ser Trp Glu Lys  Lys Ile Gln 
              1475                 1480                 1485             
          Glu Ala  Ile Asp Met Arg Thr  Ala Val Glu Leu Leu  Asn Asp Asp 
              1490                 1495                 1500             
          Val Glu  Leu Thr Thr Asp Leu  Val Arg Val His Pro  Asp Ser Ser 
              1505                 1510                 1515             
          Leu Val  Gly Arg Lys Gly Tyr  Ser Thr Thr Asp Gly  Ser Leu Tyr 
              1520                 1525                 1530             
          Ser Tyr  Phe Glu Gly Thr Lys  Phe Asn Gln Ala Ala  Ile Asp Met 
              1535                 1540                 1545             
          Ala Glu  Ile Leu Thr Leu Trp  Pro Arg Leu Gln Glu  Ala Asn Glu 
              1550                 1555                 1560             
          Arg Ile  Cys Leu Tyr Ala Leu  Gly Glu Thr Met Asp  Asn Ile Gly 
              1565                 1570                 1575             
          Ser Lys  Cys Pro Val Asn Asp  Ser Asp Ser Ser Thr  Pro Pro Arg 
              1580                 1585                 1590             
          Thr Val  Pro Cys Leu Cys Arg  Tyr Ala Met Thr Ala  Glu Arg Ile 
              1595                 1600                 1605             
          Ala Arg  Leu Arg Ser His Gln  Val Lys Ser Met Val  Val Cys Ser 
              1610                 1615                 1620             
          Ser Phe  Pro Leu Pro Lys Tyr  His Val Asp Gly Val  Gln Lys Val 
              1625                 1630                 1635             
          Lys Cys  Glu Lys Val Leu Leu  Phe Asp Pro Thr Val  Pro Ser Val 
              1640                 1645                 1650             
          Val Ser  Pro Arg Lys Tyr Ala  Ala Ser Thr Thr Asp  His Ser Asp 
              1655                 1660                 1665             
          Arg Ser  Leu Arg Gly Phe Asp  Leu Asp Trp Thr Thr  Asp Ser Ser 
              1670                 1675                 1680             
          Ser Thr  Ala Ser Asp Thr Met  Ser Leu Pro Ser Leu  Gln Ser Cys 
              1685                 1690                 1695             
          Asp Ile  Asp Ser Ile Tyr Glu  Pro Met Ala Pro Ile  Val Val Thr 
              1700                 1705                 1710             
          Ala Asp  Val His Pro Glu Pro  Ala Gly Ile Ala Asp  Leu Ala Ala 
              1715                 1720                 1725             
          Asp Val  His Pro Glu Pro Ala  Asp His Val Asp Leu  Glu Asn Pro 
              1730                 1735                 1740             
          Ile Pro  Pro Pro Arg Pro Lys  Arg Ala Ala Tyr Leu  Ala Ser Arg 
              1745                 1750                 1755             
          Ala Ala  Glu Arg Pro Val Pro  Ala Pro Arg Lys Pro  Thr Pro Ala 
              1760                 1765                 1770             
          Pro Arg  Thr Ala Phe Arg Asn  Lys Leu Pro Leu Thr  Phe Gly Asp 
              1775                 1780                 1785             
          Phe Asp  Glu His Glu Val Asp  Ala Leu Ala Ser Gly  Ile Thr Phe 
              1790                 1795                 1800             
          Gly Asp  Phe Asp Asp Val Leu  Arg Leu Gly Arg Ala  Gly Ala Tyr 
              1805                 1810                 1815             
          Ile Phe  Ser Ser Asp Thr Gly  Ser Gly His Leu Gln  Gln Lys Ser 
              1820                 1825                 1830             
          Val Arg  Gln His Asn Leu Gln  Cys Ala Gln Leu Asp  Ala Val Gln 
              1835                 1840                 1845             
          Glu Glu  Lys Met Tyr Pro Pro  Lys Leu Asp Thr Glu  Arg Glu Lys 
              1850                 1855                 1860             
          Leu Leu  Leu Leu Lys Met Gln  Met His Pro Ser Glu  Ala Asn Lys 
              1865                 1870                 1875             
          Ser Arg  Tyr Gln Ser Arg Lys  Val Glu Asn Met Lys  Ala Thr Val 
              1880                 1885                 1890             
          Val Asp  Arg Leu Thr Ser Gly  Ala Arg Leu Tyr Thr  Gly Ala Asp 
              1895                 1900                 1905             
          Val Gly  Arg Ile Pro Thr Tyr  Ala Val Arg Tyr Pro  Arg Pro Val 
              1910                 1915                 1920             
          Tyr Ser  Pro Thr Val Ile Glu  Arg Phe Ser Ser Pro  Asp Val Ala 
              1925                 1930                 1935             
          Ile Ala  Ala Cys Asn Glu Tyr  Leu Ser Arg Asn Tyr  Pro Thr Val 
              1940                 1945                 1950             
          Ala Ser  Tyr Gln Ile Thr Asp  Glu Tyr Asp Ala Tyr  Leu Asp Met 
              1955                 1960                 1965             
          Val Asp  Gly Ser Asp Ser Cys  Leu Asp Arg Ala Thr  Phe Cys Pro 
              1970                 1975                 1980             
          Ala Lys  Leu Arg Cys Tyr Pro  Lys His His Ala Tyr  His Gln Pro 
              1985                 1990                 1995             
          Thr Val  Arg Ser Ala Val Pro  Ser Pro Phe Gln Asn  Thr Leu Gln 
              2000                 2005                 2010             
          Asn Val  Leu Ala Ala Ala Thr  Lys Arg Asn Cys Asn  Val Thr Gln 
              2015                 2020                 2025             
          Met Arg  Glu Leu Pro Thr Met  Asp Ser Ala Val Phe  Asn Val Glu 
              2030                 2035                 2040             
          Cys Phe  Lys Arg Tyr Ala Cys  Ser Gly Glu Tyr Trp  Glu Glu Tyr 
              2045                 2050                 2055             
          Ala Lys  Gln Pro Ile Arg Ile  Thr Thr Glu Asn Ile  Thr Thr Tyr 
              2060                 2065                 2070             
          Val Thr  Lys Leu Lys Gly Pro  Lys Ala Ala Ala Leu  Phe Ala Lys 
              2075                 2080                 2085             
          Thr His  Asn Leu Val Pro Leu  Gln Glu Val Pro Met  Asp Arg Phe 
              2090                 2095                 2100             
          Thr Val  Asp Met Lys Arg Asp  Val Lys Val Thr Pro  Gly Thr Lys 
              2105                 2110                 2115             
          His Thr  Glu Glu Arg Pro Lys  Val Gln Val Ile Gln  Ala Ala Glu 
              2120                 2125                 2130             
          Pro Leu  Ala Thr Ala Tyr Leu  Cys Gly Ile His Arg  Glu Leu Val 
              2135                 2140                 2145             
          Arg Arg  Leu Asn Ala Val Leu  Arg Pro Asn Val His  Thr Leu Phe 
              2150                 2155                 2160             
          Asp Met  Ser Ala Glu Asp Phe  Asp Ala Ile Ile Ala  Ser His Phe 
              2165                 2170                 2175             
          His Pro  Gly Asp Pro Val Leu  Glu Thr Asp Ile Ala  Ser Phe Asp 
              2180                 2185                 2190             
          Lys Ser  Gln Asp Asp Ser Leu  Ala Leu Thr Gly Leu  Met Ile Leu 
              2195                 2200                 2205             
          Glu Asp  Leu Gly Val Asp Gln  Tyr Leu Leu Asp Leu  Ile Glu Ala 
              2210                 2215                 2220             
          Ala Phe  Gly Glu Ile Ser Ser  Cys His Leu Pro Thr  Gly Thr Arg 
              2225                 2230                 2235             
          Phe Lys  Phe Gly Ala Met Met  Lys Ser Gly Met Phe  Leu Thr Leu 
              2240                 2245                 2250             
          Phe Ile  Asn Thr Val Leu Asn  Ile Thr Ile Ala Ser  Arg Val Leu 
              2255                 2260                 2265             
          Glu Gln  Arg Leu Thr Asp Ser  Ala Cys Ala Ala Phe  Ile Gly Asp 
              2270                 2275                 2280             
          Asp Asn  Ile Val His Gly Val  Ile Ser Asp Lys Leu  Met Ala Glu 
              2285                 2290                 2295             
          Arg Cys  Ala Ser Trp Val Asn  Met Glu Val Lys Ile  Ile Asp Ala 
              2300                 2305                 2310             
          Val Met  Gly Glu Lys Pro Pro  Tyr Phe Cys Gly Gly  Phe Ile Val 
              2315                 2320                 2325             
          Phe Asp  Ser Val Thr Gln Thr  Ala Cys Arg Val Ser  Asp Pro Leu 
              2330                 2335                 2340             
          Lys Arg  Leu Phe Lys Leu Gly  Lys Pro Leu Thr Ala  Glu Asp Lys 
              2345                 2350                 2355             
          Gln Asp  Glu Asp Arg Arg Arg  Ala Leu Ser Asp Glu  Val Ser Lys 
              2360                 2365                 2370             
          Trp Phe  Arg Thr Gly Leu Gly  Ala Glu Leu Glu Val  Ala Leu Thr 
              2375                 2380                 2385             
          Ser Arg  Tyr Glu Val Glu Gly  Cys Lys Ser Ile Leu  Ile Ala Met 
              2390                 2395                 2400             
          Thr Thr  Leu Ala Arg Asp Ile  Lys Ala Phe Lys Lys  Leu Arg Gly 
              2405                 2410                 2415             
          Pro Val  Ile His Leu Tyr Gly  Gly Pro Arg Leu Val  Arg 
              2420                 2425                 2430     
          <![CDATA[<210>  54]]>
          <![CDATA[<211>  2512]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  非結構性聚合蛋白(P1234)，PRT，辛得比斯病毒(SINV)]]>
          <![CDATA[<400>  54]]>
          Met Glu Lys Pro Val Val Asn Val Asp Val Asp Pro Gln Ser Pro Phe 
          1               5                   10                  15      
          Val Val Gln Leu Gln Lys Ser Phe Pro Gln Phe Glu Val Val Ala Gln 
                      20                  25                  30          
          Gln Val Thr Pro Asn Asp His Ala Asn Ala Arg Ala Phe Ser His Leu 
                  35                  40                  45              
          Ala Ser Lys Leu Ile Glu Leu Glu Val Pro Thr Thr Ala Thr Ile Leu 
              50                  55                  60                  
          Asp Ile Gly Ser Ala Pro Ala Arg Arg Met Phe Ser Glu His Gln Tyr 
          65                  70                  75                  80  
          His Cys Val Cys Pro Met Arg Ser Pro Glu Asp Pro Asp Arg Met Met 
                          85                  90                  95      
          Lys Tyr Ala Ser Lys Leu Ala Glu Lys Ala Cys Lys Ile Thr Asn Lys 
                      100                 105                 110         
          Asn Leu His Glu Lys Ile Lys Asp Leu Arg Thr Val Leu Asp Thr Pro 
                  115                 120                 125             
          Asp Ala Glu Thr Pro Ser Leu Cys Phe His Asn Asp Val Thr Cys Asn 
              130                 135                 140                 
          Met Arg Ala Glu Tyr Ser Val Met Gln Asp Val Tyr Ile Asn Ala Pro 
          145                 150                 155                 160 
          Gly Thr Ile Tyr His Gln Ala Met Lys Gly Val Arg Thr Leu Tyr Trp 
                          165                 170                 175     
          Ile Gly Phe Asp Thr Thr Gln Phe Met Phe Ser Ala Met Ala Gly Ser 
                      180                 185                 190         
          Tyr Pro Ala Tyr Asn Thr Asn Trp Ala Asp Glu Lys Val Leu Glu Ala 
                  195                 200                 205             
          Arg Asn Ile Gly Leu Cys Ser Thr Lys Leu Ser Glu Gly Arg Thr Gly 
              210                 215                 220                 
          Lys Leu Ser Ile Met Arg Lys Lys Glu Leu Lys Pro Gly Ser Arg Val 
          225                 230                 235                 240 
          Tyr Phe Ser Val Gly Ser Thr Leu Tyr Pro Glu His Arg Ala Ser Leu 
                          245                 250                 255     
          Gln Ser Trp His Leu Pro Ser Val Phe His Leu Asn Gly Lys Gln Ser 
                      260                 265                 270         
          Tyr Thr Cys Arg Cys Asp Thr Val Val Ser Cys Glu Gly Tyr Val Val 
                  275                 280                 285             
          Lys Lys Ile Thr Ile Ser Pro Gly Ile Thr Gly Glu Thr Val Gly Tyr 
              290                 295                 300                 
          Ala Val Thr His Asn Ser Glu Gly Phe Leu Leu Cys Lys Val Thr Asp 
          305                 310                 315                 320 
          Thr Val Lys Gly Glu Arg Val Ser Phe Pro Val Cys Thr Tyr Ile Pro 
                          325                 330                 335     
          Ala Thr Ile Cys Asp Gln Met Thr Gly Ile Met Ala Thr Asp Ile Ser 
                      340                 345                 350         
          Pro Asp Asp Ala Gln Lys Leu Leu Val Gly Leu Asn Gln Arg Ile Val 
                  355                 360                 365             
          Ile Asn Gly Arg Thr Asn Arg Asn Thr Asn Thr Met Gln Asn Tyr Leu 
              370                 375                 380                 
          Leu Pro Ile Ile Ala Gln Gly Phe Ser Lys Trp Ala Lys Glu Arg Lys 
          385                 390                 395                 400 
          Asp Asp Leu Asp Asn Glu Lys Met Leu Gly Thr Arg Glu Arg Lys Leu 
                          405                 410                 415     
          Thr Tyr Gly Cys Leu Trp Ala Phe Arg Thr Lys Lys Val His Ser Phe 
                      420                 425                 430         
          Tyr Arg Pro Pro Gly Thr Gln Thr Cys Val Lys Val Pro Ala Ser Phe 
                  435                 440                 445             
          Ser Ala Phe Pro Met Ser Ser Val Trp Thr Thr Ser Leu Pro Met Ser 
              450                 455                 460                 
          Leu Arg Gln Lys Leu Lys Leu Ala Leu Gln Pro Lys Lys Glu Glu Lys 
          465                 470                 475                 480 
          Leu Leu Gln Val Ser Glu Glu Leu Val Met Glu Ala Lys Ala Ala Phe 
                          485                 490                 495     
          Glu Asp Ala Gln Glu Glu Ala Arg Ala Glu Lys Leu Arg Glu Ala Leu 
                      500                 505                 510         
          Pro Pro Leu Val Ala Asp Lys Gly Ile Glu Ala Ala Ala Glu Val Val 
                  515                 520                 525             
          Cys Glu Val Glu Gly Leu Gln Ala Asp Ile Gly Ala Ala Leu Val Glu 
              530                 535                 540                 
          Thr Pro Arg Gly His Val Arg Ile Ile Pro Gln Ala Asn Asp Arg Met 
          545                 550                 555                 560 
          Ile Gly Gln Tyr Ile Val Val Ser Pro Asn Ser Val Leu Lys Asn Ala 
                          565                 570                 575     
          Lys Leu Ala Pro Ala His Pro Leu Ala Asp Gln Val Lys Ile Ile Thr 
                      580                 585                 590         
          His Ser Gly Arg Ser Gly Arg Tyr Ala Val Glu Pro Tyr Asp Ala Lys 
                  595                 600                 605             
          Val Leu Met Pro Ala Gly Gly Ala Val Pro Trp Pro Glu Phe Leu Ala 
              610                 615                 620                 
          Leu Ser Glu Ser Ala Thr Leu Val Tyr Asn Glu Arg Glu Phe Val Asn 
          625                 630                 635                 640 
          Arg Lys Leu Tyr His Ile Ala Met His Gly Pro Ala Lys Asn Thr Glu 
                          645                 650                 655     
          Glu Glu Gln Tyr Lys Val Thr Lys Ala Glu Leu Ala Glu Thr Glu Tyr 
                      660                 665                 670         
          Val Phe Asp Val Asp Lys Lys Arg Cys Val Lys Lys Glu Glu Ala Ser 
                  675                 680                 685             
          Gly Leu Val Leu Ser Gly Glu Leu Thr Asn Pro Pro Tyr His Glu Leu 
              690                 695                 700                 
          Ala Leu Glu Gly Leu Lys Thr Arg Pro Ala Val Pro Tyr Lys Val Glu 
          705                 710                 715                 720 
          Thr Ile Gly Val Ile Gly Thr Pro Gly Ser Gly Lys Ser Ala Ile Ile 
                          725                 730                 735     
          Lys Ser Thr Val Thr Ala Arg Asp Leu Val Thr Ser Gly Lys Lys Glu 
                      740                 745                 750         
          Asn Cys Arg Glu Ile Glu Ala Asp Val Leu Arg Leu Arg Gly Met Gln 
                  755                 760                 765             
          Ile Thr Ser Lys Thr Val Asp Ser Val Met Leu Asn Gly Cys His Lys 
              770                 775                 780                 
          Ala Val Glu Val Leu Tyr Val Asp Glu Ala Phe Ala Cys His Ala Gly 
          785                 790                 795                 800 
          Ala Leu Leu Ala Leu Ile Ala Ile Val Arg Pro Arg Lys Lys Val Val 
                          805                 810                 815     
          Leu Cys Gly Asp Pro Met Gln Cys Gly Phe Phe Asn Met Met Gln Leu 
                      820                 825                 830         
          Lys Val His Phe Asn His Pro Glu Lys Asp Ile Cys Thr Lys Thr Phe 
                  835                 840                 845             
          Tyr Lys Tyr Ile Ser Arg Arg Cys Thr Gln Pro Val Thr Ala Ile Val 
              850                 855                 860                 
          Ser Thr Leu His Tyr Asp Gly Lys Met Lys Thr Thr Asn Pro Cys Lys 
          865                 870                 875                 880 
          Lys Asn Ile Glu Ile Asp Ile Thr Gly Ala Thr Lys Pro Lys Pro Gly 
                          885                 890                 895     
          Asp Ile Ile Leu Thr Cys Phe Arg Gly Trp Val Lys Gln Leu Gln Ile 
                      900                 905                 910         
          Asp Tyr Pro Gly His Glu Val Met Thr Ala Ala Ala Ser Gln Gly Leu 
                  915                 920                 925             
          Thr Arg Lys Gly Val Tyr Ala Val Arg Gln Lys Val Asn Glu Asn Pro 
              930                 935                 940                 
          Leu Tyr Ala Ile Thr Ser Glu His Val Asn Val Leu Leu Thr Arg Thr 
          945                 950                 955                 960 
          Glu Asp Arg Leu Val Trp Lys Thr Leu Gln Gly Asp Pro Trp Ile Lys 
                          965                 970                 975     
          Gln Pro Thr Asn Ile Pro Lys Gly Asn Phe Gln Ala Thr Ile Glu Asp 
                      980                 985                 990         
          Trp Glu Ala Glu His Lys Gly Ile  Ile Ala Ala Ile Asn  Ser Pro Thr 
                  995                 1000                 1005             
          Pro Arg  Ala Asn Pro Phe Ser  Cys Lys Thr Asn Val  Cys Trp Ala 
              1010                 1015                 1020             
          Lys Ala  Leu Glu Pro Ile Leu  Ala Thr Ala Gly Ile  Val Leu Thr 
              1025                 1030                 1035             
          Gly Cys  Gln Trp Ser Glu Leu  Phe Pro Gln Phe Ala  Asp Asp Lys 
              1040                 1045                 1050             
          Pro His  Ser Ala Ile Tyr Ala  Leu Asp Val Ile Cys  Ile Lys Phe 
              1055                 1060                 1065             
          Phe Gly  Met Asp Leu Thr Ser  Gly Leu Phe Ser Lys  Gln Ser Ile 
              1070                 1075                 1080             
          Pro Leu  Thr Tyr His Pro Ala  Asp Ser Ala Arg Pro  Val Ala His 
              1085                 1090                 1095             
          Trp Asp  Asn Ser Pro Gly Thr  Arg Lys Tyr Gly Tyr  Asp His Ala 
              1100                 1105                 1110             
          Ile Ala  Ala Glu Leu Ser Arg  Arg Phe Pro Val Phe  Gln Leu Ala 
              1115                 1120                 1125             
          Gly Lys  Gly Thr Gln Leu Asp  Leu Gln Thr Gly Arg  Thr Arg Val 
              1130                 1135                 1140             
          Ile Ser  Ala Gln His Asn Leu  Val Pro Val Asn Arg  Asn Leu Pro 
              1145                 1150                 1155             
          His Ala  Leu Val Pro Glu Tyr  Lys Glu Lys Gln Pro  Gly Pro Val 
              1160                 1165                 1170             
          Lys Lys  Phe Leu Asn Gln Phe  Lys His His Ser Val  Leu Val Val 
              1175                 1180                 1185             
          Ser Glu  Glu Lys Ile Glu Ala  Pro Arg Lys Arg Ile  Glu Trp Ile 
              1190                 1195                 1200             
          Ala Pro  Ile Gly Ile Ala Gly  Ala Asp Lys Asn Tyr  Asn Leu Ala 
              1205                 1210                 1215             
          Phe Gly  Phe Pro Pro Gln Ala  Arg Tyr Asp Leu Val  Phe Ile Asn 
              1220                 1225                 1230             
          Ile Gly  Thr Lys Tyr Arg Asn  His His Phe Gln Gln  Cys Glu Asp 
              1235                 1240                 1245             
          His Ala  Ala Thr Leu Lys Thr  Leu Ser Arg Ser Ala  Leu Asn Cys 
              1250                 1255                 1260             
          Leu Asn  Pro Gly Gly Thr Leu  Val Val Lys Ser Tyr  Gly Tyr Ala 
              1265                 1270                 1275             
          Asp Arg  Asn Ser Glu Asp Val  Val Thr Ala Leu Ala  Arg Lys Phe 
              1280                 1285                 1290             
          Val Arg  Val Ser Ala Ala Arg  Pro Asp Cys Val Ser  Ser Asn Thr 
              1295                 1300                 1305             
          Glu Met  Tyr Leu Ile Phe Arg  Gln Leu Asp Asn Ser  Arg Thr Arg 
              1310                 1315                 1320             
          Gln Phe  Thr Pro His His Leu  Asn Cys Val Ile Ser  Ser Val Tyr 
              1325                 1330                 1335             
          Glu Gly  Thr Arg Asp Gly Val  Gly Ala Ala Pro Ser  Tyr Arg Thr 
              1340                 1345                 1350             
          Lys Arg  Glu Asn Ile Ala Asp  Cys Gln Glu Glu Ala  Val Val Asn 
              1355                 1360                 1365             
          Ala Ala  Asn Pro Leu Gly Arg  Pro Gly Glu Gly Val  Cys Arg Ala 
              1370                 1375                 1380             
          Ile Tyr  Lys Arg Trp Pro Thr  Ser Phe Thr Asp Ser  Ala Thr Glu 
              1385                 1390                 1395             
          Thr Gly  Thr Ala Arg Met Thr  Val Cys Leu Gly Lys  Lys Val Ile 
              1400                 1405                 1410             
          His Ala  Val Gly Pro Asp Phe  Arg Lys His Pro Glu  Ala Glu Ala 
              1415                 1420                 1425             
          Leu Lys  Leu Leu Gln Asn Ala  Tyr His Ala Val Ala  Asp Leu Val 
              1430                 1435                 1440             
          Asn Glu  His Asn Ile Lys Ser  Val Ala Ile Pro Leu  Leu Ser Thr 
              1445                 1450                 1455             
          Gly Ile  Tyr Ala Ala Gly Lys  Asp Arg Leu Glu Val  Ser Leu Asn 
              1460                 1465                 1470             
          Cys Leu  Thr Thr Ala Leu Asp  Arg Thr Asp Ala Asp  Val Thr Ile 
              1475                 1480                 1485             
          Tyr Cys  Leu Asp Lys Lys Trp  Lys Glu Arg Ile Asp  Ala Ala Leu 
              1490                 1495                 1500             
          Gln Leu  Lys Glu Ser Val Thr  Glu Leu Lys Asp Glu  Asp Met Glu 
              1505                 1510                 1515             
          Ile Asp  Asp Glu Leu Val Trp  Ile His Pro Asp Ser  Cys Leu Lys 
              1520                 1525                 1530             
          Gly Arg  Lys Gly Phe Ser Thr  Thr Lys Gly Lys Leu  Tyr Ser Tyr 
              1535                 1540                 1545             
          Phe Glu  Gly Thr Lys Phe His  Gln Ala Ala Lys Asp  Met Ala Glu 
              1550                 1555                 1560             
          Ile Lys  Val Leu Phe Pro Asn  Asp Gln Glu Ser Asn  Glu Gln Leu 
              1565                 1570                 1575             
          Cys Ala  Tyr Ile Leu Gly Glu  Thr Met Glu Ala Ile  Arg Glu Lys 
              1580                 1585                 1590             
          Cys Pro  Val Asp His Asn Pro  Ser Ser Ser Pro Pro  Lys Thr Leu 
              1595                 1600                 1605             
          Pro Cys  Leu Cys Met Tyr Ala  Met Thr Pro Glu Arg  Val His Arg 
              1610                 1615                 1620             
          Leu Arg  Ser Asn Asn Val Lys  Glu Val Thr Val Cys  Ser Ser Thr 
              1625                 1630                 1635             
          Pro Leu  Pro Lys His Lys Ile  Lys Asn Val Gln Lys  Val Gln Cys 
              1640                 1645                 1650             
          Thr Lys  Val Val Leu Phe Asn  Pro His Thr Pro Ala  Phe Val Pro 
              1655                 1660                 1665             
          Ala Arg  Lys Tyr Ile Glu Val  Pro Glu Gln Pro Thr  Ala Pro Pro 
              1670                 1675                 1680             
          Ala Gln  Ala Glu Glu Ala Pro  Glu Val Val Ala Thr  Pro Ser Pro 
              1685                 1690                 1695             
          Ser Thr  Ala Asp Asn Thr Ser  Leu Asp Val Thr Asp  Ile Ser Leu 
              1700                 1705                 1710             
          Asp Met  Asp Asp Ser Ser Glu  Gly Ser Leu Phe Ser  Ser Phe Ser 
              1715                 1720                 1725             
          Gly Ser  Asp Asn Ser Ile Thr  Ser Met Asp Ser Trp  Ser Ser Gly 
              1730                 1735                 1740             
          Pro Ser  Ser Leu Glu Ile Val  Asp Arg Arg Gln Val  Val Val Ala 
              1745                 1750                 1755             
          Asp Val  His Ala Val Gln Glu  Pro Ala Pro Ile Pro  Pro Pro Arg 
              1760                 1765                 1770             
          Leu Lys  Lys Met Ala Arg Leu  Ala Ala Ala Arg Lys  Glu Pro Thr 
              1775                 1780                 1785             
          Pro Pro  Ala Ser Asn Ser Ser  Glu Ser Leu His Leu  Ser Phe Gly 
              1790                 1795                 1800             
          Gly Val  Ser Met Ser Leu Gly  Ser Ile Phe Asp Gly  Glu Thr Ala 
              1805                 1810                 1815             
          Arg Gln  Ala Ala Val Gln Pro  Leu Ala Thr Gly Pro  Thr Asp Val 
              1820                 1825                 1830             
          Pro Met  Ser Phe Gly Ser Phe  Ser Asp Gly Glu Ile  Asp Glu Leu 
              1835                 1840                 1845             
          Ser Arg  Arg Val Thr Glu Ser  Glu Pro Val Leu Phe  Gly Ser Phe 
              1850                 1855                 1860             
          Glu Pro  Gly Glu Val Asn Ser  Ile Ile Ser Ser Arg  Ser Ala Val 
              1865                 1870                 1875             
          Ser Phe  Pro Leu Arg Lys Gln  Arg Arg Arg Arg Arg  Ser Arg Arg 
              1880                 1885                 1890             
          Thr Glu  Tyr Leu Thr Gly Val  Gly Gly Tyr Ile Phe  Ser Thr Asp 
              1895                 1900                 1905             
          Thr Gly  Pro Gly His Leu Gln  Lys Lys Ser Val Leu  Gln Asn Gln 
              1910                 1915                 1920             
          Leu Thr  Glu Pro Thr Leu Glu  Arg Asn Val Leu Glu  Arg Ile His 
              1925                 1930                 1935             
          Ala Pro  Val Leu Asp Thr Ser  Lys Glu Glu Gln Leu  Lys Leu Arg 
              1940                 1945                 1950             
          Tyr Gln  Met Met Pro Thr Glu  Ala Asn Lys Ser Arg  Tyr Gln Ser 
              1955                 1960                 1965             
          Arg Lys  Val Glu Asn Gln Lys  Ala Ile Thr Thr Glu  Arg Leu Leu 
              1970                 1975                 1980             
          Ser Gly  Leu Arg Leu Tyr Asn  Ser Ala Thr Asp Gln  Pro Glu Cys 
              1985                 1990                 1995             
          Tyr Lys  Ile Thr Tyr Pro Lys  Pro Leu Tyr Ser Ser  Ser Val Pro 
              2000                 2005                 2010             
          Ala Asn  Tyr Ser Asp Pro Gln  Phe Ala Val Ala Val  Cys Asn Asn 
              2015                 2020                 2025             
          Tyr Leu  His Glu Asn Tyr Pro  Thr Val Ala Ser Tyr  Gln Ile Thr 
              2030                 2035                 2040             
          Asp Glu  Tyr Asp Ala Tyr Leu  Asp Met Val Asp Gly  Thr Val Ala 
              2045                 2050                 2055             
          Cys Leu  Asp Thr Ala Thr Phe  Cys Pro Ala Lys Leu  Arg Ser Tyr 
              2060                 2065                 2070             
          Pro Lys  Lys His Glu Tyr Arg  Ala Pro Asn Ile Arg  Ser Ala Val 
              2075                 2080                 2085             
          Pro Ser  Ala Met Gln Asn Thr  Leu Gln Asn Val Leu  Ile Ala Ala 
              2090                 2095                 2100             
          Thr Lys  Arg Asn Cys Asn Val  Thr Gln Met Arg Glu  Leu Pro Thr 
              2105                 2110                 2115             
          Leu Asp  Ser Ala Thr Phe Asn  Val Glu Cys Phe Arg  Lys Tyr Ala 
              2120                 2125                 2130             
          Cys Asn  Asp Glu Tyr Trp Glu  Glu Phe Ala Arg Lys  Pro Ile Arg 
              2135                 2140                 2145             
          Ile Thr  Thr Glu Phe Val Thr  Ala Tyr Val Ala Arg  Leu Lys Gly 
              2150                 2155                 2160             
          Pro Lys  Ala Ala Ala Leu Phe  Ala Lys Thr Tyr Asn  Leu Val Pro 
              2165                 2170                 2175             
          Leu Gln  Glu Val Pro Met Asp  Arg Phe Val Met Asp  Met Lys Arg 
              2180                 2185                 2190             
          Asp Val  Lys Val Thr Pro Gly  Thr Lys His Thr Glu  Glu Arg Pro 
              2195                 2200                 2205             
          Lys Val  Gln Val Ile Gln Ala  Ala Glu Pro Leu Ala  Thr Ala Tyr 
              2210                 2215                 2220             
          Leu Cys  Gly Ile His Arg Glu  Leu Val Arg Arg Leu  Thr Ala Val 
              2225                 2230                 2235             
          Leu Leu  Pro Asn Ile His Thr  Leu Phe Asp Met Ser  Ala Glu Asp 
              2240                 2245                 2250             
          Phe Asp  Ala Ile Ile Ala Glu  His Phe Lys Gln Gly  Asp Pro Val 
              2255                 2260                 2265             
          Leu Glu  Thr Asp Ile Ala Ser  Phe Asp Lys Ser Gln  Asp Asp Ala 
              2270                 2275                 2280             
          Met Ala  Leu Thr Gly Leu Met  Ile Leu Glu Asp Leu  Gly Val Asp 
              2285                 2290                 2295             
          Gln Pro  Leu Leu Asp Leu Ile  Glu Cys Ala Phe Gly  Glu Ile Ser 
              2300                 2305                 2310             
          Ser Thr  His Leu Pro Thr Gly  Thr Arg Phe Lys Phe  Gly Ala Met 
              2315                 2320                 2325             
          Met Lys  Ser Gly Met Phe Leu  Thr Leu Phe Val Asn  Thr Val Leu 
              2330                 2335                 2340             
          Asn Val  Val Ile Ala Ser Arg  Val Leu Glu Glu Arg  Leu Lys Thr 
              2345                 2350                 2355             
          Ser Arg  Cys Ala Ala Phe Ile  Gly Asp Asp Asn Ile  Ile His Gly 
              2360                 2365                 2370             
          Val Val  Ser Asp Lys Glu Met  Ala Glu Arg Cys Ala  Thr Trp Leu 
              2375                 2380                 2385             
          Asn Met  Glu Val Lys Ile Ile  Asp Ala Val Ile Gly  Glu Arg Pro 
              2390                 2395                 2400             
          Pro Tyr  Phe Cys Gly Gly Phe  Ile Leu Gln Asp Ser  Val Thr Ser 
              2405                 2410                 2415             
          Thr Ala  Cys Arg Val Ala Asp  Pro Leu Lys Arg Leu  Phe Lys Leu 
              2420                 2425                 2430             
          Gly Lys  Pro Leu Pro Ala Asp  Asp Glu Gln Asp Glu  Asp Arg Arg 
              2435                 2440                 2445             
          Arg Ala  Leu Leu Asp Glu Thr  Lys Ala Trp Phe Arg  Val Gly Ile 
              2450                 2455                 2460             
          Thr Gly  Thr Leu Ala Val Ala  Val Thr Thr Arg Tyr  Glu Val Asp 
              2465                 2470                 2475             
          Asn Ile  Thr Pro Val Leu Leu  Ala Leu Arg Thr Phe  Ala Gln Ser 
              2480                 2485                 2490             
          Lys Arg  Ala Phe Gln Ala Ile  Arg Gly Glu Ile Lys  His Leu Tyr 
              2495                 2500                 2505             
          Gly Gly  Pro Lys 
              2510         
          <![CDATA[<210>  55]]>
          <![CDATA[<211>  2474]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  非結構性聚合蛋白(P1234)，PRT，屈公病毒(CHIKV)]]>
          <![CDATA[<400>  55]]>
          Met Asp Pro Val Tyr Val Asp Ile Asp Ala Asp Ser Ala Phe Leu Lys 
          1               5                   10                  15      
          Ala Leu Gln Arg Ala Tyr Pro Met Phe Glu Val Glu Pro Arg Gln Val 
                      20                  25                  30          
          Thr Pro Asn Asp His Ala Asn Ala Arg Ala Phe Ser His Leu Ala Ile 
                  35                  40                  45              
          Lys Leu Ile Glu Gln Glu Ile Asp Pro Asp Ser Thr Ile Leu Asp Ile 
              50                  55                  60                  
          Gly Ser Ala Pro Ala Arg Arg Met Met Ser Asp Arg Lys Tyr His Cys 
          65                  70                  75                  80  
          Val Cys Pro Met Arg Ser Ala Glu Asp Pro Glu Arg Leu Ala Asn Tyr 
                          85                  90                  95      
          Ala Arg Lys Leu Ala Ser Ala Ala Gly Lys Val Leu Asp Arg Asn Ile 
                      100                 105                 110         
          Ser Gly Lys Ile Gly Asp Leu Gln Ala Val Met Ala Val Pro Asp Thr 
                  115                 120                 125             
          Glu Thr Pro Thr Phe Cys Leu His Thr Asp Val Ser Cys Arg Gln Arg 
              130                 135                 140                 
          Ala Asp Val Ala Ile Tyr Gln Asp Val Tyr Ala Val His Ala Pro Thr 
          145                 150                 155                 160 
          Ser Leu Tyr His Gln Ala Ile Lys Gly Val Arg Leu Ala Tyr Trp Val 
                          165                 170                 175     
          Gly Phe Asp Thr Thr Pro Phe Met Tyr Asn Ala Met Ala Gly Ala Tyr 
                      180                 185                 190         
          Pro Ser Tyr Ser Thr Asn Trp Ala Asp Glu Gln Val Leu Lys Ala Lys 
                  195                 200                 205             
          Asn Ile Gly Leu Cys Ser Thr Asp Leu Thr Glu Gly Arg Arg Gly Lys 
              210                 215                 220                 
          Leu Ser Ile Met Arg Gly Lys Lys Leu Glu Pro Cys Asp Arg Val Leu 
          225                 230                 235                 240 
          Phe Ser Val Gly Ser Thr Leu Tyr Pro Glu Ser Arg Lys Leu Leu Lys 
                          245                 250                 255     
          Ser Trp His Leu Pro Ser Val Phe His Leu Lys Gly Lys Leu Ser Phe 
                      260                 265                 270         
          Thr Cys Arg Cys Asp Thr Val Val Ser Cys Glu Gly Tyr Val Val Lys 
                  275                 280                 285             
          Arg Ile Thr Met Ser Pro Gly Leu Tyr Gly Lys Thr Thr Gly Tyr Ala 
              290                 295                 300                 
          Val Thr His His Ala Asp Gly Phe Leu Met Cys Lys Thr Thr Asp Thr 
          305                 310                 315                 320 
          Val Asp Gly Glu Arg Val Ser Phe Ser Val Cys Thr Tyr Val Pro Ala 
                          325                 330                 335     
          Thr Ile Cys Asp Gln Met Thr Gly Ile Leu Ala Thr Glu Val Thr Pro 
                      340                 345                 350         
          Glu Asp Ala Gln Lys Leu Leu Val Gly Leu Asn Gln Arg Ile Val Val 
                  355                 360                 365             
          Asn Gly Arg Thr Gln Arg Asn Thr Asn Thr Met Lys Asn Tyr Met Ile 
              370                 375                 380                 
          Pro Val Val Ala Gln Ala Phe Ser Lys Trp Ala Lys Glu Cys Arg Lys 
          385                 390                 395                 400 
          Asp Met Glu Asp Glu Lys Leu Leu Gly Val Arg Glu Arg Thr Leu Thr 
                          405                 410                 415     
          Cys Cys Cys Leu Trp Ala Phe Lys Lys Gln Lys Thr His Thr Val Tyr 
                      420                 425                 430         
          Lys Arg Pro Asp Thr Gln Ser Ile Gln Lys Val Gln Ala Glu Phe Asp 
                  435                 440                 445             
          Ser Phe Val Val Pro Ser Leu Trp Ser Ser Gly Leu Ser Ile Pro Leu 
              450                 455                 460                 
          Arg Thr Arg Ile Lys Trp Leu Leu Ser Lys Val Pro Lys Thr Asp Leu 
          465                 470                 475                 480 
          Thr Pro Tyr Ser Gly Asp Ala Gln Glu Ala Arg Asp Ala Glu Lys Glu 
                          485                 490                 495     
          Ala Glu Glu Glu Arg Glu Ala Glu Leu Thr Leu Glu Ala Leu Pro Pro 
                      500                 505                 510         
          Leu Gln Ala Ala Gln Glu Asp Val Gln Val Glu Ile Asp Val Glu Gln 
                  515                 520                 525             
          Leu Glu Asp Arg Ala Gly Ala Gly Ile Ile Glu Thr Pro Arg Gly Ala 
              530                 535                 540                 
          Ile Lys Val Thr Ala Gln Pro Thr Asp His Val Val Gly Glu Tyr Leu 
          545                 550                 555                 560 
          Val Leu Ser Pro Gln Thr Val Leu Arg Ser Gln Lys Leu Ser Leu Ile 
                          565                 570                 575     
          His Ala Leu Ala Glu Gln Val Lys Thr Cys Thr His Ser Gly Arg Ala 
                      580                 585                 590         
          Gly Arg Tyr Ala Val Glu Ala Tyr Asp Gly Arg Val Leu Val Pro Ser 
                  595                 600                 605             
          Gly Tyr Ala Ile Ser Pro Glu Asp Phe Gln Ser Leu Ser Glu Ser Ala 
              610                 615                 620                 
          Thr Met Val Tyr Asn Glu Arg Glu Phe Val Asn Arg Lys Leu His His 
          625                 630                 635                 640 
          Ile Ala Met His Gly Pro Ala Leu Asn Thr Asp Glu Glu Ser Tyr Glu 
                          645                 650                 655     
          Leu Val Arg Ala Glu Arg Thr Glu His Glu Tyr Val Tyr Asp Val Asp 
                      660                 665                 670         
          Gln Arg Arg Cys Cys Lys Lys Glu Glu Ala Ala Gly Leu Val Leu Val 
                  675                 680                 685             
          Gly Asp Leu Thr Asn Pro Pro Tyr His Glu Phe Ala Tyr Glu Gly Leu 
              690                 695                 700                 
          Lys Ile Arg Pro Ala Cys Pro Tyr Lys Ile Ala Val Ile Gly Val Phe 
          705                 710                 715                 720 
          Gly Val Pro Gly Ser Gly Lys Ser Ala Ile Ile Lys Asn Leu Val Thr 
                          725                 730                 735     
          Arg Gln Asp Leu Val Thr Ser Gly Lys Lys Glu Asn Cys Gln Glu Ile 
                      740                 745                 750         
          Thr Thr Asp Val Met Arg Gln Arg Gly Leu Glu Ile Ser Ala Arg Thr 
                  755                 760                 765             
          Val Asp Ser Leu Leu Leu Asn Gly Cys Asn Arg Pro Val Asp Val Leu 
              770                 775                 780                 
          Tyr Val Asp Glu Ala Phe Ala Cys His Ser Gly Thr Leu Leu Ala Leu 
          785                 790                 795                 800 
          Ile Ala Leu Val Arg Pro Arg Gln Lys Val Val Leu Cys Gly Asp Pro 
                          805                 810                 815     
          Lys Gln Cys Gly Phe Phe Asn Met Met Gln Met Lys Val Asn Tyr Asn 
                      820                 825                 830         
          His Asn Ile Cys Thr Gln Val Tyr His Lys Ser Ile Ser Arg Arg Cys 
                  835                 840                 845             
          Thr Leu Pro Val Thr Ala Ile Val Ser Ser Leu His Tyr Glu Gly Lys 
              850                 855                 860                 
          Met Arg Thr Thr Asn Glu Tyr Asn Lys Pro Ile Val Val Asp Thr Thr 
          865                 870                 875                 880 
          Gly Ser Thr Lys Pro Asp Pro Gly Asp Leu Val Leu Thr Cys Phe Arg 
                          885                 890                 895     
          Gly Trp Val Lys Gln Leu Gln Ile Asp Tyr Arg Gly His Glu Val Met 
                      900                 905                 910         
          Thr Ala Ala Ala Ser Gln Gly Leu Thr Arg Lys Gly Val Tyr Ala Val 
                  915                 920                 925             
          Arg Gln Lys Val Asn Glu Asn Pro Leu Tyr Ala Ser Thr Ser Glu His 
              930                 935                 940                 
          Val Asn Val Leu Leu Thr Arg Thr Glu Gly Lys Leu Val Trp Lys Thr 
          945                 950                 955                 960 
          Leu Ser Gly Asp Pro Trp Ile Lys Thr Leu Gln Asn Pro Pro Lys Gly 
                          965                 970                 975     
          Asn Phe Lys Ala Thr Ile Lys Glu Trp Glu Val Glu His Ala Ser Ile 
                      980                 985                 990         
          Met Ala Gly Ile Cys Ser His Gln  Met Thr Phe Asp Thr  Phe Gln Asn 
                  995                 1000                 1005             
          Lys Ala  Asn Val Cys Trp Ala  Lys Ser Leu Val Pro  Ile Leu Glu 
              1010                 1015                 1020             
          Thr Ala  Gly Ile Lys Leu Asn  Asp Arg Gln Trp Ser  Gln Ile Ile 
              1025                 1030                 1035             
          Gln Ala  Phe Lys Glu Asp Lys  Ala Tyr Ser Pro Glu  Val Ala Leu 
              1040                 1045                 1050             
          Asn Glu  Ile Cys Thr Arg Met  Tyr Gly Val Asp Leu  Asp Ser Gly 
              1055                 1060                 1065             
          Leu Phe  Ser Lys Pro Leu Val  Ser Val Tyr Tyr Ala  Asp Asn His 
              1070                 1075                 1080             
          Trp Asp  Asn Arg Pro Gly Gly  Lys Met Phe Gly Phe  Asn Pro Glu 
              1085                 1090                 1095             
          Ala Ala  Ser Ile Leu Glu Arg  Lys Tyr Pro Phe Thr  Lys Gly Lys 
              1100                 1105                 1110             
          Trp Asn  Ile Asn Lys Gln Ile  Cys Val Thr Thr Arg  Arg Ile Glu 
              1115                 1120                 1125             
          Asp Phe  Asn Pro Thr Thr Asn  Ile Ile Pro Ala Asn  Arg Arg Leu 
              1130                 1135                 1140             
          Pro His  Ser Leu Val Ala Glu  His Arg Pro Val Lys  Gly Glu Arg 
              1145                 1150                 1155             
          Met Glu  Trp Leu Val Asn Lys  Ile Asn Gly His His  Val Leu Leu 
              1160                 1165                 1170             
          Val Ser  Gly Cys Ser Leu Ala  Leu Pro Thr Lys Arg  Val Thr Trp 
              1175                 1180                 1185             
          Val Ala  Pro Leu Gly Val Arg  Gly Ala Asp Tyr Thr  Tyr Asn Leu 
              1190                 1195                 1200             
          Glu Leu  Gly Leu Pro Ala Thr  Leu Gly Arg Tyr Asp  Leu Val Val 
              1205                 1210                 1215             
          Ile Asn  Ile His Thr Pro Phe  Arg Ile His His Tyr  Gln Gln Cys 
              1220                 1225                 1230             
          Val Asp  His Ala Met Lys Leu  Gln Met Leu Gly Gly  Asp Ser Leu 
              1235                 1240                 1245             
          Arg Leu  Leu Lys Pro Gly Gly  Ser Leu Leu Ile Arg  Ala Tyr Gly 
              1250                 1255                 1260             
          Tyr Ala  Asp Arg Thr Ser Glu  Arg Val Ile Cys Val  Leu Gly Arg 
              1265                 1270                 1275             
          Lys Phe  Arg Ser Ser Arg Ala  Leu Lys Pro Pro Cys  Val Thr Ser 
              1280                 1285                 1290             
          Asn Thr  Glu Met Phe Phe Leu  Phe Ser Asn Phe Asp  Asn Gly Arg 
              1295                 1300                 1305             
          Arg Asn  Phe Thr Thr His Val  Met Asn Asn Gln Leu  Asn Ala Ala 
              1310                 1315                 1320             
          Phe Val  Gly Gln Ala Thr Arg  Ala Gly Cys Ala Pro  Ser Tyr Arg 
              1325                 1330                 1335             
          Val Lys  Arg Met Asp Ile Ala  Lys Asn Asp Glu Glu  Cys Val Val 
              1340                 1345                 1350             
          Asn Ala  Ala Asn Pro Arg Gly  Leu Pro Gly Asp Gly  Val Cys Lys 
              1355                 1360                 1365             
          Ala Val  Tyr Lys Lys Trp Pro  Glu Ser Phe Lys Asn  Ser Ala Thr 
              1370                 1375                 1380             
          Pro Val  Gly Thr Ala Lys Thr  Val Met Cys Gly Thr  Tyr Pro Val 
              1385                 1390                 1395             
          Ile His  Ala Val Gly Pro Asn  Phe Ser Asn Tyr Ser  Glu Ser Glu 
              1400                 1405                 1410             
          Gly Asp  Arg Glu Leu Ala Ala  Ala Tyr Arg Glu Val  Ala Lys Glu 
              1415                 1420                 1425             
          Val Thr  Arg Leu Gly Val Asn  Ser Val Ala Ile Pro  Leu Leu Ser 
              1430                 1435                 1440             
          Thr Gly  Val Tyr Ser Gly Gly  Lys Asp Arg Leu Thr  Gln Ser Leu 
              1445                 1450                 1455             
          Asn His  Leu Phe Thr Ala Met  Asp Ser Thr Asp Ala  Asp Val Val 
              1460                 1465                 1470             
          Ile Tyr  Cys Arg Asp Lys Glu  Trp Glu Lys Lys Ile  Ser Glu Ala 
              1475                 1480                 1485             
          Ile Gln  Met Arg Thr Gln Val  Glu Leu Leu Asp Glu  His Ile Ser 
              1490                 1495                 1500             
          Ile Asp  Cys Asp Val Val Arg  Val His Pro Asp Ser  Ser Leu Ala 
              1505                 1510                 1515             
          Gly Arg  Lys Gly Tyr Ser Thr  Thr Glu Gly Ala Leu  Tyr Ser Tyr 
              1520                 1525                 1530             
          Leu Glu  Gly Thr Arg Phe His  Gln Thr Ala Val Asp  Met Ala Glu 
              1535                 1540                 1545             
          Ile Tyr  Thr Met Trp Pro Lys  Gln Thr Glu Ala Asn  Glu Gln Val 
              1550                 1555                 1560             
          Cys Leu  Tyr Ala Leu Gly Glu  Ser Ile Glu Ser Ile  Arg Gln Lys 
              1565                 1570                 1575             
          Cys Pro  Val Asp Asp Ala Asp  Ala Ser Ser Pro Pro  Lys Thr Val 
              1580                 1585                 1590             
          Pro Cys  Leu Cys Arg Tyr Ala  Met Thr Pro Glu Arg  Val Thr Arg 
              1595                 1600                 1605             
          Leu Arg  Met Asn His Val Thr  Ser Ile Ile Val Cys  Ser Ser Phe 
              1610                 1615                 1620             
          Pro Leu  Pro Lys Tyr Lys Ile  Glu Gly Val Gln Lys  Val Lys Cys 
              1625                 1630                 1635             
          Ser Lys  Val Met Leu Phe Asp  His Asn Val Pro Ser  Arg Val Ser 
              1640                 1645                 1650             
          Pro Arg  Glu Tyr Arg Pro Ser  Gln Glu Ser Val Gln  Glu Ala Ser 
              1655                 1660                 1665             
          Thr Thr  Thr Ser Leu Thr His  Ser Gln Phe Asp Leu  Ser Val Asp 
              1670                 1675                 1680             
          Gly Lys  Ile Leu Pro Val Pro  Ser Asp Leu Asp Ala  Asp Ala Pro 
              1685                 1690                 1695             
          Ala Leu  Glu Pro Ala Leu Asp  Asp Gly Ala Ile His  Thr Leu Pro 
              1700                 1705                 1710             
          Ser Ala  Thr Gly Asn Leu Ala  Ala Val Ser Asp Trp  Val Met Ser 
              1715                 1720                 1725             
          Thr Val  Pro Val Ala Pro Pro  Arg Arg Arg Arg Gly  Arg Asn Leu 
              1730                 1735                 1740             
          Thr Val  Thr Cys Asp Glu Arg  Glu Gly Asn Ile Thr  Pro Met Ala 
              1745                 1750                 1755             
          Ser Val  Arg Phe Phe Arg Ala  Glu Leu Cys Pro Val  Val Gln Glu 
              1760                 1765                 1770             
          Thr Ala  Glu Thr Arg Asp Thr  Ala Met Ser Leu Gln  Ala Pro Pro 
              1775                 1780                 1785             
          Ser Thr  Ala Thr Glu Leu Ser  His Pro Pro Ile Ser  Phe Gly Ala 
              1790                 1795                 1800             
          Pro Ser  Glu Thr Phe Pro Ile  Thr Phe Gly Asp Phe  Asn Glu Gly 
              1805                 1810                 1815             
          Glu Ile  Glu Ser Leu Ser Ser  Glu Leu Leu Thr Phe  Gly Asp Phe 
              1820                 1825                 1830             
          Leu Pro  Gly Glu Val Asp Asp  Leu Thr Asp Ser Asp  Trp Ser Thr 
              1835                 1840                 1845             
          Cys Ser  Asp Thr Asp Asp Glu  Leu Arg Leu Asp Arg  Ala Gly Gly 
              1850                 1855                 1860             
          Tyr Ile  Phe Ser Ser Asp Thr  Gly Pro Gly His Leu  Gln Gln Lys 
              1865                 1870                 1875             
          Ser Val  Arg Gln Ser Val Leu  Pro Val Asn Thr Leu  Glu Glu Val 
              1880                 1885                 1890             
          His Glu  Glu Lys Cys Tyr Pro  Pro Lys Leu Asp Glu  Ala Lys Glu 
              1895                 1900                 1905             
          Gln Leu  Leu Leu Lys Lys Leu  Gln Glu Ser Ala Ser  Met Ala Asn 
              1910                 1915                 1920             
          Arg Ser  Arg Tyr Gln Ser Arg  Lys Val Glu Asn Met  Lys Ala Thr 
              1925                 1930                 1935             
          Ile Ile  Gln Arg Leu Lys Arg  Gly Cys Arg Leu Tyr  Leu Met Ser 
              1940                 1945                 1950             
          Glu Thr  Pro Lys Val Pro Thr  Tyr Arg Thr Thr Tyr  Pro Ala Pro 
              1955                 1960                 1965             
          Val Tyr  Ser Pro Pro Ile Asn  Val Arg Leu Ser Asn  Pro Glu Ser 
              1970                 1975                 1980             
          Ala Val  Ala Ala Cys Asn Glu  Phe Leu Ala Arg Asn  Tyr Pro Thr 
              1985                 1990                 1995             
          Val Ser  Ser Tyr Gln Ile Thr  Asp Glu Tyr Asp Ala  Tyr Leu Asp 
              2000                 2005                 2010             
          Met Val  Asp Gly Ser Glu Ser  Cys Leu Asp Arg Ala  Thr Phe Asn 
              2015                 2020                 2025             
          Pro Ser  Lys Leu Arg Ser Tyr  Pro Lys Gln His Ala  Tyr His Ala 
              2030                 2035                 2040             
          Pro Ser  Ile Arg Ser Ala Val  Pro Ser Pro Phe Gln  Asn Thr Leu 
              2045                 2050                 2055             
          Gln Asn  Val Leu Ala Ala Ala  Thr Lys Arg Asn Cys  Asn Val Thr 
              2060                 2065                 2070             
          Gln Met  Arg Glu Leu Pro Thr  Leu Asp Ser Ala Val  Phe Asn Val 
              2075                 2080                 2085             
          Glu Cys  Phe Lys Lys Phe Ala  Cys Asn Gln Glu Tyr  Trp Glu Glu 
              2090                 2095                 2100             
          Phe Ala  Ala Ser Pro Ile Arg  Ile Thr Thr Glu Asn  Leu Thr Thr 
              2105                 2110                 2115             
          Tyr Val  Thr Lys Leu Lys Gly  Pro Lys Ala Ala Ala  Leu Phe Ala 
              2120                 2125                 2130             
          Lys Thr  His Asn Leu Leu Pro  Leu Gln Glu Val Pro  Met Asp Arg 
              2135                 2140                 2145             
          Phe Thr  Val Asp Met Lys Arg  Asp Val Lys Val Thr  Pro Gly Thr 
              2150                 2155                 2160             
          Lys His  Thr Glu Glu Arg Pro  Lys Val Gln Val Ile  Gln Ala Ala 
              2165                 2170                 2175             
          Glu Pro  Leu Ala Thr Ala Tyr  Leu Cys Gly Ile His  Arg Glu Leu 
              2180                 2185                 2190             
          Val Arg  Arg Leu Asn Ala Val  Leu Leu Pro Asn Val  His Thr Leu 
              2195                 2200                 2205             
          Phe Asp  Met Ser Ala Glu Asp  Phe Asp Ala Ile Ile  Ala Ala His 
              2210                 2215                 2220             
          Phe Lys  Pro Gly Asp Thr Val  Leu Glu Thr Asp Ile  Ala Ser Phe 
              2225                 2230                 2235             
          Asp Lys  Ser Gln Asp Asp Ser  Leu Ala Leu Thr Ala  Leu Met Leu 
              2240                 2245                 2250             
          Leu Glu  Asp Leu Gly Val Asp  His Ser Leu Leu Asp  Leu Ile Glu 
              2255                 2260                 2265             
          Ala Ala  Phe Gly Glu Ile Ser  Ser Cys His Leu Pro  Thr Gly Thr 
              2270                 2275                 2280             
          Arg Phe  Lys Phe Gly Ala Met  Met Lys Ser Gly Met  Phe Leu Thr 
              2285                 2290                 2295             
          Leu Phe  Val Asn Thr Leu Leu  Asn Ile Thr Ile Ala  Ser Arg Val 
              2300                 2305                 2310             
          Leu Glu  Asp Arg Leu Thr Lys  Ser Ala Cys Ala Ala  Phe Ile Gly 
              2315                 2320                 2325             
          Asp Asp  Asn Ile Ile His Gly  Val Val Ser Asp Glu  Leu Met Ala 
              2330                 2335                 2340             
          Ala Arg  Cys Ala Thr Trp Met  Asn Met Glu Val Lys  Ile Ile Asp 
              2345                 2350                 2355             
          Ala Val  Val Ser Gln Lys Ala  Pro Tyr Phe Cys Gly  Gly Phe Ile 
              2360                 2365                 2370             
          Leu His  Asp Ile Val Thr Gly  Thr Ala Cys Arg Val  Ala Asp Pro 
              2375                 2380                 2385             
          Leu Lys  Arg Leu Phe Lys Leu  Gly Lys Pro Leu Ala  Ala Gly Asp 
              2390                 2395                 2400             
          Glu Gln  Asp Glu Asp Arg Arg  Arg Ala Leu Ala Asp  Glu Val Val 
              2405                 2410                 2415             
          Arg Trp  Gln Arg Thr Gly Leu  Ile Asp Glu Leu Glu  Lys Ala Val 
              2420                 2425                 2430             
          Tyr Ser  Arg Tyr Glu Val Gln  Gly Ile Ser Val Val  Val Met Ser 
              2435                 2440                 2445             
          Met Ala  Thr Phe Ala Ser Ser  Arg Ser Asn Phe Glu  Lys Leu Arg 
              2450                 2455                 2460             
          Gly Pro  Val Val Thr Leu Tyr  Gly Gly Pro Lys 
              2465                 2470                 
          <![CDATA[<210>  56]]>
          <![CDATA[<211>  14]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  CHIKV，PRT，屈公病毒之483-495]]>
          <![CDATA[<400>  56]]>
          Asn Glu Gly Glu Ile Glu Ser Leu Ser Ser Glu Leu Leu Thr 
          1               5                   10                  
          <![CDATA[<210>  57]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  SINV，PRT，辛得比斯病毒之494-512]]>
          <![CDATA[<400>  57]]>
          Ser Asp Gly Glu Ile Asp Glu Leu Ser Arg Arg Val Thr Thr Glu Ser 
          1               5                   10                  15      
          Glu Pro Val Leu 
                      20  
          <![CDATA[<210>  58]]>
          <![CDATA[<211>  13]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  SFV，PRT，勝利基森林病毒之448-459]]>
          <![CDATA[<400>  58]]>
          Asp Glu His Glu Val Asp Ala Leu Ala Ser Gly Ile Thr 
          1               5                   10              
          <![CDATA[<210>  59]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  CHIKV，PRT，屈公病毒之501-530]]>
          <![CDATA[<400>  59]]>
          Leu Pro Gly Glu Val Asp Asp Leu Thr Asp Ser Asp Trp Ser Thr Cys 
          1               5                   10                  15      
          Ser Asp Thr Asp Asp Glu Leu Arg Leu Asp Arg Ala Gly Gly 
                      20                  25                  30  
          <![CDATA[<210>  60]]>
          <![CDATA[<211>  33]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  SINV，PRT，辛得比斯病毒之517-549]]>
          <![CDATA[<400>  60]]>
          Glu Pro Gly Glu Val Asn Ser Ile Ile Ser Ser Arg Ser Ala Val Ser 
          1               5                   10                  15      
          Phe Pro Leu Arg Lys Gln Arg Arg Arg Arg Arg Ser Arg Arg Thr Glu 
                      20                  25                  30          
          Tyr 
          <![CDATA[<210>  61]]>
          <![CDATA[<211>  11]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  SFV，PRT，勝利基森林病毒之465-475]]>
          <![CDATA[<400>  61]]>
          Asp Asp Val Leu Arg Leu Gly Arg Ala Gly Ala 
          1               5                   10      
          <![CDATA[<210>  62]]>
          <![CDATA[<211>  10]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  nsP3/nsP4接合點，PRT，委內瑞拉馬腦炎病毒]]>
          <![CDATA[<400>  62]]>
          Leu His Glu Ala Gly Cys Ala Pro Ser Tyr 
          1               5                   10  
          <![CDATA[<210>  63]]>
          <![CDATA[<211>  10]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  nsP3/nsP4接合點，PRT，委內瑞拉馬腦炎病毒]]>
          <![CDATA[<400>  63]]>
          Arg Phe Asp Ala Gly Ala Tyr Ile Phe Ser 
          1               5                   10  
          <![CDATA[<210>  64]]>
          <![CDATA[<211>  10]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  nsP2/nsP3接合點，PRT，東部馬腦炎病毒]]>
          <![CDATA[<400>  64]]>
          Gln His Glu Ala Gly Arg Ala Pro Ala Tyr 
          1               5                   10  
          <![CDATA[<210>  65]]>
          <![CDATA[<211>  10]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  nsP3/nsP4接合點，PRT，東部馬腦炎病毒]]>
          <![CDATA[<400>  65]]>
          Arg Tyr Glu Ala Gly Ala Tyr Ile Phe Ser 
          1               5                   10  
          <![CDATA[<210>  66]]>
          <![CDATA[<211>  10]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  nsP2/nsP3接合點，PRT，西部馬腦炎病毒]]>
          <![CDATA[<400>  66]]>
          Arg Tyr Glu Ala Gly Arg Ala Pro Ala Tyr 
          1               5                   10  
          <![CDATA[<210>  67]]>
          <![CDATA[<211>  10]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  nsP2/nsP3接合點，PRT，西部馬腦炎病毒]]>
          <![CDATA[<400>  67]]>
          Arg Tyr Glu Ala Gly Ala Tyr Ile Phe Ser 
          1               5                   10

Claims

一種自我複製RNA分子，其包含： a) 編碼共同(consensus)截短HBV核心抗原的第一聚核苷酸序列，該共同截短HBV核心抗原由與SEQ ID NO: 2至少95%一致之胺基酸序列組成；及 b) 編碼共同HBV聚合酶抗原之第二聚核苷酸序列，該共同HBV聚合酶抗原由與SEQ ID NO: 7至少90%一致之胺基酸序列組成，其中該共同HBV聚合酶抗原不具有逆轉錄酶活性及核糖核酸酶H (RNase H)活性。
一種自我複製RNA分子，其包含： a) 非結構基因nsP1、nsP2、nsP3及nsP4； b) DLP基元(motif)及經修飾之5'-UTR； c) 亞基因體啟動子；及 d) 可操作地連接至該亞基因體啟動子之以下中之至少一者： i. 編碼共同截短HBV核心抗原的第一聚核苷酸序列，該共同截短HBV核心抗原由與SEQ ID NO: 2至少95%一致之胺基酸序列組成；或 ii. 編碼共同HBV聚合酶抗原之第二聚核苷酸序列，該共同HBV聚合酶抗原由與SEQ ID NO: 7至少90%一致之胺基酸序列組成，其中該共同HBV聚合酶抗原不具有逆轉錄酶活性及核糖核酸酶H活性。
如請求項2之自我複製RNA分子，其包含該DLP基元及用於將該DLP基元之下游及上游可操作地連接至該第一或第二聚核苷酸中之至少一者之自我蛋白酶(autoprotease)肽的編碼序列。
如請求項3之自我複製RNA分子，其中該自我蛋白酶肽係選自由以下組成之群：豬鐵士古病毒-1 2A(P2A)、口蹄疫病毒(FMDV) 2A(F2A)、馬鼻炎A病毒(ERAV) 2A(E2A)、明脈扁刺蛾病毒2A(T2A)、細胞質多角體病毒2A(BmCPV2A)、軟化病病毒2A(BmIFV2A)及其組合。
如請求項2之自我複製RNA分子，其中該經修飾之5'-UTR包含位置1、2、4處之一或多個核苷酸取代或其組合。
如請求項2之自我複製RNA分子，其中該RNA複製子不編碼功能性病毒結構蛋白。
如請求項2之自我複製RNA分子，其中該RNA複製子編碼一或多種功能性病毒結構蛋白。
如請求項2之自我複製RNA分子，其中該自我複製RNA分子含有新世界α病毒非結構蛋白nsP1、nsP2及nsP4；及α病毒nsP3蛋白宏域、中心域及高變域，其中該高變域源於舊世界α病毒nsP3高變域，或嵌合nsP3高變域源於新世界α病毒nsP3高變域之一部分及來自舊世界α病毒nsP3高變域的另一部分。
如請求項1之自我複製RNA分子，其包含編碼該共同截短HBV核心抗原之該第一聚核苷酸序列，該共同截短HBV核心抗原由與SEQ ID NO: 2至少98%一致之胺基酸序列組成。
如請求項1之自我複製RNA分子，其包含編碼該共同HBV聚合酶抗原之該第二聚核苷酸序列，該共同HBV聚合酶抗原由與SEQ ID NO: 7至少98%一致之胺基酸序列組成，其中該共同HBV聚合酶抗原不具有逆轉錄酶活性及核糖核酸酶H活性。
如請求項1之自我複製RNA分子，其中該第一聚核苷酸進一步包含編碼可操作地連接至該共同截短HBV核心抗原之N端之信號序列的聚核苷酸序列，且該第二聚核苷酸進一步包含編碼可操作地連接至該共同HBV聚合酶抗原之N端之信號序列的聚核苷酸序列。
如請求項2之自我複製RNA分子，其中 a) 該共同截短HBV核心抗原由與SEQ ID NO: 2或SEQ ID NO: 4具98%一致之胺基酸序列組成；且 b) 該共同HBV聚合酶抗原包含與SEQ ID NO: 7具98%一致之胺基酸序列。
如請求項12之自我複製RNA分子，其中該第一聚核苷酸序列包含與SEQ ID NO: 1或SEQ ID NO: 3具95%一致之聚核苷酸序列，且該第二聚核苷酸序列包含與SEQ ID NO: 5或SEQ ID NO: 6具95%一致之聚核苷酸序列。
如請求項1之自我複製RNA分子，其進一步包含用於在該第一聚核苷酸與該第二聚核苷酸之間之自我蛋白酶肽或IRES的編碼序列。
如請求項14之自我複製RNA分子，其編碼融合蛋白，該融合蛋白包含經由連接子可操作地連接至該共同HBV聚合酶抗原的該共同截短HBV核心抗原。
如請求項15之自我複製RNA分子，其中該連接子包含胺基酸序列(AlaGly) _n，且n為2至5之整數。
如請求項16之自我複製RNA分子，其中該融合蛋白包含SEQ ID NO: 16之胺基酸序列。
如請求項2之自我複製RNA分子，其中該自我複製RNA為α病毒衍生之RNA複製子。
如請求項5之自我複製RNA分子，其中該經修飾之5'-UTR在位置2處具有U-＞G取代。
如請求項8之自我複製RNA分子，其中源於舊世界α病毒nsP3高變域的部分包含選自由FGDF及FGSF組成之群的基元。
如請求項20之自我複製RNA分子，其中源於舊世界α病毒nsP3高變域的部分包含選自由以下組成之群的重複序列：FGDF/FGDF重複序列、FGSF/FGSF重複序列、FGDF/FGSF重複序列、及FGSF/FGDF重複序列，且該等重複序列係由至少10個且不超過25個胺基酸間隔。
如請求項21之自我複製RNA分子，其中源於舊世界α病毒nsP3高變域的部分包含選自由以下組成之群的重複序列：FGDF/FGDF重複序列、FGSF/FGSF重複序列、FGDF/FGSF重複序列、及FGSF/FGDF重複序列，且該等重複序列係由源於以下組成之群的胺基酸序列間隔： SEQ ID NO: 56: NEGEIESLSSELLT、SEQ ID NO: 57: SDGEIDELSRRVTTESEPVL及SEQ ID NO: 58: DEHEVDALASGIT。
如請求項11之自我複製RNA分子，其中該信號序列獨立地包含SEQ ID NO: 9或SEQ ID NO: 15之胺基酸序列，
如請求項11之自我複製RNA分子，其中該信號序列由SEQ ID NO: 8或SEQ ID NO: 14之聚核苷酸序列獨立地編碼。
如請求項16之自我複製RNA分子，其中該連接子係由包含SEQ ID NO: 11之聚核苷酸序列編碼。
如請求項1之自我複製RNA分子，其進一步包含另一HBV抗原的編碼序列。
一種組合物，其包含如請求項1至26中任一項之自我複製RNA分子，及醫藥學上可接受之載劑，其中該自我複製RNA分子囊封於以下各者中、結合至以下各者或吸附在以下各者之上：脂質體、脂複合體(lipoplex)、脂質奈米顆粒或其組合。
如請求項27之組合物，其中該自我複製RNA分子係囊封於脂質奈米顆粒中。
一種套組，其包含如請求項1至26中任一項之自我複製RNA分子或如請求項27至28中任一項之組合物，及使用該套組治療有需要個體中B型肝炎病毒(HBV)感染之說明書。
一種如請求項1至26中任一項之自我複製RNA分子或如請求項27至28中任一項之組合物的用途，其係用於製備治療有需要個體中B型肝炎病毒(HBV)感染的藥物。
一種核酸，其編碼如請求項1至26中任一項之自我複製RNA分子。