新型重组人丙型肝炎病毒样颗粒及其生产方法
技术领域
本发明涉及人重组丙型肝炎病毒样颗粒及其生产方法。
背景技术
向动物细胞中导入基因的方法大致分为物理化学方法和生物学方法。物理化学方法有磷酸钙共沉淀法、DEAE葡聚糖法、脂转染法、显微注射法、电穿孔法等。而生物学方法有使用病毒载体的方法。
病毒载体法是利用病毒所具有的进入细胞的结构,即,利用感染能力导入基因的方法。
使用病毒载体制备的重组病毒颗粒的表面存在来自病毒的结构蛋白(核衣壳或包膜蛋白等),经由存在于细胞表面的受体感染细胞,具有有效地导入基因的机制。因此,使用上述病毒载体制备的重组病毒颗粒不仅可以向动物细胞内导入基因、制备目标基因表达细胞,还可以在基因治疗、转基因动物的制作等方面应用。
病毒载体分类为反转录病毒载体、DNA病毒载体、RNA病毒载体三种,在由于来源病毒的种类不同可导入的基因的长度、基因是否可掺入细胞的染色体基因组、不仅对分裂细胞对未分裂细胞是否可导入基因、可感染的细胞的种类、对细胞的毒性、基因导入效率等方面各有特征。
反转录病毒具有正链的RNA基因组。该RNA具有典型的真核细胞的mRNA的性质,即,甲基化的5’末端帽结构和3’末端具有含约200个碱基的polyA。在感染的细胞内,该RNA通过病毒所具有的反转录酶的作用变换为DNA。并且病毒通过所编码的酶的作用掺入到宿主的基因组DNA中。掺入的DNA称为原病毒,在原病毒的两端产生重复序列(LTR),通过其中的启动子合成病毒的RNA。由合成的RNA翻译成病毒蛋白,同时该基因组大小的RNA掺入到病毒颗粒中,形成子颗粒,释放到细胞外。
生产病毒颗粒所必须的RNA结构是两端的LTR,以及中间的引物结合位点、包装信号和多聚嘌呤信号。它们是必须的顺式因子。而编码病毒蛋白的基因并非必须是顺式因子,在感染细胞中,只要提供病毒蛋白即可正常复制并产生颗粒。
因此,生产重组反转录病毒时,可以制备除去了反转录病毒所编码的gag、pol、env等基因,取而代之地插入要表达的目标基因的载体(称为反转录病毒载体),将该载体导入供给病毒蛋白的细胞(通常称为包装细胞),则可以制备掺入了外源基因的反转录病毒颗粒(非专利文献1)。
反转录病毒例如有小鼠白血病病毒、猫白血病病毒、狒狒丙型致瘤病毒、人类免疫缺陷病毒、成人T细胞白血病病毒等。并且,已报到的重组人反转录病毒载体有:以小鼠白血病病毒为基础的载体(非专利文献1)、以人类免疫缺陷病毒为基础的载体(非专利文献2)等。
重组反转录病毒的生产系统包含两种构成单元,即,包含反转录病毒载体(重组反转录病毒DNA)和反转录病毒包装细胞,反转录病毒载体中,要导入的基因信息(目标外源基因)和病毒基因组的包装、掺入所必须的所有要素均保持顺式;反转录病毒包装细胞提供由gag、pol和env基因编码的病毒蛋白。如果只是导入了表达gag、pol和env基因的重组载体的包装细胞,是无法释放重组反转录病毒颗粒的。
为了生产重组反转录病毒颗粒,必须将gag、pol和env蛋白置于反式。因此,通过向导入了表达gag、pol和env基因的重组载体的包装细胞中导入反转录病毒载体,则可以制备保有上述载体中所含的基因信息的重组反转录病毒。接着,使用这些病毒感染细胞,其中反转录病毒载体根据天然的反转录病毒生活周期掺入细胞的染色体基因组中。
如上所述,反转录病毒载体法是以将特定的DNA有效地掺入到宿主的染色体基因组中为目的而制备的系统,目标基因的插入位置不能预测,因此不可否认会有因插入使正常基因受损、插入的附近的基因活化、目标外源基因过量表达或者表达受到抑制的可能性。为克服该问题,人们开发了瞬时表达系统,该表达系统是利用可用作染色体外基因的DNA病毒载体。
DNA病毒载体是来自DNA病毒的载体。DNA病毒在病毒颗粒内保有作为基因信息的DNA,该DNA的复制是以自身DNA为模板,使来自宿主的依赖DNA的DNA复制酶作为催化剂的至少一部分生成互补链,并将该过程反复进行。可用作染色体外基因的DNA病毒载体例如有腺病毒载体。
人腺病毒具有约36kb的线状双链DNA作为基因组,其中所含的区域大致分为早期基因E1、E2、E3、E4和晚期基因L1、L2、L3、L4、L5。早期基因主要与病毒的复制有关,晚期基因与病毒壳体等病毒的结构蛋白合成有关。用作基因导入的腺病毒载体是将早期基因E 1区(分为E1A和E1B,E1A使所有的腺病毒启动子活化)置换为所需的外源基因(目标基因),在可反式供给E1A的细胞株293细胞(293细胞表达E1A)等中增殖。缺损E1A区的腺病毒载体无法在不表达E1A的通常的细胞中增殖。E3区域对于病毒的增殖来讲不是必须的,因此大多为了插入更大的外源基因而除去。腺病毒可以将最大为野生型基因组大小的105%的基因组包装在病毒壳体内,因此,通过使E1和E3区缺损,可以插入最大约8.1kb的外源基因(非专利文献3)。
腺病毒载体中,可以向非增殖细胞和增殖细胞两者中导入基因(非专利文献4)。由此,该方法适合体内基因导入法。该载体的缺点之一是基因的表达期间通常很短(以周为单位)。这是由于腺病毒的基因组限定于染色体外的区域存在,不能进行复制、扩增。第二个缺点是目前通常使用的腺病毒引发非特异性炎症反应,对载体本身的细胞性免疫应答也增强,因此,基因治疗中难以连续施用(非专利文献5)。
还开发了以RNA病毒为基础的病毒载体。RNA病毒的复制是以自身RNA为模板,通过来自自身的、依赖RNA的RNA复制酶催化生成互补链,并将上述过程反应进行。
RNA病毒大致分为(-)链RNA病毒和(+)链RNA病毒。代表性的(-)链RNA病毒有禽流感病毒。禽流感病毒基因组是含有8个节段的负链RNA的病毒。感染禽流感病毒,则通过禽流感颗粒中的蛋白质起始基因的转录。首先,病毒RNA聚合酶在由5’末端帽结构至十几个核苷酸的部分将宿主细胞mRNA切断,用作引物,将RNA链(正链)延伸。由该正链RNA翻译病毒蛋白。在复制过程中,合成与病毒的RNA完全互补的RNA,以其为模板进行子代及后代的病毒RNA的扩增。然后,病毒RNA与病毒蛋白一起包装,形成病毒颗粒。
因此,在细胞培养系统中生产禽流感病毒时,通过RNA聚合酶II系启动子、例如CMV或CAG启动子表达禽流感病毒所编码的蛋白质,同时通过不具有帽结构和polyA的启动子——RNA聚合酶I型启动子,例如rRNA基因的启动子表达病毒RNA,则细胞中,病毒RNA与病毒蛋白一起被包装,形成病毒颗粒(非专利文献6)。但是并未给出所生产的病毒量,在生产方面尚未建立可以充分利用的技术。
被分类为(+)链RNA病毒的病毒有新培斯病毒或丙型肝炎病毒。(+)链RNA病毒所具有的基因组RNA同时可发挥信使RNA(以下称为“mRNA”)的功能,可以与宿主细胞的翻译功能相关性地生产复制或形成颗粒所必须的蛋白质。换言之,(+)链RNA病毒的基因组RNA本身具有传播力。
来自新培斯病毒的病毒载体是在基因组RNA中,以使与病毒结构体相关的结构基因区缺失、残留病毒的转录复制蛋白基因群,和在转录启动子下游连接所需外源性基因的RNA作为基本结构。将上述RNA或可使该RNA转录的cDNA导入细胞内,则发生含有外源基因的RNA载体的自主复制、和转录启动子下游的外源性基因的转录,目标外源性基因产物在细胞内表达。并且,通过使表达结构基因的cDNA单元(辅助)和表达上述RNA载体的cDNA单元在包装细胞内共存,可以制备具有感染能力但不具有传播力的复合物(非专利文献7)。
新培斯病毒使用67kDa的高亲和性层粘连蛋白受体作为受体,高效感染神经细胞,因此,新培斯病毒载体作为神经特异性地导入基因的系统受到人们的关注(非专利文献8)。但是,新培斯病毒的感染显示诱导宿主细胞中的程序性细胞死亡(非专利文献9),其毒性尚未明确。
丙型肝炎病毒(HCV)的基因组是含有约9600个核苷酸的(+)链的单链RNA。该基因组RNA含有5’非翻译区(可标为5’NTR或5’UTR)、由结构区和非结构区构成的翻译区、以及3’非翻译区(标记为3’NTR或3’UTR)。该结构区编码HCV的结构蛋白,非结构区编码多种非结构蛋白。
上述HCV的结构蛋白(核心、E1、E2和p7)和非结构蛋白(NS2、NS3、NS4A、NS4B、NS5A和NS5B)是由翻译区以连续的多蛋白的形式被翻译,然后通过蛋白酶进行限定分解、游离而生成。这些结构蛋白和非结构蛋白(即HCV的病毒蛋白)中,核心(Core)是核心蛋白,E1和E2是包膜蛋白。已知非结构蛋白是与病毒本身的复制相关的蛋白质,NS2具有变性蛋白酶活性,NS3已知具有丝氨酸蛋白酶活性(N末端一侧的3分之1)和解旋酶(C末端一侧的3分之2)。并且,NS4A是NS3的蛋白酶活性的辅因子,NS5B具有依赖RNA的RNA聚合酶活性。
已知HCV根据其基因型或血清型分为多种型。目前,主流HCV基因型分类方法——Simmonds等人的采用HCV株的碱基序列的系统分析法中,HCV分类为基因型1a、基因型1b、基因型2a、基因型2b、基因型3a、基因型3b共6种型,并且各类均还分为几个亚型。对于HCV的多种基因型,其基因组全长碱基序列已经确定(非专利文献10-13)。
HCV颗粒被细胞表面的硫酸多糖类捕获,经由包膜蛋白,与亲和性高的受体结合,通过胞吞作用摄取到内体中。然后,病毒膜与内体膜融合,核衣壳侵入到细胞质中。暴露的病毒基因组通过IRES起始翻译。在内质网膜上发生翻译和蛋白质的降解。核心蛋白、E1和E2蛋白、内质网中复制的病毒RNA集合,形成病毒颗粒。然后出芽到内质网腔。出芽后的颗粒通过高尔基体释放到细胞外。
最近,作为来自HCV的具有自主复制能力的RNA,人们制备了HCV次基因组RNA复制子(专利文献1、2和非专利文献14-16),由此可以使用培养细胞进行HCV的复制机理分析。这些HCV次基因组RNA复制子是存在于HCV基因组RNA的5’非翻译区中的HCV IRES下游的结构蛋白被新霉素抗性基因及与其下游相连接的EMCV-IRES置换所得。已证明该RNA复制子通过导入人肝癌细胞Huh7并在新霉素存在下培养,可在Huh7细胞内自主复制。并且还证明了一部分HCV次基因组RNA复制子并不限于Huh7,在人子宫颈癌细胞HeLa、人肝癌细胞HepG2等细胞内也可自主复制(专利文献3)。并且专利文献2中,对于重组HCV作为基因治疗用的载体的应用,提出利用HCV全长基因组进行HCV病毒颗粒的生产。
专利文献1:特開2002-171978号公報
专利文献2:特開2001-17187号公報
专利文献3:国際公開WO2004/104198
非专利文献1:Mann,R.et al.,Cell,33(1983)p153-59
非专利文献2:Simada,T et al.,J Clin Invest.88(1991)p1043-47
非专利文献3:Betta,A et al.,Proc.Nati.Acad.Sci.USA 91(1994)p8802-06
非专利文献4:Burden,S & Yarden,Y.,Neuron,18(1997)p847-55
非专利文献5:Crystal,R.G Science,270,(1995)p404-10
非专利文献6:Neumann,G.& Kawaoka,Y.,Virology 287(2001)p243-50
非专利文献7:Berglund,P et al.,Biotechnology,11(1993)p916-920
非专利文献8:Wang,K.S et al.,J.Virol.66(1992)p4992-5001
非专利文献9:Levine,B.et al.、Nature,361(1993)p739-42
非专利文献10:Simmonds,P.et al.,Hepatology,10(1994)p1321-24
非专利文献11:Choo,Q.L et al.,Science,244(1989)p359-362
非专利文献12:Okamoto,H et al.,J.Gen.Virol.,73(1992)p673-79
非专利文献13:Mori,S.et al.,Biochem.Biophis.Res.Commun.183(1992)p334-42
非专利文献14:Blight et al.,Science,290(2000)p1972-74
非专利文献15:Friebe et al.,J.Virol.,75(2001)p12047-57
非专利文献16:Kato,T.et al.,Gastroenterology,125(2003)p1808-17
发明内容
HCV作为病毒载体,并未象反转录病毒、腺病毒、禽流感病毒、新培斯病毒那样已进行了实际开发。如果上述HCV载体被开发,则有可能向肝脏等组织细胞中特异性导入基因。这种情况下,为了确保高度的安全性,优选HCV载体可以感染细胞但没有传播性。
本发明的目的在于开发可用作上述载体的重组丙型肝炎病毒(HCV)样颗粒。还提供高效生产该HCV样颗粒的方法。
本发明人从安全性、便利性、实用性角度考虑,尝试了在培养细胞中生产可具有产业实用性的重组HCV样颗粒。首先,将HCV的基因组分割成表达HCV结构蛋白的载体、和含有与复制相关的基因的载体。后者载体中可以包含所需外源基因和/或内部核糖体进入位点(IRES)。
本发明人将含有所需外源基因、IRES序列、HCV复制相关的基因的DNA克隆在T7启动子下游,构建载体,使用T7聚合酶,体外合成含有外源基因序列的HCV次基因组RNA复制子。将该RNA复制子导入培养动物细胞中,得到该HCV次基因组RNA复制子得以复制的细胞株。
接着,发现了可将高表达HCV结构蛋白的载体高效导入到该细胞株中的体系,并导入到可保有各种基因型HCV次基因组RNA复制子的细胞中。结果通过在细胞内表达HCV结构蛋白,成功地发现了可以将该HCV次基因组RNA复制子包装到病毒颗粒中的组合。
本发明人还确认:通过本发明的方法生产的重组HCV样颗粒可以进行感染、而感染了该重组HCV的细胞不生产病毒颗粒,没有传播性。由于上述特性,本发明的重组HCV颗粒可用作进行外源基因导入、或基因治疗的载体。
即,本发明主要具有以下特征。
本发明的第1方案中,提供生产重组丙型肝炎病毒颗粒的方法,该方法包含向(i)的细胞中导入(ii)的载体,培养该细胞,回收生成的重组丙型肝炎病毒颗粒;其中所述
(i)的细胞中保有RNA复制子,该复制子含有如下的碱基序列,所述碱基序列包含来自丙型肝炎病毒株的基因组RNA上的5’非翻译区,编码NS3蛋白质、NS4A蛋白、NS4B蛋白、NS5A蛋白和NS5B蛋白的碱基序列,以及3’非翻译区;
(ii)的载体表达来源于与上述(i)中的相同或不同的丙型肝炎病毒株的核心蛋白、E1蛋白、E2蛋白和p7蛋白。
其一个实施方案中,上述(i)和(ii)的丙型肝炎病毒株是独立地选自基因型1a、1b、2a、2b、3a和3b病毒株的至少一种病毒株。
在另一实施方案中,上述(i)和(ii)的丙型肝炎病毒株是独立地选自基因型1b和2a的病毒株的至少一种病毒株。
在又一实施方案中,上述(i)的丙型肝炎病毒株是基因型1b的病毒株。
根据优选的实施方案,上述基因型1b的病毒株是con1株或其衍生株。
在又一实施方案中,上述(ii)的丙型肝炎病毒株是基因型2a的病毒株。
根据优选实施方案,上述基因型2a的病毒株是JFHI株或其衍生株。
在又一实施方案中,上述RNA复制子可进一步含有至少一个内部核糖体进入位点序列(IRES)。
在另一实施方案中,上述RNA复制子可进一步含有至少一种外源基因。
根据优选实施方案,上述IRES和上述外源基因可位于上述5’非翻译区和上述NS3之间。
根据又一实施方案中,上述细胞为动物细胞。
根据优选实施方案,上述动物细胞为哺乳动物细胞。
上述哺乳动物细胞可列举Huh7、HepG2和由这些细胞衍生的株化细胞。
在另一实施方案中,上述表达载体是病毒载体。
根据优选实施方案,上述病毒载体是痘苗病毒载体。
将由本发明的上述方法生产并回收的重组丙型肝炎病毒颗粒进一步感染肝细胞或淋巴细胞系细胞等HCV敏感性细胞,可以使病毒颗粒增殖。本发明包含这些步骤。
本发明在第2方案中,提供通过上述本发明的方法生产的、且具有感染性但不具有传播力的重组丙型肝炎病毒颗粒。
在其一个实施方案中,外源基因可表达地导入上述重组丙型肝炎病毒颗粒中。
在另一实施方案中,上述重组丙型肝炎病毒颗粒是载体。
本发明中,用于生产重组丙型肝炎病毒颗粒的优选方法之一是下述的生产重组丙型肝炎病毒颗粒的方法,该方法包含向(i)的细胞中导入(ii)的痘苗病毒载体,培养该细胞,回收生成的重组丙型肝炎病毒颗粒;其中所述
(i)的细胞是自主复制下述RNA复制子的细胞,该复制子是含有如下的碱基序列的RNA复制子,或是进一步含有至少一种外源基因和/或至少一种IRES序列的RNA复制子,所述的碱基序列至少包含来自丙型肝炎con1株的基因组RNA上的5’非翻译区,编码NS3蛋白质、NS4A蛋白、NS4B蛋白、NS5A蛋白和NS5B蛋白的碱基序列,3’非翻译区;;
(ii)的痘苗病毒载体表达丙型肝炎病毒的核心蛋白、E1蛋白、E2蛋白和p7蛋白,该丙型肝炎病毒来自JFH1株。
本发明中,优选的重组丙型肝炎病毒颗粒通过上述优选方法生产。
本发明进一步包含以下的[1]-[2]。
[1]生产重组丙型肝炎病毒样颗粒的方法,该方法包含向(i)细胞中导入(ii)病毒载体,培养该细胞,并回收生成的病毒样颗粒,其中所述
(i)的细胞保有RNA复制子,该RNA复制子含有如下的碱基序列,所述的碱基序列包含来源于选自基因型1a、1b、2a、2b、3a和3b的丙型肝炎病毒株的至少一种病毒株的基因组RNA上的5’非翻译区,编码NS3蛋白、NS4A蛋白、NS4B蛋白、NS5A蛋白和NS5B蛋白的碱基序列,3’非翻译区;
(ii)的载体表达下述丙型肝炎病毒株的核心蛋白、E1蛋白、E2蛋白和p7蛋白,所述的丙型肝炎病毒株是选自基因型1a、1b、2a、2b、3a和3b的丙型肝炎病毒株的至少一种的、与上述(i)的中的相同或不同的丙型肝炎病毒株。
该方法中,优选上述(i)的基因型1b的丙型肝炎病毒株是con1株,优选上述(i)的基因型2a的丙型肝炎病毒株是JFH1株。
该方法中,优选上述(ii)的基因型1a的丙型肝炎病毒株是H77c株、1株、H株和HC-J1株。
该方法中,优选上述(ii)的基因型1b的丙型肝炎病毒株是J1株、con1株、TH株、J株、JT株和BK株。
该方法中,优选上述(ii)的基因型2a的丙型肝炎病毒株是JFH1株、HC-J6株、JCH1株和J6CF株。
该方法中,优选上述(ii)的基因型3a的丙型肝炎病毒株是NZL1株、K3a/650株、452株和E-b1株。
该方法中,优选上述(ii)的基因型3b的丙型肝炎病毒株是Tr株。
该方法中,优选上述(ii)的载体是痘苗病毒载体或含有EF-1α启动子的载体。
该方法中,优选上述RNA复制子进一步含有至少一种内部核糖体进入位点(IRES)序列和/或至少一种外源基因。
该IRES序列和/或外源基因优选位于上述5’非翻译区和上述NS3蛋白编码序列之间。
本方法中,上述细胞优选为动物细胞。动物细胞更优选为Huh7细胞、HepG2细胞或由这些细胞衍生的株化细胞。
[2]重组丙型肝炎病毒样颗粒,其由上述[1]的方法生产,具有感染性但不具有传播力。
发明效果
本发明可提供将含有所需外源基因的HCV次基因组RNA进行包装得到的、不具有传播性的重组感染性HCV样颗粒及其制备方法。上述重组感染性HCV样颗粒具有缺乏传播性的优点,因此特别可以用于向肝脏或淋巴细胞系的细胞中或组织中导入基因(例如基因治疗),或者用作制备转基因动物的病毒载体,还可用作弱毒化疫苗。
附图简述
图1是本发明的实施方案的概略图,表示重组HCV样颗粒的制备步骤。a):导入了HCV次基因组RNA复制子的Huh7细胞中,HCV次基因组RNA复制子得到复制。未生成病毒颗粒。b):进一步导入了HCV结构蛋白表达载体的a)的细胞中,运用得到表达的HCV结构蛋白包装HCV次基因组RNA复制子,生成病毒样颗粒。c):在由b)生产的病毒样颗粒感染的细胞中,发生HCV次基因组RNA复制子的复制,但未生成病毒子颗粒。
图2是表示HCV基因组RNA和HCV次基因组RNA的cDNA的结构图。上段是由HCV基因型2a制备的pFH1,中段是pSGR-JFH1。下段是由HCV基因型1b制备的I389/NS3-3’wt。图中的符号如下。T7:T7RNA启动子。5’UTR:5’非翻译区。核心:核心蛋白。E1、E2:包膜蛋白。p7:p7蛋白。NS2、NS3、NS4A、NS4B、NS5A、NS5B:非结构蛋白。3’UTR:3’非翻译区。Age I、Pme I、Xba I:限制酶Age I、Pme I和Xba I的酶切位点。EMCV IRES:脑心肌炎病毒的内部核糖体进入位点。
图3表示用于表达本发明的HCV结构蛋白的载体的图谱。具体来说,上段表示在CAG启动子下游插入JFH结构区基因而制备的质粒克隆pGAGC-p7JFH1,下段表示在延伸因子1α启动子序列的下游插入JFH结构区基因而制备的质粒克隆pEF4C-p7JFH1的结构。图中符号如下所示。CAG:CAG启动子,pA:polyA附加序列,EcoRI:限制酶EcoRI的酶切位点,EF-1α:延伸因子1α启动子,BGH pA:牛生长因子polyA附加序列。
图4表示在载体pDIsHJFHst、pDIsH77st、pDIsJ1st、pDIsJ1(c)/JFH(E1-p7)st和pDIsJFH(c)/J1(E1-p7)st中插入的HCV结构基因的图谱。方框内的网状表示来源病毒株的不同。
图5是表示向保有复制子的细胞株中IH4.1中导入pEF4C-p7JFH1,将该细胞的培养上清(sup)通过蔗糖密度梯度进行分组得到的各组分中HCV复制子RNA的量(A)和HCV核心蛋白的量的图表(B)。□:实验1,◆:实验2
图6是表示使痘苗病毒载体DIsJFHst感染保有复制子的细胞株5-15,将该细胞培养上清(sup)通过蔗糖密度梯度进行分组得到的各组分(横轴)中HCV核心蛋白的量(纵轴)的图。涂黑的圆表示HCV核心蛋白,涂黑的方框表示使用NP40处理的培养上清得到的结果。实验1只是未处理的结果(图6A),实验2是未处理和NP40处理结果(图6B)。
实施发明的最佳方式
1.定义
本说明书中使用的术语具有以下含义。
“RNA复制子”是指改变HCV病毒基因组而制备的具有自主复制能力的RNA。
“自主复制能力”是指如质粒DNA,在细胞内可以自主地再生核酸的拷贝(即复制)的能力。
“感染能力”或“感染性”是指通过保持与细胞的粘合能力和膜融合能力等,可将病毒内部的核酸等导入细胞内的能力。
“重组丙型肝炎病毒”是指通过基因重组技术,使原本HCV病毒所具有的性质进行质/量的变化而得到的病毒,例如有:具有表达原本的病毒所表达的以外的外源基因的能力的病毒、使原本的病毒所具有的传播性或病毒基因组的复制能力缺损的病毒等,广义来说,也包含基因在相同的病毒型之间或亚型之间重组所得的病毒。
“传播性”或“传播能力”是指通过感染或人工方法使核酸导入细胞内,存在于细胞内的该核酸经复制后形成感染性颗粒或与其类似的复合物,可以传播其它细胞等能力。
“核心”是HVC的核心结构蛋白。
“E1”和“E2”均为包膜结构蛋白。
“NS”是指HCV的非结构蛋白,是与病毒本身复制相关的蛋白质。“NS2”具有变性蛋白酶活性。“NS3”具有丝氨酸蛋白酶活性(N末端一侧的3分之1)和解旋酶活性(C末端一侧的3分之2)。“NS4A”是NS3蛋白酶活性的辅因子。“NS4B”的功能尚未明确。“NS5A”具有控制宿主细胞信息传递的活性。“NS5B”具有依赖RNA的RNA聚合酶活性。
“IRES序列”是指在RNA的内部结合核糖体,可起始翻译的内部核糖体进入位点。
“可表达”是指通过启动子、增强子等调控序列可进行目标基因的转录、翻译的状态。
2.保有HCV次基因组RNA复制子的细胞
野生型HCV基因组由编码约3000个氨基酸的前体蛋白质的约9.6kb长度的单链RNA构成。HCV基因组按照5’非翻译区(5’UTR)、核心、E1、E2、p7、NS2、NS3、NS4A、NS4B、NS5A、NS5B、3’非翻译区(3’UTR)的顺序构成。本发明的方法中使用的HCV次基因组RNA复制子包括按照5’非翻译区、NS3、NS4A、NS4B、NS5A、NS5B、3’非翻译区的顺序构成的变异RNA。该RNA复制子在启动子等调控因子的作用下可复制地导入到特定的细胞中。
RNA复制子还可包含外源基因和/或IRES序列。外源基因和IRES序列可优选以外源基因、IRES序列的顺序位于5’非翻译区和NS3编码序列之间。
IRES序列的优选例子包括但不限于:EMCV IRES(脑心肌炎病毒的内部核糖体进入位点)、FMDV IRES、HCV IRES等,更优选EMCVIRES和HCV IRES,最优选EMCV IRES。
作为外源基因,可以使用显示抗药性的基因(即,该基因是可以进行细胞选择的基因,具有该基因的细胞对该药物具有抗性)、例如编码新霉素、潮霉素、嘌呤霉素、零霉素、杀稻瘟素、胸苷激酶、卡那霉素等的基因;报道基因(即,该基因是编码成为基因表达指标的基因产物的标志基因),例如编码萤光素酶、绿色荧光蛋白(GFP)、β-半乳糖苷酶等催化发光反应或显色反应的酶的基因;还有基因治疗用的靶基因治疗用核酸,例如编码在包括人的哺乳动物中对要治疗的疾病的治疗起作用的各种蛋白质,例如酶、细胞因子、趋化因子、激素、抗体、免疫调节分子、肿瘤抑制蛋白、生长因子、膜蛋白和血管激动性蛋白质的基因、反义RNA、siRNA等治疗用核酸等。
HCV次基因组RNA复制子的具体例子有pSGR-JFH1(图2中段)、I389/NS3-3’/wt(图2下段)等。上述HCV次基因组RNA复制子例如可以采用本发明人在发行刊物Kato,T.等人.Gastroenterology,2003125:1808-1817、国际公开WO 2004/104198(专利文献3)中所记述的方法制备。
使用HCV株的碱基序列进行的系统分析法中,HCV被分类为基因型1a、因型1b、基因型2a、因型2b、基因型3a、因型3b共6个型,并且各型还分类为几个亚型。HCV的多个基因型的基因组全长碱基序列均已确定(Simmonds,P.等人.,Hepatology,10(1994)1321-1324页、以及Choo,Q.L等人.,Science,244(1989)359-362页,Okamoto,H等人.,J.Gen.Virol.,73(1992)673-679页、Mori,S.等人.,Biochem.Biophis.Res.Commun.183(1992)334-342页、国际公开WO 2004/104198)。
具体来说,基因型1a的HCV株已知有H77c株(H77株的共同序列:GenBank检索号AF011751)、1株(GenBank检索号M62321)、H株(GenBank检索号M67364)、HC-J1株(GenBank检索号D10749)等。基因型1b的HCV株已知有J1株(GenBank检索号D89815)、con1株(GenBank检索号AJ238799,也称为Con-1株)、TH株(Wakita,T.等人.,J.Biol.Chem.,(1994)269,14205-14210页)、J株(GenBank检索号D90208)、JT株(GenBank检索号D01171)、BK株(GenBank检索号M58335)等。基因型2a的HCV株已知有JFH1株(GenBank检索号AB047639,也称为JFH-1株)、HC-J6株(GenBank检索号D00944)、JCH1株(GenBank检索号AB047640)、J6CF株(GenBank检索号AF177036)等。基因型2b的HCV株已知有HC-J8株(GenBank检索号D01221),基因型3a的HCV株已知有NZL1株(GenBank检索号D17763)、K3a/650株(GenBank检索号D28917)、452株(GenBank检索号DQ437509)、E-b1株(Chan,S.等人.,J.Gen.Virol.,73 1131-1141页(1992))等,基因型3b的HCV株已知有Tr株(Chayama,K.等人.,J.Gen.Virol.,75 3623-3628页(1994))等。其它的病毒株在GenBank的检索号清单中也已报道(Tokita,T.等人.,J.Gen.Virol.79,1847-1857,1998、Cristina J.& Colina R.Virolgy Journal,3,1-8,2006)。
构成本发明中使用的HCV次基因组RNA复制子的元件(即5’非翻译区、NS3、NS4A、NS4B、NS5A、NS5B和3’非翻译区)只要是在细胞内可复制,可构成HCV次基因组RNA复制子即可,可以来自上述任意的基因型或它们的亚型病毒株。本发明是生产具有感染性但不具有传播性的重组丙型肝炎病毒样颗粒的方法,所生产的病毒样颗粒的传播性缺损,因此优选本发明的RNA复制子不含有分别编码HCV结构蛋白(核心、E1、E2和p7)的基因。
上述各元件可来自相同的HCV株,也可以是来自两种或以上不同的HCV株的混合(嵌合)的形态。优选的HCV株是选自基因型1b和2a的HCV株的至少一种病毒株,更优选基因型1b的HCV株con1株、或基因型为2a的HCV株JFHI株。本发明中的HCV株例如可以是在作为亲株的con1株或JFHI株中自然或人为地产生突变得到的分离株,至少基因型是由亲株变化而成的株(衍生株)。此时,表现型可与亲株相同也可以不同,优选为相同的株。
HCV次基因组RNA复制子的例子有:含有来自JFH1株(基因型2a)以外的HCV株基因组的5’非翻译区,编码NS3蛋白、NS4A蛋白、NS4B蛋白、NS5A蛋白的序列以及编码JFH1株的NS5B蛋白的序列,3’非翻译区的HCV次基因组RNA复制子;含有JFH1株的5’非翻译区,编码NS3蛋白、NS4A蛋白、NS4B蛋白、NS5A蛋白、NS5B蛋白的序列,以及3’非翻译区的HCV次基因组RNA复制子;含有HCV-con1株(基因型1b,GenBank检索号AJ238799,Lohmann,V.等人.,Science 285(1999)110-113页)的5’非翻译区,编码NS3蛋白、NS4A蛋白、NS4B蛋白、NS5A蛋白和NS5B蛋白的序列,以及3’非翻译区的HCV次基因组RNA复制子等。另外,这些HCV次基因组RNA复制子的5’非翻译区和NS3蛋白质编码序列之间可以含有所需外源基因和IRES序列。
HCV基因组RNA上的5’非翻译区、结构蛋白(核心、E1、E2和p7)、非结构蛋白(NS2、NS3、NS4A、NS4B、NS5A和NS5B)、3’非翻译区、以及其它部位可以以例如基因型2a的HCV JFH1株(日本特开2002-171978号公报)的基因组RNA所对应的全长基因组cDNA序列GenBank检索号AB047639,Kato,T.等人.,Gastroenterology,125(2003)1808-1817页;SEQ ID NO.10所编码的氨基酸序列也表示为SEQ IDNO.11)为基准规定。
一个例子是,在来自JFH1株的全长基因组cDNA中,在本发明中可作为HCV次基因组RNA复制子的构成要素使用的5’非翻译区是SEQ ID NO.10的碱基序列中碱基序号1-340,编码核心蛋白质至p7蛋白(核心、E1、E2、p7)的区是碱基序号341-2779,编码NS3蛋白至3’非翻译区(NS3、NS4A、NS4B、NS5A、NS5B、3’UTR)的区是碱基序号3431-9678。通过与该来自JFH1株各区域的序列进行比较,对来自其它的HCV株的基因组cDNA也可以确定各区域。
为了获得HCV次基因组RNA复制子,将该HCV次基因组RNA的互补DNA克隆到可以由DNA序列转录RNA的启动子的下游,使用由此获得的载体,通过依赖DNA的RNA聚合酶合成。作为由DNA序列转录RNA的启动子,有T7、T3、SP6等,优选T7启动子,可通过T7聚合酶可以合成HCV次基因组RNA。上述合成的HCV次基因组RNA导入到将允许HCV增殖的细胞中,由此可以制备自主复制该HCV次基因组RNA复制子的细胞。
细胞优选动物细胞,例如鱼类、爬行动物类、两栖类、鸟类和哺乳动物细胞的脊椎动物细胞,最优选哺乳动物细胞。进一步举例,如来自肝脏、子宫颈、胚胎肾的正常细胞、肿瘤细胞、它们的株化细胞等,例如有Huh7、HepG2、IMY-N9、HeLa、HEK293等细胞(Date,T.等人.,J.Biol.Chem.,279,p.22371-22376,(2004)、Ito,T.等人.,Hepatology 34,566-572页,(2001)),优选Huh7、HepG2或由这些细胞衍生的克隆。
在培养细胞中使该HCV次基因组RNA复制的另外的方法可列举不使用RNA复制子而利用HCV cDNA的体系。使HCV cDNA通过RNA聚合酶II型启动子表达,则在转录的RNA的5’末端附加帽结构,在3’末端附加polyA链,核糖体用作蛋白质合成的模板,因此不会发生HCV基因组RNA的复制。为解决该问题,Heller等人在HCV基因组的5’末端和3’末端连接核酶序列,在细胞内通过RNA聚合酶II进行转录,然后用核酶切断,由此制备DNA载体,该DNA载体可在细胞内合成不附加帽和polyA的HCV RNA(Heller T等人.Proc.Natl.Acad.Sci.USA.,102,2579-2583页,2005)。将该载体导入细胞内,则可以获得复制HCV次基因组RNA复制子的细胞。
另外一种方法是将该HCV次基因组RNA的互补的DNA克隆到RNA聚合酶I启动子/终止子系的载体中,将该载体导入到允许HCV增殖的细胞中,由此可以获得复制该HCV次基因组RNA复制子的细胞。更具体地说,可以使用pHH21(Neumann G.等人.,Proc.Natl.Acad.Sci.USA,96(1999)9345-9350页)。pHH21是其中的启动子为人RNA聚合酶I启动子、其中的终止子为小鼠RNA聚合酶I终止子的载体。使用PCR,在对应HCV次基因组复制子RNA的cDNA 5’端和3’端分别附加限制酶BsmBI识别序列,然后用BsmBI消化,将HCV基因组插入到pHH21的BsmBI位点,由此可以在启动子/终止子和HCV基因组之间不含有多余的碱基序列地连接。
以表达HCV次基因组RNA复制子或HCV次基因组RNA复制子的载体等为代表的载体对细胞内的导入可采用本领域技术人员所公知的任意技术进行。上述导入方法例如有电穿孔法、基因枪法、脂转染法、磷酸钙法、显微注射法、BEAE葡聚糖法等。
本发明中,根据以上记载,可以制备在细胞内可复制本发明的HCV次基因组RNA复制子的细胞。上述RNA复制子在该细胞中持续地自主复制,因此即使是进行RNA分解的细胞内也可以保持一定的量。因此,如上所述,本发明的HCV次基因组RNA复制子、或者表达HCV次基因组RNA复制子的载体等导入到细胞内所得的细胞可以保有该RNA复制子。本发明中,“保有RNA复制子的细胞”是指该RNA复制子通过其自主复制能力,以显著的量、并且非瞬时地存在于细胞内。
本发明的方法中,向保有本发明的HCV次基因组RNA复制子的细胞中导入后述的HCV结构蛋白表达载体并使其表达,由此可以生产包装了HCV次基因组RNA复制子的病毒样颗粒。
3.HCV结构蛋白表达载体的构建
本发明的方法中,优选使HCV结构蛋白质基因在保有HCV次基因组RNA复制子的细胞内表达,提供HCV结构蛋白。
HCV结构蛋白含有核心、E1、E2、p7。用于提供HCV结构蛋白的编码这些蛋白质的基因并不限于HCV的基因型,该基因可分别来自同一HCV株,或者来自两种或以上不同的HCV株,可采用混合(嵌合)的形态。作为HCV结构蛋白基因的来源,可以是选自1a、1b、2a、2b、3a和3b的HCV株的至少一种病毒株,优选的HCV株是选自1a、2a、3a和3b的至少一种病毒株,更优选的HCV株是选自基因型1b和2a的HCV株的至少一种病毒株。进一步优选选自基因型1a的H77c株、1株、H株和HC-J1株等,基因型1b的J1株、con1株、TH株、J株、JT株和BK株等,或者基因型2a的JFH1株、HC-J6株、JCH1株和J6CF株等的至少一种病毒株。进一步优选基因型1a的H77株、基因型1b的J1株或基因型2a的JFH1株,最优选JFH1株(GenBank检索号AB047639,Kato,T.等人.,Gastroenterology,125(2003)1808-1817页)。
表达这些蛋白质的方法只要是可在细胞、优选动物细胞、更优选哺乳动物细胞中表达的方法即可,可以是任意方法。优选的方法是使用掺入了上述基因的表达载体的方法。
本发明的优选方法中,为了提供HCV结构蛋白,可以将HCV结构蛋白表达载体(优选以在启动子控制下可表达的形式含有HCV结构蛋白基因的表达载体)导入到保有上述2的HCV次基因组RNA复制子的细胞中并表达。
表达载体有:CDM8、pEF1/Myc-His1,2,3、pEF4/Myc-His1,2,3、pcDNA3.1、pREP4、pCEP(均为インビトロジエン制备)、pCl-neo(プロメガ制备)等。也可以使用pcDNA5/TO,该pcDNA5/TO含有可通过四环素调节表达的启动子(インビトロジエン制备)。启动子只要是可在动物细胞中表达的启动子即可,有巨细胞病毒的IE(立即早期)启动子、SV40早期或晚期启动子、金属硫蛋白启动子、反转录病毒启动子、热休克蛋白启动子、SRα启动子、延伸因子1α启动子、白蛋白启动子等。
可利用的载体可列举病毒载体。只要可感染动物细胞、使所需外源基因表达的病毒载体即可,优选反转录病毒载体、腺病毒载体、新培斯病毒载体、痘苗病毒载体,特别是痘苗病毒载体可表达大量的基因产物(Elroy-Stein,O.,等人.,Proc.Natl.Acad.Sci.USA,86(1989)6126-6130页),因此优选痘苗病毒载体。
本发明的方法中使用的HCV结构蛋白表达载体中,作为HCV结构蛋白基因,优选以在宿主细胞内可表达的状态含有核心蛋白基因、E1蛋白基因、E2蛋白基因、和p7蛋白基因。本发明的上述HCV结构蛋白表达载体的例子是:在可使插入基因表达的启动子的控制下含有核心蛋白基因、E1蛋白基因、E2蛋白基因和p7蛋白基因的载体。本发明中,特别优选使用在延伸因子1α(EF-1α)启动子的控制下插入核心蛋白基因、E1蛋白基因、E2蛋白基因和p7蛋白基因得到的含延伸因子1α启动子的载体作为特别适合的HCV结构蛋白表达载体。这里,“含有延伸因子1α启动子的载体”是指以可在宿主细胞内表达在其控制下的基因的配置方式含有延伸因子1α基因的启动子序列(EF-1α启动子;Mizushima等人.,Nucleic Acids Res.,1990,18,5322)的载体。例如有pEF1/Myc-Hisl1,2,3、pEF4/Myc-His1,2,3(均为インビトロジエン制备)。
本发明的HCV结构蛋白表达载体的另外优选例子是以可表达的状态含有核心蛋白基因、E1蛋白基因、E2蛋白基因和p7蛋白基因的痘苗病毒载体(重组痘苗病毒载体)。重组痘苗病毒载体的制备例如可优选使用DIs株、WR株、IBTd株(Meis,RJ & Condit,RC.Virol.182,442-454,(1992))等痘苗病毒株。重组痘苗病毒载体的制备方法如后述实施例所述。简单地说明,是在痘苗病毒转移载体中的p.7.5等痘苗病毒启动子的控制下克隆上述HCV结构蛋白基因,再将该转移载体通过电穿孔法等导入到感染了痘苗病毒的细胞中,培养该细胞,生成病毒颗粒,进一步优选将该病毒进行筛选、纯化,由此可制备目标重组痘苗病毒载体。上述痘苗病毒载体可以以重组病毒样颗粒的形式制备。
HCV的结构蛋白(核心、E1、E2、p7)和非结构蛋白(NS3、NS4A、NS4B、NS5A和NS5B)由翻译区以连续的多蛋白的形式被翻译,然后用蛋白酶进行限定分解,使其游离并生成,因此在表达这些HCV结构蛋白时,优选以核心、E1、E2、p7的连续的多蛋白的形式表达,也可以通过表达载体分别表达这些蛋白质。
导入了结构蛋白表达载体的细胞是否表达结构蛋白,这可以通过从细胞培养液或细胞中提取的蛋白质与结构蛋白的抗体的反应来检测(国际公开WO2004/104198)。
具体来说,例如将从细胞中提取的蛋白质试样进行SDS-聚酰胺凝胶电泳进行分组,在硝基纤维素上进行印迹,使抗HCV蛋白抗体(例如抗核心特异性抗体、或由丙型肝炎患者采集的抗血清)与其反应,再检测该抗体(蛋白质印迹法)。
或者使用同样的抗体,对表达HCV蛋白的细胞进行免疫染色,可以确认这些蛋白质的表达和在细胞内的位置。
4.HCV次基因组RNA复制子包装入颗粒
本发明的方法中,通过向保有HCV次基因组RNA复制子的细胞内供给表达HCV结构蛋白的载体,可在该细胞内生产通过结构蛋白包装HCV次基因组RNA复制子得到的病毒样颗粒。
复制HCV次基因组RNA复制子的细胞中,为了将HCV次基因组RNA复制子包装入病毒颗粒,可以向该细胞中导入结构蛋白(核心、E1、E2、p7)表达载体,并使其表达。或者是向稳定表达结构蛋白(核心、E1、E2、p7)的细胞中导入HCV次基因组RNA。
上述导入方法例如有电穿孔法、基因枪法、脂转染法、磷酸钙法、显微注射法、DEAE葡聚糖法等公知的方法。
5.重组HCV病毒样颗粒的生成
在如上制备的保有HCV次基因组RNA复制子的细胞中,导入了HCV结构蛋白(核心、E1、E2、p7)基因并使其表达的细胞(重组HCV样颗粒生成细胞)可以生产重组病毒样颗粒。产生的重组HCV样颗粒具有感染能力,具有复制HCV次基因组RNA的能力,但在被感染细胞中不生产子病毒颗粒,结果不具有传播性(传播能力)。
因此,通过培养本发明的重组HCV颗粒生成细胞,可以通过细胞培养体系制备重组HCV样颗粒。优选培养重组HCV样颗粒生成细胞,回收在该培养物(优选培养液)中生成的病毒样颗粒,由此获得HCV样颗粒。病毒样颗粒例如可通过蔗糖密度梯度离心等方法,由上述培养液中回收。
本发明的重组HCV样颗粒生成细胞的病毒颗粒生产能力可根据本领域技术人员所公知的任意的病毒检测方法确认。例如,将被认为生成病毒样颗粒的细胞培养液通过蔗糖密度梯度进行分组,测定各组分的密度、及其组分中HCV核心蛋白浓度或HCV复制子RNA浓度,由此可判断以往已知的HCV的比重是否一致。并且,当检测出核心蛋白的峰的组分的密度比用0.25%NP40(聚氧乙烯(9)辛基苯基醚)处理、然后进行分级时的同组分的密度轻时,可以判定该细胞具有病毒样颗粒生成能力。
重组HCV样颗粒生成细胞的病毒样颗粒是否具有感染能力,这可以检测包装到该病毒颗粒中的HCV次基因组RNA中所存在的外源基因的表现型。例如,如果外源基因是抗药性基因,则向接受了HCV的细胞中接种该病毒颗粒,在该药物存在下通常培养2-3周,通过计数抗药性的克隆来评价。
并且,为了确认重组HCV样颗粒生成细胞的病毒样颗粒在被感染细胞中不生产子病毒颗粒,可以通过上述的蛋白质印迹法等来判断感染细胞的提取物、优选感染细胞培养上清的试样中是否存在HCV结构蛋白。
通过本发明的方法生成的重组HCV样病毒颗粒具有对细胞(优选接受HCV的细胞)的感染能力。本发明还提供重组丙型肝炎病毒感染细胞的制备方法,该方法饱含培养重组HCV样颗粒生成细胞,将所得的培养物(优选培养液)中的病毒样颗粒感染其它细胞(优选接受HCV的细胞)。这里,接受HCV的细胞是具有HCV基因组RNA的复制能力和/或被HCV感染的能力的细胞,但并不限于此。具体来说,肝细胞有初代肝细胞、Huh7细胞、HepG2细胞、IMY-N9细胞、HeLa细胞等,淋巴细胞系细胞有Molt4细胞、HPB-Ma细胞、Daudi细胞等,但并不限于此。
为了容易理解,将上述第2节至第5节中说明的重组HCV样颗粒的生成步骤概括如图1所示。
6.用于导入基因的载体
按照本发明的方法生产的本发明的重组HCV样颗粒具有以下特征:在其RNA基因组上含有以下碱基序列:来自上述HCV株(选自基因型1a、1b、2a、2b、3a和3b,优选选自1b和2a的至少一种病毒株,例如基因型1b的con1株或基因型2a的JFH1株)的5’非翻译区,编码NS3蛋白、NS4A蛋白、NS4B蛋白、NS5A蛋白和NS5蛋白的碱基序列,以及3’非翻译区的碱基序列。
除此之外还有以下很有意义的特征:用根据本发明的方法在重组HCV样颗粒生成细胞中生成的HCV样颗粒感染细胞(例如上述列举的接收HCV的细胞),则在该感染细胞中,上述HCV次基因组RNA得以复制,但不形成子病毒颗粒。
本发明的重组HCV样颗粒中,通过向被包装的HCV次基因组RNA复制子中插入所需外源基因,可以作为基因导入/表达用的载体使用。上述包含外源基因的本发明的重组HCV样病毒颗粒可以通过将该外源基因插入到5’非翻译区和IRES序列之间制备HCV次基因组RNA复制子,将其按照上述本发明的方法进行包装来制备。在重组HCV颗粒生成细胞中生成的HCV颗粒不具有传播能力,因此可作为例如以肝脏或淋巴细胞系细胞或组织为靶的基因导入的载体使用。
根据本发明的病毒颗粒生成方法包装在病毒颗粒中的HCV次基因组RNA在被本发明的病毒样颗粒感染的、可接受HCV的细胞内并未掺入到染色体基因组中,因此基因的插入不会使正常基因受损或者插入附近的基因活化,较为有利。
由于上述特性,本发明的载体可以在导入外源基因、例如基因治疗或转基因动物的制备中使用。
导入到HCV次基因组RNA复制子中并包装成病毒颗粒的外源基因(或外源核酸)可以是包括来自包括人的哺乳动物的蛋白质、例如与疾病相关的各种蛋白质例如酶、细胞因子、趋化因子、激素、抗体、免疫调节分子、肿瘤抑制蛋白、生长因子、膜蛋白以及血管激动性蛋白等蛋白质、多肽或编码肽的基因,还有阻止或抑制蛋白质翻译的反义RNA、siRNA等治疗用核酸等,但并不限于此。
目标HCV敏感性细胞或组织是哺乳动物细胞或组织、优选人细胞或组织、例如人肝脏和淋巴细胞系的细胞或组织。本发明的载体在体内、体外或先体外后体内的条件下对靶细胞或组织起作用。优选在人的治疗、例如基因治疗、癌症(例如肝癌、淋巴瘤等)的治疗等中应用本发明的载体。
本说明书包含作为本申请的优先权基础的日本国特许出愿2005-287825号说明书和/或附图所记载的内容。
在本说明书中引用的所有刊物、专利和特许出愿的全体均通过参照引用到本说明书中。
实施例
以下给出实施例,更具体地说明本发明。但这些实施例只是用于说明,并不限制本发明的范围。
(实施例1)
保有复制子的细胞的制备
将由爆发性肝炎患者分离的丙型肝炎病毒JFH-1株(基因型2a)基因组中包含全长cDNA的DNA(JFH-1克隆:GenBank检索号AB047639)插入到pUC19质粒中的P7启动子下游,得到pJFH1,将其结构区和非结构区的一部分用新霉素抗性基因(neo,也称为新霉素磷酸转移酶基因)和EMCV-IRES(脑心肌炎病毒内部核糖体进入位点)置换,构建质粒DNA pSGR-JFH1(图2的中段)。该构建顺序按照已有报道(Lohmann等.,Science,(1999)285,110-113页)进行。
具体来说,将质粒pJFH1用限制酶AgeI和ClaI切断,在其切断位点插入两个片段并连接,其中一个片段是通过PCR扩增将来自pJFH1的5’NTR至核心区域的序列和来自pRSV5NEO的新霉素抗性基因结合、再用限制酶AgeI和PmeI切断所得的片段;另一个片段是通过PCR扩增将EMCV IRES至NS3区域的序列结合、再用限制酶PmeI和ClaI切断得到的片段。
接着,将pSGR-JFH1用限制酶XbaI切断。接着,将各10-20μg这些XbaI切断片段用绿豆核酸酶20单位(总反应液量50μl)在30℃下温育30分钟,进一步进行处理。绿豆核酸酶是催化选择性地分解双链DNA中的单链部分的反应的催化剂。通常,以上述XbaI切断片段直接作为模板进行RNA合成,则合成了XbaI识别序列的一部分——CTGA4个碱基多余地附加在3’末端的复制子RNA。因此,本实施例中,通过将XbaI切断片段用绿豆核酸酶进行处理,可由XbaI切断片段中除去CTGA4个碱基。然后,对于含有XbaI切断片段、用绿豆核酸酶处理后的溶液,按照常规方法进行蛋白质除去处理,纯化除去了CTGA4个碱基的XbaI切断片段,以此作为模板DNA。
接着,使用T7RNA聚合酶,由该模板DNA体外合成RNA。该RNA的合成是使用Ambion公司的MEGAscript。按照制造厂商的使用说明书,使用20μl含有0.5-1.0μg模板DNA的反应液进行反应。
RNA合成结束后,向反应溶液中添加Dnase(2个单位),在37℃下反应15分钟,然后进一步通过酸性苯酚进行RNA提取,除去模板DNA。
将0.01ng-10μg该RNA(复制子RNA)与由Huh7细胞中提取的总细胞性RNA混合,调节至RNA的总量为10μg。接着,通过电穿孔法将该混合RNA导入Huh7细胞中。将进行了电穿孔处理的Huh7细胞接种于培养皿中,培养16-24小时,然后向该培养皿中以各种浓度添加G418(新霉素)。然后,每周更换两次培养液,继续培养。上述培养21天后,从培养皿中克隆存活细胞的集落,继续培养。通过上述集落的克隆,可以建立多个细胞克隆株。将保有HCV次基因组RNA复制子的一个细胞株命名为1H4.1。
按照与上述同样的方法,由来自HCV基因型1b的Con-1株的基因组全长cDNA制备HCV次基因组RNA复制子(GenBank检索号:AJ242654,图2的下段的I389/NS3-3’/wt),导入Huh7细胞株中,将由此制备的保有该RNA复制子的细胞株5-15细胞(Lohmann等人.,Science,(1999)285,110-113页)也用于实验。
(实施例2)
结构蛋白质表达载体的制备
1)结构蛋白表达质粒体
通过PCR扩增包含由暴发性肝炎分离JFH1株(GenBank检索号AB047639)(Kato T.等人.,J.Med.Viol.2001,64:334-339)的结构区基因(碱基序列号249-2781)的区域。将该DNA片段用NheI和EcoRI消化,将包含所得结构基因的片段通过琼脂糖凝胶电泳纯化,用DNA聚合酶制成平滑末端。将该平滑末端的cDNA插入到质粒载体CAG启动子序列(CAG)的下游。同样,将含有用上述NheI和EcoRI消化得到的结构区基因的cDNA插入到具有延伸因子1α基因启动子序列(EF-1α启动子;Mizushima等人.,Nucleic Acids Res.,1990,18,5322)的载体pEF4/Myc-His(インビトロジエン制备)的SpeI和EcoRI之间。将所得质粒分别命名为pCAGC-p7JFH1、pEF4C-p7JFH1(图3)。
2)表达结构蛋白的重组痘苗病毒载体
为了制备含有JFH1株的结构基因、可表达其所编码的蛋白质的载体,首先将图3上段所示的pEF4C-p7GJFH1用限制酶BamHI和EcoRI消化,将编码核心蛋白、E1蛋白、E2蛋白和p7蛋白的区域通过琼脂糖凝胶电泳分离制备。接着将该片段与目标外源基因一起连接到设计成插入XGPRT基因的痘苗病毒转移载体pDIsgptmH5(Ohnishi,K.等人.,Jap.J.Infect.Dis.58(2005)88-94页、Ishii,K.等人.,Virology 302(2002)433-444页)。该pDIsgptmH5是在插入到pUc/DIs载体的克隆位点的痘苗病毒p7.5启动子的控制下掺入大肠杆菌(Escherichia coli)的黄嘌呤-鸟嘌呤磷酸核糖转移酶(XGPRT)基因的转移载体(Ishii,K.等人.,Virology302(2002)p.433-444)。将所得载体命名为pDIsJFHst。
按照以下方法制备含有H77c株的结构基因、可表达其所编码的蛋白质的载体。首先,以克隆H77c株的HCV基因组cDNA(GenBank检索号AF011751)得到的载体为模板,分别加入LA-PCR试剂盒(タカラバイオ制备)附属的5μl 10×缓冲液、5μl 2.5mM dNTP混合液、各1μl 10μM的引物H77/J1正向(AAAGATCTGCGAAAGGCCTTGTGGTACTGC:SEQ ID NO.1)和H77反向(AAGAGCTCTCATAACCCGACAAGAACAACGCCGCC:SEQ ID NO.2),最终加入去离子水,使总量为49μl。接着,加入1μl Takara LA Taq(タカラバイオ制备),然后进行PCR,PCR反应是将包含98℃20秒、68℃5分钟的步骤作为一个循环,共进行25个循环。对于该PCR产物的一部分进行琼脂糖凝胶电泳,确认有约2.5kb的扩增产物。
使用2μl该PCR产物,进行将扩增产物与质粒载体连接的连接反应。使用该连接反应产物,按照常规方法转化大肠杆菌,由所得转化体制备质粒DNA。用可以切除插入到该质粒DNA中的DNA片段的限制酶进行消化,进行琼脂糖凝胶电泳,确认在该质粒DNA中插入了约2.5kb的DNA片段。插入的DNA片段的碱基序列可按常规方法确定。结果,确定的碱基序列与GenBank检索号AF011751的碱基序列第271-2819位的序列一致。接着,将该质粒DNA用BglII和SacI消化,进行琼脂糖电泳,分离含有H77c株的结构基因区域的DNA片段,与痘苗病毒转移载体pDIsgptmH5(Ohnishi,K.等人.,Jap.J.Infect.Dis.58(2005)88-94页、Ishii,K.等人.,Virology 302(2002)p433-444)连接。结果将所得载体命名为pDIsH77st。
按照以下方法制备含有JI株的结构基因、可表达其所编码的蛋白质的载体。以克隆J1株的HCV基因组cDNA(GenBank检索号D89815)d得到的载体作为模板,分别加入LA-PCR试剂盒(タカラバイオ制备)附属的5μl 10×缓冲液、5μl 2.5mM dNTP混合液、各1μl 10μM的引物H77/J1正向(AAAGATCTGCGAAAGGCCTTGTGGTACTGC:SEQ IDNO.1)和J1反向(AAGAGCTCTCATAGACCTACAAAAACCCCGCCTCC:SEQ IDNO.3),最终加入去离子水,使总量为49μl。接着,加入1μl TakaraLA Taq(タカラバイオ制备),然后进行PCR,PCR反应是将包含98℃20秒、68℃5分钟的步骤作为一个循环,共进行25个循环。对于该PCR产物的一部分进行琼脂糖凝胶电泳,确认有约2.5kb的扩增产物。使用2μl该PCR产物,进行将扩增产物与质粒载体连接的连接反应。使用该连接反应产物,按照常规方法转化大肠杆菌,由所得转化体制备质粒DNA。用可以切除插入到该质粒DNA中的DNA片段的限制酶进行消化,供给琼脂糖凝胶电泳,确认在该质粒DNA中插入了约2.5kb的DNA片段。插入的DNA片段的碱基序列可按常规方法确定。结果,确定的碱基序列与GenBank检索号D89815的碱基序列第271-2819位的序列一致。接着,将该质粒DNA用BglII和SacI消化,进行琼脂糖电泳,分离含有J1株的结构基因区域的DNA片段,与痘苗病毒转移载体pDIsgptmH5(Ohnishi,K.等人.,Jap.J.Infect.Dis.58(2005)88-94页、Ishii,K.等人.,Virology 302(2002)p433-444)连接。将所得载体命名为pDIsJ1st。
按照以下方法制备含有由来自J1株的核心基因和来自JFH1株的E1、E2、p7基因形成的嵌合结构基因序列、可表达其所编码的蛋白质的载体。首先,为了扩增J1株的核心基因,以克隆J1株的HCV基因组cDNA(GenBank检索号D89815)得到的载体作为模板,分别加入LA-PCR试剂盒(タカラバイオ制备)附属的5μl 10×缓冲液、5μl2.5mM dNTP混合液、各1μl 10μM的引物H77/J1正向(SEQ IDNO.1)和J1/JFH1反向(GTAGCTGCTACTGGTATTCTTCACCTGGGCAGCGGAAGCTGGGATGGTCAAACAGGACAG:SEQ ID NO.4),最终加入去离子水,使总量为49μl。接着,加入1μl Takara LA Taq(タカラバイオ制备),然后进行PCR反应,PCR反应是将包含98℃20秒、68℃5分钟的步骤作为一个循环,共进行25个循环。为了扩增JFH1株的E1、E2、p7基因,以克隆JFH1株的HCV基因组cDNA(GenBank检索号AB047639)得到的载体作为模板,分别加入LA-PCR试剂盒(タカラバイオ制备)附属的5μl 10×缓冲液、5μl 2.5mM dNTP混合液、各1μl 10μM的引物J1/JFH1正向(CTGTCCTGTTTGACCA TCCCAGCTTCCGCTGCCCAGGTGAAGAATACCAGTAGCAGCTAC:SEQ ID NO.5)和JFH1反向(AAGAGCTCTCAATCAATATCAACAAACCCACGCCT:SEQ ID NO.6),最终加入去离子水,使总量为49μl。接着,加入1μl Takara LA Taq(タカラバイオ制备),然后进行PCR反应,PCR反应是将包含98℃20秒、68℃5分钟的步骤作为一个循环,共进行25个循环。纯化所得的各扩增片段,溶解于50μl的水中,分别将1μl稀释为100倍,各取1μl混合。将该混合液作为模板,不加入引物,在上述条件下进行5个循环的LA-PCR。然后添加引物H77/J1正向(SEQ ID NO.1)和JFH1反向(SEQ IDNO.6),再进行10个循环的LA-PCR,纯化扩增的嵌合DNA片段。将该片段克隆到质粒载体中,确定该DNA片段的碱基序列。结果可以确认,该DNA片段是由来自J1株的核心基因和来自JFH1株的E1、E2、p7基因形成的嵌合结构基因序列。接着,将该质粒用BglII和SacI消化,将所得片段与痘苗病毒转移载体pDIsgptmH5(Ohnishi,K.等人.,Jap.J.Infect.Dis.58(2005)88-94页、Ishii,K.等人.,Virology 302(2002)433-444页)连接。将所得载体命名为pDIsJ1(c)/JFH1(E1-p7)st。
按照以下方法制备含有由来自JFH1株的核心基因和来自J1株的E1、E2、p7基因型形成的嵌合结构基因序列、可表达其所编码的蛋白质的载体。首先,为了扩增JFH1株的核心基因,以克隆JFH1株的HCV基因组cDNA(GenBank检索号AB047639)得到的载体作为模板,分别加入LA-PCR试剂盒(タカラバイオ制备)附属的5μl 10×缓冲液、5μl 2.5mM dNTP混合液、各1μl 10μM的引物JFH1正向(AAAGATCTGCGAAAG GCCTTGTGGTACTGC:SEQ ID NO.7)和JFH1/J1反向(GGTATATCCCGGAC ACGTTGCGCACTTCATAAGCAGAGACCGGAACGGTGATGCAGGAC:SEQ ID NO.8),最终加入去离子水,使总量为49μl。接着,加入1μl Takara LA Taq(タカラバイオ制备),然后进行PCR反应。PCR反应是将包含98℃20秒、68℃5分钟的步骤作为一个循环,共进行25个循环。为了扩增J1株的E1、E2、p7基因,以克隆J1株的HCV基因组cDNA(GenBank检索号D89815)得到的载体作为模板,分别加入LA-PCR试剂盒(タカラバイオ制备)附属的5μl 10×缓冲液、5μl 2.5mM dNTP混合液、各1μl 10μM的引物JFH1/J1正向(GTCCTGCATCACCGTTCCGGTCTCTGCTTATGAAGTGCG CAACGTGTCCGGGATATACC:SEQ ID NO.9)和J1反向(AAGAGCTCTCATA GACCTACAAAAACCCCGCCTCC:SEQ ID NO.3),最终加入去离子水,使总量为49μl。接着,加入1μl Takara LA Taq(タカラバイオ制备),然后进行PCR反应,PCR反应是将包含98℃20秒、68℃5分钟的步骤作为一个循环,共进行25个循环。纯化所得的各扩增片段,溶解于50μl的水中,分别将1μl稀释为100倍,各取1μl混合。将该混合液作为模板,不加入引物,在上述条件下进行5个循环的LA-PCR。然后添加引物JFH1正向(SEQ ID NO.7)和J1反向(SEQ IDNO.3),再进行10个循环的LA-PCR,纯化扩增的嵌合DNA片段。将该片段克隆到质粒载体中,确定该DNA片段的碱基序列。结果可以确认,该DNA片段是由来自JFH1株的核心基因和来自J1株的E1、E2、p7基因形成的嵌合结构基因序列。接着,将该质粒用BglII和SacI消化,将所得片段与痘苗病毒转移载体pDIsgptmH5(Ohnishi,K.等人.,Jap.J.Infect.Dis.58(2005)88-94页、Ishii,K.等人.,Virology 302(2002)433-444页)连接。将所得载体命名为pDIsJFH(c)/J1(E1-p7)st。
如上所述制备的载体pDIsJFHst、pDIsH77st、pDIsJ1st、pDIsJ1(c)/JFH(E1-p7)st、和pDIsJFH(c)/J1(E1-p7)st中插入的HCV机构基因序列(嵌合结构基因序列)的图谱如图4所示。
具有上述各载体的重组痘苗病毒型载体DIs株例如可如下制备并选择。
将500μl含有约106pfu(噬斑形成单位)痘苗病毒DIs株的病毒液接种于已经接种了约107个CEF(鸡胚成纤维细胞)细胞的80mm培养皿中,每隔15分钟振荡8次,使病毒感染细胞。然后,加入含有1ml 10%FCS(胎牛血清)的DMEM(Dalbecco-modified Eagle培养基),在37℃下、5%CO2条件下培养2小时。除去培养基,用PBS(磷酸盐缓冲液)洗涤,然后加入0.5ml 0.05%胰蛋白酶溶液,使细胞游离,然后以2000rpm将细胞悬浮液离心3分钟,回收细胞,悬浮于400μl的PBS中。向该细胞悬浮液中溶解10μg上述转移载体,使用Gene Pulser II(BioRad制造),在0.4cm的电穿孔池中以250v、500μFD施加一次电压,进行电穿孔。将细胞悬浮于2ml含有10%FCS的DMEM中,接种于35mm培养皿中,在37℃、5%CO2的条件下培养7天。将感染细胞与培养基一起回收,进行三次冷冻干燥、2分钟的超声波处理,然后用该培养基稀释为10、100、1000倍。将106个细胞接种于35mm培养皿中,在培养基(含有10%FCS的DMEM)中分别添加25μg/ml、250μg/ml、15μg/ml黄嘌呤、次黄嘌呤,培养过夜,然后接种上述稀释细胞液。每隔15分钟振荡8次,使病毒感染细胞,除去稀释细胞液,加入2ml添加了1%软琼脂的培养基(含有10%FCS的DMEM、MPA、黄嘌呤、次黄嘌呤),使其固化,然后在37℃、5%CO2的条件下培养7天。将形成的噬斑部分用巴氏吸管拾取,悬浮于200μl含有10%FCS的DMEM中,进行2分钟超声波处理,将病毒从琼脂中释放。将该培养液用同样的培养基稀释为10、100、1000倍,将与上述同样的噬斑测定操作再重复2次,纯化重组病毒,然后感染CEF细胞,进行放大。
如上所述,由pDIsJFHst、pDIsH77st、pDIsJ1st、pDIsJ1(c)/JFH(E1-p7)st、pDIsJFH(c)/J1(E1-p7)st分别制备的病毒载体(重组病毒样颗粒)分别命名为DIsJFHst、DIsH77st、DIsJ1st、DIsJ1(c)/JFH(E1-p7)st、DIsJFH(c)/J1(E1-p7)st。
(实施例3)
向保有复制子的细胞中导入结构蛋白表达载体以及结构蛋白的生成
为了在保有复制子的细胞中表达HCV结构蛋白,通过脂转染法等向实施例2中制备的HCV结构蛋白表达载体pCAGC-p7JFH1或pEF4C-p7JFH1中导入保有复制子的细胞。再使实施例2中制备的表达HCV结构蛋白的病毒载体DIsJFHst、DIsH77st、DIsJ1st、DIsJ1(c)/JFH(E1-p7)st或DIsJFH(c)/J1(E1-p7)st感染保有复制子的细胞。
1)结构蛋白表达质粒载体的导入
通过脂转染法将pCAGC-p7JFH1导入保有复制子的细胞5-15,然后取8ml培养液继续培养,4天后回收培养上清,测定HCV核心蛋白,在检测下限或以下。
另一方面,通过脂转染法将pEF4C-p7JFH1导入保有复制子的细胞IH4.1。结果,可通过蛋白质印迹法在该培养上清中检测出HCV核心蛋白。因此,将导入了pEF4C-p7JFH1的保有复制子的细胞IH4.1培养4天,回收8ml培养液,以8,000g在4℃下离心60分钟,收集培养上清。接着,将该上清用SW20ロ一タ一(ベツクマン制造)以25,000rpm、4℃离心4小时,将颗粒悬浮于1ml缓冲液中。将样品倒入用SW41Eロ一タ一(ベツクマン制造)的管制备的10-60%蔗糖密度梯度中,以35,000转、4℃离心16小时。10-60%蔗糖密度梯度是将2ml 60%(重量/重量)蔗糖溶液(溶解于50mM Tris pH7.5/0.1M NaCl/1mM EDTA)、1ml 50%蔗糖溶液、1ml 40%蔗糖溶液、1ml 30%蔗糖溶液、1ml 20%蔗糖溶液、1ml10%蔗糖溶液倒入离心管中制备。
离心结束后,由管底各回收0.5ml组分。对各组分的密度、HCV核心蛋白浓度和RNA浓度进行定量。HCV核心蛋白的测定是使用Ortho HCV抗原IRMA测定仪进行(Aoyagi等.,J.Clin.Microbiol.,37(1999)1802-1808页)。HCV的复制子RNA的定量是按照Takeuchi(Takeuchi等人.,Gastroenterology 116(1999)页636-642)进行。如图5所示,在两次实验中,复制子RNA与核心蛋白的峰均位于组分8,两者是一致的。该组分的密度约1.17g/ml,与已经报道的HCV颗粒的密度一致。由此显示生成了病毒颗粒。
2)HCV结构蛋白表达重组痘苗病毒载体的导入
将保有复制子的细胞株5-15以2×106个接种于10cm的培养皿中,第二天将0.5pfu(噬斑形成单位)/细胞的DIsJFHst感染保有复制子的细胞株。用8ml的培养液持续培养。培养4天后回收培养液,以8,000g、4℃离心60分钟,收集培养上清。接着将该上清用SW20ロ一タ一(ベツクマン制造)以25,000rpm、4℃离心4小时,将8ml的细胞培养液的颗粒悬浮于1ml含有0.2%NP40的缓冲液和不含有缓冲液中。在4℃下温育20分钟,将样品倒入用SW41Eロ一タ一(ベツクマン制造)的管中制备的10-60%蔗糖密度梯度中,以35,000转、4℃离心16小时。10-60%蔗糖密度梯度是将2ml 60%(重量/重量)蔗糖溶液(溶解于50mM TrispH7.5/0.1M NaCl/1mM EDTA)、1ml 50%蔗糖溶液、1ml 40%蔗糖溶液、1ml 30%蔗糖溶液、1ml 20%蔗糖溶液、1ml 10%蔗糖溶液倒入离心管中制备。
离心结束后,由管底各回收0.5ml组分。对各组分的密度、HCV核心蛋白浓度进行定量。HCV核心蛋白的测定是使用Ortho HCV抗原IRMA测定仪进行(Aoyagi等.,J.Clin.Microbiol.,37(1999)1802-1808页)。
两次独立的实验结果如图6所示。在NP40未处理组(PBS处理)中,含有核心蛋白的颗粒密度为1.16g/ml(组分7);经NP40处理的组中,含有核心蛋白的颗粒密度为1.21g/ml(组分9)。这显示,含有脂肪、比重轻的表面膜通过NP40处理从病毒颗粒上剥离,形成未保持病毒样结构的核酸和只有核心蛋白的核心颗粒,比重变得较重。由此,本实验体系中可以生成完全的病毒颗粒。
使病毒载体DIsJ1St、DIsJ1(c)/JFH(E1-p7)st、或DIsJFH(c)/J1(E1-p7)st分别与上述同样地感染保有复制子的细胞株5-15。感染后将8ml培养了4天的上清通过超滤膜浓缩,通过上述蔗糖密度梯度离心法进行分组。对各组分的密度、HCV核心蛋白浓度进行定量。由HCV核心蛋白的密度分布图显示,感染了DIsJ1st、DIsJ1(c)/JFH(E1-p7)st、或DIsJFH(c)/J1(E1-p7)st的培养上清中含有所产生的病毒样颗粒。
(实施例4)
重组HCV样颗短的感染能力的确认
上述实施例中制备的重组HCV颗粒如图1所示,具有neo基因作为抗药性标志。因此,为了确认实施例3所得的颗粒是否具有感染能力,使该颗粒感染Huh7细胞,研究是否得到了G418(新霉素)抗性集落。
使DIsJFHst感染保有复制子的细胞株5-15,培养4天,将所得培养上清通过超滤膜(截至1×105Da)浓缩至30倍,感染Huh7细胞。感染后以1mg/ml将G418添加到培养皿中。然后每周更换2次培养液,同时继续培养。接种后培养21天后,用水晶紫对存活细胞进行染色,结果可确认形成了集落。
如果被感染细胞中没有检测出HCV结构蛋白,则在感染细胞中未生成子颗粒。因此,使本实验中形成的集落进行增殖,制备其细胞提取液。接着,通过SDS-PAGE和蛋白质印迹法对这些提取液中的蛋白质进行分析。分析时,含有核心基因的表达质粒DNA瞬时转染Huh7细胞,将所得的细胞提取液作为阳性对照。再将由未转染的Huh7细胞得到的细胞提取液作为阴性对照。将由各细胞克隆提取的试样进行SDS-PAGE,然后PVDF膜(Immobilon-P,Millipore制造)上进行印迹,使用抗核心特异性抗体(克隆2H9抗体)和识别这些抗体的HRP标记二次抗体,通过ECL(アマシヤムフアルマシア制备)分析在细胞内翻译的核心蛋白,结果,在被感染细胞中未能检测出核心蛋白。因此判断被感染细胞中未生产子病毒颗粒。这表明,按照本发明的方法制备的重组HCV样颗粒在感染了其它细胞后无法以颗粒的形式再生,因此,不具有对其它细胞更大地扩散感染的能力(传播力)。
产业实用性
根据本发明,可以提供将含有所需外源基因的HCV次基因组RNA进行包装得到的不具有传播性的重组感染性HCV样颗粒及其制备方法。上述重组感染性HCV样颗粒具有传播性差的优点,因此可用作哺乳动物、特别是人的肝脏或淋巴细胞系细胞或组织经由体内或来自体内的基因导入进行的基因治疗,或者作为制备转基因动物的病毒载体,还可用作弱毒化的疫苗。
序列表文本
SEQ ID NO.1-9的序列表示引物。
序列表
<110>Director General of National Institute of Infectious Diseases
Tokyo Metropolitan Organization for Medical Research
Toray Industries,Inc.
<120>新型重组人丙型肝炎病毒样颗粒及其生产方法
<130>PH-2921-PCT
<150>JP 2005-287825
<151>2005-09-30
<160>14
<170>PatentIn Ver.2.1
<210>1
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:引物
<220>
<223>Inventor:Tanabe,Jun-ichi;Sone,Saburo;Wakita,Takaji
Inventor:Ishii,Takashi;Suzuki,Ryosuke;Suzuki,Tetsurou
Inventor:Miyamura Tatsuo
<400>1
aaagatctgc gaaaggcctt gtggtactgc 30
<210>2
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:引物
<400>2
aagagctctc ataacccgac aagaacaacg ccgcc 35
<210>3
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:引物
<400>3
aagagctctc atagacctac aaaaaccccg cctcc 35
<210>4
<211>60
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:引物
<400>4
gtagctgcta ctggtattct tcacctgggc agcggaagct gggatggtca aacaggacag 60
<210>5
<211>60
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:引物
<400>5
ctgtcctgtt tgaccatccc agcttccgct gcccaggtga agaataccag tagcagctac 60
<210>6
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:引物
<400>6
aagagctctc aatcaatatc aacaaaccca cgcct 35
<210>7
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:引物
<400>7
aaagatctgc gaaaggcctt gtggtactgc 30
<210>8
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:引物
<400>8
ggtatatccc ggacacgttg cgcacttcat aagcagagac cggaacggtg atgcaggac 29
<210>9
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:引物
<400>9
gtcctgcatc accgttccgg tctctgctta tgaagtgcgc aacgtgtccg ggatatacc 29
<210>10
<211>9678
<212>DNA
<213>丙型肝炎病毒
<220>
<221>CDS
<222>(341)..(9442)
<400>10
acctgcccct aataggggcg acactccgcc atgaatcact cccctgtgag gaactactgt 60
cttcacgcag aaagcgccta gccatggcgt tagtatgagt gtcgtacagc ctccaggccc 120
ccccctcccg ggagagccat agtggtctgc ggaaccggtg agtacaccgg aattgccggg 180
aagactgggt cctttcttgg ataaacccac tctatgcccg gccatttggg cgtgcccccg 240
caagactgct agccgagtag cgttgggttg cgaaaggcct tgtggtactg cctgataggg 300
cgcttgcgag tgccccggga ggtctcgtag accgtgcacc atg agc aca aat cct 355
Met Ser Thr Asn Pro
1 5
aaa cct caa aga aaa acc aaa aga aac acc aac cgt cgc cca gaa gac 403
Lys Pro Gln Arg Lys Thr Lys Arg Asn Thr Asn Arg Arg Pro Glu Asp
10 15 20
gtt aag ttc ccg ggc ggc ggc cag atc gtt ggc gga gta tac ttg ttg 451
Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly Gly Val Tyr Leu Leu
25 30 35
ccg cgc agg ggc ccc agg ttg ggt gtg cgc acg aca agg aaa act tcg 499
Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Thr Thr Arg Lys Thr Ser
40 45 50
gag cgg tcc cag cca cgt ggg aga cgc cag ccc atc ccc aaa gat cgg 547
Glu Arg Ser Gln Pro Arg Gly Arg Arg Gln Pro Ile Pro Lys Asp Arg
55 60 65
cgc tcc act ggc aag gcc tgg gga aaa cca ggt cgc ccc tgg ccc cta 595
Arg Ser Thr Gly Lys Ala Trp Gly Lys Pro Gly Arg Pro Trp Pro Leu
70 75 80 85
tat ggg aat gag gga ctc ggc tgg gca gga tgg ctc ctg tcc ccc cga 643
Tyr Gly Asn Glu Gly Leu Gly Trp Ala Gly Trp Leu Leu Ser Pro Arg
90 95 100
ggc tct cgc ccc tcc tgg ggc ccc act gac ccc cgg cat agg tcg cgc 691
Gly Ser Arg Pro Ser Trp Gly Pro Thr Asp Pro Arg His Arg Ser Arg
105 110 115
aac gtg ggt aaa gtc atc gac acc cta acg tgt ggc ttt gcc gac ctc 739
Asn Val Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
120 125 130
atg ggg tac atc ccc gtc gta ggc gcc ccg ctt agt ggc gcc gcc aga 787
Met Gly Tyr Ile Pro Val Val Gly Ala Pro Leu Ser Gly Ala Ala Arg
135 140 145
gct gtc gcg cac ggc gtg aga gtc ctg gag gac ggg gtt aat tat gca 835
Ala Val Ala His Gly Val Arg Val Leu Glu Asp Gly Val Asn Tyr Ala
150 155 160 165
aca ggg aac cta ccc ggt ttc ccc ttt tct atc ttc ttg ctg gcc ctg 883
Thr Gly Asn Leu Pro Gly Phe Pro Phe Ser Ile Phe Leu Leu Ala Leu
170 175 180
ttg tcc tgc atc acc gtt ccg gtc tct gct gcc cag gtg aag aat acc 931
Leu Ser Cys Ile Thr Val Pro Val Ser Ala Ala Gln Val Lys Asn Thr
185 190 195
agt agc agc tac atg gtg acc aat gac tgc tcc aat gac agc atc act 979
Ser Ser Ser Tyr Met Val Thr Asn Asp Cys Ser Asn Asp Ser Ile Thr
200 205 210
tgg cag ctc gag gct gcg gtt ctc cac gtc ccc ggg tgc gtc ccg tgc 1027
Trp Gln Leu Glu Ala Ala Val Leu His Val Pro Gly Cys Val Pro Cys
215 220 225
gag aga gtg ggg aat acg tca cgg tgt tgg gtg cca gtc tcg cca aac 1075
Glu Arg Val Gly Asn Thr Ser Arg Cys Trp Val Pro Val Ser Pro Asn
230 235 240 245
atg gct gtg cgg cag ccc ggt gcc ctc acg cag ggt ctg cgg acg cac 1123
Met Ala Val Arg Gln Pro Gly Ala Leu Thr Gln Gly Leu Arg Thr His
250 255 260
atc gat atg gtt gtg atg tcc gcc acc ttc tgc tct gct ctc tac gtg 1171
Ile Asp Met Val Val Met Ser Ala Thr Phe Cys Ser Ala Leu Tyr Val
265 270 275
ggg gac ctc tgt ggc ggg gtg atg ctc gcg gcc cag gtg ttc atc gtc 1219
Gly Asp Leu Cys Gly Gly Val Met Leu Ala Ala Gln Val Phe Ile Val
280 285 290
tcg ccg cag tac cac tgg ttt gtg caa gaa tgc aat tgc tcc atc tac 1267
Ser Pro Gln Tyr His Trp Phe Val Gln Glu Cys Asn Cys Ser Ile Tyr
295 300 305
cct ggc acc atc act gga cac cgc atg gca tgg gac atg atg atg aac 1315
Pro Gly Thr Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
310 315 320 325
tgg tcg ccc acg gcc acc atg atc ctg gcg tac gtg atg cgc gtc ccc 1363
Trp Ser Pro Thr Ala Thr Met Ile Leu Ala Tyr Val Met Arg Val Pro
330 335 340
gag gtc atc ata gac atc gtt agc ggg gct cac tgg ggc gtc atg ttc 1411
Glu Val Ile Ile Asp Ile Val Ser Gly Ala His Trp Gly Val Met Phe
345 350 355
ggc ttg gcc tac ttc tct atg cag gga gcg tgg gcg aag gtc att gtc 1459
Gly Leu Ala Tyr Phe Ser Met Gln Gly Ala Trp Ala Lys Val Ile Val
360 365 370
atc ctt ctg ctg gcc gct ggg gtg gac gcg ggc acc acc acc gtt gga 1507
Ile Leu Leu Leu Ala Ala Gly Val Asp Ala Gly Thr Thr Thr Val Gly
375 380 385
ggc gct gtt gca cgt tcc acc aac gtg att gcc ggc gtg ttc agc cat 1555
Gly Ala Val Ala Arg Ser Thr Asn Val Ile Ala Gly Val Phe Ser His
390 395 400 405
ggc cct cag cag aac att cag ctc att aac acc aac ggc agt tgg cac 1603
Gly Pro Gln Gln Asn Ile Gln Leu Ile Asn Thr Asn Gly Ser Trp His
410 415 420
atc aac cgt act gcc ttg aat tgc aat gac tcc ttg aac acc ggc ttt 1651
Ile Asn Arg Thr Ala Leu Asn Cys Asn Asp Ser Leu Asn Thr Gly Phe
425 430 435
ctc gcg gcc ttg ttc tac acc aac cgc ttt aac tcg tca ggg tgt cca 1699
Leu Ala Ala Leu Phe Tyr Thr Asn Arg Phe Asn Ser Ser Gly Cys Pro
440 445 450
ggg cgc ctg tcc gcc tgc cgc aac atc gag gct ttc cgg ata ggg tgg 1747
Gly Arg Leu Ser Ala Cys Arg Asn Ile Glu Ala Phe Arg Ile Gly Trp
455 460 465
ggc acc cta cag tac gag gat aat gtc acc aat cca gag gat atg agg 1795
Gly Thr Leu Gln Tyr Glu Asp Asn Val Thr Asn Pro Glu Asp Met Arg
470 475 480 485
ccg tac tgc tgg cac tac ccc cca aag ccg tgt ggc gta gtc ccc gcg 1843
Pro Tyr Cys Trp His Tyr Pro Pro Lys Pro Cys Gly Val Val Pro Ala
490 495 500
agg tct gtg tgt ggc cca gtg tac tgt ttc acc ccc agc ccg gta gta 1891
Arg Ser Val Cys Gly Pro Val Tyr Cys Phe Thr Pro Ser Pro Val Val
505 510 515
gtg ggc acg acc gac aga cgt gga gtg ccc acc tac aca tgg gga gag 1939
Val Gly Thr Thr Asp Arg Arg Gly Val Pro Thr Tyr Thr Trp Gly Glu
520 525 530
aat gag aca gat gtc ttc cta ctg aac agc acc cga ccg ccg cag ggc 1987
Asn Glu Thr Asp Val Phe Leu Leu Asn Ser Thr Arg Pro Pro Gln Gly
535 540 545
tca tgg ttc ggc tgc acg tgg atg aac tcc act ggt ttc acc aag act 2035
Ser Trp Phe Gly Cys Thr Trp Met Asn Ser Thr Gly Phe Thr Lys Thr
550 555 560 565
tgt ggc gcg cca cct tgc cgc acc aga gct gac ttc aac gcc agc acg 2083
Cys Gly Ala Pro Pro Cys Arg Thr Arg Ala Asp Phe Asn Ala Ser Thr
570 575 580
gac ttg ttg tgc cct acg gat tgt ttt agg aag cat cct gat gcc act 2131
Asp Leu Leu Cys Pro Thr Asp Cys Phe Arg Lys His Pro Asp Ala Thr
585 590 595
tat att aag tgt ggt tct ggg ccc tgg ctc aca cca aag tgc ctg gtc 2179
Tyr Ile Lys Cys Gly Ser Gly Pro Trp Leu Thr Pro Lys Cys Leu Val
600 605 610
cac tac cct tac aga ctc tgg cat tac ccc tgc aca gtc aat ttt acc 2227
His Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Val Asn Phe Thr
615 620 625
atc ttc aag ata aga atg tat gta ggg ggg gtt gag cac agg ctc acg 2275
Ile Phe Lys Ile Arg Met Tyr Val Gly Gly Val Glu His Arg Leu Thr
630 635 640 645
gcc gca tgc aac ttc act cgt ggg gat cgc tgc gac ttg gag gac agg 2323
Ala Ala Cys Asn Phe Thr Arg Gly Asp Arg Cys Asp Leu Glu Asp Arg
650 655 660
gac agg agt cag ctg tct cct ctg ttg cac tct acc acg gaa tgg gcc 2371
Asp Arg Ser Gln Leu Ser Pro Leu Leu His Ser Thr Thr Glu Trp Ala
665 670 675
atc ctg ccc tgc acc tac tca gac tta ccc gct ttg tca act ggt ctt 2419
Ile Leu Pro Cys Thr Tyr Ser Asp Leu Pro Ala Leu Ser Thr Gly Leu
680 685 690
ctc cac ctt cac cag aac atc gtg gac gta caa tac atg tat ggc ctc 2467
Leu His Leu His Gln Asn Ile Val Asp Val Gln Tyr Met Tyr Gly Leu
695 700 705
tca cct gct atc aca aaa tac gtc gtt cga tgg gag tgg gtg gta ctc 2515
Ser Pro Ala Ile Thr Lys Tyr Val Val Arg Trp Glu Trp Val Val Leu
710 715 720 725
tta ttc ctg ctc tta gcg gac gcc aga gtc tgc gcc tgc ttg tgg atg 2563
Leu Phe Leu Leu Leu Ala Asp Ala Arg Val Cys Ala Cys Leu Trp Met
730 735 740
ctc atc ttg ttg ggc cag gcc gaa gca gca ttg gag aag ttg gtc gtc 2611
Leu Ile Leu Leu Gly Gln Ala Glu Ala Ala Leu Glu Lys Leu Val Val
745 750 755
ttg cac gct gcg agt gcg gct aac tgc cat ggc ctc cta tat ttt gcc 2659
Leu His Ala Ala Ser Ala Ala Asn Cys His Gly Leu Leu Tyr Phe Ala
760 765 770
atc ttc ttc gtg gca gct tgg cac atc agg ggt cgg gtg gtc ccc ttg 2707
Ile Phe Phe Val Ala Ala Trp His Ile Arg Gly Arg Val Val Pro Leu
775 780 785
acc acc tat tgc ctc act ggc cta tgg ccc ttc tgc cta ctg ctc atg 2755
Thr Thr Tyr Cys Leu Thr Gly Leu Trp Pro Phe Cys Leu Leu Leu Met
790 795 800 805
gca ctg ccc cgg cag gct tat gcc tat gac gca cct gtg cac gga cag 2803
Ala Leu Pro Arg Gln Ala Tyr Ala Tyr Asp Ala Pro Val His Gly Gln
810 815 820
ata ggc gtg ggt ttg ttg ata ttg atc acc ctc ttc aca ctc acc ccg 2851
Ile Gly Val Gly Leu Leu Ile Leu Ile Thr Leu Phe Thr Leu Thr Pro
825 830 835
ggg tat aag acc ctc ctc ggc cag tgt ctg tgg tgg ttg tgc tat ctc 2899
Gly Tyr Lys Thr Leu Leu Gly Gln Cys Leu Trp Trp Leu Cys Tyr Leu
840 845 850
ctg acc ctg ggg gaa gcc atg att cag gag tgg gta cca ccc atg cag 2947
Leu Thr Leu Gly Glu Ala Met Ile Gln Glu Trp Val Pro Pro Met Gln
855 860 865
gtg cgc ggc ggc cgc gat ggc atc gcg tgg gcc gtc act ata ttc tgc 2995
Val Arg Gly Gly Arg Asp Gly Ile Ala Trp Ala Val Thr Ile Phe Cys
870 875 880 885
ccg ggt gtg gtg ttt gac att acc aaa tgg ctt ttg gcg ttg ctt ggg 3043
Pro Gly Val Val Phe Asp Ile Thr Lys Trp Leu Leu Ala Leu Leu Gly
890 895 900
cct gct tac ctc tta agg gcc gct ttg aca cat gtg ccg tac ttc gtc 3091
Pro Ala Tyr Leu Leu Arg Ala Ala Leu Thr His Val Pro Tyr Phe Val
905 910 915
aga gct cac gct ctg ata agg gta tgc gct ttg gtg aag cag ctc gcg 3139
Arg Ala His Ala Leu Ile Arg Val Cys Ala Leu Val Lys Gln Leu Ala
920 925 930
ggg ggt agg tat gtt cag gtg gcg cta ttg gcc ctt ggc agg tgg act 3187
Gly Gly Arg Tyr Val Gln Val Ala Leu Leu Ala Leu Gly Arg Trp Thr
935 940 945
ggc acc tac atc tat gac cac ctc aca cct atg tcg gac tgg gcc gct 3235
Gly Thr Tyr Ile Tyr Asp His Leu Thr Pro Met Ser Asp Trp Ala Ala
950 955 960 965
agc ggc ctg cgc gac tta gcg gtc gcc gtg gaa ccc atc atc ttc agt 3283
Ser Gly Leu Arg Asp Leu Ala Val Ala Val Glu Pro Ile Ile Phe Ser
970 975 980
ccg atg gag aag aag gtc atc gtc tgg gga gcg gag acg gct gca tgt 3331
Pro Met Glu Lys Lys Val Ile Val Trp Gly Ala Glu Thr Ala Ala Cys
985 990 995
ggg gac att cta cat gga ctt ccc gtg tcc gcc cga ctc ggc cag gag 3379
Gly Asp Ile Leu His Gly Leu Pro Val Ser Ala Arg Leu Gly Gln Glu
1000 1005 1010
atc ctc ctc ggc cca gct gat ggc tac acc tcc aag ggg tgg aag ctc 3427
Ile Leu Leu Gly Pro Ala Asp Gly Tyr Thr Ser Lys Gly Trp Lys Leu
1015 1020 1025
ctt gct ccc atc act gct tat gcc cag caa aca cga ggc ctc ctg ggc 3475
Leu Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly
1030 1035 1040 1045
gcc ata gtg gtg agt atg acg ggg cgt gac agg aca gaa cag gcc ggg 3523
Ala Ile Val Val Ser Met Thr Gly Arg Asp Arg Thr Glu Gln Ala Gly
1050 1055 1060
gaa gtc caa atc ctg tcc aca gtc tct cag tcc ttc ctc gga aca acc 3571
Glu Val Gln Ile Leu Ser Thr Val Ser Gln Ser Phe Leu Gly Thr Thr
1065 1070 1075
atc tcg ggg gtt ttg tgg act gtt tac cac gga gct ggc aac aag act 3619
Ile Ser Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Asn Lys Thr
1080 1085 1090
cta gcc ggc tta cgg ggt ccg gtc acg cag atg tac tcg agt gct gag 3667
Leu Ala Gly Leu Arg Gly Pro Val Thr Gln Met Tyr Ser Ser Ala Glu
1095 1100 1105
ggg gac ttg gta ggc tgg ccc agc ccc cct ggg acc aag tct ttg gag 3715
Gly Asp Leu Val Gly Trp Pro Ser Pro Pro Gly Thr Lys Ser Leu Glu
1110 1115 1120 1125
ccg tgc aag tgt gga gcc gtc gac cta tat ctg gtc acg cgg aac gct 3763
Pro Cys Lys Cys Gly Ala Val Asp Leu Tyr Leu Val Thr Arg Asn Ala
1130 1135 1140
gat gtc atc ccg gct cgg aga cgc ggg gac aag cgg gga gca ttg ctc 3811
Asp Val Ile Pro Ala Arg Arg Arg Gly Asp Lys Arg Gly Ala Leu Leu
1145 1150 1155
tcc ccg aga ccc att tcg acc ttg aag ggg tcc tcg ggg ggg ccg gtg 3859
Ser Pro Arg Pro Ile Ser Thr Leu Lys Gly Ser Ser Gly Gly Pro Val
1160 1165 1170
ctc tgc cct agg ggc cac gtc gtt ggg ctc ttc cga gca gct gtg tgc 3907
Leu Cys Pro Arg Gly His Val Val Gly Leu Phe Arg Ala Ala Val Cys
1175 1180 1185
tct cgg ggc gtg gcc aaa tcc atc gat ttc atc ccc gtt gag aca ctc 3955
Ser Arg Gly Val Ala Lys Ser Ile Asp Phe Ile Pro Val Glu Thr Leu
1190 1195 1200 1205
gac gtt gtt aca agg tct ccc act ttc agt gac aac agc acg cca ccg 4003
Asp Val Val Thr Arg Ser Pro Thr Phe Ser Asp Asn Ser Thr Pro Pro
1210 1215 1220
gct gtg ccc cag acc tat cag gtc ggg tac ttg cat gct cca act ggc 4051
Ala Val Pro Gln Thr Tyr Gln Val Gly Tyr Leu His Ala Pro Thr Gly
1225 1230 1235
agt gga aag agc acc aag gtc cct gtc gcg tat gcc gcc cag ggg tac 4099
Ser Gly Lys Ser Thr Lys Val Pro Val Ala Tyr Ala Ala Gln Gly Tyr
1240 1245 1250
aaa gta cta gtg ctt aac ccc tcg gta gct gcc acc ctg ggg ttt ggg 4147
Lys Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly
1255 1260 1265
gcg tac cta tcc aag gca cat ggc atc aat ccc aac att agg act gga 4195
Ala Tyr Leu Ser Lys Ala His Gly Ile Asn Pro Asn Ile Arg Thr Gly
1270 1275 1280 1285
gtc agg acc gtg atg acc ggg gag gcc atc acg tac tcc aca tat ggc 4243
Val Arg Thr Val Met Thr Gly Glu Ala Ile Thr Tyr Ser Thr Tyr Gly
1290 1295 1300
aaa ttt ctc gcc gat ggg ggc tgc gct agc ggc gcc tat gac atc atc 4291
Lys Phe Leu Ala Asp Gly Gly Cys Ala Ser Gly Ala Tyr Asp Ile Ile
1305 1310 1315
ata tgc gat gaa tgc cac gct gtg gat gct acc tcc att ctc ggc atc 4339
Ile Cys Asp Glu Cys His Ala Val Asp Ala Thr Ser Ile Leu Gly Ile
1320 1325 1330
gga acg gtc ctt gat caa gca gag aca gcc ggg gtc aga cta act gtg 4387
Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Val Arg Leu Thr Val
1335 1340 1345
ctg gct acg gcc aca ccc ccc ggg tca gtg aca acc ccc cat ccc gat 4435
Leu Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Thr Pro His Pro Asp
1350 1355 1360 1365
ata gaa gag gta ggc ctc ggg cgg gag ggt gag atc ccc ttc tat ggg 4483
Ile Glu Glu Val Gly Leu Gly Arg Glu Gly Glu Ile Pro Phe Tyr Gly
1370 1375 1380
agg gcg att ccc cta tcc tgc atc aag gga ggg aga cac ctg att ttc 4531
Arg Ala Ile Pro Leu Ser Cys Ile Lys Gly Gly Arg His Leu Ile Phe
1385 1390 1395
tgc cac tca aag aaa aag tgt gac gag ctc gcg gcg gcc ctt cgg ggc 4579
Cys His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Ala Leu Arg Gly
1400 1405 1410
atg ggc ttg aat gcc gtg gca tac tat aga ggg ttg gac gtc tcc ata 4627
Met Gly Leu Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Ile
1415 1420 1425
ata cca gct cag gga gat gtg gtg gtc gtc gcc acc gac gcc ctc atg 4675
Ile Pro Ala Gln Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met
1430 1435 1440 1445
acg ggg tac act gga gac ttt gac tcc gtg atc gac tgc aat gta gcg 4723
Thr Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Val Ala
1450 1455 1460
gtc acc caa gct gtc gac ttc agc ctg gac ccc acc ttc act ata acc 4771
Val Thr Gln Ala Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Thr
1465 1470 1475
aca cag act gtc cca caa gac gct gtc tca cgc agt cag cgc cgc ggg 4819
Thr Gln Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly
1480 1485 1490
cgc aca ggt aga gga aga cag ggc act tat agg tat gtt tcc act ggt 4867
Arg Thr Gly Arg Gly Arg Gln Gly Thr Tyr Arg Tyr Val Ser Thr Gly
1495 1500 1505
gaa cga gcc tca gga atg ttt gac agt gta gtg ctt tgt gag tgc tac 4915
Glu Arg Ala Ser Gly Met Phe Asp Ser Val Val Leu Cys Glu Cys Tyr
1510 1515 1520 1525
gac gca ggg gct gcg tgg tac gat ctc aca cca gcg gag acc acc gtc 4963
Asp Ala Gly Ala Ala Trp Tyr Asp Leu Thr Pro Ala Glu Thr Thr Val
1530 1535 1540
agg ctt aga gcg tat ttc aac acg ccc ggc cta ccc gtg tgt caa gac 5011
Arg Leu Arg Ala Tyr Phe Asn Thr Pro Gly Leu Pro Val Cys Gln Asp
1545 1550 1555
cat ctt gaa ttt tgg gag gca gtt ttc acc ggc ctc aca cac ata gac 5059
His Leu Glu Phe Trp Glu Ala Val Phe Thr Gly Leu Thr His Ile Asp
1560 1565 1570
gcc cac ttc ctc tcc caa aca aag caa gcg ggg gag aac ttc gcg tac 5107
Ala His Phe Leu Ser Gln Thr Lys Gln Ala Gly Glu Asn Phe Ala Tyr
1575 1580 1585
cta gta gcc tac caa gct acg gtg tgc gcc aga gcc aag gcc cct ccc 5155
Leu Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Lys Ala Pro Pro
1590 1595 1600 1605
ccg tcc tgg gac gcc atg tgg aag tgc ctg gcc cga ctc aag cct acg 5203
Pro Ser Trp Asp Ala Met Trp Lys Cys Leu Ala Arg Leu Lys Pro Thr
1610 1615 1620
ctt gcg ggc ccc aca cct ctc ctg tac cgt ttg ggc cct att acc aat 5251
Leu Ala Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Pro Ile Thr Asn
1625 1630 1635
gag gtc acc ctc aca cac cct ggg acg aag tac atc gcc aca tgc atg 5299
Glu Val Thr Leu Thr His Pro Gly Thr Lys Tyr Ile Ala Thr Cys Met
1640 1645 1650
caa gct gac ctt gag gtc atg acc agc acg tgg gtc cta gct gga gga 5347
Gln Ala Asp Leu Glu Val Met Thr Ser Thr Trp Val Leu Ala Gly Gly
1655 1660 1665
gtc ctg gca gcc gtc gcc gca tat tgc ctg gcg act gga tgc gtt tcc 5395
Val Leu Ala Ala Val Ala Ala Tyr Cys Leu Ala Thr Gly Cys Val Ser
1670 1675 1680 1685
atc atc ggc cgc ttg cac gtc aac cag cga gtc gtc gtt gcg ccg gat 5443
Ile Ile Gly Arg Leu His Val Asn Gln Arg Val Val Val Ala Pro Asp
1690 1695 1700
aag gag gtc ctg tat gag gct ttt gat gag atg gag gaa tgc gcc tct 5491
Lys Glu Val Leu Tyr Glu Ala Phe Asp Glu Met Glu Glu Cys Ala Ser
1705 1710 1715
agg gcg gct ctc atc gaa gag ggg cag cgg ata gcc gag atg ttg aag 5539
Arg Ala Ala Leu Ile Glu Glu Gly Gln Arg Ile Ala Glu Met Leu Lys
1720 1725 1730
tcc aag atc caa ggc ttg ctg cag cag gcc tct aag cag gcc cag gac 5587
Ser Lys Ile Gln Gly Leu Leu Gln Gln Ala Ser Lys Gln Ala Gln Asp
1735 1740 1745
ata caa ccc gct atg cag gct tca tgg ccc aaa gtg gaa caa ttt tgg 5635
Ile Gln Pro Ala Met Gln Ala Ser Trp Pro Lys Val Glu Gln Phe Trp
1750 1755 1760 1765
gcc aga cac atg tgg aac ttc att agc ggc atc caa tac ctc gca gga 5683
Ala Arg His Met Trp Asn Phe Ile Ser Gly Ile Gln Tyr Leu Ala Gly
1770 1775 1780
ttg tca aca ctg cca ggg aac ccc gcg gtg gct tcc atg atg gca ttc 5731
Leu Ser Thr Leu Pro Gly Asn Pro Ala Val Ala Ser Met Met Ala Phe
1785 1790 1795
agt gcc gcc ctc acc agt ccg ttg tcg acc agt acc acc atc ctt ctc 5779
Ser Ala Ala Leu Thr Ser Pro Leu Ser Thr Ser Thr Thr Ile Leu Leu
1800 1805 1810
aac atc atg gga ggc tgg tta gcg tcc cag atc gca cca ccc gcg ggg 5827
Asn Ile Met Gly Gly Trp Leu Ala Ser Gln Ile Ala Pro Pro Ala Gly
1815 1820 1825
gcc acc ggc ttt gtc gtc agt ggc ctg gtg ggg gct gcc gtg ggc agc 5875
Ala Thr Gly Phe Val Val Ser Gly Leu Val Gly Ala Ala Val Gly Ser
1830 1835 1840 1845
ata ggc ctg ggt aag gtg ctg gtg gac atc ctg gca gga tat ggt gcg 5923
Ile Gly Leu Gly Lys Val Leu Val Asp Ile Leu Ala Gly Tyr Gly Ala
1850 1855 1860
ggc att tcg ggg gcc ctc gtc gca ttc aag atc atg tct ggc gag aag 5971
Gly Ile Ser Gly Ala Leu Val Ala Phe Lys Ile Met Ser Gly Glu Lys
1865 1870 1875
ccc tct atg gaa gat gtc atc aat cta ctg cct ggg atc ctg tct ccg 6019
Pro Ser Met Glu Asp Val Ile Asn Leu Leu Pro Gly Ile Leu Ser Pro
1880 1885 1890
gga gcc ctg gtg gtg ggg gtc atc tgc gcg gcc att ctg cgc cgc cac 6067
Gly Ala Leu Val Val Gly Val Ile Cys Ala Ala Ile Leu Arg Arg His
1895 1900 1905
gtg gga ccg ggg gag ggc gcg gtc caa tgg atg aac agg ctt att gcc 6115
Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu Ile Ala
1910 1915 1920 1925
ttt gct tcc aga gga aac cac gtc gcc cct act cac tac gtg acg gag 6163
Phe Ala Ser Arg Gly Asn His Val Ala Pro Thr His Tyr Val Thr Glu
1930 1935 1940
tcg gat gcg tcg cag cgt gtg acc caa cta ctt ggc tct ctt act ata 6211
Ser Asp Ala Ser Gln Arg Val Thr Gln Leu Leu Gly Ser Leu Thr Ile
1945 1950 1955
acc agc cta ctc aga aga ctc cac aat tgg ata act gag gac tgc ccc 6259
Thr Ser Leu Leu Arg Arg Leu His Asn Trp Ile Thr Glu Asp Cys Pro
1960 1965 1970
atc cca tgc tcc gga tcc tgg ctc cgc gac gtg tgg gac tgg gtt tgc 6307
Ile Pro Cys Ser Gly Ser Trp Leu Arg Asp Val Trp Asp Trp Val Cys
1975 1980 1985
acc atc ttg aca gac ttc aaa aat tgg ctg acc tct aaa ttg ttc ccc 6355
Thr Ile Leu Thr Asp Phe Lys Asn Trp Leu Thr Ser Lys Leu Phe Pro
1990 1995 2000 2005
aag ctg ccc ggc ctc ccc ttc atc tct tgt caa aag ggg tac aag ggt 6403
Lys Leu Pro Gly Leu Pro Phe Ile Ser Cys Gln Lys Gly Tyr Lys Gly
2010 2015 2020
gtg tgg gcc ggc act ggc atc atg acc acg cgc tgc cct tgc ggc gcc 6451
Val Trp Ala Gly Thr Gly Ile Met Thr Thr Arg Cys Pro Cys Gly Ala
2025 2030 2035
aac atc tct ggc aat gtc cgc ctg ggc tct atg agg atc aca ggg cct 6499
Asn Ile Ser Gly Asn Val Arg Leu Gly Ser Met Arg Ile Thr Gly Pro
2040 2045 2050
aaa acc tgc atg aac acc tgg cag ggg acc ttt cct atc aat tgc tac 6547
Lys Thr Cys Met Asn Thr Trp Gln Gly Thr Phe Pro Ile Asn Cys Tyr
2055 2060 2065
acg gag ggc cag tgc gcg ccg aaa ccc ccc acg aac tac aag acc gcc 6595
Thr Glu Gly Gln Cys Ala Pro Lys Pro Pro Thr Asn Tyr Lys Thr Ala
2070 2075 2080 2085
atc tgg agg gtg gcg gcc tcg gag tac gcg gag gtg acg cag cat ggg 6643
Ile Trp Arg Val Ala Ala Ser Glu Tyr Ala Glu Val Thr Gln His Gly
2090 2095 2100
tcg tac tcc tat gta aca gga ctg acc act gac aat ctg aaa att cct 6691
Ser Tyr Ser Tyr Val Thr Gly Leu Thr Thr Asp Asn Leu Lys Ile Pro
2105 2110 2115
tgc caa cta cct tct cca gag ttt ttc tcc tgg gtg gac ggt gtg cag 6739
Cys Gln Leu Pro Ser Pro Glu Phe Phe Ser Trp Val Asp Gly Val Gln
2120 2125 2130
atc cat agg ttt gca ccc aca cca aag ccg ttt ttc cgg gat gag gtc 6787
Ile His Arg Phe Ala Pro Thr Pro Lys Pro Phe Phe Arg Asp Glu Val
2135 2140 2145
tcg ttc tgc gtt ggg ctt aat tcc tat gct gtc ggg tcc cag ctt ccc 6835
Ser Phe Cys Val Gly Leu Asn Ser Tyr Ala Val Gly Ser Gln Leu Pro
2150 2155 2160 2165
tgt gaa cct gag ccc gac gca gac gta ttg agg tcc atg cta aca gat 6883
Cys Glu Pro Glu Pro Asp Ala Asp Val Leu Arg Ser Met Leu Thr Asp
2170 2175 2180
ccg ccc cac atc acg gcg gag act gcg gcg cgg cgc ttg gca cgg gga 6931
Pro Pro His Ile Thr Ala Glu Thr Ala Ala Arg Arg Leu Ala Arg Gly
2185 2190 2195
tca cct cca tct gag gcg agc tcc tca gtg agc cag cta tca gca ccg 6979
Ser Pro Pro Ser Glu Ala Ser Ser Ser Val Ser Gln Leu Ser Ala Pro
2200 2205 2210
tcg ctg cgg gcc acc tgc acc acc cac agc aac acc tat gac gtg gac 7027
Ser Leu Arg Ala Thr Cys Thr Thr His Ser Asn Thr Tyr Asp Val Asp
2215 2220 2225
atg gtc gat gcc aac ctg ctc atg gag ggc ggt gtg gct cag aca gag 7075
Met Val Asp Ala Asn Leu Leu Met Glu Gly Gly Val Ala Gln Thr Glu
2230 2235 2240 2245
cct gag tcc agg gtg ccc gtt ctg gac ttt ctc gag cca atg gcc gag 7123
Pro Glu Ser Arg Val Pro Val Leu Asp Phe Leu Glu Pro Met Ala Glu
2250 2255 2260
gaa gag agc gac ctt gag ccc tca ata cca tcg gag tgc atg ctc ccc 7171
Glu Glu Ser Asp Leu Glu Pro Ser Ile Pro Ser Glu Cys Met Leu Pro
2265 2270 2275
agg agc ggg ttt cca cgg gcc tta ccg gct tgg gca cgg cct gac tac 7219
Arg Ser Gly Phe Pro Arg Ala Leu Pro Ala Trp Ala Arg Pro Asp Tyr
2280 2285 2290
aac ccg ccg ctc gtg gaa tcg tgg agg agg cca gat tac caa ccg ccc 7267
Asn Pro Pro Leu Val Glu Ser Trp Arg Arg Pro Asp Tyr Gln Pro Pro
2295 2300 2305
acc gtt gct ggt tgt gct ctc ccc ccc ccc aag aag gcc ccg acg cct 7315
Thr Val Ala Gly Cys Ala Leu Pro Pro Pro Lys Lys Ala Pro Thr Pro
2310 2315 2320 2325
ccc cca agg aga cgc cgg aca gtg ggt ctg agc gag agc acc ata tca 7363
Pro Pro Arg Arg Arg Arg Thr Val Gly Leu Ser Glu Ser Thr Ile Ser
2330 2335 2340
gaa gcc ctc cag caa ctg gcc atc aag acc ttt ggc cag ccc ccc tcg 7411
Glu Ala Leu Gln Gln Leu Ala Ile Lys Thr Phe Gly Gln Pro Pro Ser
2345 2350 2355
agc ggt gat gca ggc tcg tcc acg ggg gcg ggc gcc gcc gaa tcc ggc 7459
Ser Gly Asp Ala Gly Ser Ser Thr Gly Ala Gly Ala Ala Glu Ser Gly
2360 2365 2370
ggt ccg acg tcc cct ggt gag ccg gcc ccc tca gag aca ggt tcc gcc 7507
Gly Pro Thr Ser Pro Gly Glu Pro Ala Pro Ser Glu Thr Gly Ser Ala
2375 2380 2385
tcc tct atg ccc ccc ctc gag ggg gag cct gga gat ccg gac ctg gag 7555
Ser Ser Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp Leu Glu
2390 2395 2400 2405
tct gat cag gta gag ctt caa cct ccc ccc cag ggg ggg ggg gta gct 7603
Ser Asp Gln Val Glu Leu Gln Pro Pro Pro Gln Gly Gly Gly Val Ala
2410 2415 2420
ccc ggt tcg ggc tcg ggg tct tgg tct act tgc tcc gag gag gac gat 7651
Pro Gly Ser Gly Ser Gly Ser Trp Ser Thr Cys Ser Glu Glu Asp Asp
2425 2430 2435
acc acc gtg tgc tgc tcc atg tca tac tcc tgg acc ggg gct cta ata 7699
Thr Thr Val Cys Cys Ser Met Ser Tyr Ser Trp Thr Gly Ala Leu Ile
2440 2445 2450
act ccc tgt agc ccc gaa gag gaa aag ttg cca atc aac cct ttg agt 7747
Thr Pro Cys Ser Pro Glu Glu Glu Lys Leu Pro Ile Asn Pro Leu Ser
2455 2460 2465
aac tcg ctg ttg cga tac cat aac aag gtg tac tgt aca aca tca aag 7795
Asn Ser Leu Leu Arg Tyr His Asn Lys Val Tyr Cys Thr Thr Ser Lys
2470 2475 2480 2485
agc gcc tca cag agg gct aaa aag gta act ttt gac agg acg caa gtg 7843
Ser Ala Ser Gln Arg Ala Lys Lys Val Thr Phe Asp Arg Thr Gln Val
2490 2495 2500
ctc gac gcc cat tat gac tca gtc tta aag gac atc aag cta gcg gct 7891
Leu Asp Ala His Tyr Asp Ser Val Leu Lys Asp Ile Lys Leu Ala Ala
2505 2510 2515
tcc aag gtc agc gca agg ctc ctc acc ttg gag gag gcg tgc cag ttg 7939
Ser Lys Val Ser Ala Arg Leu Leu Thr Leu Glu Glu Ala Cys Gln Leu
2520 2525 2530
act cca ccc cat tct gca aga tcc aag tat gga ttc ggg gcc aag gag 7987
Thr Pro Pro His Ser Ala Arg Ser Lys Tyr Gly Phe Gly Ala Lys Glu
2535 2540 2545
gtc cgc agc ttg tcc ggg agg gcc gtt aac cac atc aag tcc gtg tgg 8035
Val Arg Ser Leu Ser Gly Arg Ala Val Asn His Ile Lys Ser Val Trp
2550 2555 2560 2565
aag gac ctc ctg gaa gac cca caa aca cca att ccc aca acc atc atg 8083
Lys Asp Leu Leu Glu Asp Pro Gln Thr Pro Ile Pro Thr Thr Ile Met
2570 2575 2580
gcc aaa aat gag gtg ttc tgc gtg gac ccc gcc aag ggg ggt aag aaa 8131
Ala Lys Asn Glu Val Phe Cys Val Asp Pro Ala Lys Gly Gly Lys Lys
2585 2590 2595
cca gct cgc ctc atc gtt tac cct gac ctc ggc gtc cgg gtc tgc gag 8179
Pro Ala Arg Leu Ile Val Tyr Pro Asp Leu Gly Val Arg Val Cys Glu
2600 2605 2610
aaa atg gcc ctc tat gac att aca caa aag ctt cct cag gcg gta atg 8227
Lys Met Ala Leu Tyr Asp Ile Thr Gln Lys Leu Pro Gln Ala Val Met
2615 2620 2625
gga gct tcc tat ggc ttc cag tac tcc cct gcc caa cgg gtg gag tat 8275
Gly Ala Ser Tyr Gly Phe Gln Tyr Ser Pro Ala Gln Arg Val Glu Tyr
2630 2635 2640 2645
ctc ttg aaa gca tgg gcg gaa aag aag gac ccc atg ggt ttt tcg tat 8323
Leu Leu Lys Ala Trp Ala Glu Lys Lys Asp Pro Met Gly Phe Ser Tyr
2650 2655 2660
gat acc cga tgc ttc gac tca acc gtc act gag aga gac atc agg acc 8371
Asp Thr Arg Cys Phe Asp Ser Thr Val Thr Glu Arg Asp Ile Arg Thr
2665 2670 2675
gag gag tcc ata tac cag gcc tgc tcc ctg ccc gag gag gcc cgc act 8419
Glu Glu Ser Ile Tyr Gln Ala Cys Ser Leu Pro Glu Glu Ala Arg Thr
2680 2685 2690
gcc ata cac tcg ctg act gag aga ctt tac gta gga ggg ccc atg ttc 8467
Ala Ile His Ser Leu Thr Glu Arg Leu Tyr Val Gly Gly Pro Met Phe
2695 2700 2705
aac agc aag ggt caa acc tgc ggt tac aga cgt tgc cgc gcc agc ggg 8515
Asn Ser Lys Gly Gln Thr Cys Gly Tyr Arg Arg Cys Arg Ala Ser Gly
2710 2715 2720 2725
gtg cta acc act agc atg ggt aac acc atc aca tgc tat gtg aaa gcc 8563
Val Leu Thr Thr Ser Met Gly Asn Thr Ile Thr Cys Tyr Val Lys Ala
2730 2735 2740
cta gcg gcc tgc aag gct gcg ggg ata gtt gcg ccc aca atg ctg gta 8611
Leu Ala Ala Cys Lys Ala Ala Gly Ile Val Ala Pro Thr Met Leu Val
2745 2750 2755
tgc ggc gat gac cta gta gtc atc tca gaa agc cag ggg act gag gag 8659
Cys Gly Asp Asp Leu Val Val Ile Ser Glu Ser Gln Gly Thr Glu Glu
2760 2765 2770
gac gag cgg aac ctg aga gcc ttc acg gag gcc atg acc agg tac tct 8707
Asp Glu Arg Asn Leu Arg Ala Phe Thr Glu Ala Met Thr Arg Tyr Ser
2775 2780 2785
gcc cct cct ggt gat ccc ccc aga ccg gaa tat gac ctg gag cta ata 8755
Ala Pro Pro Gly Asp Pro Pro Arg Pro Glu Tyr Asp Leu Glu Leu Ile
2790 2795 2800 2805
aca tcc tgt tcc tca aat gtg tct gtg gcg ttg ggc ccg cgg ggc cgc 8803
Thr Ser Cys Ser Ser Asn Val Ser Val Ala Leu Gly Pro Arg Gly Arg
2810 2815 2820
cgc aga tac tac ctg acc aga gac cca acc act cca ctc gcc cgg gct 8851
Arg Arg Tyr Tyr Leu Thr Arg Asp Pro Thr Thr Pro Leu Ala Arg Ala
2825 2830 2835
gcc tgg gaa aca gtt aga cac tcc cct atc aat tca tgg ctg gga aac 8899
Ala Trp Glu Thr Val Arg His Ser Pro Ile Asn Ser Trp Leu Gly Asn
2840 2845 2850
atc atc cag tat gct cca acc ata tgg gtt cgc atg gtc cta atg aca 8947
Ile Ile Gln Tyr Ala Pro Thr Ile Trp Val Arg Met Val Leu Met Thr
2855 2860 2865
cac ttc ttc tcc att ctc atg gtc caa gac acc ctg gac cag aac ctc 8995
His Phe Phe Ser Ile Leu Met Val Gln Asp Thr Leu Asp Gln Asn Leu
2870 2875 2880 2885
aac ttt gag atg tat gga tca gta tac tcc gtg aat cct ttg gac ctt 9043
Asn Phe Glu Met Tyr Gly Ser Val Tyr Ser Val Asn Pro Leu Asp Leu
2890 2895 2900
cca gcc ata att gag agg tta cac ggg ctt gac gcc ttt tct atg cac 9091
Pro Ala Ile Ile Glu Arg Leu His Gly Leu Asp Ala Phe Ser Met His
2905 2910 2915
aca tac tct cac cac gaa ctg acg cgg gtg gct tca gcc ctc aga aaa 9139
Thr Tyr Ser His His Glu Leu Thr Arg Val Ala Ser Ala Leu Arg Lys
2920 2925 2930
ctt ggg gcg cca ccc ctc agg gtg tgg aag agt cgg gct cgc gca gtc 9187
Leu Gly Ala Pro Pro Leu Arg Val Trp Lys Ser Arg Ala Arg Ala Val
2935 2940 2945
agg gcg tcc ctc atc tcc cgt gga ggg aaa gcg gcc gtt tgc ggc cga 9235
Arg Ala Ser Leu Ile Ser Arg Gly Gly Lys Ala Ala Val Cys Gly Arg
2950 2955 2960 2965
tat ctc ttc aat tgg gcg gtg aag acc aag ctc aaa ctc act cca ttg 9283
Tyr Leu Phe Asn Trp Ala Val Lys Thr Lys Leu Lys Leu Thr Pro Leu
2970 2975 2980
ccg gag gcg cgc cta ctg gac tta tcc agt tgg ttc acc gtc ggc gcc 9331
Pro Glu Ala Arg Leu Leu Asp Leu Ser Ser Trp Phe Thr Val Gly Ala
2985 2990 2995
ggc ggg ggc gac att ttt cac agc gtg tcg cgc gcc cga ccc cgc tca 9379
Gly Gly Gly Asp Ile Phe His Ser Val Ser Arg Ala Arg Pro Arg Ser
3000 3005 3010
tta ctc ttc ggc cta ctc cta ctt ttc gta ggg gta ggc ctc ttc cta 9427
Leu Leu Phe Gly Leu Leu Leu Leu Phe Val Gly Val Gly Leu Phe Leu
3015 3020 3025
ctc ccc gct cgg tag agcggcacac actaggtaca ctccatagct aactgttcct 9482
Leu Pro Ala Arg
3030
tttttttttt tttttttttt tttttttttt tttttttttt ttcttttttt tttttttccc 9542
tctttcttcc cttctcatct tattctactt tctttcttgg tggctccatc ttagccctag 9602
tcacggctag ctgtgaaagg tccgtgagcc gcatgactgc agagagtgcc gtaactggtc 9662
tctctgcaga tcatgt 9678
<210>11
<211>3033
<212>PRT
<213>丙型肝炎病毒
<400>11
Met Ser Thr Asn Pro Lys Pro Gln Arg Lys Thr Lys Arg Asn Thr Asn
1 5 10 15
Arg Arg Pro Glu Asp Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly
20 25 30
Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Thr
35 40 45
Thr Arg Lys Thr Ser Glu Arg Ser Gln Pro Arg Gly Arg Arg Gln Pro
50 55 60
Ile Pro Lys Asp Arg Arg Ser Thr Gly Lys Ala Trp Gly Lys Pro Gly
65 70 75 80
Arg Pro Trp Pro Leu Tyr Gly Asn Glu Gly Leu Gly Trp Ala Gly Trp
85 90 95
Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Thr Asp Pro
100 105 110
Arg His Arg Ser Arg Asn Val Gly Lys Val Ile Asp Thr Leu Thr Cys
115 120 125
Gly Phe Ala Asp Leu Met Gly Tyr Ile Pro Val Val Gly Ala Pro Leu
130 135 140
Ser Gly Ala Ala Arg Ala Val Ala His Gly Val Arg Val Leu Glu Asp
145 150 155 160
Gly Val Asn Tyr Ala Thr Gly Asn Leu Pro Gly Phe Pro Phe Ser Ile
165 170 175
Phe Leu Leu Ala Leu Leu Ser Cys Ile Thr Val Pro Val Ser Ala Ala
180 185 190
Gln Val Lys Asn Thr Ser Ser Ser Tyr Met Val Thr Asn Asp Cys Ser
195 200 205
Asn Asp Ser Ile Thr Trp Gln Leu Glu Ala Ala Val Leu His Val Pro
210 215 220
Gly Cys Val Pro Cys Glu Arg Val Gly Asn Thr Ser Arg Cys Trp Val
225 230 235 240
Pro Val Ser Pro Asn Met Ala Val Arg Gln Pro Gly Ala Leu Thr Gln
245 250 255
Gly Leu Arg Thr His Ile Asp Met Val Val Met Ser Ala Thr Phe Cys
260 265 270
Ser Ala Leu Tyr Val Gly Asp Leu Cys Gly Gly Val Met Leu Ala Ala
275 280 285
Gln Val Phe Ile Val Ser Pro Gln Tyr His Trp Phe Val Gln Glu Cys
290 295 300
Asn Cys Ser Ile Tyr Pro Gly Thr Ile Thr Gly His Arg Met Ala Trp
305 310 315 320
Asp Met Met Met Asn Trp Ser Pro Thr Ala Thr Met Ile Leu Ala Tyr
325 330 335
Val Met Arg Val Pro Glu Val Ile Ile Asp Ile Val Ser Gly Ala His
340 345 350
Trp Gly Val Met Phe Gly Leu Ala Tyr Phe Ser Met Gln Gly Ala Trp
355 360 365
Ala Lys Val Ile Val Ile Leu Leu Leu Ala Ala Gly Val Asp Ala Gly
370 375 380
Thr Thr Thr Val Gly Gly Ala Val Ala Arg Ser Thr Asn Val Ile Ala
385 390 395 400
Gly Val Phe Ser His Gly Pro Gln Gln Asn Ile Gln Leu Ile Asn Thr
405 410 415
Asn Gly Ser Trp His Ile Asn Arg Thr Ala Leu Asn Cys Asn Asp Ser
420 425 430
Leu Asn Thr Gly Phe Leu Ala Ala Leu Phe Tyr Thr Asn Arg Phe Asn
435 440 445
Ser Ser Gly Cys Pro Gly Arg Leu Ser Ala Cys Arg Asn Ile Glu Ala
450 455 460
Phe Arg Ile Gly Trp Gly Thr Leu Gln Tyr Glu Asp Asn Val Thr Asn
465 470 475 480
Pro Glu Asp Met Arg Pro Tyr Cys Trp His Tyr Pro Pro Lys Pro Cys
485 490 495
Gly Val Val Pro Ala Arg Ser Val Cys Gly Pro Val Tyr Cys Phe Thr
500 505 510
Pro Ser Pro Val Val Val Gly Thr Thr Asp Arg Arg Gly Val Pro Thr
515 520 525
Tyr Thr Trp Gly Glu Asn Glu Thr Asp Val Phe Leu Leu Asn Ser Thr
530 535 540
Arg Pro Pro Gln Gly Ser Trp Phe Gly Cys Thr Trp Met Asn Ser Thr
545 550 555 560
Gly Phe Thr Lys Thr Cys Gly Ala Pro Pro Cys Arg Thr Arg Ala Asp
565 570 575
Phe Asn Ala Ser Thr Asp Leu Leu Cys Pro Thr Asp Cys Phe Arg Lys
580 585 590
His Pro Asp Ala Thr Tyr Ile Lys Cys Gly Ser Gly Pro Trp Leu Thr
595 600 605
Pro Lys Cys Leu Val His Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys
610 615 620
Thr Val Asn Phe Thr Ile Phe Lys Ile Arg Met Tyr Val Gly Gly Val
625 630 635 640
Glu His Arg Leu Thr Ala Ala Cys Asn Phe Thr Arg Gly Asp Arg Cys
645 650 655
Asp Leu Glu Asp Arg Asp Arg Ser Gln Leu Ser Pro Leu Leu His Ser
660 665 670
Thr Thr Glu Trp Ala Ile Leu Pro Cys Thr Tyr Ser Asp Leu Pro Ala
675 680 685
Leu Ser Thr Gly Leu Leu His Leu His Gln Asn Ile Val Asp Val Gln
690 695 700
Tyr Met Tyr Gly Leu Ser Pro Ala Ile Thr Lys Tyr Val Val Arg Trp
705 710 715 720
Glu Trp Val Val Leu Leu Phe Leu Leu Leu Ala Asp Ala Arg Val Cys
725 730 735
Ala Cys Leu Trp Met Leu Ile Leu Leu Gly Gln Ala Glu Ala Ala Leu
740 745 750
Glu Lys Leu Val Val Leu His Ala Ala Ser Ala Ala Asn Cys His Gly
755 760 765
Leu Leu Tyr Phe Ala Ile Phe Phe Val Ala Ala Trp His Ile Arg Gly
770 775 780
Arg Val Val Pro Leu Thr Thr Tyr Cys Leu Thr Gly Leu Trp Pro Phe
785 790 795 800
Cys Leu Leu Leu Met Ala Leu Pro Arg Gln Ala Tyr Ala Tyr Asp Ala
805 810 815
Pro Val His Gly Gln Ile Gly Val Gly Leu Leu Ile Leu Ile Thr Leu
820 825 830
Phe Thr Leu Thr Pro Gly Tyr Lys Thr Leu Leu Gly Gln Cys Leu Trp
835 840 845
Trp Leu Cys Tyr Leu Leu Thr Leu Gly Glu Ala Met Ile Gln Glu Trp
850 855 860
Val Pro Pro Met Gln Val Arg Gly Gly Arg Asp Gly Ile Ala Trp Ala
865 870 875 880
Val Thr Ile Phe Cys Pro Gly Val Val Phe Asp Ile Thr Lys Trp Leu
885 890 895
Leu Ala Leu Leu Gly Pro Ala Tyr Leu Leu Arg Ala Ala Leu Thr His
900 905 910
Val Pro Tyr Phe Val Arg Ala His Ala Leu Ile Arg Val Cys Ala Leu
915 920 925
Val Lys Gln Leu Ala Gly Gly Arg Tyr Val Gln Val Ala Leu Leu Ala
930 935 940
Leu Gly Arg Trp Thr Gly Thr Tyr Ile Tyr Asp His Leu Thr Pro Met
945 950 955 960
Ser Asp Trp Ala Ala Ser Gly Leu Arg Asp Leu Ala Val Ala Val Glu
965 970 975
Pro Ile Ile Phe Ser Pro Met Glu Lys Lys Val Ile Val Trp Gly Ala
980 985 990
Glu Thr Ala Ala Cys Gly Asp Ile Leu His Gly Leu Pro Val Ser Ala
995 1000 1005
Arg Leu Gly Gln Glu Ile Leu Leu Gly Pro Ala Asp Gly Tyr Thr Ser
1010 1015 1020
Lys Gly Trp Lys Leu Leu Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr
1025 1030 1035 1040
Arg Gly Leu Leu Gly Ala Ile Val Val Ser Met Thr Gly Arg Asp Arg
1045 1050 1055
Thr Glu Gln Ala Gly Glu Val Gln Ile Leu Ser Thr Val Ser Gln Ser
1060 1065 1070
Phe Leu Gly Thr Thr Ile Ser Gly Val Leu Trp Thr Val Tyr His Gly
1075 1080 1085
Ala Gly Asn Lys Thr Leu Ala Gly Leu Arg Gly Pro Val Thr Gln Met
1090 1095 1100
Tyr Ser Ser Ala Glu Gly Asp Leu Val Gly Trp Pro Ser Pro Pro Gly
1105 1110 1115 1120
Thr Lys Ser Leu Glu Pro Cys Lys Cys Gly Ala Val Asp Leu Tyr Leu
1125 1130 1135
Val Thr Arg Asn Ala Asp Val Ile Pro Ala Arg Arg Arg Gly Asp Lys
1140 1145 1150
Arg Gly Ala Leu Leu Ser Pro Arg Pro Ile Ser Thr Leu Lys Gly Ser
1155 1160 1165
Ser Gly Gly Pro Val Leu Cys Pro Arg Gly His Val Val Gly Leu Phe
1170 1175 1180
Arg Ala Ala Val Cys Ser Arg Gly Val Ala Lys Ser Ile Asp Phe Ile
1185 1190 1195 1200
Pro Val Glu Thr Leu Asp Val Val Thr Arg Ser Pro Thr Phe Ser Asp
1205 1210 1215
Asn Ser Thr Pro Pro Ala Val Pro Gln Thr Tyr Gln Val Gly Tyr Leu
1220 1225 1230
His Ala Pro Thr Gly Ser Gly Lys Ser Thr Lys Val Pro Val Ala Tyr
1235 1240 1245
Ala Ala Gln Gly Tyr Lys Val Leu Val Leu Asn Pro Ser Val Ala Ala
1250 1255 1260
Thr Leu Gly Phe Gly Ala Tyr Leu Ser Lys Ala His Gly Ile Asn Pro
1265 1270 1275 1280
Asn Ile Arg Thr Gly Val Arg Thr Val Met Thr Gly Glu Ala Ile Thr
1285 1290 1295
Tyr Ser Thr Tyr Gly Lys Phe Leu Ala Asp Gly Gly Cys Ala Ser Gly
1300 1305 1310
Ala Tyr Asp Ile Ile Ile Cys Asp Glu Cys His Ala Val Asp Ala Thr
1315 1320 1325
Ser Ile Leu Gly Ile Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly
1330 1335 1340
Val Arg Leu Thr Val Leu Ala Thr Ala Thr Pro Pro Gly Ser Val Thr
1345 1350 1355 1360
Thr Pro His Pro Asp Ile Glu Glu Val Gly Leu Gly Arg Glu Gly Glu
1365 1370 1375
Ile Pro Phe Tyr Gly Arg Ala Ile Pro Leu Ser Cys Ile Lys Gly Gly
1380 1385 1390
Arg His Leu Ile Phe Cys His Ser Lys Lys Lys Cys Asp Glu Leu Ala
1395 1400 1405
Ala Ala Leu Arg Gly Met Gly Leu Asn Ala Val Ala Tyr Tyr Arg Gly
1410 1415 1420
Leu Asp Val Ser Ile Ile Pro Ala Gln Gly Asp Val Val Val Val Ala
1425 1430 1435 1440
Thr Asp Ala Leu Met Thr Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile
1445 1450 1455
Asp Cys Asn Val Ala Val Thr Gln Ala Val Asp Phe Ser Leu Asp Pro
1460 1465 1470
Thr Phe Thr Ile Thr Thr Gln Thr Val Pro Gln Asp Ala Val Ser Arg
1475 1480 1485
Ser Gln Arg Arg Gly Arg Thr Gly Arg Gly Arg Gln Gly Thr Tyr Arg
1490 1495 1500
Tyr Val Ser Thr Gly Glu Arg Ala Ser Gly Met Phe Asp Ser Val Val
1505 1510 1515 1520
Leu Cys Glu Cys Tyr Asp Ala Gly Ala Ala Trp Tyr Asp Leu Thr Pro
1525 1530 1535
Ala Glu Thr Thr Val Arg Leu Arg Ala Tyr Phe Asn Thr Pro Gly Leu
1540 1545 1550
Pro Val Cys Gln Asp His Leu Glu Phe Trp Glu Ala Val Phe Thr Gly
1555 1560 1565
Leu Thr His Ile Asp Ala His Phe Leu Ser Gln Thr Lys Gln Ala Gly
1570 1575 1580
Glu Asn Phe Ala Tyr Leu Val Ala Tyr Gln Ala Thr Val Cys Ala Arg
1585 1590 1595 1600
Ala Lys Ala Pro Pro Pro Ser Trp Asp Ala Met Trp Lys Cys Leu Ala
1605 1610 1615
Arg Leu Lys Pro Thr Leu Ala Gly Pro Thr Pro Leu Leu Tyr Arg Leu
1620 1625 1630
Gly Pro Ile Thr Asn Glu Val Thr Leu Thr His Pro Gly Thr Lys Tyr
1635 1640 1645
Ile Ala Thr Cys Met Gln Ala Asp Leu Glu Val Met Thr Ser Thr Trp
1650 1655 1660
Val Leu Ala Gly Gly Val Leu Ala Ala Val Ala Ala Tyr Cys Leu Ala
1665 1670 1675 1680
Thr Gly Cys Val Ser Ile Ile Gly Arg Leu His Val Asn Gln Arg Val
1685 1690 1695
Val Val Ala Pro Asp Lys Glu Val Leu Tyr Glu Ala Phe Asp Glu Met
1700 1705 1710
Glu Glu Cys Ala Ser Arg Ala Ala Leu Ile Glu Glu Gly Gln Arg Ile
1715 1720 1725
Ala Glu Met Leu Lys Ser Lys Ile Gln Gly Leu Leu Gln Gln Ala Ser
1730 1735 1740
Lys Gln Ala Gln Asp Ile Gln Pro Ala Met Gln Ala Ser Trp Pro Lys
1745 1750 1755 1760
Val Glu Gln Phe Trp Ala Arg His Met Trp Asn Phe Ile Ser GlyIle
1765 1770 1775
Gln Tyr Leu Ala Gly Leu Ser Thr Leu Pro Gly Asn Pro Ala Val Ala
1780 1785 1790
Ser Met Met Ala Phe Ser Ala Ala Leu Thr Ser Pro Leu Ser Thr Ser
1795 1800 1805
Thr Thr Ile Leu Leu Asn Ile Met Gly Gly Trp Leu Ala Ser Gln Ile
1810 1815 1820
Ala Pro Pro Ala Gly Ala Thr Gly Phe Val Val Ser Gly Leu Val Gly
1825 1830 1835 1840
Ala Ala Val Gly Ser Ile Gly Leu Gly Lys Val Leu Val Asp Ile Leu
1845 1850 1855
Ala Gly Tyr Gly Ala Gly Ile Ser Gly Ala Leu Val Ala Phe Lys Ile
1860 1865 1870
Met Ser Gly Glu Lys Pro Ser Met Glu Asp Val Ile Asn Leu Leu Pro
1875 1880 1885
Gly Ile Leu Ser Pro Gly Ala Leu Val Val Gly Val Ile Cys Ala Ala
1890 1895 1900
Ile Leu Arg Arg His Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met
1905 1910 1915 1920
Asn Arg Leu Ile Ala Phe Ala Ser Arg Gly Asn His Val Ala Pro Thr
1925 1930 1935
His Tyr Val Thr Glu Ser Asp Ala Ser Gln Arg Val Thr Gln Leu Leu
1940 1945 1950
Gly Ser Leu Thr Ile Thr Ser Leu Leu Arg Arg Leu His Asn Trp Ile
1955 1960 1965
Thr Glu Asp Cys Pro Ile Pro Cys Ser Gly Ser Trp Leu Arg Asp Val
1970 1975 1980
Trp Asp Trp Val Cys Thr Ile Leu Thr Asp Phe Lys Asn Trp Leu Thr
1985 1990 1995 2000
Ser Lys Leu Phe Pro Lys Leu Pro Gly Leu Pro Phe Ile Ser Cys Gln
2005 2010 2015
Lys Gly Tyr Lys Gly Val Trp Ala Gly Thr Gly Ile Met Thr Thr Arg
2020 2025 2030
Cys Pro Cys Gly Ala Asn Ile Ser Gly Asn Val Arg Leu Gly Ser Met
2035 2040 2045
Arg Ile Thr Gly Pro Lys Thr Cys Met Asn Thr Trp Gln Gly Thr Phe
2050 2055 2060
Pro Ile Asn Cys Tyr Thr Glu Gly Gln Cys Ala Pro Lys Pro Pro Thr
2065 2070 2075 2080
Asn Tyr Lys Thr Ala Ile Trp Arg Val Ala Ala Ser Glu Tyr Ala Glu
2085 2090 2095
Val Thr Gln His Gly Ser Tyr Ser Tyr Val Thr Gly Leu Thr Thr Asp
2100 2105 2110
Asn Leu Lys Ile Pro Cys Gln Leu Pro Ser Pro Glu Phe Phe Ser Trp
2115 2120 2125
Val Asp Gly Val Gln Ile His Arg Phe Ala Pro Thr Pro Lys Pro Phe
2130 2135 2140
Phe Arg Asp Glu Val Ser Phe Cys Val Gly Leu Asn Ser Tyr Ala Val
2145 2150 2155 2160
Gly Ser Gln Leu Pro Cys Glu Pro Glu Pro Asp Ala Asp Val Leu Arg
2165 2170 2175
Ser Met Leu Thr Asp Pro Pro His Ile Thr Ala Glu Thr Ala Ala Arg
2180 2185 2190
Arg Leu Ala Arg Gly Ser Pro Pro Ser Glu Ala Ser Ser Ser Val Ser
2195 2200 2205
Gln Leu Ser Ala Pro Ser Leu Arg Ala Thr Cys Thr Thr His Ser Asn
2210 2215 2220
Thr Tyr Asp Val Asp Met Val Asp Ala Asn Leu Leu Met Glu Gly Gly
2225 2230 2235 2240
Val Ala Gln Thr Glu Pro Glu Ser Arg Val Pro Val Leu Asp Phe Leu
2245 2250 2255
Glu Pro Met Ala Glu Glu Glu Ser Asp Leu Glu Pro Ser Ile Pro Ser
2260 2265 2270
Glu Cys Met Leu Pro Arg Ser Gly Phe Pro Arg Ala Leu Pro Ala Trp
2275 2280 2285
Ala Arg Pro Asp Tyr Asn Pro Pro Leu Val Glu Ser Trp Arg Arg Pro
2290 2295 2300
Asp Tyr Gln Pro Pro Thr Val Ala Gly Cys Ala Leu Pro Pro Pro Lys
2305 2310 2315 2320
Lys Ala Pro Thr Pro Pro Pro Arg Arg Arg Arg Thr Val Gly Leu Ser
2325 2330 2335
Glu Ser Thr Ile Ser Glu Ala Leu Gln Gln Leu Ala Ile Lys Thr Phe
2340 2345 2350
Gly Gln Pro Pro Ser Ser Gly Asp Ala Gly Ser Ser Thr Gly Ala Gly
2355 2360 2365
Ala Ala Glu Ser Gly Gly Pro Thr Ser Pro Gly Glu Pro Ala Pro Ser
2370 2375 2380
Glu Thr Gly Ser Ala Ser Ser Met Pro Pro Leu Glu Gly Glu Pro Gly
2385 2390 2395 2400
Asp Pro Asp Leu Glu Ser Asp Gln Val Glu Leu Gln Pro Pro Pro Gln
2405 2410 2415
Gly Gly Gly Val Ala Pro Gly Ser Gly Ser Gly Ser Trp Ser Thr Cys
2420 2425 2430
Ser Glu Glu Asp Asp Thr Thr Val Cys Cys Ser Met Ser Tyr Ser Trp
2435 2440 2445
Thr Gly Ala Leu Ile Thr Pro Cys Ser Pro Glu Glu Glu Lys Leu Pro
2450 2455 2460
Ile Asn Pro Leu Ser Asn Ser Leu Leu Arg Tyr His Asn Lys Val Tyr
2465 2470 2475 2480
Cys Thr Thr Ser Lys Ser Ala Ser Gln Arg Ala Lys Lys Val Thr Phe
2485 2490 2495
Asp Arg Thr Gln Val Leu Asp Ala His Tyr Asp Ser Val Leu Lys Asp
2500 2505 2510
Ile Lys Leu Ala Ala Ser Lys Val Ser Ala Arg Leu Leu Thr Leu Glu
2515 2520 2525
Glu Ala Cys Gln Leu Thr Pro Pro His Ser Ala Arg Ser Lys Tyr Gly
2530 2535 2540
Phe Gly Ala Lys Glu Val Arg Ser Leu Ser Gly Arg Ala Val Asn His
2545 2550 2555 2560
Ile Lys Ser Val Trp Lys Asp Leu Leu Glu Asp Pro Gln Thr Pro Ile
2565 2570 2575
Pro Thr Thr Ile Met Ala Lys Asn Glu Val Phe Cys Val Asp Pro Ala
2580 2585 2590
Lys Gly Gly Lys Lys Pro Ala Arg Leu Ile Val Tyr Pro Asp Leu Gly
2595 2600 2605
Val Arg Val Cys Glu Lys Met Ala Leu Tyr Asp Ile Thr Gln Lys Leu
2610 2615 2620
Pro Gln Ala Val Met Gly Ala Ser Tyr Gly Phe Gln Tyr Ser Pro Ala
2625 2630 2635 2640
Gln Arg Val Glu Tyr Leu Leu Lys Ala Trp Ala Glu Lys Lys Asp Pro
2645 2650 2655
Met Gly Phe Ser Tyr Asp Thr Arg Cys Phe Asp Ser Thr Val Thr Glu
2660 2665 2670
Arg Asp Ile Arg Thr Glu Glu Ser Ile Tyr Gln Ala Cys Ser Leu Pro
2675 2680 2685
Glu Glu Ala Arg Thr Ala Ile His Ser Leu Thr Glu Arg Leu Tyr Val
2690 2695 2700
Gly Gly Pro Met Phe Asn Ser Lys Gly Gln Thr Cys Gly Tyr Arg Arg
2705 2710 2715 2720
Cys Arg Ala Ser Gly Val Leu Thr Thr Ser Met Gly Asn ThrIle Thr
2725 2730 2735
Cys Tyr Val Lys Ala Leu Ala Ala Cys Lys Ala Ala Gly Ile Val Ala
2740 2745 2750
Pro Thr Met Leu Val Cys Gly Asp Asp Leu Val Val Ile Ser Glu Ser
2755 2760 2765
Gln Gly Thr Glu Glu Asp Glu Arg Asn Leu Arg Ala Phe Thr Glu Ala
2770 2775 2780
Met Thr Arg Tyr Ser Ala Pro Pro Gly Asp Pro Pro Arg Pro Glu Tyr
2785 2790 2795 2800
Asp Leu Glu Leu Ile Thr Ser Cys Ser Ser Asn Val Ser Val Ala Leu
2805 2810 2815
Gly Pro Arg Gly Arg Arg Arg Tyr Tyr Leu Thr Arg Asp Pro Thr Thr
2820 2825 2830
Pro Leu Ala Arg Ala Ala Trp Glu Thr Val Arg His Ser Pro Ile Asn
2835 2840 2845
Ser Trp Leu Gly Asn Ile Ile Gln Tyr Ala Pro Thr Ile Trp Val Arg
2850 2855 2860
Met Val Leu Met Thr His Phe Phe Ser Ile Leu Met Val Gln Asp Thr
2865 2870 2875 2880
Leu Asp Gln Asn Leu Asn Phe Glu Met Tyr Gly Ser Val Tyr Ser Val
2885 2890 2895
Asn Pro Leu Asp Leu Pro Ala Ile Ile Glu Arg Leu His Gly Leu Asp
2900 2905 2910
Ala Phe Ser Met His Thr Tyr Ser His His Glu Leu Thr Arg Val Ala
2915 2920 2925
Ser Ala Leu Arg Lys Leu Gly Ala Pro Pro Leu Arg Val Trp Lys Ser
2930 2935 2940
Arg Ala Arg Ala Val Arg Ala Ser Leu Ile Ser Arg Gly Gly Lys Ala
2945 2950 2955 2960
Ala Val Cys Gly Arg Tyr Leu Phe Asn Trp Ala Val Lys Thr Lys Leu
2965 2970 2975
Lys Leu Thr Pro Leu Pro Glu Ala Arg Leu Leu Asp Leu Ser Ser Trp
2980 2985 2990
Phe Thr Val Gly Ala Gly Gly Gly Asp Ile Phe His Ser Val Ser Arg
2995 3000 3005
Ala Arg Pro Arg Ser Leu Leu Phe Gly Leu Leu Leu Leu Phe Val Gly
3010 3015 3020
Val Gly Leu Phe Leu Leu Pro Ala Arg
3025 3030
<210>12
<211>13
<212>DNA
<213>丙型肝炎病毒
<400>12
ctagccgagt agc 13
<210>13
<211>26
<212>DNA
<213>丙型肝炎病毒
<400>13
ccccggcagg cttatgccta gaattc 26
<210>14
<211>6
<212>PRT
<213>丙型肝炎病毒
<400>14
Pro Arg Gln Ala Tyr Ala
1 5