HCV检测
技术领域
本发明总的涉及病毒诊断。具体而言,本发明涉及使用了衍生自丙型肝炎病毒多蛋白区域的第一分离抗原和包含得自HCV多蛋白的多个表位的多表位融合抗原的抗原/抗体/抗原夹心检测,用于准确诊断丙型肝炎病毒感染,其中,所述多个表位包括一种或多种得自与所述第一抗原相同的多蛋白区域的表位。
发明背景
丙肝病毒(HCV)是胃肠外非甲型非乙型肝炎(NANBH)的主要原因,它主要通过输血和性接触传播。该病毒存在于0.4-2.0%的供血者中。在约50%感染者中产生慢性肝炎,其中约20%被感染的个人产生肝硬化,有时导致肝细胞癌。因此,研究和控制该疾病在医学上是重要的。
Houghten等首先鉴定并确定HCV是NANBH的原因。HCV的病毒基因组序列是已知的,以及获得该序列的方法。参见,如国际出版物No.WO89/04669;WO90/11089;和WO90/14436。HCV具有9.5kb的正义单链RNA基因组,其是黄病毒科的成员。基于系统发育分析,已鉴定出至少6个不同但相关的HCV基因型(Simmonds等,J.Gen.Virol.(1993)74:2391-2399)。该病毒编码一个具有3000多个氨基酸残基的多蛋白(Choo等,Science(1989)244:359-362;Choo等,Proc.Natl.Acad.Sci.USA(1991)88:2451-2455;Han等,Proc.Natl.Acad.Sci.USA(1991)88:1711-1715)。多蛋白在翻译同时或之后加工成结构和非结构(NS)蛋白。
具体说,如图1所示,HCV基因组编码几种蛋白质。HCV多蛋白的切割产物的顺序和命名如下:NH2-C-E1-E2-p7-NS2-NS3-NS4a-NS4b-NS5a-NS5b-COOH。宿主蛋白酶催化多蛋白的最初切割,释放三种结构蛋白:N-末端核衣壳蛋白(称为“核心”)和两种包膜糖蛋白“AE1”(也称为E)和“AE2”(也称为E2/NS1),和含有病毒酶的非结构(NS)蛋白。NS区称为NS2、NS3、NS4和NS5。NS2是具有蛋白水解活性的膜内在蛋白,它与NS3组合,切开NS2-NS3 sissle键,从而产生NS3N-末端并释放大的多蛋白,该多蛋白包含丝氨酸蛋白酶和RNA解旋酶活性。NS3蛋白酶加工剩余的多蛋白。在这些反应中,NS3释放NS3辅因子(NS4a)、两种蛋白质(NS4b和NS5a),和依赖RNA的RNA聚合酶(NS5b)。多蛋白熟化的完成由NS3-NS4连接处的自催化裂解引发,由NS3丝氨酸蛋白酶催化。
已描述了许多用作HCV的免疫和诊断试剂,衍生自HCV多蛋白的一般和特异性多肽。参见如Houghton等,欧洲出版物No.318,216和388,232;Choo等,Science(1989)244:359-362;Kuo等,Science(1989)244:362-364;Houghton等,Hepatology(1991)14:381-388;Chien等,Proc.Natl.Acad.Sci.USA(1992)89:10011-10015;Chien等,J.Gastroent.Hepatol.(1993)8:S33-39;Chien等,国际出版物No.WO 93/00365;Chien,D.Y.,国际出版物No.WO94/01778。这些出版物通常对HCV、HCV多肽免疫试剂的生产和使用提供了广泛的背景。
筛选和鉴定HCV载体和HCV污染的血液或血液制品的灵敏和专一的方法将对医学提供重要的进步。在约10%输血的病人中发生输血后肝炎(PTH),而HCV在这些病例中占多达90%。病人护理和预防及HCV通过血液或血制品,或通过密切的个人接触传播需要可靠的诊断和预后工具。因此,开发了几种测定方法用于HCV感染的血清诊断。参见如Choo等,Science(1989)244:359-362;Kuo等,Science(1989)244:362-364;Choo等,Br.Med.Bull.(1990)46:423-441;Ebeling等,Lancet(1990)335:982-983;van der Poel等,Lancet(1990)335:558-560;van der Poel等,Lancet(1991)337:317-319;Chien,D.Y.,国际出版物No.WO94/01778;Valenzuella等,国际出版物No.WO97/44469;和Kashiwakuma等,美国专利No.5,871,904。
一些基于血清的测定方法面临的显著问题是,在病毒感染和检测之间有明显的间隔,通常超过80天。这种测定间隔对输血受体可能产生很大的危险。为了克服该问题,开发了直接检测病毒RNA的基于核酸的测试(NAT),和检测病毒抗原而不是抗体反应的HCV核心抗原试验。参见如Kashiwakuma等,美国专利No.5,871,904;Beld等,Transfusion(2000),40:575-579。
然而,仍然需要灵敏、准确的诊断和预后工具,以提供充分的病人护理并防止HCV通过血液和血制品,或密切的个人接触传播。
发明概要
本发明部分基于以下发现:使用衍生自HCV多蛋白的第一抗原与包含得自与该第一抗原相同的HCV多蛋白区域的表位的多表位融合抗原的组合能提供敏感且可靠的检测HCV的方法。本文所述的检测可检测由六种已知的HCV基因型中的任何一种引起的HCV感染。在本发明的一个代表性实施例中,所述第一抗原包括NS3/4a构象表位,第二抗原是一种多表位融合抗原,包含一种或多种得自NS3/4a区域的表位。多表位融合蛋白的使用能在一单位面积底物上提供大量的表位,并改善选择性,从而能减少掩蔽问题,提高敏感性,并检测抗体。而且,本文所述的检测可快速进行,并可使用较大的样品体积,而没有背景影响。
因此,在一个实施方式中,本发明涉及检测生物样品中的丙型肝炎病毒(HCV)的方法。该方法包括:
(a)提供免疫检测固相支持物,该支持物含有结合于其上的HCV抗原,其中,所述HCV抗原由一种或多种得自HCV多蛋白的第一区域的分离抗原组成;
(b)在使HCV抗体(当存在于该生物样品中时)与所述一种或多种HCV抗原结合的条件下,使生物样品与该固相支持物混合;
(c)在形成复合物的条件下,将可检测的标记HCV多表位融合抗原(MEFA)加到步骤(b)的固相支持物中,其中,该标记的MEFA含有至少一个得自与所述一个或多个分离的抗原相同的HCV多蛋白区域的表位,所述MEFA与结合的HCV抗体结合;
(d)检测该HCV抗体与得自所述HCV多蛋白的第一区域的一种或多种抗原以及所述MEFA之间形成的复合物,如果有的话,作为生物样品中HCV感染的指标。
在另一实施方式中,本发明涉及一种检测生物样品中的HCV感染的方法,该方法包括:
(a)供免疫检测固相支持物,该支持物包含结合于其上的HCV抗原,其中,该HCV抗原由一种或多种多表位融合抗原(MEFA)组成;
(b)在使HCV抗体(当存在于该生物样品中时)与所述一种或多种MEFA结合的条件下,使生物样品与该固相支持物混合;
(c)在形成复合物的条件下,将存在于一种或多种MEFA中的得自HCV多蛋白的区域的可检测的标记的分离HCV抗原加到步骤(b)的固相支持物中;
(d)检测该HCV抗体与所述分离的HCV抗原以及所述MEFA之间形成的复合物,如果有的话,作为生物样品中HCV感染的指标。
在又一实施方式中,本发明涉及一种检测生物样品中的HCV感染的方法,该方法包括:
(a)提供免疫检测固相支持物,该支持物包含结合于其上的HCV抗原,其中,该HCV抗原由一种或多种分离的HCV NS3/4a构象表位组成;
(b)在使HCV抗体(当存在于该生物样品中时)与所述一种或多种NS3/4a表位结合的条件下,使生物样品与该固相支持物混合;
(c)在形成复合物的条件下,将可检测的标记HCV多表位融合抗原(MEFA)加到步骤(b)的固相支持物中,其中,所述标记的MEFA含有至少一种得自HCV NS3/4a区域的表位,其中,该MEFA与该结合的HCV抗体结合;
(d)检测该HCV抗体与该NS3/4a构象表位以及所述MEFA之间形成的复合物,如果有的话,作为生物样品中HCV感染的指标。
在另一实施方式中,本发明涉及一种检测生物样品中的HCV感染的方法,该方法包括:
(a)提供免疫检测固相支持物,该支持物含有结合于其上的HCV抗原,其中,该HCV抗原由一种或多种多表位融合抗原(MEFA)组成,所述一种或多种MEFA包含至少一种得自HCV NS3/4a区域的表位;
(b)在使HCV抗体(当存在于该生物样品中时)与所述一种或多种MEFA结合的条件下,使生物样品与该固相支持物混合;
(c)在形成复合物的条件下,将可检测的标记HCV NS3/4a构象表位加到所述固相支持物中,其中,所述NS3/4a构象表位与该结合的HCV抗体结合;
(d)检测该HCV抗体与该NS3/4a构象表位以及所述MEFA之间形成的复合物,如果有的话,作为生物样品中HCV感染的指标。
在上述方法中,NS3/4a构象表位和/或MEFA包含得自HCV多蛋白的NS3/4a蛋白酶区域的表位,和/或得自HCV多蛋白的NS3/4a解旋酶区域的表位。在具体实施例中,该NS3/4a构象表位包含图3A-3D描述的氨基酸序列(SEQ IDNO:1和2)。
在其它实施方式中,MEFA包含氨基酸1193-1657(依HCV-1序列编号)。在又一实施方式中,MEFA包含得自HCV多蛋白c33c区域的表位,如氨基酸1211-1457,和/或氨基酸1192-1457,依HCV-1编号。
在另外的实施方式中,MEFA包含得自HCV多蛋白的5-1-1区域的表位,如氨基酸1689-1735,依HCV-1编号。
在具体的实施方式中,MEFA包含图6A-6F所述的氨基酸序列(SEQ IDNO:3和4)或图8A-8F所述的氨基酸序列(SEQ ID NO:5和6)。
在结合以下详细描述和附图后,本发明的这些和其它方面将变得显而易见。此外,本文给出了各种参考文献,这些文献更详细地描述了某些方法或组合物。
附图简述
图1是HCV基因组图,描述了衍生出本检测试剂(蛋白质和抗体)的多蛋白的不同区域。
图2显示本发明使用MEFA 12进行的代表性抗原/抗体/抗原夹心检测的示意图。
图3A-3D(SEQ ID NO:1和2)显示了用于本检测的代表性NS3/4a构象抗原的DNA和相应的氨基酸序列。在图3A-3D中403和404位的氨基酸代表HCV-1的天然氨基酸序列中的Pro代替Thr,和Ile代替Ser。
图4是pd.HCV1a.ns3ns4aPI的构建图。
图5是MEFA 12的示意图。
图6A-6F(SEQ ID NO:3和4)描述了MEFA 12的DNA和相应的氨基酸序列。
图7是MEFA 7.1的示意图。
图8A-8F(SEQ ID NO:5和6)描述了MEFA 7.1的DNA和相应的氨基酸序列。
图9A-9C显示用于本发明免疫检测的代表性MEFA。图9A是MEFA 3的示意图。图9B是MEFA 5的示意图。图9C是MEFA 6的示意图。
发明详述
本发明的实施除非另外说明,将使用本领域技术人员已知的化学、生物化学、重组DNA技术和免疫学的常规方法。这些技术在文献中有完整的解释。参见,如《基础免疫学》(Fundamental Virology),第二版,第I和II卷(B.N.Fields和D.M.Knipe编);《实验免疫学手册》(Handbook ofExperimental Immunology),第I-IV卷(D.M.Weir和C.C.Blackwell编,Blackwell Scientific Publications);T.E.Creighton,《蛋白质:结构和分子特性》(Proteins:Structures and Molecularproperties)(W.H.Freeman and Company,1993);A.L.Lehninger,《生物化学》(Biochemistry)(Worth Publishers,Inc.最新版);Sambrook等,《分子克隆:实验室手册》(Molecular Cloning:a Laboratory Manual),第二版,1989;《酶学方法》(Methods in Engymology)(S.Colowick和N.Kaplan编,Academic Press,Inc.)。
必须注意的是,如本说明书和权利要求中使用的,单数形式“一”、“一个”、“该”包括复数参考,除非内容明显说明。因此,例如,“一抗原”包括两个或多个抗原的混合物等。
文中使用了下列氨基酸缩写:
丙氨酸:Ala(A) 精氨酸:Arg(R)
天冬酰胺:Asn(N) 天冬氨酸:Asp(D)
半胱氨酸:Cys(C) 谷氨酰胺:Gln(Q)
谷氨酸:Glu(E) 甘氨酸:Gly(G)
组氨酸:His(H) 异亮氨酸:Ile(I)
亮氨酸:Leu(L) 赖氨酸:Lys(K)
甲硫氨酸:Met(M) 苯丙氨酸:Phe(F)
脯氨酸:Pro(P) 丝氨酸:Ser(S)
苏氨酸:Thr(T) 色氨酸:Trp(W)
酪氨酸:Tyr(Y) 缬氨酸:Val(V)
I.定义
在本发明的描述中,使用了下列术语,并如下定义。
术语“多肽”和“蛋白质”指氨基酸残基的聚合物,并不限于产物的最小长度。因此,肽、寡肽、二聚物、多聚物等都包括在该定义中。全长的蛋白质及其片段包括在该定义中。该术语还包括多肽的表达后修饰,例如糖基化、乙酰化、磷酸化等。另外,为了本发明的目的,“多肽”指包括天然序列的修饰,例如缺失、添加和取代(通常性质保守),只要蛋白质维持所需活性。这些修饰可以是经过设计的,如通过定点诱变,或可以是偶然的,例如通过产生蛋白质的宿主突变,或由于PCR扩增引起的错误。
HCV多肽是一种如上所述的衍生自HCV多蛋白的多肽。该多肽不需要物理衍生自HCV,但可以是合成或重组产生的。另外,该多肽可衍生自任何各种HCV株和分离物,如但不限于来自HCV株1、2、3、4、5或6的任一分离物。在这些株之间有许多保守和可变的区域,一般当两条序列排列时,衍生自这些区域的表位的氨基酸序列将具有高程度的序列同源性,例如高于30%,优选高于40%的氨基酸序列同源性。因此,例如术语“NS3/4a”多肽指任何各种HCV株的天然NS3/4a和NS3/4a类似物、突变蛋白和免疫原性的片段(如下进一步定义)。许多这些病毒株的完整基因型是已知的。参见如美国专利No.6,150,087和GenBank登录号AJ238800和AJ238799。
术语“类似物”和“突变蛋白”指参照分子的生物活性衍生物,或这些衍生物保留所需活性(如在本文所述的测定中的免疫反应性)的片段。通常,术语“类似物”指具有天然多肽序列和结构,以及相对于天然分子的一个或多个氨基酸添加、取代(通常性质保守)和/或缺失的化合物,只要修饰不破坏免疫原性的活性。术语“突变蛋白”指具有一种或多种肽模拟物(“类肽”)的肽,如国际出版物号WO91/04282中所述的。优选类似物或突变蛋白至少具有与天然分子相同的免疫活性。制备多肽类似物和突变蛋白的方法是本领域已知的,如下进一步所述。
特别优选的类似物包括性质上保守的取代,即这些取代发生在与它们的侧链有关的一类氨基酸中。具体而言,氨基酸一般被分成四类:(1)酸性--天冬氨酸和谷氨酸;(2)碱性--赖氨酸、精氨酸、组氨酸;(3)非极性--丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸;(4)无电荷的极性--甘氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、丝氨酸、苏氨酸、酪氨酸。有时将苯丙氨酸、色氨酸和酪氨酸归为芳族氨基酸。例如,有理由预测:单独用异亮氨酸或缬氨酸取代亮氨酸、用谷氨酸取代天冬氨酸、用丝氨酸取代苏氨酸,或者用结构上相关的氨基酸取代类似的保守的氨基酸,这样的取代将不会对生物活性有重要影响。例如,感兴趣的多肽可包括多达约5-10个保守的或不保守的氨基酸取代,甚至多达约15-25个保守的或不保守的氨基酸取代,或2-25之间任何整数,只要该分子的所需功能仍维持完整。本领域的熟练技术人员可结合本领域熟知的Hopp/Woods和Kyte-Doolittle曲线图,容易地测定感兴趣的分子中可耐受改变的区域。
术语“片段”指仅由完整的全长多肽序列和结构的一部分组成的多肽。该片段可包括该天然多肽的C末端缺失和/或N末端缺失。特定的HCV蛋白质的“免疫原性片段”一般包括至少该全长分子的约5-10个连续的氨基酸残基,较佳至少含有该全长分子的约15-25个连续的氨基酸残基,最佳至少含有该全长分子的约20-50个或以上的连续的氨基酸残基,这些氨基酸残基限定了一个表位;或者含有5个氨基酸和全长序列之间的任何整数,只要所述的片段在测定中保留免疫活性。例如,用于MEFA的优选的免疫原性片段,包括但不限于HCV核心的片段,包含例如多蛋白的氨基酸10-45、10-53、67-88和120-130,表位5-1-1(在病毒基因组的NS3区域中)和衍生自HCV多蛋白的E1、E2、c33c(NS3)、c100(NS4),NS3/4a和NS5区域的限定的表位,以及从HCV多蛋白中鉴定出的任何其它各种表位。见例如Chien等,Proc.Natl.Acad.Sci.USA(1992),89:10011-10015;Chien等,J.Gastroent.Hepatol.,(1993),8:S33-39;Chien等,国际出版物WO 93/00365;Chien,D.Y.,国际出版物WO 94/01778;美国专利No.6,150,087和6,121,020。
术语“表位”在文中指至少约有3-5个、较佳地约5到10或15个、但不超过约1000个氨基酸(或其中的任何整数)的序列;它定义了一条自身或作为较大序列的一部分,与在对其应答中产生的抗体结合的序列。该片段的长度没有严格的上限,它几乎可包含蛋白质序列的全长,甚至包括含有HCV多蛋白的两个或多个表位的融合蛋白。用于本发明的表位并不限于具有衍生了它的母体蛋白质部分的确切序列的多肽。实际上,病毒基因组处于恒定流动的状态,且含有几种在隔离种群间具有相对高度易变性的可变结构域。因而,术语“表位”包括与天然序列相同的序列,以及该天然序列的修饰物,如缺失、添加和取代(通常性质保守)。
可使用任何数量的本领域周知的表位作图技术来鉴别包括表位在内的给定多肽的区域。参见,如《分子生物学方法》(Methods in Molecular Biology)中的表位作图程序,第66卷(Glenn E.Morris编辑,1996),Humana Press,Totowa,New Jersey。例如,通过如同时在固相支持物上合成大量的肽,对应于蛋白质分子的部分的肽,在这些肽仍连接于该支持物时使肽与抗体反应,就可测定各线性表位。这些技术在本领域中是已知的,并在美国专利No.4,708,871;Geysen等(1984),Proc.Natl.Acad.Sci.USA,81:3998-4002;Geysen等(1985)Proc.Natl.Acad.Sci.USA 82:178-182;Geysen等(1986),Molec.Immunol.,23:709-715中有所描述。用这些技术鉴定了许多HCV的表位。参见如Chien等,《病毒性肝炎和肝病》(Viral Hepatitis and Liver Disease)(1994),第320-324页和下文。类似地,通过使用如X-射线结晶学和二维核磁共振法测定氨基酸的空间构象容易地鉴定构象表位。参见如“表位作图流程”,上述。还可使用标准抗原性曲线图和亲水性图,如用从Oxford Molecular Group获得的Omiga 1.0版软件程序,也可鉴别蛋白质的抗原区域。此计算机程序采用Hopp/Woods方法(Hopp等,Proc.Natl.Acad.Sci USA(1981),78:3824-3828)确定抗原性图谱,并用Kyte-Doolittle技术(Kyte等,J.Mol.Biol.(1982),157:105-132)绘制亲水性图。
关于各种HCV表位的描述,可参见Chien等,Proc.Natl.Acad.Sci.USA(1992)89:10011-10015;Chien等,J.Gastroent.Hepatol.(1993)8:S33-39;Chien等,国际出版物No.WO 93/00365;Chien,D.Y.,国际出版物No.WO94/01778;和美国专利6280927和6150087。
术语“构象表位”在文中指全长蛋白质的一部分,或其类似物或突变蛋白,它具有编码该全长天然蛋白质内的表位的氨基酸序列的结构特征。天然的结构特征包括但不限于糖基化和三维结构。表位限定的序列的长度可广泛改变,因为据信这些表位是通过抗原的三维形状形成的(例如折叠)。因此限定该表位的氨基酸可以数量相对少,但沿着分子的长度(或者甚至在二聚体等的情况下对于不同的分子)广泛地分散,通过折叠形成正确的表位构象。限定表位的残基之间的抗原部分对于表位的构象结构不是关键的。例如,这些间插序列的缺失或取代可能不影响构象表位,条件是保留对于表位构象关键的序列(例如涉及二硫键、糖基化位点的半胱氨酸等)。
可用上述方法容易鉴别NS3/4a区域中存在的构象表位。另外,在给定的多肽中构象表位的存在与否可通过用抗体(构象表位的多克隆血清或单克隆抗体)筛选感兴趣的抗原,并将它的反应性与仅保留线性表位(如存在)的抗原的变性形式比较来确定。在用多克隆抗体的筛选中,有利的是首先用变性的抗原吸附多克隆血清,看其是否保留针对感兴趣的抗原的抗体。另外,在NS3/4a的情况中,保留天然构象的分子还具有蛋白酶活性,和任选的解旋酶活性。这些活性可用酶测定检测(如下所述)。
较佳地,重组产生构象表位,并使它在一种在保留其所需结构特征的条件下(如表位没有变性)能被抽提出来的细胞中表达。这样的细胞包括细菌、酵母、昆虫细胞和哺乳动物细胞。HCV多蛋白的重组构象表位的表达和分离在如国际出版物WO 96/04301、WO 94/01778、WO 95/33053、WO 92/08734中有描述。另外,可能表达抗原并在回收后使蛋白质复性。还理解化学合成也可提供构象抗原模拟表位(mimitopes),它与“天然”抗原的构象表位交叉反应。
本文所用的术语“多表位融合抗原”或“MEFA”指一种多肽,其中多个HCV抗原是一条单一、连续的氨基酸链的部分,该链在天然中不存在。HCV抗原可以直接通过肽键彼此连接,或通过插入氨基酸序列分隔。融合抗原还可以含有相对于该HCV多蛋白而言外源的序列。另外,存在的HCV序列可以来自HCV的多基因型和/或分离物。本免疫测定中所用的具体的MEFA的例子在例如国际出版物WO01/96875、WO01/09609、WO97/44469和美国专利6514731和6428792中描述。
“抗体”指通过化学或物理方法与感兴趣的多肽专一性结合的分子。因此,HCV NS3/4a抗体是一种与HCVNS3/4a蛋白的表位特异性结合的分子。本文所用的术语“抗体”包括从多克隆和单克隆制备物获得的抗体,及以下:杂交(嵌合)抗体分子(参见如Winter等(1991)Nature 349:293-299;和美国专利No.4,816,567);F(ab′)2和F(ab)片段;Fv分子(非共价异二聚体,参见如Inbar等(1972)Proc.Natl.Acad.Sci.USA69:2659-2662;和Ehrlich等(1980)Biochem19:4091-4096);单链Fv分子(sFv)(参见如Huston等(1988)Proc.Natl.Acad.Sci.USA 85:5879-5883);二聚和三聚抗体片段构建物;小体(minibodies)(参见如Pack等(1992)Biochem 31:1579-1584;Cumber等(1992)J Immunology 149B:120-126);人源化抗体分子(参见如Riechmann等(1988)Nature 332:323-327;Verhoeyan等(1988)Science 239:1534-1536;和英国专利申请No.GB 2,276,169,1994年9月21日出版);和从这些分子获得的任何功能性片段,其中这些片段维持亲本抗体分子的免疫结合性质。
“重组”蛋白质是指保留了所需活性的通过本文所述的重组DNA技术制得的蛋白质。通常,克隆感兴趣的基因,然后在转化的生物体中表达(如下所述)。宿主生物体表达外源基因,从而在表达条件下产生该蛋白。
当涉及一种多肽时,“分离”意味着所述的分子从发现该分子天然存在的整个生物体中分离和分开,或基本不存在其它相同类型的生物大分子。术语“分离”对于多核苷酸是:一种核酸分子,它完全或部分缺乏通常与其天然结合的序列;或一个序列,因为它天然存在,但具有与其结合的异源序列;或从染色体解离的分子。
“等效抗原决定簇”指来自HCV的不同亚种或株的抗原决定簇,例如HCV株1、2、3等。更特别地,表位是已知的,如5-1-1,和病毒株1、2和3之间的表位有变化。因此,这三种不同病毒株的表位5-1-1是等效的抗原决定簇,即使它们的序列不相同,它们也是“拷贝”。等效抗原决定簇的氨基酸序列通常具有高度的序列同源性,例如当两个序列对比时,大于30%的氨基酸序列同源性,较佳地大于40%的氨基酸序列同源性。
“同源性”指两个多核苷酸或两条多肽部分之间的相似性百分数。两条DNA或两条多肽序列在确定的分子长度内,当序列显示有至少约50%,优选至少约75%、更佳至少约80-85%、尤其佳至少约90%、最佳至少约95-98%序列相似性时,彼此“基本上同源”。如本文所述,基本同源也指显示与特定的DNA或多肽序列具有完全同一性的序列。
通常,“同一性”指两条多核苷酸或多肽序列上准确的核苷酸对核苷酸或者氨基酸对氨基酸对应。通过排列两个分子的序列直接比较它们的序列信息,计算两条排列的序列间匹配的准确数量,将其除以较短序列的长度,然后乘以100,从而可得到同一性百分数。
在相似性和同一性分析中可辅助使用易于获得的计算机程序,如ALIGN、Dayhoff、M.O.(Atlas of Protein Sequence and Structure、M.O.Dayhoff编辑,5Suppl.,3:353-358,National Biomedical Research Foundation,Washington,DC),它适用于Smith和Waterman分析肽用的局部同源性算法(Advances in Appl.Math.,2:482-489,1981)。可从Wisconsin Sequence Analysis Package(第8版,从Genetics Computer Group,Madison,WI获得)获得测定核苷酸序列相似性和同一性的程序,例如,BESTFIT、FASTA和GAP程序,这些程序也依赖于Smith和Waterman算法。使用制造者建议的和上述Wisconsin Sequence AnalysisPackage所述的默认参数可容易地使用这些程序。例如,可使用Smith和Warerman的同源性算法的默认计分表和6个核苷酸位置的间隔罚分(gap penalty)测定的核苷酸序列与参比序列的相似性百分数。
本发明建立相似性百分数的另一方法是使用版权属于爱丁堡大学、由John F.Collins和Shane S.Sturrok开发、由IntelliGenetics,Inc.(Mountain View,CA)发行的MPSRCH程序包。Smith-Waterman算法可在这套程序包中使用,其中,在计分表中使用默认参数(例如,间隔开放罚分=12,间隔延伸罚分=1,间隔=6)。从这批数据产生的“匹配”值反映出“序列相似性”。计算序列间的同一性百分数或相似性百分数的其它合适的程序在本领域中一般都是已知的,例如,另一种排列程序是BLAST,使用默认参数。例如,可使用下述默认参数的BLASTN和BLASTP:基因编码=标准;过滤=无;链=两者;截留=60;期望值=10;矩阵=BLOSUM62;描述=50个序列;排序=HIGH SCORE;数据库=无冗余,GenBank+EMBL+DDBJ+PDB+GenBank CDS翻译+Swiss蛋白+Spupdate+PIR。在http://www.ncbi.nim.gov/cgi-bin/BLAST网址上可查到这些程序的详细描述。
或者,在同源区域之间形成稳定的双链体的条件下进行多核苷酸杂交,接着用单链特异性核酸酶消化,测定消化的片段的大小,从而测出同源性。在如(对具体的体系所定义的)严格条件下进行的Southern杂交试验中,可鉴别基本同源的DNA序列。确定适当的杂交条件在本领域熟练技术人员所掌握的知识之内。例如,参见Sambrook等,同上;DNA克隆,同上;核酸杂交,同上。
“一般固相支持物”指一个单一固相基质,免疫测定所用的HCV多肽与其共价或通过非共价方式,例如疏水性吸附结合。
“免疫反应性”指所关心的抗原与HCV感染的个体的生物样品中存在的抗-HCV抗体特异地反应。
“免疫复合物”指当抗体和抗原上的表位结合时形成的组合。
本文所用的“生物样品”指从受试者中分离的组织或液体的样品,包括(但不限于)血液、血浆、血清、粪便物、尿液、骨髓、胆汁、脊髓液、淋巴液、皮肤样品、皮肤分泌物、呼吸道分泌物、肠道分泌物和泌尿生殖道分泌物、泪液、唾液、乳液、血细胞、器官、活组织检查和体外细胞培养组分的样品,包括但不限于细胞和组织在培养基中生长获得的条件培养基,例如重组细胞和细胞成分。
本文所用的术语“标记”和“可检测标记”指能检测的分子,包括但不限于反射性同位素、荧光素、化学发光物、生色团、酶、酶底物、酶辅因子、酶抑制剂、生色团、染料、金属离子、金属溶胶、配体(例如生物素、链霉亲和素和半抗原)等。术语“荧光素”指能在可检测范围内显示荧光的物质或其部分。可在本发明中使用的标记的特定例子包括但不限于,辣根过氧化物酶(HRP)、荧光素、FITC、罗丹明、丹磺酰、伞形酮、二甲基吖啶鎓酯(DMAE)、德克萨斯红、鲁米诺、NADPH和α-β-半乳糖苷酶。
II.本发明的实施方式
在详细描述本发明之前,应理解本发明并非局限于特定的制剂或工艺参数,它们当然是可以变化的。还应理解本文所用的术语仅用于说明本发明具体实施例的目的,而并非对其限定。
虽然大量与本文所述类似或相等的组合物和方法可用于本发明的实践中,但本文描述了优选的材料和方法。
如上所述,本发明基于以下发现:新颖的抗原/抗体/抗原夹心检测方法可用于准确检测HCV感染。这些方法可快速、有效地实施,并消除使用大样品体积可能产生的背景影响。这些方法较佳使用存在于HCV血清转化的早期阶段期间的高度免疫原性HCV抗原,从而增加检测准确度,并减少假结果的产生率。
具体而言,本文所述的免疫测定使用两种基本的HCV抗原,一种存在于固相中,另一种存在于液相中。两种抗原都能结合感染个体的生物样品中存在的HCV抗体。用于本检测中的一种抗原是得自HCV多蛋白的区域的分离的抗原。所使用的第二抗原是含有得自相同或不同HCV基因型和分离物的各种HCV多肽的多表位融合抗原(“MEFA”)。该MEFA包括至少一种或多种衍生自与分离的HCV抗原相同的HCV多蛋白区域的表位。
在特别优选的实施例中,用于本检测的抗原之一是衍生自HCV多蛋白的NS3/4a区域的高度免疫原性构象表位。在这些实施例中,所使用的第二抗原是包含一种或多种得自NS3/4a区域(线性或构象的)的表位的MEFA,如下文所述。因此,MEFA可包括衍生自一种或多种HCV分离物的NS3/4a区域的多个优势免疫表位。如果在多表位融合中使用多个NS3/4a表位,这些表位可以是相同或不同的表位。或者,融合抗原可包括一种或多种衍生自NS3/4a区域的表位,以及得自其它HCV区域如(无限制的)HCV核心、E1、E2、P7、NS4b、NS5a和NS5b序列的主要线性表位。
可使用下文所述的任何几种检测方式,如(但不限于)使用结合了分离的HCV抗原(如NS3/4a构象表位)或MEFA的固相支持物的检测形式,以简单的检测来方便地实施这些方法。因此,MEFA可以液相或固相的形式提供。如果提供在溶液中,分离的HCV抗原则存在于固相中。
例如,在本发明的一个代表性方法中,在固相支持物上实施检测,该固相支持物已结合有一种或多种包含一种或多种衍生自HCV多蛋白的NS3/4a区域的构象表位。在此实施例中,MEFA存在于液相中。在另一实施例中,在构象支持物上实施检测,该固相支持物已结合有一种或多种MEFA。在此实施例中,含有构象NS3/4a表位的多肽存在在液相中。因此,如果构象NS3/4a表位存在于固相支持物中,MEFA则存在在液相中,或者相反。
为了进一步理解本发明,以下将就用于本发明方法的各种HCV多肽抗原和MEFA以及蛋白质的生产和使用蛋白质的方法提供更详细的讨论。
HCV抗原和MEFA
HCV株的基因组含有长约9000-12000个核苷酸的单一开放读框,它被转录成多蛋白。如图1和表1所示,HCV多蛋白在切割后产生至少10种不同的产物,其顺序为NH2-核心-E1-E2-p7-NS2-NS3-NS4a-NS4b-NS5a-NS5b-COOH。核心多肽的位置为1-191,相对于HCV-1编号(HCV-1的基因组可参见,Choo等人,(1991)Proc.Natl.Acad.Sci.USA 88:2451-2455)。进一步加工该多肽产生约1-173个氨基酸的HCV多肽。包膜多肽E1和E2分别出现在192-383和384-746位。在约747-809位点发现P7区域。NS2是具有蛋白水解活性的膜内在蛋白,且约位于多蛋白的810-1026。NS2与NS3(位于1027-1657),切割NS2-NS3的sissle键,从而产生NS3N-末端并释放大的多蛋白,具有丝氨酸蛋白酶和RNA解旋酶活性。在约1027-1207位发现的NS蛋白酶用于加工余下的多蛋白。在约1193-1657位发现解旋酶活性。NS3释放出NS3辅因子(NS4a,位置为约1658-1711)、两种蛋白质(NS4b的位置为约1712-1972,和NS5a的位置为约1973-2420)和RNA-依赖性RNA聚合酶(NS5b的位置为约2421-3011)。多蛋白熟化的完成由NS3-NS4连接处的自催化裂解引发,由NS3丝氨酸蛋白酶催化。
*相对于HCV-1编号。参见Choo等人(1991)Proc.Natl.Acad.Sci.USA88:2451-2455。
本发明方法的一个组成是得自上述HCV多蛋白任何各个区域中的任一个的分离的抗原。已测定了多种HCV株和分离物的核酸和氨基酸序列,包括上述各种区域的核酸和氨基酸序列。例如,Kubo等人(1989),Japan.Nucl.Acids.Res,17:10367-10372;Takeuchi等人(1990),Gene,91:287-291;Takeuchi等人(1990),J.Gen.Virol.,71:3027-3033以及Takeuchi等人(1990),Nucl.Acids Res.,18:4626中描述了分离物HCV J1.1。两个独立的分离物HCV-J和BK的完整的编码序列分别由Kato等人〔(1990),Proc.Natl.Acad.Sci.USA,87:9524-9528〕和Takamizawa等人〔(1991),J.Virol.,65:1105-1113〕描述。
描述HCV-1分离物的出版物包括Choo等人(1990),Brit.Med.Bull.,46:423-441;Choo等人(1991),Proc.Natl.Acad.Sci.USA,88:2451-2455和Han等人(1991),Proc.Natl.Acad.Sci.USA,88:1711-1715。在Okamoto等人(1991),Japan J.Exp.Med.,60:167-177中描述了HCV分离物HC-J1和HC-J4。Weiner等人(1991),Virol.,180:842-848中描述了HCV分离物HCT 18-、HCT 23、Th、HCT 27、EC1和EC10。在Enomoto等人(1990),Biochem.Biophys.Res.Commun.,170:1021-1025中描述了HCV分离物Pt-1、HCV-K1和HCV-K2。在Tsukiyama-Kohara等人(1991),Virus Genes,5:243-254中描述了HCV分离物A、C、D和E。
因此,例如,可从任何一种这些HCV分离物的核心区域衍生得到分离的HCV抗原。这个区域出现在该HCV多蛋白的第1-191位氨基酸(相对于HCV-1编号)。该全长蛋白质、其片段(如氨基酸1-150,如氨基酸1-130、1-120,例如氨基酸1-121、1-122、1-123等)或含有该全长蛋白质的表位的较小片段都可用于本发明方法,所述表位如在第10-53个氨基酸、第10-45个氨基酸、第67-88个氨基酸、第120-130个氨基酸之间发现的那些表位,或者在以下文献中鉴别的任何核心表位:如Houghton等人,美国专利第5350671;Chien等人,Proc.Natl.Acad.Sci.USA(1992),89:10011-10015;Chien等人,J.Gastroent.Hepatol.(1993),8:S33-39;Chien等人,国际出版物第WO 93/00365号;Chien,D.Y.,国际出版物第WO 94/01778;和美国专利第6280927号和6150087号。此外,可使用由多蛋白的核心区域中的移码产生的蛋白质(如国际出版物WO99/63941中所述)。
类似地,可将得自HCV E1和/或E2区域的多肽用作本发明方法中的分离的HCV抗原。E2存在于多个物种中(Spaete等,Virol.(1992)188:819-830;Selby等,J.Virol.(1996)70:5177-5182;Grakoui等,J.Virol.(1993)67:1385-1395;Tomei等,J.Virol.(1993)67:4017-4026),裁剪和蛋白水解可出现在E2多肽的NB和C末端。因此,用于本文的E2多肽可含有HCV多蛋白的氨基酸405-661,如400、401、402、……到661。如383或384-661、383或384-715、383或384-746、383或384-749或383或384-809、或383或384到661-809之间的任一C末端,相对于全长HCV-1多蛋白编号。类似地,用于本文的E1多肽可含有HCV多蛋白的氨基酸192-326、192-330、192-360、192-363、192-383、或192到326-393之间的任一C末端。
含有表位的E1和/或E2的免疫原性片段也用于本发明方法中。例如,E1多肽片段可包括从E1多肽约5个氨基酸到近全长分子,如6、10、25、50、75、100、125、150、175、185个或更多氨基酸或所示数字间任何整数。类似地,E2多肽片段可包含E2多肽的6、10、25、50、75、100、150、200、250、300或350个氨基酸,或所述数字之间的任何整数。
例如,衍生自如E2的超变区(例如跨越氨基酸384-410或390-410的区域)的表位可包括在这些融合体中。掺入到E2序列中的特别有效的E2表位是含有衍生自此区域的共有序列的表位,所述共有序列如Gly-Ser-Ala-Ala-Arg-Thr-Thr-Ser-Gly-Phe-Val-Ser-Leu-Phe-Ala-Pro-Gly-Ala-Lys-Gln-Asn,代表HCV类型1基因组氨基酸390-410的共有序列。E1和E2的其它表位是已知的,并描述于如Chien等,国际公开号WO 93/00365。
此外,E1和/或E2多肽可缺乏所有或部分跨膜结构域。关于E1,一般终止于约氨基酸370位和更高(以HCV-1E1编号为基础)的多肽由ER保留并因此不分泌入培养基。关于E2,终止于约氨基酸731位和更高(也以HCV-1E2序列编号为基础)的多肽由ER保持并因此不分泌。(参见例如出版于1996年2月15日的国际出版物WO 96/04301)。应该指出这些氨基酸位置不是绝对的,且可一定程度变化。因此,本发明考虑使用保留跨膜结合结构域的E1和/或E2多肽,以及缺乏所有或部分跨膜结合结构域的多肽,包括终止于约氨基酸369位和更低的E1多肽和终止于约氨基酸730位和更低的E1多肽。此外,C-末端截短可延伸超出跨膜结构域到N-末端。因此,例如发生在位置低于如360的E1截短和发生在低于如715位的E2截短也可包括在本发明中。必要的是截短的E1和E2多肽保持用于所需目的的功能。然而,特别优选的截短E1构建物是那些延伸不超过约氨基酸300的构建物。最优选的是在360位终止。优选的截短的E2构建物是其C末端截短延伸不超过氨基酸715位的构建物。特别优选的是,E2截短是在氨基酸715-730中的任一氨基酸(如725)之后截短。
此外,可将得自NS3、NS4、NS5a或NS5b区域的表位用作分离的HCV抗原。特别优选的是使用得自NS3/4a区域的表位。已描述了HCV多蛋白的NS3/4a区域,且该蛋白的氨基酸序列和整体结构已公开于:如Yao等,Structure(1999年11月)7:1353-1363;Sali等,Biochem.(1998)37:3392-3401;和Bartenschlager,R.,J.Viral Hepat.(1999)6:165-181。同样,可参见Dasmahapatra等的美国专利No.5,843,752。本发明的免疫测定可使用至少一种衍生自NS3/4a区域的构象表位,其以天然的HCV粒子或其传染性产物中所发现的构象存在,这可通过由NS3/4a基因产物通常显示的蛋自酶和任选地解旋酶活性的保存和/或抗原与受HCV感染的对象的生物样品中的抗体的免疫反应性以及抗原变性后表位的免疫反应性验证。例如,通过加热、改变pH至极酸性或碱性或通过添加已知的有机变性剂(如二硫苏糖醇(DTT))或适当的去污剂破坏构象表位。参见如《蛋白质纯化方法,一种实用的方法》(Protein Purification Methods,a Practicalapproach)(E.L.V.Harris和S.Angal编辑,IRL Press),并将变性的产物与未进行上述处理的产物相比。
可用本领域已知的标准酶试验确定蛋白酶和解旋酶活性。例如,可用本领域已知的方法确定蛋白酶活性。参见如Takeshita等,Anal.Biochem.(1997)247:242-246;Kakiuchi等,J.Biochem.(1997)122:749-755;Sali等,Biochemistry(1998)37:3392-3401;Cho等,J.Virol.Meth(1998)72:109-115;Cerretani等,Anal.Biochem.(1999)266:192-197;Zhang等,Anal.Biochem.(1999)270:268-275;Kakiuchi等,J.Virol.Meth(1999)80:77-84;Fowler等,J.Biomol.Screen.(2000)5:153-158;和Kim等,Anal.Biochem.(2000)284:42-48。以下实施例阐述了一种特别方便的测试蛋白酶活性的测定。
类似地,解旋酶活性测定是本领域熟知的,且NS3/4a表位的解旋酶活性可用如下方法确定,例如ELISA分析(如Hsu等,Biochem.Biophys,Res.Commun.(1998)253:594-599中所述);闪烁亲近测定系统(如Kyono等,Anal.Biochem.(1998)257:120-126中所述);高通量筛选测定法(如Hicham等,Antiviral Res.(2000)46:181-193和Kwong等,Methods Mol.Med.(2000)24:97-116中所述);以及本领域已知的其它测定法。例如,参见Khu等,J.Virol.(2001)75:205-214;Utama等,Virology(2000)273:316-324;Paolini等,J.Gen.Virol.(2000)81:1335-1345;Preugschat等,Biochemistry(2000)39:5174-5183;Preugschat等,Methods Mol.Med.(1998)19:353-364;和Hesson等,Biochemistry(2000)39:2619-2625。
如果使用构象NS3/4a表位,抗原的长度应足以维持一种免疫反应性构象表位。通常,含有所用抗原的多肽几乎是全长的,然而也可以截短该多肽,以用于例如增加溶解性或改善分泌。一般而言,在NS3/4a中发现的构象表位在细胞中作为重组多肽表达,且该多肽提供所需形式的表位(如下详述)。
图3A-3D(SEQ ID NO:1和2)显示了NS3/4a多肽的代表性氨基酸序列。图3A-3D的2-686位所示的氨基酸序列相应于HCV-1的1027-1711位的氨基酸。1位显示了编码Met的起始密码子(ATG)。另外,在HCV-1的1428位通常出现的Thr(图3的氨基酸403位)突变为Pro,在HCV-1的1429位通常出现的Ser(图3的氨基酸404位)突变为Ile。然而,无论是天然序列(有或无N-末端Met)、所示的类似物(有或无N-末端Met)或其它类似物和片段都可用于本发明测定,只要该表位是采用保留或恢复其天然构象(如保留蛋白酶活性和任选地解旋酶活性)的方法产生的。Dasmahapatra等,美国专利No.5,843,752和Zhang等,美国专利No.5,990,276,他们都描述了NS3/4a的类似物。
在约1027-1207位发现NS3/4a的NS3蛋白酶,相对于HCV-1编号,图3上为2-182位。NS3蛋白酶的结构和活性位点是已知的,参见如De Francesco等,Antivir.Ther.(1998)3:99-109;Koch等,Biochemistry(2001)40:631-640。通常为耐受的天然序列上的变化将是分子活性位点以外的那些变化。具体说,需要维持图3的氨基酸1-或2-155(有少量或仅有保守性替代)。155位以外的氨基酸可以耐受更大的变化。另外,如果使用NS3/4a序列的片段,这些片段通常至少包括氨基酸1-或2-155,较佳地包括氨基酸1-或2-175,且最佳地包括氨基酸1-或2-182(有或无N-末端Met)。发现解旋酶结构域约在HCV-1的1193-1657位(图3的207-632位)。因此,如果需要解旋酶活性,就要维持分子的该部分有小量或仅有保守性变化。本领域技术人员根据NS3/4a的已知结构易确定耐受变化的其它区域。
含有衍生自NS3/4a的表位的许多抗原是已知的,包括但不限于衍生自c33c、c200、c100和5-1-1区域、以及含有NS3表位的融合蛋白(如c25)的抗原。
关于得自其它HCV区域的这些和其它各种HCV表位的描述,可参见如Houghton等人,美国专利第5350671;Chien等人,Proc.Natl.Acad.Sci.USA(1992),89:10011-10015;Chien等人,J.Gastroent.Hepatol.(1993),8:S33-39;Chien等人,国际出版物WO 93/00365号;Chien,D.Y.,国际出版物WO 94/01778;和美国专利6280927、6150087。
本文所述的免疫检测也使用多表位融合抗原(称为“MEFA”),如国际出版物WO01/96875、WO01/09609、WO97/44469和美国专利6514731、6428792中所述的。用于本发明检测的MEFA包含多个衍生自图1和表1所述的各种病毒区域的任一区域的表位,如上所述。
多个HCV抗原是单一、连续的氨基酸链的一部分,该链在自然中不出现。因此,表位的线性顺序与它们在基因组中出现的线性顺序不同。用于本文的MEFA的序列的线性顺序较佳以最优的抗原性排列。优选的是,这些表位得自一种以上的HCV株,从而可在单一检测中提供检测多种HCV菌株的增强的能力。因此,用于本文的MEFA可含有衍生自上述多蛋白的各种免疫原性区域。
如上所述,在特别优选的实施例中,将NS3/4a表位用作分离的HCV抗原。在此实施例中,MEFA包括至少一种或多种衍生自NS3/4a区域的表位(线性的或构象的)。因此,MEFA可包含衍生自多种一种或多种HCV分离物的NS3/4a区域的多个免疫优势表位。如果在多表位融合体中使用多个NS3/4a表位,则这些表位可以是相同或不同的。或者,融合抗原可包含一种或多种衍生自NS3/4a区域的表位,以及得自其它HCV区域(如不限于HCV核心、E1、E2、P7、NS4b、NS5a和NS5b序列)的主要线性表位。
含有衍生自NS3/4a区域的表位的多肽包括但不限于含有所有或部分NS3、NS4a和NS3/4a区域的多肽。得自这些区域的许多表位是已知的,包括但不限于衍生自c33c、c200和c100区域以及含有NS3表位的融合蛋白(如c25)的抗原。这些和其它NS3表位可用于本发明的检测中,并且是本领域已知的,在以下的文献中有描述:如Houghton等人,美国专利第5350671;Chien等人,Proc.Natl.Acad.Sci.USA(1992),89:10011-10015;Chien等人,J.Gastroent.Hepatol.(1993),8:S33-39;Chien等人,国际出版物WO 93/00365号;Chien,D.Y.,国际出版物第WO 94/01778;和美国专利6280927、6150087。
此外,已知为5-1-1的抗原决定簇部分存在于NS4a区域中(可参见图1),它特别可用于本发明检测所使用的MEFA中。此抗原决定簇以三种不同的形式在三种不同的HCV病毒株中出现。因此,在本发明的一个优选实施例中,5-1-1的所有三种形式出现在用于本发明免疫检测的多表位融合抗原中。
用于MEFA的其它HCV表位包括任何上述各种表位,如衍生自E2的高变区衍生的表位,如跨越氨基酸384-410或390-410的区域或得自此区域的共有序列(如上述,Gly-Ser-Ala-Ala-Arg-Thr-Thr-Ser-Gly-Phe-Val-Ser-Leu-Phe-Ala-Pro-Gly-Ala-Lys-Gln-Asn,SEQ ID NO:7),其代表1型HCV基因组的氨基酸390-410的共有序列。本发明MEFA中存在的代表性E2表位包含跨越氨基酸390-444的杂交表位。这种杂交E2表位可包含代表氨基酸390-410的共有序列,该序列融合于HCV E2的氨基酸411-444的天然氨基酸序列。
如上所述,可从各种HCV株衍生抗原。已知HCV的多种病毒株,且在融合蛋白中可用从任何这些株衍生的表位。已知任何特定种类的生物体的个体间互不相同,而且特定生物体如病毒可以有大量不同的株。例如,如上所述,HCV包括至少6种基因型。这些基因型各包括等效的抗原决定簇。更具体地说,各株包括大量抗原决定簇,它们存在于该病毒的所有株中,但各病毒株之间略有差异。类似地,也可能存在来自不同HCV株的核心区域的等效抗原决定簇。通常,等效抗原决定簇的氨基酸序列具有高度同源性,序列对比时其同源性程度通常为30%或更高,较佳地为40%或更高。本发明的多拷贝表位还可包含同一表位的精确拷贝的多拷贝。
用于本发明检测的代表性MEFA显示在图5、7和9A-9C中,并在国际出版物WO01/96875、WO01/09609、WO97/44469和美国专利6514731和6428792中描述。用于本文的代表性MEFA包括命名为MEFA 3、MEFA 5、MEFA 6、MEFA 7.1、MEFA 12、MEFA 13和MEFA 13.1的MEFA。应理解的是,这些MEFA仅仅是代表性的,衍生自HCV基因组的其它表位也可用于本发明的检测,并可掺入到这些和其它MEFA中。
图6A到6F显示了MEFA12的DNA序列及相应的氨基酸序列。图5显示了MEFA 12的结构通式,其如下:hSOD-E1(1型)-E2HVR共有序列(1a型)-E2HVR共有序列(1和2型)-c33c短(1型)-5-1-1(1型)-5-1-1(3型)-5-1-1(2型)-c100(1型)-NS5(1型)-NS5(1型)-核心(1+2型)-核心(1+2型)。这种多拷贝表位包括以下氨基酸序列,相对于HCV-1编号(以下所述的氨基酸编号是按照Choo等人(1991)Proc.Natl.Acad.Sci.USA 88:2451-2455中的编号标志进行的,其中氨基酸#1是由核心区域的编码序列编码的第一个甲硫氨酸):超氧化物歧化酶的氨基酸1-69(截短的SOD,用于提高蛋白质的重组表达);来自E1区域多蛋白的氨基酸303-320;多蛋白的氨基酸390-410,代表HCV-1a E2超变区的共有序列;来自区域E2多蛋白的氨基酸384-414,代表HCV-1和HCV-2的E2超变区的共有序列;HCV-1多蛋白的氨基酸1211-1457,其确定解旋酶;来自5-1-1,氨基酸1689-1735的表位的三种拷贝,一种来自HCV-1,一种来自HCV-3,另一种来自HCV-2,这些拷贝是HCV的三种不同病毒株的等效抗原性决定簇;HCV-1的HCV多肽C100,多蛋白的氨基酸1901-1936;来自HCV-1的NS5区域的表位的两种精确拷贝,各具有HCV多蛋白的氨基酸2278-2313;和来自核心区域三个表位的两种拷贝,两种来自HCV-1和一种来自HCV-2,这些拷贝是由HCV-1的氨基酸9-53和64-88以及HCV-2的氨基酸67-84代表的等效抗原决定簇。
表2显示了参考本文图6A-6F(SEQ ID NO:3和4)MEFA12中的各种表位的氨基酸位置。表中的编号以HCV-1为基础。见Choo等,Proc.Natl.Acad.Sci.USA 88:2451-2455。MEFA 13和13.1还共有MEFA12上面特定的通式,具有分别在表3和表4指明的修改。
表2MEFA12
MEFA aa# |
5′末端位点 |
表位 |
hcv aa# |
病毒株 |
1-69 |
Nco1 |
截短的hSOD |
|
|
72-89 |
MluI |
E1 |
303-320 |
1 |
92-112 |
HindIII |
E2HVR1a共有序列 |
390-410 |
1 |
113-143 |
|
E2HVR1+2共有序列 |
384-414 |
1,2 |
146-392 |
SpeI |
C33C短 |
1211-1457 |
1 |
395-441 |
SphI |
5-1-1 |
1689-1735 |
1 |
444-490 |
NruI |
5-1-1 |
1689-1735 |
3 |
493-539 |
ClaI |
5-1-1 |
1689-1735 |
2 |
542-577 |
AvaI |
C100 |
1901-1936 |
1 |
MEFA aa# |
5′末端位点 |
表位 |
hcv aa# |
病毒株 |
580-615 |
XbaI |
NS5 |
2278-2313 |
1 |
618-653 |
BglII |
NS5 |
2278-2313 |
1 |
654-741 |
NcoI |
核心表位 |
9-53,R47L64-8867-84 |
112 |
742-829 |
BalI |
核心表位 |
9-53,R47L64-8867-84 |
112 |
表3MEFA 13
MEFA aa# |
5′末端位点 |
表位 |
hcv aa# |
病毒株 |
1-156 |
Nco1 |
突变的hSOD(aa 70-72,ALA) |
|
|
161-178 |
MluI |
E1 |
303-320 |
1 |
181-201 |
HindIII |
E2HVR1a共有序列 |
390-410 |
1 |
202-232 |
|
E2HVR1+2共有序列 |
384-414 |
1,2 |
235-451 |
|
C33C短 |
1211-1457 |
1 |
454-500 |
HindIII |
5-1-1PI突变<sup>*</sup> |
1689-1735 |
1 |
503-549 |
NruI |
5-1-1PI突变<sup>*</sup> |
1689-1735 |
3 |
552-598 |
ClaI |
5-1-1PI突变<sup>*</sup> |
1689-1735 |
2 |
601-636 |
AvaI |
C100 |
1901-1936 |
1 |
639-674 |
XbaI |
NS5 |
2278-2313 |
1 |
677-712 |
BglII |
NS5 |
2278-2313 |
1 |
MEFA aa# |
5′末端位点 |
表位 |
hcv aa# |
病毒株 |
713-800 |
|
核心表位 |
9-53,R47L64-8867-84 |
112 |
801-888 |
|
核心表位 |
9-53,R47L64-8867-84 |
112 |
*通过消除可能由NS3/4a重组蛋白靶向的切割位点(CS或CA)修饰5-1-1表位。序列已变成PI,代替CS或CA。
表4MEFA 13.1
MEFA aa# |
5′末端位点 |
表位 |
hcv aa# |
病毒株 |
1-86 |
Nco1 |
突变的hSOD(aa 70-72,ALA) |
|
|
89-106 |
MluI |
E1 |
303-320 |
1 |
109-129 |
HindIII |
E2HVR1a共有序列 |
390-410 |
1 |
130-160 |
|
E2HVR1+2共有序列 |
384-414 |
1,2 |
163-379 |
|
C33C短 |
1211-1457 |
1 |
382-428 |
HindIII |
5-1-1PI突变<sup>*</sup> |
1689-1735 |
1 |
431-477 |
NruI |
5-1-1PI突变<sup>*</sup> |
1689-1735 |
3 |
480-526 |
ClaI |
5-1-1PI突变<sup>*</sup> |
1689-1735 |
2 |
529-564 |
AvaI |
C100 |
1901-1936 |
1 |
567-602 |
XbaI |
NS5 |
2278-2313 |
1 |
605-640 |
BglII |
NS5 |
2278-2313 |
1 |
MEFA aa# |
5′末端位点 |
表位 |
hcv aa# |
病毒株 |
641-728 |
|
核心表位 |
9-53,R47L64-8867-84 |
112 |
729-816 |
|
核心表位 |
9-53,R47L64-8867-84 |
112 |
*通过消除可能由NS3/4a重组蛋白靶向的切割位点(CS或CA)修饰5-1-1表位。序列已变成PI,代替CS或CA。
图8A到8F(SEQ ID NO:5和6)显示了另一代表性多表位融合抗原MEFA7.1的DNA序列及相应的氨基酸序列。图7显示了MEFA7.1的结构通式,其如下:hSOD-E1(1型)-E2HVR共有序列(1a型)-E2HVR共有序列(1和2型)-解旋酶(1型)-5-1-1(1型)-5-1-1(3型)-5-1-1(2型)-c100(1型)-NS5(1型)-NS5(1型)-核心(1+2型)-核心(1+2型)。这种多拷贝表位包括以下氨基酸序列,相对于HCV-1编号(以下所述的氨基酸编号是按照Choo等(1991)Proc.Natl.Acad.Sci.USA88:2451-2455中提供的编号标志,其中氨基酸#1是由核心区域的编码序列编码的第一个甲硫氨酸):超氧化物歧化酶的氨基酸1-156(SOD,用于提高蛋白质的重组表达);E1区域多蛋白的氨基酸303-320;多蛋白的氨基酸390-410,代表HCV-1a E2高变区的共有序列;区域E2多蛋白的氨基酸384-414,代表HCV-1和HCV-2的E2高变区的共有序列;HCV-1多蛋白的氨基酸193-1658,其确定解旋酶;5-1-1,氨基酸1689-1735的表位的三种拷贝,一种来自HCV-1,一种来自HCV-3,另一种来自HCV-2,这些拷贝是HCV的三种不同病毒株的等效抗原决定簇;HCV-1的HCV多肽C100,多蛋白的氨基酸1901-1936;HCV-1的NS5区域的表位的两种精确拷贝,各具有HCV多蛋白的氨基酸2278-2313;和核心区域的表位的两种拷贝,一种来自HCV-1和一种来自HCV-2,这些拷贝是由HCV-1的氨基酸9-32、39-42和64-88以及HCV-2的氨基酸67-84代表的等效抗原决定簇。
表5显示了参考本文图8A-8F(SEQ ID NO:5和6)的各种表位的氨基酸位置。
在一种检测模式中,如下文进一步所述的,将样品与固相支持物混合。该固相支持物包含分离的HCV抗原(如一种或多种NS3/4a构象表位)或上述MEFA,该MEFA包含一种或多种衍生自与HCV抗原相同的多蛋白区域(如NS3/4a区域)的表位。如上所述,已知许多包含这些表位的抗原,包括但不限于衍生自c33c和c100区域以及含有NS3表位的融合蛋白(如c25)的抗原,以及称为5-1-1部分存在于NS4a区域内的抗原决定簇(可参见图1)。这些和其它NS3/4a表位可用于本发明检测,并且是本领域已知的,如在以下文献中有描述:Houghton等人,美国专利第5350671;Chien等人,Proc.Natl.Acad.Sci.USA(1992),89:10011-10015;Chien等人,J.Gastroent.Hepatol.(1993),8:S33-39;Chien等人,国际出版物WO 93/00365号;Chien,D.Y.,国际出版物第WO 94/01778;和美国专利6280927、6150087。
如果样品受到HCV感染,针对固相支持物上存在的表位的HCV抗体将与该固相支持物组分结合。将也与该得自生物样品中的俘获的HCV抗体反应的可检测的标记抗原加入液相中。例如,如果结合于该固相支持物的抗原是NS3/4a构象表位,则用于液相中的可检测的标记抗原是包含NS3/4a表位的MEFA。如果结合于固相支持物的抗原是包含NS3/4a表位的MEFA,则用于液相的该可检测的标记抗原含有构象NS3/4a表位。
图2描述了本发明的代表性检测。如该图所示,固相支持物包含构象NS3/4a表位。将生物样品加到该固相支持物中。针对存在于该样品中的NS3/4a表位的HCV抗体将与该固相支持物上的该NS3/4a构象表位结合。然后加入辣根过氧化物酶(HRP)标记的含有样品抗体与之结合的表位的MEFA 12。MEFA 12与也与NS3/4a构象表位结合的抗体结合。洗掉未结合的成分,标记物的检测表明存在HCV感染。
由于使用了两种与样品抗体结合的抗原而使得可使用较大体积的样品,上述抗原/抗体/抗原夹心检测是特别有利的。此外,该检测可快速完成。
用于HCV免疫检测的抗原的生产
如上所述,通常用重组方法制备本发明的分子。因此,可以用标准分子生物学方法制备用于本发明的编码HCV抗原的多核苷酸。例如,用重组方法可以获得编码上述分子的多核苷酸序列,例如通过从表达基因的细胞筛选cDNA和基因组文库,或通过从已知的包括该基因的载体衍生该基因。另外,用本领域所述的方法,如Houghton等的美国专利No.5,350,671所述的方法,从病毒核酸分子直接分离出所需的基因。也可合成而非克隆制备感兴趣的基因。可用适当的特定序列的密码子设计该分子。然后将用标准方法制备的重叠的寡核苷酸装配完整的序列,并装配入完整的编码序列中。参见如Edge(1981)Nature 292:756;Nambair等(1984)Science 223:1299;和Jay等(1984)J.Biol.Chem.259:6311。
因此,从携带所需序列的载体可获得具体的核苷酸序列,或用本领域已知的各种寡核苷酸合成方法,如定位诱变和聚合酶链式反应(PCR),完全或部分合成。参见如Sambrook,同上。具体说,获得编码所需序列的核苷酸序列的方法是用常规的自动多核苷酸合成仪制备的退火补集的重叠的合成的寡核苷酸,然后用适当的DNA连接酶连接,并通过PVR扩增连接的核苷酸序列。参见如Jayaraman等(1991)Proc.Natl.Acad.Sci.USA 88:4084-4088。另外,在本发明中也可使用寡核苷酸定向的合成(Jones等,(1986)Nature 54:75-82)、先有核苷酸区域的寡核苷酸定向诱变(Riechmann等,(1988)Nature 332:323-327和Verhoeyen等(1988)Science 239:1534-1536)和用T4DNA聚合酶进行的酶促补平带缺口的寡核苷酸(Queen等(1989)Proc.Natl.Acad.Sci.USA 86:10029-10033),以提供抗原结合能力变化或提高的和/或免疫原性降低的分子。
一旦制备或分离了编码序列,就可将这些序列克隆入任何合适的载体或复制子中。对本领域技术人员而言,各种克隆载体是已知的,且适当的克隆载体的筛选只是选择问题。合适的载体包括(但不限于):质粒、噬菌体、转座子、粘粒、染色体或当与适当的控制元件结合时能复制的病毒。
然后将克隆序列置于合适的控制元件的控制下,这取决于用于表达的系统。因此,可以将编码序列置于启动子、核糖体结合位点(用于细菌表达)和任选地操纵子的控制下,从而由合适的转化体将感兴趣的DNA序列转录到RNA中。该编码序列可以包含或不包含信号肽或前导序列(随后可由宿主在翻译后加工除去)。参见如美国专利4,431,739、4,425,437、4,338,397。
除了控制序列外,可以添加调节序列,从而可以相对于宿主细胞的生长调节序列的表达。调节序列是本领域技术人员已知的,其实例包括那些能导致应答化学或物理刺激(包括调节化合物的存在)启动或关闭基因表达的调节序列。载体中还可存在其它类型的调节元件。例如,可以使用增强子元件以增加构建物的表达水平。实例包括SV40早期基因增强子(Dijkema等(1985)EMBO J.4:761);从Rous肉瘤病毒的长末端重复序列(LTR)衍生的增强子/启动子(Gorman等(1982)Proc.Natl.Acad.Sci.USA 79:6777);和从人CMV衍生的元件(Boshart等,(1985)Cell 41:521),如CMV内含子A序列中包括的元件(美国专利No.5,688,688)。表达盒还可包括在合适的宿主细胞中自主复制的复制起点、一种或多种可选择的标记物、一个或多个限制酶切位点、高拷贝数的潜势(potential)和强启动子。
构建表达载体,使具体的编码序列位于该具有适当调节序列的载体中,与控制序列有关的编码序列的位置和取向使编码序列在控制序列的“控制”下转录(即,结合于控制序列中DNA分子的RNA聚合酶转录该编码序列)。可能需要对编码感兴趣分子的序列进行修饰来实现此目的。例如,在一些情况中可能需要修饰该序列,从而使其连接于适合取向的控制序列,即维持读框。在插入到载体之前,控制序列和其它调节序列可连接于编码序列。或者,可以将编码序列直接克隆入已包含控制序列和合适的限制酶切位点的表达载体中。
如上所述,还可能需要制备感兴趣的抗原的突变体或类似物。尤其对NS3/4a而言。如此制备的方法在如下文献中有描述,如Dasmahapatra等的美国专利No.5,843,752和Zhang等的美国专利No.5,990,276。通过缺失一部分编码感兴趣的多肽的序列、插入序列、和/或替代该序列内的一个或多个核苷酸,可以制备用于分析的这种和其它HCV蛋白的突变体或类似物。修饰核苷酸序列的方法,如定向诱变等是本领域技术人员所熟知的。参见如Sambrook等,上述;Kunkel,T.A.(1985)Proc.Natl.Acad.Sci.USA(1985)82:448;Geisselsoder等(1987)BioiTechniques 5:786;Zoller和Smith(1983)MethodsEnzymol.100:468;Dalbie-McFarland等(1982)Proc.Natl.Acad.Sci USA 79:6409。
这些分子可以在各种系统中表达,包括本领域熟知的昆虫、哺乳动物、细菌、病毒和酵母表达系统。
例如,昆虫细胞表达系统如杆状病毒系统是本领域技术人员已知的,描述于如Summers和Smith,Texas Aguricultural Experiment Station BulletinNo.1555(1987)。用于杆状病毒/昆虫细胞表达系统的材料和方法都是可以试剂盒形式购得的,尤其是Invitrogen,San Diego CA(″MaxBac″试剂盒)。类似地,细菌和哺乳动物细胞表达系统也是本领域熟知的,其描述见如Sambrook等,同上。酵母表达系统也是本领域熟知的,其描述见如《酵母遗传工程》(Yeast GeneticEngineering)(Barr等编辑,1989)Butterworths,London。
许多用于上述系统的合适的宿主细胞也是已知的。例如,哺乳动物细胞系是本领域已知的,其包括可从美国典型培养物保藏中心(ATCC)获得的无限增殖的细胞系,如(但并非限于)中国仓鼠卵巢细胞(CHO)、Hela细胞、幼仓鼠肾(BHK)细胞、猴肾细胞(COS)、人胚肾细胞、人肝细胞癌细胞(如Hep G2)、Madin-Darby牛肾(″MDBK″)细胞等。类似地,在本发明的表达构建物中也可使用细菌宿主,如大肠杆菌(E.coli)、枯草杆菌(Bacillus subtilis)和链球菌(Streptococcus spp.)。在本发明中还可用酵母宿主,特别包括酿酒酵母(Saccharomyces cerevisiae)、麦芽糖假丝酵母(Candida maltosa)、白色念珠菌(Candida albicans)、多形汉逊酵母(Hansenula polymorpha)、脆壁克鲁维酵母(Kluyveromyces fragilis)、乳酸克鲁维酵母(Kluyveromyces lactis)、季也蒙氏毕赤酵母(Pichia guillerimondii)、巴斯德毕赤酵母(Pichia pastoris)、粟酒裂殖酵母(Schizosaccharomyces pombe)和解脂耶罗威亚酵母(yarrowia lipolytica)。可与杆状病毒表达载体一起使用的昆虫细胞特别包括埃及伊蚊(Aedes aegypti)、苜蓿银纹夜蛾(Autographa californica)、家蚕(Bombyx mori)、黑腹果蝇(Drosophila melanogaster)、草地夜蛾(Spodopterafrugiperda)和粉纹夜蛾(Trichoplusia ni)。
用本领域熟知的各种基因送递的方法,可将包含感兴趣的核苷酸序列的核酸分子稳定地整合入宿主细胞基因组中或在合适的宿主细胞中的稳定的附加型元件上维持。参见如美国专利No.5,399,346。
根据所选用的表达系统和宿主,在表达蛋白质的条件下,培养用如上所述的表达载体转化的宿主细胞制备该分子。然后从宿主细胞分离出表达的蛋自质并纯化。如果表达系统将蛋白质分泌到生长培养基中,则直接从培养基纯化产物。如果不是分泌的,则从细胞裂解液分离。合适的培养条件和回收方法的选择都是本领域技术人员能力之内的。
已描述了各种HCV抗原的重组制备。参见如Houghton等,美国专利No.5,350,671;Chien等,J.Gastroent.Hepatol.(1993)8:S33-39;Chien等,国际出版物No.WO 93/00365;Chien,D.Y.,国际出版物No.WO 94/01778。
免疫诊断试验
一旦产生,将上述HCV抗原置于合适的固相支持物上,用于本发明的免疫试验。为了本发明的目的,固相支持物可以是任何物质,它是不溶性的基质,并可具有粗糙或半粗糙的表面。示范性的固相支持物包括(但并非限于)基质如硝化纤维素(如以膜或微量滴定孔形式);聚氯乙烯(如板或微量滴定孔);聚苯乙烯乳胶(如珠或微量滴定板);聚偏1,1-二氟乙烯;重氮化纸;尼龙膜;活化珠、磁力感应珠等。具体的支持物包括板、小球、皿、毛细管、空心纤维、针、钉、固体纤维、纤维素珠、微孔玻璃珠、硅胶、聚苯乙烯珠(任选地与二乙烯苯交联)、嫁接的共聚珠、聚丙烯酰胺珠、乳胶珠、二甲基丙烯酰胺珠(任选地与N-N′-二-烯丙酰乙烯二胺交联)和用疏水聚合物包膜的玻璃珠。
如果需要,易将待加到固相支持物上的分子功能化,产生苯乙烯或丙烯酸部分,能让该分子掺入聚苯乙烯、聚丙烯酸酯或其它聚合物如聚酰亚胺、聚丙烯酰胺、聚乙烯、聚乙烯、聚二乙炔、聚苯撑-乙烯、多肽、多糖、聚砜、聚吡咯、聚咪唑、聚噻吩、聚醚、环氧树脂、石英玻璃、硅胶、硅氧烷、多磷酸盐、水凝胶、琼脂糖、纤维素等。
在一实例中,在使分子充分地固定于支持物的合适的结合条件下,首先将固相支持物与分离的HCV抗原或MEFA(在此称为“固相成分”)反应。有时,可以通过首先将抗原与具有较好固相结合特性的蛋白质偶联,从而提高支持物的固定化。适合的偶联蛋白包括(但并非限于)大分子如血清白蛋白,包括:牛血清白蛋白(BSA)、匙孔血蓝蛋白、免疫球蛋白分子、甲状腺球蛋白、卵白蛋白和本领域技术人员已知的其它蛋白质。其它可用于将分子结合于支持物的试剂包括多糖、聚乳酸、聚羟基乙酸、多聚氨基酸、氨基酸共聚物等。将这些分子与抗原偶联的分子和方法是本领域技术人员所熟知的。参见,如Brinkley,M.A.(1992)Bioconjugate Chem.3:2-13;Hashida等人(1984)J.Appl.Biochem.6:56-63;和Anjaneyulu和Staros(1987)International J.of Peptide and ProteinRes.30:117-124。
在固相支持物与固相成分反应后,冲洗除去支持物上未固定的固相成分,然后在适合的结合条件下,将与支持物结合的成分与怀疑含有HCV抗体(本文将其称为“配体分子”)的生物样品接触。冲洗除去任何未结合的配体分子后,在合适的结合条件下加入第二HCV抗原(分离的HCV抗原或MEFA,取决于结合于固相支持物上的是哪种抗原)。此第二抗原在此称为“液相成分”。加入的抗原带有如上所述的可检测标记,并与已与结合于支持物上的抗原反应的配体分子结合。因此,配体分子与固相成分以及液相成分结合。冲洗除去未结合的配体分子和液相成分。由此,标记物的存在表明生物样品中存在HCV抗原。
更具体的,可用ELISA法,其中微量滴定板的孔用固相成分包涂。然后在包涂的孔中加入含有或怀疑含有配体分子的生物样品。一段足够使配体分子与固定的固相成分结合的培育时间后,洗涤平板以除去未结合的部分,加入可检测标记的液相成分。这些分子能与任何捕获的样品抗体反应,洗涤平板并用本领域熟知的方法检测标记物的存在。
上述测定试剂,包括具有结合抗原的免疫测定固相支持物和与捕获样品反应的抗原,可以具有合适的说明书和其它必需试剂的试剂盒提供,以进行如上所述的免疫测定。视所用的特定免疫测定而定,试剂盒还可含有合适的标记和其它包装的试剂和材料(即洗涤缓冲液等)。标准免疫测定,例如上述的测定可用这些试剂盒进行。
III.实验
下面是实施本发明所需的特定实施例的例子。这些实施例仅为了说明的目的,而不是要以任何形式限制本发明的范围。
已做出努力确保使用的数据(例如量和温度等)的准确性,但当然应允许一些实验错误和偏差。
实施例1
具有Thr到Pro和Ser到Ile取代的NS3/4a构象表位的制备
如下获得NS3/4a的构象表位。该表位具有图3A-3D(SEQ ID NO:1和2)所述的序列,在403位(HCV-1全长序列的氨基酸1428)和404位(HCV-1全长序列的氨基酸1429)与天然序列不同。具体说,在天然序列1428位上通常出现的Thr已突变成Pro,在天然序列1429位上出现的Ser已突变为Ile。
具体说,所用的酵母表达载体是pBS24.1。此酵母表达载体含有2μ用于在酵母中自主复制序列和反向重复序列(IR),确保转录终止的α-因子终止子和用于选择的酵母leu2-d和URA3。还存在ColE1的复制起点和β-内酰胺酶基因,用于大肠杆菌中的增殖和选择(Pichuantes等,1996,“酵母中异源基因产物的表达”,在“蛋白质工程:设计和生产指南”,第5章,J.L.Cleland和C.Craik编辑,Wiley-Liss,Inc.,纽约,N.Y.,第129-161页。
如下制备质粒pd.hcvla.ns3ns4aPI,其编码用于本发明免疫测定的代表性NS3/4a表位。使用两步流程。首先,将以下的DNA片段连接在一起:(a)合成的寡核苷酸,其提供5′HindIII克隆位点,随后接序列ACAAAACAAA(SEQ IDNO:8),起始密码子ATG,和HCV1a的密码子,从氨基酸1027开始继续到氨基酸1046的BglI位点;(b)来自pAcHLTns3ns4aPI的683bp的BglI-ClaI限制性片段(编码氨基酸1046-1274);和(c)HindIII和ClaI消化、去磷酸化和凝胶纯化的的pSP72载体(Promega,Madison,WI,GenBank/EMBL登录号X65332)。质粒pAcHLTns3ns4aPI衍生自pAcHLT,从BD Pharmingen(San Diego,CA)购得的一种杆状病毒表达载体。特别是制备了pAcHLT EcoRI-PstI载体和如下片段:EcoRI-AlwnI,935bp,对应于HCV-1基因组的氨基酸1027-1036,AlwnI-SacII,247bp,对应于HCV-1基因组的氨基酸1336-1419;HinfI-BglI,175bp,对应于HCV-1基因组的氨基酸1449-1509;BglI-PstI,619bp,对应于HCV-1基因组的氨基酸1510-1711,加上转录终止密码子。SacII-HinfI合成产生的91bp片段(对应于HCV-1基因组的氨基酸1420-1448,含有PI突变(Thr-1428突变成Pro,Ser-1429突变成Ile))与上述的175bp HinfI-BglI片段和619bp的BglI-PstI片段连接,并亚克隆入用SacII和PstI消化的pGEM-5Zf(+)载体。pGEM-5Zf(+)是市售的大肠杆菌载体(Promega,Madison,WI,GenBank/EMBL登录号X65308)。在转化感受态HB101细胞,单独克隆的小筛选分析并证实序列后,凝胶纯化pGEM5.PI克隆2的885bp的SacII-PstI片段。该片段与上述的EcoRI-AlwnI 935bp片段、AlwnI-SacII 247bp片段和pAcHLT EcoRI-PstI载体连接。得到的构建物命名为pAcHLTns3ns4aPI。
上述连接混合物转化入HB 101-感受态细胞,并铺在含有100微克/毫升氨苄青霉素的Luria琼脂平板上。单独克隆的少量制备物分析鉴定了推定的阳性,扩增了其中两个。用Qiagen Maxiprep试剂盒制备pSP72 1aHC,克隆#1和#2的质粒DNA,并测序。
接着,连接下列片段:(a)来自pSP721aHC#1的761bp HindIII-ClaI片段(pSP72.1aHC是通过连接下列片段产生的:用HindIII和ClaI消化的pSP72,提供5′HindIII克隆位点的寡核苷酸,接着是序列ACAAAACAAA(SEQ ID NO:8),起始密码子ATG和HCV1a的密码子,从氨基酸1027开始,直到氨基酸1046处的BglII位点,和来自pAcHLTns3ns4aPI的683bp BglII-ClaI限制性片段(编码氨基酸1046-1274));(b)酵母杂交启动子ADH2/GAPDH的1353bp的BamHI-HindIII片段;(c)来自pAcHLTns3ns4aPI的1320bp ClaI-SalI片段(编码HCV1a氨基酸1046-1711,其中Thr1428突变成Pro,Ser1429突变成Ile);和(d)已用BamHI和SacI消化,去磷酸化和凝胶纯化的pBS23.1酵母表达载体。该连接混合物转化入感受态HB101细胞,并铺在含有100微克/毫升氨苄青霉素的Luria琼脂平板上。单独克隆的小量制备物分析鉴定到具有预期的3446bp的BamHI-SalI插入的克隆,它带有ADH2/GAPDH启动子,起始密码子ATG和氨基酸1027-1711的HCV1a NS3/4a(显示图3A-3D的氨基酸1-686),Thr1428(图3A-3D的氨基酸位置403)突变成Pro,Ser1429(图3A-3D的氨基酸位置404)突变成Ile。构建物称为pd.HCV1a.ns3ns4aPI(见图4)。
用pd.HCV1a.ns3ns4aPI转化酿酒酵母株AD3,在培养基中的葡萄糖耗尽后检查单个转化子的表达。在酵母中高水平表达重组蛋白质,如考马斯蓝染色检测到的,并使用针对NS3的解旋酶结构域的多克隆抗体,通过免疫印迹分析证实。
实施例2
NS3/4a构象表位的纯化
如下纯化NS3/4a构象表位。如上所述收集表达NS3/4a表位的酿酒酵母细胞。将细胞悬浮在裂解缓冲液(50mM Tris pH8.0,150mM NaCl,1mM EDTA,1mM PMSF,0.1μM抑胃酶肽,1μM亮抑酶肽),并以细胞∶缓冲液∶0.5毫米玻璃珠1∶1∶1的比例,在Dyno-Mill(Wab Willy A.Bachofon,Basel,Switzerland)或等效装置中裂解。裂解液于30100xg、4℃离心30分钟,并在洗涤缓冲液(6ml/g起始细胞沉淀重量)中加入含有不溶性细胞组分的沉淀,室温振摇15分钟。洗涤缓冲液含有50mM NaPO4 pH8.0、0.3M NaCl、5mM β-巯基乙醇、10%甘油、0.05%辛基葡糖苷、1mM EDTA、1mM PMSF、0.1μM抑胃酶肽、1μM亮抑酶肽。30100xg、4℃离心30分钟除去细胞碎片。丢弃上清液并保留沉淀。
如下从沉淀中抽提蛋白质。加入6ml/g抽提缓冲液并在室温振摇15分钟。抽提缓冲液含有50mM Tris pH8.0、1M NaCl、5mM β-巯基乙醇、10%甘油、1mMEDTA、1mM PMSF、0.1μM抑胃酶肽、1μM亮抑酶肽。这在30100xg、4℃离心30分钟。保留上清液并用下列配方加入达到17.5%的硫酸铵:上清液的体积(ml)乘以x%硫酸铵/(1-x%硫酸铵)=加到上清液中的4.1M饱和硫酸铵的毫升数。一边在冰上搅拌,一边滴加硫酸铵,溶液在冰上搅拌10分钟。17700xg 4℃离心溶液30分钟,保留沉淀,储藏在2℃-8℃达48小时。
重新悬浮沉淀,并4℃如下过Poly U柱(Poly U Sepharose 4B,AmershamPharmacia)。沉淀重新悬浮在6ml Poly U平衡缓冲液/克沉淀重量中。平衡缓冲液含有25mM HEPES pH8.0、200mM NaCl、5mM DTT(新鲜加入)、10%甘油、1.2%辛基葡糖苷。4℃振摇溶液15分钟,31000xg、4℃离心30分钟。
制备Poly U柱(1ml树脂/克起始沉淀重量)。线性流速为60cm/hr,填充流速为133%60cm/hr。用平衡缓冲液平衡柱,并在平衡好的柱上加入重悬浮硫酸铵沉淀的上清液。用平衡缓冲液将柱洗到基线,在一步洗脱中用下列Poly U洗脱缓冲液洗脱蛋白质:25mM HEPES pH8.0、1M NaCl、5mM DTT(新鲜加入)、10%甘油、1.2%辛基葡糖苷。柱洗脱物在SDS-PAGE(考马斯蓝染色)上展开,冷冻等份并储藏在-80℃。用蛋白质印迹,使用针对NS3蛋白酶结构域的多克隆抗体和针对5-1-1表位(HCV 4a)的单克隆抗体证实了NS3/4a表位的存在。
另外,在纯化过程中如下监测蛋白酶的酶活性。用90微升反应缓冲液(25mMTris,pH7.5,0.15M NaCl,0.5mM EDTA,10%甘油,0.05正十二烷基B-D-麦芽糖苷,5mM DTT)稀释NS4A肽(KKGSVVIVGRIVLSGKPAIIPKK,SEQ IDNO:9)和含有NS3/4a构象表位的样品,并在室温下混合30分钟。将90微升混合物加到微量滴定板(Costar,Inc.,Corning,NY)中,加入10微升HCV底物(AnaSpec,Inc.,San Jose CA)。混合平板并在Fluostar平板阅读仪上阅读。结果表示为相对荧光单位(RFU)/分钟。
用这些方法,1M NaCl抽提的产物含有3.7RFU/分钟的活性,硫酸铵沉淀物具有7.5RFU/分钟的活性,Poly U纯化的产物具有18.5RFU/分钟的活性。
实施例3
NS3/4a构象表位对变性NS3/4a的免疫反应性
将如上所述产生的NS3/4a构象表位的免疫反应性与在NS3/4a构象表位制备物中加入SDS到最终浓度为2%的变性的NS3/4a进行比较。将变性的NS3/4a和构象NS3/4a涂覆到微量滴定板上(如上所述)。也将c200抗原(Hepatology(1992)15:19-25,在ORTHO HCv 3.0版ELISA测试系统,Ortho-Clinical Diagnostics,Raritan,New Jersey中可得)涂覆到微量滴定板上。用c200作为比较,假定它是非构象的,由于在其配方中存在还原剂(DTT)和去污剂(SDS)。
针对两个早期HCV血清转化组PHV904和PHV914(市售人血样,购自Boston Biomeida,Inc.,West Bridgewater,MA)测试了免疫反应性。结果如表6所示。数据提示NS3/4a(和c200)变性或线性化的形式不与NS3/4a构象表位一样早地检测到早期血清转化组。
表6
还使用标准程序制备的针对NS3/4a的单克隆抗体测试了构象表位的免疫反应性。然后在针对NS3/4a和变性的NS3/4a和c200抗原的ELISA测定中测试这些单克隆抗体。数据显示抗-NS3/4a单克隆抗体与NS3/4a和变性的NS3/4a以与表7显示的血清转化组相似的方式反应。该结果还提供了NS3/4a天然是构象表位的进一步证据,因为可制备反应性与早期c33c血清转化组相似的单克隆抗体。
实施例4
用HCV抗原涂覆固相支持物
如下将HCV NS3/4a构象表位或MEFA抗原涂覆到平板上。用0.22μ过滤装置过滤HCV涂覆缓冲液(50mM NaPO4 pH 7.0,2mM EDTA和0.1%氯乙酰胺)。然后将以下试剂顺序添加到HCV涂覆缓冲液中,且每次添加后都要搅拌:来自1 0mg/ml溶液的2μg/ml巯基修饰的BSA(Bayer Corp,Pentex,Kankakee,Illinois);来自1M溶液的5mM DTT(Sigma,St.Louis,MO);0.45μg/ml NS3/4a(蛋白质浓度为0.3mg/ml);0.375μg/ml MEFA 7.1(蛋白质浓度为1mg/ml)。室温搅拌最终溶液15分钟。
将200μl上述溶液加到Costar高度结合的平底板(Corning Inc.,Corning,NewYork)的各孔中,并将平板在保湿室中培育过夜。然后用洗涤缓冲液(1×PBS,0.1%TWEEN-20)洗涤平板,轻敲干燥,并加入285μl Ortho Post-涂覆缓冲液(1×PBSpH 7.4,1%BSA,3%蔗糖)。培育平板至少1小时,轻敲并在2-8℃干燥过夜。将平板装入有干燥剂的袋内备用。
实施例5
免疫测定
为了测试本发明免疫测定测试HCV感染的能力,用可购得的人血液样品(受HCV感染的)的板。这些板是从Boston Biomedica,Inc.,West Bridgewater,MA(BBI);Bioclinical Partners,Franklin,MA(BCP)和North American Biologics,Inc.,BocoRatan,FL(NABI)购得。
如下进行测定。在涂覆的平板中加入200μl样品稀释缓冲液(1g/l酪蛋白,100mg/l重组人SOD,1g/l氯乙酰胺,10g/l BSA,500mg/l酵母提取物,0.366g/lEDTA,1.162g/l KPO4,5ml/l Tween-20,29.22g/l NaCl,1.627g/l NaPO4,1%SDS)。然后加入20μl样品。将其在37℃培育30-60分钟。用洗涤缓冲液(1xPBS、pH 7.4,0.1%Tween-20)洗涤平板。加入200μl在ORTHO HCV 3.0ELISA测试系统中用Enhanced SAVe批量偶联稀释液(Ortho-Clinical Diagnostics,Raritan,New Jersey)以1∶22,000稀释的标记的液相成分(HRP标记的MEFA或HRP标记的NS3/4a构象表位,取决于结合于固相支持物上的抗原),并在37℃培育30-60分钟。如上所述洗涤,并添加200μl底物溶液(1OPD片剂/10ml)。OPD片剂含有辣根过氧化物酶反应显色所需的邻苯二胺二盐酸盐和过氧化氢。将在黑暗中室温培育30分钟。加入50μl 4N H2SO4终止反应,并在492nm阅读平板,相对于690nm处的吸光度作为对照。
因此,公开了新颖的HCV检测试验。根据上述内容,应理解虽然本文为了说明的目的描述了本发明的具体实施例,但是可作出各种改变,而不背离本文的精神和范围。
序列表
<110>希龙公司
<120>HCV检测
<130>2300-19199.40
<150>60/409,515
<151>2002-09-09
<160>9
<170>PatentIn version 3.2
<210>1
<211>2058
<212>DNA
<213>人工
<220>
<223>NS3/41构象表位DNA序列
<400>1
atg gcg ccc atc acg gcg tac gcc cag cag aca agg ggc ctc cta ggg 48
Met Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly
1 5 10 15
tgc ata atc acc agc cta act ggc cgg gac aaa aac caa gtg gag ggt 96
Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly
20 25 30
gag gtc cag att gtg tca act gct gcc caa acc ttc ctg gca acg tgc 144
Glu Val Gln Ile Val Ser Thr Ala Ala Gln Thr Phe Leu Ala Thr Cys
35 40 45
atc aat ggg gtg tgc tgg act gtc tac cac ggg gcc gga acg agg acc 192
Ile Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr
50 55 60
atc gcg tca ccc aag ggt cct gtc atc cag atg tat acc aat gta gac 240
Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp
65 70 75 80
caa gac ctt gtg ggc tgg ccc gct ccg caa ggt agc cga tca ttg aca 288
Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr
85 90 95
ccc tgc act tgc ggc tcc tcg gac ctt tac ctg gtc acg agg cac gcc 336
Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala
100 105 110
gat gtc att ccc gtg cgc cgg cgg ggt gat agc agg ggc agc ctg ctg 384
Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu
115 120 125
tcg ccc cgg ccc att tcc tac ttg aaa ggc tcc tcg ggg ggt ccg ctg 432
Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu
130 135 140
ttg tgc ccc gcg ggg cac gcc gtg ggc ata ttt agg gcc gcg gtg tgc 480
Leu Cys Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys
145 150 155 160
acc cgt gga gtg gct aag gcg gtg gac ttt atc cct gtg gag aac cta 528
Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu
165 170 175
gag aca acc atg agg tcc ccg gtg ttc acg gat aac tcc tct cca cca 576
Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro
180 185 190
gta gtg ccc cag agc ttc cag gtg gct cac ctc cat gct ccc aca ggc 624
Val Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly
195 200 205
agc ggc aaa agc acc aag gtc ccg gct gca tat gca gct cag ggc tat 672
Ser Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr
210 215 220
aag gtg cta gta ctc aac ccc tct gtt gct gca aca ctg ggc ttt ggt 720
Lys Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly
225 230 235 240
gct tac atg tcc aag gct cat ggg atc gat cct aac atc agg acc ggg 768
Ala Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg Thr Gly
245 250 255
gtg aga aca att acc act ggc agc ccc atc acg tac tcc acc tac ggc 816
Val Arg Thr Ile Thr Thr Gly Ser Pro Ile Thr Tyr Ser Thr Tyr Gly
260 265 270
aag ttc ctt gcc gac ggc ggg tgc tcg ggg ggc gct tat gac ata ata 864
Lys Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile
275 280 285
att tgt gac gag tgc cac tcc acg gat gcc aca tcc atc ttg ggc att 912
Ile Cys Asp Glu Cys His Ser Thr Asp Ala Thr Ser Ile Leu Gly Ile
290 295 300
ggc act gtc ctt gac caa gca gag act gcg ggg gcg aga ctg gtt gtg 960
Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val
305 310 315 320
ctc gcc acc gcc acc cct ccg ggc tcc gtc act gtg ccc cat ccc aac 1008
Leu Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His Pro Asn
325 330 335
atc gag gag gtt gct ctg tcc acc acc gga gag atc cct ttt tac ggc 1056
Ile Glu Glu Val Ala Leu Ser Thr Thr Gly Glu Ile Pro Phe Tyr Gly
340 345 350
aag gct atc ccc ctc gaa gta atc aag ggg ggg aga cat ctc atc ttc 1104
Lys Ala Ile Pro Leu Glu Val Ile Lys Gly Gly Arg His Leu Ile Phe
355 360 365
tgt cat tca aag aag aag tgc gac gaa ctc gcc gca aag ctg gtc gca 1152
Cys His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Val Ala
370 375 380
ttg ggc atc aat gcc gtg gcc tac tac cgc ggt ctt gac gtg tcc gtc 1200
Leu Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val
385 390 395 400
atc ccg ccc atc ggc gat gtt gtc gtc gtg gca acc gat gcc ctc atg 1248
Ile Pro Pro Ile Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met
405 410 415
acc ggc tat acc ggc gac ttc gac tcg gtg ata gac tgc aat acg tgt 1296
Thr Gly Tyr Thr Gly Asp Phe Asp Ser ValIle Asp Cys Asn Thr Cys
420 425 430
gtc acc cag aca gtc gat ttc agc ctt gac cct acc ttc acc att gag 1344
Val Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu
435 440 445
aca atc acg ctc ccc caa gat gct gtc tcc cgc act caa cgt cgg ggc 1392
Thr Ile Thr Leu Pro Gln Asp Ala Val Ser Arg Thr Gln Arg Arg Gly
450 455 460
agg act ggc agg ggg aag cca ggc atc tac aga ttt gtg gca ccg ggg 1440
Arg Thr Gly Arg Gly Lys Pro Gly Ile Tyr Arg Phe Val Ala Pro Gly
465 470 475 480
gag cgc ccc tcc ggc atg ttc gac tcg tcc gtc ctc tgt gag tgc tat 1488
Glu Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr
485 490 495
gac gca ggc tgt gct tgg tat gag ctc acg ccc gcc gag act aca gtt 1536
Asp Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Thr Val
500 505 510
agg cta cga gcg tac atg aac acc ccg ggg ctt ccc gtg tgc cag gac 1584
Arg Leu Arg Ala Tyr Met Asn Thr Pro Gly Leu Pro Val Cys Gln Asp
515 520 525
cat ctt gaa ttt tgg gag ggc gtc ttt aca ggc ctc act cat ata gat 1632
His Leu Glu Phe Trp Glu Gly Val Phe Thr Gly Leu Thr His Ile Asp
530 535 540
gcc cac ttt cta tcc cag aca aag cag agt ggg gag aac ctt cct tac 1680
Ala His Phe Leu Ser Gln Thr Lys Gln Ser Gly Glu Asn Leu Pro Tyr
545 550 555 560
ctg gta gcg tac caa gcc acc gtg tgc gct agg gct caa gcc cct ccc 1728
Leu Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro
565 570 575
cca tcg tgg gac cag atg tgg aag tgt ttg att cgc ctc aag ccc acc 1776
Pro Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr
580 585 590
ctc cat ggg cca aca ccc ctg cta tac aga ctg ggc gct gtt cag aat 1824
Leu His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn
595 600 605
gaa atc acc ctg acg cac cca gtc acc aaa tac atc atg aca tgc atg 1872
Glu Ile Thr Leu Thr His Pro Val Thr Lys Tyr Ile Met Thr Cys Met
610 615 620
tcg gcc gac ctg gag gtc gtc acg agc acc tgg gtg ctc gtt ggc ggc 1920
Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly
625 630 635 640
gtc ctg gct gct ttg gcc gcg tat tgc ctg tca aca ggc tgc gtg gtc 1968
Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val Val
645 650 655
ata gtg ggc agg gtc gtc ttg tcc ggg aag ccg gca atc ata cct gac 2016
Ile Val Gly Arg Val Val Leu Ser Gly Lys Pro Ala Ile Ile Pro Asp
660 665 670
agg gaa gtc ctc tac cga gag ttc gat gag atg gaa gag tgc 2058
Arg Glu Val Leu Tyr Arg Glu Phe Asp Glu Met Glu Glu Cys
675 680 685
<210>2
<211>686
<212>PRT
<213>人工
<220>
<223>NS3/41构象表位氨基酸序列
<400>2
Met Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly
1 5 10 15
Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly
20 25 30
Glu Val Gln Ile Val Ser Thr Ala Ala Gln Thr Phe Leu Ala Thr Cys
35 40 45
Ile Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr
50 55 60
Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp
65 70 75 80
Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr
85 90 95
Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala
100 105 110
Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu
115 120 125
Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu
130 135 140
Leu Cys Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys
145 150 155 160
Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu
165 170 175
Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro
180 185 190
Val Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly
195 200 205
Ser Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr
210 215 220
Lys Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly
225 230 235 240
Ala Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg Thr Gly
245 250 255
Val Arg Thr Ile Thr Thr Gly Ser Pro Ile Thr Tyr Ser Thr Tyr Gly
260 265 270
Lys Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile
275 280 285
Ile Cys Asp Glu Cys His Ser Thr Asp Ala Thr Ser Ile Leu Gly Ile
290 295 300
Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val
305 310 315 320
Leu Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His Pro Asn
325 330 335
Ile Glu Glu Val Ala Leu Ser Thr Thr Gly Glu Ile Pro Phe Tyr Gly
340 345 350
Lys Ala Ile Pro Leu Glu Val Ile Lys Gly Gly Arg His Leu Ile Phe
355 360 365
Cys His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Val Ala
370 375 380
Leu Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val
385 390 395 400
Ile Pro Pro Ile Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met
405 410 415
Thr Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys
420 425 430
Val Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu
435 440 445
Thr Ile Thr Leu Pro Gln Asp Ala Val Ser Arg Thr Gln Arg Arg Gly
450 455 460
Arg Thr Gly Arg Gly Lys Pro Gly Ile Tyr Arg Phe Val Ala Pro Gly
465 470 475 480
Glu Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr
485 490 495
Asp Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Thr Val
500 505 510
Arg Leu Arg Ala Tyr Met Asn Thr Pro Gly Leu Pro Val Cys Gln Asp
515 520 525
His Leu Glu Phe Trp Glu Gly Val Phe Thr Gly Leu Thr His Ile Asp
530 535 540
Ala His Phe Leu Ser Gln Thr Lys Gln Ser Gly Glu Asn Leu Pro Tyr
545 550 555 560
Leu Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro
565 570 575
Pro Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr
580 585 590
Leu His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn
595 600 605
Glu Ile Thr Leu Thr His Pro Val Thr Lys Tyr Ile Met Thr Cys Met
610 615 620
Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly
625 630 635 640
Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val Val
645 650 655
Ile Val Gly Arg Val Val Leu Ser Gly Lys Pro Ala Ile Ile Pro Asp
660 665 670
Arg Glu Val Leu Tyr Arg Glu Phe Asp Glu Met Glu Glu Cys
675 680 685
<210>3
<211>2499
<212>DNA
<213>人工
<220>
<223>MEFA 12DNA序列
<400>3
atg gct aca aag gct gtt tgt gtt ttg aag ggt gac ggc cca gtt caa 48
Met Ala Thr Lys Ala Val Cys Val Leu Lys Gly Asp Gly Pro Val Gln
1 5 10 15
ggt att att aac ttc gag cag aag gaa agt aat gga cca gtg aag gtg 96
Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val
20 25 30
tgg gga agc att aaa gga ctg act gaa ggc ctg cat gga ttc cat gtt 144
Trp Gly Ser Ile Lys Gly Leu Thr Glu Gly Leu His Gly Phe His Val
35 40 45
cat gag ttt gga gat aat aca gca ggc tgt acc agt gca ggt cct cac 192
His Glu Phe Gly Asp Asn Thr Ala Gly Cys Thr Ser Ala Gly Pro His
50 55 60
ttt aat cct cta tcc acg cgt ggt tgc aat tgc tct atc tat ccc ggc 240
Phe Asn Pro Leu Ser Thr Arg Gly Cys Asn Cys Ser Ile Tyr Pro Gly
65 70 75 80
cat ata acg ggt cac cgc atg gca tgg aag ctt ggt tcc gcc gcc aga 288
His Ile Thr Gly His Arg Met Ala Trp Lys Leu Gly Ser Ala Ala Arg
85 90 95
act acc tcg ggc ttt gtc tcc ttg ttc gcc cca ggt gcc aaa caa aac 336
Thr Thr Ser Gly Phe Val Ser Leu Phe Ala Pro Gly Ala Lys Gln Asn
100 105 110
gaa act cac gtc acg gga ggc gca gcc gcc cga act acg tct ggg ttg 384
Glu Thr His Val Thr Gly Gly Ala Ala Ala Arg Thr Thr Ser Gly Leu
115 120 125
acc tct ttg ttc tcc cca ggt gcc agc caa aac att caa ttg att act 432
Thr Ser Leu phe Ser Pro Gly Ala Ser Gln Asn Ile Gln Leu Ile Thr
130 135 140
agt acg gat aac tcc tct cca cca gta gtg ccc cag agc ttc cag gtg 480
Ser Thr Asp Asn Ser Ser Pro Pro Val Val Pro Gln Ser Phe Gln Val
145 150 155 160
gct cac ctc cat gct ccc aca ggc agc ggc aaa agc acc aag gtc ccg 528
Ala His Leu His Ala Pro Thr Gly Ser Gly Lys Ser Thr Lys Val Pro
165 170 175
gct gca tat gca gct cag ggc tat aag gtg cta gta ctc aac ccc tct 576
Ala Ala Tyr Ala Ala Gln Gly Tyr Lys Val Leu Val Leu Asn Pro Ser
180 185 190
gtt gct gca aca ctg ggc ttt ggt gct tac atg tcc aag gct cat ggg 624
Val Ala Ala Thr Leu Gly Phe Gly Ala Tyr Met Ser Lys Ala His Gly
195 200 205
atc gat cct aac atc agg acc ggg gtg aga aca att acc act ggc agc 672
Ile Asp Pro Asn Ile Arg Thr Gly Val Arg Thr Ile Thr Thr Gly Ser
210 215 220
ccc atc acg tac tcc acc tac ggc aag ttc ctt gcc gac ggc ggg tgc 720
Pro Ile Thr Tyr Ser Thr Tyr Gly Lys Phe Leu Ala Asp Gly Gly Cys
225 230 235 240
tcg ggg ggc gct tat gac ata ata att tgt gac gag tgc cac tcc acg 768
Ser Gly Gly Ala Tyr Asp Ile Ile Ile Cys Asp Glu Cys His Ser Thr
245 250 255
gat gcc aca tcc atc ttg ggc atc ggc act gtc ctt gac caa gca gag 816
Asp Ala Thr Ser Ile Leu Gly Ile Gly Thr Val Leu Asp Gln Ala Glu
260 265 270
act gcg ggg gcg aga ctg gtt gtg ctc gcc acc gcc acc cct ccg ggc 864
Thr Ala Gly Ala Arg Leu Val Val Leu Ala Thr Ala Thr Pro Pro Gly
275 280 285
tcc gtc act gtg ccc cat ccc aac atc gag gag gtt gct ctg tcc acc 912
Ser Val Thr Val Pro His Pro Asn Ile Glu Glu Val Ala Leu Ser Thr
290 295 300
acc gga gag atc cct ttt tac ggc aag gct atc ccc ctc gaa gta atc 960
Thr Gly Glu Ile Pro Phe Tyr Gly Lys Ala Ile Pro Leu Glu Val Ile
305 310 315 320
aag ggg ggg aga cat ctc atc ttc tgt cat tca aag aag aag tgc gac 1008
Lys Gly Gly Arg His Leu Ile Phe Cys His Ser Lys Lys Lys Cys Asp
325 330 335
gaa ctc gcc gca aag ctg gtc gca ttg ggc atc aat gcc gtg gcc tac 1056
Glu Leu Ala Ala Lys Leu Val Ala Leu Gly Ile Asn Ala Val Ala Tyr
340 345 350
tac cgc ggt ctt gac gtg tcc gtc atc ccg acc agc ggc gat gtt gtc 1104
Tyr Arg Gly Leu Asp Val Ser Val Ile Pro Thr Ser Gly Asp Val Val
355 360 365
gtc gtg gca acc gat gcc ctc atg acc ggc tat acc ggc gac ttc gac 1152
Val Val Ala Thr Asp Ala Leu Met Thr Gly Tyr Thr Gly Asp Phe Asp
370 375 380
tcg gtg ata gac tgc aat acg tgt gca tgc tcc ggg aag ccg gca atc 1200
Ser Val Ile Asp Cys Asn Thr Cys Ala Cys Ser Gly Lys Pro Ala Ile
385 390 395 400
ata cct gac agg gaa gtc ctc tac cga gag ttc gat gag atg gaa gag 1248
Ile Pro Asp Arg Glu Val Leu Tyr Arg Glu Phe Asp Glu Met Glu Glu
405 410 415
tgc tct cag cac tta ccg tac atc gag caa ggg atg atg ctc gcc gag 1296
Cys Ser Gln His Leu Pro Tyr Ile Glu Gln Gly Met Met Leu Ala Glu
420 425 430
cag ttc aag cag aag gcc ctc ggc ctc tcg cga ggg ggc aag ccg gca 1344
Gln Phe Lys Gln Lys Ala Leu Gly Leu Ser Arg Gly Gly Lys Pro Ala
435 440 445
atc gtt cca gac aaa gag gtg ttg tat caa caa tac gat gag atg gaa 1392
Ile Val Pro Asp Lys Glu Val Leu Tyr Gln Gln Tyr Asp Glu Met Glu
450 455 460
gag tgc tca caa gct gcc cca tat atc gaa caa gct cag gta ata gct 1440
Glu Cys Ser Gln Ala Ala Pro Tyr Ile Glu Gln Ala Gln Val Ile Ala
465 470 475 480
cac cag ttc aag gaa aaa gtc ctt gga ttg atc gat aat gat caa gtg 1488
His Gln Phe Lys Glu Lys Val Leu Gly Leu Ile Asp Asn Asp Gln Val
485 490 495
gtt gtg act cct gac aaa gaa atc tta tat gag gcc ttt gat gag atg 1536
Val Val Thr Pro Asp Lys Glu Ile Leu Tyr Glu Ala Phe Asp Glu Met
500 505 510
gaa gaa tgc gcc tcc aaa gcc gcc ctc att gag gaa ggg cag cgg atg 1584
Glu Glu Cys Ala Ser Lys Ala Ala Leu Ile Glu Glu Gly Gln Arg Met
515 520 525
gcg gag atg ctc aag tct aag ata caa ggc ctc ctc ggg ata ctg cgc 1632
Ala Glu Met Leu Lys Ser Lys Ile Gln Gly Leu Leu Gly Ile Leu Arg
530 535 540
cgg cac gtt ggt cct ggc gag ggg gca gtg cag tgg atg aac cgg ctg 1680
Arg His Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu
545 550 555 560
ata gcc ttc gcc tcc aga ggg aac cat gtt tcc ccc acg cac tac gtt 1728
Ile Ala Phe Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val
565 570 575
ccg tct aga tcc cgg aga ttc gcc cag gcc ctg ccc gtt tgg gcg cgg 1776
Pro Ser Arg Ser Arg Arg Phe Ala Gln Ala Leu Pro Val Trp Ala Arg
580 585 590
ccg gac tat aac ccc ccg cta gtg gag acg tgg aaa aag ccc gac tac 1824
Pro Asp Tyr Asn Pro Pro Leu Val Glu Thr Trp Lys Lys Pro Asp Tyr
595 600 605
gaa cca cct gtg gtc cac ggc aga tct tct cgg aga ttc gcc cag gcc 1872
Glu Pro Pro Val Val His Gly Arg Ser Ser Arg Arg Phe Ala Gln Ala
610 615 620
ctg ccc gtt tgg gcg cgg ccg gac tat aac ccc ccg cta gtg gag acg 1920
Leu Pro Val Trp Ala Arg Pro Asp Tyr Asn Pro Pro Leu Val Glu Thr
625 630 635 640
tgg aaa aag ccc gac tac gaa cca cct gtg gtc cat ggc aga aag acc 1968
Trp Lys Lys Pro Asp Tyr Glu Pro Pro Val Val His Gly Arg Lys Thr
645 650 655
aaa cgt aac acc aac cgg cgg ccg cag gac gtc aag ttc ccg ggt ggc 2016
Lys Arg Asn Thr Asn Arg Arg Pro Gln Asp Val Lys Phe Pro Gly Gly
660 665 670
ggt cag atc gtt ggt gga gtt tac ttg ttg ccg cgc agg ggc cct aga 2064
Gly Gln Ile Val Gly Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg
675 680 685
ttg ggt gtg ctc gcg acg aga aag act tcc cct atc ccc aag gct cgt 2112
Leu Gly Val Leu Ala Thr Arg Lys Thr Ser Pro Ile Pro Lys Ala Arg
690 695 700
cgg ccc gag ggc agg acc tgg gct cag ccc ggt tac cct tgg ccc ctc 2160
Arg Pro Glu Gly Arg Thr Trp Ala Gln Pro Gly Tyr Pro Trp Pro Leu
705 710 715 720
tat ggc aat aag gac aga cgg tct aca ggt aag tcc tgg ggt aag cca 2208
Tyr Gly Asn Lys Asp Arg Arg Ser Thr Gly Lys Ser Trp Gly Lys Pro
725 730 735
ggg tac cct tgg cca aga aag acc aaa cgt aac acc aac cgg cgg ccg 2256
Gly Tyr Pro Trp Pro Arg Lys Thr Lys Arg Asn Thr Asn Arg Arg Pro
740 745 750
cag gac gtc aag ttc ccg ggt ggc ggt cag atc gtt ggt gga gtt tac 2304
Gln Asp Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly Gly Val Tyr
755 760 765
ttg ttg ccg cgc agg ggc cct aga ttg ggt gtg ctc gcg acg aga aag 2352
Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Leu Ala Thr Arg Lys
770 775 780
act tcc cct atc ccc aag gct cgt cgg ccc gag ggc agg acc tgg gct 2400
Thr Ser Pro Ile Pro Lys Ala Arg Arg Pro Glu Gly Arg Thr Trp Ala
785 790 795 800
cag ccc ggt tac cct tgg ccc ctc tat ggc aat aag gac aga cgg tct 2448
Gln Pro Gly Tyr Pro Trp Pro Leu Tyr Gly Asn Lys Asp Arg Arg Ser
805 810 815
aca ggt aag tcc tgg ggt aag cca ggg tac cct tgg ccc taatgagtcg ac 2499
Thr Gly Lys Ser Trp Gly Lys Pro Gly Tyr Pro Trp Pro
820 825
<210>4
<211>829
<212>PRT
<213>人工
<220>
<223>MEFA 12氨基酸序列
<400>4
Met Ala Thr Lys Ala Val Cys Val Leu Lys Gly Asp Gly Pro Val Gln
1 5 10 15
Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val
20 25 30
Trp Gly Ser Ile Lys Gly Leu Thr Glu Gly Leu His Gly Phe His Val
35 40 45
His Glu Phe Gly Asp Asn Thr Ala Gly Cys Thr Ser Ala Gly Pro His
50 55 60
Phe Asn Pro Leu Ser Thr Arg Gly Cys Asn Cys Ser Ile Tyr Pro Gly
65 70 75 80
His Ile Thr Gly His Arg Met Ala Trp Lys Leu Gly Ser Ala Ala Arg
85 90 95
Thr Thr Ser Gly Phe Val Ser Leu Phe Ala Pro Gly Ala Lys Gln Asn
100 105 110
Glu Thr His Val Thr Gly Gly Ala Ala Ala Arg Thr Thr Ser Gly Leu
115 120 125
Thr Ser Leu Phe Ser Pro Gly Ala Ser Gln Asn Ile Gln Leu Ile Thr
130 135 140
Ser Thr Asp Asn Ser Ser Pro Pro Val Val Pro Gln Ser Phe Gln Val
145 150 155 160
Ala His Leu His Ala Pro Thr Gly Ser Gly Lys Ser Thr Lys Val Pro
165 170 175
Ala Ala Tyr Ala Ala Gln Gly Tyr Lys Val Leu Val Leu Asn Pro Ser
180 185 190
Val Ala Ala Thr Leu Gly Phe Gly Ala Tyr Met Ser Lys Ala His Gly
195 200 205
Ile Asp Pro Asn Ile Arg Thr Gly Val Arg Thr Ile Thr Thr Gly Ser
210 215 220
Pro Ile Thr Tyr Ser Thr Tyr Gly Lys Phe Leu Ala Asp Gly Gly Cys
225 230 235 240
Ser Gly Gly Ala Tyr Asp Ile Ile Ile Cys Asp Glu Cys His Ser Thr
245 250 255
Asp Ala Thr Ser Ile Leu Gly Ile Gly Thr Val Leu Asp Gln Ala Glu
260 265 270
Thr Ala Gly Ala Arg Leu Val Val Leu Ala Thr Ala Thr Pro Pro Gly
275 280 285
Ser Val Thr Val Pro His Pro Asn Ile Glu Glu Val Ala Leu Ser Thr
290 295 300
Thr Gly Glu Ile Pro Phe Tyr Gly Lys Ala Ile Pro Leu Glu Val Ile
305 310 315 320
Lys Gly Gly Arg His Leu Ile Phe Cys His Ser Lys Lys Lys Cys Asp
325 330 335
Glu Leu Ala Ala Lys Leu Val Ala Leu Gly Ile Asn Ala Val Ala Tyr
340 345 350
Tyr Arg Gly Leu Asp Val Ser Val Ile Pro Thr Ser Gly Asp Val Val
355 360 365
Val Val Ala Thr Asp Ala Leu Met Thr Gly Tyr Thr Gly Asp Phe Asp
370 375 380
Ser Val Ile Asp Cys Asn Thr Cys Ala Cys Ser Gly Lys Pro Ala Ile
385 390 395 400
Ile Pro Asp Arg Glu Val Leu Tyr Arg Glu Phe Asp Glu Met Glu Glu
405 410 415
Cys Ser Gln His Leu Pro Tyr Ile Glu Gln Gly Met Met Leu Ala Glu
420 425 430
Gln Phe Lys Gln Lys Ala Leu Gly Leu Ser Arg Gly Gly Lys Pro Ala
435 440 445
Ile Val Pro Asp Lys Glu Val Leu Tyr Gln Gln Tyr Asp Glu Met Glu
450 455 460
Glu Cys Ser Gln Ala Ala Pro Tyr Ile Glu Gln Ala Gln Val Ile Ala
465 470 475 480
His Gln Phe Lys Glu Lys Val Leu Gly Leu Ile Asp Asn Asp Gln Val
485 490 495
Val Val Thr Pro Asp Lys Glu Ile Leu Tyr Glu Ala Phe Asp Glu Met
500 505 510
Glu Glu Cys Ala Ser Lys Ala Ala Leu Ile Glu Glu Gly Gln Arg Met
515 520 525
Ala Glu Met Leu Lys Ser Lys Ile Gln Gly Leu Leu Gly Ile Leu Arg
530 535 540
Arg His Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu
545 550 555 560
Ile Ala Phe Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val
565 570 575
Pro Ser Arg Ser Arg Arg Phe Ala Gln Ala Leu Pro Val Trp Ala Arg
580 585 590
Pro Asp Tyr Asn Pro Pro Leu Val Glu Thr Trp Lys Lys Pro Asp Tyr
595 600 605
Glu Pro Pro Val Val His Gly Arg Ser Ser Arg Arg Phe Ala Gln Ala
610 615 620
Leu Pro Val Trp Ala Arg Pro Asp Tyr Asn Pro Pro Leu Val Glu Thr
625 630 635 640
Trp Lys Lys Pro Asp Tyr Glu Pro Pro Val Val His Gly Arg Lys Thr
645 650 655
Lys Arg Asn Thr Asn Arg Arg Pro Gln Asp Val Lys Phe Pro Gly Gly
660 665 670
Gly Gln Ile Val Gly Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg
675 680 685
Leu Gly Val Leu Ala Thr Arg Lys Thr Ser Pro Ile Pro Lys Ala Arg
690 695 700
Arg Pro Glu Gly Arg Thr Trp Ala Gln Pro Gly Tyr Pro Trp Pro Leu
705 710 715 720
Tyr Gly Asn Lys Asp Arg Arg Ser Thr Gly Lys Ser Trp Gly Lys Pro
725 730 735
Gly Tyr Pro Trp Pro Arg Lys Thr Lys Arg Asn Thr Asn Arg Arg Pro
740 745 750
Gln Asp Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly Gly Val Tyr
755 760 765
Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Leu Ala Thr Arg Lys
770 775 780
Thr Ser Pro Ile Pro Lys Ala Arg Arg Pro Glu Gly Arg Thr Trp Ala
785 790 795 800
Gln Pro Gly Tyr Pro Trp Pro Leu Tyr Gly Asn Lys Asp Arg Arg Ser
805 810 815
Thr Gly Lys Ser Trp Gly Lys Pro Gly Tyr Pro Trp Pro
820 825
<210>5
<211>3297
<212>DNA
<213>人工
<220>
<223>MEFA7.1DNA序列
<400>5
atg gct aca aag gct gtttgt gtt ttg aag ggt gac ggc ccagtt caa 48
Met Ala Thr Lys Ala Val Cys Val Leu Lys Gly Asp Gly Pro Val Gln
1 5 10 15
ggt att att aac ttc gag cag aag gaa agt aat gga cca gtg aag gtg 96
Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val
20 25 30
tgg gga agc att aaa gga ctg act gaa ggc ctg cat gga ttc cat gtt 144
Trp Gly Ser Ile Lys Gly Leu Thr Glu Gly Leu His Gly Phe His Val
35 40 45
cat gag ttt gga gat aat aca gca ggc tgt acc agt gca ggt cct cac 192
His Glu Phe Gly Asp Asn Thr Ala Gly Cys Thr Ser Ala Gly Pro His
50 55 60
ttt aat cct cta tcc aga aaa cac ggt ggg cca aag gat gaa gag agg 240
Phe Asn Pro Leu Ser Arg Lys His Gly Gly Pro Lys Asp Glu Glu Arg
65 70 75 80
cat gtt gga gac ttg ggc aat gtg act gct gac aaa gat ggt gtg gcc 288
His Val Gly Asp Leu Gly Asn Val Thr Ala Asp Lys Asp Gly Val Ala
85 90 95
gat gtg tct att gaa gat tct gtg atc tca ctc tca gga gac cat tgc 336
Asp Val Ser Ile Glu Asp Ser Val Ile Ser Leu Ser Gly Asp His Cys
100 105 110
atc att ggc cgc aca ctg gtg gtc cat gaa aaa gca gat gac ttg ggc 384
Ile Ile Gly Arg Thr Leu Val Val His Glu Lys Ala Asp Asp Leu Gly
115 120 125
aaa ggt gga aat gaa gaa agt aca aag aca gga aac gct gga agt cgt 432
Lys Gly Gly Asn Glu Glu Ser Thr Lys Thr Gly Asn Ala Gly Ser Arg
130 135 140
ttg gct tgt ggt gta att ggg atc gcc cag aat ttg aat tct ggt tgc 480
Leu Ala Cys Gly Val Ile Gly Ile Ala Gln Asn Leu Asn Ser Gly Cys
145 150 155 160
aat tgc tct atc tat ccc ggc cat ata acg ggt cac cgc atg gca tgg 528
Asn Cys Ser Ile Tyr Pro Gly His Ile Thr Gly His Arg Met Ala Trp
165 170 175
aag ctt ggt tcc gcc gcc aga act acc tcg ggc ttt gtc tcc ttg ttc 576
Lys Leu Gly Ser Ala Ala Arg Thr Thr Ser Gly Phe Val Ser Leu Phe
180 185 190
gcc cca ggt gcc aaa caa aac gaa act cac gtc acg gga ggc gca gcc 624
Ala Pro Gly Ala Lys Gln Asn Glu Thr His Val Thr Gly Gly Ala Ala
195 200 205
gcc cga act acg tct ggg ttg acc tct ttg ttc tcc cca ggt gcc agc 672
Ala Arg Thr Thr Ser Gly Leu Thr Ser Leu Phe Ser Pro GlyAla Ser
210 215 220
caa aac att caa ttg att gtc gac ttt atc cct gtg gag aac cta gag 720
Gln Asn Ile Gln Leu Ile Val Asp Phe Ile Pro Val Glu Asn Leu Glu
225 230 235 240
aca acc atg cga tct ccg gtg ttc acg gat aac tcc tct cca cca gta 768
Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Val
245 250 255
gtg ccc cag agc ttc cag gtg gct cac ctc cat gct ccc aca ggc agc 816
Val Pro Gln Ser Phe Gln Val Ala His Leu Hi s Ala Pro Thr Gly Ser
260 265 270
ggc aaa agc acc aag gtc ccg gct gca tat gca gct cag ggc tat aag 864
Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr Lys
275 280 285
gtg cta gta ctc aac ccc tct gtt gct gca aca ctg ggc ttt ggt gct 912
Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly Ala
290 295 300
tac atg tcc aag gct cat ggg atc gat cct aac atc agg acc ggg gtg 960
Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg Thr Gly Val
305 310 315 320
aga aca att acc act ggc agc ccc atc acg tac tcc acc tac ggc aag 1008
Arg Thr Ile Thr Thr Gly Ser Pro Ile Thr Tyr Ser Thr Tyr Gly Lys
325 330 335
ttc ctt gcc gac ggc ggg tgc tcg ggg ggc gct tat gac ata ata att 1056
Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile Ile
340 345 350
tgt gac gag tgc cac tcc acg gat gcc aca tcc atc ttg ggc att ggc 1104
Cys Asp Glu Cys His Ser Thr Asp Ala Thr Ser Ile Leu Gly Ile Gly
355 360 365
act gtc ctt gac caa gca gag act gcg ggg gcg aga ctg gtt gtg ctc 1152
Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val Leu
370 375 380
gcc acc gcc acc cct ccg ggc tcc gtc act gtg ccc cat ccc aac atc 1200
Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His Pro Asn Ile
385 390 395 400
gag gag gtt gct ctg tcc acc acc gga gag atc cct ttt tac ggc aag 1248
Glu Glu Val Ala Leu Ser Thr Thr Gly Glu Ile Pro Phe Tyr Gly Lys
405 410 415
gct atc ccc ctc gaa gta atc aag ggg ggg aga cat ctc atc ttc tgt 1296
Ala Ile Pro Leu Glu Val Ile Lys Gly Gly Arg His Leu Ile Phe Cys
420 425 430
cat tca aag aag aag tgc gac gaa ctc gcc gca aag ctg gtc gca ttg 1344
His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Val Ala Leu
435 440 445
ggc atc aat gcc gtg gcc tac tac cgc ggt ctt gac gtg tcc gtc atc 1392
Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile
450 455 460
ccg acc agc ggc gat gtt gtc gtc gtg gca acc gat gcc ctc atg acc 1440
Pro Thr Ser Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met Thr
465 470 475 480
ggc tat acc ggc gac ttc gac tcg gtg ata gac tgc aat acg tgt gtc 1488
Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys Val
485 490 495
acc cag aca gtc gat ttc agc ctt gac cct acc ttc acc att gag aca 1536
Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu Thr
500 505 510
atc acg ctc ccc caa gat gct gtc tcc cgc act caa cgt cgg ggc agg 1584
Ile Thr Leu Pro Gln Asp Ala Val Ser Arg Thr Gln Arg Arg Gly Arg
515 520 525
act ggc agg ggg aag cca ggc atc tac aga ttt gtg gca ccg ggg gag 1632
Thr Gly Arg Gly Lys Pro Gly Ile Tyr Arg Phe Val Ala Pro Gly Glu
530 535 540
cgc ccc tcc ggc atg ttc gac tcg tcc gtc ctc tgt gag tgc tat gac 1680
Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr Asp
545 550 555 560
gca ggc tgt gct tgg tat gag ctc acg ccc gcc gag act aca gtt agg 1728
Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Thr Val Arg
565 570 575
cta cga gcg tac atg aac acc ccg ggg ctt ccc gtg tgc cag gac cat 1776
Leu Arg Ala Tyr Met Asn Thr Pro Gly Leu Pro Val Cys Gln Asp His
580 585 590
ctt gaa ttt tgg gag ggc gtc ttt aca ggc ctc act cat ata gat gcc 1824
Leu Glu Phe Trp Glu Gly Val Phe Thr Gly Leu Thr His Ile Asp Ala
595 600 605
cac ttt cta tcc cag aca aag cag agt ggg gag aac ctt cct tac ctg 1872
His Phe Leu Ser Gln Thr Lys Gln Ser Gly Glu Asn Leu Pro Tyr Leu
610 615 620
gta gcg tac caa gcc acc gtg tgc gct agg gct caa gcc cct ccc cca 1920
Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro Pro
625 630 635 640
tcg tgg gac cag atg tgg aag tgt ttg att cgc ctc aag ccc acc ctc 1968
Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu
645 650 655
cat ggg cca aca ccc ctg cta tac aga ctg ggc gct gtt cag aat gaa 2016
His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn Glu
660 665 670
atc acc ctg acg cac cca gtc acc aaa tac atc atg aca tgc atg tcg 2064
Ile Thr Leu Thr His Pro Val Thr Lys Tyr Ile Met Thr Cys Met Ser
675 680 685
gcc gac ctg gag gtc gtc acg agc gca tgc tcc ggg aag ccg gca atc 2112
Ala Asp Leu Glu Val Val Thr Ser Ala Cys Ser Gly Lys Pro Ala Ile
690 695 700
ata cct gac agg gaa gtc ctc tac cga gag ttc gat gag atg gaa gag 2160
Ile Pro Asp Arg Glu Val Leu Tyr Arg Glu Phe Asp Glu Met Glu Glu
705 710 715 720
tgc tct cag cac tta ccg tac atc gag caa ggg atg atg ctc gcc gag 2208
Cys Ser Gln His Leu Pro Tyr Ile Glu Gln Gly Met Met Leu Ala Glu
725 730 735
cag ttc aag cag aag gcc ctc ggc ctc tcg cga ggg ggc aag ccg gca 2256
Gln Phe Lys Gln Lys Ala Leu Gly Leu Ser Arg Gly Gly Lys Pro Ala
740 745 750
atc gtt cca gac aaa gag gtg ttg tat caa caa tac gat gag atg gaa 2304
Ile Val Pro Asp Lys Glu Val Leu Tyr Gln Gln Tyr Asp Glu Met Glu
755 760 765
gag tgc tca caa gct gcc cca tat atc gaa caa gct cag gta ata gct 2352
Glu Cys Ser Gln Ala Ala Pro Tyr Ile Glu Gln Ala Gln Val Ile Ala
770 775 780
cac cag ttc aag gaa aaa gtc ctt gga ttg atc gat aat gat caa gtg 2400
His Gln Phe Lys Glu Lys Val Leu Gly Leu Ile Asp Asn Asp Gln Val
785 790 795 800
gtt gtg act cct gac aaa gaa atc tta tat gag gcc ttt gat gag atg 2448
Val Val Thr Pro Asp Lys Glu Ile Leu Tyr Glu Ala Phe Asp Glu Met
805 810 815
gaa gaa tgc gcc tcc aaa gcc gcc ctc att gag gaa ggg cag cgg atg 2496
Glu Glu Cys Ala Ser Lys Ala Ala Leu Ile Glu Glu Gly Gln Arg Met
820 825 830
gcg gag atg ctc aag tct aag ata caa ggc ctc ctc ggg ata ctg cgc 2544
Ala Glu Met Leu Lys Ser LysIle Gln Gly Leu Leu Gly Ile Leu Arg
835 840 845
cgg cac gtt ggt cct ggc gag ggg gca gtg cag tgg atg aac cgg ctg 2592
Arg His Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu
850 855 860
ata gcc ttc gcc tcc aga ggg aac cat gtt tcc ccc acg cac tac gtt 2640
Ile Ala Phe Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val
865 870 875 880
ccg tct aga tcc cgg aga ttc gcc cag gcc ctg ccc gtt tgg gcg cgg 2688
Pro Ser Arg Ser Arg Arg Phe Ala Gln Ala Leu Pro Val Trp Ala Arg
885 890 895
ccg gac tat aac ccc ccg cta gtg gag acg tgg aaa aag ccc gac tac 2736
Pro Asp Tyr Asn Pro Pro Leu Val Glu Thr Trp Lys Lys Pro Asp Tyr
900 905 910
gaa cca cct gtg gtc cac ggc aga tct tct cgg aga ttc gcc cag gcc 2784
Glu Pro Pro Val Val His Gly Arg Ser Ser Arg Arg Phe Ala Gln Ala
915 920 925
ctg ccc gtt tgg gcg cgg ccg gac tat aac ccc ccg cta gtg gag acg 2832
Leu Pro Val Trp Ala Arg Pro Asp Tyr Asn Pro Pro Leu Val Glu Thr
930 935 940
tgg aaa aag ccc gac tac gaa cca cct gtg gtc cat ggc aga aag acc 2880
Trp Lys Lys Pro Asp Tyr Glu Pro Pro Val Val His Gly Arg Lys Thr
945 950 955 960
aaa cgt aac acc aac cgg cgg ccg cag gac gtc aag ttc ccg ggt ggc 2928
Lys Arg Asn Thr Asn Arg Arg Pro Gln Asp Val Lys Phe Pro Gly Gly
965 970 975
ggt cag atc gtt ggt cgc agg ggc cct cct atc ccc aag gct cgt cgg 2976
Gly Gln Ile Val Gly Arg Arg Gly Pro Pro Ile Pro Lys Ala Arg Arg
980 985 990
ccc gag ggc agg acc tgg gct cag ccc ggt tac cct tgg ccc ctc tat 3024
Pro Glu Gly Arg Thr Trp Ala Gln Pro Gly Tyr Pro Trp Pro Leu Tyr
995 1000 1005
ggc aat aag gac aga cgg tct aca ggt aag tcc tgg ggt aag cca ggg 3072
Gly Asn Lys Asp Arg Arg Ser Thr Gly Lys Ser Trp Gly Lys Pro Gly
1010 1015 1020
tac cct tgg cca aga aag acc aaa cgt aac acc aac cga cgg ccg cag 3120
Tyr Pro Trp Pro Arg Lys Thr Lys Arg Asn Thr Asn Arg Arg Pro Gln
1025 1030 1035 1040
gac gtc aag ttc ccg ggt ggc ggt cag atc gtt ggt cgc agg ggc cct 3168
Asp Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly Arg Arg Gly Pro
1045 1050 1055
cct atc ccc aag gct cgt cgg ccc gag ggc agg acc tgg gct cag ccc 3216
Pro Ile Pro Lys Ala Arg Arg Pro Glu Gly Arg Thr Trp Ala Gln Pro
1060 1065 1070
ggt tac cct tgg ccc ctc tat ggc aat aag gac aga cgg tct acc ggt 3264
Gly Tyr Pro Trp Pro Leu Tyr Gly Asn Lys Asp Arg Arg Ser Thr Gly
1075 1080 1085
aag tcc tgg ggt aag cca ggg tat cct tgg ccc 3297
Lys Ser Trp Gly Lys Pro Gly Tyr Pro Trp Pro
1090 1095
<210>6
<211>1099
<212>PRT
<213>人工
<220>
<223>MEFA 7.1氨基酸序列
<400>6
Met Ala Thr Lys Ala Val Cys Val Leu Lys Gly Asp Gly Pro Val Gln
1 5 10 15
Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val
20 25 30
Trp Gly Ser Ile Lys Gly Leu Thr Glu Gly Leu His Gly Phe His Val
35 40 45
His Glu Phe Gly Asp Asn Thr Ala Gly Cys Thr Ser Ala Gly Pro His
50 55 60
Phe Asn Pro Leu Ser Arg Lys His Gly Gly Pro Lys Asp Glu Glu Arg
65 70 75 80
His Val Gly Asp Leu Gly Asn Val Thr Ala Asp Lys Asp Gly Val Ala
85 90 95
Asp Val Ser Ile Glu Asp Ser Val Ile Ser Leu Ser Gly Asp His Cys
100 105 110
Ile Ile Gly Arg Thr Leu Val Val His Glu Lys Ala Asp Asp Leu Gly
115 120 125
Lys Gly Gly Asn Glu Glu Ser Thr Lys Thr Gly Asn Ala Gly Ser Arg
130 135 140
Leu Ala Cys Gly Val Ile Gly Ile Ala Gln Asn Leu Asn Ser Gly Cys
145 150 155 160
Asn Cys Ser Ile Tyr Pro Gly His Ile Thr Gly His Arg Met Ala Trp
165 170 175
Lys Leu Gly Ser Ala Ala Arg Thr Thr Ser Gly Phe Val Ser Leu Phe
180 185 190
Ala Pro Gly Ala Lys Gln Asn Glu Thr His Val Thr Gly Gly Ala Ala
195 200 205
Ala Arg Thr Thr Ser Gly Leu Thr Ser Leu Phe Ser Pro Gly Ala Ser
210 215 220
Gln Asn Ile Gln Leu Ile Val Asp Phe Ile Pro Val Glu Asn Leu Glu
225 230 235 240
Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Val
245 250 255
Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly Ser
260 265 270
Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr Lys
275 280 285
Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly Ala
2902 95 300
Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg Thr Gly Val
305 310 315 320
Arg Thr Ile Thr Thr Gly Ser Pro Ile Thr Tyr Ser Thr Tyr Gly Lys
325 330 335
Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile Ile
340 345 350
Cys Asp Glu Cys His Ser Thr Asp Ala Thr Ser Ile Leu Gly Ile Gly
355 360 365
Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val Leu
370 375 380
Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His Pro Asn Ile
385 390 395 400
Glu Glu Val Ala Leu Ser Thr Thr Gly Glu Ile Pro Phe Tyr Gly Lys
405 410 415
Ala Ile Pro Leu Glu Val Ile Lys Gly Gly Arg His Leu Ile Phe Cys
420 425 430
His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Val Ala Leu
435 440 445
Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile
450 455 460
Pro Thr Ser Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met Thr
465 470 475 480
Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys Val
485 490 495
Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu Thr
500 505 510
Ile Thr Leu Pro Gln Asp Ala Val Ser Arg Thr Gln Arg Arg Gly Arg
515 520 525
Thr Gly Arg Gly Lys Pro Gly Ile Tyr Arg Phe Val Ala Pro Gly Glu
530 535 540
Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr Asp
545 550 555 560
Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Thr Val Arg
565 570 575
Leu Arg Ala Tyr Met Asn Thr Pro Gly Leu Pro Val Cys Gln Asp His
580 585 590
Leu Glu Phe Trp Glu Gly Val Phe Thr Gly Leu Thr His Ile Asp Ala
595 600 605
His Phe Leu Ser Gln Thr Lys Gln Ser Gly Glu Asn Leu Pro Tyr Leu
610 615 620
Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro Pro
625 630 635 640
Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu
645 650 655
His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn Glu
660 665 670
Ile Thr Leu Thr His Pro Val Thr Lys Tyr Ile Met Thr Cys Met Ser
675 680 685
Ala Asp Leu Glu Val Val Thr Ser Ala Cys Ser Gly Lys Pro Ala Ile
690 695 700
Ile Pro Asp Arg Glu Val Leu Tyr Arg Glu Phe Asp Glu Met Glu Glu
705 710 715 720
Cys Ser Gln His Leu Pro Tyr Ile Glu Gln Gly Met Met Leu Ala Glu
725 730 735
Gln Phe Lys Gln Lys Ala Leu Gly Leu Ser Arg Gly Gly Lys Pro Ala
740 745 750
Ile Val Pro Asp Lys Glu Val Leu Tyr Gln Gln Tyr Asp Glu Met Glu
755 760 765
Glu Cys Ser Gln Ala Ala Pro Tyr Ile Glu Gln Ala Gln Val Ile Ala
770 775 780
His Gln Phe Lys Glu Lys Val Leu Gly Leu Ile Asp Asn Asp Gln Val
785 790 795 800
Val Val Thr Pro Asp Lys Glu Ile Leu Tyr Glu Ala Phe Asp Glu Met
805 810 815
Glu Glu Cys Ala Ser Lys Ala Ala Leu Ile Glu Glu Gly Gln Arg Met
820 825 830
Ala Glu Met Leu Lys Ser Lys Ile Gln Gly Leu Leu Gly Ile Leu Arg
835 840 845
Arg His Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu
850 855 860
Ile Ala Phe Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val
865 870 875 880
Pro Ser Arg Ser Arg Arg Phe Ala Gln Ala Leu Pro Val Trp Ala Arg
885 890 895
Pro Asp Tyr Asn Pro Pro Leu Val Glu Thr Trp Lys Lys Pro Asp Tyr
900 905 910
Glu Pro Pro Val Val His Gly Arg Ser 5er Arg Arg Phe Ala Gln Ala
915 920 925
Leu Pro Val Trp Ala Arg Pro Asp Tyr Asn Pro Pro Leu Val Glu Thr
930 935 940
Trp Lys Lys Pro Asp Tyr Glu Pro Pro Val Val His Gly Arg Lys Thr
945 950 955 960
Lys Arg Asn Thr Asn Arg Arg Pro Gln Asp Val Lys Phe Pro Gly Gly
965 970 975
Gly Gln Ile Val Gly Arg Arg Gly Pro Pro Ile Pro Lys Ala Arg Arg
980 985 990
Pro Glu Gly Arg Thr Trp Ala Gln Pro Gly Tyr Pro Trp Pro Leu Tyr
995 1000 1005
Gly Asn Lys Asp Arg Arg Ser Thr Gly Lys Ser Trp Gly Lys Pro Gly
1010 1015 1020
Tyr Pro Trp Pro Arg Lys Thr Lys Arg Asn Thr Asn Arg Arg Pro Gln
1025 1030 1035 1040
Asp Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly Arg Arg Gly Pro
1045 1050 1055
Pro Ile Pro Lys Ala Arg Arg Pro Glu Gly Arg Thr Trp Ala Gln Pro
1060 1065 1070
Gly Tyr Pro Trp Pro Leu Tyr Gly Asn Lys Asp Arg Arg Ser Thr Gly
1075 1080 1085
Lys Ser Trp Gly Lys Pro Gly Tyr Pro Trp Pro
1090 1095
<210>7
<211>21
<212>PRT
<213>人工
<220>
<223>共有序列
<400>7
Gly Ser Ala Ala Arg Thr Thr Ser Gly Phe Val Ser Leu Phe Ala Pro
1 5 10 15
Gly Ala Lys Gln Asn
20
<210>8
<211>10
<212>DNA
<213>人工
<220>
<223>HindI II位点后的序列
<400>8
acaaaacaaa 10
<210>9
<211>23
<212>PRT
<213>人工
<220>
<223>NS4A肽
<400>9
Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys
1 5 10 15
Pro Ala Ile Ile Pro Lys Lys
20