CN101875942B - 甲型肝炎病毒基因组全序列 - Google Patents

甲型肝炎病毒基因组全序列 Download PDF

Info

Publication number
CN101875942B
CN101875942B CN2009100504746A CN200910050474A CN101875942B CN 101875942 B CN101875942 B CN 101875942B CN 2009100504746 A CN2009100504746 A CN 2009100504746A CN 200910050474 A CN200910050474 A CN 200910050474A CN 101875942 B CN101875942 B CN 101875942B
Authority
CN
China
Prior art keywords
leu
ser
val
gly
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009100504746A
Other languages
English (en)
Other versions
CN101875942A (zh
Inventor
张爱晖
施松明
周平华
吴克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yuxi Walvax Biotechnology Co.,Ltd.
Original Assignee
Shanghai Zerun Biotech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zerun Biotech Co Ltd filed Critical Shanghai Zerun Biotech Co Ltd
Priority to CN2009100504746A priority Critical patent/CN101875942B/zh
Publication of CN101875942A publication Critical patent/CN101875942A/zh
Application granted granted Critical
Publication of CN101875942B publication Critical patent/CN101875942B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及甲型肝炎病毒基因组全序列。更具体地,本发明涉及全序列如SEQ ID NO:1所示的甲型肝炎病毒的基因组序列及其应用。本发明还提供了甲型肝炎病毒特异性的引物和探针。

Description

甲型肝炎病毒基因组全序列
技术领域
本发明涉及病毒基因组学领域。更具体地,本发明涉及甲型肝炎病毒的基因组序列及其应用。
背景技术
甲型肝炎是由甲型肝炎病毒感染人体引起的一种急性肠道传病。甲型肝炎是现已发现的严重影响人类健康的六种病毒性肝炎之一,且感染率为最高。我国是甲型肝炎高流行区,常引起季节性流行。由于该病的高发病率及较长的病程,给人民健康及经济发展带来严重影响。
目前,对于甲型肝炎迄今人们尚无有效的治疗手段,接种疫苗是迄今人类控制该疾病最有效和最经济的措施。
中国专利申请01140508.2公开了一种甲肝病毒中国株和减毒株的培育及互补脱氧核糖核酸序列。然而,甲肝减毒活疫苗存在着明显的缺点,最为突出的是毒力返祖和次传播问题,对接种者及其密切接触者构成潜在的安全隐患。其次,对免疫功能低下或缺陷者高度危险。此外,减毒活疫苗还存在热稳定性差、运输贮存条件要求苛刻等缺点。
因灭活疫苗病毒蛋白纯度高,故免疫效果好,安全性高,这也是发达国家和地区迄今只使用甲肝灭活疫苗的重要原因。此外灭活疫苗是公认制备多价疫苗、联合疫苗的重要环节,而联合疫苗是世界卫生组织(WHO)与各国卫生当局所倡导的疫苗发展方向和策略。
现有的甲肝灭活疫(包括减毒疫苗)的甲肝病毒株所适应的细胞基质均为人二倍体细胞或人成纤维细胞,繁殖效率不高是其共同缺点,而制备灭活疫苗需要大量纯化的病毒抗原,这是甲肝灭活苗制备成本高昂的根本原因。
中国专利申请02106985中公开了一种甲型肝炎病毒株,该病毒株具有在Vero细胞(ATCC NO:CCL-81)上高效稳定增殖的特性,增殖效率是其它甲肝毒株在人二倍体细胞增殖10倍以上,且动物试验已证明该甲肝病毒株YN5具有良好的免疫原性,可以用作生产灭活疫苗的毒种。
然而,目前对于各种类型甲型肝炎病毒的基因组还了解甚少。本领域迫切需要开发类型甲型肝炎病毒的基因组,以便了解不同HAV毒株之间区别以及用于检测应用。
发明内容
本发明的目的就是通过对甲型肝炎病毒基因组进行全序列的测定,为检测HAV、研究HAV感染途径等目的奠定可靠的基础。
在本发明的第一方面,提供了一种分离的核酸分子,所述核酸分子具有或其序列为SEQ ID NO:1所示的核苷酸序列或其反义序列。
在另一类优选例中,所述的核酸分子是DNA或RNA。
在本发明的第二方面,提供了本发明第一方面中所述的核酸分子的用途,它们被用于制备检测甲型肝炎病毒的引物、探针或试剂盒。
在另一类优选例中,所述的引物长度为15-100个核苷酸。
在另一类优选例中,所述的探针的长度为25-5000个核苷酸。
在另一类优选例中,所述的探针的长度为50-500个核苷酸。
在本发明的第三方面,提供了一种分离的DNA分子,该DNA分子由SEQ IDNO:1所示序列或其反义序列中连续的150-7473个核苷酸所构成。
在另一类优选例中,所述的DNA分子由SEQ ID NO:1所示序列或其反义序列中连续的300-7473个核苷酸所构成。
在另一类优选例中,所述的DNA分子由SEQ ID NO:1所示序列或其反义序列中连续的1000-7473个核苷酸所构成。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
具体实施方式
本发明人经过广泛而深入的研究,首次获得了具有在Vero细胞上高效稳定增殖的特性甲肝病毒的全基因组序列。在此基础上,完成了本发明。
总体而言,本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。
本发明的基因组全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
第一方面,本发明提供了一核酸,该核酸含有在SEQ ID NO:1所示的甲肝病毒的基因组核苷酸序列。还提供了含有与本文所公开的核苷酸序列有序列相同性的序列的核酸。根据具体的序列,序列相同性的程度宜大于50%(例如60%、70%、80%、90%、95%、99%或更高)。这些序列包括例如突变体和等位基因变体。
本发明还提供了包含本文所公开的一种或多种核苷酸序列片段的核酸。这些片段应包含诸序列中至少n个连续的氨基酸,并且根据具体的序列,n为10或更高(例如,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,30,35,40,45,50,60,75,100或更高)。较佳地,该片段是甲肝病毒基因组特有的,换言之在其他生物体的基因组中并不存在。更佳地,该片段是甲肝病毒毒株的基因组特有的。本发明还提供了与本文所提供的核酸发生杂交的核酸。杂交条件如本文中所述。
本发明还提供了一核酸,该核酸包含与上述序列互补的序列(例如,用于反义、用于探针、或用于扩增引物)。
当然,本发明的核酸可以用多种方法制备(例如,化学合成、从DNA文库、或从生物体本身制得等),并可采用各种形式(例如单链、双链、载体、探针、引物等)。术语“核酸”包括DNA和RNA,以及它们的类似物,如含有修饰骨架的那些类似物,还包括肽核酸(PNA)等。
应理解,因为SEQ ID NO:1基本上代表了甲肝病毒的完整基因组。
本发明还提供了含有本发明的核苷酸序列的载体(如表达载体、测序载体、克隆载体等)以及用这些载体转化的宿主细胞。
第二方面,本发明还提供了一种蛋白质,该蛋白质含有本文所示的甲肝病毒核苷酸序列中所编码的氨基酸序列。还提供了含有与这些蛋白质有序列相同性的序列的蛋白。根据具体的序列,序列相同性程度宜大于50%(例如60%、70%、80%、90%、95%、99%或更高)。序列相同性用如上所述的方法确定。这些同源蛋白包括本文所示的甲肝病毒核苷酸序列中所编码的突变体和等位基因变体。
本发明还提供了一种蛋白质,该蛋白质含有序列表中所公开的甲肝病毒核苷酸序列中所编码的氨基酸序列片段。这些片段应包含诸序列中至少n个连续的氨基酸,并且根据具体的序列,n为7或更高(例如,8、10、12、14、16、18、20或更高)。这些片段宜包含该序列的表位。
可用各种测试来评估本发明蛋白的体内免疫原性。例如,蛋白质可以重组表达或者化学合成,并通过免疫印迹用于筛选病人的血清。蛋白质与病人血清之间发生阳性反应,就表示病人早已对有关蛋白质产生过免疫应答,即该蛋白是免疫原。该方法可用于鉴别免疫优势蛋白。
本发明还提供了编码本发明蛋白的核酸。
第三方面,本发明还提供了含有本发明核酸的核苷酸序列的计算机、计算机存储器、计算机存储介质(如软盘、硬盘、CD-ROM等)和/或计算机数据库。较佳地,它含有本文列出的一种或多种甲肝病毒核苷酸序列。
这可用于分析本文所列出甲肝病毒核苷酸序列。例如,可用于检索以鉴别序列中的开放阅读框(ORF)或编码序列。
第四方面,本发明提供了鉴别氨基酸序列的方法,它包括步骤:检索本文所列出的甲肝病毒核苷酸序列中推定的开放阅读框或蛋白编码序列。类似地,本发明提供了此处所列出的甲肝病毒核苷酸序列在检索推定的开放阅读框或蛋白质编码序列中的用途。
开放阅读框或蛋白编码序列分析通常在计算机上用标准的生物信息技术进行。用于分析的典型算法或程序包括:ORFFINDER(NCBI),GENMARK[Borodovsky &McIninch(1993)Computers Chem17:122-133]和GLIMMER[Salzberg et al.(1998)Nucl Acids Res 26:544-548]。
对开放阅读框或蛋白编码序列的检索可包括步骤:检索此处所列出的甲肝病毒核苷酸序列中的起始密码子和检索上游序列中的处于读框中终止密码子。中间的密码子就代表了推定的蛋白编码序列。通常,应检索一个序列中6种可能的读框。
用这种方法鉴别出的氨基酸序列可用任何合适的系统进行表达,以获得蛋白。该蛋白可用于产生抗体,而该抗体识别在鉴别出的氨基酸序列中的表位。这些抗体可用于筛选甲肝病毒,以检测是否存在含所鉴别氨基酸序列的蛋白质。
此外,一旦鉴别出ORF或蛋白编码序列,那么就可将该序列与序列数据库进行比较。序列分析工具可在NCBI(http://www.ncbi.nlm.nih.gov)处找到,例如BLAST,BLAST2,BLASTn,BLASTp,tBLASTn,BLASTx,和tBLASTx算法[还可参见Altschul等人.(1997)Gapped BLAST and PSI-BLAST:new generationof protein database search programs.Nucleic Acids Research25:2289-3402]。用于比较的合适数据库包括非冗余GenBank,EMBL,DDBJ和PDB序列,以及非冗余GenBank CDS翻译物,PDB,SwissProt,Spupdate和PIR序列。这种比较可给出蛋白质功能的指示。
氨基酸序列中的疏水区可用以上算法加以预测,例如基于Esposti等人的统计学研究的算法[″膜蛋白亲水性的关键评价″(Critical evaluation of thehydropathy of membrane proteins)(1990)Eur J Biochem 190:207-219]。疏水区代表了潜在的跨膜区或疏水性前导序列,这暗示蛋白质可以被分泌或位于表面。这些特性通常是良好免疫原的标志。
类似地,可用PSORT算法(http://www.psort.nibb.ac.jp)来预测跨膜区或前导序列,以及用MOTIFS程序来预测功能区(GCG Wisconsin & PROSITE)。
本发明还提供了一种核酸,该核酸含有本文所列出的甲肝病毒核苷酸序列中的开放阅读框或蛋白编码序列。此外,基于本发明所提供的基因组序列,还提供了若干种蛋白质,该蛋白质含有所述开放阅读框或蛋白编码序列所编码的氨基酸序列。例如,SEQ ID NO:1中第730-7413位的ORF就编码一个长度为2229个氨基酸的前原蛋白(pre-proprotein)(SEQ ID NO:2)。
第五方面,本发明提供了结合这些蛋白的抗体。它们可能是多克隆的或单克隆的,可用本领域技术人员已知的任何合适方法制得。
本发明的抗体可以以各种不同方式使用,例如用于证实蛋白质的表达,或用于证实蛋白质表达的场所。例如,标记的抗体(如荧光标记以用于FACS(流式细胞分选仪))可以与完整的病毒一起孵育,而在病毒表面上存在标记就证实蛋白质的位置。
第六方面,本发明提供了各种方法。
本发明提供了一种生产本发明的蛋白的方法,该方法包括步骤:在诱导蛋白表达的条件下,培育本发明的宿主细胞。一种方法还可包括化学合成蛋白或化学合成(至少部分合成)核苷酸。
本发明提供了一种检测本发明的多核苷酸的方法,该方法包括下列步骤:(a)在杂交条件下使本发明的核酸探针与生物样品接触,形成双链体;和(b)检测所述双链体。
本发明提供了一种检测本发明的蛋白质的方法,该方法包括下列步骤:(a)在适合形成抗体-抗原复合物的条件下使本发明的抗体和生物样品接触;和(b)检测所述复合物。
第七方面,本发明提供了检测选择性结合于抗原或多肽或蛋白质的抗体的方法,这些抗原或多肽或蛋白质是对甲肝病毒的任何毒种或毒株特异性的,较佳地是对甲肝病毒毒株特异性的,但更佳地是对甲肝病毒特异的。该方法包括步骤:(a)在适合形成抗体-抗原复合物的条件下,使本发明抗原或多肽或蛋白质与生物样品接触;和(b)检测所述复合物。
方法综述
本发明提供了甲肝病毒HAV核苷酸序列、和其所编码的氨基酸序列。利用这些所公开的序列,可以产生核酸探针试验和表达盒及载体。蛋白质还可化学合成。表达载体可以转入宿主细胞以产生蛋白。纯化或分离的多肽可用于产生抗体以检测HAV蛋白。而且,宿主细胞或提取物可用于生物试验以分离促效剂和拮抗剂。此外,利用这些序列,人们可检索以鉴定开放读框(ORF)和鉴定氨基酸序列。蛋白质还可用于免疫原性组合物以及用作疫苗组份。
除非另有描述,本发明的实施将采用分子生物学、微生物学、重组DNA和免疫学的常规技术,这些均是本领域技术人员所知的。这些技术在下列文献中有全面的描述:例如,Sambrook《分子克隆实验手册》第2版(1989);《DNA克隆》第I和II卷(D.N.Glover编1985);《寡核苷酸合成》(M.J.Gait编,1984);《核酸杂交》(B.D.Hames和S.J.Higgins编.1984);《转录和翻译》(B.D.Hames和S.J.Higgins编,1984);《动物细胞培养》(R.I.Freshney编,1986);《固定化细胞和酶》(IRL出版社,1986);B.Perbal,《分子克隆实用指南》(1984);《酶学方法》系列丛书(Academic Press,Inc.),尤其是154和155卷;《哺乳动物细胞的基因转移载体》(J.H.Miller和M.P.Calos编,1987,Cold Spring Harbor Laboratory);Mayer和Walker编(1987),《细胞和分子生物学的免疫化学方法》(Academic Press,London);Scopes,(1987)《蛋白质纯化:原理和实践》第2版(Springer-Verlag,N.Y.),以及《实验免疫学手册》I-IV卷(D.C.Weir和C.C.Blackwell编1986)。
在本说明书中采用了核苷酸和氨基酸的标准缩写。
本文引用的所有出版物、专利和专利申请均全部纳入本文作参考。
免疫诊断试验
本发明的甲肝病毒HAV抗原或其抗原性片段,可用于免疫试验来检测抗体水平(或相反,可用抗甲肝病毒抗体来检测抗原水平)。根据明确的免疫试验,可以开发重组抗原,以代替侵入性诊断方法。可检测生物学样品(例如包括血液或血清样品)中的抗甲肝病毒HAV蛋白或其片段的抗体。免疫试验的设计可作很大变化,其各种方案均是本领域中已知的。免疫试验的方案可基于例如竞争性、或直接反应或夹心型试验。方案例如还可采用固体支持物,或可以采用免疫沉淀法。大多数试验涉及采用标记的抗体或多肽;该标记例如可以是荧光标记、化学发光标记、放射活性标记或染料分子。扩增探针信号的试验也是已知的;其例子是采用生物素和亲和素的试验,酶标记的和介导的免疫试验,如ELISA试验。
将合适的材料(包括本发明的组合物)以及进行试验所需的其它试剂和材料(例如合适的缓冲液、盐溶液等)和合适的试验说明书包装到合适的容器中,构成适用于免疫诊断且含有适当标记的试剂的试剂盒。
核酸杂交
“杂交”指两个核酸序列相互之间通过氢键而结合。通常,一个序列固定于固体载体,另一个将游离于溶液内。然后,在有利于形成氢键的条件下使两个序列相互接触。影响这种结合的因素包括:溶剂的类型和体积;反应温度;杂交时间;搅拌;封闭液相序列与固体载体非特异性结合的试剂(Denhardt’s试剂或BLOTTO);各序列的浓度;是否使用化合物来增加序列结合的速度(硫酸葡聚糖或聚乙二醇);以及杂交后洗涤条件的严谨程度。见Sambrook等人[同上]第2卷,第9章,9.47至9.57页。
“严谨性”指有利于非常相似的序列结合而不利于不同序列结合的杂交反应条件。例如,应选择温度和盐浓度的组合,使温度比所研究的杂交的Tm计算值低大约120至200℃。温度和盐浓度常可在前期初步实验中通过经验来确定,在初步实验中,固定在滤膜上的基因组DNA样品与感兴趣的序列杂交,然后在不同的严谨度条件下洗涤。见Sambrook等人第9.50页。
在设计杂交实验时,影响核酸杂交的一些因素可以方便地予以改变。杂交和洗涤时的温度以及洗涤时的盐浓度的调节最为简单。随着杂交温度(即严谨度)的升高,不同源的链之间发生杂交的可能性变得更少,结果背景值降低。如果放射性标记的探针并非与固定的片段完全同源(这在基因家族和种间杂交实验中是常见的),则必须降低杂交温度,而背景值将会增加。洗涤温度以类似的方式影响杂交带的强度和背景值的程度。洗涤的严谨性也随盐浓度的降低而升高。
通常,在50%甲酰胺存在下的方便的杂交温度是:对于靶片段同源性达95%至100%的探针而言,是42℃;对于同源性为90%至95%的探针,为37℃;对于同源性为85%和90%的探针,为32℃。对于较低的同源性,应用上述方程式应相应地降低甲酰胺含量和调节温度。如果探针和靶片段之间的同源性是未知的,则最简单的方法是从非严谨的杂交和洗涤条件开始。如果在放射自显影后发现了非特异性的条带或高背景值,则可在高严谨性下洗涤滤膜,并重新曝光。如果曝光所需时间使得该方法不切实际,则应平行测试几种杂交和/或洗涤严谨性。
核酸探针试验
采用本发明的核酸探针的方法(如PCR、分支DNA探针试验或印迹技术)能确定cDNA或mRNA的存在。如果探针和本发明的序列能形成稳定地足以被检测到的双链体或双链复合物,则称探针与本发明的序列“杂交”。
核酸探针将与本发明的甲肝病毒核苷酸序列(包括有义和反义链)杂交。尽管有许多不同的核苷酸序列编码该氨基酸序列,但是天然的甲肝病毒序列是较佳的,因为它是实际存在于细胞中的序列。mRNA代表一种编码序列,因此探针应与该编码序列互补;单链cDNA与mRNA互补,因此cDNA探针应与非编码序列互补。
探针的确切长度和序列将取决于杂交条件,如温度、盐浓度等。例如,对于诊断应用,根据分析物序列的复杂程度,核酸探针通常含有至少10-20个核苷酸,较佳的15-25个,更佳的至少30个核苷酸,但是也可短于该长度。短的引物通常需要较低温度,以便和模板形成足够稳定的杂交复合物。
探针可用合成方法产生,例如Matteucci等人[J.Am.Chem.Soc.(1981)103:3185]的方法或Urdea等人[Proc.Natl.Acad.Sci.USA(1983)80:7461]的方法,或用市售的自动寡核苷酸合成仪合成。
可以根据偏好选择探针的化学特征。对于某些应用,DNA或RNA是合适的。对于其它的应用,可以加入修饰,例如骨架修饰,如硫代磷酸酯或甲基磷酸酯,可用来增加体内半衰期,改变RNA亲和力,增加核酸酶抗性等[例如参见Agrawal和Iyer(1995)Curr Opin Biotechnol 6:12-19;Agrawal(1996)TIBTECH14:376-387];还可采用类似物如肽核酸[例如参见Corey(1997)TIBTECH15:224-229;Buchardt等人(1993)TIBTECH11:384-386]。
另外,聚合酶链反应(PCR)是另一个熟知的检测少量靶核酸的手段。该试验在Mullis等人[Meth.Enzymol.(1987)155:335-350];美国专利4,683,195和4,683,202中有所描述。用两个“引物”核苷酸与靶核酸杂交,并用来引导反应。引物可包含不与扩增靶序列(或其互补序列)杂交的序列,以帮助双链体的稳定性,或例如可插入一个简便的限制性位点。这些序列通常侧接所需的甲肝病毒序列。
利用最初的靶核酸作为模板,热稳定的聚合酶能从引物产生靶核酸的拷贝。在聚合酶产生临界量的靶核酸后,它们可用较传统的方法(如Southern印迹)来检测。当采用Southern印迹方法时,标记的探针将与甲肝病毒序列(如其互补序列)杂交。
另外,mRNA或cDNA也可用Sambrook等人[同上]描述的传统印迹技术来检测。用凝胶电泳可纯化并分离利用聚合酶从mRNA产生的mRNA或cDNA。然后,将凝胶上的核酸印迹到固体载体如硝酸纤维素上。使固体载体与标记的探针接触,然后洗涤除去所有未杂交的探针。然后,检测含有标记探针的双链体。该探针通常用放射活性物质作标记。
基因组序列的应用
基于对甲型肝炎病毒基因组全序列的测定,可以了解与该病毒增殖及重要调控功能有关的基因结构和功能,找到其分子生理机制以及如何侵染宿主的关键点,寻找病毒致病甚至致死基因。
一种应用方法是,用甲型肝炎病毒感染Vero细胞,建立cDNA文库。用双向末端法测定cDNA克隆,或直接对HAV cDNA的文库用PCR扩增的方法进行序列测定。基于本发明所提供的甲型肝炎病毒基因组序列,可以大大方便引物的设计以及克隆的进程。
另一种直接的应用是使用本发明的引物或探针,来检测样品中是否存在甲型肝炎病毒或其遗传物质。
对于探针而言,这种检测方法包括步骤:
将DNA样品与本发明的探针接触,
观察是否形成DNA-探针复合物,形成了复合物就表示样品中存在甲型肝炎病毒或遗传物质。
对于引物而言,这种检测方法包括步骤:
用本发明的特异性引物,对样品进行PCR反应,
观察是否扩增产生了特异性的扩增产物,产生了特异性扩增产物就表示样品中存在甲型肝炎病毒或遗传物质。
在本发明的一个实例中,甲型肝炎病毒的基因组序列是通过如下方法获得的,该方法包括步骤:
1.分离纯化HAV病毒,获取高纯度RNA样品。
2.以此RNA样品为模板,采用“RT-PCR”合成单链cDNA。继续以此cDNA为模板,利用32mer寡核苷酸引物,在Taq和Deep Vent DNA多聚酶的作用下进行PCR扩增,得到7.4k片段
3.将得到的序列输入计算机,利用软件(如Innerpeace软件)进行拼接,再经后期工作得到完整的病毒基因组全序列。
经过多次反复测序,在平均每个碱基测序约6次的基础上获得了如SEQ IDNO:1所示的甲型肝炎病毒基因组全序列。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1
病毒RNA的提取
取甲型肝炎病毒株YN5感染Vero细胞,进行超声破碎3~5秒,将细胞破碎。4℃800rpm离心5min后取上清液,进行蔗糖/甘油非连续密度梯度离心,获得高纯度HAV病毒。
逆转录PCR(RT-PCR)
设计并合成引物1:5’-TTTTTTTTTTTTTTTTTTAT-3’(SEQ ID NO:3)。取前述制备的RNA病毒5μL置于200μL的PCR扩增专用小管中,加入100pmol的引物1,置于65℃变性10min后,立即置于冰上,加入10×逆转录缓冲液2μL,1mmol/L 4×dNTP,20U RNasin,和50U Expand Reverse Transcriptase,加水至终体积20μL。混匀后42℃温育2h。
PCR扩增
设计并合成以下引物2和引物3。
引物2:5’-TTCAAGAGGGGTCTCCGGGAATTTCCGGAGTC-3’(SEQ ID NO:4);
引物3:5’-ATTTATTTACTAATAAAAGAAATAAACAAACC-3’(SEQ ID NO:5)。
取上述逆转录产物5μL置于200μL的PCR扩增专用小管内,加入10×PCR缓冲液2μL,350μmol 4×dNTP,350nmol引物2和引物3,8U含Deep Vent的Taq DNA聚合酶,混匀后置PCR仪进行扩增,循环参数:96℃ 2min 1个循环,93℃10s,69℃50s,72℃15min 10个循环;93℃10s,69℃50s,72℃15min(每次增加20s),30个循环。反应产物取2μL于0.8%琼脂糖凝胶电泳检测,将大小为7.4Kb的片段割下,然后进行DNA片段的纯化。
连接反应
按如下条件与pUC18质粒进行连接:
    10×PCR缓冲液     1ul
    pUC18     0.2ul
    DNA     3.3ul
    T4连接酶     0.5ul
转化
取50ul的大肠杆菌DH5α,加入连接反应产物,在冰上放置30分钟。42℃条件下放置1分钟,再进行冰浴1~2分钟。加入250ul 37℃的SOC营养液,摇菌一小时,涂板。
测序
然后,挑取大肠杆菌阳性克隆进行PCR。对PCR产物进行末端双脱氧法法测序。
经过多次反复测序,在平均每个碱基测序约6次的基础上,获得了如SEQ IDNO:1所示的甲型肝炎病毒基因组全序列。
实施例2
对甲型肝炎病毒基因组序列的验证
根据SEQ ID NO:1所示的核苷酸序列,按每800bp左右长度设计引物,进行PCR反应,对PCR产物进行测序验证。结果表明SEQ ID NO:1的核苷酸序列是正确的。
实施例3
检测甲型肝炎病毒病毒株的试剂盒
基于SEQ ID NO:1中所示的基因组序列,合成以下PCR引物和探针:
有义引物1:序列为SEQ ID NO:1中第1393-1416位。
反义引物2:序列为SEQ ID NO:1中第1537-1560位的互补序列。
探针3:序列为SEQ ID NO:1中第1444-1473位。
制备一试剂盒(检测100次),它含有:
    名称     浓度
    有义引物1     100pmol
    反义引物2     100pmol
    探针3     100pmol
    PCR反应液     含Taq酶dNTP镁离子PCR反应缓冲液
取甲型肝炎病毒株YN5感染Vero细胞,如实施例1获得甲肝病毒株并通过RT-PCR获得cDNA样品。将该cDNA样品稀释104、105、106和107倍制得样品A、B、C、D,用上述试剂盒进行PCR扩增和杂交检测,同时设置阳性对照和阴性对照。
结果表明,该试剂盒可以检测稀释度为104、105、106和107倍的HAV样品。
此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110>上海泽润生物科技有限公司
<120>甲型肝炎病毒基因组全序列
<130>091191
<160>5
<170>PatentIn version                                                3.4
<210>1
<211>7473
<212>DNA
<213>Hepatitis A virus
<220>
<221>CDS
<222>(730)..(7413)
<400>1
ttcaagaggg gtgtccggga atttacggag tccctcttgg aagtccatgg tgaggggact    60
tgatacctca ccgccgtttg cctaggctat aggctaaatt ttccctttcc cttttccctt    120
tcccattccc ttttgcttgt aaatattgat tcctgcaggt tcagggttct taaatctgtt    180
tctctataag aacactcatt ttcacgcttt ctgtcttctt tcttccaggg ctctcccctt    240
gccctaggct ctggccgttg cgcccggcgg ggtcaactcc atgattagca tggagctgta    300
ggagtctaaa ttggggacac agatgtttgg aacgtcacct tgcagtgtta acttggcttt    360
catgaatctc tttgatcttc cacaaggggt aggctacggg tgaaacctct taggctaata    420
cttctatgaa gagatgcctt ggatagggta acagcggcgg atattggtga gttgttaaga    480
caaaaaccat tcaacgccgg aggactggct ctcatccagt ggatgcattg agtgaattga    540
ttgtcagggc tgtctctagg tttaatccca gacctctctg tgcttagggc aaacactatt    600
tggccttaaa tgggatcctg tgagaggggg tccctccatt gccagctgga ctgttctttg    660
gggccttatg tggtgtttgc ctctgaggta ctcaggggca tttaggtttt tcctcattct    720
taaataata atg aat atg gcc aaa caa gga att ttc cag act gtt ggg agt    771
          Met Asn Met Ala Lys Gln Gly Ile Phe Gln Thr Val Gly Ser
          1               5                   10
ggc ctt gac cac atc ctg tct ctg gca gac att gag gaa gag caa atg      819
Gly Leu Asp His Ile Leu Ser Leu Ala Asp Ile Glu Glu Glu Gln Met
15                  20                  25                  30
att cag tcc gtt gat agg act gca gtg act ggt gct tct tat ttc act      867
Ile Gln Ser Val Asp Arg Thr Ala Val Thr Gly Ala Ser Tyr Phe Thr
                35                  40                  45
tct gtg gac caa tct tca gtt cac act gct gag gtt ggc tca cat caa      915
Ser Val Asp Gln Ser Ser Val His Thr Ala Glu Val Gly Ser His Gln
            50                  55                  60
att gaa cct ttg aaa acc tct gtt gac aaa cct ggt tct aag aag act      963
Ile Glu Pro Leu Lys Thr Ser Val Asp Lys Pro Gly Ser Lys Lys Thr
        65                  70                  75
cag ggg gag aag ttt ttc ttg att cac tct gct gat tgg ctc act aca      1011
Gln Gly Glu Lys Phe Phe Leu Ile His Ser Ala Asp Trp Leu Thr Thr
    80                  85                  90
cat gct ctt ttt cat gaa gtt gca aaa ttg gat gtg gtg aaa ttg ctg      1059
His Ala Leu Phe His Glu Val Ala Lys Leu Asp Val Val Lys Leu Leu
95                  100                 105                 110
tat aat gag cag ttt gct gtc caa ggc ttg ttg aga tat cat aca tat      1107
Tyr Asn Glu Gln Phe Ala Val Gln Gly Leu Leu Arg Tyr His Thr Tyr
                115                 120                 125
gca aga ttt ggc att gag att caa gtt cag ata aac cct aca ccc ttt    1155
Ala Arg Phe Gly Ile Glu Ile Gln Val Gln Ile Asn Pro Thr Pro Phe
            130                 135                 140
cag caa ggg gga ttg att tgt gcc atg gtt cct ggt gac caa agt tat    1203
Gln Gln Gly Gly Leu Ile Cys Ala Met Val Pro Gly Asp Gln Ser Tyr
        145                 150                 155
ggt tca ata gca tcc ttg act gtt tat cct cat ggt ttg tta aat tgt    1251
Gly Ser Ile Ala Ser Leu Thr Val Tyr Pro His Gly Leu Leu Asn Cys
    160                 165                 170
aac atc aac aat gtt gtt aga ata aag gtt cca ttt att tat act aga    1299
Asn Ile Asn Asn Val Val Arg Ile Lys Val Pro Phe Ile Tyr Thr Arg
175                 180                 185                 190
ggt gct tat cat ttt aaa gat cca cag tac cca gtt tgg gaa tta aca    1347
Gly Ala Tyr His Phe Lys Asp Pro Gln Tyr Pro Val Trp Glu Leu Thr
                195                 200                 205
atc aga gtt tgg tca gag ttg aat att gga aca gga act tca gct tac    1395
Ile Arg Val Trp Ser Glu Leu Asn Ile Gly Thr Gly Thr Ser Ala Tyr
            210                 215                 220
act tca ctt aat gtt tta gct agg ttt aca gat ttg gag tta cat ggg    1443
Thr Ser Leu Asn Val Leu Ala Arg Phe Thr Asp Leu Glu Leu His Gly
        225                 230                 235
tta act cct ctt tct aca cag atg atg aga aat gaa ttc aga gtt agt    1491
Leu Thr Pro Leu Ser Thr Gln Met Met Arg Asn Glu Phe Arg Val Ser
    240                 245                 250
act act gaa aat gtt gta aat ttg tca aat tat gaa gat gca agg gca    1539
Thr Thr Glu Asn Val Val Asn Leu Ser Asn Tyr Glu Asp Ala Arg Ala
255                 260                 265                 270
aaa atg tct ttt gct ttg gat cag gaa gat tgg aag tct gac ccc tct    1587
Lys Met Ser Phe Ala Leu Asp Gln Glu Asp Trp Lys Ser Asp Pro Ser
                275                 280                 285
caa ggt ggt ggg att aga att act cat ttt act act tgg aca tcc att    1635
Gln Gly Gly Gly Ile Arg Ile Thr His Phe Thr Thr Trp Thr Ser Ile
            290                 295                 300
cca act tta gct gcc cag ttt ccg ttt aat gct tca gat tcg gtt ggg    1683
Pro Thr Leu Ala Ala Gln Phe Pro Phe Asn Ala Ser Asp Ser Val Gly
        305                 310                 315
caa caa att aaa gtt att cca gtg gac cca tat ttt ttc cag atg aca    1731
Gln Gln Ile Lys Val Ile Pro Val Asp Pro Tyr Phe Phe Gln Met Thr
    320                 325                 330
aac act aat cct gac caa aaa tgt ata act gct ctg gct tct att tgt    1779
Asn Thr Asn Pro Asp Gln Lys Cys Ile Thr Ala Leu Ala Ser Ile Cys
335                 340                 345                 350
cag atg ttt tgt ttt tgg agg ggt gat ctt gtt ttt gat ttt cag gtt    1827
Gln Met Phe Cys Phe Trp Arg Gly Asp Leu Val Phe Asp Phe Gln Val
                355                 360                 365
ttt cca acc aaa tat cat tca ggt aga tta ttg ttt tgt ttt gtt cct    1875
Phe Pro Thr Lys Tyr His Ser Gly Arg Leu Leu Phe Cys Phe Val Pro
            370                 375                 380
ggg aat gag tta ata gat gtt act gga att aca ttg aag cag gca act    1923
Gly Asn Glu Leu Ile Asp Val Thr Gly Ile Thr Leu Lys Gln Ala Thr
        385                 390                 395
act gct cct tgt gca gta atg gac att aca gga gtg caa tca acc ttg    1971
Thr Ala Pro Cys Ala Val Met Asp Ile Thr Gly Val Gln Ser Thr Leu
    400                 405                 410
aga ttt cgt gtt cct tgg att tct gat aca ccc tat cga gtg aat agg    2019
Arg Phe Arg Val Pro Trp Ile Ser Asp Thr Pro Tyr Arg Val Asn Arg
415                 420                 425                 430
tat acg aag tcg gca cat caa aaa ggt gag tac act gcc att gga aag    2067
Tyr Thr Lys Ser Ala His Gln Lys Gly Glu Tyr Thr Ala lle Gly Lys
                435                 440                 445
ctt att gtg tac tgt tac aat aga ctg act tct cct tct aat gtt gct    2115
Leu Ile Val Tyr Cys Tyr Asn Arg Leu Thr Ser Pro Ser Asn Val Ala
            450                 455                 460
tct cat gtt aga gtt aat gtt tat ctt tca gca att aat ctg gaa tgt    2163
Ser His Val Arg Val Asn Val Tyr Leu Ser Ala Ile Asn Leu Glu Cys
        465                 470                 475
ttt gct cct ctt tat cat gct atg gat gtt acc aca cag gtt gga gat    2211
Phe Ala Pro Leu Tyr His Ala Met Asp Val Thr Thr Gln Val Gly Asp
    480                 485                 490
gat tca gga ggt ttt tca aca aca gtt tct aca gag cag aat gtc cct    2259
Asp Ser Gly Gly Phe Ser Thr Thr Val Ser Thr Glu Gln Asn Val Pro
495                 500                 505                 510
gat ccc caa gtt ggc ata aca acc atg agg gat cta aaa ggg aaa gcc    2307
Asp Pro Gln Val Gly Ile Thr Thr Met Arg Asp Leu Lys Gly Lys Ala
                515                 520                 525
aac agg gga aag atg gat gtt tca gga gtg caa gca cct gtg gga gct    2355
Asn Arg Gly Lys Met Asp Val Ser Gly Val Gln Ala Pro Val Gly Ala
            530                 535                 540
att aca aca att gag gat cca gtt tta gca aag aaa gtg cct gag aca    2403
Ile Thr Thr Ile Glu Asp Pro Val Leu Ala Lys Lys Val Pro Glu Thr
        545                 550                 555
ttt cct gaa ttg aag cct gga gag tcc aga cat aca tca gat cat atg    2451
Phe Pro Glu Leu Lys Pro Gly Glu Ser Arg His Thr Ser Asp His Met
    560                 565                 570
tcc att tat aaa ttc atg gga agg tct cat ttt ctg tgt act ttt act    2499
Ser Ile Tyr Lys Phe Met Gly Arg Ser His Phe Leu Cys Thr Phe Thr
575                 580                 585                 590
ttc aat tca aat aat aaa gag tac aca ttt cca ata act ctg tct tcg    2547
Phe Asn Ser Asn Asn Lys Glu Tyr Thr Phe Pro Ile Thr Leu Ser Ser
                595                 600                 605
act tct aat cct cct cat ggt tta cca tca aca tta agg tgg ttt ttc    2595
Thr Ser Asn Pro Pro His Gly Leu Pro Ser Thr Leu Arg Trp Phe Phe
            610                 615                 620
aat ttg ttc cag ttg tat aga gga cca ctg gat ttg aca att att atc    2643
Asn Leu Phe Gln Leu Tyr Arg Gly Pro Leu Asp Leu Thr Ile Ile Ile
        625                 630                 635
aca gga gcc act gat gtg gat ggt atg gcc tgg ttc act cca gta ggc    2691
Thr Gly Ala Thr Asp Val Asp Gly Met Ala Trp Phe Thr Pro Val Gly
    640                 645                 650
ctt gct gtc gac acc cct tgg gtg gaa aag gag tca gct ttg tct att    2739
Leu Ala Val Asp Thr Pro Trp Val Glu Lys Glu Ser Ala Leu Ser Ile
655                 660                 665                 670
gat tac aaa act gct ctt gga gct gtt aga ttt aat aca aga aga aca    2787
Asp Tyr Lys Thr Ala Leu Gly Ala Val Arg Phe Asn Thr Arg Arg Thr
                675                 680                 685
gga aac att cag att aga ttg cca tgg tat tct tat ttg tat gcc gtg    2835
Gly Asn Ile Gln Ile Arg Leu Pro Trp Tyr Ser Tyr Leu Tyr Ala Val
            690                 695                 700
tct gga gca ctg gat ggc ttg gga gat aaa aca gat tct aca ttt gga    2883
Ser Gly Ala Leu Asp Gly Leu Gly Asp Lys Thr Asp Ser Thr Phe Gly
        705                 710                 715
ttg gtt tct att cag att gca aat tac aat cat tct gat gaa tat ttg    2931
Leu Val Ser Ile Gln Ile Ala Asn Tyr Asn His Ser Asp Glu Tyr Leu
    720                 725                 730
tcc ttt agt tgt tat ttg tct gtt aca gaa caa tca gag ttc tat ttt    2979
Ser Phe Ser Cys Tyr Leu Ser Val Thr Glu Gln Ser Glu Phe Tyr Phe
735                 740                 745                 750
cct aga gct cca tta aat tca aat gct atg ttg tcc act gag tcc atg    3027
Pro Arg Ala Pro Leu Asn Ser Asn Ala Met Leu Ser Thr Glu Ser Met
                755                 760                 765
atg agc aga att gca gct ggg gac ttg gag tca tcg gtg gat gat cct    3075
Met Ser Arg Ile Ala Ala Gly Asp Leu Glu Ser Ser Val Asp Asp Pro
            770                 775                 780
aga tca gag gag gac aga aga ttt gag agt cat ata gaa tgt agg aaa    3123
Arg Ser Glu Glu Asp Arg Arg Phe Glu Ser His Ile Glu Cys Arg Lys
        785                 790                 795
cca tac aaa gaa ttg aga ttg gag gtt ggc aaa caa aga ctc aag tat    317l
Pro Tyr Lys Glu Leu Arg Leu Glu Val Gly Lys Gln Arg Leu Lys Tyr
    800                 805                 810
gct cag gaa gaa ttg tca aat gaa gtg ctt cca cct cct agg aaa atg    3219
Ala Gln Glu Glu Leu Ser Asn Glu Val Leu Pro Pro Pro Arg Lys Met
815                 820                 825                 830
aaa ggg cta ttt tca caa gct aaa att tct ctt ttc tat act gag gag    3267
Lys Gly Leu Phe Ser Gln Ala Lys Ile Ser Leu Phe Tyr Thr Glu Glu
                835                 840                 845
cat gaa ata atg aaa ttt tct tgg aga gga gtg act gct gac act agg    3315
His Glu Ile Met Lys Phe Ser Trp Arg Gly Val Thr Ala Asp Thr Arg
            850                 855                 860
gct ttg aga aga ttt gga ttc tct atg gct gct ggt aga agt gtg tgg    3363
Ala Leu Arg Arg Phe Gly Phe Ser Met Ala Ala Gly Arg Ser Val Trp
        865                 870                 875
act ctt gag atg gat gct gga gtt ctt act gga aga ttg gtc aga ttg    3411
Thr Leu Glu Met Asp Ala Gly Val Leu Thr Gly Arg Leu Val Arg Leu
    880                 885                 890
aat gat gag aaa tgg aca gaa atg aaa gat gat aaa att gtt tca tta    3459
Asn Asp Glu Lys Trp Thr Glu Met Lys Asp Asp Lys Ile Val Ser Leu
895                 900                 905                 910
gtt gaa aaa ttc aca agc aac aaa tac tgg tct aaa gtg aat ttt cca    3507
Val Glu Lys Phe Thr Ser Asn Lys Tyr Trp Ser Lys Val Asn Phe Pro
                915                 920                 925
cat gga atg tta gat ctt gaa gaa att gct gcc aae tct aaa gat ttt    3555
His Gly Met Leu Asp Leu Glu Glu Lle Ala Ala Asn Ser Lys Asp Phe
            930                 935                 940
cca aat atg tct gag aca gat ttg tgt ttc ctg ttg cat tgg ttg aat    3603
Pro Asn Met Ser Glu Thr Asp Leu Cys Phe Leu Leu His Trp Leu Asn
        945                 950                 955
cca aag aaa atc aat tta gca aat aga atg ctt gga ttg tct gga gtg    3651
Pro Lys Lys Ile Asn Leu Ala Asn Arg Met Leu Gly Leu Ser Gly Val
    960                 965                 970
cag gaa att aaa gaa cag ggt gtt gga ttg ata gca gag tgc aga act    3699
Gln Glu Ile Lys Glu Gln Gly Val Gly Leu Ile Ala Glu Cys Arg Thr
975                 980                 985                 990
ttc ttg gat tct att gct ggg act ctg aaa tcc atg atg ttt gga ttt    3747
Phe Leu Asp Ser Ile Ala Gly Thr Leu Lys Ser Met Met Phe Gly Phe
                995                 1000                1005
cat cat tct gtg act gtt gaa att ata aat act gta ctt tgt ttt        3792
His His Ser Val Thr Val Glu Ile Ile Asn Thr Val Leu Cys Phe
            1010                1015                1020
gtt aag agt gga att ctg ctc tat gtc ata caa caa ttg aac caa        3837
Val Lys Ser Gly Ile Leu Leu Tyr Val Ile Gln Gln Leu Asn Gln
            1025                1030                1035
gat gag cac tcc cac ata att ggt ttg ttg aga gtt atg aat tat        3882
Asp Glu His Ser His Ile Ile Gly Leu Leu Arg Val Met Asn Tyr
            1040                1045                1050
gca gac att ggc tgc tca gtt att tca tgt ggc aaa gtt ttt tct    3927
Ala Asp Ile Gly Cys Ser Val Ile Ser Cys Gly Lys Val Phe Ser
            1055                1060                1065
aaa atg tta gaa aca gtt ttt aat tgg caa atg gac tcc aga atg    3972
Lys Met Leu Glu Thr Val Phe Asn Trp Gln Met Asp Ser Arg Met
            1070                1075                1080
atg gag ctg aga act cag agc ttt tcc aac tgg tta aga gac att    4017
Met Glu Leu Arg Thr Gln Ser Phe Ser Asn Trp Leu Arg Asp Ile
            1085                1090                1095
tgt tca gga att act att ttt aaa agt ctt aag gat gcc ata tat    4062
Cys Ser Gly Ile Thr Ile Phe Lys Ser Leu Lys Asp Ala Ile Tyr
            1100                1105                1110
tgg cta tat aca aaa ttg aag gat ttt tat gaa gta aac tat ggc    4107
Trp Leu Tyr Thr Lys Leu Lys Asp Phe Tyr Glu Val Asn Tyr Gly
            1115                1120                1125
aag aag aag gat gtt ctt aat att ctt aaa gac aac cag caa aaa    4152
Lys Lys Lys Asp Val Leu Asn Ile Leu Lys Asp Asn Gln Gln Lys
            1130                1135                1140
att gaa aaa gcc att gaa gaa gca gac aat ttt tgc att ttg caa    4197
Ile Glu Lys Ala Ile Glu Glu Ala Asp Asn Phe Cys Ile Leu Gln
            1145                1150                1155
att caa gat gta gag aga ttt gat cag tat cag aaa ggg gtt gat    4242
Ile Gln Asp Val Glu Arg Phe Asp Gln Tyr Gln Lys Gly Val Asp
            1160                1165                1170
tta ata caa aaa ctg agg act gtt cat tca atg gct caa gtt gac    4287
Leu Ile Gln Lys Leu Arg Thr Val His Ser Met Ala Gln Val Asp
            1175                1180                1185
cct aac ctt ggg gtt cat ttg tca cct ctt aga gat tgc ata gcc    4332
Pro Asn Leu Gly Val His Leu Ser Pro Leu Arg Asp Cys Ile Ala
            1190                1195                1200
aga gtc cac caa aag ctc aag aat ctt gga tct ata aat cag gcc    4377
Arg Val His Gln Lys Leu Lys Asn Leu Gly Ser Ile Asn Gln Ala
            1205                1210                1215
atg gtg aca agg tgt gag cca gtt gtt tgc tat tta tat ggc aaa    4422
Met Val Thr Arg Cys Glu Pro Val Val Cys Tyr Leu Tyr Gly Lys
            1220                1225                1230
aga gga gga ggg aaa agt ttg act tta att gca ttg gca acc aaa    4467
Arg Gly Gly Gly Lys Ser Leu Thr Leu Ile Ala Leu Ala Thr Lys
            1235                1240                1245
att tgt aaa cac tat ggt gtt gaa cct gag aaa aat att tac act    4512
Ile Cys Lys His Tyr Gly Val Glu Pro Glu Lys Asn Ile Tyr Thr
            1250                1255                1260
aaa cct gtg gcc tca gac tat tgg gat ggt tac agt gga caa ttg    4557
Lys Pro Val Ala Ser Asp Tyr Trp Asp Gly Tyr Ser Gly Gln Leu
            1265                1270                1275
gtt tgc att att gat gat att ggc caa aat aca aca gat gaa gat    4602
Val Cys Ile Ile Asp Asp Ile Gly Gln Asn Thr Thr Asp Glu Asp
            1280                1285                1290
tgg tca gat ttt tgt caa tta gtg tca gga tgt cca atg aga ttg    4647
Trp Ser Asp Phe Cys Gln Leu Val Ser Gly Cys Pro Met Arg Leu
            1295                1300                1305
aac atg gct tct ctt gag gag aag ggc aga cat ttt tcc tct cct    4692
Asn Met Ala Ser Leu Glu Glu Lys Gly Arg His Phe Ser Ser Pro
            1310                1315                1320
ttt ata ata gca act tca aat tgg tca aat cca agt cca aaa aca    4737
Phe Ile Ile Ala Thr Ser Asn Trp Ser Asn Pro Ser Pro Lys Thr
            1325                1330                1335
gtt tat gtt aag gaa gca att gat cgt agg ctt cat ttc aag gtt    4782
Val Tyr Val Lys Glu Ala Ile Asp Arg Arg Leu His Phe Lys Va1
            1340                1345                1350
gag gtt aaa cct gct tca ttt ttt aaa aat cct cat aat gat atg    4827
Glu VaI Lys Pro Ala Ser Phe Phe Lys Asn Pro His Asn Asp Met
            1355                1360                1365
tta aat gtt aat ttg gct aaa aca aat gat gca ata aag gat atg    4872
Leu Asn Val Asn Leu Ala Lys Thr Asn Asp Ala Ile Lys Asp Met
            1370                1375                1380
tct tgt gtt gat cta gta atg gat gga cat aat atc tca ttg atg    4917
Ser Cys Val Asp Leu Val Met Asp Gly His Asn Ile Ser Leu Met
            1385                1390                1395
gat tta ctt agt tct tta gta atg aca gtt gaa att agg aag caa    4962
Asp Leu Leu Ser Ser Leu Val Met Thr Val Glu Ile Arg Lys Gln
            1400                1405                1410
aat atg agt gaa ttc atg gag ttg tgg tcc cag gga atc tca gat    5007
Asn Met Ser Glu Phe Met Glu Leu Trp Ser Gln Gly Ile Ser Asp
            1415                1420                1425
gat gac aat gat agt gca gta gct gag ttt ttc caa tct ttt cca    5052
Asp Asp Asn Asp Ser Ala Val Ala Glu Phe Phe Gln Ser Phe Pro
            1430                1435                1440
tct ggt gaa cca tca aat tcc aaa tta tct agt ttt ttc caa tct    5097
Ser Gly Glu Pro Ser Asn Ser Lys Leu Ser Ser Phe Phe Gln Ser
            1445                1450                1455
gtc act aat cac aag tgg gtt gct gtg gga gct gca gtt ggc att    5142
Val Thr Asn His Lys Trp Val Ala Val Gly Ala Ala Val Gly Ile
            1460                1465                1470
ctt gga gtg ctt gtg gga gga tgg ttt gtg tac aag cat ttc tcc    5187
Leu Gly Val Leu Val Gly Gly Trp Phe Val Tyr Lys His Phe Ser
            1475                1480                1485
cgc aaa gag gaa gaa cca att cca gct gaa ggg gtt tat cat ggt    5232
Arg Lys Glu Glu Glu Pro Ile Pro Ala Glu Gly Val Tyr His Gly
            1490                1495                1500
gtg act aag ccc aaa cag gtg att aaa ttg gat gca gat cca gta    5277
Val Thr Lys Pro Lys Gln Val Ile Lys Leu Asp Ala Asp Pro Val
            1505                1510                1515
gag tct cag tca act tta gaa ata gca gga tta gtt agg aaa aat    5322
Glu Ser Gln Ser Thr Leu Glu Ile Ala Gly Leu Val Arg Lys Asn
            1520                1525                1530
ttg gtt cag ttt gga gtt ggg gag aaa aat gga tgt gtg aga tgg    5367
Leu Val Gln Phe Gly Val Gly Glu Lys Asn Gly Cys Val Arg Trp
            1535                1540                1545
gtt atg aat gcc tta gga gtg aag gat gat tgg tta tta gta cct    5412
Val Met Asn Ala Leu Gly Val Lys Asp Asp Trp Leu Leu Val Pro
            1550                1555                1560
tct cat gct tat aaa ttt gaa aag gat tat gaa atg atg gag ttc    5457
Ser His Ala Tyr Lys Phe Glu Lys Asp Tyr Glu Met Met Glu Phe
            1565                1570                1575
tat ttc aat aga ggt gga act tac tat tca att tca gct ggc aat    5502
Tyr Phe Asn Arg Gly Gly Thr Tyr Tyr Ser Ile Ser Ala Gly Asn
            1580                1585                1590
ggt ggt att caa tct tta gat gtg ggg ttt caa gat gtt gtt cta    5547
Gly Gly Ile Gln Ser Leu Asp Val Gly Phe Gln Asp Val Val Leu
            1595                1600                1605
atg aag gtt cct aca att ccc aag ttt aga gat att act caa cat    5592
Met Lys Val Pro Thr Ile Pro Lys Phe Arg Asp Ile Thr Gln His
            1610                1615                1620
ttt att aag aaa gga gat gta cct aga gcc ttg aat cgc ttg gca    5637
Phe Ile Lys Lys Gly Asp Val Pro Arg Ala Leu Asn Arg Leu Ala
            1625                1630                1635
aca tta gtg aca act gtt aat gga act cct atg tta att tct gag    5682
Thr Leu Val Thr Thr Val Asn Gly Thr Pro Met Leu Ile Ser Glu
            1640                1645                1650
gga cca tta aag atg gag gag aag gcc acc tat gtt cat aag aag    5727
Gly Pro Leu Lys Met Glu Glu Lys Ala Thr Tyr Val His Lys Lys
            1655                1660                1665
aat gat ggt acc aca gtt gat tta act gtt gat cag gca tgg aga    5772
Asn Asp Gly Thr Thr Val Asp Leu Thr Val Asp Gln Ala Trp Arg
            1670                1675                1680
gga aaa ggt gaa ggt ctt cct gga atg tgt ggt ggg gcc ttg gtg    5817
Gly Lys Gly Glu Gly Leu Pro Gly Met Cys Gly Gly Ala Leu Val
            1685                1690                1695
tca tca aat cag tcc ata cag aat gca att ttg ggt att cat gtt    5862
Ser Ser Asn Gln Ser Ile Gln Asn Ala Ile Leu Gly Ile His Val
            1700                1705                1710
gct gga gga aat tca att ctt gtg gca aag ttg gtt act caa gaa    5907
Ala Gly Gly Asn Ser Ile Leu Val Ala Lys Leu Val Thr Gln Glu
            1715                1720                1725
atg ttt caa aac att gat aag aaa att gaa agt cag aga ata atg    5952
Met Phe Gln Asn Ile Asp Lys Lys Ile Glu Ser Gln Arg Ile Met
            1730                1735                1740
aaa gtg gaa ttt act cag tgt tca atg aat gta gtc tcc aaa acg    5997
Lys Val Glu Phe Thr Gln Cys Ser Met Asn Val Val Ser Lys Thr
            1745                1750                1755
ctt ttt aaa aag agc ccc att cat cat cac att gat aaa acc atg    6042
Leu Phe Lys Lys Ser Pro Ile His His His Ile Asp Lys Thr Met
            1760                1765                1770
att aat ttt cct gca gct atg cct ttt tct aaa gct gaa att gat    6087
Ile Asn Phe Pro Ala Ala Met Pro Phe Ser Lys Ala Glu Ile Asp
            1775                1780                1785
cca atg gct gtg atg ttg tct aaa tat tca tta cct att gtg gaa    6132
Pro Met Ala Val Met Leu Ser Lys Tyr Ser Leu Pro Ile Val Glu
            1790                1795                1800
gaa cca gag gat tac aaa gaa gct tca gtt ttt tat caa aat aaa    6177
Glu Pro Glu Asp Tyr Lys Glu Ala Ser Val Phe Tyr Gln Asn Lys
            1805                1810                1815
ata gta ggc aag act cag tta gtt gat gac ttt cta gat ctt gat    6222
Ile Val Gly Lys Thr Gln Leu Val Asp Asp Phe Leu Asp Leu Asp
            1820                1825                1830
atg gct att aca ggg gct cca ggc att gat gct att aat atg gat    6267
Met Ala Ile Thr Gly Ala Pro Gly Ile Asp Ala Ile Asn Met Asp
            1835                1840                1845
tca tct tct ggg ttt cct tat gtt caa gaa aaa ttg acc aaa aga    6312
Ser Ser Ser Gly Phe Pro Tyr Val Gln Glu Lys Leu Thr Lys Arg
            1850                1855                1860
gat tta att tgg ttg gat gaa aat ggt ttg ctg cta gga gtt cat    6357
Asp Leu Ile Trp Leu Asp Glu Asn Gly Leu Leu Leu Gly Val His
            1865                1870                1875
cca aga ttg gcc cag aga att tta ttt aat act gtt atg atg gaa    6402
Pro Arg Leu Ala Gln Arg Ile Leu Phe Asn Thr Val Met Met Glu
            1880                1885                1890
aat tgt tct gac cta gat gtt gtt ttc aca act tgt cca aaa gat    6447
Asn Cys Ser Asp Leu Asp Val Val Phe Thr Thr Cys Pro Lys Asp
            1895                1900                1905
gaa ttg aga cca ttg gag aaa gtt ttg gaa tca aaa aca aga gca    6492
Glu Leu Arg Pro Leu Glu Lys Val Leu Glu Ser Lys Thr Arg Ala
            1910                1915                1920
att gat gct tgt cct ttg gat tat aca att cta tgc cga atg tac    6537
Ile Asp Ala Cys Pro Leu Asp Tyr Thr Ile Leu Cys Arg Met Tyr
            1925                1930                1935
tgg ggt cca gct att agt tat ttt cat ctg aat cca ggg ttt cat    6582
Trp Gly Pro Ala Ile Ser Tyr Phe His Leu Asn Pro Gly Phe His
            1940                1945                1950
aca ggt gtt gct att ggc ata gat cct gat aga cag tgg gat gaa    6627
Thr Gly Val Ala Ile Gly Ile Asp Pro Asp Arg Gln Trp Asp Glu
            1955                1960                1965
tta ttt aaa aca atg ata aga ttt gga gat gtt ggt ctt gat ttg    6672
Leu Phe Lys Thr Met Ile Arg Phe Gly Asp Val Gly Leu Asp Leu
            1970                1975                1980
gat ttt tcc gct ttt gat gct agt ctt agt cca ttc atg att agg    6717
Asp Phe Ser Ala Phe Asp Ala Ser Leu Ser Pro Phe Met Ile Arg
            1985                1990                1995
gag gcg ggt aga att atg agt gaa tta tct gga aca cca tct cat    6762
Glu Ala Gly Arg Ile Met Ser Glu Leu Ser Gly Thr Pro Ser His
            2000                2005                2010
ttt gga aca gct ctt atc aat act atc att tat tct aaa cat ttg    6807
Phe Gly Thr Ala Leu Ile Asn Thr Ile Ile Tyr Ser Lys His Leu
            2015                2020                2025
ctg tat aat tgt tgt tat cat gtt tgt ggt tca atg cct tct ggg    6852
Leu Tyr Asn Cys Cys Tyr His Val Cys Gly Ser Met Pro Ser Gly
            2030                2035                2040
tct cct tgt aca gct ttg ttg aat tca att att aac aac att aat    6897
Ser Pro Cys Thr Ala Leu Leu Asn Ser Ile Ile Asn Asn Ile Asn
            2045                2050                2055
ttg tat tat gtg ttt tcc aaa ata ttt gga aag tct cca gtc ttc    6942
Leu Tyr Tyr Val Phe Ser Lys Ile Phe Gly Lys Ser Pro Val Phe
            2060                2065                2070
ttt tgt cag gct ttg agg atc ctt tgt tat gga gag gat gtt ttg    6987
Phe Cys Gln Ala Leu Arg Ile Leu Cys Tyr Gly Glu Asp Val Leu
            2075                2080                2085
ata gtt ttt tcc agg gat gtt caa att gat aat ctt gat ttg att    7032
Ile Val Phe Ser Arg Asp Val Gln Ile Asp Asn Leu Asp Leu Ile
            2090                2095                2100
gga cag aaa att gtg gat gag ttt aaa aaa ctt ggt atg aca gct    7077
Gly Gln Lys Ile Val Asp Glu Phe Lys Lys Leu Gly Met Thr Ala
            2105                2110                2115
act tca gct gat aaa aat gtg cct caa ctg aag cca gtt tca gaa    7122
Thr Ser Ala Asp Lys Asn Val Pro Gln Leu Lys Pro Val Ser Glu
            2120                2125                2130
ttg act ttt ctc aaa aga tct ttt aat ttg gtg gag gat aga att    7167
Leu Thr Phe Leu Lys Arg Ser Phe Asn Leu Val Glu Asp Arg Ile
            2135                2140                2145
agg cct gca att tca gaa aag aca att tgg tct ttg ata act tgg    7212
Arg Pro Ala Ile Ser Glu Lys Thr Ile Trp Ser Leu Ile Thr Trp
            2150                2155                2160
cag aga agt aac gct gag ttt gag cag aac tta gaa aat gct cag    7257
Gln Arg Ser Asn Ala Glu Phe Glu Gln Asn Leu Glu Asn Ala Gln
            2165                2170                2175
tgg ttt gcc ttt atg cat ggc tat gag ttt tat cag aaa ttt tat    7302
Trp Phe Ala Phe Met His Gly Tyr Glu Phe Tyr Gln Lys Phe Tyr
            2180                2185                2190
tat ttt ggt cag tcc tgt ttg gag aaa gag atg ata gaa tat agg    7347
Tyr Phe Gly Gln Ser Cys Leu Glu Lys Glu Met Ile Glu Tyr Arg
            2195                2200                2205
ctt aaa tct tat gat tgg tgg aga atg aga ttt tat gac cag tgt    7392
Leu Lys Ser Tyr Asp Trp Trp Arg Met Arg Phe Tyr Asp Gln Cys
            2210                2215                2220
ttc att tgt gac ctt tca tga tttgtttaaa caaattttct taaaatttct    7443
Phe Ile Cys Asp Leu Ser
            2225
gaggtttggt tatttctttt atcagtaaat                                7473
<210>2
<211>2227
<212>PRT
<213>Hepatitis A virus
<400>2
Met Asn Met Ala Lys Gln Gly Ile Phe Gln Thr Val Gly Ser Gly Leu
1               5                   10                  15
Asp His Ile Leu Ser Leu Ala Asp Ile Glu Glu Glu Gln Met Ile Gln
            20                  25                  30
Ser Val Asp Arg Thr Ala Val Thr Gly Ala Ser Tyr Phe Thr Ser Val
        35                  40                  45
Asp Gln Ser Ser Val His Thr Ala Glu Val Gly Ser His Gln Ile Glu
    50                  55                  60
Pro Leu Lys Thr Ser Val Asp Lys Pro Gly Ser Lys Lys Thr Gln Gly
65                  70                  75                  80
Glu Lys Phe Phe Leu Ile His Ser Ala Asp Trp Leu Thr Thr His Ala
                85                  90                  95
Leu Phe His Glu Val Ala Lys Leu Asp Val Val Lys Leu Leu Tyr Asn
            100                 105                 110
Glu Gln Phe Ala Val Gln Gly Leu Leu Arg Tyr His Thr Tyr Ala Arg
        115                 120                 125
Phe Gly Ile Glu Ile Gln Val Gln Ile Asn Pro Thr Pro Phe Gln Gln
    130                 135                 140
Gly Gly Leu Ile Cys Ala Met Val Pro Gly Asp Gln Ser Tyr Gly Ser
145                 150                 155                 160
Ile Ala Ser Leu Thr Val Tyr Pro His Gly Leu Leu Asn Cys Asn Ile
                165                 170                 175
Asn Asn Val Val Arg Ile Lys Val Pro Phe Ile Tyr Thr Arg Gly Ala
            180                 185                 190
Tyr His Phe Lys Asp Pro Gln Tyr Pro Val Trp Glu Leu Thr Ile Arg
        195                 200                 205
Val Trp Ser Glu Leu Asn Ile Gly Thr Gly Thr Ser Ala Tyr Thr Ser
    210                 215                 220
Leu Asn Val Leu Ala Arg Phe Thr Asp Leu Glu Leu His Gly Leu Thr
225                 230                 235                 240
Pro Leu Ser Thr Gln Met Met Arg Asn Glu Phe Arg Val Ser Thr Thr
                245                 250                 255
Glu Asn Val Val Asn Leu Ser Asn Tyr Glu Asp Ala Arg Ala Lys Met
            260                 265                 270
Ser Phe Ala Leu Asp Gln Glu Asp Trp Lys Ser Asp Pro Ser Gln Gly
        275                 280                 285
Gly Gly Ile Arg Ile Thr His Phe Thr Thr Trp Thr Ser Ile Pro Thr
    290                 295                 300
Leu Ala Ala Gln Phe Pro Phe Asn Ala Ser Asp Ser Val Gly Gln Gln
305                 310                 315                 320
Ile Lys Val Ile Pro Val Asp Pro Tyr Phe Phe Gln Met Thr Asn Thr
                325                 330                 335
Asn Pro Asp Gln Lys Cys Ile Thr Ala Leu Ala Ser Ile Cys Gln Met
            340                 345                 350
Phe Cys Phe Trp Arg Gly Asp Leu Val Phe Asp Phe Gln Val Phe Pro
        355                 360                 365
Thr Lys Tyr His Ser Gly Arg Leu Leu Phe Cys Phe Val Pro Gly Asn
    370                 375                 380
Glu Leu Ile Asp Val Thr Gly Ile Thr Leu Lys Gln Ala Thr Thr Ala
385                 390                 395                 400
Pro Cys Ala Val Met Asp Ile Thr Gly Val Gln Ser Thr Leu Arg Phe
                405                 410                 415
Arg Val Pro Trp Ile Ser Asp Thr Pro Tyr Arg Val Asn Arg Tyr Thr
            420                 425                 430
Lys Ser Ala His Gln Lys Gly Glu Tyr Thr Ala Ile Gly Lys Leu Ile
        435                 440                 445
Val Tyr Cys Tyr Asn Arg Leu Thr Ser Pro Ser Asn Val Ala Ser His
    450                 455                 460
Val Arg Val Asn Val Tyr Leu Ser Ala Ile Asn Leu Glu Cys Phe Ala
465                 470                 475                 480
Pro Leu Tyr His Ala Met Asp Val Thr Thr Gln Val Gly Asp Asp Ser
                485                 490                 495
Gly Gly Phe Ser Thr Thr Val Ser Thr Glu Gln Asn Val Pro Asp Pro
            500                 505                 510
Gln Val Gly Ile Thr Thr Met Arg Asp Leu Lys Gly Lys Ala Asn Arg
        515                 520                 525
Gly Lys Met Asp Val Ser Gly Val Gln Ala Pro Val Gly Ala Ile Thr
    530                 535                 540
Thr Ile Glu Asp Pro Val Leu Ala Lys Lys Val Pro Glu Thr Phe Pro
545                 550                 555                 560
Glu Leu Lys Pro Gly Glu Ser Arg His Thr Ser Asp His Met Ser Ile
                565                 570                 575
Tyr Lys Phe Met Gly Arg Ser His Phe Leu Cys Thr Phe Thr Phe Asn
            580                 585                 590
Ser Asn Asn Lys Glu Tyr Thr Phe Pro Ile Thr Leu Ser Ser Thr Ser
        595                 600                 605
Asn Pro Pro His Gly Leu Pro Ser Thr Leu Arg Trp Phe Phe Asn Leu
    610                 615                 620
Phe Gln Leu Tyr Arg Gly Pro Leu Asp Leu Thr Ile Ile Ile Thr Gly
625                 630                 635                 640
Ala Thr Asp Val Asp Gly Met Ala Trp Phe Thr Pro Val Gly Leu Ala
                645                 650                 655
Val Asp Thr Pro Trp Val Glu Lys Glu Ser Ala Leu Ser Ile Asp Tyr
            660                 665                 670
Lys Thr Ala Leu Gly Ala Val Arg Phe Asn Thr Arg Arg Thr Gly Asn
        675                 680                 685
Ile Gln Ile Arg Leu Pro Trp Tyr Ser Tyr Leu Tyr Ala Val Ser Gly
    690                 695                 700
Ala Leu Asp Gly Leu Gly Asp Lys Thr Asp Ser Thr Phe Gly Leu Val
705                 710                 715                 720
Ser Ile Gln Ile Ala Asn Tyr Asn His Ser Asp Glu Tyr Leu Ser Phe
                725                 730                 735
Ser Cys Tyr Leu Ser Val Thr Glu Gln Ser Glu Phe Tyr Phe Pro Arg
            740                 745                 750
Ala Pro Leu Asn Ser Asn Ala Met Leu Ser Thr Glu Ser Met Met Ser
        755                 760                 765
Arg Ile Ala Ala Gly Asp Leu Glu Ser Ser Val Asp Asp Pro Arg Ser
    770                 775                 780
Glu Glu Asp Arg Arg Phe Glu Ser His Ile Glu Cys Arg Lys Pro Tyr
785                 790                 795                 800
Lys Glu Leu Arg Leu Glu Val Gly Lys Gln Arg Leu Lys Tyr Ala Gln
                805                 810                 815
Glu Glu Leu Ser Asn Glu Val Leu Pro Pro Pro Arg Lys Met Lys Gly
            820                 825                 830
Leu Phe Ser Gln Ala Lys Ile Ser Leu Phe Tyr Thr Glu Glu His Glu
        835                 840                 845
Ile Met Lys Phe Ser Trp Arg Gly Val Thr Ala Asp Thr Arg Ala Leu
    850                 855                 860
Arg Arg Phe Gly Phe Ser Met Ala Ala Gly Arg Ser Val Trp Thr Leu
865                 870                 875                 880
Glu Met Asp Ala Gly Val Leu Thr Gly Arg Leu Val Arg Leu Asn Asp
                885                 890                 895
Glu Lys Trp Thr Glu Met Lys Asp Asp Lys Ile Val Ser Leu Val Glu
            900                 905                 910
Lys Phe Thr Ser Asn Lys Tyr Trp Ser Lys Val Asn Phe Pro His Gly
        915                 920                 925
Met Leu Asp Leu Glu Glu Ile Ala Ala Asn Ser Lys Asp Phe Pro Asn
    930                 935                 940
Met Ser Glu Thr Asp Leu Cys Phe Leu Leu His Trp Leu Asn Pro Lys
945                 950                 955                 960
Lys Ile Asn Leu Ala Asn Arg Met Leu Gly Leu Ser Gly Val Gln Glu
                965                 970                 975
Ile Lys Glu Gln Gly Val Gly Leu Ile Ala Glu Cys Arg Thr Phe Leu
            980                 985                 990
Asp Ser Ile Ala Gly Thr Leu Lys Ser Met Met Phe Gly Phe His His
        995                 1000                1005
Ser Val Thr Val Glu Ile Ile Asn Thr Val Leu Cys Phe Val Lys
    1010                1015                1020
Ser Gly Ile Leu Leu Tyr Val Ile Gln Gln Leu Asn Gln Asp Glu
    1025                1030                1035
His Ser His Ile Ile Gly Leu Leu Arg Val Met Asn Tyr Ala Asp
    1040                1045                1050
Ile Gly Cys Ser Val Ile Ser Cys Gly Lys Val Phe Ser Lys Met
    1055                1060                1065
Leu Glu Thr Val Phe Asn Trp Gln Met Asp Ser Arg Met Met Glu
    1070                1075                1080
Leu Arg Thr Gln Ser Phe Ser Asn Trp Leu Arg Asp Ile Cys Ser
    1085                1090                1095
Gly Ile Thr Ile Phe Lys Ser Leu Lys Asp Ala Ile Tyr Trp Leu
    1100                1105                1110
Tyr Thr Lys Leu Lys Asp Phe Tyr Glu Val Asn Tyr Gly Lys Lys
    1115                1120                1125
Lys Asp Val Leu Asn Ile Leu Lys Asp Asn Gln Gln Lys Ile Glu
    1130                1135                1140
Lys Ala Ile Glu Glu Ala Asp Asn Phe Cys Ile Leu Gln Ile Gln
    1145                1150                1155
Asp Val Glu Arg Phe Asp Gln Tyr Gln Lys Gly Val Asp Leu Ile
    1160                1165                1170
Gln Lys Leu Arg Thr Val His Ser Met Ala Gln Val Asp Pro Asn
    1175                1180                1185
Leu Gly Val His Leu Ser Pro Leu Arg Asp Cys Ile Ala Arg Val
    1190                1195                1200
His Gln Lys Leu Lys Asn Leu Gly Ser Ile Asn Gln Ala Met Val
    1205                1210                1215
Thr Arg Cys Glu Pro Val Val Cys Tyr Leu Tyr Gly Lys Arg Gly
    1220                1225                1230
Gly Gly Lys Ser Leu Thr Leu Ile Ala Leu Ala Thr Lys Ile Cys
    1235                1240                1245
Lys His Tyr Gly Val Glu Pro Glu Lys Asn Ile Tyr Thr Lys Pro
    1250                1255                1260
Val Ala Ser Asp Tyr Trp Asp Gly Tyr Ser Gly Gln Leu Val Cys
    1265                1270                1275
Ile Ile Asp Asp Ile Gly Gln Asn Thr Thr Asp Glu Asp Trp Ser
    1280                1285                1290
Asp Phe Cys Gln Leu Val Ser Gly Cys Pro Met Arg Leu Asn Met
    1295                1300                1305
Ala Ser Leu Glu Glu Lys Gly Arg His Phe Ser Ser Pro Phe Ile
    1310                1315                1320
Ile Ala Thr Ser Asn Trp Ser Asn Pro Ser Pro Lys Thr Val Tyr
    1325                1330                1335
Val Lys Glu Ala Ile Asp Arg Arg Leu His Phe Lys Val Glu Val
    1340                1345                1350
Lys Pro Ala Ser Phe Phe Lys Asn Pro His Asn Asp Met Leu Asn
    1355                1360                1365
Val Asn Leu Ala Lys Thr Asn Asp Ala Ile Lys Asp Met Ser Cys
    1370                1375                1380
Val Asp Leu Val Met Asp Gly His Asn Ile Ser Leu Met Asp Leu
    1385                1390                1395
Leu Ser Ser Leu Val Met Thr Val Glu Ile Arg Lys Gln Asn Met
    1400                1405                1410
Ser Glu Phe Met Glu Leu Trp Ser Gln Gly Ile Ser Asp Asp Asp
    1415                1420                1425
Asn Asp Ser Ala Val Ala Glu Phe Phe Gln Ser Phe Pro Ser Gly
    1430                1435                1440
Glu Pro Ser Asn Ser Lys Leu Ser Ser Phe Phe Gln Ser Val Thr
    1445                1450                1455
Asn His Lys Trp Val Ala Val Gly Ala Ala Val Gly Ile Leu Gly
    1460                1465                1470
Val Leu Val Gly Gly Trp Phe Val Tyr Lys His Phe Ser Arg Lys
    1475                1480                1485
Glu Glu Glu Pro Ile Pro Ala Glu Gly Val Tyr His Gly Val Thr
    1490                1495                1500
Lys Pro Lys Gln Val Ile Lys Leu Asp Ala Asp Pro Val Glu Ser
    1505                1510                1515
Gln Ser Thr Leu Glu Ile Ala Gly Leu Val Arg Lys Asn Leu Val
    1520                1525                1530
Gln Phe Gly Val Gly Glu Lys Asn Gly Cys Val Arg Trp Val Met
    1535                1540                1545
Asn Ala Leu Gly Val Lys Asp Asp Trp Leu Leu Val Pro Ser His
    1550                1555                1560
Ala Tyr Lys Phe Glu Lys Asp Tyr Glu Met Met Glu Phe Tyr Phe
    1565                1570                1575
Asn Arg Gly Gly Thr Tyr Tyr Ser Ile Ser Ala Gly Asn Gly Gly
    1580                1585                1590
Ile Gln Ser Leu Asp Val Gly Phe Gln Asp Val Val Leu Met Lys
    1595                1600                1605
Val Pro Thr Ile Pro Lys Phe Arg Asp Ile Thr Gln His Phe Ile
    1610                1615                1620
Lys Lys Gly Asp Val Pro Arg Ala Leu Asn Arg Leu Ala Thr Leu
    1625                1630                1635
Val Thr Thr Val Asn Gly Thr Pro Met Leu Ile Ser Glu Gly Pro
    1640                1645                1650
Leu Lys Met Glu Glu Lys Ala Thr Tyr Val His Lys Lys Asn Asp
    1655                1660                1665
Gly Thr Thr Val Asp Leu Thr Val Asp Gln Ala Trp Arg Gly Lys
    1670                1675                1680
Gly Glu Gly Leu Pro Gly Met Cys Gly Gly Ala Leu Val Ser Ser
    1685                1690                1695
Asn Gln Ser Ile Gln Asn Ala Ile Leu Gly Ile His Val Ala Gly
    1700                1705                1710
Gly Asn Ser Ile Leu Val Ala Lys Leu Val Thr Gln Glu Met Phe
    1715                1720                1725
Gln Asn Ile Asp Lys Lys Ile Glu Ser Gln Arg Ile Met Lys Val
    1730                1735                1740
Glu Phe Thr Gln Cys Ser Met Asn Val Val Ser Lys Thr Leu Phe
    1745                1750                1755
Lys Lys Ser Pro Ile His His His Ile Asp Lys Thr Met Ile Asn
    1760                1765                1770
Phe Pro Ala Ala Met Pro Phe Ser Lys Ala Glu Ile Asp Pro Met
    1775                1780                1785
Ala Val Met Leu Ser Lys Tyr Ser Leu Pro Ile Val Glu Glu Pro
    1790                1795                1800
Glu Asp Tyr Lys Glu Ala Ser Val Phe Tyr Gln Asn Lys Ile Val
    1805                1810                1815
Gly Lys Thr Gln Leu Val Asp Asp Phe Leu Asp Leu Asp Met Ala
    1820                1825                1830
Ile Thr Gly Ala Pro Gly Ile Asp Ala Ile Asn Met Asp Ser Ser
    1835                1840                1845
Ser Gly Phe Pro Tyr Val Gln Glu Lys Leu Thr Lys Arg Asp Leu
    1850                1855                1860
Ile Trp Leu Asp Glu Asn Gly Leu Leu Leu Gly Val His Pro Arg
    1865                1870                1875
Leu Ala Gln Arg Ile Leu Phe Asn Thr Val Met Met Glu Asn Cys
    1880                1885                1890
Ser Asp Leu Asp Val Val Phe Thr Thr Cys Pro Lys Asp Glu Leu
    1895                1900                1905
Arg Pro Leu Glu Lys Val Leu Glu Ser Lys Thr Arg Ala Ile Asp
    1910                1915                1920
Ala Cys Pro Leu Asp Tyr Thr Ile Leu Cys Arg Met Tyr Trp Gly
    1925                1930                1935
Pro Ala Ile Ser Tyr Phe His Leu Asn Pro Gly Phe His Thr Gly
    1940                1945                1950
Val Ala Ile Gly Ile Asp Pro Asp Arg Gln Trp Asp Glu Leu Phe
    1955                1960                1965
Lys Thr Met Ile Arg Phe Gly Asp Val Gly Leu Asp Leu Asp Phe
    1970                1975                1980
Ser Ala Phe Asp Ala Ser Leu Ser Pro Phe Met Ile Arg Glu Ala
    1985                1990                1995
Gly Arg Ile Met Ser Glu Leu Ser Gly Thr Pro Ser His Phe Gly
    2000                2005                2010
Thr Ala Leu Ile Asn Thr Ile Ile Tyr Ser Lys His Leu Leu Tyr
    2015                2020                2025
Asn Cys Cys Tyr His Val Cys Gly Ser Met Pro Ser Gly Ser Pro
    2030                2035                2040
Cys Thr Ala Leu Leu Asn Ser Ile Ile Asn Asn Ile Asn Leu Tyr
    2045                2050                2055
Tyr Val Phe Ser Lys Ile Phe Gly Lys Ser Pro Val Phe Phe Cys
    2060                2065                2070
Gln Ala Leu Arg Ile Leu Cys Tyr Gly Glu Asp Val Leu Ile Val
    2075                2080                2085
Phe Ser Arg Asp Val Gln Ile Asp Asn Leu Asp Leu Ile Gly Gln
    2090                2095                2100
Lys Ile Val Asp Glu Phe Lys Lys Leu Gly Met Thr Ala Thr Ser
    2105                2110                2115
Ala Asp Lys Asn Val Pro Gln Leu Lys Pro Val Ser Glu Leu Thr
    2120                2125                2130
Phe Leu Lys Arg Ser Phe Asn Leu Val Glu Asp Arg Ile Arg Pro
    2135                2140                2145
Ala Ile Ser Glu Lys Thr Ile Trp Ser Leu Ile Thr Trp Gln Arg
    2150                2155                2160
Ser Asn Ala Glu Phe Glu Gln Asn Leu Glu Asn Ala Gln Trp Phe
    2165                2170                2175
Ala Phe Met His Gly Tyr Glu Phe Tyr Gln Lys Phe Tyr Tyr Phe
    2180                2185                2190
Gly Gln Ser Cys Leu Glu Lys Glu Met Ile Glu Tyr Arg Leu Lys
    2195                2200                2205
Ser Tyr Asp Trp Trp Arg Met Arg Phe Tyr Asp Gln Cys Phe Ile
    2210                2215                2220
Cys Asp Leu Ser
    2225
<210>3
<211>20
<212>DNA
<213>人工序列
<220>
<221>misc feature
<223>引物
<400>3
tttttttttt ttttttttat                         20
<210>4
<211>32
<212>DNA
<213>人工序列
<220>
<221>misc feature
<223>引物
<400>4
ttcaagaggg gtctccggga atttccggag tc           32
<210>5
<211>32
<212>DNA
<213>人工序列
<220>
<221>misc feature
<223>引物
<400>5
atttatttac taataaaaga aataaacaaa cc           32

Claims (5)

1.一种分离的核酸分子,其特征在于,所述核酸分子的核苷酸序列如SEQID NO:1所示或其反义序列,且所述核酸分子来源于甲肝病毒株YN5。
2.一种权利要求1所述的核酸分子的用途,其特征在于,用于制备检测甲型肝炎病毒的引物、探针或试剂盒。
3.如权利要求2所述的用途,其特征在于,所述的引物长度为15-100个核苷酸。
4.如权利要求2所述的用途,其特征在于,所述的探针的长度为25-5000个核苷酸。
5.如权利要求4所述的用途,其特征在于,所述的探针的长度为50-500个核苷酸。
CN2009100504746A 2009-04-30 2009-04-30 甲型肝炎病毒基因组全序列 Active CN101875942B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100504746A CN101875942B (zh) 2009-04-30 2009-04-30 甲型肝炎病毒基因组全序列

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100504746A CN101875942B (zh) 2009-04-30 2009-04-30 甲型肝炎病毒基因组全序列

Publications (2)

Publication Number Publication Date
CN101875942A CN101875942A (zh) 2010-11-03
CN101875942B true CN101875942B (zh) 2013-05-15

Family

ID=43018625

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100504746A Active CN101875942B (zh) 2009-04-30 2009-04-30 甲型肝炎病毒基因组全序列

Country Status (1)

Country Link
CN (1) CN101875942B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3536809A1 (en) * 2011-07-15 2019-09-11 Gen-Probe Incorporated Compositions and method for detecting human parvovirus nucleic acid
CN112521461B (zh) * 2020-12-17 2022-07-01 杭州贤至生物科技有限公司 甲型肝炎病毒重组蛋白的制备及其快速检测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5478746A (en) * 1982-04-07 1995-12-26 The United States Of America As Represented By The Department Of Health And Human Services cDNA encoding attenuated cell culture adapted hepatitis A virus genome

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5478746A (en) * 1982-04-07 1995-12-26 The United States Of America As Represented By The Department Of Health And Human Services cDNA encoding attenuated cell culture adapted hepatitis A virus genome

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Liu G.等.登录号:AF512536.1.《GenBank》.2004, *
甲型病毒性肝炎病毒的基因结构特点及基因工程疫苗研究展望;胡孟冬;《上海医学》;198902;第12卷(第02期);110-111 *
甲型肝炎病毒(H2株)快速适应变异株全基因序列分析;胡凝珠等;《中国生物制品学杂志》;20020225;第14卷(第04期);193-196 *
胡凝珠等.甲型肝炎病毒(H2株)快速适应变异株全基因序列分析.《中国生物制品学杂志》.2002,第14卷(第04期),193-196.
胡孟冬.甲型病毒性肝炎病毒的基因结构特点及基因工程疫苗研究展望.《上海医学》.1989,第12卷(第02期),110-111.

Also Published As

Publication number Publication date
CN101875942A (zh) 2010-11-03

Similar Documents

Publication Publication Date Title
CN110423844B (zh) 检测bk病毒的方法和组合物
CA2128528C (en) Process for typing of hcv isolates
AU660940B2 (en) NANBV diagnostics: polynucleotides useful for screening for hepatitis C virus
Laor et al. Detection of FMDV RNA amplified by the polymerase chain reaction (PCR)
JP2008228736A (ja) Hcvを遺伝子型分類するためのヘテロ二本鎖トラッキングアッセイ(hta)
Elahi et al. Determination of hepatitis C virus genotype by Pyrosequencing
EP0932702B1 (en) Detection and identification of non-polio enteroviruses
TW201221650A (en) Method for detection of enterovirus
CN101875942B (zh) 甲型肝炎病毒基因组全序列
CN103387997A (zh) 中华鳖小rna病毒基因组全序列及其应用
US20090098126A1 (en) Method and kit for the detection of adenoviruses
CN111172297B (zh) 一种RhD血型基因RHD993C>T等位基因及应用
US20030124517A1 (en) Hepatitis A virus nucleotide sequences, recombinant proteins and uses thereof
CN102352366B (zh) 罗氏沼虾双顺反子病毒基因组全序列及其应用
EP1833997A1 (en) Method for the detection of adenoviruses
CN106701799B (zh) 一种马铃薯m病毒基因组全序列及其应用
KR20030021155A (ko) 일본인으로부터의 이-형 간염 바이러스로부터 유래하는폴리누클레오티드 프로브 및 프라이머, 이들을 갖는 칩,이들을 갖는 키트, 및 이들에 의한 이-형 간염 바이러스를검출하는 방법
JPWO2006009260A1 (ja) E型肝炎ウイルスの検出方法
CN101899417B (zh) 乙型肝炎病毒耐阿德福韦变异病毒株及其应用
TW200804604A (en) Detection method for koi herpes virus (KHV)
CN111218453A (zh) 一种RhD血型抗原RHD-G353A突变体及检测
CN112725459B (zh) 与中国对虾耐高pH相关的SNP标记的核心序列、引物及应用
CN111154766B (zh) 一种rhd-s68r突变体及其检测方法
Ying et al. Identification of a novel A allele with initiator codon variant (c. 2T> A) in the ABO gene associated with weak A phenotype.
CN112940099A (zh) RhD-T163P突变体及其检测

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210226

Address after: No. 83, Dongfeng South Road, high tech Zone, Yuxi City, Yunnan Province

Patentee after: Yuxi Walvax Biotechnology Co.,Ltd.

Address before: 1399 Zhangjiang zhangheng Road, Pudong New Area, Shanghai 201203

Patentee before: SHANGHAI ZERUN BIOTECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right