CN110573628B - 检测癌症的探针组合 - Google Patents

检测癌症的探针组合 Download PDF

Info

Publication number
CN110573628B
CN110573628B CN201880010351.7A CN201880010351A CN110573628B CN 110573628 B CN110573628 B CN 110573628B CN 201880010351 A CN201880010351 A CN 201880010351A CN 110573628 B CN110573628 B CN 110573628B
Authority
CN
China
Prior art keywords
gene
hbv
sequence
probe
entrez
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880010351.7A
Other languages
English (en)
Other versions
CN110573628A (zh
Inventor
林友瑜
王雅俊
曾晟泰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TCM Biotech International Corp
Original Assignee
TCM Biotech International Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TCM Biotech International Corp filed Critical TCM Biotech International Corp
Publication of CN110573628A publication Critical patent/CN110573628A/zh
Application granted granted Critical
Publication of CN110573628B publication Critical patent/CN110573628B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/706Specific hybridization probes for hepatitis

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Virology (AREA)
  • Communicable Diseases (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

一种用于检测癌症的探针组合,其包括一组或多组HBV局部基因组靶向探针。其中当每一组该HBV局部基因组靶向探针依该HBV局部基因组的序列排列对齐时,已对齐的该些HBV局部基因组靶向探针于对齐后所组成的一整体序列和一种HBV基因组中的一参考序列或一HBV基因组上的DR序列(direct repeat region)互相匹配。在该些已对齐的多组探针中,每一探针序列的一部分和相邻的一个或二个探针序列的一部分重迭。该探针组合可进一步包括一组或多组癌症热点基因靶向探针,例如CTNNB1、TERT和TP53基因靶向探针、一组或多组外源性基因如一部分λ噬菌体的基因组靶向探针以及多组内源性基因如GAPDH和GdX基因靶向探针。

Description

检测癌症的探针组合
相关申请的交叉引用
本申请要求2017年2月7日提交的美国临时申请No.62/456087的优先权,该临时申请通过引用文献并入本文。
技术领域
本申请涉及一种探针组合,尤其是涉及一种用于检测癌症且具有序列专一性的探针组合。
背景技术
肝病毒科(Hepadnaviridae)被认为是和肝炎、肝细胞癌(hepatocellularcarcinoma;HCC)和肝硬化(cirrhosis)的致病机转有关的一类病毒。HBV(Hepatitis BVirus,即乙型肝炎病毒)为肝病毒科中最常见的病毒,且为一小型DNA病毒,其可被分类为基因型A至J。大部分成人被HBV感染后会康复,然而大约有5%至10%感染HBV的病患无法清除体内的病毒且会成为慢性带原者。乙型肝炎的慢性带原者演变为肝细胞癌的机率很高,因为HBV能嵌入宿主的基因组中且造成肝细胞在遗传上或表观遗传(epigenetic)上的改变。
目前和检测HBV嵌入基因组有关的方法,有Jiang等人发表的“The effect ofhepatitis B virus integration into the genomes of hepatocellular carcinomapatients”(Genome Res.(2012)22,593-601)和Sung等人发表的“Genome-wide survey ofrecurrent HBV integration in hepatocellular carcinoma”(Nature Genetics(2012)44,765-769);上述文献揭露了使用全基因组定序(whole genome sequencing)以检测肝细胞癌的肝组织样本中HBV嵌入基因组的状况。然而,这些直接定序的检测方法效率不佳。Jiang提及大约每次定序平均会产生2500万至3500万个75bp的核酸片段读值,但是在Jiang的检测方法中,可测得的HBV核酸片段读值为600万个,且仅有400个嵌合点(junction)读值。更进一步地,目前没有任何使用直接定序法的研究能够从循环系统中的肿瘤DNA(ctDNA)样本中检测HBV的嵌入事件。
而后,Li等人所发表的”HIVID:An efficient method to detect HBVintegration using low coverage sequencing”(Genomics(2013)102:4,338-344)和Zhao等人所发表的“Genomic and oncogenic preference of HBV integration inhepatocellular carcinoma”(Nature Communications(2016)7:12992)揭露了可捕捉特定序列的探针的使用方法,该些探针是依照HBV基因组中的序列设计的,且能够检测HBV嵌入基因组的状态。然而,Li和Zhao皆没有提供设计该些探针时更清楚的设计逻辑。更进一步地,Li和Zhao的研究中所揭露的探针效率不佳:在Li和Zhao的研究中,探针对人类基因组的平均对准率为83.7%,而HBV序列的平均对准率和检测嵌入事件的比率却分别低到0.08%和0.01%,代表着该些探针无法检测HBV嵌入人类基因组,或检测嵌入事件时的低效率。
发明内容
本发明提供了一组探针组合及分析方法,上述的探针组合和分析方法将可用于高效率和高敏感度地捕捉病毒DNA和病毒-宿主嵌合点(viral-hostjunction)。
本发明的一个实施例提供了一种用于检测癌症的探针组合。所述探针组合包括一组或多组部分乙型肝炎病毒(HBV)靶向探针。
根据以下一个或多个本发明的实施例,本发明提供了一种可检测癌症的探针组合。该探针组合包括一组或多组HBV局部基因组靶向探针,其中当每一组该HBV局部基因组靶向探针依该HBV局部基因组序列排列对齐时,已对齐的该些HBV局部基因组靶向探针于对齐后所组成的一整体序列和一种HBV基因型的一基因组中的一DR序列(direct repeatregion)的一参考序列互相匹配,且在该些已对齐的多组HBV局部基因组靶向探针中,每一个该HBV局部基因组靶向探针序列的一部分和相邻的一个或二个HBV局部基因组靶向探针序列的一部分相重迭。
在一实施例中,该些HBV基因型包括基因型A型、基因型B型、基因型C型、基因型D型、基因型E型、基因型F型、基因型G型、基因型H型、基因型I型和基因型J型。
在一实施例中,该些DR序列的参考序列包括SEQ ID NO.1至SEQ ID NO.32。
在一实施例中,该探针组合包括一组或多组HBV全基因组靶向探针,其中当每一组该HBV全基因组靶向探针依该HBV全基因组序列排列对齐时,已对齐的该些HBV全基因组靶向探针于对齐后所组成的一整体序列和一种HBV基因型的该基因组互相匹配,且在该些已对齐的多组HBV全基因组靶向探针中,每一个该HBV全基因组靶向探针序列的一部分和相邻的一个或二个HBV全基因组靶向探针序列的一部分相重迭。
在一实施例中,该探针组合更包括一组或多组癌症热点基因靶向探针,其中当每一组该癌症热点基因靶向探针依该癌症热点基因序列排列对齐时,已对齐的该些癌症热点基因靶向探针于对齐后所组成的一整体序列和一癌症热点基因的一参考序列互相匹配,且在该些已对齐的多组癌症热点基因靶向探针中,每一个该癌症热点基因靶向探针序列的一部分和相邻的一个或二个癌症热点基因靶向探针序列的一部分相重迭。
在一实施例中,该癌症热点基因包括CTNNB1、TERT和TP53。
在一实施例中,该癌症热点基因的该参考序列包括SEQ ID NOs.33-41。
在一实施例中,该探针组合更包括一组或多组外源性基因靶向探针,其中当该每一组外源性基因靶向探针依该外源性基因序列排列对齐时,已对齐的该些外源性基因靶向探针于对齐后所组成的一整体序列和一外源性基因的一参考序列互相匹配,且在该些已对齐的多组外源性基因靶向探针中,每一个该外源性基因靶向探针序列的一部分和相邻的一个或二个外源性基因靶向探针序列的一部分相重迭。
在一实施例中,该外源性基因源自于一λ噬菌体。
在一实施例中,该外源性基因的该参考序列包括SEQ ID NOs.42-54。
在一实施例中,该探针组合更包括一组或多组内源性基因靶向探针,其中当该每一组内源性基因靶向探针依该内源性基因序列排列对齐时,已对齐的该些内源性基因靶向探针于对齐后所组成的一整体序列和一内源性基因的一参考序列互相匹配,且在该些已对齐的多组内源性基因靶向探针中,每一个该内源性基因靶向探针序列的一部分和相邻的一个或二个内源性基因靶向探针序列的一部分相重迭。
在一实施例中,该内源性基因包括GAPDH和GdX。
在一实施例中,该内源性基因的该参考序列包括SEQ ID NO.55和SEQ ID NO.56。
较佳地,各个实施例中的该探针组合可检测到的癌症包括肝细胞癌。
较佳地,各个实施例中的该探针组合是用于捕捉具有病毒-宿主嵌合点的靶向核酸片段,该靶向核酸片段是由一感染HBV的对象的一样本中的DNA所取得。
优选地,从标本中获得的DNA包括基因组DNA和循环系统中的肿瘤DNA(ctDNA)。
优选地,所述样本包括生物性液体和肝组织。
根据以上实施例,本发明可提供一用来检测病毒感染或病毒感染所导致的癌症的工具。本发明的众多实施例能够应用于检测各种不同种类的DNA病毒和其病毒嵌入基因组现象。根据众多实施例所设计的探针组合确保了能够涵盖到最佳的病毒/宿主序列,且也考虑到了病毒基因的不稳定性。该探针组合也被证实了具备高敏感度、高效率和可信度。
附图说明
附图示出了本发明的一个或多个实施例,并与书面描述一起解释了本发明的原理。只要有可能,在整个附图中使用相同的附图标记来表示实施例的相同或相似的元件。
图1为一流程图,该流程图描绘出在符合本发明的一实施例中,取得一参考序列的流程。
图2A和图2B为本发明的一实施例中,该探针的设计概念示意图。
图3为本发明的一实验结果,该实验结果表现出一实施例中该探针的选择性杂交(hybridization)。
图4A和图4B为本发明的一实施结果,该实验结果表现出该探针的特异性。
图5A为本发明的一实施例中,一由热点图转换而来的直方图,据以呈现本发明的探针组合使用于配对的肿瘤基因组DNA(tumor genomic DNA)样本时,几个不同基因位置的下一代定序(next generation sequencing)分析结果。
图5B为本发明的一实施例中,一由热点图转换而来的直方图,据以呈现本发明的探针组合使用于配对的血浆内肿瘤DNA(plasma circulating tumor DNA)样本时,几个不同基因位置的下一代定序(next generation sequencing)分析结果。
图6为本发明的一实施例中的另一直方图,该直方图由一热点图转换而来,具体呈现本发明的探针组合使用于肿瘤基因组DNA(tumor genomic DNA)样本时,几个不同基因位置的下一代定序(next generation sequencing)分析结果。
图7为本发明的一实验结果,该实验结果为数个DNA样本和一探针组合进行杂交后,再以下一代定序技术分析。
根据惯例,各种描述的特征未按比例绘制,并且被绘制以强调与本公开相关的特征。在整个附图和文本中,相同的参考字符表示相同的元件。
具体实施方式
现在下面将结合本发明各种实施例中的附图对本发明进行更全面的描述。然而,本发明可以以许多不同的形式实施,并且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了使本发明彻底和完整的公开,并且将公开的范围完全传达给本领域技术人员。相同的附图标记始终表示相同的元件。
这里使用的术语的目的仅在于描述特定的实施例,并不旨在限制本公开。如这里所使用的单数形式“一”,“一个”和“该”也包括复数形式,除非上下文另有明确说明。将进一步理解,在本文中使用的术语“包括”和/或“包含”,或“包括”和/或“包括”或“具有”和/或“含有”,特别是存在陈述的特征、区域、整数、步骤、操作、元素和/或组件,但不排除一个或多个其他特征,区域,整数,步骤,操作,元素,组件和/或组的存在或添加。
应当理解,术语“和/或”和“至少一个”包括任何一个以及其中一个或多个的所有组合。还应该理解,尽管这里可以使用术语第一、第二、第三等来描述各种元件、部件、区域、部件和/或部分,但是这些元件、部件、区域、部件和/或部分不应该受这些术语的限制。这些术语仅用于将一个元件、组件、区域、部件或部分与另一个元件、组件、区域、层或部分区分开。因此,在不脱离本公开教导的情况下,下面讨论的第一元件、组件、区域、部件或部分可以被称为第二元件、组件、区域、层或部分。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。可以进一步理解,诸如在常用词典中定义的那些术语应被解释为具有与其在相关领域和本公开的上下文中的含义一致的含义。除非在此明确定义,则将不能被理想化解释或者被解释为过于正式的意义。
本发明的其中一个面向提供了一探针组合,该探针组合包括了一组或多组特定序列靶向探针。该些探针可包括单股寡核苷酸(single stranded oligonucleotides)和单股聚核苷酸(single stranded polynucleotide),例如单股脱氧核醣核酸(ssDNA;singlestranded deoxyribonucleic acids)、单股核醣核酸(single stranded ribonucleicacids)和单股人造核苷酸(single stranded artificial nucleotides)。该探针组合可用于检测病毒感染或病毒感染所引起的癌症,特别是DNA病毒所引起的癌症。在某些实施例中,该探针组合可用于检测HBV、人类乳突病毒(HPV)、艾司坦-巴尔病毒(EBV;Epstein-BarrVirus)、第8型疱疹病毒(HHV-8;Herpes Virus-8)、人类嗜T淋巴球病毒(HTLV;Human T-lymphotropic Virus)、Merkel氏多瘤病毒(MCV;Merkel Cell Polyomavirus)或其他DNA病毒。在其他实施例中,该探针组合可用于检测肝细胞癌(hepatocellular carcinoma)、肝癌(liver cancer)、子宫颈癌(cervical cancer)、阴茎癌(penile cancer)、肛门癌(analcancer)、阴道癌(vaginal cancer)、外阴癌(vulvar cancer)、口腔癌(oral cancer)、口咽癌(oropharyngeal cancer)、鼻咽癌(nasopharyngeal cancer)、头颈癌(head and neckcancer)、淋巴癌(lymphoma)、原发性积液淋巴癌(primary effusion lymphoma)、胃癌(stomach cancer)、卡波西氏肉瘤(Kaposi sarcoma)、Merkel氏细胞癌(Merkel cellcarcinoma)或其他由DNA病毒感染所引起的癌症。
根据本发明的一种实施例,该探针组合包括一组或多组特定病毒全基因组靶向探针。当每一该特定病毒全基因组靶向探针依该特定病毒全基因组序列对齐时,已对齐的该些特定病毒全基因组靶向探针的于对齐后所组成的一整体序列和一种特定病毒基因型的该基因组的一参考序列互相匹配。该特定病毒得标的基因型可包括前述DNA病毒的不同基因型。例如若该特定病毒为HBV,则其靶向基因型就可包括基因型A型、基因型B型、基因型C型、基因型D型、基因型E型、基因型F型、基因型G型、基因型H型、基因型I型和基因型J型。该特定病毒基因组的该参考序列可由NCBI GenBank(https://www.ncbi.nlm.nih.gov/genbank/)或自临床样本中所获得的序列取得。例如HBV基因型A型的参考序列可由NCBIGenBank Accession No.AP007263、HE974383或HE974381取得;HBV基因型B型的参考序列可由GenBank Accession No.AB981581、AB602818或AB554017取得;HBV基因型C型的参考序列可由GenBank Accession No.LC360507、AB644287或AB113879取得;HBVD型的参考序列可由GenBank Accession No.HE815465、HE974382或AB554024取得;HBV基因型E型的参考序列可由GenBank Accession No.HE974380、HE974384或AP007262取得;HBV基因型F型的参考序列可由GenBank Accession No.DQ823095、AB036909或AB036920取得;HBV基因型G型的参考序列可由GenBank Accession No.AB625342、HE981176或GU563559取得;HBV基因型H型的参考序列可由GenBank Accession No.AB298362、AB846650或AB516395取得;HBV基因型I型的参考序列可由GenBank Accession No.EU833891、KF214680或KU950741取得;HBV基因型J型的参考序列可由GenBank Accession No.AB486012取得。
在一实施例中,该探针组合包括二组HBV全基因组靶向探针。当一组HBV全基因组靶向探针依该HBV全基因组序列排列对齐时,已对齐的该些HBV全基因组靶向探针于对齐后所组成的一整体序列和HBV基因型B型的一基因组的一参考序列(SEQ ID NO.1)互相匹配。同样的,当其他组HBV全基因组靶向探针依该HBV全基因组序列排列对齐时,已对齐的该些HBV全基因组靶向探针于对齐后所组成的一整体序列和HBV基因型C型的一基因组的一参考序列(SEQ ID NO.2)互相匹配。在此实施例中,该HBV参考序列取得的方法如图1所示。如步骤S1中所示,DNA由样本中萃取而来,该样本可为被HBV慢性感染的病人的生物性液体,例如:血液、淋巴液、尿液、汗液、唾液、眼泪或胃肠液(interstinal fluid);或为其组织,例如肝组织。该萃取出的DNA包括了病人的基因组DNA(gDNA)和/或循环系统中的肿瘤DNA(ctDNA)。如步骤S2中所示,该萃取出的DNA依据NCBI GenBank中已知的各种HBV基因型而定序且分类。在此实施例中,选择HBV基因型B型和基因型C型的原因,是由于此二种基因型盛行于肝细胞癌病人之中;然而本发明的实施例并不限于HBV基因型B型和基因型C型,而是可包含各种能造成持续性感染的DNA病毒的不同基因型。如步骤S3中所示,以Clustal算法对齐并计算每一所选基因型的序列,并根据每一位置所共同拥有的对偶片段序列,得到该病毒基因型的一共通序列(consensus sequence)。最后,该共通序列被用来当做该病毒基因型的一参考序列。在此实施例中,该些参考序列包括HBV基因型B型和基因型C型的多个共通序列,其中该些参考序列可分别涵盖HBV基因型B型的基因组中的全部3,191bp序列,或HBV基因型C型基因组中的全部3,191bp序列。
在此实施例中,该病毒序列靶向探针被设计为:当该些病毒全基因组靶向探针依该病毒全基因组序列排列对齐时,每一病毒全基因组靶向探针的一部分会直接和相邻的病毒全基因组靶向探针的一部分相重迭。如图2A所示,在此实施例中,每一HBV全基因组序列211靶向探针212的一部分会直接和一个或二个相邻的HBV全基因组序列211靶向探针212的一部分重迭。该序列重迭部分的长度不等,较佳地为50%(在此以2X重迭密度表示)或75%(在此以4X重迭密度表示),如图2B所示。在一实施例中,该探针被设计为具有120bp的长度和2X重迭密度,每一探针会直接和相邻的探针重迭60bp。同样的,若该些探针的长度分别为120bp和4X重迭密度,则每一探针将会直接和相邻的探针重迭90bp。
进一步地,在设计该些探针时,该病毒的基因组结构也是考虑因素之一。在HBV基因组靶向的实施例中,由于HBV基因组为环形,因此该些HBV全基因组靶向探针中,其最后的探针将超过该HBV基因组的该参考序列的第3191bp,且会在该参考序列的起始碱基处(即第1bp)继续下去。例如一探针的长度为120bp,且起始于该HBV全基因组的参考序列的第3,121bp;该探针将包括一个71bp长的区域以对应该参考序列的第3,121至第3,191bp,紧接在后的是一个49bp长的区域,以对应该参考序列的第1至第49bp。
本发明的实施例并不限制该些探针的长度;该些探针的长度可基于成本、捕捉效率、敏感度、特异性或其他因素进行设计。在某些实施例中,任一参考序列所对应的探针可能数量N可由以下的公式1进行计算:
在公式1中L代表该参考序列的长度,而P代表该些探针的长度,P的范围可为一最小长度(以min表示)至一最大长度(以max表示)。例如基于一长度为3191bp的HBV基因型B型或C型参考序列,如其探针序列长度为50至120bp之间,则可设计出220,597种探针。
根据本发明的一实施例,该探针组和可以包括一组或多组特定病毒局部基因组靶向探针。当每一组该特定病毒局部基因组靶向探针依该特定病毒局部基因组序列排列对齐时,已对齐的该些特定病毒局部基因组靶向探针于对齐后所组成的一整体序列和一特定病毒局部基因组的一特别区上的一参考序列互相匹配。在该些已对齐的多组特定病毒局部基因组靶向,每一个特定病毒局部基因组靶向的探针的一部分和相邻的一个或二个以该特定病毒局部基因组做为靶向的探针的一部分相重迭。在某些实施例中,上述的特别区包括一在HBV基因组中且介于DR序列1(direct repeat 1)和DR序列2(direct repeat2)之间的区域。在其他实施例中,该特别区可为一介于DR序列1和DR序列2之间的区域,再加上两个自上述区域延伸出的延展区,以使其长度达到一指定长度。例如:为了定义一长度为960bp,位于DR序列上的参考序列,可以假设DR序列1和DR序列2分别位于病毒基因组上的第360至第370bp和第594至604bp,该参考序列可以定义为DR序列1和DR序列2之间的区域且再加上由两端起算360bp的延展区。同时,该HBV基因型A型基因组上的一DR序列上的该参考序列可为SEQ ID NOs.3-5;该HBV基因型B型基因组上的一DR序列上的该参考序列可为SEQ IDNOs.6-9;该HBV基因型C型基因组上的一DR序列上的该参考序列可为SEQ ID NOs 10-13;该HBV基因型D型基因组上的一DR序列上的该参考序列可为SEQ ID NOs.14-16;该HBV基因型E型基因组上的一DR序列上的该参考序列可为SEQ ID NOs.17-19;该HBV基因型F型基因组上的一DR序列上的该参考序列可为SEQ ID NOs.20-22;该HBV基因型G型基因组上的一DR序列上的该参考序列可为SEQ ID NOs.23-25;该HBV基因型H型基因组上的一DR序列上的该参考序列可为SEQ ID NOs.26-28;该HBV基因型I型基因组上的一DR序列上的该参考序列可为SEQ ID NOs.29-31;该HBV基因型J型基因组上的一DR序列上的该参考序列可为SEQ IDNOs.32。
在一实施例中,该探针组合可包括二组HBV局部基因组靶向探针。当中当每一组该HBV局部基因组靶向探针依该HBV局部基因组序列的序列排列对齐时,已对齐的该些HBV局部基因组靶向探针于对齐后所组成的一整体序列和HBV基因型B型的一基因组中的一DR序列的一参考序列(SEQ ID NO.9),或HBV基因型C型的一基因组中的一DR序列的一参考序列(SEQ ID NO.13)互相匹配。该些DR序列可被定义为位于第1190至第2234bp、第1231至第2190bp或其他在HBV基因组中的特别区。和前述类似的是,每一个该HBV局部基因组靶向探针的一部分和相邻的一个或二个HBV局部基因组靶向探针序列的一部分相重迭。该些重迭序列的长度可为但不限于50%(即为2X重迭密度)或75%(即为4X重迭密度)。
可使用前述的公式1计算该些HBV局部基因组中该DR序列的参考序列(SEQ IDNOs.9和13)靶向探针的可能数量。例如基于一长度为960bp的HBV DR序列中的参考序列,在探针序列总长为50至120bp之间的前提下,则可设计出62,196种探针。
根据本发明的一实施例,该探针组合包括一组病毒全基因组序列靶向探针和一组病毒局部基因组靶向序列探针。该病毒全基因组序列靶向探针和病毒局部基因组序列靶向探针可合并使用,以提升该探针组合所能涵盖的该病毒基因组中的参考序列范围。在一实施例中,该HBV局部基因组靶向探针可被设计为覆盖该基因组中的DR序列。例如,假设该HBV全基因组靶向探针的长度为120bp并起始于HBV基因组的第1、第61和第121bp(该探针重迭序列设计为2X重迭密度),该HBV局部基因组靶向探针的重迭序列则设计为2X重迭密度且起始于HBV基因组的第31、第91和第151bp。亦即,该DR序列即可被二组探针所涵盖(即上述的HBV全基因组靶向探针和HBV局部基因组靶向探针)且探针的重迭序列为4X重迭密度(即每一探针和其直接相邻的探针有75%的序列重迭)。
根据本发明的一实施例,该探针组合更进一步包括一组或多组癌症热点基因(hotspot genes)靶向探针。其中当每一组该癌症热点基因靶向探针依该癌症热点基因序列排列对齐时,已对齐的该些癌症热点基因靶向探针于对齐后所组成的一整体序列和一癌症热点基因的一参考序列互相匹配。在该些已对齐的多组癌症热点基因靶向探针中,每一个该癌症热点基因靶向探针序列的一部分和相邻的一个或二个癌症热点基因靶向探针序列的一部分相重迭。该些重迭序列的长度可为但不限于50%(即为2X重迭密度)或75%(即为4X重迭密度)。
该些癌症热点基因的参考序列可由NCBI基因数据库(www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=gene,以下并以该数据库中的“Entrez Gene ID”表示)取得。该些癌症热点基因可包括但不限于以下至少一种基因:ABL1(Entrez Gene ID:25)、ABL2(Entrez Gene ID:27)、ACSL3(Entrez Gene ID:2181)、AF15Q14(Entrez Gene ID:57082)、AF1Q(Entrez Gene ID:10962)、AF3p21(Entrez Gene ID:51517)、AF5q31(Entrez GeneID:27125)、AKAP9(Entrez Gene ID:10142)、AKT1(Entrez Gene ID:207)、AKT2(EntrezGene ID:208)、ALDH2(Entrez Gene ID:217)、ALK(Entrez Gene ID:238)、ALO17(Entrez Gene ID:57674)、APC(Entrez Gene ID:11789)、ARHGEF12(Entrez Gene ID:23365)、ARHH(Entrez Gene ID:399)、ARID1A(Entrez Gene ID:8289)、ARID2(Entrez GeneID:196528)、ARNT(Entrez Gene ID:405)、ASPSCR1(Entrez Gene ID:79058)、ASXL1(Entrez Gene ID:171023)、ATF1(Entrez Gene ID:466)、ATIC(Entrez Gene ID:471)、ATM(Entrez Gene ID:472)、ATRX(Entrez Gene ID:546)、BAP1(Entrez Gene ID:8314)、BCL10(Entrez Gene ID:8915)、BCL11A(Entrez Gene ID:53335)、BCL11B(Entrez Gene ID:64919)、BCL2(Entrez Gene ID:596)、BCL3(Entrez Gene ID:602)、BCL5(Entrez Gene ID:603)、BCL6(Entrez Gene ID:604)、BCL7A(Entrez Gene ID:605)、BCL9(Entrez Gene ID:607)、BCOR(Entrez Gene ID:54880)、BCR(Entrez Gene ID:613)、BHD(Entrez Gene ID:50947)、BIRC3(Entrez Gene ID:330)、BLM(Entrez Gene ID:641)、BMPRIA(Entrez GeneID:12166)、BRAF(Entrez Gene ID:673)、BRCA1(Entrez Gene ID:672)、BRCA2(EntrezGene ID:675)、BRD3(Entrez Gene ID:8019)、BRD4(Entrez Gene ID:23476)、BRIP1(Entrez Gene ID:83990)、BTG1(Entrez Gene ID:694)、BUB1B(Entrez Gene ID:701)、C15orf55(Entrez Gene ID:144535)、C16orf75(Entrez Gene ID:387882)、CANT1(EntrezGene ID:124583)、CARD11(Entrez Gene ID:84433)、CARs(Entrez Gene ID:833)、CBFB(Entrez Gene ID:865)、CBL(Entrez Gene ID:867)、CBLB(Entrez Gene ID:868)、CBLC(Entrez Gene ID:23624)、CCNB1IP1(Entrez Gene ID:57820)、CCND1(Entrez Gene ID:595)、CCND2(Entrez Gene ID:894)、CCND3(Entrez Gene ID:896)、CCNE1(Entrez GeneID:898)、CD273(Entrez Gene ID:80380)、CD274(Entrez Gene ID:29126)、CD74(EntrezGene ID:972)、CD79A(Entrez Gene ID:973)、CD79B(Entrez Gene ID:974)、CDH1(EntrezGene ID:999)、CDH11(Entrez Gene ID:1009)、CDK12(Entrez Gene ID:51755)、CDK4(Entrez Gene ID:1019)、CDK6(Entrez Gene ID:1021)、CDKN2A(Entrez Gene ID:1029)、CDKN2C(Entrez Gene ID:1031)、CDX2(Entrez Gene ID:1045)、CEBPA(Entrez Gene ID:1050)、CEP1(Entrez Gene ID:11064)、CHCHD7(Entrez Gene ID:79145)、CHEK2(EntrezGene ID:11200)、CHIC2(Entrez Gene ID:26511)、CHN1(Entrez Gene ID:1123)、CIC(Entrez Gene ID:23152)、CIITA(Entrez Gene ID:4261)、CLTC(Entrez Gene ID:1213)、CLTCL1(Entrez Gene ID:8218)、CMKOR1(Entrez Gene ID:57007)、CoL1A1(Entrez GeneID:1277)、CPBP(Entrez Gene ID:1316)、COX6C(Entrez Gene ID:1345)、CREB1(EntrezGene ID:1385)、CREB3L1(Entrez Gene ID:90993)、CREB3L2(Entrez Gene ID:64764)、CREBBP(Entrez Gene ID:1387)、CRLF2(Entrez Gene ID:64109)、CRTC3(Entrez Gene ID:64784)、CTNNB1(catenin beta 1;Entrez Gene ID:1499)、CYLD(Entrez Gene ID:1540)、D10S170(Entrez Gene ID:8030)、DAXX(Entrez Gene ID:1616)、DDB2(Entrez Gene ID:1643)、DDX10(Entrez Gene ID:1662)、DDX5(Entrez Gene ID:1655)、DDX6(Entrez GeneID:1656)、DEK(Entrez Gene ID:7913)、DICER1(Entrez Gene ID:23405)、DNMT3A(EntrezGene ID:1788)、DUX4(Entrez Gene ID:100288687)、EBF1(Entrez Gene ID:1879)、EGFR(Entrez Gene ID:1956)、EIF4A2(Entrez Gene ID:1974)、ELF4(Entrez Gene ID:2000)、ELK4(Entrez Gene ID:2005)、ELKS(Entrez Gene ID:23085)、ELL(Entrez Gene ID:8178)、ELN(Entrez Gene ID:2006)、EML4(Entrez Gene ID:27436)、EP300(Entrez GeneID:2033)、EPS15(Entrez Gene ID:2060)、ERBB2(Entrez Gene ID:2064)、ERCC2(EntrezGene ID:2068)、ERCC3(Entrez Gene ID:2071)、ERCC4(Entrez Gene ID:2072)、ERCC5(Entrez Gene ID:2073)、ERG(Entrez Gene ID:2078)、ETV1(Entrez Gene ID:2115)、ETV4(Entrez Gene ID:2118)、ETV5(Entrez Gene ID:2119)、ETV6(Entrez Gene ID:2120)、EVI1(Entrez Gene ID:2122)、EWsR1(Entrez Gene ID:2130)、EXT1(Entrez Gene ID:2131)、EXT2(Entrez Gene ID:2132)、EZH2(Entrez Gene ID:2146)、FACL6(Entrez GeneID:23305)、FAM22A(Entrez Gene ID:728118)、FAM22B(Entrez Gene ID:729262)、FAM46C(Entrez Gene ID:54855)、FANCA(Entrez Gene ID:2175)、FANCC(Entrez Gene ID:2176)、FANCD2(Entrez Gene ID:2177)、FANCE(Entrez Gene ID:2178)、FANCF(Entrez Gene ID:2188)、FANCG(Entrez Gene ID:2189)、FBXO11(Entrez Gene ID:80204)、FBXW7(EntrezGene ID:55294)、FCGR2B(Entrez Gene ID:2213)、FEV(Entrez Gene ID:54738)、FGFR1(Entrez Gene ID:2260)、FGFR1OP(Entrez Gene ID:11116)、FGFR2(Entrez Gene ID:2263)、FGFR3(Entrez Gene ID:2261)、FH(Entrez Gene ID:2271)、FHIT(Entrez Gene ID:2272)、FIP1L1(Entrez Gene ID:81608)、FLI1(Entrez Gene ID:2313)、FLT3(Entrez GeneID:2322)、FNBP1(Entrez Gene ID:23048)、FOXL2(Entrez Gene ID:668)、FOXO1(EntrezGene ID:2308)、FOXO3A(Entrez Gene ID:2309)、FOXP1(Entrez Gene ID:27086)、FSTL3(Entrez Gene ID:10272)、FUBP1(Entrez Gene ID:8880)、FUS(Entrez Gene ID:2521)、FVT1(Entrez Gene ID:2531)、GAS7(Entrez Gene ID:8522)、GATA1(Entrez Gene ID:2623)、GATA2(Entrez Gene ID:2624)、GATA3(Entrez Gene ID:2625)、GMPS(Entrez GeneID:8833)、GNA11(Entrez Gene ID:2767)、GNAQ(Entrez Gene ID:2776)、GNAS(EntrezGene ID:2778)、GOLGA5(Entrez Gene ID:9950)、GOPC(Entrez Gene ID:57120)、GPC3(Entrez Gene ID:2719)、GPHN(Entrez Gene ID:10243)、GRAF(Entrez Gene ID:23092)、HCMOGT-1(Entrez Gene ID:92521)、HEAB(Entrez Gene ID:10978)、HERPUD1(Entrez GeneID:9709)、HEY1(Entrez Gene ID:23462)、HIP1(Entrez Gene ID:3092)、HIST1H4I(EntrezGene ID:8294)、HLF(Entrez Gene ID:3131)、HLXB9(Entrez Gene ID:3110)、HMGA1(Entrez Gene ID:3159)、HMGA2(Entrez Gene ID:8091)、HNRNPA2B1(Entrez Gene ID:3181)、HOOK3(Entrez Gene ID:84376)、HOXA11(Entrez Gene ID:3207)、HOXA13(EntrezGene ID:3209)、HOXA9(Entrez Gene ID:3205)、HOXC11(Entrez Gene ID:3227)、HOXC13(Entrez Gene ID:3229)、HOXD11(Entrez Gene ID:3237)、HOXD13(Entrez Gene ID:3239)、HRAS(Entrez Gene ID:3265)、HRPT2(Entrez Gene ID:79577)、HSPCA(Entrez GeneID:3320)、HSPCB(Entrez Gene ID:3326)、IDH1(Entrez Gene ID:3417)、IDH2(EntrezGene ID:3418)、IGH@(Entrez Gene ID:3492)、IGK@(Entrez Gene ID:50802)、IGL@(Entrez Gene ID:3535)、IKZF1(Entrez Gene ID:10320)、IL2(Entrez Gene ID:3558)、IL21R(Entrez Gene ID:50615)、IL6ST(Entrez Gene ID:3572)、IL7R(Entrez Gene ID:3575)、IRF4(Entrez Gene ID:3662)、IRTA1(Entrez Gene ID:83417)、ITK(Entrez GeneID:3702)、JAK1(Entrez Gene ID:3716)、JAK2(Entrez Gene ID:3717)、JAK3(Entrez GeneID:3718)、JAZF1(Entrez Gene ID:221895)、JUN(Entrez Gene ID:3725)、KDR(EntrezGene ID:3791)、KIAA1549(Entrez Gene ID:57670)、KIT(Entrez Gene ID:3815)、KLK2(Entrez Gene ID:3817)、KRAS(Entrez Gene ID:3845)、KTN1(Entrez Gene ID:3895)、LAF4(Entrez Gene ID:3899)、LASP1(Entrez Gene ID:3927)、LCK(Entrez Gene ID:3932)、LCP1(Entrez Gene ID:3936)、LCX(Entrez Gene ID:80312)、LHFP(Entrez GeneID:10186)、LIFR(Entrez Gene ID:3977)、LMO1(Entrez Gene ID:4004)、LMO2(EntrezGene ID:4005)、LPP(Entrez Gene ID:4026)、LYL1(Entrez Gene ID:4066)、MADH4(EntrezGene ID:4089)、MAF(Entrez Gene ID:4094)、MAFB(Entrez Gene ID:9935)、MALT1(EntrezGene ID:10892)、MAML2(Entrez Gene ID:84441)、MAP2K4(Entrez Gene ID:6416)、MDM2(Entrez Gene ID:4193)、MDM4(Entrez Gene ID:4194)、MDS1(Entrez Gene ID:2122)、MDS2(Entrez Gene ID:259283)、MECT1(Entrez Gene ID:23373)、MED12(Entrez Gene ID:9968)、MEN1(Entrez Gene ID:4221)、MET(Entrez Gene ID:4233)、MITF(Entrez Gene ID:4286)、MKL1(Entrez Gene ID:57591)、MLF1(Entrez Gene ID:4291)、MLH1(Entrez GeneID:4292)、MLL(Entrez Gene ID:4297)、MLL2(Entrez Gene ID:8085)、MLL3(Entrez GeneID:58508)、MLLT1(Entrez Gene ID:4298)、MLLT10(Entrez Gene ID:8028)、MLLT2(EntrezGene ID:4299)、MLLT3(Entrez Gene ID:4300)、MLLT4(Entrez Gene ID:4301)、MLLT6(Entrez Gene ID:4302)、MLLT7(Entrez Gene ID:4303)、MN1(Entrez Gene ID:4330)、MPL(Entrez Gene ID:4352)、MSF(Entrez Gene ID:10801)、MSH2(Entrez Gene ID:4436)、MSH6(Entrez Gene ID:2956)、MsI2(Entrez Gene ID:124540)、MSN(Entrez Gene ID:4478)、MTCP1(Entrez Gene ID:4515)、MUC1(Entrez Gene ID:4582)、MUTYH(Entrez GeneID:4595)、MYB(Entrez Gene ID:4602)、MYC(Entrez Gene ID:4609)、MYCL1(Entrez GeneID:4610)、MYCN(Entrez Gene ID:4613)、MYD88(Entrez Gene ID:4615)、MYH11(EntrezGene ID:4629)、MYH9(Entrez Gene ID:4627)、MYST4(Entrez Gene ID:23522)、NACA(Entrez Gene ID:4666)、NBS1(Entrez Gene ID:4683)、NCOA1(Entrez Gene ID:8648)、NCOA2(Entrez Gene ID:10499)、NCOA4(Entrez Gene ID:8031)、NDRG1(Entrez Gene ID:10397)、NF1(Entrez Gene ID:4763)、NF2(Entrez Gene ID:4771)、NFE2L2(Entrez GeneID:4780)、NFIB(Entrez Gene ID:4781)、NFKB2(Entrez Gene ID:4791)、NIN(Entrez GeneID:51199)、NKX2-1(Entrez Gene ID:7080)、NONO(Entrez Gene ID:4841)、NOTCH1(EntrezGene ID:4851)、NOTCH2(Entrez Gene ID:4853)、NPM1(Entrez Gene ID:4869)、NR4A3(Entrez Gene ID:8013)、NRAS(Entrez Gene ID:4893)、NSD1(Entrez Gene ID:64324)、NTRK1(Entrez Gene ID:4914)、NTRK3(Entrez Gene ID:4916)、NUMA1(Entrez Gene ID:4926)、NUP214(Entrez Gene ID:8021)、NUP98(Entrez Gene ID:4928)、OLIG2(EntrezGene ID:10215)、OMD(Entrez Gene ID:4958)、PAFAHIB2(Entrez Gene ID:5049)、PALB2(Entrez Gene ID:79728)、PAX3(Entrez Gene ID:5077)、PAX5(Entrez Gene ID:5079)、PAX7(Entrez Gene ID:5081)、PAX8(Entrez Gene ID:7849)、PBRM1(Entrez Gene ID:55193)、PBX1(Entrez Gene ID:5087)、PCM1(Entrez Gene ID:5108)、PCSK7(Entrez GeneID:9159)、PDE4DIP(Entrez Gene ID:9659)、PDGFB(Entrez Gene ID:5155)、PDGFRA(Entrez Gene ID:5156)、PDGFRB(Entrez Gene ID:5159)、PER1(Entrez Gene ID:5187)、PHOX2B(Entrez Gene ID:8929)、PICALM(Entrez GeneID:8301)、PIK3CA(Entrez Gene ID:5290)、PIK3R1(Entrez Gene ID:5295)、PIM1(Entrez Gene ID:5292)、PLAG1(Entrez GeneID:5324)、PML(Entrez Gene ID:5371)、PMS1(Entrez Gene ID:5378)、PMS2(Entrez GeneID:5395)、PMX1(Entrez Gene ID:5396)、PNUTL1(Entrez Gene ID:5413)、POU2AFI(EntrezGene ID:5450)、POU5F1(Entrez Gene ID:5460)、PPARG(Entrez Gene ID:5468)、PPP2R1A(Entrez Gene ID:5518)、PRCC(Entrez Gene ID:5546)、PRDM1(Entrez Gene ID:639)、PRDM16(Entrez Gene ID:63976)、PRF1(Entrez Gene ID:5551)、PRKAR1A(Entrez GeneID:5573)、PRO1073(Entrez Gene ID:57018)、PSIP2(Entrez Gene ID:11168)、PTCH(Entrez Gene ID:5727)、PTEN(Entrez Gene ID:5728)、PTPN11(Entrez Gene ID:5781)、RAB5EP(Entrez Gene ID:9135)、RAD51L1(Entrez Gene ID:5890)、RAF1(Entrez Gene ID:5894)、RALGDS(Entrez Gene ID:5900)、RANBP17(Entrez Gene ID:64901)、RAP1GDS1(Entrez Gene ID:5910)、RARA(Entrez Gene ID:5914)、RB1(Entrez Gene ID:5925)、RBM15(Entrez Gene ID:64783)、RECQL4(Entrez Gene ID:9401)、REL(Entrez Gene ID:5966)、RET(Entrez Gene ID:5979)、ROS1(Entrez Gene ID:6098)、RPL22(Entrez GeneID:6146)、RPN1(Entrez Gene ID:6184)、RuNDC2A(Entrez Gene ID:92017)、RUNX1(EntrezGene ID:861)、RUNXBP2(Entrez Gene ID:7994)、SBDS(Entrez Gene ID:51119)、SDH5(Entrez Gene ID:54949)、SDHB(Entrez Gene ID:6390)、SDHC(Entrez Gene ID:6391)、SDHD(Entrez Gene ID:6392)、SEPT6(Entrez Gene ID:23157)、SET(Entrez Gene ID:6418)、SETD2(Entrez Gene ID:29072)、SF3B1(Entrez Gene ID:23451)、SFPQ(EntrezGene ID:6421)、SFRS3(Entrez Gene ID:6428)、SH3GL1(Entrez Gene ID:6455)、SIL(Entrez Gene ID:6491)、SLC45A3(Entrez Gene ID:85414)、SMARCA4(Entrez Gene ID:6597)、SMARCB1(Entrez Gene ID:6598)、SMO(Entrez Gene ID:6608)、SOCS1(Entrez GeneID:8651)、SOX2(Entrez Gene ID:6657)、SRGAP3(Entrez Gene ID:9901)、SRSF2(EntrezGene ID:6427)、SS18L1(Entrez Gene ID:26039)、SSH3BP1(Entrez Gene ID:10006)、SSX1(Entrez Gene ID:6756)、SSX2(Entrez Gene ID:6757)、SSX4(Entrez Gene ID:6759)、STK11(Entrez Gene ID:6794)、STL(Entrez Gene ID:7955)、SUFU(Entrez Gene ID:51684)、SUZ12(Entrez Gene ID:23512)、SYK(Entrez Gene ID:6850)、TAF15(Entrez GeneID:8148)、TAL1(Entrez Gene ID:6886)、TAL2(Entrez Gene ID:6887)、TCEA1(EntrezGene ID:6917)、TCF1(Entrez Gene ID:6927)、TCF12(Entrez Gene ID:6938)、TCF3(Entrez Gene ID:6929)、TCF7L2(Entrez Gene ID:6934)、TCL1A(Entrez Gene ID:8115)、TCL6(Entrez Gene ID:27004)、TET2(Entrez Gene ID:54790)、TERT(telomerase reversetranscriptase;Entrez Gene ID:7015)、TFE3(Entrez Gene ID:7030)、TFEB(Entrez GeneID:7942)、TFG(Entrez Gene ID:10342)、TFPT(Entrez Gene ID:29844)、TFRC(EntrezGene ID:7037)、THRAP3(Entrez Gene ID:9967)、TIF1(Entrez Gene ID:8805)、TLX1(Entrez Gene ID:3195)、TLX3(Entrez Gene ID:30012)、TMPRSS2(Entrez Gene ID:7113)、TNFAIP3(Entrez Gene ID:7128)、TNFRSF14(Entrez Gene ID:8764)、TNFRSF17(Entrez Gene ID:608)、TNFRSF6(Entrez Gene ID:355)、TOP1(Entrez Gene ID:7150)、TP53(tumor protein p53;Entrez Gene ID:7157)、TPM3(Entrez Gene ID:7170)、TPM4(Entrez Gene ID:7171)、TPR(Entrez Gene ID:7175)、TRA@(Entrez Gene ID:6955)、TRB@(Entrez Gene ID:6957)、TRD@(Entrez Gene ID:6964)、TRIM27(Entrez Gene ID:5987)、TRIM33(Entrez Gene ID:51592)、TRIP11(Entrez Gene ID:9321)、TSC1(Entrez Gene ID:7248)、TSC2(Entrez Gene ID:7249)、TSHR(Entrez Gene ID:7253)、TTL(Entrez Gene ID:150465)、U2AF1(Entrez Gene ID:7307)、USP6(Entrez Gene ID:9098)、VHL(Entrez GeneID:7428)、WAS(Entrez Gene ID:7454)、WHSC1(Entrez Gene ID:7468)、WHSC1L1(EntrezGene ID:54904)、WIF1(Entrez Gene ID:11197)、WRN(Entrez Gene ID:7486)、WT1(EntrezGene ID:7490)、WTX(Entrez Gene ID:139285)、XPA(Entrez Gene ID:7507)、XPC(EntrezGene ID:7508)、XPO1(Entrez Gene ID:7514)、YWHAE(Entrez Gene ID:7531)、ZNF145(Entrez Gene ID:7704)、ZNF198(Entrez Gene ID:7750)、ZNF278(Entrez Gene ID:23598)、ZNF331(Entrez Gene ID:55422)、ZNF384(Entrez Gene ID:171017)、ZNF521(Entrez Gene ID:25925)、ZNF9(Entrez Gene ID:7555)、and ZRSR2(Entrez Gene ID:8233)。
在该实施例中,考虑到该些癌症热点基因的该参考序列的终端区域(terminalregions;即起始的60bp和最后的60bp)仅会被一探针所涵盖,相比之下该参考序列的非终端区域在探针重迭序列为2X重迭密度的前提下则会被二个探针所涵盖,如此该仅被一探针涵盖的终端区域的捕捉效率将较低。该癌症热点基因的参考序列可以延展超过该参考序列的两端,例如:CTNNB1基因的外显子3(exon 3)的长度为228bp,若从两端延展75bp则会得到一条378bp长的CTNNB1基因外显子3参考序列(SEQ ID NO.33)。其他癌症热点基因的参考序列也可以类似方式设计。另外,若一外显子延展出的序列和一相邻外显子延展出的序列重迭,该二条经延展的参考序列也可汇整为一条能涵盖所有外显子和所有延展序列的单一条参考序列。
该癌症热点基因靶向探针的可能数量可使用前述的公式1进行计算。例如针对一条长度为378bp的CTNNB1外显子3(exon 3)参考序列(SEQ IDNO.33),在探针序列长度介于50至120bp之间的前提下,总共可有20,874种探针设计。同样的,针对一条长度为673bp的TERT启动子(promoter)的参考序列(SEQ ID NO.34),在探针序列长度介于50至120bp之间的前提下,总共可有41,819种探针设计。针对一条长度为779bp的TP53外显子2/3/4(exons2/3/4)的参考序列(SEQ ID NO.35),在探针序列长度介于50至120bp之间的前提下,总共可有49,345种探针设计。针对一条长度为528bp的TP53外显子5/6(exon 5/6)的参考序列(SEQID NO.36),在探针序列长度介于50至120bp之间的前提下,总共可有31,524种探针设计。针对一条长度为260bp的TP53外显子7(exon 7)的参考序列(SEQ ID NO.37),在探针序列长度介于50至120bp之间的前提下,总共可有12,496种探针设计。针对一条长度为453bp的TP53外显子8/9(exon 8)的参考序列(SEQ ID NO.39),在探针序列长度介于50至120bp之间的前提下,总共可有26,199种探针设计。针对一条长度为257bp的TP53外显子10(exon 10)的参考序列(SEQ ID NO.40),在探针序列长度介于50至120bp之间的前提下,总共可有12,283种探针设计。针对一条长度为232bp的TP53外显子11(exon 11)的参考序列(SEQ ID NO.41),在探针序列长度介于50至120bp之间的前提下,总共可有10,508种探针设计。
根据本发明的一实施例,该探针组合更进一步包括一组或多组外源性基因(exogenous gene)靶向探针,以做为定量和阴性对照组。当每一组该外源性基因靶向探针依该外源性基因序列排列对齐时,已对齐的该些外源性基因靶向探针于对齐后所组成的一整体序列和一外源性基因的一参考序列互相匹配。在该些已对齐的多组外源性基因靶向探针中,每一个该外源性基因靶向探针序列的一部分和相邻的一个或二个外源性基因靶向探针序列的一部分相重迭。该些重迭序列的长度可为但不限于50%(即为2X重迭密度)或75%(即为4X重迭密度)。
该些外源性基因的参考序列可由NCBI基因数据库中取得。该外源性基因可源自λ噬菌体(lambda phage)、大肠杆菌(E.coli)、酵母菌、病毒或其他常见微生物。该外源性基因靶向探针的可能数量可使用前述的公式1进行计算。例如针对长度为48,502bp的λ噬菌体基因组的参考序列(GenBank Accession No.NC_001416),在探针序列长度介于50至120bp之间的前提下,总共可有478,682种探针设计。
该实施例将需要额外加入一来自外部的核苷酸片段(如spike-in DNA)且其序列需相对应于该外源性基因靶向探针。亦即,无论在受HBV感染或罹患肝细胞癌的情况下,人类基因组都不会含有类似于该外源性基因靶向探针的序列,所以若在以该实施例检测癌症的过程之中没有额外加入与该外源性基因靶向探针相对应的核苷酸片段,则该外源性基因靶向探针理论上无法于基因组DNA或循环系统中的肿瘤DNA之中捕捉到任何核苷酸片段。另一方面,因为理论上能被该外源性基因靶向探针所捕捉的所有核苷酸片段都是额外加入的核苷酸片段,在该实施例检测癌症的过程中也可以另外加入核苷酸片段,更可以调整该另外加入的核苷酸片段的数量或性质,以确保绝对定量的结果可靠。
在一实施例中,可挑选4个120bp长且位于λ噬菌体基因组中的序列,设计以λ噬菌体基因组靶向探针。挑选的标准包括:a)所选择的序列和人类基因组或HBV基因组没有同源性(homology);b)所选择的序列在整个λ噬菌体基因组中是独特的序列;c)所选择的序列的GC碱基含量在一定范围之内;d)不是长的单体碱基(monomer)序列,例如:AAAAA;和/或e)在primer 3、netprimer或其他引子设计算法的推算结果中,其DNA序列不容易形成二级结构。如表1所示,该些HBV全基因组靶向探针、该些HBV局部基因组靶向探针、该些热点基因靶向探针,和该些外源性基因靶向探针的组合可用于捕捉特定HBV DNA片段,无论该特定HBVDNA片段是否具备病毒-宿主嵌合点。
表1
在表2所示的另一实施例中,可以设计额外的λ噬菌体靶向探针组,以涵盖由前述的4个120bp区域(SEQ ID NOs.46-49)的下游所延展出的序列,并且该些探针具有2X或4X重迭密度.另外,λ噬菌体靶向探针组(或探针套数)也可用于模拟2套(2N)HBV靶向探针(其中一套探针的靶向为基因型B型,另一套探针的靶向为基因型C型)和1套(1N)热点基因靶向探针组,因此可产生一组2X/1N、2X/2N、4X/1N和4X/2N的λ噬菌体的基因组所延展出的序列靶向探针组。
表2
另外,目前已知序列中的GC碱基会影响定序所涵盖的范围,约在GC碱基比率低(GC=0.3,定序涵盖范围=0.6X)的样本、GC碱基比率最佳(GC=0.48,定序涵盖范围=1.3X)的样本和GC碱基比率高(GC=0.7,定序涵盖范围=0.4X)的样本之中造成定序涵盖范围约3倍的不同。因此,如表2所述,额外的λ噬菌体靶向探针组也可设计做为探针中GC碱基的内部控制机制。在λ噬菌体基因组中5个120对碱基长的序列(SED ID NOs.50-54)是依照下列的标准而被选择做为参考序列:a)所选择的序列和人类基因组或HBV基因组没有同源性;b)所选择的序列在整个λ噬菌体中是独特的序列;c)所选择的序列的GC碱基含量在一定范围之内;d)不是长的单体碱基序列,例如:AAAAA;和/或e)在primer 3、netprimer或其他引子设计算法的推测结果中,其DNA序列不容易形成二级结构。此5个长度为120bp、GC碱基含量分别为0.3、0.4、0.5、0.6和0.68的区域被选定为参考序列,用以设计5组额外的λ噬菌体靶向探针(1X/1N)。
根据本发明的一实施例,该探针组合更进一步包括一组或多组内源性基因(endogenous gene)靶向探针,以做为相对定量和阳性对照组。当每一组该内源性基因靶向探针依该内源性基因序列排列对齐时,已对齐的该些内源性基因靶向探针于对齐后所组成的一整体序列和一内源性基因的一参考序列互相匹配。在该些已对齐的多组内源性基因靶向探针中,每一个该内源性基因靶向探针序列的一部分和相邻的一个或二个内源性基因靶向探针序列的一部分相重迭。该些重迭序列的长度可为但不限于50%(即为2X重迭密度)或75%(即为4X重迭密度)。
该些内源性基因的参考序列可由NCBI基因数据库中取得。在该实施例中,该内源性基因源于人类基因组内,且可由NCBI基因数据库(www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=gene,以下并以该数据库中的“Entrez Gene ID”表示)取得。该些内源性基因可包括但不限于以下至少一种基因:GAPDH(glyceraldehyde-3-phosphatedehydrogenase;Entrez Gene ID:2597)、UBL4A(ubiquitin like 4A;GdX;Entrez GeneID:8266)、HPRT1(Entrez Gene ID:3251)、TBP(Entrez Gene ID:6908)、B2M(Entrez GeneID:567)、RPL13A(Entrez Gene ID:23521)、RN18S1(Entrez Gene ID:100008588)、C1orf43(Entrez Gene ID:25912)、CHMP2A(Entrez Gene ID:27243)、EMC7(Entrez Gene ID:56851)、GPI(Entrez Gene ID:2821)、PSMB2(Entrez Gene ID:5690)、PSMB4(Entrez GeneID:5692)、RAB7A(Entrez Gene ID:7879)、REEP5(Entrez Gene ID:7905)、SNRPD3(EntrezGene ID:6634)、VCP(Entrez Gene ID:7415)、VPS29(Entrez Gene ID:51699)、ACTB(Entrez Gene ID:60)、PPIA(Entrez Gene ID:5478)、GUSB(Entrez Gene ID:2990)、HSP90AB1(Entrez Gene ID:3326)、RPLP0(Entrez Gene ID:6175)、TFRC(Entrez Gene ID:7037)、UBC(Entrez Gene ID:7316)。
该内源性基因靶向探针的可能数量可使用前述的公式1进行计算。例如针对长度为1,682bp的GAPDH基因的参考序列,在探针序列长度介于50至120bp之间的前提下,总共可有113,458种探针设计。同样的,针对长度为3,583bp的GdX基因的参考序列,在探针序列长度介于50至120bp之间的前提下,总共可有248,429种探针设计。
在该实施例中,该些内源性基因是用来增加检测序列的可靠度;也就是说,该些内源性基因可以做为稳定表现且在肿瘤中表现量不会变化的一般性持家基因(housekeepinggene)。由于癌症热点基因的结构变异;如CTNNB、TP53、TERT和其他前述与癌症有关的基因已被发现出现在肿瘤样本中,且上述与癌症有关的基因的套数(copy number)在肿瘤形成(tumorgenesis)之中可能由于基因缺失(deletion)、复制(duplication)或其他结构上的变异而有所改变,因此仅根据癌症热点基因进行定量可能并不可靠。在表2所述的实施例中有二组探针被纳入探针组合中作为内部控制组:一组以GAPDH基因(SEQ ID NO.55)上240bp长的区域做为靶向、重迭密度为2X的探针和一组以GdX基因(SEQ ID NO.56)上240bp长的区域做为靶向、重迭密度为2X的探针。此二个240bp长、分别位于GdX基因和GAPDH基因上的靶向序列皆不具备以下特征:和HBV基因组的同源性、长的单体碱基序列、明显的DNA二级结构或超出一定范围的GC碱基含量。使用GdX基因做为参考序列的另一优点是,GdX基因也可以用来辨识检测对象的性别。
在本发明的部分实施例中,每一个该些探针都以一标记分子标记,以做为检测和定量。该些标记分子可包括但不限于:生物素(biotin)、荧光蛋白(fluorescent protein)、冷光蛋白(luminescent protein)、抗体、放射性化合物或其组合。
本发明的另一方面也提供了一检测DNA病毒感染(如:HBV、人类乳突病毒、艾司坦-巴尔病毒、第8型疱疹病毒、人类嗜T淋巴球病毒、Merkel氏多瘤病毒或其他DNA病毒)或检测和病毒感染有关的癌症(如:肝细胞肝癌、子宫颈癌、鼻咽癌、淋巴癌、Merkel氏细胞癌或其他和DNA病毒感染有关的癌症)的方法。在一实施例中,该方法包括以下步骤:由一对象的一样本萃取核酸;增幅该核酸;将该核酸和各实施例中所提及的该探针组合进行杂交以捕捉靶向核酸片段;定序该些被捕获的靶向核酸片段;且分析该些被捕获的靶向核酸片段。
在该实施例中,该核酸可包括病毒核酸、宿主的基因组核酸和具有病毒-宿主嵌合点的核酸,且可为DNA、RNA或其他聚核苷酸(polynucleotides)。萃取该些核酸的方法可为沈淀法、色层分析法(chromatography)和/或磁珠捕捉分析法。该用来萃取核酸的样本可为生物性液体(如:血液、汗液、唾液、泪液、尿液、淋巴液或组织间液(interstitial fluid))或组织(如:肝组织)。可使用DNA选殖(DNA cloning)、聚合酶链锁反应(polymerase chainreaction;PCR)、反转录酶-聚合酶连锁反应(reverse transcription PCR;RT-PCR)、巢式PCR(nested-PCR)、定量PCR(qPCR)和/或数位式PCR(digital PCR)增幅该些被萃取出的核酸。该靶向核酸片段可被该探针组合以杂交的方式捕捉(如:南方墨点转渍(Southernblot)杂交法、原位杂交法(in-situ hybridization)或北方墨点转渍(Northern blog)杂交法)和/或被锁定在特定位置(如:和微粒有关的捕捉法或和芯片有关的捕捉法)。该被捕捉的靶向核酸片段以下一代定序技术执行定序(如:大量平行定序(massively parallelsequencing)、单分子定序(singlemolecule sequencing)或NanoString定序)、马克萨姆-吉尔伯特定序法(Maxam-Gilbert sequencing)、桑格氏定序法(Sanger seuqencing)、焦磷酸根定序法(pyrosequencing)和/或DNA微数组(DNA microarray)。
在另一实施例中,该增幅步骤和该杂交步骤可互相调换。即根据本发明的另一实施例的方法包括以下步骤:由一对象的一样本萃取核酸;将该核酸和各实施例中所提及的该探针组合进行杂交以捕捉靶向核酸片段;增幅该核酸;定序该些靶向核酸片段;且分析该些靶向核酸片段。
分析和定量被该探针组合靶向核酸可依以下方式执行:原始读值(Rawreads;RR)直接由该下一代定序仪器所产生。该些原始读值中的低质量读值被排除以取得高质量读值(high quality reads;HQR)。该些高质量读值再压缩为特别读值(unique reads;UR);换句话说,具有一模一样序列的高质量读值被压缩为一单一特别读值,同时和其套数或冗余性(redundancy)有关的信息也被保留下来。最后,该些具有低冗余性的特别读值进一步被排除,保留下高冗余性特别读值(high redundancy unique reads;HRUR)。再利用压缩时被保留下来的冗余性信息,可再计算出高冗余性特别读值的读值总数(RiHRUR)。
在一实施例中,该用来分析该下一代定序数据的生物信息分析方法汇总于表3中。
/>
表3
表3同时也比较该较佳实施例中的方法和Zhao所提到的方法。如表3中所示,两者之间主要不同处包括:Zhao合并位置相近的嵌合点,而本实施例的方法则是基于序列之间的相似度而合并嵌合点。同时,Zhao会移除重复计算的读值,且仅考虑特别嵌合点(uniquejunction);而本实施例的方法则是排除冗余性小于5的读值,保留冗余性信息,且对嵌合点的定量是基于单一特别嵌合点的总数。
验证探针的特异性。
基于本发明的一实施例,设计TP53外显子2-11(SEQ ID NOs 35-38,40-41)靶向探针,该探针和一肝细胞癌病人的肝细胞肿瘤基因组DNA、非肿瘤基因组DNA和循环系统中的肿瘤DNA进行杂交,且该杂交结果以定量PCR进行定量。在脊椎动物中普遍存在且在肝中表现量高的Micro RNA miR-122也被定量以做为阴性对照组。
表4
如上表4中所述,在三种不同样本中,TP53较miR-122具有显著较高的杂交后留存率,这代表TP53靶向的探针和TP53成功杂交、捕捉且回收。相反地,miR-122因为缺乏与TP53靶向探针的特异性,所以会被洗去。表4同时也显示了在基因组DNA中被TP53靶向的探针所捕捉的TP53的量为miR-122量的250倍,且由循环系统中的肿瘤DNA捕捉的TP53的量为miR-122量的10倍。上述结果显示了TP53靶向的探针具有序列特异性且能够选择性地在DNA样本中捕捉TP53基因片段。
同时,如表5中所示,以表1中所列出的探针增幅共26组肝细胞肿瘤基因组DNA样本,且以下一代定序技术执行定序以分析HBV基因组、HBV-人的嵌合点(以下以“嵌合点”表示)和癌症热点基因(包括CTNNB1、TERT和TP53)是否存在。该HBV-人的嵌合点代表着HBV嵌入人类基因组。表5中的该宿主基因组序列比率(host genome ratio)为被捕捉到的序列和人类基因组的序列的序列长度比率。如表5中所示,该宿主基因组序列长度比率和该已观测的下一代定序读值比率在样本之间有显著的不同,此代表着该HBV基因组、癌症热点基因和HBV-人嵌合点皆被该探针组合成功地增幅。
表5
由于单一的嵌合点估计会有150bp长的检测范围,因而可估算宿主基因组中的嵌合点长度(junction length)为3kb。因此,单一嵌入事件会形成二个嵌合点,可以300bp长的嵌合点区(junction region)表示。若大致估计每一位病人有10个可检测的嵌合点,则一位个别病人的估计嵌合点长度则应在3kb(即300bp x 10)。该嵌入的HBV长度(排除未嵌入的自由态HBV)就可被估计为32.15kb(即为3,215kb x 10)。此处所述的在人类基因组中该嵌合点和该HBV的比率,为非常粗略且高估的估计值,因此可能会造成低估该嵌合点和该HBV的增幅效率。
如图3所示,基于本发明的一实施例,嵌合点靶向的探针能够选择性地捕捉具有特定病毒-宿主嵌合点的DNA片段。三位肝细胞癌病人(由“pt3”、“pt11”和“pt15”表示)由肿瘤中取得的肝细胞癌的基因组DNA样本(以“T”表示)和由非肿瘤组织取得的DNA样本(以“N”表示)皆和探针1(以“pt3junction”表示)及探针2(以“pt11junction”表示)进行杂交。该探针1和该探针2皆分别根据pt3和pt11中的HBV-人嵌合点的序列而进行设计。图3中的聚合酶链锁反应(Polymerase Chain Reaction)实验结果代表该探针1选择性地和pt3的肿瘤基因组DNA杂交且该探针2选择性地和pt11的肿瘤基因组DNA杂交。“NTC”代表“无样本对照组”且做为此实验的阴性对照组,而“PBGD”(即紫质胆素原去胺酶基因(porphobilinogendeaminase gene))和miR-122做为阳性对照组。
见图4A和图4B,该探针1(以“pt3junction”表示)被用来检测在病人pt3的基因组DNA和血清DNA中是否存在HBV-人嵌合点。如图4A所示,可观察到一病人pt3特有的HBV-人嵌合点存在于病人pt3的肿瘤基因组DNA、术前血清DNA(pre-OP serum DNA)和术后血清DNA(post-OP serum DNA)之中。上述病人pt3特有的嵌合点并没有在病人pt11和非肝细胞癌但为HBV阳性病人(non-HCC HBV positive,以“Normal”表示)的样本中被观察到。同样地,如图4B中所示,当探针2(以“pt11junction”表示)被用来检测在病人pt11的基因组DNA和血清DNA中是否存在HBV-人嵌合点,一病人pt11特有的HBV-人嵌合点存在于病人pt11的肿瘤基因组DNA、术前血清DNA和术后血清DNA之中。上述病人pt11特有的嵌合点并没有在病人pt15和非肝细胞癌但为HBV阳性病人(以“Normal”表示)的样本中被观察到。
确认探针的捕捉效率。
表2中的该探针组合被用来分析一对肿瘤基因组DNA和血浆内循环系统中的肿瘤DNA(plasma ctDNA)样本(上述DNA样本皆由同一位肝细胞癌病人取得),以决定该探针组合在不同种样本中的捕捉效率。如表6中下一代定序统计信息所示,肿瘤基因组DNA的读值在HBV全基因组、HBV局部基因组和HBV-人嵌合点中,高于血浆内循环系统中的肿瘤DNA;该探针组合在肿瘤基因组DNA样本中展现出高捕捉效率。另外、在肿瘤基因组DNA中被辨识的10个嵌合点中的8个嵌合点具有显著且大量的读值(>947),这代表了嵌合点取得率(junctionrecovery rate)为75%。
/>
表6
图5A和图5B为热点图转换成的直方图,该直方图显示了被下一代定序技术预测到且被探针捕捉到的读值的比率。同时,图6显示了以同样的该探针组合(表2中的探针组合)与另一肝细胞癌病人的肿瘤基因组DNA样本杂交并执行下一代定序分析的分析结果。
请见图7,该探针组合除了有检测HBV DNA和HBV嵌入人基因组的功能外,本发明中的该探针组合也能够检测和基因突变有关的癌症。如图8中所示,由下一代定序技术分析被基因型B型的HBV感染的男性和女性肝细胞癌病人的DNA样本,可得到在不同病人中有不同类型的HBV-人嵌合点,且不同的嵌合点也具有不同的读值:在TERT和MLL4区中具有特别的嵌合点(以“TERT/MLL4integration”表示),且有数个已知的癌症热点突变位于CTNNB1基因的外显子3的TERT启动子中(以“TERT/CTNNB1mutations”表示)。
优点与益处。
根据本发明中的实施例所提出的该探针组合和分析方法较先前技艺展现了明显更佳的敏感度和效率。如表7所示,和Li等人的分析法的比较中,可以得到被本发明中的较佳实施例的该探针组合捕捉到的该核酸片段具有显著较高HBV比率、较高的嵌合点读值和较低的人类基因组读值。
表7
另外,根据本揭露中的实施例的生物信息分析方法,分析先前Zhao的下一代定序结果,也可以得知Zhao的分析结果中有97.5%的读值来自于人类基因组,仅有1.49%来自于HBV基因组,1.43%来自于局部HBV基因组和1%来自于嵌合点,再次证明了目前已知的捕捉HBV的探针在增幅HBV片段和HBV-嵌合点上的效率并不好。再者,Zhao的研究中仅提及辨识出157个嵌合点,然而以本发明实施例中所使用的生物信息分析方法,分析与Zhao研究中相同一组下一代定序原始资料,则可揭露出469个嵌合点。其中,将近80%由Zhao所揭露的嵌合点亦出现在这469个嵌合点中。这些结果展现出本发明中的实施例的生物信息分析方法在检测病毒嵌入事件中具高敏感度,且较先前技艺能够辨识显著地较多的病毒-宿主嵌合点。
再者,和Jiang和Sung所提出的直接定序法相比,本发明中的实施例所提出的该探针组合和分析方法仅在典型的下一代定序结果中产生5百万个150bp长的读值(较Jiang的分析结果少了80%读值,或少了60%总核酸量);然而本发明的实施例仍能够在5百万个读值之中辨识出307,101个HBV读值和69,198个嵌合点读值。上述结果展现了本发明中的实施例不仅对病毒嵌入事件敏感且效率高。
本发明的诸多前述实施例提供了一有力且多功能的分析工具,以检测病毒感染和病毒感染所引起的癌症。本发明中的实施例可用来检测各种不同DNA病毒和病毒嵌入事件。该根据实施例所设计的探针组合可确保最适病毒/宿主序列涵盖率,且也考虑到基因稳定性,并因此而展现了高敏感度、效率和可靠度。
先前的描述仅是本公开的实施例,并不旨在限制本公开的范围。根据本公开的权利要求和说明书做出的许多变化和修改仍然在本发明公开的的范围内。另外,每个实施例和权利要求不必实现所公开的所有优点或特征。此外,摘要和标题仅用于便于搜索专利文献,并不旨在以任何方式限制所要求保护的公开的范围。
序列表
<110> 泰宗生物科技股份有限公司.
<120> 检测癌症的探针组合
<150> US 62/456,087
<151> 2017-02-07
<160> 56
<170> SIPOSequenceListing 1.0
<210> 1
<211> 3191
<212> DNA
<213> Hepatitis B virus
<400> 1
ctccaccact ttccaccaaa ctcttcaaga tcccagagtc agggccctgt actttcctgc 60
tggtggctcc agttcaggaa cagtgagccc tgctcagaat actgtctctg ccatatcgtc 120
aatcttatcg aagactgggg accctgtacc gaacatggag aacatcgcat caggactcct 180
aggacccctg ctcgtgttac aggcggggtt tttcttgttg acaaaaatcc tcacaatacc 240
acagagtcta gactcgtggt ggacttctct caattttcta gggggaacac ccgtgtgtct 300
tggccaaaat tcgcagtccc aaatctccag tcactcacca acctgttgtc ctccaatttg 360
tcctggttat cgctggatgt gtctgcggcg ttttatcatc ttcctctgca tcctgctgct 420
atgcctcatc ttcttgttgg ttcttctgga ctatcaaggt atgttgcccg tttgtcctct 480
aattccagga tcatcaacaa ccagcaccgg accatgcaaa acctgcacaa ctcctgctca 540
aggaacctct atgtttccct catgttgctg tacaaaacct acggacggaa actgcacctg 600
tattcccatc ccatcatctt gggctttcgc aaaataccta tgggagtggg cctcagtccg 660
tttctcttgg ctcagtttac tagtgccatt tgttcagtgg ttcgtagggc tttcccccac 720
tgtctggctt tcagttatat ggatgatgtg gtattggggg ccaagtctgt acaacatctt 780
gagtcccttt atgccgctgt taccaatttt cttttgtctt tgggtataca tttaaaccct 840
cacaaaacaa aaagatgggg atattccctt aacttcatgg gatatgtaat tgggagttgg 900
ggcacattgc cacaggaaca tattgtacaa aaaatcaaaa tgtgttttag gaaacttcct 960
gtaaacaggc ctattgattg gaaagtatgt caacgaattg tgggtctttt ggggtttgcc 1020
gcccctttca cgcaatgtgg atatcctgct ttaatgcctt tatatgcatg tatacaagca 1080
aaacaggctt ttactttctc gccaacttac aaggcctttc taagtaaaca gtatctgaac 1140
ctttaccccg ttgctcggca acggcctggt ctgtgccaag tgtttgctga cgcaaccccc 1200
actggttggg gcttggccat aggccatcag cgcatgcgtg gaacctttgt gtctcctctg 1260
ccgatccata ctgcggaact cctagccgct tgttttgctc gcagcaggtc tggagcaaaa 1320
ctcatcggga ctgacaattc tgtcgtgctc tcccgcaagt atacatcatt tccatggctg 1380
ctaggctgtg ctgccaactg gatcctgcgc gggacgtcct ttgtttacgt cccgtcggcg 1440
ctgaatcccg cggacgaccc ctcccggggc cgcttggggc tctaccgccc gcttctccgc 1500
ctgttgtacc gaccgaccac ggggcgcacc tctctttacg cggactcccc gtctgtgcct 1560
tctcatctgc cggaccgtgt gcacttcgct tcacctctgc acgtcgcatg gagaccaccg 1620
tgaacgccca ccggaacctg cccaaggtct tgcataagag gactcttgga ctttcagcaa 1680
tgtcaacgac cgaccttgag gcatacttca aagactgtgt gtttactgag tgggaggagt 1740
tgggggagga gattaggtta aaggtctttg tactaggagg ctgtaggcat aaattggtgt 1800
gttcaccagc accatgcaac tttttcacct ctgcctaatc atctcatgtt catgtcctac 1860
tgttcaagcc tccaagctgt gccttgggtg gctttggggc atggacattg acccgtataa 1920
agaatttgga gcttctgtgg agttactctc ttttttgcct tctgacttct ttccttctat 1980
tcgagatctc ctcgacaccg cctctgctct gtatcgggag gccttagagt ctccggaaca 2040
ttgttcacct caccatacgg cactcaggca agctattctg tgttggggtg agttaatgaa 2100
tctagccacc tgggtgggaa gtaatttgga agatccagca tccagggaat tagtagtcag 2160
ctatgtcaac gttaatatgg gcctaaaaat cagacaacta ttgtggtttc acatttcctg 2220
tcttactttt ggaagagaaa ctgttcttga atatttggtg tcttttggag tgtggattcg 2280
cactcctcct gcatatagac caccaaatgc ccctatctta tcaacacttc cggaaactac 2340
tgttgttaga cgaagaggca ggtcccctag aagaagaact ccctcgcctc gcagacgaag 2400
gtctcaatcg ccgcgtcgca gaagatctca atctcgggaa tctcaatgtt agtattcctt 2460
ggacacataa ggtgggaaac tttacggggc tttattcttc tacggtacct tgctttaatc 2520
ctaaatggca aactccttct tttcctgaca ttcatttgca ggaggacatt gttgatagat 2580
gtaagcaatt tgtggggccc cttacagtaa atgaaaacag gagactaaaa ttaattatgc 2640
ctgctaggtt ttatcccaat gttactaaat atttgccctt agataaaggg atcaaacctt 2700
attatccaga gcatgtagtt aatcattact tccagacgag acattattta cacactcttt 2760
ggaaggcggg tatcttatat aaaagagagt ccacacgtag cgcctcattt tgcgggtcac 2820
catattcttg ggaacaagat ctacagcatg ggaggttggt cttccaaacc tcgaaaaggc 2880
atggggacaa atctttctgt ccccaatccc ctgggattct tccccgatca tcagttggac 2940
cctgcattca aagccaactc agaaaatcca gattgggacc tcaacccgca caaggacaac 3000
tggccggacg ccaacaaggt gggagtggga gcattcgggc cagggttcac ccctccccat 3060
gggggactgt tggggtggag ccctcaggct cagggcatac tcacaactgt gccagcagct 3120
cctcctcctg cctccaccaa tcggcagtca ggaaggcagc ctactccctt atctccacct 3180
ctaagggaca c 3191
<210> 2
<211> 3191
<212> DNA
<213> Hepatitis B virus
<400> 2
ctccacaaca ttccaccaag ctctgctaga tcccagagtg aggggcctat actttcctgc 60
tggtggctcc agttccggaa cagtaaaccc tgttccgact actgcctcac ccatatcgtc 120
aatcttctcg aggactgggg accctgcacc gaacatggag aacacaacat caggattcct 180
aggacccctg ctcgtgttac aggcggggtt tttcttgttg acaagaatcc tcacaatacc 240
acagagtcta gactcgtggt ggacttctct caattttcta gggggagcac ccacgtgtcc 300
tggccaaaat tcgcagtccc caacctccaa tcactcacca acctcttgtc ctccaatttg 360
tcctggctat cgctggatgt gtctgcggcg ttttatcata ttcctcttca tcctgctgct 420
atgcctcatc ttcttgttgg ttcttctgga ctaccaaggt atgttgcccg tttgtcctct 480
acttccagga acatcaacta ccagcacggg accatgcaag acctgcacga ttcctgctca 540
aggaacctct atgtttccct cttgttgctg tacaaaacct tcggacggaa actgcacttg 600
tattcccatc ccatcatcct gggctttcgc aagattccta tgggagtggg cctcagtccg 660
tttctcctgg ctcagtttac tagtgccatt tgttcagtgg ttcgtagggc tttcccccac 720
tgtttggctt tcagttatat ggatgatgtg gtattggggg ccaagtctgt acaacatctt 780
gagtcccttt ttacctctat taccaatttt cttttgtctt tgggtataca tttgaaccct 840
aataaaacca aacgttgggg ctactccctt aacttcatgg gatatgtaat tggaagttgg 900
ggtactttac cacaggaaca tattgtacta aaaatcaagc aatgttttcg aaaactgcct 960
gtaaatagac ctattgattg gaaagtatgt caaagaattg tgggtctttt gggctttgct 1020
gcccctttta cacaatgtgg ctatcctgcc ttaatgcctt tatatgcatg tatacaatct 1080
aagcaggctt tcactttctc gccaacttac aaggcctttc tgtgtaaaca atatctgaac 1140
ctttaccccg ttgcccggca acggtcaggt ctctgccaag tgtttgctga cgcaaccccc 1200
actggatggg gcttggccat aggccatcgg cgcatgcgtg gaacctttgt ggctcctctg 1260
ccgatccata ctgcggaact cctagcagct tgttttgctc gcagccggtc tggagcgaaa 1320
cttatcggca ccgacaactc tgttgtcctc tctcggaaat acacctcctt tccatggctg 1380
ctagggtgtg ctgccaactg gatcctgcgc gggacgtcct ttgtctacgt cccgtcggcg 1440
ctgaatcccg cggacgaccc gtctcggggc cgtttgggac tctaccgtcc ccttcttcat 1500
ctgccgttcc ggccgaccac ggggcgcacc tctctttacg cggtctcccc gtctgtgcct 1560
tctcatctgc cggaccgtgt gcacttcgct tcacctctgc acgtcgcatg gagaccaccg 1620
tgaacgccca ccaggtcttg cccaaggtct tacataagag gactcttgga ctctcagcaa 1680
tgtcaacgac cgaccttgag gcatacttca aagactgttt gtttaaagac tgggaggagt 1740
tgggggagga gattaggtta atgatctttg tactaggagg ctgtaggcat aaattggtct 1800
gttcaccagc accatgcaac tttttcacct ctgcctaatc atctcatgtt catgtcctac 1860
tgttcaagcc tccaagctgt gccttgggtg gctttggggc atggacattg acccgtataa 1920
agaatttgga gcttctgtgg agttactctc ttttttgcct tctgacttct ttccttctat 1980
tcgagatctc ctcgacaccg cctctgctct gtatcgggag gccttagagt ctccggaaca 2040
ttgttcacct caccatacag cactcaggca agctattctg tgttggggtg agttgatgaa 2100
tctggccacc tgggtgggaa gtaatttgga agacccagca tccagggaat tagtagtcag 2160
ctatgtcaat gttaatatgg gcctaaaaat cagacaacta ttgtggtttc acatttcctg 2220
tcttactttt ggaagagaaa ctgttcttga gtatttggtg tcttttggag tgtggattcg 2280
cactcctccc gcttacagac caccaaatgc ccctatctta tcaacacttc cggaaactac 2340
tgttgttaga cgacgaggca ggtcccctag aagaagaact ccctcgcctc gcagacgaag 2400
gtctcaatcg ccgcgtcgca gaagatctca atctcgggaa tctcaatgtt agtatccctt 2460
ggactcataa ggtgggaaac tttactgggc tttattcttc tactgtacct gtctttaatc 2520
ctgagtggca aactccctcc tttcctcaca ttcatttaca ggaggacatt attaatagat 2580
gtcaacaata tgtgggccct cttacagtta atgaaaaaag gagattaaaa ttaattatgc 2640
ctgctaggtt ctatcctaac cttaccaaat atttgccctt ggataaaggc attaaacctt 2700
attatcctga acatgcagtt aatcattact tcaaaactag gcattattta catactctgt 2760
ggaaggctgg cattctatat aagagagaaa ctacacgcag cgcctcattt tgtgggtcac 2820
catattcttg ggaacaagag ctacagcatg ggaggttggt cttccaaacc tcgacaaggc 2880
atggggacga atctttctgt tcccaatcct ctgggattct ttcccgatca ccagttggac 2940
cctgcgttcg gagccaactc aaacaatcca gattgggact tcaaccccaa caaggatcac 3000
tggccagagg caaatcaggt aggagcggga gcattcgggc cagggttcac cccaccacac 3060
ggcggtcttt tggggtggag ccctcaggct cagggcatat tgacaacagt gccagcagca 3120
cctcctcctg cctccaccaa tcggcagtca ggaagacagc ctactcccat ctctccacct 3180
ctaagagaaa g 3191
<210> 3
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 3
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct 60
tgttttgctc gcagccggtc tggagcaaag ctcatcggaa ctgacaattc tgtcgtcctc 120
tcgcggaaat atacatcgtt tccatggctg ctaggctgtg ctgccaactg gatccttcgc 180
ggaacgtcct ttgtctacgt cccgtcggcg ctgaatcccg cggacgaccc ctctcggggc 240
cgcttgggac tctctcgtcc ccttctccgt ctgccgttcc agccgaccac ggggcgcacc 300
tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggtccgtgt gcacttcgct 360
tcacctctgc acgttgcatg gagaccaccg tgaacgccca tcagatcctg cccaaggtct 420
tacataagag gactcttgga ctcccagcaa tgtcaacgac cgaccttgag gcctacttca 480
aagactgtgt gtttaaggac tgggaggagc tgggggagga gattaggtta aaggtctttg 540
tattaggagg ctgtaggcat aaattggtct gcgcaccagc accatgcaac tttttcacct 600
ctgcctaatc atctcttgta catgtcccac tgttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacattg acccttataa agaatttgga gctactgtgg agttactctc 720
gtttttgcct tctgacttct ttccttccgt cagagatctc ctagacaccg cctcagctct 780
gtatcgagaa gccttagagt ctcctgagca ttgctcacct caccatactg cactcaggca 840
agccattctc tgctgggggg aattgatgac tctagctacc tgggtgggta ataatttgga 900
agatccagca tccagggatc tagtagtcaa ttatgttaat actaacatgg gtttaaagat 960
<210> 4
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 4
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct 60
tgttttgctc gcagccggtc tggagcaaag ctcatcggaa ctgacaattc tgtcgtcctc 120
tcgcggaaat atacatcgtt tccatggctg ctaggctgta ctgccaactg gatccttcgc 180
gggacgtcct ttgtttacgt cccgtcggcg ctgaatcccg cggacgaccc ctctcggggc 240
cgcttgggac tctctcgtcc ccttctccgt ctgccgttcc agccgaccac ggggcgcacc 300
tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggtccgtgt gcacttcgct 360
tcacctctgc acgttgcatg gagaccaccg tgaacgccca tcagatcctg cccaaggtct 420
tacataagag gactcttgga ctcccagcaa tgtcaacgac cgaccttgag gcctacttca 480
aagactgtgt gtttaaggac tgggaggagc tgggggagga gattaggtta atgatctttg 540
tattaggagg ctgtaggcat aaattggtct gcgcaccagc accatgcaac tttttcacct 600
ctgcctaatc atctcttgta catgtcccac tgttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacattg acccttataa agaatttgga gctactgtgg agttactctc 720
gtttttgcct tctgacttct ttccttccgt cagagatctc ctagacaccg cctcagctct 780
gtatcgagaa gccttagagt ctcctgagca ttgctcacct caccatactg cactcaggca 840
agccattctc tgctgggggg aattgatgac tctagctacc tgggtgggta ataatttgga 900
agatccagca tccagggatc tagtagtcaa ttatgttaat actaacatgg gtttaaagat 960
<210> 5
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 5
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct 60
tgttttgctc gcagccggtc tggagcaaaa ctcatcggga ctgacaattc tgtcgtcctt 120
tctcggaaat atacatcctt cccatggctg ctaggttgta ctgccaactg gattcttcga 180
gggacgtcct ttgtctacgt cccgtcggcg ctgaatcccg cggacgaccc ctcgcgaggt 240
cgcttgggac tctatcgtcc ccttctccgt ctgccgtacc gtccgaccac ggggcgcacc 300
tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggtccgtgt gcacttcgct 360
tcacctctgc acgttgcatg gagaccaccg tgaacgccca tcagatcctg cccaaggtct 420
tatataagag gactcttgga ctcccagcaa tgtcaacgac cgaccttgag gcctacttca 480
aagactgtgt gtttaaagac tgggaggagt tgggggagga gattaggtta aaggtttatg 540
tattaggagg ctgtaggcat aaattggtct gcgcaccatc atcatgcaac tttttcacct 600
ctgcctaatc atctcttgta catgtcccac ttttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacattg acccttataa agaatttgga gctacagtgg agttactctc 720
gtttttgcct tctgacttct ttccttccgt ccgggatcta ctagatacag cctcagctct 780
gtatcgggaa gcattagagt ctcctgagca ttgctcacct caccatacag cactcaggca 840
agccattctc tgctgggggg atgtactgga tctatctacc tgggtgggtg ctaatttgca 900
agatccagca tccagggatc tagtagtcaa ttatgttaat actaacatgg gcctaaagtt 960
<210> 6
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 6
cgcatgcgtg gaacctttgt gtctcctctg ccgatccata ctgcggaact cctagccgct 60
tgttttgctc gcagcaggtc tggggcaaaa ctcatcggga ctgacaattc tgtcgtgctc 120
tcccgcaagt atacatcgtt cccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtttacgt cccgtcggcg ctgaatcccg cggacgaccc ctcccggggc 240
cgcttggggc tctaccgccc gcttctccgc ctgttgtacc gtccgaccac ggggcgcacc 300
tctctttacg cggactcccc gtctgtgcct tctcatctrc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccggaacctg cccaaggtct 420
tgcataagag gactcttgga ctttcmgcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgtgt gtttaatgag tgggaggagt tgggggagga gaktaggtta aaggtctttg 540
tactaggagg ctgtaggcat aaattggtgy gttcaccagc accatgcaac tttttcacct 600
ctgcctaatc atctcatgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttagggc atggacattg acccgtataa agaatttgga gcttctgtgg agttactctc 720
ttttttgcct catgacttct ttccttctat tcgagatctc ctcgacaccg cctctgcttt 780
gtatcgggag gccttagagt ctccggaaca ttgttcacct caccatacgg cactcaggca 840
agctattctg tgttggggtg agttgatgaa tctagccacc tgggtgggaa gtaatttgga 900
agatccagca tccagggaat tagtcgttag ctatgtcaac gttaatatgg gcmtaaaaat 960
<210> 7
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 7
cgcatgcgtg gaacctttgt gtctcctctg ccgatccata ctgcggaact cctagccgct 60
tgttttgctc gcagcaggtc tggagcgaaa ctcatcggga ctgacaattc tgtcgtgctc 120
tcccgcaagt atacatcgtt tccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtttacgt cccgtcggcg ctgaatcccg cggacgaccc ctcccggggc 240
cgcttggggc tctaccgccc gcttctccgt ctgccgtacc gaccgaccac ggggcgcacc 300
tctctttacg cggactcccc gtctgtgcct tctcgtctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gaaaccaccg tgaacgccca ccggaacctg cccaaggtct 420
tgcacaagag gactcttgga ctttcagcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgtgt gtttcatgag tgggaggagc tgggggagga gattaggtta aaggtctttg 540
tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600
ctgcctagtc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttgggac atggacattg acccttataa agaatttgga gctactgtgg agttactctc 720
ttttttgcct tctgacttct ttccgtcggt acgagacctc ctagataccg ctgctgctct 780
gtatcgggaa gccttagaat ctcctgaaca ttgctcacct caccacacag cactcaggca 840
agctattctg tgctgggggg aattaatgac tctagctacc tgggtgggta ataatttaga 900
agatccagcg tccagggatc tagtagtcaa ttatgttaac actaacatgg gcctaaagat 960
<210> 8
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 8
cgcatgcgtg ggacctttgt gtctcctctg ccgatccata ctgcggaact cctagccgct 60
tgttttgctc gcagcaggtc tggagcgaaa cttatcggga ctgacaattc cgttgtcctt 120
tcccgcaaat atacatcgtt tccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtctacgt cccgtcggcg ctgaatcccg cggacgaccc ctcccggggc 240
cgcttggggc tctaccgccc gcttctccgt ctgccgtacc gaccgaccac ggggcgcacc 300
tctctttacg cggactcccc gtctgtgcct tctcgtctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccggaacttg cccaaggtct 420
tgcataagag gactcttgga ctttcagcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgtgt gtttaatgag tgggaggagt tgggggagga gattaggtta aaggtctttg 540
tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600
ctgcctaatc atctcatgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacattg acccgtataa agaatttgga gcttctgtgg agttactctc 720
ttttttgcct tctgacttct ttccttctat tcgagatctt ctcgacaccg cctctgctct 780
gtatcgggag gccttagagt ctccggaaca ttgttcacct caccatacgg cactcaggca 840
agctattctg tgttggggtg agttaatgaa tctagccacc tgggtgggaa gtaatttgga 900
agacccagca tccagggaat tagtagtcag ctatgtcaat gttaatatgg gcctaaaaat 960
<210> 9
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 9
cgcatgcgtg gaacctttgt gtctcctctg ccgatccata ctgcggaact cctagccgct 60
tgttttgctc gcagcaggtc tggagcaaaa ctcatcggga ctgacaattc tgtcgtgctc 120
tcccgcaagt atacatcatt tccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtttacgt cccgtcggcg ctgaatcccg cggacgaccc ctcccggggc 240
cgcttggggc tctaccgccc gcttctccgc ctgttgtacc gaccgaccac ggggcgcacc 300
tctctttacg cggactcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccggaacctg cccaaggtct 420
tgcataagag gactcttgga ctttcagcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgtgt gtttactgag tgggaggagt tgggggagga gattaggtta aaggtctttg 540
tactaggagg ctgtaggcat aaattggtgt gttcaccagc accatgcaac tttttcacct 600
ctgcctaatc atctcatgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacattg acccgtataa agaatttgga gcttctgtgg agttactctc 720
ttttttgcct tctgacttct ttccttctat tcgagatctc ctcgacaccg cctctgctct 780
gtatcgggag gccttagagt ctccggaaca ttgttcacct caccatacgg cactcaggca 840
agctattctg tgttggggtg agttaatgaa tctagccacc tgggtgggaa gtaatttgga 900
agatccagca tccagggaat tagtagtcag ctatgtcaac gttaatatgg gcctaaaaat 960
<210> 10
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 10
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagcagct 60
tgttttgctc gcagccggtc tggagctaaa cttatcggga ctgacaactc tgttgtcctc 120
tcgcggaaat acacctcctt cccatggctg ctcgggtgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtctacgt cccgtcggcg ctgaatcccg cggacgaccc atctcggggc 240
cgtttgggcc tctaccgtcc ccttcttcac ctgccgttcc agccgaccac ggggcgcacc 300
tctctttacg cggactcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccaggtcttg cccaagctct 420
tacataagag gactcttgga ctctcagcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgttt gtttaaagac tgggaggagt tgggggagga gattaggtta aaggtctttg 540
tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcccct 600
ctgcctaatc atctcatgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacattg acccgtataa agaatttgga gcttctgtgg agttactctc 720
ttttttgcct tctgacttct ttccttctat tcgagatctc ctcgataccg cctctgctct 780
gtatcgggag gccttagagt ctccggaaca ttgttcacct caccatacag cactcaggca 840
agctattctg tgttggggtg agttgatgaa tctggccacc tgggtgggaa gtaatttgga 900
agacccagca tccagggaat tagtagtcag ctatgtcaat gttaatatgg gcctaaaaat 960
<210> 11
<211> 961
<212> DNA
<213> Hepatitis B virus
<400> 11
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagcggct 60
twgttttgct cgcagccggt ctggagcgaa cctcatcggc accgacaact ctgttgtcct 120
ctctcggaag tacacctcct ttccatggct gctaggatgt gctgccaact ggatcctgcg 180
cgggacgtcc tttgtctacg tcccgtcggc gctgaatccc gcggacgacc cctctcgggg 240
ccgcttgggg atctaccgtc ccctcctccg tctgccgttc cggccgacca cggggcgcac 300
ctctctttac gcggtctccc cgtctgtgcc ttctcatctg ccggaccgtg tgcacttcgc 360
ttcacctctg cacgtcgcat ggagaccacc gtgaacgccc accaggtctt gcccaaggtc 420
ttgcataaga ggactcttgg actctcagca atgtcaacga ccgaccttga ggcatacttc 480
aaagactgtg tgtttaaaga ctgggaggag ttgggggagg agattaggtt aaaggtcttt 540
gtactaggag gctgtaggca taaattggtc tgttcaccag caccatgcaa ctttttcacc 600
tctgcctaat catctcatgt tcatgtccta ctgttcaagc ctccaagctg tgccttgggt 660
ggctttgggg catggacatt gacccttata aagaatttgg agcttctgtg gagttactct 720
cttttttgcc gtctgatttc tttccatcta ttcgagatct cctagacact gcctcagctc 780
tgtatcggga agccttagag tctccggaac attgttcacc tcaccataca gcactcaggc 840
aagctgttct gtgttggggt gaattaatga atctggctac ctgggtggga agtaatttgg 900
aagatccagc atccagggaa ttagtagtca gttatgtcaa tgttaatatg ggcttaaaga 960
t 961
<210> 12
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 12
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctggcagct 60
tgttttgctc gcagccggtc tggagcgaaa cttatcggga ctgacaactc tgttgtcctt 120
tctcggaaat acacctcctt cccatggctg ctcggatgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtctacgt cccgtcggcg ctgaatcccg cggacgaccc gtctcggggc 240
cgtttgggcc tctaccgtcc ccttctgcag ctgccgttcc ggccgaccac ggggcgcacc 300
tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccaggtcttg cccaaggtct 420
tacataagag gactcttgga ctctcagcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgttt gtttaaagac tgggaggagt tgggggagga gattaggtta aaggtctttg 540
tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600
ctgcctaatc atctcatgtt catgtcccac tgttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacattg acccgtataa agaatttgga gcttctgtgg agttactctc 720
ttttttgcct tctgacttct ttccttctat tcgagatctc ctcgacaccg cctctgcact 780
gtatcgggag gccttagagt ctccggaaca ttgttcacct caccatacag cactcaggca 840
agctattctg tgttggggtg agttgatgaa tctggccacc tgggtgggaa gtaatttgga 900
agacccagca tccagggaat tagtagtcag ctatgtcaat gttaacatgg gcctaaaaat 960
<210> 13
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 13
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagcagct 60
tgttttgctc gcagccggtc tggagcgaaa cttatcggca ccgacaactc tgttgtcctc 120
tctcggaaat acacctcctt tccatggctg ctagggtgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtctacgt cccgtcggcg ctgaatcccg cggacgaccc gtctcggggc 240
cgtttgggac tctaccgtcc ccttcttcat ctgccgttcc ggccgaccac ggggcgcacc 300
tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccaggtcttg cccaaggtct 420
tacataagag gactcttgga ctctcagcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgttt gtttaaagac tgggaggagt tgggggagga gattaggtta atgatctttg 540
tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600
ctgcctaatc atctcatgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacattg acccgtataa agaatttgga gcttctgtgg agttactctc 720
ttttttgcct tctgacttct ttccttctat tcgagatctc ctcgacaccg cctctgctct 780
gtatcgggag gccttagagt ctccggaaca ttgttcacct caccatacag cactcaggca 840
agctattctg tgttggggtg agttgatgaa tctggccacc tgggtgggaa gtaatttgga 900
agacccagca tccagggaat tagtagtcag ctatgtcaat gttaatatgg gcctaaaaat 960
<210> 14
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 14
cgcgtgcgtg gaaccttttc ggctcctctg ccgatccata ctgcggaact cctagccgct 60
tgttttgctc gcagcaggtc tggagcaaac attatcggga ctgataactc tgttgtcctc 120
tcccgcaaat atacatcgta tccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtttacgt cccgtcggcg ctgaatcctg cggacgaccc ttctcggggt 240
cgcttgagac tctctcgtcc ccttctccgt ctgccgttcc gaccgaccac ggggcgcacc 300
tctctttacg cggactcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccgaatgttg cccaaggtct 420
tacataagag gactcttgga ctctctgcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgttt gtttaaagac tgggaggagt tgggggagga gattagatta aaggtctttg 540
tactaggagg ctgtaggcat aaattggtct gcgcaccggc gccatgcacc tttttcacct 600
ctgcctaatc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacatcg acccttataa agaatttgga gctactgtgg agttactctc 720
gtttttgcct tctgacttct ttccttcagt acgagatctt ctagataccg cctcagctct 780
gtatcgggaa gccttagagt ctcctgagca ttgttcacct caccatactg cactcaggca 840
agcaattctt tgctgggggg aactaatgac tctagctacc tgggtgggtg ttaatttgga 900
agatccagca tctagagacc tagtagtcag ttatgtcaac actaatatgg gcctaaagtt 960
<210> 15
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 15
cgcatgcgtg gaaccttttt ggctcctctg ccgatccata ctgcggaact cctagccgct 60
tgttttgctc gcagcaggtc tggagcaaac attctcggga ctgacaactc tgttgtcctc 120
tcccgcaaat atacatcgtt tccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtttacgt cccgtcgrcg ctgaatcccg cggacgaccc gtctcggggc 240
cgcttggggc cctgtcgtcc tcttctctgc ctgccgttcc gaccgagcac ggggcgcacc 300
tctctttacg cggactcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccaaagcttg cccaaggtct 420
tacataagag gactcttgga ctctctgcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgttt gtttaacgac tgggaggagt tgggggagga gattaggtta aaggtctttg 540
tactaggagg ctgtaggcat aaattggtct gcgcaccagc accatgcaac tttttcacct 600
ctgcctaatc atcttttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttagggc atggacattg acccttataa agaatttgsa gcttctgtgc agttactctc 720
gtttttgcct gttsacttct ttccttccgt acgagatctt ctagataccg cctcagctct 780
gtatcgggat gctttagagt ctcctgagca tttgtcaccg caccatactg cactcaggca 840
agcaattctt tgctggggag aattaatgac tctagctacc tgggtgggta ctaatttaga 900
agatcaagca tctagggacc tagtagtcag ttatgtcaac amtaatatgg gcctaaagtt 960
<210> 16
<211> 957
<212> DNA
<213> Hepatitis B virus
<400> 16
cgcatgcgtg gaacctttgt ggctcctctt ccgatccata ctgcggaact cctagccgct 60
tgttttgctc gcagccggtc tggagcaaac attattggga ctgataactc tgttgtcctc 120
tcccgcaaat atacatcgtt tccatggctg ctaggccgtg ctgccaactg ggtcctgcgc 180
gggacgtcct ttgtttacgt cccgtcggcg ctgaatcccg cggacgaccc ttctcggggt 240
cgcttgggac tctctcgtcc ccttctccgt ctgccgttcc gaccgaccac ggggcgcacc 300
tctctttacg cggactcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccaattgccc aaggtcttac 420
ataagaggac tcttggactc tctgcaatgt caacgaccga ccttgaggca tacttcaaag 480
actgtttgtt taaagactgg gaggagttgg gggaggagat tagattaaag gtctttgtac 540
taggaggctg taggcataaa ttggtctgcg caccagcacc atgcaacttt ttcacctctg 600
cctaatcatc tcttgttcat gtcctactgt tcaagcctcc aagctgtgcc ttgggtggct 660
ttggggcatg gacattgacc cttataaaga atttggagct accgtggagt tactctcatt 720
tttgccttct gacttctttc cttcggtacg agatcttcta gataccgcct cagctctgta 780
tcgggaagct ttagagtctc ttgagcattg ttcacctcac catactgcac tcaggcaagc 840
aattctttgc tggggggaac taatgactct agctacctgg gtgggagtta atttggaaga 900
tccagcatct agggacctag tagtcagtta tgtcaacact aatatgggcc taaagtt 957
<210> 17
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 17
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct 60
tgttttgctc gcagcaggtc tggagcraaa cttatcggga cggataattc tgtcgtcctc 120
tcccggaaat atacatcgtt tccatggctg ctaggctgtg ctgccaactg gatcctgcga 180
gggacgtcct ttgtctacgt cccgtcggcg ctgaatcctg cggacgaccc gtctcggggt 240
cgcttggggg tctatcgtcc ccttctccgt ctrccgttcc agccgwccac ggggcgcacc 300
tctctttacg cggtctcccc gtctgtgcct tctcgcctgc cggwccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccagatattg cccaaggtct 420
tatataagag gactcttgga ctctctgcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgttt gtttaaagac tgggaggagt tgggggagga gattagatta atgatctttg 540
tactaggagg ctgtaggcat aaawtggtct gcgtaccagc accatgcaac tttttcacct 600
ctgcctaatc atctcgtgtt catgtcctac tgttcaagcc tccaagctgt gccttgagtg 660
gctttaggac atggacattg acccttataa agaatttgga gcttctgtgg agttactctc 720
gtttttgcct tctgacttct ttccttcagt aagagatctt ctagataccg cctctgctct 780
gtttcgggat gccttagaat ctcctgagca ttgttcacct caccatactg cactcaggca 840
agccattctt tgctggggag atgtaatgaa tctagctaca tgggtgggtg caaatttgga 900
agatccaaca tccagggacc tggtagtcgg ttatgtcaat agtaatatgg gcctaaagtt 960
<210> 18
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 18
cgcatgcgtg gaacctttgy ggctcctctg ccgatccata ctgcggaact cctggccgct 60
tgttttgctc gcagcaggtc tggagcgaaa cttattggaa cggataattc tgtcgttctc 120
tcccggaaat atacatcatt tccatggctg ctaggctgtg ctgccaactg gatcctgcga 180
gggacgtcct ttgtctacgt cccgtcagcg ctgaatcctg cggacgaccc gtctcggggt 240
cgcttgggga tctatcgtcc ccttctccgt ctgccgttcc ggccgaccac ggggcgcacc 300
tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gaaaccaccg tgaacgccca ccaaatcttg cccaaggtct 420
tatataagag gactcttgga ctctctgcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgctt gtttaaagac tgggaggagt tgggggagga gattagatta atgatctttg 540
tactaggagg ctgtaggcat aaattggtct gcgcaccagc accatgcaac tttttcacct 600
ctgcctaatc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttaggac atggacattg acccttataa agaatttgga gctwctgtgg agttactctc 720
ktttttgcct catgacttct ttccttcaat aagagatctt ctagataccg ccacagctct 780
gtatcgggat gccttagaat ctcctgagca ttgttcacct caccacacgg cactcaggca 840
agccattctt tgctgggggg atgtaatgaa tctagctacc tgggtgggtg taaatttgga 900
agatccagca tccagggacc tggtagtcgg ttatgtcaat actaatatgg gcctaaagtt 960
<210> 19
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 19
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct 60
tgttttgctc gcagcaggtc tggagcgaaa ctcataggga cagataattc tgtcgttctc 120
tcccggaaat atacatcatt tccatggctg ctaggctgtg ctgccaactg gatcctgcga 180
gggacgtcct ttgtctacgt cccgtcagcg ctgaatcctg cggacgaccc ctctcggggc 240
cgcttggggg tctatcgtcc ccttctccgt ctgccgttcc ggccgaccac ggggcgcacc 300
tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccagatcttg cccaaggtct 420
tacataagag gactcttgga ctctctgcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgttt gtttaaagac tgggaggagt tgggggagga gactagatta atgatctttg 540
tactaggagg ctgtaggcat aaattggtct gcgcaccagc accatgcaac tttttcacct 600
ctgcctaatc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttgggac atggacattg acccttataa agaatttgga gctactgtgg agttactctc 720
gtttttgcct tctgacttct ttccttcagt aagagatctt ctagataccg cctctgctct 780
gtatcgggat gccttagaat ctcctgagca ttgttcacct caccatactg cactcaggca 840
agccattctt tgctggggag aattaatgac tctagctacc tgggtgggtg taaatttgga 900
agatccagca tccagggacc tagtagtcag ttatgtcaat actaatatgg gcctaaagtt 960
<210> 20
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 20
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact ccttgcagct 60
tgtttcgctc gcagccggtc tggagcgaaa ctcatcggca cagacaactc tgttgtcctc 120
tctaggaagt acacctcctt cccatggctg ctcggttgtg ctgccaactg gatcctacgc 180
gggacgtcct ttgtttacgt cccgtcggcg ctgaatccag cggacgatcc ctctcggggt 240
cgcttggggc tgtatcgccc ccttctccgt ctgccgttcc agccgacgac gggtcgcacc 300
tctctttacg cggcctcccc gtctgttcct tctcgtctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgcccc tcgaagcttg ccaacagtct 420
tacataagcg gactcttgga ctttcaggaa ggtcaatcac ctggatcgaa gaatacatca 480
aagactgtgt atttaaggac tgggaggagc tgggggagga gattaggtta aaggtctttg 540
tattaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600
ctgcctaatc atcttttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacattg acccttataa agaatttgga gcttctgtgg aattactctc 720
ttttttgcct tctgacttct tcccgtcagt tcgggaccta ctcgacaccg cttcagccct 780
ctaccgggat gctttagaat caccagaaca ttgcacacct aaccataccg ctctcaggca 840
agctatattg tgctggggtg agttaatgac tttggcttcc tgggtgggca ataacttgga 900
agatcctgct gctagggacc tagtggttaa ctatgtcaat actaacatgg gcctaaaaat 960
<210> 21
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 21
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact ccttgcagcc 60
tgtttcgctc gcagccggtc tggagcgaac attatcggca cagacaactc tgttgtcctc 120
tctaggaagt acacctcctt tccatggctg ctcggttgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtttacgt cccgtcggcg ctgaatcccg cggacgaccc ttcccggggt 240
cgcttggggc tgtaccgccc ccttcttcgt ctgccgttcc agccgacgac gggtcgcacc 300
tctctttacg cggactcccc gtctgttcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgcccc ctggaatctg ccaacagtct 420
tacataagag gactcttgga ctttcaggac ggtcaatgac ctggatcgaa gaatacatca 480
aagactgtgt atttaaggac tgggaggagc tgggggagga gatcaggtta aaggtctttg 540
tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600
ctgcctaatc atcttttgtt catgtcccac tgttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacattg acccttataa agaatttgga gcttctgtgg aattgctctc 720
ttttttgcct tctgatttct tcccgtctgt tcgggaccta ctcgacaccg cttcagccct 780
ttaccgggat gctctagagt caccggaaca ttgcaccccc aatcataccg ctctcaggca 840
agctattttg tgctggggtg agttaatgac tttggcttcc tgggtgggta ataatttgga 900
agaccctgca gctagggatt tagtagttaa ttatgtcaac actaatatgg gcctgaaaat 960
<210> 22
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 22
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact ccttgcagcc 60
tgtttcgctc gcagccggtc tggagcgaac attatcggca cagacaactc tgttgtcctc 120
tctaggaagt acacctcctt tccatggctg ctcggttgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtttacgt cccgtcggcg ctgaatcccg cggacgaccc ttcccggggt 240
cgcttggggc tctaccgccc ccttcttcgt ctgccgttcc agccgacgac gggtcgcacc 300
tctctttacg cggactcccc gtctgttcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgcccc ctggaatctg ccaacagtct 420
tacataagag gactcttgga ctttcaggac ggtcaatgac ctggatcgaa gaatacatca 480
aagactgtgt atttaaggac tgggaggagc tgggggagga gatcaggtta aaggtctttg 540
tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600
ctgcctaatc atcttttgtt catgtcccac tgttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacattg acccttataa agaatttggc gcttctgtgg aattgctctc 720
ttttttgcct tctgatttct tcccgtctgt tcgggaccta ctcgacaccg cttcagccct 780
ttaccgggat gctctagagt caccggaaca ttgcaccccc aatcataccg ctctcaggca 840
agctattttg tgctggggtg agttaatgac tttggcttcc tgggtgggta ataatttgga 900
agaccctgca gctagggatt tagtagttaa ttatgtcaac actaatatgg gcctgaaaat 960
<210> 23
<211> 996
<212> DNA
<213> Hepatitis B virus
<400> 23
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagctgct 60
tgttttgctc gcagccggtc tggagcaaaa ctcattggga ctgacaattc tgtcgtcctt 120
tctcggaaat atacatcctt tccatggctg ctaggctgtg ctgccaactg gatccttcgc 180
gggacgtcct ttgtttacgt cccgtcagcg ctgaatccag cggacgaccc ctcccggggc 240
cgtttggggc tctgtcgccc ccttctccgt ctgccgttcc tgccgaccac ggggcgcacc 300
tctctttacg cggtctcccc gtctgttcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgttacatg gaaaccgcca tgaacacctc tcatcatctg ccaaggcagt 420
tatataagag gactcttgga ctgtttgtta tgtcaacaac cggggtggag aaatacttca 480
aggactgtgt ttttgctgag tgggaagaat taggcaatga gtccaggtta atgacctttg 540
tattaggagg ctgtaggcat aaattggtct gcgcaccagc accatgtaac tttttcacct 600
ctgcctaatc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttagggc atggatagaa caactttgcc atatggcctt tttggcttag acattgaccc 720
ttataaagaa tttggagcta ctgtggagtt gctctcgttt ttgccttctg actttttccc 780
gtctgttcgt gatcttctcg acaccgcttc agctttgtac cgggaatcct tagagtcctc 840
tgatcattgt tcgcctcacc atacagcact caggcaagca atcctgtgct ggggtgagtt 900
gatgactcta gccacctggg tgggtaataa tttggaagat ccagcatcca gagatttggt 960
ggtcaattat gttaatacta atatgggttt aaaaat 996
<210> 24
<211> 996
<212> DNA
<213> Hepatitis B virus
<400> 24
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagctgct 60
tgttttgctc gcagccggtc tggagcaaaa ctcattggga ctgacaattc tgtcgtcctt 120
tctcggaaat atacatcctt tccatggctg ctaggctgtg ctgccaactg gatccttcgc 180
gggacgtcct ttgtttacgt cccgtcagcg ctgaatccag cggacgaccc ctcccggggc 240
cgtttggggc tctgtcgccc ccttctccgt ctgccgttcc tgccgaccac ggggcgcacc 300
tctctttacg cggtctcccc gtctgttcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgttacatg gaaaccgcca tgaacacctc tcatcatcta ccaaggcagt 420
tatataagag gactcttgga ctgtttgtta tgtcaacaac cgggatggag aaatacttca 480
aggactgtgt ttttgctgag tgggaagaat taggcaatga gtccaggtta atgacctttg 540
tattaggagg ctgtaggcat aaattggtct gcgcaccagc accatgtaac tttttcacct 600
ctgcctaatc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttagggc atggatagaa caactttgcc atatggcctt tttggcttag acattgaccc 720
ttataaagaa tttggagcta ctgtggagtt gctctcgttt ttgccttctg actttttccc 780
gtctgttcgt gatcttctcg acaccgcttc agctttgtac cgggaatcct tagagtcctc 840
tgatcattgt tcgcctcacc atacagcact caggcaagca attctgtgct ggggtgagtt 900
gatgactcta gctacctggg tgggtaataa tttggaagat ccagcatcca gagatttggt 960
ggtcaattat gttaatacta atatgggttt aaaaat 996
<210> 25
<211> 999
<212> DNA
<213> Hepatitis B virus
<400> 25
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagctgct 60
tgttttgctc gcagccggtc tggagcgaaa ctcattggga ctgacaattc tgtcgtcctt 120
tctcggaaat atacatcctt tccatggctg ctaggctgtg ctgccaactg gatccttcgc 180
gggacgtcct ttgtttacgt cccgtcagcg ctgaatccag cggacgaccc ctcccggggc 240
cgtttggggc tctgtcgccc ccttctccgt ctgccgttcc tgccgaccac ggggcgcacc 300
tctctttacg cggtctcccc gtctgttcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgttacatg gaaaccgcca tgaacacctc tcatcatctg ccaaggcagt 420
tatataagag gactcttgga ctgtttgtta tgtcaacaac cggggtggag aaatacttca 480
aggactggtg tgtttttgct gagtgggaag aattaggcaa tgagtccagg ttaatgacct 540
ttgtattagg aggctgtagg cataaattgg tctgcgcacc agcaccaatg caacttttca 600
cctctgccta atcatctctt gttcatgtcc tactgttcaa gcctccaagc tgtgccttgg 660
gtggctttag ggcatggata gaacaacttt gccatatggc ctttttggct tagacattga 720
cccttataaa gaatttggag ctactgtgga gttgctctcg tttttgcctt ctgacttttt 780
cccgtctgtt cgtgatcttc tcgacaccgc ttcagctttg taccgggaat ccttagagtc 840
ctctgatcat tgttcgcctc accatacagc actcaggcaa gcaatcctgt gctggggtga 900
gttgatgact ctagctacct gggtgggtaa taatttggaa gatccagcat ccagagattt 960
ggtggtcaat tatgttaata ctaatatggg tttaaaaat 999
<210> 26
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 26
cgcatgcgcg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct 60
tgtttcgctc gcagcaggtc tggagcggac attatcggca ctgacaactc cgttgtcctt 120
tctcggaagt acacctcctt cccatggctg ctaggatgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtctacgt cccgtcggcg ctgaatcctg cggacgaccc ctctcgtggt 240
cgcttggggc tctgccgccc tcttctccgc ctgccgttcc ggccgacgac gggtcgcacc 300
tctctttacg cggactcccc gcctgtgcct tctcatctgc cggcccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgcccc ttggaacttg ccaacaacct 420
tacataagag gactcttgga ctttcgcccc ggtcaacgac ctggattgag gaatacatca 480
aagactgtgt atttaaggac tgggaggagt cgggggagga gttgaggtta aaggtctttg 540
tattaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600
ctgcctaatc atcttttgtt catgtcccac tgttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacattg acccttataa agaatttgga gcttctgtgg agttactctc 720
atttttgcct tctgacttct tcccgtctgt ccgggaccta ctcgacaccg cttcagccct 780
ctaccgagat gccttagaat caccagaaca ttgcaccccc aaccacactg ctctcaggca 840
agctattttg cgctggggtg agttgatgac cttggcttcc tgggtgggca ataatttaga 900
ggatcctgca gcaagagatc tagtagttaa ttatgtcaat actaacatgg gcctaaaaat 960
<210> 27
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 27
cgcatgcgcg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct 60
tgtttcgctc gcagcaggtc tggagcggac attatcggca ctgacaactc cgttgtcctt 120
tctcggaagt acacctcctt cccatggctg ctaggttgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtctacgt cccgtcggcg ctgaatcctg cggacgaccc ctctcgtggt 240
cgcttggggc tctgccgccc tcttctccgc ctgtcgttcc ggccgacgac gggtcgcacc 300
tctctttacg cggactcccc gcctgtgcct tctcatctgc cggcccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgcccc ttggaacttg ccaacaacct 420
tacataagag gactcttgga ctttcgcccc ggtcaacgac ctggattgag gaatacatca 480
aagactgtgt atttaaggac tgggaggagt cgggggagga gttgaggtta aaggtctttg 540
tattaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600
ctgcctaatc atcttttgtt catgtcccac tgttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacattg acccttataa agaatttgga gcttctgtgg agttactctc 720
atttttgcct tctgacttct tcccgtctgt ccgggaccta ctcgacaccg cttcagccct 780
ctaccgagat gccttagaat caccagaaca ttgcaccccc aaccacactg ctctcaggca 840
agctattttg tgctggggtg agttgatgac attggcttcc tgggtgggca ataatttaga 900
ggatcctgca gcaagagatc tagtagttaa ttatgtcaat actaacatgg gcctaaaaat 960
<210> 28
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 28
cgcatgcgcg gaacctttta ggctccgctg ccgatccata ctgcggaact cctagcagct 60
tgtttcgctc gcagccggtc tggagcggac attatcggca ctgacaactc cgttgtcctt 120
tctcggaagt acacctcctt cccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtctacgt cccgtcggcg ctgaatcctg cggacgaccc ctctcgtggt 240
cgcttggggc tatgccgccc tcttctccgc ctgccgttcc ggccgacgac gggtcgcacc 300
tctctttacg cggactcccc acctgtgcct ttacatcggc cggcccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg ggaaccaccg tgaacgcccc ttggaacttg ccaacaacct 420
tatataagag gactcttgga ctttcgcccc ggtcaacgac ctggattgag gaatacatca 480
aagactgtgt atttaaggac tgggaggagt cgggggagga gtcgaggtta atgatctttg 540
tattaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600
ctgcctaatc agcttttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttgggac atggacatcg acccttataa agaatttgga gcttctgtgg agttactctc 720
mtttttgcct tctgatttct tcccgtctgt ccgggaccta ctcgacaccg cttcagccct 780
cttccgagat gccttagaat cacccgaaca ttgcaccccc caccayacag ctctcaggca 840
agctattttg tgctggggtg agttgatgac tttggcttcc tgggtgggca ataatttaga 900
tgatcctgca tccagagatc tagtagttaa ttatgtcaat actaacatgg gcctaaaact 960
<210> 29
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 29
cgcatgcgtg gaacctttgc agctccactg ccgatccata ctgcggaact gctagctgcc 60
tgttttgctc gcagccggtc tggagcaaaa cttatcggga ctgataattc tgtcgtcctt 120
tcacggaaat atacatcatt tccatggctg ctaggctgtg ctgccaactg gatcatgcgc 180
gggacgtcct ttgtctacgt cccgtcggcg ctgaatcctg cggacgaccc ctctcggggc 240
cgtttgggga tctaccgtcc ccttctccgt ctgccgtacc ggccgtccac ggggcgcacc 300
tctctttacg cggactcccc gtgtgtgcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgccca cctggtattg cccaaggtat 420
tgcataagag gactcttgga ctctcggcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgtgt gtttaaagac tgggaggagc tgggggagga gattaggcta aaggtctttg 540
tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600
ctgcctaatc atctcatgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttggggc atggacattg acccttataa agaatttgga gcttctgtgg agttactctc 720
ttttttgcct tctgatttct ctccgtctgt tcgagatcta ctcgacaccg cctcagctct 780
ctaccgggag gccttagagt ctccggaaca ttgttcacct caccatacag cacttaggca 840
agctgtcctg tgttggggtg agttgatgac tctagctacc tgggtgggaa gtaatttgga 900
cgaccctgga tccagggatt tagtagtcac ctatgtcaat gttaatatgg gcctaaagtt 960
<210> 30
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 30
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata cggcggaact gctagctgcc 60
tgttttgctc gcagcaggtc tggggcaaat cttatcggga ctgataattc tgtcgtcctt 120
tcgcggaaat atacatcatt tccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtctacgt cccgtcggcg ctgaatcctg cggacgaccc ctctcggggc 240
cgcttgggga tctaccgtcc ccttcttcgc ctgccgttcc ggccgtccac ggggcgcacc 300
tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgacca cctgaccttg cccaaggtct 420
tgcataagag gactcttgga ctcccagcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgtgt gtttaaagac tgggaggagt tgggggagga gatcaggtta aagatttatg 540
tattaggagg ctgtaggcat aaattggtct gcgcaccagc accatgcaac tttttcacct 600
ctgcctaatc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttaggac atggacattg acccttataa agaatttgga gcttctttgg agttactctc 720
ttttttgcct tctgatttct ttccatctgt tcgagatctc ctcgacaccg cctcagcttt 780
gtatcgggag gccttagagt ctcctgaaca ttgtacacct caccatacag cactcaggca 840
agcggtaata tgttggggtg agttgatgac tctagctact tgggtgggaa gtaatttgga 900
agaccctgcc tccagggatt tagtagtcag ctatgtcaat ggtcatatgg gcctaaaatt 960
<210> 31
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 31
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact gctagctgcc 60
tgttttgctc gcagcaggtc tggagcaaac attataggga ctgataattc cgtcgtcctt 120
tcgcggaaat atacgtcctt tccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtctacgt cccgtcggcg ctgaatcctg cggacgaccc ctctcggggc 240
cgcttgggga tctaccgtcc ccttcttcgt ctgccgttcc ggccgtccac ggggcgcacc 300
tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggcccgtgt gcacttcgct 360
tcacctctgc acgtcgcatg gagaccaccg tgaacgccca cctgaccttg cccaaggtat 420
tgcataagag gactcttgga ctctcagcaa tgtcaacgac cgaccttgag gcatacttca 480
aagactgtgt gtttaaagac tgggaggagt tgggggagga gatcaggtta aaggtctttg 540
tattaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600
ctgcctaatc atctcatgtt catgtcctac tgttcaagcc tccaagttgt gccttgggtg 660
gctttggggc atggacattg acccttataa agaatttgga gcttctgtgg agttactctc 720
ttttttgcct tctgatttct ttccatctat tcgagatctc ctcgacaccg cctcagcttt 780
gtatcgggag gccttagagt ctcctgaaca ttgttcacct caccatacag cactcaggca 840
agctgttcta tgttggggtg agttgatgac tctagctacc tgggtgggaa gtaatttgga 900
agaccctgcc tccagggatt tagtagtcag ctatgtcaat gttaatatgg ggctaaaaat 960
<210> 32
<211> 960
<212> DNA
<213> Hepatitis B virus
<400> 32
cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagcagct 60
tgttttgctc gcagcaggtc tggggcaaac ctactcggga cagataattc tgtggtttta 120
tcacggaagt atacgtcctt cccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180
gggacgtcct ttgtctacgt cccgtcggcg ctgaatcccg cggacgaccc gtctcggggc 240
aagttgggcc tctaccgtcc tcttctccgt ctgccgttcc gaccgaccac ggggcgcacc 300
tctctttacg cggtctcccc gtctgtacct tctcatctgc cggcccgtgt gcacttcgct 360
tcacctctgc acgttgcatg gagaccaccg tgaacgcccc ctggaatttg ccaagagtgt 420
tacataagcg gactcttgga ctttcggaca tgtcaacgtc cgcaattgag acatacttca 480
aggactgtgt atttaaagac tgggaggagt caggggagga gattaggtta atgatctttg 540
tattaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600
ctgcctaatc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660
gctttagggc atggacattg acccttataa agaatttgga gcttctgtgg agttactctc 720
ttttttgcct tctgatttct ttccgtcaat cagagacctc ctcgacaccg cctcagctct 780
ataccgagaa gccttagagt ctccagaaca ttgctcacct caccatacag cacttaggca 840
agctgtgcta tgttggggtg agttgatgaa tctggctacc tgggtgggaa gtaatttgga 900
agacccagca tccagggaac ttgtagtcag ctatgttaac attaatatgg gcctaaaaat 960
<210> 33
<211> 378
<212> DNA
<213> Homo sapiens
<400> 33
tatcacagat tctttttttt taaattaaag taacatttcc aatctactaa tgctaatact 60
gtttcgtatt tatagctgat ttgatggagt tggacatggc catggaacca gacagaaaag 120
cggctgttag tcactggcag caacagtctt acctggactc tggaatccat tctggtgcca 180
ctaccacagc tccttctctg agtggtaaag gcaatcctga ggaagaggat gtggatacct 240
cccaagtcct gtatgagtgg gaacagggat tttctcagtc cttcactcaa gaacaagtag 300
ctggtaagag tattattttt cattgcctta ctgaaagtca gaatgcagtt ttgagaacta 360
aaaagttagt gtataata 378
<210> 34
<211> 673
<212> DNA
<213> Homo sapiens
<400> 34
gtcgcctgcg ctgctctccg catgtcgctg gttccccccg gccgccctca accccagccg 60
gacgccgacc ccggggaggc ccacctggcg gaaggagggg gcggcggggg gcggccgtgc 120
gtcccagggc acgcacacca ggcactgggc caccagcgcg cggaaagccg ccgggtcccc 180
gcgctgcacc agccgccagc cctggggccc caggcgccgc acgaacgtgg ccagcggcag 240
cacctcgcgg tagtggctgc gcagcaggga gcgcacggct cggcagcggg gagcgcgcgg 300
catcgcgggg gtggccgggg ccagggcttc ccacgtgcgc agcaggacgc agcgctgcct 360
gaaactcgcg ccgcgaggag agggcggggc cgcggaaagg aaggggaggg gctgggaggg 420
cccggagggg gctgggccgg ggacccggga ggggtcggga cggggcgggg tccgcgcgga 480
ggaggcggag ctggaaggtg aaggggcagg acgggtgccc gggtccccag tccctccgcc 540
acgtgggaag cgcggtcctg ggcgtctgtg cccgcgaatc cactgggagc ccggcctggc 600
cccgacagcg cagctgctcc gggcggaccc gggggtctgg gccgcgcttc cccgcccgcg 660
cgccgctcgc gct 673
<210> 35
<211> 779
<212> DNA
<213> Homo sapiens
<400> 35
ggttccttct ctgcaggccc aggtgaccca gggttggaag tgtctcatgc tggatcccca 60
cttttcctct tgcagcagcc agactgcctt ccgggtcact gccatggagg agccgcagtc 120
agatcctagc gtcgagcccc ctctgagtca ggaaacattt tcagacctat ggaaactgtg 180
agtggatcca ttggaagggc aggcccacca cccccacccc aaccccagcc ccctagcaga 240
gacctgtggg aagcgaaaat tccatgggac tgactttctg ctcttgtctt tcagacttcc 300
tgaaaacaac gttctggtaa ggacaagggt tgggctgggg acctggaggg ctggggacct 360
ggagggctgg ggggctgggg ggctgaggac ctggtcctct gactgctctt ttcacccatc 420
tacagtcccc cttgccgtcc caagcaatgg atgatttgat gctgtccccg gacgatattg 480
aacaatggtt cactgaagac ccaggtccag atgaagctcc cagaatgcca gaggctgctc 540
cccccgtggc ccctgcacca gcagctccta caccggcggc ccctgcacca gccccctcct 600
ggcccctgtc atcttctgtc ccttcccaga aaacctacca gggcagctac ggtttccgtc 660
tgggcttctt gcattctggg acagccaagt ctgtgacttg cacggtcagt tgccctgagg 720
ggctggcttc catgagactt caatgcctgg ccgtatcccc ctgcatttct tttgtttgg 779
<210> 36
<211> 528
<212> DNA
<213> Homo sapiens
<400> 36
gctgccgtct tccagttgct ttatctgttc acttgtgccc tgactttcaa ctctgtctcc 60
ttcctcttcc tacagtactc ccctgccctc aacaagatgt tttgccaact ggccaagacc 120
tgccctgtgc agctgtgggt tgattccaca cccccgcccg gcacccgcgt ccgcgccatg 180
gccatctaca agcagtcaca gcacatgacg gaggttgtga ggcgctgccc ccaccatgag 240
cgctgctcag atagcgatgg tgagcagctg gggctggaga gacgacaggg ctggttgccc 300
agggtcccca ggcctctgat tcctcactga ttgctcttag gtctggcccc tcctcagcat 360
cttatccgag tggaaggaaa tttgcgtgtg gagtatttgg atgacagaaa cacttttcga 420
catagtgtgg tggtgcccta tgagccgcct gaggtctggt ttgcaactgg ggtctctggg 480
aggaggggtt aagggtggtt gtcagtggcc ctccaggtga gcagtagg 528
<210> 37
<211> 260
<212> DNA
<213> Homo sapiens
<400> 37
aaaaaggcct cccctgcttg ccacaggtct ccccaaggcg cactggcctc atcttgggcc 60
tgtgttatct cctaggttgg ctctgactgt accaccatcc actacaacta catgtgtaac 120
agttcctgca tgggcggcat gaaccggagg cccatcctca ccatcatcac actggaagac 180
tccaggtcag gagccacttg ccaccctgca cactggcctg ctgtgcccca gcctctgctt 240
gcctctgacc cctgggccca 260
<210> 38
<211> 436
<212> DNA
<213> Homo sapiens
<400> 38
cctggttttt taaatgggac aggtaggacc tgatttcctt actgcctctt gcttctcttt 60
tcctatcctg agtagtggta atctactggg acggaacagc tttgaggtgc gtgtttgtgc 120
ctgtcctggg agagaccggc gcacagagga agagaatctc cgcaagaaag gggagcctca 180
ccacgagctg cccccaggga gcactaagcg agcctggttt tttaaatggg acaggtagga 240
cctgatttcc ttactgcctc ttgcttctct tttcctatcc tgagtagcac tgcccaacaa 300
caccagctcc tctccccagc caaagaagaa accactggat ggagaatatt tcacccttca 360
ggtactaagt cttgggacct cttatcaagt ggaaagtttc cagtctaaca ctcaaaatgc 420
cgttttcttc ttgact 436
<210> 39
<211> 453
<212> DNA
<213> Homo sapiens
<400> 39
cctggttttt taaatgggac aggtaggacc tgatttcctt actgcctctt gcttctcttt 60
tcctatcctg agtagtggta atctactggg acggaacagc tttgaggtgc gtgtttgtgc 120
ctgtcctggg agagaccggc gcacagagga agagaatctc cgcaagaaag gggagcctca 180
ccacgagctg cccccaggga gcactaagcg aggtaagcaa gcaggacaag aagcggtgga 240
ggagaccaag ggtgcagtta tgcctcagat tcacttttat cacctttcct tgcctctttc 300
ctagcactgc ccaacaacac cagctcctct ccccagccaa agaagaaacc actggatgga 360
gaatatttca cccttcaggt actaagtctt gggacctctt atcaagtgga aagtttccag 420
tctaacactc aaaatgccgt tttcttcttg act 453
<210> 40
<211> 257
<212> DNA
<213> Homo sapiens
<400> 40
caattgtaac ttgaaccatc ttttaactca ggtactgtgt atatacttac ttctccccct 60
cctctgttgc tgcagatccg tgggcgtgag cgcttcgaga tgttccgaga gctgaatgag 120
gccttggaac tcaaggatgc ccaggctggg aaggagccag gggggagcag ggctcactcc 180
aggtgagtga cctcagcccc ttcctggccc tactcccctg ccttcctagg ttggaaagcc 240
ataggattcc attctca 257
<210> 41
<211> 232
<212> DNA
<213> Homo sapiens
<400> 41
ttggtcaggg aaaaggggca cagaccctct cactcatgtg atgtcatctc tcctccctgc 60
ttctgtctcc tacagccacc tgaagtccaa aaagggtcag tctacctccc gccataaaaa 120
actcatgttc aagacagaag ggcctgactc agactgacat tctccacttc ttgttcccca 180
ctgacagcct cccaccccca tctctccctc ccctgccatt ttgggttttg gg 232
<210> 42
<211> 120
<212> DNA
<213> Lambda phage
<400> 42
ctggtgccgc cgcaatggcc attaaccgcg ttgcttcatc cgcgatatcg cagtcggcgt 60
cacaggttgc ccgtgagaca aaggtacgcc ggaaactggt aaaggaaagg gccaggctga 120
<210> 43
<211> 120
<212> DNA
<213> Lambda phage
<400> 43
acgtgtcggc ggagcagatt gcgtatgttg ctcagttgca gcgttccggc gatgaagccg 60
gggcattgca ggcggcgaac gaggccgcaa cgaaagggtt tgatgaccag acccgccgcc 120
<210> 44
<211> 120
<212> DNA
<213> Lambda phage
<400> 44
gccgtggtgg ctggtctgcc gggggacgat tcataagttc cgctgtgtgc cgcatctcac 60
cgggcggcgc tttgagcacg gtgtgacgga ctgttacaca ctgttccggg atgcttatca 120
<210> 45
<211> 120
<212> DNA
<213> Lambda phage
<400> 45
catgtaccgg gcgatgttat tgaaatctgc gatgatgact atgccggtat cagcaccggt 60
ggtcgtgtgc tggcggtgaa cagccagacc cggacgctga cgctcgaccg tgaaatcacg 120
<210> 46
<211> 240
<212> DNA
<213> Lambda phage
<400> 46
ctggtgccgc cgcaatggcc attaaccgcg ttgcttcatc cgcgatatcg cagtcggcgt 60
cacaggttgc ccgtgagaca aaggtacgcc ggaaactggt aaaggaaagg gccaggctga 120
aaagggccac ggtcaaaaat ccgcaggcca gaatcaaagt taaccggggg gatttgcccg 180
taatcaagct gggtaatgcg cgggttgtcc tttcgcgccg caggcgtcgt aaaaaggggc 240
<210> 47
<211> 240
<212> DNA
<213> Lambda phage
<400> 47
catgtaccgg gcgatgttat tgaaatctgc gatgatgact atgccggtat cagcaccggt 60
ggtcgtgtgc tggcggtgaa cagccagacc cggacgctga cgctcgaccg tgaaatcacg 120
ctgccatcct ccggtaccgc gctgataagc ctggttgacg gaagtggcaa tccggtcagc 180
gtggaggttc agtccgtcac cgacggcgtg aaggtaaaag tgagccgtgt tcctgacggt 240
<210> 48
<211> 180
<212> DNA
<213> Lambda phage
<400> 48
acgtgtcggc ggagcagatt gcgtatgttg ctcagttgca gcgttccggc gatgaagccg 60
gggcattgca ggcggcgaac gaggccgcaa cgaaagggtt tgatgaccag acccgccgcc 120
tgaaagagaa catgggcacg ctggagacct gggcagacag gactgcgcgg gcattcaaat 180
<210> 49
<211> 180
<212> DNA
<213> Lambda phage
<400> 49
gccgtggtgg ctggtctgcc gggggacgat tcataagttc cgctgtgtgc cgcatctcac 60
cgggcggcgc tttgagcacg gtgtgacgga ctgttacaca ctgttccggg atgcttatca 120
tctggcgggg attgagatgc cggactttca tcgtgaggat gactggtggc gtaacggcca 180
<210> 50
<211> 120
<212> DNA
<213> Lambda phage
<400> 50
agttatacat tctgccatag attatagcta aggcatgtaa taattcgtaa tcttttagcg 60
tattagcgac ccatcgtctt tctgatttaa taatagatga ttcagttaaa tatgaaggta 120
<210> 51
<211> 120
<212> DNA
<213> Lambda phage
<400> 51
cacacaacac catatgcatt taagtcgctt gaaattgcta taagcagagc atgttgcgcc 60
agcatgatta atacagcatt taatacagag ccgtgtttat tgagtcggta ttcagagtct 120
<210> 52
<211> 120
<212> DNA
<213> Lambda phage
<400> 52
gctgacagcc tgattgcaaa attcaaagaa gcgggcggaa cggtcagaga gattgatgta 60
tgagcagagt caccgcgatt atctccgctc tggttatctg catcatcgtc tgcctgtcat 120
<210> 53
<211> 120
<212> DNA
<213> Lambda phage
<400> 53
agaaacgaat gctgcagcgt cacaacaatc agccgccacg tctgcctcca ccgcggccac 60
gaaagcgtca gaggccgcca cttcagcacg agatgcggtg gcctcaaaag aggcagcaaa 120
<210> 54
<211> 120
<212> DNA
<213> Lambda phage
<400> 54
atcgccgtgc tgccggtgtc cggcacgctg gtcagccgga cgcgggcgct gcagccgtac 60
tcggggatga ccggttacaa cggcattatc gcccgtctgc aacaggctgc cagcgatccg 120
<210> 55
<211> 240
<212> DNA
<213> Homo sapiens
<400> 55
gaaaagagct aggaaggaca ggcaacttgg caaatcaaag ccctgggact agggggttaa 60
aatacagctt cccctcttcc cacccgcccc agtctctgtc ccttttgtag gagggactta 120
gagaaggggt gggcttgccc tgtccagtta atttctgacc tttactcctg ccctttgagt 180
ttgatgatgc tgagtgtaca agcgttttct ccctaaaggg tgcagctgag ctaggcagca 240
<210> 56
<211> 240
<212> DNA
<213> Homo sapiens
<400> 56
gattacgaga ggtccctgag tcgcctgacg ctggacgaca tcgaacggtt ggccagccgc 60
ttcctgcacc ctgaagtgac tgagacaatg gagaagggct tctccaaata gaattctcgg 120
agcatgggga ggtgcccaac gccaggctac cgctgcatgt cgcactaagt gtgttctcct 180
gttgcagttg ggctcatcat cgtcatagct ggcatgtacc tggctctggc caggtgctag 240

Claims (16)

1.一种检测癌症的探针组合,其特征在于,包括:
一组或多组部分乙型肝炎病毒(HBV)靶向探针;以及
一组或多组完整的HBV靶向探针;
其中,当每组所述部分HBV靶向探针的序列对齐时,对齐的所述部分HBV靶向探针的整体序列与HBV基因型中的基因组上的直接重复(DR)区域的参考序列匹配,其中所述DR区域是在HBV基因体中介于DR序列1(direct repeat 1)和DR序列2(direct repeat 2)之间再加上自所述DR序列1和DR序列2延伸出的延展区的区域;以及,
在对齐的所述部分HBV靶向探针中,每个所述部分HBV靶向探针的一部分与一个或两个相邻的所述部分HBV靶向探针的一部分重叠;
其中,当每组所述完整的HBV靶向探针的序列对齐时,对齐的所述完整的HBV靶向探针的整体序列与HBV基因型中的基因组上的参考序列匹配;以及
在对齐的所述完整的HBV靶向探针中,每个所述完整的HBV靶向探针的一部分与一个或两个相邻的所述完整的HBV靶向探针的一部分重叠。
2.如权利要求1所述的探针组合,其特征在于,所述HBV基因型包括基因型A、基因型B、基因型C、基因型D、基因型E、基因型F、基因型G、基因型H、基因型I和基因型J。
3.如权利要求1所述的探针组合,其特征在于,所述DR区域的参考序列包括SEQ IDNOs.3-32。
4.如权利要求1所述的探针组合,其特征在于,还包括:
一组或多组热点基因靶向探针;
其中,当每组所述热点基因靶向探针的序列对齐时,对齐的所述热点基因靶向探针的整体序列与癌症热点基因的参考序列匹配;以及
在对齐的所述热点基因靶向探针中,每个所述热点基因靶向探针的一部分与一个或两个相邻的所述热点基因靶向探针的一部分重叠。
5.如权利要求4所述的探针组合,其特征在于,所述癌症热点基因包括CTNNB1基因、TERT基因和TP53基因。
6.如权利要求4所述的探针组合,其特征在于,所述癌症热点基因的参考序列包括SEQID NOs.33-41。
7.如权利要求4所述的探针组合,其特征在于,还包括:
一组或多组外源基因靶向探针;
其中,当每组所述外源基因靶向探针的序列对齐时,对齐的所述外源基因靶向探针的整体序列与外源基因的参考序列匹配;以及
在对齐的所述外源基因靶向探针中,每个所述外源基因靶向探针的一部分与一个或两个相邻的所述外源基因靶向探针的一部分重叠。
8.如权利要求7所述的探针组合,其特征在于,所述外源基因源自于一λ噬菌体。
9.如权利要求7所述的探针组合,其特征在于,所述外源基因的参考序列包括SEQ IDNOs.42-54。
10.如权利要求7所述的探针组合,其特征在于,还包括:
一组或多组内源基因靶向探针;
其中,当每组所述内源基因靶向探针的序列对齐时,对齐的所述内源基因靶向探针的整体序列与内源基因的参考序列匹配;以及
在对齐的所述内源基因靶向探针中,每个所述内源基因靶向探针的一部分与一个或两个相邻的所述内源基因靶向探针的一部分重叠。
11.如权利要求10所述的探针组合,其特征在于,所述内源基因包括GAPDH基因和GdX基因。
12.如权利要求10所述的探针组合,其特征在于,所述内源基因的参考序列包括SEQ IDNO.55和SEQ ID NO.56。
13.如权利要求1所述的探针组合,其特征在于,所述癌症包括肝细胞癌。
14.如权利要求1所述的探针组合,其特征在于,所述检测癌症的探针组合用于捕捉具有病毒-宿主嵌合点的目标核酸片段,所述目标核酸片段是由一感染HBV的对象的一样本中的DNA所取得。
15.如权利要求14所述的探针组合,其特征在于,所述DNA包括宿主的基因组DNA和循环系统中的肿瘤DNA。
16.如权利要求14所述的探针组合,其特征在于,所述样本包括生物性液体和肝组织。
CN201880010351.7A 2017-02-07 2018-02-06 检测癌症的探针组合 Active CN110573628B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762456087P 2017-02-07 2017-02-07
US62/456087 2017-02-07
PCT/CN2018/075474 WO2018145627A1 (en) 2017-02-07 2018-02-06 Probe combination for detection of cancer

Publications (2)

Publication Number Publication Date
CN110573628A CN110573628A (zh) 2019-12-13
CN110573628B true CN110573628B (zh) 2023-12-22

Family

ID=63038710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880010351.7A Active CN110573628B (zh) 2017-02-07 2018-02-06 检测癌症的探针组合

Country Status (9)

Country Link
US (1) US11319602B2 (zh)
EP (1) EP3580353B1 (zh)
JP (1) JP6799175B2 (zh)
KR (1) KR102327119B1 (zh)
CN (1) CN110573628B (zh)
ES (1) ES2961464T3 (zh)
SG (1) SG11201907220UA (zh)
TW (1) TWI726191B (zh)
WO (1) WO2018145627A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111465707A (zh) * 2017-11-17 2020-07-28 简·探针公司 用于检测C1orf43核酸的组合物和方法
KR20200054430A (ko) * 2018-11-09 2020-05-20 주식회사 셀레믹스 폐암 조직 내 세포 유래 돌연변이를 검출하기 위한 프로브 제조 및 검출 방법
WO2021046655A1 (en) * 2019-09-13 2021-03-18 University Health Network Detection of circulating tumor dna using double stranded hybrid capture
US11814690B2 (en) * 2019-11-04 2023-11-14 The Catholic University Of Korea Industry-Academic Cooperation Foundation Probe for detecting hepatitis b virus and use thereof

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013075313A1 (zh) * 2011-11-24 2013-05-30 深圳华大基因科技有限公司 一种检测病毒在待测样本中整合方式的探针及其制备方法和应用
CN103725773A (zh) * 2012-10-10 2014-04-16 杭州普望生物技术有限公司 鉴定宿主基因组中hbv基因整合位点和重复靶基因
CN105506065A (zh) * 2014-09-25 2016-04-20 上海人类基因组研究中心 肝癌基因检测方法、检测试剂盒及其应用
CN106319065A (zh) * 2016-09-14 2017-01-11 埃提斯生物技术(上海)有限公司 基于高通量测序检测人brca1/2基因的捕获探针及试剂盒

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100647277B1 (ko) * 2003-08-14 2006-11-17 삼성전자주식회사 B형 간염 검사용 pcr 프라이머 세트 및 이를 포함하는 b형 간염 검사 키트
US20060057670A1 (en) * 2004-09-10 2006-03-16 The Chinese University Of Hong Kong Genomic markers of hepatitis B virus associated with hepatocellular carcinomas
US20070042388A1 (en) * 2005-08-12 2007-02-22 Wong Christopher W Method of probe design and/or of nucleic acids detection
WO2009061640A2 (en) * 2007-11-06 2009-05-14 Siemens Healthcare Diagnostics Inc. Hepatitis b virus (hbv) specific oligonucleotide sequences
KR101162088B1 (ko) 2008-09-30 2012-07-04 재단법인서울대학교산학협력재단 실시간 pcr을 이용하여 b형 간염유래 간질환을 진단하기 위한 키트
CN102277448B (zh) 2011-05-30 2013-09-04 厦门艾德生物医药科技有限公司 用于预测乙肝病毒引起的肝癌的引物、探针及试剂盒
CN103797130B (zh) 2011-06-24 2016-07-27 深圳华大基因科技有限公司 用于确定人体具有异常状态的系统和方法
KR20130121283A (ko) * 2012-04-27 2013-11-06 (주)바이오니아 B형 간염 바이러스를 검출하기 위한 중합효소연쇄반응의 프라이머, 프로브, 및 이를 이용한 검출키트 및 방법
US9840742B2 (en) 2014-06-16 2017-12-12 JBS Science Inc. Detection of hepatitis B virus (HBV) DNA and methylated HBV DNA in urine of patients with HBV-associated hepatocellular carcinoma
TWI797095B (zh) * 2016-10-24 2023-04-01 美商格瑞爾有限責任公司 腫瘤檢測之方法及系統

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013075313A1 (zh) * 2011-11-24 2013-05-30 深圳华大基因科技有限公司 一种检测病毒在待测样本中整合方式的探针及其制备方法和应用
CN103725773A (zh) * 2012-10-10 2014-04-16 杭州普望生物技术有限公司 鉴定宿主基因组中hbv基因整合位点和重复靶基因
CN105506065A (zh) * 2014-09-25 2016-04-20 上海人类基因组研究中心 肝癌基因检测方法、检测试剂盒及其应用
CN106319065A (zh) * 2016-09-14 2017-01-11 埃提斯生物技术(上海)有限公司 基于高通量测序检测人brca1/2基因的捕获探针及试剂盒

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
[日]奥田邦雄、[美]K.G.伊莎克.病毒DNA整合在肝癌发生中的作用.《肝脏肿瘤》.1991, *
乙型肝炎病毒DNA整合的机制及后果;成军;世界华人消化杂志(02);全文 *
反转录病毒感染与肿瘤发生;Hung Y. Fan等;《微生物与感染》;20090925(第03期);全文 *
唐玉梅.医学分子病毒学及其应用.1997,131. *
唐玉梅.病毒的基因组.《医学分子病毒学及其应用》.1997, *
奥田邦雄.肝脏肿瘤.1991,42. *
肝癌基因组学与肝癌发病机制;焦宇辰;;肝癌电子杂志(03);全文 *
肝癌基因组学与肝癌发病机制;焦宇辰;《肝癌电子杂志》;20150930(第03期);全文 *

Also Published As

Publication number Publication date
KR102327119B1 (ko) 2021-11-16
TWI726191B (zh) 2021-05-01
WO2018145627A1 (en) 2018-08-16
EP3580353A1 (en) 2019-12-18
KR20190114989A (ko) 2019-10-10
US20180223380A1 (en) 2018-08-09
JP2020503067A (ja) 2020-01-30
EP3580353B1 (en) 2023-09-13
TW201833332A (zh) 2018-09-16
JP6799175B2 (ja) 2020-12-09
SG11201907220UA (en) 2019-09-27
CN110573628A (zh) 2019-12-13
EP3580353A4 (en) 2020-03-04
ES2961464T3 (es) 2024-03-12
US11319602B2 (en) 2022-05-03

Similar Documents

Publication Publication Date Title
CN110573628B (zh) 检测癌症的探针组合
CN104053786B (zh) 用于多重pcr的方法和组合物
AU2016334233B2 (en) Methods and compositions for enrichment of amplification products
EP2702170B1 (en) Methods and compositions for multiplex pcr
US10329605B2 (en) Method to increase sensitivity of detection of low-occurrence mutations
WO2016101258A1 (zh) 一种检测与人体异常状态相关的差异甲基化CpG岛的方法
CN107278234A (zh) 基因序列校验组合物、方法和试剂盒
CN110719958B (zh) 构建核酸文库的方法和试剂盒
JP2009533066A5 (zh)
WO2011120409A1 (zh) 以alu间聚合酶链式反应为基础的检测基因区特征的方法
CA2901120C (en) Methods and kits for identifying and adjusting for bias in sequencing of polynucleotide samples
JP2007209354A (ja) 塩基変異分析方法
JP2022179442A (ja) 捕捉プローブおよびその使用
JP2023519979A (ja) ゲノム内の構造再編成の検出方法
JP2005528910A5 (zh)
KR20130113208A (ko) 만성 b형 간염 치료제의 약제내성 예측용 조성물 및 그 예측 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant