TW201833332A - 偵測癌症之探針組合 - Google Patents

偵測癌症之探針組合 Download PDF

Info

Publication number
TW201833332A
TW201833332A TW107104048A TW107104048A TW201833332A TW 201833332 A TW201833332 A TW 201833332A TW 107104048 A TW107104048 A TW 107104048A TW 107104048 A TW107104048 A TW 107104048A TW 201833332 A TW201833332 A TW 201833332A
Authority
TW
Taiwan
Prior art keywords
sequence
probe
hbv
target
probes
Prior art date
Application number
TW107104048A
Other languages
English (en)
Other versions
TWI726191B (zh
Inventor
林友瑜
王雅俊
曾晟泰
Original Assignee
泰宗生物科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 泰宗生物科技股份有限公司 filed Critical 泰宗生物科技股份有限公司
Publication of TW201833332A publication Critical patent/TW201833332A/zh
Application granted granted Critical
Publication of TWI726191B publication Critical patent/TWI726191B/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/706Specific hybridization probes for hepatitis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Virology (AREA)
  • Communicable Diseases (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

一種用於偵測癌症的探針組合,其包括一組或多組以HBV局部基因體做為標的之探針。其中當每一組該以HBV局部基因體做為標的之探針依該HBV局部基因體之序列排列對齊時,已對齊的該些以HBV局部基因體做為標的之探針於對齊後所組成的一整體序列和一種HBV基因體中之一參考序列或一HBV基因體上的DR序列 (direct repeat region) 互相匹配。在該些已對齊的多組探針中,每一探針序列的一部分和相鄰的一個或二個探針序列的一部分重疊。該探針組合可進一步包括一組或多組以癌症熱點基因做為標的之探針,例如以CTNNB1、TERT和TP53基因做為標的之探針、一組或多組以外源性基因如一部分λ噬菌體之基因體做為標的之探針以及多組以內源性基因如GAPDH和GdX基因做為標的之探針。

Description

偵測癌症之探針組合
本發明與一種探針組合有關。進一步地,本發明和一種用於偵測癌症且具有序列專一性的探針組合有關。
肝病毒科 (Hepadnaviridae) 被認為是和肝炎、肝細胞癌 (hepatocellular carcinoma;HCC) 和肝硬化 (cirrhosis) 之致病機轉有關的一類病毒。HBV (Hepatitis B Virus,即B型肝炎病毒) 為肝病毒科中最常見的病毒,且為一小型DNA病毒,其可被分類為基因型A至J。大部分成人被HBV感染後會康復,然而大約有5%至10%感染HBV的病患無法清除體內的病毒且會成為慢性帶原者。B型肝炎的慢性帶原者演變為肝細胞癌的機率很高,因為HBV能嵌入宿主的基因體中且造成肝細胞在遺傳上或表觀遺傳 (epigenetic) 上的改變。
目前和偵測HBV嵌入基因體有關的方法,有Jiang等人發表的「The effect of hepatitis B virus integration into the genomes of hepatocellular carcinoma patients」(Genome Res. (2012) 22, 593-601) 和Sung等人發表的「Genome-wide survey of recurrent HBV integration in hepatocellular carcinoma」(Nature Genetics (2012) 44, 765-769);上述文獻揭露了使用全基因體定序 (whole genome sequencing) 以偵測肝細胞癌之肝組織樣本中HBV嵌入基因體的狀況。然而,這些直接定序的偵測方法效率不佳。Jiang提及大約每次定序平均會產生2500萬至3500萬個75 bp之核酸片段讀值,但是在Jiang的偵測方法中,可測得的HBV核酸片段讀值為600萬個,且僅有400個嵌合點 (junction) 讀值。更進一步地,目前沒有任何使用直接定序法的研究能夠從循環系統中的腫瘤DNA (ctDNA) 樣本中偵測HBV的嵌入事件。
而後,Li等人所發表的「HIVID: An efficient method to detect HBV integration using low coverage sequencing」(Genomics (2013) 102:4, 338-344) 和Zhao等人所發表的「Genomic and oncogenic preference of HBV integration in hepatocellular carcinoma」(Nature Communications (2016) 7:12992) 揭露了可捕捉特定序列的探針之使用方法,該些探針是依照HBV基因體中的序列設計的,且能夠偵測HBV嵌入基因體的狀態。然而,Li和Zhao皆沒有提供設計該些探針時更清楚的設計邏輯。更進一步地,Li和Zhao的研究中所揭露的探針效率不佳:在Li和Zhao的研究中,探針對人類基因體的平均對準率為83.7%,而HBV序列的平均對準率和偵測嵌入事件的比率卻分別低到0.08%和0.01%,代表著該些探針無法偵測HBV嵌入人類基因體,或偵測嵌入事件時的低效率。
本發明提供了一組探針組合及分析方法,上述的探針組合和分析方法將可用於高效率和高敏感度地捕捉病毒DNA和病毒-宿主嵌合點 (viral-host junction)。
根據以下一個或多個本發明之實施例,本發明提供了一種可偵測癌症之探針組合。該探針組合包括一組或多組以HBV局部基因體做為標的之探針,其中當每一組該以HBV局部基因體做為標的之探針依該HBV局部基因體序列排列對齊時,已對齊的該些以HBV局部基因體做為標的之探針於對齊後所組成的一整體序列和一種HBV基因型的一基因體中之一DR序列 (direct repeat region) 的一參考序列互相匹配,且在該些已對齊的多組以HBV局部基因體做為標的之探針中,每一個該以HBV局部基因體做為標的之探針序列的一部分和相鄰的一個或二個以HBV局部基因體做為標的之探針序列的一部分相重疊。
在一實施例中,該些HBV基因型包括基因型A型、基因型B型、基因型C型、基因型D型、基因型E型、基因型F型、基因型G型、基因型H型、基因型I型和基因型J型。
在一實施例中,該些DR序列的參考序列包括SEQ ID NO. 1至SEQ ID NO. 32。
在一實施例中,該探針組合包括一組或多組以HBV全基因體做為標的之探針,其中當每一組該以HBV全基因體做為標的之探針依該HBV全基因體序列排列對齊時,已對齊的該些以HBV全基因體做為標的之探針於對齊後所組成的一整體序列和一種HBV基因型的該基因體互相匹配,且在該些已對齊的多組以HBV全基因體做為標的之探針中,每一個該以HBV全基因體做為標的之探針序列的一部分和相鄰的一個或二個以HBV全基因體做為標的之探針序列的一部分相重疊。
在一實施例中,該探針組合更包括一組或多組以癌症熱點基因做為標的之探針,其中當每一組該以癌症熱點基因做為標的之探針依該癌症熱點基因序列排列對齊時,已對齊的該些以癌症熱點基因做為標的之探針於對齊後所組成的一整體序列和一癌症熱點基因的一參考序列互相匹配,且在該些已對齊的多組以癌症熱點基因做為標的之探針中,每一個該以癌症熱點基因做為標的之探針序列的一部分和相鄰的一個或二個以癌症熱點基因做為標的之探針序列的一部分相重疊。
在一實施例中,該癌症熱點基因包括CTNNB1、TERT和TP53。
在一實施例中,該癌症熱點基因之該參考序列包括SEQ ID NOs. 33-41。
在一實施例中,該探針組合更包括一組或多組以外源性基因做為標的之探針,其中當該每一組以外源性基因做為標的之探針依該外源性基因序列排列對齊時,已對齊的該些以外源性基因做為標的之探針於對齊後所組成的一整體序列和一外源性基因的一參考序列互相匹配,且在該些已對齊的多組以外源型基因做為標的之探針中,每一個該以外源性基因做為標的之探針序列的一部分和相鄰的一個或二個以外源型基因做為標的之探針序列的一部分相重疊。
在一實施例中,該外源性基因源自於一λ噬菌體。
在一實施例中,該外源性基因的該參考序列包括SEQ ID NOs. 42-54。
在一實施例中,該探針組合更包括一組或多組以內源性基因做為標的之探針,其中當該每一組以內源性基因做為標的之探針依該內源性基因序列排列對齊時,已對齊的該些以內源性基因做為標的之探針於對齊後所組成的一整體序列和一內源性基因的一參考序列互相匹配,且在該些已對齊的多組以內源性基因做為標的之探針中,每一個該以內源性基因做為標的之探針序列的一部分和相鄰的一個或二個以內源性基因做為標的之探針序列的一部分相重疊。
在一實施例中,該內源性基因包括GAPDH和GdX。
在一實施例中,該內源性基因的該參考序列包括SEQ ID NO. 55和SEQ ID NO.56。
較佳地,各個實施例中的該探針組合可偵測到的癌症包括肝細胞癌。
較佳地,各個實施例中的該探針組合是用於捕捉具有病毒-宿主嵌合點的標的核酸片段,該標的核酸片段是由一感染HBV的對象的一樣本中之DNA所取得。
較佳地,由該樣本中取得之DNA包括基因體DNA和循環系統中的腫瘤DNA。
根據以上實施例,本發明可提供一用來偵測病毒感染或病毒感染所導致之癌症的工具。本發明的眾多實施例能夠應用於偵測各種不同種類的DNA病毒和其病毒嵌入基因體現象。根據眾多實施例所設計的探針組合確保了能夠涵蓋到最佳的病毒/宿主序列,且也考慮到了病毒基因的不穩定性。該探針組合也被證實了具備高敏感度、高效率和可信度。
為使圖式簡明清楚,因此不同圖式中代表相對應元件之符號可能會重複。另外為了使實施例可被完整地理解,本說明書也針對各實施例中的諸多細節進行說明。然而,本技術領域中具有通常技藝之人也可不需上述諸多細節就可實施以下各實施例。本發明之圖式並不代表部分元件之尺寸和比例,且有可能會將部分元件誇大表示以更佳地說明該元件相關之細節和特徵。本說明書之目的並非限制以下實施例之內容。
本發明中的各詞彙僅用於描述特定實施例,且並非限制本發明之內容。「和/或」以及「至少一」係包括了任何和所有列出的元件、區域。同時,雖然本發明中會出現「第一」、「第二」和「第三」一類的詞彙,然而該些詞彙僅用於區別一元件和另一元件、一區域和另一區域,以及一部件和另一部件時。因此,以不偏離本發明的教示做為前提,一第一元件、第一區域或第一部件也可被命名為第二元件、第二區域或第二部件。另外,除非有另行定義,否則本發明中的所有詞彙 (包括專有名詞) 皆為本技術領域中具有通常技藝之人所認知的詞彙。
本發明的其中一個面向提供了一探針組合,該探針組合包括了一組或多組以特定序列做為標的之多個探針。該些探針可包括單股寡核苷酸 (single stranded oligonucleotides) 和單股聚核苷酸 (single stranded polynucleotide),例如單股去氧核醣核酸 (ssDNA;single stranded deoxyribonucleic acids)、單股核醣核酸 (single stranded ribonucleic acids) 和單股人造核苷酸 (single stranded artificial nucleotides)。該探針組合可用於偵測病毒感染或病毒感染所引起的癌症,特別是DNA病毒所引起的癌症。在某些實施例中,該探針組合可用於偵測HBV、人類乳突病毒 (HPV)、艾司坦-巴爾病毒 (EBV;Epstein-Barr Virus)、第8型疱疹病毒 (HHV-8;Herpes Virus-8)、人類嗜T淋巴球病毒 (HTLV;Human T-lymphotropic Virus)、Merkel氏多瘤病毒 (MCV;Merkel Cell Polyomavirus)或其他DNA病毒。在其他實施例中,該探針組合可用於偵測肝細胞癌(hepatocellular carcinoma)、肝癌 (liver cancer)、子宮頸癌 (cervical cancer)、陰莖癌 (penile cancer)、肛門癌 (anal cancer)、陰道癌 (vaginal cancer)、外陰癌 (vulvar cancer)、口腔癌 (oral cancer)、口咽癌 (oropharyngeal cancer)、鼻咽癌 (nasopharyngeal cancer)、頭頸癌 (head and neck cancer)、淋巴癌 (lymphoma)、原發性積液淋巴癌 (primary effusion lymphoma)、胃癌 (stomach cancer)、卡波西氏肉瘤 (Kaposi sarcoma)、Merkel氏細胞癌 (Merkel cell carcinoma) 或其他由DNA病毒感染所引起的癌症。
根據本發明的一種實施例,該探針組合包括一組或多組以特定病毒全基因體做為標的之探針。當每一該以特定病毒全基因體做為標的之探針依該特定病毒全基因體序列對齊時,已對齊的該些以特定病毒全基因體做為標的之探針之於對齊後所組成的一整體序列和一種特定病毒基因型的該基因體的一參考序列互相匹配。該特定病毒得標的基因型可包括前述DNA病毒的不同基因型。例如若該特定病毒為HBV,則其標的基因型就可包括基因型A型、基因型B型、基因型C型、基因型D型、基因型E型、基因型F型、基因型G型、基因型H型、基因型I型和基因型J型。該特定病毒基因體的該參考序列可由NCBI GenBank (https://www.ncbi.nlm.nih.gov/genbank/) 或自臨床樣本中所獲得的序列取得。例如HBV基因型A型的參考序列可由NCBI GenBank Accession No. AP007263、HE974383或HE974381取得;HBV基因型B型的參考序列可由GenBank Accession No. AB981581、AB602818或AB554017取得;HBV基因型C型的參考序列可由GenBank Accession No. LC360507、AB644287或AB113879取得;HBVD型的參考序列可由GenBank Accession No. HE815465、HE974382或AB554024取得;HBV基因型E型的參考序列可由GenBank Accession No. HE974380、HE974384或AP007262取得;HBV基因型F型的參考序列可由GenBank Accession No. DQ823095、AB036909或AB036920取得;HBV基因型G型的參考序列可由GenBank Accession No. AB625342、HE981176或GU563559取得;HBV基因型H型的參考序列可由GenBank Accession No. AB298362、AB846650或AB516395取得;HBV基因型I型的參考序列可由GenBank Accession No. EU833891、KF214680或KU950741取得;HBV基因型J型的參考序列可由GenBank Accession No. AB486012取得。
在一實施例中,該探針組合包括二組以HBV全基因體做為標的之探針。當一組以HBV全基因體做為標的之探針依該HBV全基因體序列排列對齊時,已對齊的該些以HBV全基因體做為標的之探針於對齊後所組成的一整體序列和HBV基因型B型的一基因體的一參考序列 (SEQ ID NO. 1) 互相匹配。同樣的,當其他組以HBV全基因體做為標的之探針依該HBV全基因體序列排列對齊時,已對齊的該些以HBV全基因體做為標的之探針於對齊後所組成的一整體序列和HBV基因型C型的一基因體的一參考序列 (SEQ ID NO. 2) 互相匹配。在此實施例中,該HBV參考序列取得的方法如圖1所示。如步驟S1中所示,DNA由樣本中萃取而來,該樣本可為被HBV慢性感染的病人之生物性液體,例如:血液、淋巴液、尿液、汗液、唾液、眼淚或胃腸液 (interstinal fluid);或為其組織,例如肝組織。該萃取出的DNA包括了病人的基因體DNA(gDNA)和/或循環系統中的腫瘤DNA (ctDNA)。如步驟S2中所示,該萃取出的DNA依據NCBI GenBank中已知的各種HBV基因型而定序且分類。在此實施例中,選擇HBV基因型B型和基因型C型的原因,是由於此二種基因型盛行於台灣肝細胞癌病人之中;然而本發明的實施例並不限於HBV基因型B型和基因型C型,而是可包含各種能造成持續性感染之DNA病毒的不同基因型。如步驟S3中所示,以Clustal演算法對齊並計算每一所選基因型之序列,並根據每一位置所共同擁有之對偶片段序列,得到該病毒基因型的一共通序列 (consensus sequence)。最後,該共通序列被用來當做該病毒基因型的一參考序列。在此實施例中,該些參考序列包括HBV基因型B型和基因型C型的多個共通序列,其中該些參考序列可分別涵蓋HBV基因型B型的基因體中的全部3,191 bp序列,或HBV基因型C型基因體中的全部3,191 bp序列。
在此實施例中,該以病毒序列做為標的之探針被設計為:當該些以病毒全基因體做為標的之探針依該病毒全基因體序列排列對齊時,每一以病毒全基因體做為標的之探針的一部分會直接和相鄰的以病毒全基因體做為標的之探針的一部分相重疊。如圖2A所示,在此實施例中,每一以HBV全基因體序列211做為標的之探針212的一部分會直接和一個或二個相鄰的以HBV全基因體序列211做為標的之探針212的一部分重疊。該序列重疊部分的長度不等,較佳地為50% (在此以2X重疊密度表示) 或75% (在此以4X重疊密度表示),如圖2B所示。在一實施例中,該探針被設計為具有120 bp的長度和2X重疊密度,每一探針會直接和相鄰的探針重疊60 bp。同樣的,若該些探針的長度分別為120 bp和4X重疊密度,則每一探針將會直接和相鄰的探針重疊90 bp。
進一步地,在設計該些探針時,該病毒的基因體結構也是考量因素之一。在以HBV基因體做為標的之實施例中,由於HBV基因體為環形,因此該些以HBV全基因體做為標的之探針中,其最後的探針將超過該HBV基因體之該參考序列的第3191 bp,且會在該參考序列的起始鹼基處 (即第1 bp) 繼續下去。例如一探針之長度為120 bp,且起始於該HBV全基因體的參考序列的第3,121 bp;該探針將包括一個71 bp長的區域以對應該參考序列的第3,121至第3,191 bp,緊接在後的是一個49 bp長的區域,以對應該參考序列的第1至第49 bp。
本發明的實施例並不限制該些探針的長度;該些探針的長度可基於成本、捕捉效率、敏感度、特異性或其他因素進行設計。在某些實施例中,任一參考序列所對應的探針可能數量N可由以下的公式1進行計算:
在公式1中L代表該參考序列的長度,而P代表該些探針的長度,P之範圍可為一最小長度 (以min表示) 至一最大長度 (以max表示)。例如基於一長度為3191 bp的HBV基因型B型或C型參考序列,如其探針序列長度為50至120 bp之間,則可設計出220,597種探針。
根據本發明的一實施例,該探針組和可以包括一組或多組以特定病毒局部基因體做為標的之探針。當每一組該以特定病毒局部基因體做為標的之探針依該特定病毒局部基因體序列排列對齊時,已對齊的該些以特定病毒局部基因體做為標的之探針於對齊後所組成的一整體序列和一特定病毒局部基因體之一特別區上的一參考序列互相匹配。在該些已對齊的多組以特定病毒局部基因體做為標的的探針中,每一個以特定病毒局部基因體做為標的的探針的一部分和相鄰的一個或二個以該特定病毒局部基因體做為標的的探針的一部分相重疊。在某些實施例中,上述的特別區包括一在HBV基因體中且介於DR序列1 (direct repeat 1) 和DR序列2 (direct repeat 2) 之間的區域。在其他實施例中,該特別區可為一介於DR序列1和DR序列2之間的區域,再加上兩個自上述區域延伸出的延展區,以使其長度達到一指定長度。例如:為了定義一長度為960 bp,位於DR序列上的參考序列,可以假設DR序列1和DR序列2分別位於病毒基因體上的第360至第370 bp和第594至604 bp,該參考序列可以定義為DR序列1和DR序列2之間的區域且再加上由兩端起算360 bp的延展區。同時,該HBV基因型A型基因體上的一DR序列上的該參考序列可為SEQ ID NOs. 3-5;該HBV基因型B型基因體上的一DR序列上的該參考序列可為SEQ ID NOs. 6-9;該HBV基因型C型基因體上的一DR序列上的該參考序列可為SEQ ID NOs 10-13;該HBV基因型D型基因體上的一DR序列上的該參考序列可為SEQ ID NOs. 14-16;該HBV基因型E型基因體上的一DR序列上的該參考序列可為SEQ ID NOs. 17-19;該HBV基因型F型基因體上的一DR序列上的該參考序列可為SEQ ID NOs. 20-22;該HBV基因型G型基因體上的一DR序列上的該參考序列可為SEQ ID NOs. 23-25;該HBV基因型H型基因體上的一DR序列上的該參考序列可為SEQ ID NOs. 26-28;該HBV基因型I型基因體上的一DR序列上的該參考序列可為SEQ ID NOs. 29-31;該HBV基因型J型基因體上的一DR序列上的該參考序列可為SEQ ID NOs. 32。
在一實施例中,該探針組合可包括二組以HBV局部基因體做為標的之探針。當中當每一組該以HBV局部基因體做為標的之探針依該HBV局部基因體序列之序列排列對齊時,已對齊的該些以HBV局部基因體做為標的之探針於對齊後所組成的一整體序列和HBV基因型B型的一基因體中之一DR序列的一參考序列 (SEQ ID NO. 9),或HBV基因型C型的一基因體中之一DR序列的一參考序列 (SEQ ID NO. 13) 互相匹配。該些DR序列可被定義為位於第1190至第2234 bp、第1231至第2190 bp或其他在HBV基因體中的特別區。和前述類似的是,每一個該以HBV局部基因體做為標的之探針的一部分和相鄰的一個或二個以HBV局部基因體做為標的之探針序列的一部分相重疊。該些重疊序列的長度可為但不限於50% (即為2X重疊密度) 或75% (即為4X重疊密度)。
可使用前述的公式1計算該些以HBV局部基因體中該DR序列的參考序列 (SEQ ID NOs. 9和13) 做為標的之探針的可能數量。例如基於一長度為960 bp的HBV DR序列中之參考序列,在探針序列總長為50至120 bp之間的前提下,則可設計出62,196種探針。
根據本發明的一實施例,該探針組合包括一組以病毒全基因體序列做為標的之探針和一組以病毒局部基因體做為標的之序列探針。以該病毒全基因體序列做為標的之探針和以病毒局部基因體序列做為標的之探針可合併使用,以提升該探針組合所能涵蓋的該病毒基因體中之參考序列範圍。在一實施例中,該以HBV局部基因體做為標的之探針可被設計為覆蓋該基因體中的DR序列。例如,假設該以HBV全基因體做為標的之探針的長度為120 bp並起始於HBV基因體的第1、第61和第121 bp (該探針重疊序列設計為2X重疊密度),該以HBV局部基因體做為標的之探針的重疊序列則設計為2X重疊密度且起始於HBV基因體的第31、第91和第121 bp。亦即,該DR序列即可被二組探針所涵蓋 (即上述的以HBV全基因體做為標的之探針和以HBV局部基因體做為標的之探針) 且探針的重疊序列為4X重疊密度(即每一探針和其直接相鄰之探針有75%的序列重疊)。
根據本發明的一實施例,該探針組合更進一步包括一組或多組以癌症熱點基因 (hotspot genes) 做為標的之探針。其中當每一組該以癌症熱點基因做為標的之探針依該癌症熱點基因序列排列對齊時,已對齊的該些以癌症熱點基因做為標的之探針於對齊後所組成的一整體序列和一癌症熱點基因的一參考序列互相匹配。在該些已對齊的多組以癌症熱點基因做為標的之探針中,每一個該以癌症熱點基因做為標的之探針序列的一部分和相鄰的一個或二個以癌症熱點基因做為標的之探針序列的一部分相重疊。該些重疊序列的長度可為但不限於50% (即為2X重疊密度) 或75% (即為4X重疊密度)。
該些癌症熱點基因的參考序列可由NCBI基因資料庫(www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=gene,以下並以該資料庫中的「Entrez Gene ID」表示) 取得。該些癌症熱點基因可包括但不限於以下至少一種基因:ABL1 (Entrez Gene ID: 25)、ABL2 (Entrez Gene ID: 27)、ACSL3 (Entrez Gene ID: 2181)、AF15Q14 (Entrez Gene ID: 57082)、AF1Q (Entrez Gene ID: 10962)、AF3p21 (Entrez Gene ID: 51517)、AF5q31 (Entrez Gene ID: 27125)、AKAP9 (Entrez Gene ID: 10142)、AKT1 (Entrez Gene ID: 207)、AKT2 (Entrez Gene ID: 208)、ALDH2 (Entrez Gene ID: 217)、ALK (Entrez Gene ID: 238)、ALO17 (Entrez Gene ID: 57674)、APC (Entrez Gene ID: 11789)、ARHGEF12 (Entrez Gene ID: 23365)、ARHH (Entrez Gene ID: 399)、ARID1A (Entrez Gene ID: 8289)、ARID2 (Entrez Gene ID: 196528)、ARNT (Entrez Gene ID: 405)、ASPSCR1 (Entrez Gene ID: 79058)、ASXL1 (Entrez Gene ID: 171023)、ATF1 (Entrez Gene ID: 466)、ATIC (Entrez Gene ID: 471)、ATM (Entrez Gene ID: 472)、ATRX (Entrez Gene ID: 546)、BAP1 (Entrez Gene ID: 8314)、BCL10 (Entrez Gene ID: 8915)、BCL11A (Entrez Gene ID: 53335)、BCL11B (Entrez Gene ID: 64919)、BCL2 (Entrez Gene ID: 596)、BCL3 (Entrez Gene ID: 602)、BCL5 (Entrez Gene ID: 603)、BCL6 (Entrez Gene ID: 604)、BCL7A (Entrez Gene ID: 605)、BCL9 (Entrez Gene ID: 607)、BCOR (Entrez Gene ID: 54880)、BCR (Entrez Gene ID: 613)、BHD (Entrez Gene ID: 50947)、BIRC3 (Entrez Gene ID: 330)、BLM (Entrez Gene ID: 641)、BMPRIA (Entrez Gene ID: 12166)、BRAF (Entrez Gene ID: 673)、BRCA1 (Entrez Gene ID: 672)、BRCA2 (Entrez Gene ID: 675)、BRD3 (Entrez Gene ID: 8019)、BRD4 (Entrez Gene ID: 23476)、BRIP1 (Entrez Gene ID: 83990)、BTG1 (Entrez Gene ID: 694)、BUB1B (Entrez Gene ID: 701)、C15orf55 (Entrez Gene ID: 144535)、C16orf75 (Entrez Gene ID: 387882)、CANT1 (Entrez Gene ID: 124583)、CARD11 (Entrez Gene ID: 84433)、CARs (Entrez Gene ID: 833)、CBFB (Entrez Gene ID: 865)、CBL (Entrez Gene ID: 867)、CBLB (Entrez Gene ID: 868)、CBLC (Entrez Gene ID: 23624)、CCNB1IP1 (Entrez Gene ID: 57820)、CCND1 (Entrez Gene ID: 595)、CCND2 (Entrez Gene ID: 894)、CCND3 (Entrez Gene ID: 896)、CCNE1 (Entrez Gene ID: 898)、CD273 (Entrez Gene ID: 80380)、CD274 (Entrez Gene ID: 29126)、CD74 (Entrez Gene ID: 972)、CD79A (Entrez Gene ID: 973)、CD79B (Entrez Gene ID: 974)、CDH1 (Entrez Gene ID: 999)、CDH11 (Entrez Gene ID: 1009)、CDK12 (Entrez Gene ID: 51755)、CDK4 (Entrez Gene ID: 1019)、CDK6 (Entrez Gene ID: 1021)、CDKN2A (Entrez Gene ID: 1029)、CDKN2C (Entrez Gene ID: 1031)、CDX2 (Entrez Gene ID: 1045)、CEBPA (Entrez Gene ID: 1050)、CEP1 (Entrez Gene ID: 11064)、CHCHD7 (Entrez Gene ID: 79145)、CHEK2 (Entrez Gene ID: 11200)、CHIC2 (Entrez Gene ID: 26511)、CHN1 (Entrez Gene ID: 1123)、CIC (Entrez Gene ID: 23152)、CIITA (Entrez Gene ID: 4261)、CLTC (Entrez Gene ID: 1213)、CLTCL1 (Entrez Gene ID: 8218)、CMKOR1 (Entrez Gene ID: 57007)、CoL1A1 (Entrez Gene ID: 1277)、CPBP (Entrez Gene ID: 1316)、COX6C (Entrez Gene ID: 1345)、CREB1 (Entrez Gene ID: 1385)、CREB3L1 (Entrez Gene ID: 90993)、CREB3L2 (Entrez Gene ID: 64764)、CREBBP (Entrez Gene ID: 1387)、CRLF2 (Entrez Gene ID: 64109)、CRTC3 (Entrez Gene ID: 64784)、CTNNB1 (catenin beta 1; Entrez Gene ID: 1499)、CYLD (Entrez Gene ID: 1540)、D10S170 (Entrez Gene ID: 8030)、DAXX (Entrez Gene ID: 1616)、DDB2 (Entrez Gene ID: 1643)、DDX10 (Entrez Gene ID: 1662)、DDX5 (Entrez Gene ID: 1655)、DDX6 (Entrez Gene ID: 1656)、DEK (Entrez Gene ID: 7913)、DICER1 (Entrez Gene ID: 23405)、DNMT3A (Entrez Gene ID: 1788)、DUX4 (Entrez Gene ID: 100288687)、EBF1 (Entrez Gene ID: 1879)、EGFR (Entrez Gene ID: 1956)、EIF4A2 (Entrez Gene ID: 1974)、ELF4 (Entrez Gene ID: 2000)、ELK4 (Entrez Gene ID: 2005)、ELKS (Entrez Gene ID: 23085)、ELL (Entrez Gene ID: 8178)、ELN (Entrez Gene ID: 2006)、EML4 (Entrez Gene ID: 27436)、EP300 (Entrez Gene ID: 2033)、EPS15 (Entrez Gene ID: 2060)、ERBB2 (Entrez Gene ID: 2064)、ERCC2 (Entrez Gene ID: 2068)、ERCC3 (Entrez Gene ID: 2071)、ERCC4 (Entrez Gene ID: 2072)、ERCC5 (Entrez Gene ID: 2073)、ERG (Entrez Gene ID: 2078)、ETV1 (Entrez Gene ID: 2115)、ETV4 (Entrez Gene ID: 2118)、ETV5 (Entrez Gene ID: 2119)、ETV6 (Entrez Gene ID: 2120)、EVI1 (Entrez Gene ID: 2122)、EWsR1 (Entrez Gene ID: 2130)、EXT1 (Entrez Gene ID: 2131)、EXT2 (Entrez Gene ID: 2132)、EZH2 (Entrez Gene ID: 2146)、FACL6 (Entrez Gene ID: 23305)、FAM22A (Entrez Gene ID: 728118)、FAM22B (Entrez Gene ID: 729262)、FAM46C (Entrez Gene ID: 54855)、FANCA (Entrez Gene ID: 2175)、FANCC (Entrez Gene ID: 2176)、FANCD2 (Entrez Gene ID: 2177)、FANCE (Entrez Gene ID: 2178)、FANCF (Entrez Gene ID: 2188)、FANCG (Entrez Gene ID: 2189)、FBXO11 (Entrez Gene ID: 80204)、FBXW7 (Entrez Gene ID: 55294)、FCGR2B (Entrez Gene ID: 2213)、FEV (Entrez Gene ID: 54738)、FGFR1 (Entrez Gene ID: 2260)、FGFR1OP (Entrez Gene ID: 11116)、FGFR2 (Entrez Gene ID: 2263)、FGFR3 (Entrez Gene ID: 2261)、FH (Entrez Gene ID: 2271)、FHIT (Entrez Gene ID: 2272)、FIP1L1 (Entrez Gene ID: 81608)、FLI1 (Entrez Gene ID: 2313)、FLT3 (Entrez Gene ID: 2322)、FNBP1 (Entrez Gene ID: 23048)、FOXL2 (Entrez Gene ID: 668)、FOXO1 (Entrez Gene ID: 2308)、FOXO3A (Entrez Gene ID: 2309)、FOXP1 (Entrez Gene ID: 27086)、FSTL3 (Entrez Gene ID: 10272)、FUBP1 (Entrez Gene ID: 8880)、FUS (Entrez Gene ID: 2521)、FVT1 (Entrez Gene ID: 2531)、GAS7 (Entrez Gene ID: 8522)、GATA1 (Entrez Gene ID: 2623)、GATA2 (Entrez Gene ID: 2624)、GATA3 (Entrez Gene ID: 2625)、GMPS (Entrez Gene ID: 8833)、GNA11 (Entrez Gene ID: 2767)、GNAQ (Entrez Gene ID: 2776)、GNAS (Entrez Gene ID: 2778)、GOLGA5 (Entrez Gene ID: 9950)、GOPC (Entrez Gene ID: 57120)、GPC3 (Entrez Gene ID: 2719)、GPHN (Entrez Gene ID: 10243)、GRAF (Entrez Gene ID: 23092)、HCMOGT-1 (Entrez Gene ID: 92521)、HEAB (Entrez Gene ID: 10978)、HERPUD1 (Entrez Gene ID: 9709)、HEY1 (Entrez Gene ID: 23462)、HIP1 (Entrez Gene ID: 3092)、HIST1H4I (Entrez Gene ID: 8294)、HLF (Entrez Gene ID: 3131)、HLXB9 (Entrez Gene ID: 3110)、HMGA1 (Entrez Gene ID: 3159)、HMGA2 (Entrez Gene ID: 8091)、HNRNPA2B1 (Entrez Gene ID: 3181)、HOOK3 (Entrez Gene ID: 84376)、HOXA11 (Entrez Gene ID: 3207)、HOXA13 (Entrez Gene ID: 3209)、HOXA9 (Entrez Gene ID: 3205)、HOXC11 (Entrez Gene ID: 3227)、HOXC13 (Entrez Gene ID: 3229)、HOXD11 (Entrez Gene ID: 3237)、HOXD13 (Entrez Gene ID: 3239)、HRAS (Entrez Gene ID: 3265)、HRPT2 (Entrez Gene ID: 79577)、HSPCA (Entrez Gene ID: 3320)、HSPCB (Entrez Gene ID: 3326)、IDH1 (Entrez Gene ID: 3417)、IDH2 (Entrez Gene ID: 3418)、IGH@ (Entrez Gene ID: 3492)、IGK@ (Entrez Gene ID: 50802)、IGL@ (Entrez Gene ID: 3535)、IKZF1 (Entrez Gene ID: 10320)、IL2 (Entrez Gene ID: 3558)、IL21R (Entrez Gene ID: 50615)、IL6ST (Entrez Gene ID: 3572)、IL7R (Entrez Gene ID: 3575)、IRF4 (Entrez Gene ID: 3662)、IRTA1 (Entrez Gene ID: 83417)、ITK (Entrez Gene ID: 3702)、JAK1 (Entrez Gene ID: 3716)、JAK2 (Entrez Gene ID: 3717)、JAK3 (Entrez Gene ID: 3718)、JAZF1 (Entrez Gene ID: 221895)、JUN (Entrez Gene ID: 3725)、KDR (Entrez Gene ID: 3791)、KIAA1549 (Entrez Gene ID: 57670)、KIT (Entrez Gene ID: 3815)、KLK2 (Entrez Gene ID: 3817)、KRAS (Entrez Gene ID: 3845)、KTN1 (Entrez Gene ID: 3895)、LAF4 (Entrez Gene ID: 3899)、LASP1 (Entrez Gene ID: 3927)、LCK (Entrez Gene ID: 3932)、LCP1 (Entrez Gene ID: 3936)、LCX (Entrez Gene ID: 80312)、LHFP (Entrez Gene ID: 10186)、LIFR (Entrez Gene ID: 3977)、LMO1 (Entrez Gene ID: 4004)、LMO2 (Entrez Gene ID: 4005)、LPP (Entrez Gene ID: 4026)、LYL1 (Entrez Gene ID: 4066)、MADH4 (Entrez Gene ID: 4089)、MAF (Entrez Gene ID: 4094)、MAFB (Entrez Gene ID: 9935)、MALT1 (Entrez Gene ID: 10892)、MAML2 (Entrez Gene ID: 84441)、MAP2K4 (Entrez Gene ID: 6416)、MDM2 (Entrez Gene ID: 4193)、MDM4 (Entrez Gene ID: 4194)、MDS1 (Entrez Gene ID: 2122)、MDS2 (Entrez Gene ID: 259283)、MECT1 (Entrez Gene ID: 23373)、MED12 (Entrez Gene ID: 9968)、MEN1 (Entrez Gene ID: 4221)、MET (Entrez Gene ID: 4233)、MITF (Entrez Gene ID: 4286)、MKL1 (Entrez Gene ID: 57591)、MLF1 (Entrez Gene ID: 4291)、MLH1 (Entrez Gene ID: 4292)、MLL (Entrez Gene ID: 4297)、MLL2 (Entrez Gene ID: 8085)、MLL3 (Entrez Gene ID: 58508)、MLLT1 (Entrez Gene ID: 4298)、MLLT10 (Entrez Gene ID: 8028)、MLLT2 (Entrez Gene ID: 4299)、MLLT3 (Entrez Gene ID: 4300)、MLLT4 (Entrez Gene ID: 4301)、MLLT6 (Entrez Gene ID: 4302)、MLLT7 (Entrez Gene ID: 4303)、MN1 (Entrez Gene ID: 4330)、MPL (Entrez Gene ID: 4352)、MSF (Entrez Gene ID: 10801)、MSH2 (Entrez Gene ID: 4436)、MSH6 (Entrez Gene ID: 2956)、MsI2 (Entrez Gene ID: 124540)、MSN (Entrez Gene ID: 4478)、MTCP1 (Entrez Gene ID: 4515)、MUC1 (Entrez Gene ID: 4582)、MUTYH (Entrez Gene ID: 4595)、MYB (Entrez Gene ID: 4602)、MYC (Entrez Gene ID: 4609)、MYCL1 (Entrez Gene ID: 4610)、MYCN (Entrez Gene ID: 4613)、MYD88 (Entrez Gene ID: 4615)、MYH11 (Entrez Gene ID: 4629)、MYH9 (Entrez Gene ID: 4627)、MYST4 (Entrez Gene ID: 23522)、NACA (Entrez Gene ID: 4666)、NBS1 (Entrez Gene ID: 4683)、NCOA1 (Entrez Gene ID: 8648)、NCOA2 (Entrez Gene ID: 10499)、NCOA4 (Entrez Gene ID: 8031)、NDRG1 (Entrez Gene ID: 10397)、NF1 (Entrez Gene ID: 4763)、NF2 (Entrez Gene ID: 4771)、NFE2L2 (Entrez Gene ID: 4780)、NFIB (Entrez Gene ID: 4781)、NFKB2 (Entrez Gene ID: 4791)、NIN (Entrez Gene ID: 51199)、NKX2-1 (Entrez Gene ID: 7080)、NONO (Entrez Gene ID: 4841)、NOTCH1 (Entrez Gene ID: 4851)、NOTCH2 (Entrez Gene ID: 4853)、NPM1 (Entrez Gene ID: 4869)、NR4A3 (Entrez Gene ID: 8013)、NRAS (Entrez Gene ID: 4893)、NSD1 (Entrez Gene ID: 64324)、NTRK1 (Entrez Gene ID: 4914)、NTRK3 (Entrez Gene ID: 4916)、NUMA1 (Entrez Gene ID: 4926)、NUP214 (Entrez Gene ID: 8021)、NUP98 (Entrez Gene ID: 4928)、OLIG2 (Entrez Gene ID: 10215)、OMD (Entrez Gene ID: 4958)、PAFAHIB2 (Entrez Gene ID: 5049)、PALB2 (Entrez Gene ID: 79728)、PAX3 (Entrez Gene ID: 5077)、PAX5 (Entrez Gene ID: 5079)、PAX7 (Entrez Gene ID: 5081)、PAX8 (Entrez Gene ID: 7849)、PBRM1 (Entrez Gene ID: 55193)、PBX1 (Entrez Gene ID: 5087)、PCM1 (Entrez Gene ID: 5108)、PCSK7 (Entrez Gene ID: 9159)、PDE4DIP (Entrez Gene ID: 9659)、PDGFB (Entrez Gene ID: 5155)、PDGFRA (Entrez Gene ID: 5156)、PDGFRB (Entrez Gene ID: 5159)、PER1 (Entrez Gene ID: 5187)、PHOX2B (Entrez Gene ID: 8929)、PICALM (Entrez Gene ID: 8301)、PIK3CA (Entrez Gene ID: 5290)、PIK3R1 (Entrez Gene ID: 5295)、PIM1 (Entrez Gene ID: 5292)、PLAG1 (Entrez Gene ID: 5324)、PML (Entrez Gene ID: 5371)、PMS1 (Entrez Gene ID: 5378)、PMS2 (Entrez Gene ID: 5395)、PMX1 (Entrez Gene ID: 5396)、PNUTL1 (Entrez Gene ID: 5413)、POU2AFI (Entrez Gene ID: 5450)、POU5F1 (Entrez Gene ID: 5460)、PPARG (Entrez Gene ID: 5468)、PPP2R1A (Entrez Gene ID: 5518)、PRCC (Entrez Gene ID: 5546)、PRDM1 (Entrez Gene ID: 639)、PRDM16 (Entrez Gene ID: 63976)、PRF1 (Entrez Gene ID: 5551)、PRKAR1A (Entrez Gene ID: 5573)、PRO1073 (Entrez Gene ID: 57018)、PSIP2 (Entrez Gene ID: 11168)、PTCH (Entrez Gene ID: 5727)、PTEN (Entrez Gene ID: 5728)、PTPN11 (Entrez Gene ID: 5781)、RAB5EP (Entrez Gene ID: 9135)、RAD51L1 (Entrez Gene ID: 5890)、RAF1 (Entrez Gene ID: 5894)、RALGDS (Entrez Gene ID: 5900)、RANBP17 (Entrez Gene ID: 64901)、RAP1GDS1 (Entrez Gene ID: 5910)、RARA (Entrez Gene ID: 5914)、RB1 (Entrez Gene ID: 5925)、RBM15 (Entrez Gene ID: 64783)、RECQL4 (Entrez Gene ID: 9401)、REL (Entrez Gene ID: 5966)、RET (Entrez Gene ID: 5979)、ROS1 (Entrez Gene ID: 6098)、RPL22 (Entrez Gene ID: 6146)、RPN1 (Entrez Gene ID: 6184)、RuNDC2A (Entrez Gene ID: 92017)、RUNX1 (Entrez Gene ID: 861)、RUNXBP2 (Entrez Gene ID: 7994)、SBDS (Entrez Gene ID: 51119)、SDH5 (Entrez Gene ID: 54949)、SDHB (Entrez Gene ID: 6390)、SDHC (Entrez Gene ID: 6391)、SDHD (Entrez Gene ID: 6392)、SEPT6 (Entrez Gene ID: 23157)、SET (Entrez Gene ID: 6418)、SETD2 (Entrez Gene ID: 29072)、SF3B1 (Entrez Gene ID: 23451)、SFPQ (Entrez Gene ID: 6421)、SFRS3 (Entrez Gene ID: 6428)、SH3GL1 (Entrez Gene ID: 6455)、SIL (Entrez Gene ID: 6491)、SLC45A3 (Entrez Gene ID: 85414)、SMARCA4 (Entrez Gene ID: 6597)、SMARCB1 (Entrez Gene ID: 6598)、SMO (Entrez Gene ID: 6608)、SOCS1 (Entrez Gene ID: 8651)、SOX2 (Entrez Gene ID: 6657)、SRGAP3 (Entrez Gene ID: 9901)、SRSF2 (Entrez Gene ID: 6427)、SS18L1 (Entrez Gene ID: 26039)、SSH3BP1 (Entrez Gene ID: 10006)、SSX1 (Entrez Gene ID: 6756)、SSX2 (Entrez Gene ID: 6757)、SSX4 (Entrez Gene ID: 6759)、STK11 (Entrez Gene ID: 6794)、STL (Entrez Gene ID: 7955)、SUFU (Entrez Gene ID: 51684)、SUZ12 (Entrez Gene ID: 23512)、SYK (Entrez Gene ID: 6850)、TAF15 (Entrez Gene ID: 8148)、TAL1 (Entrez Gene ID: 6886)、TAL2 (Entrez Gene ID: 6887)、TCEA1 (Entrez Gene ID: 6917)、TCF1 (Entrez Gene ID: 6927)、TCF12 (Entrez Gene ID: 6938)、TCF3 (Entrez Gene ID: 6929)、TCF7L2 (Entrez Gene ID: 6934)、TCL1A (Entrez Gene ID: 8115)、TCL6 (Entrez Gene ID: 27004)、TET2 (Entrez Gene ID: 54790)、TERT (telomerase reverse transcriptase; Entrez Gene ID: 7015)、TFE3 (Entrez Gene ID: 7030)、TFEB (Entrez Gene ID: 7942)、TFG (Entrez Gene ID: 10342)、TFPT (Entrez Gene ID: 29844)、TFRC (Entrez Gene ID: 7037)、THRAP3 (Entrez Gene ID: 9967)、TIF1 (Entrez Gene ID: 8805)、TLX1 (Entrez Gene ID: 3195)、TLX3 (Entrez Gene ID: 30012)、TMPRSS2 (Entrez Gene ID: 7113)、TNFAIP3 (Entrez Gene ID: 7128)、TNFRSF14 (Entrez Gene ID: 8764)、TNFRSF17 (Entrez Gene ID: 608)、TNFRSF6 (Entrez Gene ID: 355)、TOP1 (Entrez Gene ID: 7150)、TP53 (tumor protein p53; Entrez Gene ID: 7157)、TPM3 (Entrez Gene ID: 7170)、TPM4 (Entrez Gene ID: 7171)、TPR (Entrez Gene ID: 7175)、TRA@ (Entrez Gene ID: 6955)、TRB@ (Entrez Gene ID: 6957)、TRD@ (Entrez Gene ID: 6964)、TRIM27 (Entrez Gene ID: 5987)、TRIM33 (Entrez Gene ID: 51592)、TRIP11 (Entrez Gene ID: 9321)、TSC1 (Entrez Gene ID: 7248)、TSC2 (Entrez Gene ID: 7249)、TSHR (Entrez Gene ID: 7253)、TTL (Entrez Gene ID: 150465)、U2AF1 (Entrez Gene ID: 7307)、USP6 (Entrez Gene ID: 9098)、VHL (Entrez Gene ID: 7428)、WAS (Entrez Gene ID: 7454)、WHSC1 (Entrez Gene ID: 7468)、WHSC1L1 (Entrez Gene ID: 54904)、WIF1 (Entrez Gene ID: 11197)、WRN (Entrez Gene ID: 7486)、WT1 (Entrez Gene ID: 7490)、WTX (Entrez Gene ID: 139285)、XPA (Entrez Gene ID: 7507)、XPC (Entrez Gene ID: 7508)、XPO1 (Entrez Gene ID: 7514)、YWHAE (Entrez Gene ID: 7531)、ZNF145 (Entrez Gene ID: 7704)、ZNF198 (Entrez Gene ID: 7750)、ZNF278 (Entrez Gene ID: 23598)、ZNF331 (Entrez Gene ID: 55422)、ZNF384 (Entrez Gene ID: 171017)、ZNF521 (Entrez Gene ID: 25925)、ZNF9 (Entrez Gene ID: 7555)、and ZRSR2 (Entrez Gene ID: 8233)。
在該實施例中,考慮到該些癌症熱點基因之該參考序列的終端區域 (terminal regions;即起始的60 bp和最後的60 bp) 僅會被一探針所涵蓋,相比之下該參考序列的非終端區域在探針重疊序列為2X重疊密度的前提下則會被二個探針所涵蓋,如此該僅被一探針涵蓋之終端區域的捕捉效率將較低。該癌症熱點基因的參考序列可以延展超過該參考序列的兩端,例如:CTNNB1基因的外顯子3 (exon 3) 之長度為228 bp,若從兩端延展75 bp則會得到一條378 bp長的CTNNB1基因外顯子3參考序列 (SEQ ID NO.33)。其他癌症熱點基因的參考序列也可以類似方式設計。另外,若一外顯子延展出之序列和一相鄰外顯子延展出之序列重疊,該二條經延展的參考序列也可彙整為一條能涵蓋所有外顯子和所有延展序列的單一條參考序列。
該以癌症熱點基因做為標的之探針的可能數量可使用前述的公式1進行計算。例如針對一條長度為378 bp的CTNNB1外顯子3(exon 3)參考序列 (SEQ ID NO.33),在探針序列長度介於50至120 bp之間的前提下,總共可有20,874種探針設計。同樣的,針對一條長度為673 bp的TERT啟動子 (promoter) 之參考序列 (SEQ ID NO. 34),在探針序列長度介於50至120 bp之間的前提下,總共可有41,819種探針設計。針對一條長度為779 bp的TP53外顯子2/3/4 (exons 2/3/4) 之參考序列 (SEQ ID NO.35),在探針序列長度介於50至120 bp之間的前提下,總共可有49,345種探針設計。針對一條長度為528 bp的TP53外顯子5/6 (exon 5/6) 之參考序列 (SEQ ID NO. 36),在探針序列長度介於50至120 bp之間的前提下,總共可有31,524種探針設計。針對一條長度為260 bp的TP53外顯子7 (exon 7) 之參考序列 (SEQ ID NO. 37),在探針序列長度介於50至120 bp之間的前提下,總共可有12,496種探針設計。針對一條長度為453 bp的TP53外顯子8/9 (exon 8) 之參考序列 (SEQ ID NO. 39),在探針序列長度介於50至120 bp之間的前提下,總共可有26,199種探針設計。針對一條長度為257 bp的TP53外顯子10 (exon 10) 之參考序列 (SEQ ID NO. 40),在探針序列長度介於50至120 bp之間的前提下,總共可有12,283種探針設計。針對一條長度為232 bp的TP53外顯子11 (exon 11) 之參考序列 (SEQ ID NO. 41),在探針序列長度介於50至120 bp之間的前提下,總共可有10,508種探針設計。
根據本發明的一實施例,該探針組合更進一步包括一組或多組以外源性基因 (exogenous gene) 做為標的之探針,以做為定量和陰性對照組之用。當每一組該以外源性基因做為標的之探針依該外源性基因序列排列對齊時,已對齊的該些以外源性基因做為標的之探針於對齊後所組成的一整體序列和一外源性基因的一參考序列互相匹配。在該些已對齊的多組以外源性基因做為標的之探針中,每一個該以外源性基因做為標的之探針序列的一部分和相鄰的一個或二個以外源性基因做為標的之探針序列的一部分相重疊。該些重疊序列的長度可為但不限於50% (即為2X重疊密度) 或75% (即為4X重疊密度)。
該些外源性基因的參考序列可由NCBI基因資料庫中取得。該外源性基因可源自λ噬菌體 (lambda phage)、大腸桿菌 (E. coli)、酵母菌、φX174病毒或其他常見微生物。該以外源性基因做為標的之探針的可能數量可使用前述的公式1進行計算。例如針對長度為48,502 bp的λ噬菌體基因體之參考序列 (GenBank Accession No. NC_001416),在探針序列長度介於50至120 bp之間的前提下,總共可有478,682種探針設計。
該實施例將需要額外加入一來自外部之核苷酸片段(如spike-in DNA)且其序列需相對應於該以外源性基因做為標的之探針。亦即,無論在受HBV感染或罹患肝細胞癌的情況下,人類基因體都不會含有類似於該以外源性基因做為標的之探針的序列,所以若在以該實施例偵測癌症的過程之中沒有額外加入與該以外源性基因做為標的之探針相對應的核苷酸片段,則該以外源性基因做為標的之探針理論上無法於基因體DNA或循環系統中的腫瘤DNA之中捕捉到任何核苷酸片段。另一方面,因為理論上能被該以外源性基因做為標的之探針所捕捉的所有核苷酸片段都是額外加入的核苷酸片段,在該實施例偵測癌症的過程中也可以另外加入核苷酸片段,更可以調整該另外加入的核苷酸片段的數量或性質,以確保絕對定量之結果可靠。
在一實施例中,可挑選4個120 bp長且位於λ噬菌體基因體中的序列,以設計以λ噬菌體基因體做為標的之探針。挑選的標準包括:a) 所選擇的序列和人類基因體或HBV基因體沒有同源性 (homology);b) 所選擇的序列在整個λ噬菌體基因體中是獨特的序列;c) 所選擇的序列的GC鹼基含量在一定範圍之內;d) 不是長的單體鹼基 (monomer) 序列,例如: AAAAA;和/或e) 在primer 3、netprimer或其他引子設計演算法的推算結果中,其DNA序列不容易形成二級結構。如表1所示,該些以HBV全基因體做為標的之探針、該些以HBV局部基因體做為標的之探針、該些以熱點基因做為標的之探針,和該些以外源性基因做為標的之探針之組合可用於捕捉特定HBV DNA片段,無論該特定HBV DNA片段是否具備病毒-宿主嵌合點。
表1:用於捕捉特定HBVDNA片段之探針組合
在表2所示的另一實施例中,可以設計額外的以λ噬菌體做為標的之探針組,以涵蓋由前述的4個120 bp區域 (SEQ ID NOs. 46-49) 之下游所延展出的序列,並且該些探針具有2X或4X重疊密度.另外,以λ噬菌體做為標的之探針組 (或探針套數) 也可用於模擬2套(2N)以HBV做為標的之探針 (其中一套探針之標的為基因型B型,另一套探針之標的為基因型C型) 和1套(1N)以熱點基因做為標的之探針組,因此可產生一組2X/1N、2X/2N、4X/1N和4X/2N的以λ噬菌體之基因體所延展出的序列做為標的之探針組。
表2:額外的以λ噬菌體做為標的之探針之探針組
另外,目前已知序列中的GC鹼基會影響定序所涵蓋的範圍,約在GC鹼基比率低 (GC = 0.3,定序涵蓋範圍 = 0.6X) 的樣本、GC鹼基比率最佳 (GC = 0.48,定序涵蓋範圍 = 1.3X) 的樣本和GC鹼基比率高 (GC = 0.7,定序涵蓋範圍 = 0.4X) 的樣本之中造成定序涵蓋範圍約3倍的不同。因此,如表2所述,額外的以λ噬菌體做為標的之探針組也可設計做為探針中GC鹼基的內部控制機制。在λ噬菌體基因體中5個120對鹼基長的序列 (SED ID NOs. 50-54) 是依照下列的標準而被選擇做為參考序列:a) 所選擇的序列和人類基因體或HBV基因體沒有同源性;b) 所選擇的序列在整個λ噬菌體中是獨特的序列;c) 所選擇的序列的GC鹼基含量在一定範圍之內;d) 不是長的單體鹼基序列,例如:AAAAA;和/或e) 在primer 3、netprimer或其他引子設計演算法的推測結果中,其DNA序列不容易形成二級結構。此5個長度為120 bp、GC鹼基含量分別為0.3、0.4、0.5、0.6和0.68的區域被選定為參考序列,用以設計5組額外的以λ噬菌體做為標的之探針(1X/1N)。
根據本發明的一實施例,該探針組合更進一步包括一組或多組以內源性基因 (endogenous gene) 做為標的之探針,以做為相對定量和陽性對照組之用。當每一組該以內源性基因做為標的之探針依該內源性基因序列排列對齊時,已對齊的該些以內源性基因做為標的之探針於對齊後所組成的一整體序列和一內源性基因的一參考序列互相匹配。在該些已對齊的多組以內源性基因做為標的之探針中,每一個該以內源性基因做為標的之探針序列的一部分和相鄰的一個或二個以內源性基因做為標的之探針序列的一部分相重疊。該些重疊序列的長度可為但不限於50% (即為2X重疊密度) 或75% (即為4X重疊密度)。
該些內源性基因的參考序列可由NCBI基因資料庫中取得。在該實施例中,該內源性基因源於人類基因體內,且可由NCBI基因資料庫(www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=gene,以下並以該資料庫中的「Entrez Gene ID」表示) 取得。該些內源性基因可包括但不限於以下至少一種基因:GAPDH (glyceraldehyde-3-phosphate dehydrogenase; Entrez Gene ID: 2597)、UBL4A (ubiquitin like 4A; GdX; Entrez Gene ID: 8266)、HPRT1 (Entrez Gene ID: 3251)、TBP (Entrez Gene ID: 6908)、B2M (Entrez Gene ID: 567)、RPL13A (Entrez Gene ID: 23521)、RN18S1 (Entrez Gene ID: 100008588)、C1orf43 (Entrez Gene ID: 25912)、CHMP2A (Entrez Gene ID: 27243)、EMC7 (Entrez Gene ID: 56851)、GPI (Entrez Gene ID: 2821)、PSMB2 (Entrez Gene ID: 5690)、PSMB4 (Entrez Gene ID: 5692)、RAB7A (Entrez Gene ID: 7879)、REEP5 (Entrez Gene ID: 7905)、SNRPD3 (Entrez Gene ID: 6634)、VCP (Entrez Gene ID: 7415)、VPS29 (Entrez Gene ID: 51699)、ACTB (Entrez Gene ID: 60)、PPIA (Entrez Gene ID: 5478)、GUSB (Entrez Gene ID: 2990)、HSP90AB1 (Entrez Gene ID: 3326)、RPLP0 (Entrez Gene ID: 6175)、TFRC (Entrez Gene ID: 7037)、UBC (Entrez Gene ID: 7316)。
該以內源性基因做為標的之探針的可能數量可使用前述的公式1進行計算。例如針對長度為1,682 bp的GAPDH基因之參考序列,在探針序列長度介於50至120 bp之間的前提下,總共可有113,458種探針設計。同樣的,針對長度為3,583 bp的GdX基因之參考序列,在探針序列長度介於50至120 bp之間的前提下,總共可有248,429種探針設計。
在該實施例中,該些內源性基因是用來增加偵測序列之可靠度;也就是說,該些內源性基因可以做為穩定表現且在腫瘤中表現量不會變化的一般性持家基因 (housekeeping gene)。由於癌症熱點基因的結構變異;如CTNNB、TP53、TERT和其他前述與癌症有關之基因已被發現出現在腫瘤樣本中,且上述與癌症有關之基因的套數 (copy number) 在腫瘤形成 (tumorgenesis) 之中可能由於基因缺失 (deletion)、複製 (duplication) 或其他結構上的變異而有所改變,因此僅根據癌症熱點基因進行定量可能並不可靠。在表2所述的實施例中有二組探針被納入探針組合中作為內部控制組:一組以GAPDH基因(SEQ ID NO. 55)上240 bp長的區域做為標的、重疊密度為2X之探針和一組以GdX基因(SEQ ID NO. 56)上240 bp長的區域做為標的、重疊密度為2X之探針。此二個240 bp長、分別位於GdX基因和GAPDH基因上的標的序列皆不具備以下特徵: 和HBV基因體之同源性、長的單體鹼基序列、明顯的DNA二級結構或超出一定範圍的GC鹼基含量。使用GdX基因做為參考序列的另一優點是,GdX基因也可以用來辨識檢測對象的性別。
在本發明的部分實施例中,每一個該些探針都以一標記分子標記之,以做為偵測和定量之用。該些標記分子可包括但不限於:生物素 (biotin)、螢光蛋白 (fluorescent protein)、冷光蛋白 (luminescent protein)、抗體、放射性化合物或其組合。
本發明的另一方面也提供了一偵測DNA病毒感染 (如:HBV、人類乳突病毒、艾司坦-巴爾病毒、第8型疱疹病毒、人類嗜T淋巴球病毒、Merkel氏多瘤病毒或其他DNA病毒) 或偵測和病毒感染有關的癌症 (如:肝細胞肝癌、子宮頸癌、鼻咽癌、淋巴癌、Merkel氏細胞癌或其他和DNA病毒感染有關之癌症) 之方法。在一實施例中,該方法包括以下步驟:由一對象的一樣本萃取核酸;增幅該核酸;將該核酸和各實施例中所提及之該探針組合進行雜交以捕捉標的核酸片段;定序該些被捕獲之標的核酸片段;且分析該些被捕獲之標的核酸片段。
在該實施例中,該核酸可包括病毒核酸、宿主的基因體核酸和具有病毒-宿主嵌合點的核酸,且可為DNA、RNA或其他聚核苷酸 (polynucleotides)。萃取該些核酸的方法可為沈澱法、色層分析法 (chromatography) 和/或磁珠捕捉分析法。該用來萃取核酸的樣本可為生物性液體 (如:血液、汗液、唾液、淚液、尿液、淋巴液或組織間液 (interstitial fluid)) 或組織 (如:肝組織)。可使用DNA選殖 (DNA cloning) 、聚合酶鏈鎖反應 (polymerase chain reaction;PCR)、反轉錄酶-聚合酶連鎖反應 (reverse transcription PCR;RT-PCR) 、巢式PCR (nested-PCR)、定量PCR (qPCR) 和/或數位式PCR (digital PCR) 增幅該些被萃取出的核酸。該標的核酸片段可被該探針組合以雜交的方式捕捉 (如:南方墨點轉漬 (Southern blot) 雜交法、原位雜交法 (in-situ hybridization) 或北方墨點轉漬 (Northern blog) 雜交法) 和/或被鎖定在特定位置 (如:和微粒有關的捕捉法或和晶片有關的捕捉法)。該被捕捉的標的核酸片段以次世代定序技術執行定序 (如:大量平行定序(massively parallel sequencing)、單分子定序(single molecule sequencing) 或NanoString定序)、馬克薩姆-吉爾伯特定序法 (Maxam-Gilbert sequencing)、桑格氏定序法 (Sanger seuqencing)、焦磷酸根定序法 (pyrosequencing) 和/或DNA微陣列 (DNA microarray)。
在另一實施例中,該增幅步驟和該雜交步驟可互相調換。即根據本發明之另一實施例的方法包括以下步驟:由一對象的一樣本萃取核酸;將該核酸和各實施例中所提及之該探針組合進行雜交以捕捉標的核酸片段;增幅該核酸;定序該些標的核酸片段;且分析該些標的核酸片段。
分析和定量被該探針組合標的核酸可依以下方式執行:原始讀值 (Raw reads;RR) 直接由該次世代定序儀器所產生。該些原始讀值中的低品質讀值被排除以取得高品質讀值 (high quality reads;HQR)。該些高品質讀值再壓縮為特別讀值 (unique reads;UR);換句話說,具有一模一樣序列的高品質讀值被壓縮為一單一特別讀值,同時和其套數或冗餘性 (redundancy) 有關的資訊也被保留下來。最後,該些具有低冗餘性的特別讀值進一步被排除,保留下高冗餘性特別讀值 (high redundancy unique reads;HRUR)。再利用壓縮時被保留下來的冗餘性資訊,可再計算出高冗餘性特別讀值之讀值總數 (RiHRUR)。
在一實施例中,該用來分析該次世代定序數據的生物資訊分析方法彙總於表3中。
表3:用來分析該次世代定序數據的生物資訊分析方法
表3同時也比較該較佳實施例中的方法和Zhao所提到的方法。如表3中所示,兩者之間主要不同處包括:Zhao合併位置相近的嵌合點,而本實施例的方法則是基於序列之間的相似度而合併嵌合點。同時,Zhao會移除重複計算的讀值,且僅考慮特別嵌合點 (unique junction);而本實施例的方法則是排除冗餘性小於5的讀值,保留冗餘性資訊,且對嵌合點的定量是基於單一特別嵌合點的總數。
驗證探針的特異性
基於本發明之一實施例,設計以TP53外顯子2-11 (SEQ ID NOs 35-38,40-41) 做為標的之探針,該探針和一肝細胞癌病人的肝細胞腫瘤基因體DNA、非腫瘤基因體DNA和循環系統中的腫瘤DNA進行雜交,且該雜交結果以定量PCR進行定量。在脊椎動物中普遍存在且在肝中表現量高的Micro RNA miR-122也被定量以做為陰性對照組。
表4
如上表4中所述,在三種不同樣本中,TP53較miR-122具有顯著較高的雜交後留存率,這代表以TP53做為標的的探針和TP53成功雜交、捕捉且回收。相反地,miR-122因為缺乏與TP53標的探針的特異性,所以會被洗去。表4同時也顯示了在基因體DNA中被以TP53做為標的的探針所捕捉之TP53的量為miR-122量的250倍,且由循環系統中的腫瘤DNA捕捉的TP53的量為miR-122量的10倍。上述結果顯示了以TP53做為標的的探針具有序列特異性且能夠選擇性地在DNA樣本中捕捉TP53基因片段。
同時,如表5中所示,以表1中所列出的探針增幅共26組肝細胞腫瘤基因體DNA樣本,且以次世代定序技術執行定序以分析HBV基因體、HBV-人之嵌合點 (以下以「嵌合點」表示) 和癌症熱點基因 (包括CTNNB1、TERT和TP53) 是否存在。該HBV-人之嵌合點代表著HBV嵌入人類基因體。表5中的該宿主基因體序列比率 (host genome ratio) 為被捕捉到之序列和人類基因體之序列的序列長度比率。如表5中所示,該宿主基因體序列長度比率和該已觀測的次世代定序讀值比率在樣本之間有顯著的不同,此代表著該HBV基因體、癌症熱點基因和HBV-人嵌合點皆被該探針組合成功地增幅。
表5
由於單一的嵌合點估計會有150 bp長的偵測範圍,因而可估算宿主基因體中的嵌合點長度 (junction length) 為3 kb。因此,單一嵌入事件會形成二個嵌合點,可以300 bp長的嵌合點區 (junction region) 表示之。若大致估計每一位病人有10個可偵測的嵌合點,則一位個別病人的估計嵌合點長度則應在3 kb (即300 bp x 10)。該嵌入的HBV長度 (排除未嵌入的自由態HBV) 就可被估計為32.15 kb (即為3,215 kb x 10)。此處所述之在人類基因體中該嵌合點和該HBV的比率,為非常粗略且高估的估計值,因此可能會造成低估該嵌合點和該HBV之增幅效率。
如圖3所示,基於本發明之一實施例,以嵌合點做為標的的探針能夠選擇性地捕捉具有特定病毒-宿主嵌合點的DNA片段。三位肝細胞癌病人 (由「pt3」、「pt11」和「pt15」表示) 由腫瘤中取得之肝細胞癌的基因體DNA樣本 (以「T」表示) 和由非腫瘤組織取得之DNA樣本 (以「N」表示) 皆和探針1 (以「pt3 junction」表示) 及探針2 (以「pt11 junction」表示) 進行雜交。該探針1和該探針2皆分別根據pt3和pt11中之HBV-人嵌合點之序列而進行設計。圖3中的聚合酶鏈鎖反應 (Polymerase Chain Reaction) 實驗結果代表該探針1選擇性地和pt3之腫瘤基因體DNA雜交且該探針2選擇性地和pt11之腫瘤基因體DNA雜交。「NTC」代表「無樣本對照組」且做為此實驗之陰性對照組,而「PBGD」(即紫質膽素原去胺酶基因 (porphobilinogen deaminase gene) ) 和miR-122做為陽性對照組。
見圖4A和圖4B,該探針1 (以「pt3 junction」表示) 被用來偵測在病人pt3的基因體DNA和血清DNA中是否存在HBV-人嵌合點。如圖4A所示,可觀察到一病人pt3特有的HBV-人嵌合點存在於病人pt3的腫瘤基因體DNA、術前血清DNA (pre-OP serum DNA)和術後血清DNA (post-OP serum DNA) 之中。上述病人pt3特有的嵌合點並沒有在病人pt11和非肝細胞癌但為HBV陽性病人 (non-HCC HBV positive,以「Normal」表示) 之樣本中被觀察到。同樣地,如圖4B中所示,當探針2 (以「pt11 junction」表示) 被用來偵測在病人pt11的基因體DNA和血清DNA中是否存在HBV-人嵌合點,一病人pt11特有的HBV-人嵌合點存在於病人pt11的腫瘤基因體DNA、術前血清DNA和術後血清DNA之中。上述病人pt11特有的嵌合點並沒有在病人pt15和非肝細胞癌但為HBV陽性病人 (以「Normal」表示) 之樣本中被觀察到。
確認探針之捕捉效率
表2中的該探針組合被用來分析一對腫瘤基因體DNA和血漿內循環系統中的腫瘤DNA (plasma ctDNA) 樣本 (上述DNA樣本皆由同一位肝細胞癌病人取得),以決定該探針組合在不同種樣本中的捕捉效率。如表6中次世代定序統計資訊所示,腫瘤基因體DNA的讀值在HBV全基因體、HBV局部基因體和HBV-人嵌合點中,高於血漿內循環系統中的腫瘤DNA;該探針組合在腫瘤基因體DNA樣本中展現出高捕捉效率。另外、在腫瘤基因體DNA中被辨識之10個嵌合點中的8個嵌合點具有顯著且大量的讀值 (> 947),這代表了嵌合點取得率 (junction recovery rate) 為75%。
表6
圖5A和圖5B為熱點圖轉換成的直方圖,該直方圖顯示了被次世代定序技術預測到且被探針捕捉到之讀值的比率。同時,圖6顯示了以同樣的該探針組合 (表2中的探針組合) 與另一肝細胞癌病人之腫瘤基因體DNA樣本雜交並執行次世代定序分析之分析結果。
請見圖7,該探針組合除了有偵測HBV DNA和HBV嵌入人基因體的功能外,本發明中的該探針組合也能夠偵測和基因突變有關的癌症。如圖8中所示,由次世代定序技術分析被基因型B型之HBV感染的男性和女性肝細胞癌病人之DNA樣本,可得到在不同病人中有不同類型的HBV-人嵌合點,且不同的嵌合點也具有不同的讀值:在TERT和MLL4區中具有特別的嵌合點 (以「TERT/MLL4 integration」表示),且有數個已知的癌症熱點突變位於CTNNB1基因的外顯子3之TERT啟動子中 (以「TERT/CTNNB1 mutations」表示)。
優點與益處
根據本發明中的實施例所提出之該探針組合和分析方法較先前技藝展現了明顯更佳的敏感度和效率。如表7所示,和Li等人之分析法的比較中,可以得到被本發明中之較佳實施例的該探針組合捕捉到的該核酸片段具有顯著較高HBV比率、較高的嵌合點讀值和較低的人類基因體讀值。
表7
另外,根據本揭露中的實施例之生物資訊分析方法,分析先前Zhao的次世代定序結果,也可以得知Zhao的分析結果中有97.5%的讀值來自於人類基因體,僅有1.49%來自於HBV基因體,1.43%來自於局部HBV基因體和1%來自於嵌合點,再次證明了目前已知的捕捉HBV之探針在增幅HBV片段和HBV-嵌合點上的效率並不好。再者,Zhao的研究中僅提及辨識出157個嵌合點,然而以本發明實施例中所使用的之生物資訊分析方法,分析與Zhao研究中相同一組次世代定序原始資料,則可揭露出469個嵌合點。其中,將近80%由Zhao所揭露的嵌合點亦出現在這469個嵌合點中。這些結果展現出本發明中的實施例之生物資訊分析方法在偵測病毒嵌入事件中具高敏感度,且較先前技藝能夠辨識顯著地較多的病毒-宿主嵌合點。
再者,和Jiang和Sung所提出的直接定序法相比,本發明中的實施例所提出的該探針組合和分析方法僅在典型的次世代定序結果中產生5百萬個150 bp長之讀值 (較Jiang的分析結果少了80%讀值,或少了60%總核酸量);然而本發明之實施例仍能夠在5百萬個讀值之中辨識出307,101個HBV讀值和69,198個嵌合點讀值。上述結果展現了本發明中的實施例不僅對病毒嵌入事件敏感且效率高。
本發明的諸多前述實施例提供了一有力且多功能的分析工具,以偵測病毒感染和病毒感染所引起之癌症。本發明中的實施例可用來偵測各種不同DNA病毒和病毒嵌入事件。該根據實施例所設計的探針組合可確保最適病毒/宿主序列涵蓋率,且也考慮到基因穩定性,並因此而展現了高敏感度、效率和可靠度。
綜上所述,本發明符合發明專利要件,爰依法提出專利申請。惟,以上所述者僅為本發明之較佳實施例,本發明之範圍並不以上述實施例為限,舉凡熟習本案技藝之人士爰依本創作之精神所作之等效修飾或變化,皆應涵蓋於以下申請專利範圍內。
211‧‧‧探針
212‧‧‧HBV全基因體序列
本發明將可由以下之敘述配合附圖以更佳地理解,其中: 圖1為一流程圖,該流程圖描繪出在符合本發明的一實施例中,取得一參考序列的流程。 圖2A和圖2B為本發明的一實施例中,該探針的設計概念示意圖。 圖3為本發明的一實驗結果,該實驗結果表現出一實施例中該探針的選擇性雜交 (hybridization)。 圖4A和圖4B為本發明的一實施結果,該實驗結果表現出該探針的特異性。 圖5A為本發明的一實施例中,一由熱點圖轉換而來的直方圖,據以呈現本發明之探針組合使用於配對的腫瘤基因體DNA (tumor genomic DNA)樣本時,幾個不同基因位置之次世代定序 (next generation sequencing)分析結果 圖5B為本發明的一實施例中,一由熱點圖轉換而來的直方圖,據以呈現本發明之探針組合使用於配對的血漿內腫瘤DNA (plasma circulating tumor DNA)樣本時,幾個不同基因位置之次世代定序 (next generation sequencing)分析結果 圖6為本發明的一實施例中的另一直方圖,該直方圖由一熱點圖轉換而來,具體呈現本發明之探針組合使用於腫瘤基因體DNA (tumor genomic DNA)樣本時,幾個不同基因位置之次世代定序 (next generation sequencing)分析結果 圖7為本發明的一實驗結果,該實驗結果為數個DNA樣本和一探針組合進行雜交後,再以次世代定序技術分析之。
<110> 泰宗生物科技股份有限公司 <120> 偵測癌症之探針組合 <130> 序列表 <150> US 62/456,087 <151> 2017-02-07 <160> 56 <170> PatentIn version 3.5 <210> 1 <211> 3191 <212> DNA <213> Hepatitis B virus <400> 1 ctccaccact ttccaccaaa ctcttcaaga tcccagagtc agggccctgt actttcctgc 60 tggtggctcc agttcaggaa cagtgagccc tgctcagaat actgtctctg ccatatcgtc 120 aatcttatcg aagactgggg accctgtacc gaacatggag aacatcgcat caggactcct 180 aggacccctg ctcgtgttac aggcggggtt tttcttgttg acaaaaatcc tcacaatacc 240 acagagtcta gactcgtggt ggacttctct caattttcta gggggaacac ccgtgtgtct 300 tggccaaaat tcgcagtccc aaatctccag tcactcacca acctgttgtc ctccaatttg 360 tcctggttat cgctggatgt gtctgcggcg ttttatcatc ttcctctgca tcctgctgct 420 atgcctcatc ttcttgttgg ttcttctgga ctatcaaggt atgttgcccg tttgtcctct 480 aattccagga tcatcaacaa ccagcaccgg accatgcaaa acctgcacaa ctcctgctca 540 aggaacctct atgtttccct catgttgctg tacaaaacct acggacggaa actgcacctg 600 tattcccatc ccatcatctt gggctttcgc aaaataccta tgggagtggg cctcagtccg 660 tttctcttgg ctcagtttac tagtgccatt tgttcagtgg ttcgtagggc tttcccccac 720 tgtctggctt tcagttatat ggatgatgtg gtattggggg ccaagtctgt acaacatctt 780 gagtcccttt atgccgctgt taccaatttt cttttgtctt tgggtataca tttaaaccct 840 cacaaaacaa aaagatgggg atattccctt aacttcatgg gatatgtaat tgggagttgg 900 ggcacattgc cacaggaaca tattgtacaa aaaatcaaaa tgtgttttag gaaacttcct 960 gtaaacaggc ctattgattg gaaagtatgt caacgaattg tgggtctttt ggggtttgcc 1020 gcccctttca cgcaatgtgg atatcctgct ttaatgcctt tatatgcatg tatacaagca 1080 aaacaggctt ttactttctc gccaacttac aaggcctttc taagtaaaca gtatctgaac 1140 ctttaccccg ttgctcggca acggcctggt ctgtgccaag tgtttgctga cgcaaccccc 1200 actggttggg gcttggccat aggccatcag cgcatgcgtg gaacctttgt gtctcctctg 1260 ccgatccata ctgcggaact cctagccgct tgttttgctc gcagcaggtc tggagcaaaa 1320 ctcatcggga ctgacaattc tgtcgtgctc tcccgcaagt atacatcatt tccatggctg 1380 ctaggctgtg ctgccaactg gatcctgcgc gggacgtcct ttgtttacgt cccgtcggcg 1440 ctgaatcccg cggacgaccc ctcccggggc cgcttggggc tctaccgccc gcttctccgc 1500 ctgttgtacc gaccgaccac ggggcgcacc tctctttacg cggactcccc gtctgtgcct 1560 tctcatctgc cggaccgtgt gcacttcgct tcacctctgc acgtcgcatg gagaccaccg 1620 tgaacgccca ccggaacctg cccaaggtct tgcataagag gactcttgga ctttcagcaa 1680 tgtcaacgac cgaccttgag gcatacttca aagactgtgt gtttactgag tgggaggagt 1740 tgggggagga gattaggtta aaggtctttg tactaggagg ctgtaggcat aaattggtgt 1800 gttcaccagc accatgcaac tttttcacct ctgcctaatc atctcatgtt catgtcctac 1860 tgttcaagcc tccaagctgt gccttgggtg gctttggggc atggacattg acccgtataa 1920 agaatttgga gcttctgtgg agttactctc ttttttgcct tctgacttct ttccttctat 1980 tcgagatctc ctcgacaccg cctctgctct gtatcgggag gccttagagt ctccggaaca 2040 ttgttcacct caccatacgg cactcaggca agctattctg tgttggggtg agttaatgaa 2100 tctagccacc tgggtgggaa gtaatttgga agatccagca tccagggaat tagtagtcag 2160 ctatgtcaac gttaatatgg gcctaaaaat cagacaacta ttgtggtttc acatttcctg 2220 tcttactttt ggaagagaaa ctgttcttga atatttggtg tcttttggag tgtggattcg 2280 cactcctcct gcatatagac caccaaatgc ccctatctta tcaacacttc cggaaactac 2340 tgttgttaga cgaagaggca ggtcccctag aagaagaact ccctcgcctc gcagacgaag 2400 gtctcaatcg ccgcgtcgca gaagatctca atctcgggaa tctcaatgtt agtattcctt 2460 ggacacataa ggtgggaaac tttacggggc tttattcttc tacggtacct tgctttaatc 2520 ctaaatggca aactccttct tttcctgaca ttcatttgca ggaggacatt gttgatagat 2580 gtaagcaatt tgtggggccc cttacagtaa atgaaaacag gagactaaaa ttaattatgc 2640 ctgctaggtt ttatcccaat gttactaaat atttgccctt agataaaggg atcaaacctt 2700 attatccaga gcatgtagtt aatcattact tccagacgag acattattta cacactcttt 2760 ggaaggcggg tatcttatat aaaagagagt ccacacgtag cgcctcattt tgcgggtcac 2820 catattcttg ggaacaagat ctacagcatg ggaggttggt cttccaaacc tcgaaaaggc 2880 atggggacaa atctttctgt ccccaatccc ctgggattct tccccgatca tcagttggac 2940 cctgcattca aagccaactc agaaaatcca gattgggacc tcaacccgca caaggacaac 3000 tggccggacg ccaacaaggt gggagtggga gcattcgggc cagggttcac ccctccccat 3060 gggggactgt tggggtggag ccctcaggct cagggcatac tcacaactgt gccagcagct 3120 cctcctcctg cctccaccaa tcggcagtca ggaaggcagc ctactccctt atctccacct 3180 ctaagggaca c 3191 <210> 2 <211> 3191 <212> DNA <213> Hepatitis B virus <400> 2 ctccacaaca ttccaccaag ctctgctaga tcccagagtg aggggcctat actttcctgc 60 tggtggctcc agttccggaa cagtaaaccc tgttccgact actgcctcac ccatatcgtc 120 aatcttctcg aggactgggg accctgcacc gaacatggag aacacaacat caggattcct 180 aggacccctg ctcgtgttac aggcggggtt tttcttgttg acaagaatcc tcacaatacc 240 acagagtcta gactcgtggt ggacttctct caattttcta gggggagcac ccacgtgtcc 300 tggccaaaat tcgcagtccc caacctccaa tcactcacca acctcttgtc ctccaatttg 360 tcctggctat cgctggatgt gtctgcggcg ttttatcata ttcctcttca tcctgctgct 420 atgcctcatc ttcttgttgg ttcttctgga ctaccaaggt atgttgcccg tttgtcctct 480 acttccagga acatcaacta ccagcacggg accatgcaag acctgcacga ttcctgctca 540 aggaacctct atgtttccct cttgttgctg tacaaaacct tcggacggaa actgcacttg 600 tattcccatc ccatcatcct gggctttcgc aagattccta tgggagtggg cctcagtccg 660 tttctcctgg ctcagtttac tagtgccatt tgttcagtgg ttcgtagggc tttcccccac 720 tgtttggctt tcagttatat ggatgatgtg gtattggggg ccaagtctgt acaacatctt 780 gagtcccttt ttacctctat taccaatttt cttttgtctt tgggtataca tttgaaccct 840 aataaaacca aacgttgggg ctactccctt aacttcatgg gatatgtaat tggaagttgg 900 ggtactttac cacaggaaca tattgtacta aaaatcaagc aatgttttcg aaaactgcct 960 gtaaatagac ctattgattg gaaagtatgt caaagaattg tgggtctttt gggctttgct 1020 gcccctttta cacaatgtgg ctatcctgcc ttaatgcctt tatatgcatg tatacaatct 1080 aagcaggctt tcactttctc gccaacttac aaggcctttc tgtgtaaaca atatctgaac 1140 ctttaccccg ttgcccggca acggtcaggt ctctgccaag tgtttgctga cgcaaccccc 1200 actggatggg gcttggccat aggccatcgg cgcatgcgtg gaacctttgt ggctcctctg 1260 ccgatccata ctgcggaact cctagcagct tgttttgctc gcagccggtc tggagcgaaa 1320 cttatcggca ccgacaactc tgttgtcctc tctcggaaat acacctcctt tccatggctg 1380 ctagggtgtg ctgccaactg gatcctgcgc gggacgtcct ttgtctacgt cccgtcggcg 1440 ctgaatcccg cggacgaccc gtctcggggc cgtttgggac tctaccgtcc ccttcttcat 1500 ctgccgttcc ggccgaccac ggggcgcacc tctctttacg cggtctcccc gtctgtgcct 1560 tctcatctgc cggaccgtgt gcacttcgct tcacctctgc acgtcgcatg gagaccaccg 1620 tgaacgccca ccaggtcttg cccaaggtct tacataagag gactcttgga ctctcagcaa 1680 tgtcaacgac cgaccttgag gcatacttca aagactgttt gtttaaagac tgggaggagt 1740 tgggggagga gattaggtta atgatctttg tactaggagg ctgtaggcat aaattggtct 1800 gttcaccagc accatgcaac tttttcacct ctgcctaatc atctcatgtt catgtcctac 1860 tgttcaagcc tccaagctgt gccttgggtg gctttggggc atggacattg acccgtataa 1920 agaatttgga gcttctgtgg agttactctc ttttttgcct tctgacttct ttccttctat 1980 tcgagatctc ctcgacaccg cctctgctct gtatcgggag gccttagagt ctccggaaca 2040 ttgttcacct caccatacag cactcaggca agctattctg tgttggggtg agttgatgaa 2100 tctggccacc tgggtgggaa gtaatttgga agacccagca tccagggaat tagtagtcag 2160 ctatgtcaat gttaatatgg gcctaaaaat cagacaacta ttgtggtttc acatttcctg 2220 tcttactttt ggaagagaaa ctgttcttga gtatttggtg tcttttggag tgtggattcg 2280 cactcctccc gcttacagac caccaaatgc ccctatctta tcaacacttc cggaaactac 2340 tgttgttaga cgacgaggca ggtcccctag aagaagaact ccctcgcctc gcagacgaag 2400 gtctcaatcg ccgcgtcgca gaagatctca atctcgggaa tctcaatgtt agtatccctt 2460 ggactcataa ggtgggaaac tttactgggc tttattcttc tactgtacct gtctttaatc 2520 ctgagtggca aactccctcc tttcctcaca ttcatttaca ggaggacatt attaatagat 2580 gtcaacaata tgtgggccct cttacagtta atgaaaaaag gagattaaaa ttaattatgc 2640 ctgctaggtt ctatcctaac cttaccaaat atttgccctt ggataaaggc attaaacctt 2700 attatcctga acatgcagtt aatcattact tcaaaactag gcattattta catactctgt 2760 ggaaggctgg cattctatat aagagagaaa ctacacgcag cgcctcattt tgtgggtcac 2820 catattcttg ggaacaagag ctacagcatg ggaggttggt cttccaaacc tcgacaaggc 2880 atggggacga atctttctgt tcccaatcct ctgggattct ttcccgatca ccagttggac 2940 cctgcgttcg gagccaactc aaacaatcca gattgggact tcaaccccaa caaggatcac 3000 tggccagagg caaatcaggt aggagcggga gcattcgggc cagggttcac cccaccacac 3060 ggcggtcttt tggggtggag ccctcaggct cagggcatat tgacaacagt gccagcagca 3120 cctcctcctg cctccaccaa tcggcagtca ggaagacagc ctactcccat ctctccacct 3180 ctaagagaaa g 3191 <210> 3 <211> 960 <212> DNA <213> Hepatitis B virus <400> 3 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct 60 tgttttgctc gcagccggtc tggagcaaag ctcatcggaa ctgacaattc tgtcgtcctc 120 tcgcggaaat atacatcgtt tccatggctg ctaggctgtg ctgccaactg gatccttcgc 180 ggaacgtcct ttgtctacgt cccgtcggcg ctgaatcccg cggacgaccc ctctcggggc 240 cgcttgggac tctctcgtcc ccttctccgt ctgccgttcc agccgaccac ggggcgcacc 300 tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggtccgtgt gcacttcgct 360 tcacctctgc acgttgcatg gagaccaccg tgaacgccca tcagatcctg cccaaggtct 420 tacataagag gactcttgga ctcccagcaa tgtcaacgac cgaccttgag gcctacttca 480 aagactgtgt gtttaaggac tgggaggagc tgggggagga gattaggtta aaggtctttg 540 tattaggagg ctgtaggcat aaattggtct gcgcaccagc accatgcaac tttttcacct 600 ctgcctaatc atctcttgta catgtcccac tgttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacattg acccttataa agaatttgga gctactgtgg agttactctc 720 gtttttgcct tctgacttct ttccttccgt cagagatctc ctagacaccg cctcagctct 780 gtatcgagaa gccttagagt ctcctgagca ttgctcacct caccatactg cactcaggca 840 agccattctc tgctgggggg aattgatgac tctagctacc tgggtgggta ataatttgga 900 agatccagca tccagggatc tagtagtcaa ttatgttaat actaacatgg gtttaaagat 960 <210> 4 <211> 960 <212> DNA <213> Hepatitis B virus <400> 4 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct 60 tgttttgctc gcagccggtc tggagcaaag ctcatcggaa ctgacaattc tgtcgtcctc 120 tcgcggaaat atacatcgtt tccatggctg ctaggctgta ctgccaactg gatccttcgc 180 gggacgtcct ttgtttacgt cccgtcggcg ctgaatcccg cggacgaccc ctctcggggc 240 cgcttgggac tctctcgtcc ccttctccgt ctgccgttcc agccgaccac ggggcgcacc 300 tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggtccgtgt gcacttcgct 360 tcacctctgc acgttgcatg gagaccaccg tgaacgccca tcagatcctg cccaaggtct 420 tacataagag gactcttgga ctcccagcaa tgtcaacgac cgaccttgag gcctacttca 480 aagactgtgt gtttaaggac tgggaggagc tgggggagga gattaggtta atgatctttg 540 tattaggagg ctgtaggcat aaattggtct gcgcaccagc accatgcaac tttttcacct 600 ctgcctaatc atctcttgta catgtcccac tgttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacattg acccttataa agaatttgga gctactgtgg agttactctc 720 gtttttgcct tctgacttct ttccttccgt cagagatctc ctagacaccg cctcagctct 780 gtatcgagaa gccttagagt ctcctgagca ttgctcacct caccatactg cactcaggca 840 agccattctc tgctgggggg aattgatgac tctagctacc tgggtgggta ataatttgga 900 agatccagca tccagggatc tagtagtcaa ttatgttaat actaacatgg gtttaaagat 960 <210> 5 <211> 960 <212> DNA <213> Hepatitis B virus <400> 5 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct 60 tgttttgctc gcagccggtc tggagcaaaa ctcatcggga ctgacaattc tgtcgtcctt 120 tctcggaaat atacatcctt cccatggctg ctaggttgta ctgccaactg gattcttcga 180 gggacgtcct ttgtctacgt cccgtcggcg ctgaatcccg cggacgaccc ctcgcgaggt 240 cgcttgggac tctatcgtcc ccttctccgt ctgccgtacc gtccgaccac ggggcgcacc 300 tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggtccgtgt gcacttcgct 360 tcacctctgc acgttgcatg gagaccaccg tgaacgccca tcagatcctg cccaaggtct 420 tatataagag gactcttgga ctcccagcaa tgtcaacgac cgaccttgag gcctacttca 480 aagactgtgt gtttaaagac tgggaggagt tgggggagga gattaggtta aaggtttatg 540 tattaggagg ctgtaggcat aaattggtct gcgcaccatc atcatgcaac tttttcacct 600 ctgcctaatc atctcttgta catgtcccac ttttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacattg acccttataa agaatttgga gctacagtgg agttactctc 720 gtttttgcct tctgacttct ttccttccgt ccgggatcta ctagatacag cctcagctct 780 gtatcgggaa gcattagagt ctcctgagca ttgctcacct caccatacag cactcaggca 840 agccattctc tgctgggggg atgtactgga tctatctacc tgggtgggtg ctaatttgca 900 agatccagca tccagggatc tagtagtcaa ttatgttaat actaacatgg gcctaaagtt 960 <210> 6 <211> 960 <212> DNA <213> Hepatitis B virus <400> 6 cgcatgcgtg gaacctttgt gtctcctctg ccgatccata ctgcggaact cctagccgct 60 tgttttgctc gcagcaggtc tggggcaaaa ctcatcggga ctgacaattc tgtcgtgctc 120 tcccgcaagt atacatcgtt cccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtttacgt cccgtcggcg ctgaatcccg cggacgaccc ctcccggggc 240 cgcttggggc tctaccgccc gcttctccgc ctgttgtacc gtccgaccac ggggcgcacc 300 tctctttacg cggactcccc gtctgtgcct tctcatctrc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccggaacctg cccaaggtct 420 tgcataagag gactcttgga ctttcmgcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgtgt gtttaatgag tgggaggagt tgggggagga gaktaggtta aaggtctttg 540 tactaggagg ctgtaggcat aaattggtgy gttcaccagc accatgcaac tttttcacct 600 ctgcctaatc atctcatgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttagggc atggacattg acccgtataa agaatttgga gcttctgtgg agttactctc 720 ttttttgcct catgacttct ttccttctat tcgagatctc ctcgacaccg cctctgcttt 780 gtatcgggag gccttagagt ctccggaaca ttgttcacct caccatacgg cactcaggca 840 agctattctg tgttggggtg agttgatgaa tctagccacc tgggtgggaa gtaatttgga 900 agatccagca tccagggaat tagtcgttag ctatgtcaac gttaatatgg gcmtaaaaat 960 <210> 7 <211> 960 <212> DNA <213> Hepatitis B virus <400> 7 cgcatgcgtg gaacctttgt gtctcctctg ccgatccata ctgcggaact cctagccgct 60 tgttttgctc gcagcaggtc tggagcgaaa ctcatcggga ctgacaattc tgtcgtgctc 120 tcccgcaagt atacatcgtt tccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtttacgt cccgtcggcg ctgaatcccg cggacgaccc ctcccggggc 240 cgcttggggc tctaccgccc gcttctccgt ctgccgtacc gaccgaccac ggggcgcacc 300 tctctttacg cggactcccc gtctgtgcct tctcgtctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gaaaccaccg tgaacgccca ccggaacctg cccaaggtct 420 tgcacaagag gactcttgga ctttcagcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgtgt gtttcatgag tgggaggagc tgggggagga gattaggtta aaggtctttg 540 tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600 ctgcctagtc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttgggac atggacattg acccttataa agaatttgga gctactgtgg agttactctc 720 ttttttgcct tctgacttct ttccgtcggt acgagacctc ctagataccg ctgctgctct 780 gtatcgggaa gccttagaat ctcctgaaca ttgctcacct caccacacag cactcaggca 840 agctattctg tgctgggggg aattaatgac tctagctacc tgggtgggta ataatttaga 900 agatccagcg tccagggatc tagtagtcaa ttatgttaac actaacatgg gcctaaagat 960 <210> 8 <211> 960 <212> DNA <213> Hepatitis B virus <400> 8 cgcatgcgtg ggacctttgt gtctcctctg ccgatccata ctgcggaact cctagccgct 60 tgttttgctc gcagcaggtc tggagcgaaa cttatcggga ctgacaattc cgttgtcctt 120 tcccgcaaat atacatcgtt tccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtctacgt cccgtcggcg ctgaatcccg cggacgaccc ctcccggggc 240 cgcttggggc tctaccgccc gcttctccgt ctgccgtacc gaccgaccac ggggcgcacc 300 tctctttacg cggactcccc gtctgtgcct tctcgtctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccggaacttg cccaaggtct 420 tgcataagag gactcttgga ctttcagcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgtgt gtttaatgag tgggaggagt tgggggagga gattaggtta aaggtctttg 540 tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600 ctgcctaatc atctcatgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacattg acccgtataa agaatttgga gcttctgtgg agttactctc 720 ttttttgcct tctgacttct ttccttctat tcgagatctt ctcgacaccg cctctgctct 780 gtatcgggag gccttagagt ctccggaaca ttgttcacct caccatacgg cactcaggca 840 agctattctg tgttggggtg agttaatgaa tctagccacc tgggtgggaa gtaatttgga 900 agacccagca tccagggaat tagtagtcag ctatgtcaat gttaatatgg gcctaaaaat 960 <210> 9 <211> 960 <212> DNA <213> Hepatitis B virus <400> 9 cgcatgcgtg gaacctttgt gtctcctctg ccgatccata ctgcggaact cctagccgct 60 tgttttgctc gcagcaggtc tggagcaaaa ctcatcggga ctgacaattc tgtcgtgctc 120 tcccgcaagt atacatcatt tccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtttacgt cccgtcggcg ctgaatcccg cggacgaccc ctcccggggc 240 cgcttggggc tctaccgccc gcttctccgc ctgttgtacc gaccgaccac ggggcgcacc 300 tctctttacg cggactcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccggaacctg cccaaggtct 420 tgcataagag gactcttgga ctttcagcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgtgt gtttactgag tgggaggagt tgggggagga gattaggtta aaggtctttg 540 tactaggagg ctgtaggcat aaattggtgt gttcaccagc accatgcaac tttttcacct 600 ctgcctaatc atctcatgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacattg acccgtataa agaatttgga gcttctgtgg agttactctc 720 ttttttgcct tctgacttct ttccttctat tcgagatctc ctcgacaccg cctctgctct 780 gtatcgggag gccttagagt ctccggaaca ttgttcacct caccatacgg cactcaggca 840 agctattctg tgttggggtg agttaatgaa tctagccacc tgggtgggaa gtaatttgga 900 agatccagca tccagggaat tagtagtcag ctatgtcaac gttaatatgg gcctaaaaat 960 <210> 10 <211> 960 <212> DNA <213> Hepatitis B virus <400> 10 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagcagct 60 tgttttgctc gcagccggtc tggagctaaa cttatcggga ctgacaactc tgttgtcctc 120 tcgcggaaat acacctcctt cccatggctg ctcgggtgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtctacgt cccgtcggcg ctgaatcccg cggacgaccc atctcggggc 240 cgtttgggcc tctaccgtcc ccttcttcac ctgccgttcc agccgaccac ggggcgcacc 300 tctctttacg cggactcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccaggtcttg cccaagctct 420 tacataagag gactcttgga ctctcagcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgttt gtttaaagac tgggaggagt tgggggagga gattaggtta aaggtctttg 540 tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcccct 600 ctgcctaatc atctcatgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacattg acccgtataa agaatttgga gcttctgtgg agttactctc 720 ttttttgcct tctgacttct ttccttctat tcgagatctc ctcgataccg cctctgctct 780 gtatcgggag gccttagagt ctccggaaca ttgttcacct caccatacag cactcaggca 840 agctattctg tgttggggtg agttgatgaa tctggccacc tgggtgggaa gtaatttgga 900 agacccagca tccagggaat tagtagtcag ctatgtcaat gttaatatgg gcctaaaaat 960 <210> 11 <211> 961 <212> DNA <213> Hepatitis B virus <400> 11 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagcggct 60 twgttttgct cgcagccggt ctggagcgaa cctcatcggc accgacaact ctgttgtcct 120 ctctcggaag tacacctcct ttccatggct gctaggatgt gctgccaact ggatcctgcg 180 cgggacgtcc tttgtctacg tcccgtcggc gctgaatccc gcggacgacc cctctcgggg 240 ccgcttgggg atctaccgtc ccctcctccg tctgccgttc cggccgacca cggggcgcac 300 ctctctttac gcggtctccc cgtctgtgcc ttctcatctg ccggaccgtg tgcacttcgc 360 ttcacctctg cacgtcgcat ggagaccacc gtgaacgccc accaggtctt gcccaaggtc 420 ttgcataaga ggactcttgg actctcagca atgtcaacga ccgaccttga ggcatacttc 480 aaagactgtg tgtttaaaga ctgggaggag ttgggggagg agattaggtt aaaggtcttt 540 gtactaggag gctgtaggca taaattggtc tgttcaccag caccatgcaa ctttttcacc 600 tctgcctaat catctcatgt tcatgtccta ctgttcaagc ctccaagctg tgccttgggt 660 ggctttgggg catggacatt gacccttata aagaatttgg agcttctgtg gagttactct 720 cttttttgcc gtctgatttc tttccatcta ttcgagatct cctagacact gcctcagctc 780 tgtatcggga agccttagag tctccggaac attgttcacc tcaccataca gcactcaggc 840 aagctgttct gtgttggggt gaattaatga atctggctac ctgggtggga agtaatttgg 900 aagatccagc atccagggaa ttagtagtca gttatgtcaa tgttaatatg ggcttaaaga 960 t 961 <210> 12 <211> 960 <212> DNA <213> Hepatitis B virus <400> 12 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctggcagct 60 tgttttgctc gcagccggtc tggagcgaaa cttatcggga ctgacaactc tgttgtcctt 120 tctcggaaat acacctcctt cccatggctg ctcggatgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtctacgt cccgtcggcg ctgaatcccg cggacgaccc gtctcggggc 240 cgtttgggcc tctaccgtcc ccttctgcag ctgccgttcc ggccgaccac ggggcgcacc 300 tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccaggtcttg cccaaggtct 420 tacataagag gactcttgga ctctcagcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgttt gtttaaagac tgggaggagt tgggggagga gattaggtta aaggtctttg 540 tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600 ctgcctaatc atctcatgtt catgtcccac tgttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacattg acccgtataa agaatttgga gcttctgtgg agttactctc 720 ttttttgcct tctgacttct ttccttctat tcgagatctc ctcgacaccg cctctgcact 780 gtatcgggag gccttagagt ctccggaaca ttgttcacct caccatacag cactcaggca 840 agctattctg tgttggggtg agttgatgaa tctggccacc tgggtgggaa gtaatttgga 900 agacccagca tccagggaat tagtagtcag ctatgtcaat gttaacatgg gcctaaaaat 960 <210> 13 <211> 960 <212> DNA <213> Hepatitis B virus <400> 13 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagcagct 60 tgttttgctc gcagccggtc tggagcgaaa cttatcggca ccgacaactc tgttgtcctc 120 tctcggaaat acacctcctt tccatggctg ctagggtgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtctacgt cccgtcggcg ctgaatcccg cggacgaccc gtctcggggc 240 cgtttgggac tctaccgtcc ccttcttcat ctgccgttcc ggccgaccac ggggcgcacc 300 tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccaggtcttg cccaaggtct 420 tacataagag gactcttgga ctctcagcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgttt gtttaaagac tgggaggagt tgggggagga gattaggtta atgatctttg 540 tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600 ctgcctaatc atctcatgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacattg acccgtataa agaatttgga gcttctgtgg agttactctc 720 ttttttgcct tctgacttct ttccttctat tcgagatctc ctcgacaccg cctctgctct 780 gtatcgggag gccttagagt ctccggaaca ttgttcacct caccatacag cactcaggca 840 agctattctg tgttggggtg agttgatgaa tctggccacc tgggtgggaa gtaatttgga 900 agacccagca tccagggaat tagtagtcag ctatgtcaat gttaatatgg gcctaaaaat 960 <210> 14 <211> 960 <212> DNA <213> Hepatitis B virus <400> 14 cgcgtgcgtg gaaccttttc ggctcctctg ccgatccata ctgcggaact cctagccgct 60 tgttttgctc gcagcaggtc tggagcaaac attatcggga ctgataactc tgttgtcctc 120 tcccgcaaat atacatcgta tccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtttacgt cccgtcggcg ctgaatcctg cggacgaccc ttctcggggt 240 cgcttgagac tctctcgtcc ccttctccgt ctgccgttcc gaccgaccac ggggcgcacc 300 tctctttacg cggactcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccgaatgttg cccaaggtct 420 tacataagag gactcttgga ctctctgcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgttt gtttaaagac tgggaggagt tgggggagga gattagatta aaggtctttg 540 tactaggagg ctgtaggcat aaattggtct gcgcaccggc gccatgcacc tttttcacct 600 ctgcctaatc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacatcg acccttataa agaatttgga gctactgtgg agttactctc 720 gtttttgcct tctgacttct ttccttcagt acgagatctt ctagataccg cctcagctct 780 gtatcgggaa gccttagagt ctcctgagca ttgttcacct caccatactg cactcaggca 840 agcaattctt tgctgggggg aactaatgac tctagctacc tgggtgggtg ttaatttgga 900 agatccagca tctagagacc tagtagtcag ttatgtcaac actaatatgg gcctaaagtt 960 <210> 15 <211> 960 <212> DNA <213> Hepatitis B virus <400> 15 cgcatgcgtg gaaccttttt ggctcctctg ccgatccata ctgcggaact cctagccgct 60 tgttttgctc gcagcaggtc tggagcaaac attctcggga ctgacaactc tgttgtcctc 120 tcccgcaaat atacatcgtt tccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtttacgt cccgtcgrcg ctgaatcccg cggacgaccc gtctcggggc 240 cgcttggggc cctgtcgtcc tcttctctgc ctgccgttcc gaccgagcac ggggcgcacc 300 tctctttacg cggactcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccaaagcttg cccaaggtct 420 tacataagag gactcttgga ctctctgcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgttt gtttaacgac tgggaggagt tgggggagga gattaggtta aaggtctttg 540 tactaggagg ctgtaggcat aaattggtct gcgcaccagc accatgcaac tttttcacct 600 ctgcctaatc atcttttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttagggc atggacattg acccttataa agaatttgsa gcttctgtgc agttactctc 720 gtttttgcct gttsacttct ttccttccgt acgagatctt ctagataccg cctcagctct 780 gtatcgggat gctttagagt ctcctgagca tttgtcaccg caccatactg cactcaggca 840 agcaattctt tgctggggag aattaatgac tctagctacc tgggtgggta ctaatttaga 900 agatcaagca tctagggacc tagtagtcag ttatgtcaac amtaatatgg gcctaaagtt 960 <210> 16 <211> 957 <212> DNA <213> Hepatitis B virus <400> 16 cgcatgcgtg gaacctttgt ggctcctctt ccgatccata ctgcggaact cctagccgct 60 tgttttgctc gcagccggtc tggagcaaac attattggga ctgataactc tgttgtcctc 120 tcccgcaaat atacatcgtt tccatggctg ctaggccgtg ctgccaactg ggtcctgcgc 180 gggacgtcct ttgtttacgt cccgtcggcg ctgaatcccg cggacgaccc ttctcggggt 240 cgcttgggac tctctcgtcc ccttctccgt ctgccgttcc gaccgaccac ggggcgcacc 300 tctctttacg cggactcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccaattgccc aaggtcttac 420 ataagaggac tcttggactc tctgcaatgt caacgaccga ccttgaggca tacttcaaag 480 actgtttgtt taaagactgg gaggagttgg gggaggagat tagattaaag gtctttgtac 540 taggaggctg taggcataaa ttggtctgcg caccagcacc atgcaacttt ttcacctctg 600 cctaatcatc tcttgttcat gtcctactgt tcaagcctcc aagctgtgcc ttgggtggct 660 ttggggcatg gacattgacc cttataaaga atttggagct accgtggagt tactctcatt 720 tttgccttct gacttctttc cttcggtacg agatcttcta gataccgcct cagctctgta 780 tcgggaagct ttagagtctc ttgagcattg ttcacctcac catactgcac tcaggcaagc 840 aattctttgc tggggggaac taatgactct agctacctgg gtgggagtta atttggaaga 900 tccagcatct agggacctag tagtcagtta tgtcaacact aatatgggcc taaagtt 957 <210> 17 <211> 960 <212> DNA <213> Hepatitis B virus <400> 17 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct 60 tgttttgctc gcagcaggtc tggagcraaa cttatcggga cggataattc tgtcgtcctc 120 tcccggaaat atacatcgtt tccatggctg ctaggctgtg ctgccaactg gatcctgcga 180 gggacgtcct ttgtctacgt cccgtcggcg ctgaatcctg cggacgaccc gtctcggggt 240 cgcttggggg tctatcgtcc ccttctccgt ctrccgttcc agccgwccac ggggcgcacc 300 tctctttacg cggtctcccc gtctgtgcct tctcgcctgc cggwccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccagatattg cccaaggtct 420 tatataagag gactcttgga ctctctgcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgttt gtttaaagac tgggaggagt tgggggagga gattagatta atgatctttg 540 tactaggagg ctgtaggcat aaawtggtct gcgtaccagc accatgcaac tttttcacct 600 ctgcctaatc atctcgtgtt catgtcctac tgttcaagcc tccaagctgt gccttgagtg 660 gctttaggac atggacattg acccttataa agaatttgga gcttctgtgg agttactctc 720 gtttttgcct tctgacttct ttccttcagt aagagatctt ctagataccg cctctgctct 780 gtttcgggat gccttagaat ctcctgagca ttgttcacct caccatactg cactcaggca 840 agccattctt tgctggggag atgtaatgaa tctagctaca tgggtgggtg caaatttgga 900 agatccaaca tccagggacc tggtagtcgg ttatgtcaat agtaatatgg gcctaaagtt 960 <210> 18 <211> 960 <212> DNA <213> Hepatitis B virus <400> 18 cgcatgcgtg gaacctttgy ggctcctctg ccgatccata ctgcggaact cctggccgct 60 tgttttgctc gcagcaggtc tggagcgaaa cttattggaa cggataattc tgtcgttctc 120 tcccggaaat atacatcatt tccatggctg ctaggctgtg ctgccaactg gatcctgcga 180 gggacgtcct ttgtctacgt cccgtcagcg ctgaatcctg cggacgaccc gtctcggggt 240 cgcttgggga tctatcgtcc ccttctccgt ctgccgttcc ggccgaccac ggggcgcacc 300 tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gaaaccaccg tgaacgccca ccaaatcttg cccaaggtct 420 tatataagag gactcttgga ctctctgcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgctt gtttaaagac tgggaggagt tgggggagga gattagatta atgatctttg 540 tactaggagg ctgtaggcat aaattggtct gcgcaccagc accatgcaac tttttcacct 600 ctgcctaatc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttaggac atggacattg acccttataa agaatttgga gctwctgtgg agttactctc 720 ktttttgcct catgacttct ttccttcaat aagagatctt ctagataccg ccacagctct 780 gtatcgggat gccttagaat ctcctgagca ttgttcacct caccacacgg cactcaggca 840 agccattctt tgctgggggg atgtaatgaa tctagctacc tgggtgggtg taaatttgga 900 agatccagca tccagggacc tggtagtcgg ttatgtcaat actaatatgg gcctaaagtt 960 <210> 19 <211> 960 <212> DNA <213> Hepatitis B virus <400> 19 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct 60 tgttttgctc gcagcaggtc tggagcgaaa ctcataggga cagataattc tgtcgttctc 120 tcccggaaat atacatcatt tccatggctg ctaggctgtg ctgccaactg gatcctgcga 180 gggacgtcct ttgtctacgt cccgtcagcg ctgaatcctg cggacgaccc ctctcggggc 240 cgcttggggg tctatcgtcc ccttctccgt ctgccgttcc ggccgaccac ggggcgcacc 300 tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgccca ccagatcttg cccaaggtct 420 tacataagag gactcttgga ctctctgcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgttt gtttaaagac tgggaggagt tgggggagga gactagatta atgatctttg 540 tactaggagg ctgtaggcat aaattggtct gcgcaccagc accatgcaac tttttcacct 600 ctgcctaatc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttgggac atggacattg acccttataa agaatttgga gctactgtgg agttactctc 720 gtttttgcct tctgacttct ttccttcagt aagagatctt ctagataccg cctctgctct 780 gtatcgggat gccttagaat ctcctgagca ttgttcacct caccatactg cactcaggca 840 agccattctt tgctggggag aattaatgac tctagctacc tgggtgggtg taaatttgga 900 agatccagca tccagggacc tagtagtcag ttatgtcaat actaatatgg gcctaaagtt 960 <210> 20 <211> 960 <212> DNA <213> Hepatitis B virus <400> 20 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact ccttgcagct 60 tgtttcgctc gcagccggtc tggagcgaaa ctcatcggca cagacaactc tgttgtcctc 120 tctaggaagt acacctcctt cccatggctg ctcggttgtg ctgccaactg gatcctacgc 180 gggacgtcct ttgtttacgt cccgtcggcg ctgaatccag cggacgatcc ctctcggggt 240 cgcttggggc tgtatcgccc ccttctccgt ctgccgttcc agccgacgac gggtcgcacc 300 tctctttacg cggcctcccc gtctgttcct tctcgtctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgcccc tcgaagcttg ccaacagtct 420 tacataagcg gactcttgga ctttcaggaa ggtcaatcac ctggatcgaa gaatacatca 480 aagactgtgt atttaaggac tgggaggagc tgggggagga gattaggtta aaggtctttg 540 tattaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600 ctgcctaatc atcttttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacattg acccttataa agaatttgga gcttctgtgg aattactctc 720 ttttttgcct tctgacttct tcccgtcagt tcgggaccta ctcgacaccg cttcagccct 780 ctaccgggat gctttagaat caccagaaca ttgcacacct aaccataccg ctctcaggca 840 agctatattg tgctggggtg agttaatgac tttggcttcc tgggtgggca ataacttgga 900 agatcctgct gctagggacc tagtggttaa ctatgtcaat actaacatgg gcctaaaaat 960 <210> 21 <211> 960 <212> DNA <213> Hepatitis B virus <400> 21 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact ccttgcagcc 60 tgtttcgctc gcagccggtc tggagcgaac attatcggca cagacaactc tgttgtcctc 120 tctaggaagt acacctcctt tccatggctg ctcggttgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtttacgt cccgtcggcg ctgaatcccg cggacgaccc ttcccggggt 240 cgcttggggc tgtaccgccc ccttcttcgt ctgccgttcc agccgacgac gggtcgcacc 300 tctctttacg cggactcccc gtctgttcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgcccc ctggaatctg ccaacagtct 420 tacataagag gactcttgga ctttcaggac ggtcaatgac ctggatcgaa gaatacatca 480 aagactgtgt atttaaggac tgggaggagc tgggggagga gatcaggtta aaggtctttg 540 tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600 ctgcctaatc atcttttgtt catgtcccac tgttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacattg acccttataa agaatttgga gcttctgtgg aattgctctc 720 ttttttgcct tctgatttct tcccgtctgt tcgggaccta ctcgacaccg cttcagccct 780 ttaccgggat gctctagagt caccggaaca ttgcaccccc aatcataccg ctctcaggca 840 agctattttg tgctggggtg agttaatgac tttggcttcc tgggtgggta ataatttgga 900 agaccctgca gctagggatt tagtagttaa ttatgtcaac actaatatgg gcctgaaaat 960 <210> 22 <211> 960 <212> DNA <213> Hepatitis B virus <400> 22 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact ccttgcagcc 60 tgtttcgctc gcagccggtc tggagcgaac attatcggca cagacaactc tgttgtcctc 120 tctaggaagt acacctcctt tccatggctg ctcggttgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtttacgt cccgtcggcg ctgaatcccg cggacgaccc ttcccggggt 240 cgcttggggc tctaccgccc ccttcttcgt ctgccgttcc agccgacgac gggtcgcacc 300 tctctttacg cggactcccc gtctgttcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgcccc ctggaatctg ccaacagtct 420 tacataagag gactcttgga ctttcaggac ggtcaatgac ctggatcgaa gaatacatca 480 aagactgtgt atttaaggac tgggaggagc tgggggagga gatcaggtta aaggtctttg 540 tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600 ctgcctaatc atcttttgtt catgtcccac tgttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacattg acccttataa agaatttggc gcttctgtgg aattgctctc 720 ttttttgcct tctgatttct tcccgtctgt tcgggaccta ctcgacaccg cttcagccct 780 ttaccgggat gctctagagt caccggaaca ttgcaccccc aatcataccg ctctcaggca 840 agctattttg tgctggggtg agttaatgac tttggcttcc tgggtgggta ataatttgga 900 agaccctgca gctagggatt tagtagttaa ttatgtcaac actaatatgg gcctgaaaat 960 <210> 23 <211> 996 <212> DNA <213> Hepatitis B virus <400> 23 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagctgct 60 tgttttgctc gcagccggtc tggagcaaaa ctcattggga ctgacaattc tgtcgtcctt 120 tctcggaaat atacatcctt tccatggctg ctaggctgtg ctgccaactg gatccttcgc 180 gggacgtcct ttgtttacgt cccgtcagcg ctgaatccag cggacgaccc ctcccggggc 240 cgtttggggc tctgtcgccc ccttctccgt ctgccgttcc tgccgaccac ggggcgcacc 300 tctctttacg cggtctcccc gtctgttcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgttacatg gaaaccgcca tgaacacctc tcatcatctg ccaaggcagt 420 tatataagag gactcttgga ctgtttgtta tgtcaacaac cggggtggag aaatacttca 480 aggactgtgt ttttgctgag tgggaagaat taggcaatga gtccaggtta atgacctttg 540 tattaggagg ctgtaggcat aaattggtct gcgcaccagc accatgtaac tttttcacct 600 ctgcctaatc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttagggc atggatagaa caactttgcc atatggcctt tttggcttag acattgaccc 720 ttataaagaa tttggagcta ctgtggagtt gctctcgttt ttgccttctg actttttccc 780 gtctgttcgt gatcttctcg acaccgcttc agctttgtac cgggaatcct tagagtcctc 840 tgatcattgt tcgcctcacc atacagcact caggcaagca atcctgtgct ggggtgagtt 900 gatgactcta gccacctggg tgggtaataa tttggaagat ccagcatcca gagatttggt 960 ggtcaattat gttaatacta atatgggttt aaaaat 996 <210> 24 <211> 996 <212> DNA <213> Hepatitis B virus <400> 24 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagctgct 60 tgttttgctc gcagccggtc tggagcaaaa ctcattggga ctgacaattc tgtcgtcctt 120 tctcggaaat atacatcctt tccatggctg ctaggctgtg ctgccaactg gatccttcgc 180 gggacgtcct ttgtttacgt cccgtcagcg ctgaatccag cggacgaccc ctcccggggc 240 cgtttggggc tctgtcgccc ccttctccgt ctgccgttcc tgccgaccac ggggcgcacc 300 tctctttacg cggtctcccc gtctgttcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgttacatg gaaaccgcca tgaacacctc tcatcatcta ccaaggcagt 420 tatataagag gactcttgga ctgtttgtta tgtcaacaac cgggatggag aaatacttca 480 aggactgtgt ttttgctgag tgggaagaat taggcaatga gtccaggtta atgacctttg 540 tattaggagg ctgtaggcat aaattggtct gcgcaccagc accatgtaac tttttcacct 600 ctgcctaatc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttagggc atggatagaa caactttgcc atatggcctt tttggcttag acattgaccc 720 ttataaagaa tttggagcta ctgtggagtt gctctcgttt ttgccttctg actttttccc 780 gtctgttcgt gatcttctcg acaccgcttc agctttgtac cgggaatcct tagagtcctc 840 tgatcattgt tcgcctcacc atacagcact caggcaagca attctgtgct ggggtgagtt 900 gatgactcta gctacctggg tgggtaataa tttggaagat ccagcatcca gagatttggt 960 ggtcaattat gttaatacta atatgggttt aaaaat 996 <210> 25 <211> 999 <212> DNA <213> Hepatitis B virus <400> 25 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagctgct 60 tgttttgctc gcagccggtc tggagcgaaa ctcattggga ctgacaattc tgtcgtcctt 120 tctcggaaat atacatcctt tccatggctg ctaggctgtg ctgccaactg gatccttcgc 180 gggacgtcct ttgtttacgt cccgtcagcg ctgaatccag cggacgaccc ctcccggggc 240 cgtttggggc tctgtcgccc ccttctccgt ctgccgttcc tgccgaccac ggggcgcacc 300 tctctttacg cggtctcccc gtctgttcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgttacatg gaaaccgcca tgaacacctc tcatcatctg ccaaggcagt 420 tatataagag gactcttgga ctgtttgtta tgtcaacaac cggggtggag aaatacttca 480 aggactggtg tgtttttgct gagtgggaag aattaggcaa tgagtccagg ttaatgacct 540 ttgtattagg aggctgtagg cataaattgg tctgcgcacc agcaccaatg caacttttca 600 cctctgccta atcatctctt gttcatgtcc tactgttcaa gcctccaagc tgtgccttgg 660 gtggctttag ggcatggata gaacaacttt gccatatggc ctttttggct tagacattga 720 cccttataaa gaatttggag ctactgtgga gttgctctcg tttttgcctt ctgacttttt 780 cccgtctgtt cgtgatcttc tcgacaccgc ttcagctttg taccgggaat ccttagagtc 840 ctctgatcat tgttcgcctc accatacagc actcaggcaa gcaatcctgt gctggggtga 900 gttgatgact ctagctacct gggtgggtaa taatttggaa gatccagcat ccagagattt 960 ggtggtcaat tatgttaata ctaatatggg tttaaaaat 999 <210> 26 <211> 960 <212> DNA <213> Hepatitis B virus <400> 26 cgcatgcgcg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct 60 tgtttcgctc gcagcaggtc tggagcggac attatcggca ctgacaactc cgttgtcctt 120 tctcggaagt acacctcctt cccatggctg ctaggatgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtctacgt cccgtcggcg ctgaatcctg cggacgaccc ctctcgtggt 240 cgcttggggc tctgccgccc tcttctccgc ctgccgttcc ggccgacgac gggtcgcacc 300 tctctttacg cggactcccc gcctgtgcct tctcatctgc cggcccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgcccc ttggaacttg ccaacaacct 420 tacataagag gactcttgga ctttcgcccc ggtcaacgac ctggattgag gaatacatca 480 aagactgtgt atttaaggac tgggaggagt cgggggagga gttgaggtta aaggtctttg 540 tattaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600 ctgcctaatc atcttttgtt catgtcccac tgttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacattg acccttataa agaatttgga gcttctgtgg agttactctc 720 atttttgcct tctgacttct tcccgtctgt ccgggaccta ctcgacaccg cttcagccct 780 ctaccgagat gccttagaat caccagaaca ttgcaccccc aaccacactg ctctcaggca 840 agctattttg cgctggggtg agttgatgac cttggcttcc tgggtgggca ataatttaga 900 ggatcctgca gcaagagatc tagtagttaa ttatgtcaat actaacatgg gcctaaaaat 960 <210> 27 <211> 960 <212> DNA <213> Hepatitis B virus <400> 27 cgcatgcgcg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct 60 tgtttcgctc gcagcaggtc tggagcggac attatcggca ctgacaactc cgttgtcctt 120 tctcggaagt acacctcctt cccatggctg ctaggttgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtctacgt cccgtcggcg ctgaatcctg cggacgaccc ctctcgtggt 240 cgcttggggc tctgccgccc tcttctccgc ctgtcgttcc ggccgacgac gggtcgcacc 300 tctctttacg cggactcccc gcctgtgcct tctcatctgc cggcccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgcccc ttggaacttg ccaacaacct 420 tacataagag gactcttgga ctttcgcccc ggtcaacgac ctggattgag gaatacatca 480 aagactgtgt atttaaggac tgggaggagt cgggggagga gttgaggtta aaggtctttg 540 tattaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600 ctgcctaatc atcttttgtt catgtcccac tgttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacattg acccttataa agaatttgga gcttctgtgg agttactctc 720 atttttgcct tctgacttct tcccgtctgt ccgggaccta ctcgacaccg cttcagccct 780 ctaccgagat gccttagaat caccagaaca ttgcaccccc aaccacactg ctctcaggca 840 agctattttg tgctggggtg agttgatgac attggcttcc tgggtgggca ataatttaga 900 ggatcctgca gcaagagatc tagtagttaa ttatgtcaat actaacatgg gcctaaaaat 960 <210> 28 <211> 960 <212> DNA <213> Hepatitis B virus <400> 28 cgcatgcgcg gaacctttta ggctccgctg ccgatccata ctgcggaact cctagcagct 60 tgtttcgctc gcagccggtc tggagcggac attatcggca ctgacaactc cgttgtcctt 120 tctcggaagt acacctcctt cccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtctacgt cccgtcggcg ctgaatcctg cggacgaccc ctctcgtggt 240 cgcttggggc tatgccgccc tcttctccgc ctgccgttcc ggccgacgac gggtcgcacc 300 tctctttacg cggactcccc acctgtgcct ttacatcggc cggcccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg ggaaccaccg tgaacgcccc ttggaacttg ccaacaacct 420 tatataagag gactcttgga ctttcgcccc ggtcaacgac ctggattgag gaatacatca 480 aagactgtgt atttaaggac tgggaggagt cgggggagga gtcgaggtta atgatctttg 540 tattaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600 ctgcctaatc agcttttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttgggac atggacatcg acccttataa agaatttgga gcttctgtgg agttactctc 720 mtttttgcct tctgatttct tcccgtctgt ccgggaccta ctcgacaccg cttcagccct 780 cttccgagat gccttagaat cacccgaaca ttgcaccccc caccayacag ctctcaggca 840 agctattttg tgctggggtg agttgatgac tttggcttcc tgggtgggca ataatttaga 900 tgatcctgca tccagagatc tagtagttaa ttatgtcaat actaacatgg gcctaaaact 960 <210> 29 <211> 960 <212> DNA <213> Hepatitis B virus <400> 29 cgcatgcgtg gaacctttgc agctccactg ccgatccata ctgcggaact gctagctgcc 60 tgttttgctc gcagccggtc tggagcaaaa cttatcggga ctgataattc tgtcgtcctt 120 tcacggaaat atacatcatt tccatggctg ctaggctgtg ctgccaactg gatcatgcgc 180 gggacgtcct ttgtctacgt cccgtcggcg ctgaatcctg cggacgaccc ctctcggggc 240 cgtttgggga tctaccgtcc ccttctccgt ctgccgtacc ggccgtccac ggggcgcacc 300 tctctttacg cggactcccc gtgtgtgcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgccca cctggtattg cccaaggtat 420 tgcataagag gactcttgga ctctcggcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgtgt gtttaaagac tgggaggagc tgggggagga gattaggcta aaggtctttg 540 tactaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600 ctgcctaatc atctcatgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttggggc atggacattg acccttataa agaatttgga gcttctgtgg agttactctc 720 ttttttgcct tctgatttct ctccgtctgt tcgagatcta ctcgacaccg cctcagctct 780 ctaccgggag gccttagagt ctccggaaca ttgttcacct caccatacag cacttaggca 840 agctgtcctg tgttggggtg agttgatgac tctagctacc tgggtgggaa gtaatttgga 900 cgaccctgga tccagggatt tagtagtcac ctatgtcaat gttaatatgg gcctaaagtt 960 <210> 30 <211> 960 <212> DNA <213> Hepatitis B virus <400> 30 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata cggcggaact gctagctgcc 60 tgttttgctc gcagcaggtc tggggcaaat cttatcggga ctgataattc tgtcgtcctt 120 tcgcggaaat atacatcatt tccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtctacgt cccgtcggcg ctgaatcctg cggacgaccc ctctcggggc 240 cgcttgggga tctaccgtcc ccttcttcgc ctgccgttcc ggccgtccac ggggcgcacc 300 tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggaccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgacca cctgaccttg cccaaggtct 420 tgcataagag gactcttgga ctcccagcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgtgt gtttaaagac tgggaggagt tgggggagga gatcaggtta aagatttatg 540 tattaggagg ctgtaggcat aaattggtct gcgcaccagc accatgcaac tttttcacct 600 ctgcctaatc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttaggac atggacattg acccttataa agaatttgga gcttctttgg agttactctc 720 ttttttgcct tctgatttct ttccatctgt tcgagatctc ctcgacaccg cctcagcttt 780 gtatcgggag gccttagagt ctcctgaaca ttgtacacct caccatacag cactcaggca 840 agcggtaata tgttggggtg agttgatgac tctagctact tgggtgggaa gtaatttgga 900 agaccctgcc tccagggatt tagtagtcag ctatgtcaat ggtcatatgg gcctaaaatt 960 <210> 31 <211> 960 <212> DNA <213> Hepatitis B virus <400> 31 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact gctagctgcc 60 tgttttgctc gcagcaggtc tggagcaaac attataggga ctgataattc cgtcgtcctt 120 tcgcggaaat atacgtcctt tccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtctacgt cccgtcggcg ctgaatcctg cggacgaccc ctctcggggc 240 cgcttgggga tctaccgtcc ccttcttcgt ctgccgttcc ggccgtccac ggggcgcacc 300 tctctttacg cggtctcccc gtctgtgcct tctcatctgc cggcccgtgt gcacttcgct 360 tcacctctgc acgtcgcatg gagaccaccg tgaacgccca cctgaccttg cccaaggtat 420 tgcataagag gactcttgga ctctcagcaa tgtcaacgac cgaccttgag gcatacttca 480 aagactgtgt gtttaaagac tgggaggagt tgggggagga gatcaggtta aaggtctttg 540 tattaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600 ctgcctaatc atctcatgtt catgtcctac tgttcaagcc tccaagttgt gccttgggtg 660 gctttggggc atggacattg acccttataa agaatttgga gcttctgtgg agttactctc 720 ttttttgcct tctgatttct ttccatctat tcgagatctc ctcgacaccg cctcagcttt 780 gtatcgggag gccttagagt ctcctgaaca ttgttcacct caccatacag cactcaggca 840 agctgttcta tgttggggtg agttgatgac tctagctacc tgggtgggaa gtaatttgga 900 agaccctgcc tccagggatt tagtagtcag ctatgtcaat gttaatatgg ggctaaaaat 960 <210> 32 <211> 960 <212> DNA <213> Hepatitis B virus <400> 32 cgcatgcgtg gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagcagct 60 tgttttgctc gcagcaggtc tggggcaaac ctactcggga cagataattc tgtggtttta 120 tcacggaagt atacgtcctt cccatggctg ctaggctgtg ctgccaactg gatcctgcgc 180 gggacgtcct ttgtctacgt cccgtcggcg ctgaatcccg cggacgaccc gtctcggggc 240 aagttgggcc tctaccgtcc tcttctccgt ctgccgttcc gaccgaccac ggggcgcacc 300 tctctttacg cggtctcccc gtctgtacct tctcatctgc cggcccgtgt gcacttcgct 360 tcacctctgc acgttgcatg gagaccaccg tgaacgcccc ctggaatttg ccaagagtgt 420 tacataagcg gactcttgga ctttcggaca tgtcaacgtc cgcaattgag acatacttca 480 aggactgtgt atttaaagac tgggaggagt caggggagga gattaggtta atgatctttg 540 tattaggagg ctgtaggcat aaattggtct gttcaccagc accatgcaac tttttcacct 600 ctgcctaatc atctcttgtt catgtcctac tgttcaagcc tccaagctgt gccttgggtg 660 gctttagggc atggacattg acccttataa agaatttgga gcttctgtgg agttactctc 720 ttttttgcct tctgatttct ttccgtcaat cagagacctc ctcgacaccg cctcagctct 780 ataccgagaa gccttagagt ctccagaaca ttgctcacct caccatacag cacttaggca 840 agctgtgcta tgttggggtg agttgatgaa tctggctacc tgggtgggaa gtaatttgga 900 agacccagca tccagggaac ttgtagtcag ctatgttaac attaatatgg gcctaaaaat 960 <210> 33 <211> 378 <212> DNA <213> Homo sapiens <400> 33 tatcacagat tctttttttt taaattaaag taacatttcc aatctactaa tgctaatact 60 gtttcgtatt tatagctgat ttgatggagt tggacatggc catggaacca gacagaaaag 120 cggctgttag tcactggcag caacagtctt acctggactc tggaatccat tctggtgcca 180 ctaccacagc tccttctctg agtggtaaag gcaatcctga ggaagaggat gtggatacct 240 cccaagtcct gtatgagtgg gaacagggat tttctcagtc cttcactcaa gaacaagtag 300 ctggtaagag tattattttt cattgcctta ctgaaagtca gaatgcagtt ttgagaacta 360 aaaagttagt gtataata 378 <210> 34 <211> 673 <212> DNA <213> Homo sapiens <400> 34 gtcgcctgcg ctgctctccg catgtcgctg gttccccccg gccgccctca accccagccg 60 gacgccgacc ccggggaggc ccacctggcg gaaggagggg gcggcggggg gcggccgtgc 120 gtcccagggc acgcacacca ggcactgggc caccagcgcg cggaaagccg ccgggtcccc 180 gcgctgcacc agccgccagc cctggggccc caggcgccgc acgaacgtgg ccagcggcag 240 cacctcgcgg tagtggctgc gcagcaggga gcgcacggct cggcagcggg gagcgcgcgg 300 catcgcgggg gtggccgggg ccagggcttc ccacgtgcgc agcaggacgc agcgctgcct 360 gaaactcgcg ccgcgaggag agggcggggc cgcggaaagg aaggggaggg gctgggaggg 420 cccggagggg gctgggccgg ggacccggga ggggtcggga cggggcgggg tccgcgcgga 480 ggaggcggag ctggaaggtg aaggggcagg acgggtgccc gggtccccag tccctccgcc 540 acgtgggaag cgcggtcctg ggcgtctgtg cccgcgaatc cactgggagc ccggcctggc 600 cccgacagcg cagctgctcc gggcggaccc gggggtctgg gccgcgcttc cccgcccgcg 660 cgccgctcgc gct 673 <210> 35 <211> 779 <212> DNA <213> Homo sapiens <400> 35 ggttccttct ctgcaggccc aggtgaccca gggttggaag tgtctcatgc tggatcccca 60 cttttcctct tgcagcagcc agactgcctt ccgggtcact gccatggagg agccgcagtc 120 agatcctagc gtcgagcccc ctctgagtca ggaaacattt tcagacctat ggaaactgtg 180 agtggatcca ttggaagggc aggcccacca cccccacccc aaccccagcc ccctagcaga 240 gacctgtggg aagcgaaaat tccatgggac tgactttctg ctcttgtctt tcagacttcc 300 tgaaaacaac gttctggtaa ggacaagggt tgggctgggg acctggaggg ctggggacct 360 ggagggctgg ggggctgggg ggctgaggac ctggtcctct gactgctctt ttcacccatc 420 tacagtcccc cttgccgtcc caagcaatgg atgatttgat gctgtccccg gacgatattg 480 aacaatggtt cactgaagac ccaggtccag atgaagctcc cagaatgcca gaggctgctc 540 cccccgtggc ccctgcacca gcagctccta caccggcggc ccctgcacca gccccctcct 600 ggcccctgtc atcttctgtc ccttcccaga aaacctacca gggcagctac ggtttccgtc 660 tgggcttctt gcattctggg acagccaagt ctgtgacttg cacggtcagt tgccctgagg 720 ggctggcttc catgagactt caatgcctgg ccgtatcccc ctgcatttct tttgtttgg 779 <210> 36 <211> 528 <212> DNA <213> Homo sapiens <400> 36 gctgccgtct tccagttgct ttatctgttc acttgtgccc tgactttcaa ctctgtctcc 60 ttcctcttcc tacagtactc ccctgccctc aacaagatgt tttgccaact ggccaagacc 120 tgccctgtgc agctgtgggt tgattccaca cccccgcccg gcacccgcgt ccgcgccatg 180 gccatctaca agcagtcaca gcacatgacg gaggttgtga ggcgctgccc ccaccatgag 240 cgctgctcag atagcgatgg tgagcagctg gggctggaga gacgacaggg ctggttgccc 300 agggtcccca ggcctctgat tcctcactga ttgctcttag gtctggcccc tcctcagcat 360 cttatccgag tggaaggaaa tttgcgtgtg gagtatttgg atgacagaaa cacttttcga 420 catagtgtgg tggtgcccta tgagccgcct gaggtctggt ttgcaactgg ggtctctggg 480 aggaggggtt aagggtggtt gtcagtggcc ctccaggtga gcagtagg 528 <210> 37 <211> 260 <212> DNA <213> Homo sapiens <400> 37 aaaaaggcct cccctgcttg ccacaggtct ccccaaggcg cactggcctc atcttgggcc 60 tgtgttatct cctaggttgg ctctgactgt accaccatcc actacaacta catgtgtaac 120 agttcctgca tgggcggcat gaaccggagg cccatcctca ccatcatcac actggaagac 180 tccaggtcag gagccacttg ccaccctgca cactggcctg ctgtgcccca gcctctgctt 240 gcctctgacc cctgggccca 260 <210> 38 <211> 436 <212> DNA <213> Homo sapiens <400> 38 cctggttttt taaatgggac aggtaggacc tgatttcctt actgcctctt gcttctcttt 60 tcctatcctg agtagtggta atctactggg acggaacagc tttgaggtgc gtgtttgtgc 120 ctgtcctggg agagaccggc gcacagagga agagaatctc cgcaagaaag gggagcctca 180 ccacgagctg cccccaggga gcactaagcg agcctggttt tttaaatggg acaggtagga 240 cctgatttcc ttactgcctc ttgcttctct tttcctatcc tgagtagcac tgcccaacaa 300 caccagctcc tctccccagc caaagaagaa accactggat ggagaatatt tcacccttca 360 ggtactaagt cttgggacct cttatcaagt ggaaagtttc cagtctaaca ctcaaaatgc 420 cgttttcttc ttgact 436 <210> 39 <211> 453 <212> DNA <213> Homo sapiens <400> 39 cctggttttt taaatgggac aggtaggacc tgatttcctt actgcctctt gcttctcttt 60 tcctatcctg agtagtggta atctactggg acggaacagc tttgaggtgc gtgtttgtgc 120 ctgtcctggg agagaccggc gcacagagga agagaatctc cgcaagaaag gggagcctca 180 ccacgagctg cccccaggga gcactaagcg aggtaagcaa gcaggacaag aagcggtgga 240 ggagaccaag ggtgcagtta tgcctcagat tcacttttat cacctttcct tgcctctttc 300 ctagcactgc ccaacaacac cagctcctct ccccagccaa agaagaaacc actggatgga 360 gaatatttca cccttcaggt actaagtctt gggacctctt atcaagtgga aagtttccag 420 tctaacactc aaaatgccgt tttcttcttg act 453 <210> 40 <211> 257 <212> DNA <213> Homo sapiens <400> 40 caattgtaac ttgaaccatc ttttaactca ggtactgtgt atatacttac ttctccccct 60 cctctgttgc tgcagatccg tgggcgtgag cgcttcgaga tgttccgaga gctgaatgag 120 gccttggaac tcaaggatgc ccaggctggg aaggagccag gggggagcag ggctcactcc 180 aggtgagtga cctcagcccc ttcctggccc tactcccctg ccttcctagg ttggaaagcc 240 ataggattcc attctca 257 <210> 41 <211> 232 <212> DNA <213> Homo sapiens <400> 41 ttggtcaggg aaaaggggca cagaccctct cactcatgtg atgtcatctc tcctccctgc 60 ttctgtctcc tacagccacc tgaagtccaa aaagggtcag tctacctccc gccataaaaa 120 actcatgttc aagacagaag ggcctgactc agactgacat tctccacttc ttgttcccca 180 ctgacagcct cccaccccca tctctccctc ccctgccatt ttgggttttg gg 232 <210> 42 <211> 120 <212> DNA <213> Lambda phage <400> 42 ctggtgccgc cgcaatggcc attaaccgcg ttgcttcatc cgcgatatcg cagtcggcgt 60 cacaggttgc ccgtgagaca aaggtacgcc ggaaactggt aaaggaaagg gccaggctga 120 <210> 43 <211> 120 <212> DNA <213> Lambda phage <400> 43 acgtgtcggc ggagcagatt gcgtatgttg ctcagttgca gcgttccggc gatgaagccg 60 gggcattgca ggcggcgaac gaggccgcaa cgaaagggtt tgatgaccag acccgccgcc 120 <210> 44 <211> 120 <212> DNA <213> Lambda phage <400> 44 gccgtggtgg ctggtctgcc gggggacgat tcataagttc cgctgtgtgc cgcatctcac 60 cgggcggcgc tttgagcacg gtgtgacgga ctgttacaca ctgttccggg atgcttatca 120 <210> 45 <211> 120 <212> DNA <213> Lambda phage <400> 45 catgtaccgg gcgatgttat tgaaatctgc gatgatgact atgccggtat cagcaccggt 60 ggtcgtgtgc tggcggtgaa cagccagacc cggacgctga cgctcgaccg tgaaatcacg 120 <210> 46 <211> 240 <212> DNA <213> Lambda phage <400> 46 ctggtgccgc cgcaatggcc attaaccgcg ttgcttcatc cgcgatatcg cagtcggcgt 60 cacaggttgc ccgtgagaca aaggtacgcc ggaaactggt aaaggaaagg gccaggctga 120 aaagggccac ggtcaaaaat ccgcaggcca gaatcaaagt taaccggggg gatttgcccg 180 taatcaagct gggtaatgcg cgggttgtcc tttcgcgccg caggcgtcgt aaaaaggggc 240 <210> 47 <211> 240 <212> DNA <213> Lambda phage <400> 47 catgtaccgg gcgatgttat tgaaatctgc gatgatgact atgccggtat cagcaccggt 60 ggtcgtgtgc tggcggtgaa cagccagacc cggacgctga cgctcgaccg tgaaatcacg 120 ctgccatcct ccggtaccgc gctgataagc ctggttgacg gaagtggcaa tccggtcagc 180 gtggaggttc agtccgtcac cgacggcgtg aaggtaaaag tgagccgtgt tcctgacggt 240 <210> 48 <211> 180 <212> DNA <213> Lambda phage <400> 48 acgtgtcggc ggagcagatt gcgtatgttg ctcagttgca gcgttccggc gatgaagccg 60 gggcattgca ggcggcgaac gaggccgcaa cgaaagggtt tgatgaccag acccgccgcc 120 tgaaagagaa catgggcacg ctggagacct gggcagacag gactgcgcgg gcattcaaat 180 <210> 49 <211> 180 <212> DNA <213> Lambda phage <400> 49 gccgtggtgg ctggtctgcc gggggacgat tcataagttc cgctgtgtgc cgcatctcac 60 cgggcggcgc tttgagcacg gtgtgacgga ctgttacaca ctgttccggg atgcttatca 120 tctggcgggg attgagatgc cggactttca tcgtgaggat gactggtggc gtaacggcca 180 <210> 50 <211> 120 <212> DNA <213> Lambda phage <400> 50 agttatacat tctgccatag attatagcta aggcatgtaa taattcgtaa tcttttagcg 60 tattagcgac ccatcgtctt tctgatttaa taatagatga ttcagttaaa tatgaaggta 120 <210> 51 <211> 120 <212> DNA <213> Lambda phage <400> 51 cacacaacac catatgcatt taagtcgctt gaaattgcta taagcagagc atgttgcgcc 60 agcatgatta atacagcatt taatacagag ccgtgtttat tgagtcggta ttcagagtct 120 <210> 52 <211> 120 <212> DNA <213> Lambda phage <400> 52 gctgacagcc tgattgcaaa attcaaagaa gcgggcggaa cggtcagaga gattgatgta 60 tgagcagagt caccgcgatt atctccgctc tggttatctg catcatcgtc tgcctgtcat 120 <210> 53 <211> 120 <212> DNA <213> Lambda phage <400> 53 agaaacgaat gctgcagcgt cacaacaatc agccgccacg tctgcctcca ccgcggccac 60 gaaagcgtca gaggccgcca cttcagcacg agatgcggtg gcctcaaaag aggcagcaaa 120 <210> 54 <211> 120 <212> DNA <213> Lambda phage <400> 54 atcgccgtgc tgccggtgtc cggcacgctg gtcagccgga cgcgggcgct gcagccgtac 60 tcggggatga ccggttacaa cggcattatc gcccgtctgc aacaggctgc cagcgatccg 120 <210> 55 <211> 240 <212> DNA <213> Homo sapiens <400> 55 gaaaagagct aggaaggaca ggcaacttgg caaatcaaag ccctgggact agggggttaa 60 aatacagctt cccctcttcc cacccgcccc agtctctgtc ccttttgtag gagggactta 120 gagaaggggt gggcttgccc tgtccagtta atttctgacc tttactcctg ccctttgagt 180 ttgatgatgc tgagtgtaca agcgttttct ccctaaaggg tgcagctgag ctaggcagca 240 <210> 56 <211> 240 <212> DNA <213> Homo sapiens <400> 56 gattacgaga ggtccctgag tcgcctgacg ctggacgaca tcgaacggtt ggccagccgc 60 ttcctgcacc ctgaagtgac tgagacaatg gagaagggct tctccaaata gaattctcgg 120 agcatgggga ggtgcccaac gccaggctac cgctgcatgt cgcactaagt gtgttctcct 180 gttgcagttg ggctcatcat cgtcatagct ggcatgtacc tggctctggc caggtgctag 240

Claims (34)

  1. 一種用於偵測癌症的探針組合,包括: 一組或多組以HBV局部基因體做為標的之探針, 其中當每一因體序列排列對齊時,已對齊的該些以HBV局部基因體做為標的之探針於組該以HBV局部基因體做為標的之探針依該HBV局部基對齊後所組成的一整體序列和一種HBV基因型的一基因體中之一DR序列 (direct repeat region) 的一參考序列互相匹配,且 在該些已對齊的多組以HBV局部基因體做為標的之探針中,每一個該以HBV局部基因體做為標的之探針序列的一部分和相鄰的一個或二個以HBV局部基因體做為標的之探針序列的一部分相重疊。
  2. 如申請專利範圍第1項所述之探針組合,其中該HBV基因型包括基因型A型、基因型B型、基因型C型、基因型D型、基因型E型、基因型F型、基因型G型、基因型H型、基因型I型和基因型J型。
  3. 如申請專利範圍第1項所述之探針組合,其中該DR序列的該參考序列包括SEQ ID NOs. 3-32。
  4. 如申請專利範圍第1項所述之探針組合,更進一步包括: 一組或多組以HBV全基因體做為標的之探針, 其中當每一組該以HBV全基因體做為標的之探針依該HBV全基因體序列排列對齊時,已對齊的該些以HBV全基因體做為標的之探針於對齊後所組成的一整體序列和一種HBV基因型的該基因體互相匹配,且 在該些已對齊的多組以HBV全基因體做為標的之探針中,每一個該以HBV全基因體做為標的之探針序列的一部分和相鄰的一個或二個以HBV全基因體做為標的之探針序列的一部分相重疊。
  5. 如申請專利範圍第4項所述之探針組合,更進一步包括: 一組或多組以癌症熱點基因做為標的之探針, 其中當每一組該以癌症熱點基因做為標的之探針依該癌症熱點基因序列排列對齊時,已對齊的該些以癌症熱點基因做為標的之探針於對齊後所組成的一整體序列和一癌症熱點基因的一參考序列互相匹配,且 在該些已對齊的多組以癌症熱點基因做為標的之探針中,每一個該以癌症熱點基因做為標的之探針序列的一部分和相鄰的一個或二個以癌症熱點基因做為標的之探針序列的一部分相重疊。
  6. 如申請專利範圍第5項所述之探針組合,其中該癌症熱點基因包括CTNNB1、TERT和TP53。
  7. 如申請專利範圍第5項所述之探針組合,其中該癌症熱點基因之該參考序列包括SEQ ID NOs. 33-41。
  8. 如申請專利範圍第5項所述之探針組合,更進一步包括: 一組或多組以外源性基因做為標的之探針, 其中當該每一組以外源性基因做為標的之探針依該外源性基因序列排列對齊時,已對齊的該些以外源性基因做為標的之探針於對齊後所組成的一整體序列和一外源性基因的一參考序列互相匹配,且 在該些已對齊的多組以外源型基因做為標的之探針中,每一個該以外源性基因做為標的之探針序列的一部分和相鄰的一個或二個以外源型基因做為標的之探針序列的一部分相重疊。
  9. 如申請專利範圍第8項所述之探針組合,其中該外源性基因源自於一λ噬菌體。
  10. 如申請專利範圍第8項所述之探針組合,其中該外源性基因的該參考序列包括SEQ ID NOs. 42-54。
  11. 如申請專利範圍第8項所述之探針組合,更進一步包括: 一組或多組以內源性基因做為標的之探針, 其中當該每一組以內源性基因做為標的之探針依該內源性基因序列排列對齊時,已對齊的該些以內源性基因做為標的之探針於對齊後所組成的一整體序列和一內源性基因的一參考序列互相匹配,且 在該些已對齊的多組以內源性基因做為標的之探針中,每一個該以內源性基因做為標的之探針序列的一部分和相鄰的一個或二個以內源性基因做為標的之探針序列的一部分相重疊。
  12. 如申請專利範圍第11項所述之探針組合,其中該內源性基因包括GAPDH和GdX。
  13. 如申請專利範圍第11項所述之探針組合,其中該內源性基因的該參考序列包括SEQ ID NO. 55和SEQ ID NO.56。
  14. 如申請專利範圍第1項所述之探針組合,其中該癌症包括肝細胞癌。
  15. 如申請專利範圍第1項所述之探針組合,該探針組合是用於捕捉具有病毒-宿主嵌合點的標的核酸片段,該標的核酸片段是由一感染HBV的對象的一樣本中之DNA所取得。
  16. 如申請專利範圍第15項所述之探針組合,其中該DNA包括宿主的基因體DNA和循環系統中的腫瘤DNA。
  17. 如申請專利範圍第15項所述之探針組合,其中該樣本包括生物性液體和肝組織。
  18. 一種用於偵測癌症的探針組合,包括: 一組或多組以HBV全基因體做為標的之探針, 其中當每一組該以HBV全基因體做為標的之探針依該HBV全基因體序列排列對齊時,已對齊的該些以HBV全基因體做為標的之探針於對齊後所組成的一整體序列和一種HBV基因型的該基因體互相匹配,且 在該些已對齊的多組以HBV全基因體做為標的之探針中,每一個該以HBV全基因體做為標的之探針序列的一部分和相鄰的一個或二個以HBV全基因體做為標的之探針序列的一部分相重疊。
  19. 如申請專利範圍第18項所述之探針組合,其中該種HBV基因型包括基因型A型、基因型B型、基因型C型、基因型D型、基因型E型、基因型F型、基因型G型、基因型H型、基因型I型和基因型J型。
  20. 如申請專利範圍第18項所述之探針組合,更進一步包括: 一組或多組以HBV局部基因體做為標的之探針, 其中當每一組該以HBV局部基因體做為標的之探針依該HBV局部基因體之序列排列對齊時,已對齊的該些以HBV局部基因體做為標的之探針於對齊後所組成的一整體序列和一種HBV基因型的該基因體中之一DR序列 (direct repeat region) 的一參考序列互相匹配,且 在該些已對齊的多組以HBV局部基因體做為標的之探針中,每一個該以HBV局部基因體做為標的之探針序列的一部分和相鄰的一個或二個以HBV局部基因體做為標的之探針序列的一部分相重疊。
  21. 如申請專利範圍第20項所述之探針組合,其中該DR序列的該參考序列包括SEQ ID NOs. 3-32。
  22. 如申請專利範圍第20項所述之探針組合,更進一步包括: 一組或多組以癌症熱點基因做為標的之探針, 其中當每一組該以癌症熱點基因做為標的之探針依該癌症熱點基因序列排列對齊時,已對齊的該些以癌症熱點基因做為標的之探針於對齊後所組成的一整體序列和一癌症熱點基因的一參考序列互相匹配,且 在該些已對齊的多組以癌症熱點基因做為標的之探針中,每一個該以癌症熱點基因做為標的之探針序列的一部分和相鄰的一個或二個以癌症熱點基因做為標的之探針序列的一部分相重疊。
  23. 如申請專利範圍第22項所述之探針組合,其中該癌症熱點基因包括CTNNB1、TERT和TP53。
  24. 如申請專利範圍第22項所述之探針組合,其中該癌症熱點基因的該參考序列包括SEQ ID NOs. 33-41。
  25. 如申請專利範圍第22項所述之探針組合,更進一步包括: 一組或多組以外源性基因做為標的之探針, 其中當該每一組以外源性基因做為標的之探針依該外源性基因序列排列對齊時,已對齊的該些以外源性基因做為標的之探針於對齊後所組成的一整體序列和一外源性基因的一參考序列互相匹配,且 在該些已對齊的多組以外源型基因做為標的之探針中,每一個該以外源性基因做為標的之探針序列的一部分和相鄰的一個或二個以外源型基因做為標的之探針序列的一部分相重疊。
  26. 如申請專利範圍第25項所述之探針組合,其中該外源性基因源自於一λ噬菌體。
  27. 如申請專利範圍第25項所述之探針組合,其中該外源性基因的該參考序列包括SEQ ID NOs. 42-54。
  28. 如申請專利範圍第25項所述之探針組合,更進一步包括: 一組或多組以內源性基因做為標的之探針, 其中當該每一組以內源性基因做為標的之探針依該內源性基因序列排列對齊時,已對齊的該些以內源性基因做為標的之探針於對齊後所組成的一整體序列和一內源性基因的一參考序列互相匹配,且 在該些已對齊的多組以內源性基因做為標的之探針中,每一個該以內源性基因做為標的之探針序列的一部分和相鄰的一個或二個以內源性基因做為標的之探針序列的一部分相重疊。
  29. 如申請專利範圍第28項所述之探針組合,其中該內源性基因包括GAPDH和GdX。
  30. 如申請專利範圍第28項所述之探針組合,其中該內源性基因的該參考序列包括SEQ ID NO. 55和SEQ ID NO.56。
  31. 如申請專利範圍第28項所述之探針組合,其中該癌症包括肝細胞癌。
  32. 如申請專利範圍第28項所述之探針組合,該探針組合是用於捕捉具有病毒-宿主嵌合點的標的核酸片段,該標的核酸片段是由一感染HBV的對象的一樣本中之DNA所取得。
  33. 如申請專利範圍第32項所述之探針組合,其中該DNA包括宿主的基因體DNA和循環系統中的腫瘤DNA。
  34. 如申請專利範圍第32項所述之探針組合,其中該樣本包括生物性液體和肝組織。
TW107104048A 2017-02-07 2018-02-05 偵測癌症之探針組合 TWI726191B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201762456087P 2017-02-07 2017-02-07
US62/456087 2017-02-07

Publications (2)

Publication Number Publication Date
TW201833332A true TW201833332A (zh) 2018-09-16
TWI726191B TWI726191B (zh) 2021-05-01

Family

ID=63038710

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107104048A TWI726191B (zh) 2017-02-07 2018-02-05 偵測癌症之探針組合

Country Status (9)

Country Link
US (1) US11319602B2 (zh)
EP (1) EP3580353B1 (zh)
JP (1) JP6799175B2 (zh)
KR (1) KR102327119B1 (zh)
CN (1) CN110573628B (zh)
ES (1) ES2961464T3 (zh)
SG (1) SG11201907220UA (zh)
TW (1) TWI726191B (zh)
WO (1) WO2018145627A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111465707A (zh) * 2017-11-17 2020-07-28 简·探针公司 用于检测C1orf43核酸的组合物和方法
KR20200054430A (ko) * 2018-11-09 2020-05-20 주식회사 셀레믹스 폐암 조직 내 세포 유래 돌연변이를 검출하기 위한 프로브 제조 및 검출 방법
WO2021046655A1 (en) * 2019-09-13 2021-03-18 University Health Network Detection of circulating tumor dna using double stranded hybrid capture
US11814690B2 (en) * 2019-11-04 2023-11-14 The Catholic University Of Korea Industry-Academic Cooperation Foundation Probe for detecting hepatitis b virus and use thereof

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100647277B1 (ko) * 2003-08-14 2006-11-17 삼성전자주식회사 B형 간염 검사용 pcr 프라이머 세트 및 이를 포함하는 b형 간염 검사 키트
US20060057670A1 (en) * 2004-09-10 2006-03-16 The Chinese University Of Hong Kong Genomic markers of hepatitis B virus associated with hepatocellular carcinomas
US20070042388A1 (en) * 2005-08-12 2007-02-22 Wong Christopher W Method of probe design and/or of nucleic acids detection
WO2009061640A2 (en) * 2007-11-06 2009-05-14 Siemens Healthcare Diagnostics Inc. Hepatitis b virus (hbv) specific oligonucleotide sequences
KR101162088B1 (ko) 2008-09-30 2012-07-04 재단법인서울대학교산학협력재단 실시간 pcr을 이용하여 b형 간염유래 간질환을 진단하기 위한 키트
CN102277448B (zh) 2011-05-30 2013-09-04 厦门艾德生物医药科技有限公司 用于预测乙肝病毒引起的肝癌的引物、探针及试剂盒
WO2013075313A1 (zh) * 2011-11-24 2013-05-30 深圳华大基因科技有限公司 一种检测病毒在待测样本中整合方式的探针及其制备方法和应用
CN103797130B (zh) 2011-06-24 2016-07-27 深圳华大基因科技有限公司 用于确定人体具有异常状态的系统和方法
KR20130121283A (ko) * 2012-04-27 2013-11-06 (주)바이오니아 B형 간염 바이러스를 검출하기 위한 중합효소연쇄반응의 프라이머, 프로브, 및 이를 이용한 검출키트 및 방법
CN103725773B (zh) * 2012-10-10 2015-11-25 杭州普望生物技术有限公司 鉴定宿主基因组中hbv基因整合位点和重复靶基因
US9840742B2 (en) 2014-06-16 2017-12-12 JBS Science Inc. Detection of hepatitis B virus (HBV) DNA and methylated HBV DNA in urine of patients with HBV-associated hepatocellular carcinoma
CN105506065A (zh) * 2014-09-25 2016-04-20 上海人类基因组研究中心 肝癌基因检测方法、检测试剂盒及其应用
CN106319065B (zh) * 2016-09-14 2020-03-10 上海思路迪医学检验所有限公司 基于高通量测序检测人brca1/2基因的捕获探针及试剂盒
TWI797095B (zh) * 2016-10-24 2023-04-01 美商格瑞爾有限責任公司 腫瘤檢測之方法及系統

Also Published As

Publication number Publication date
KR102327119B1 (ko) 2021-11-16
TWI726191B (zh) 2021-05-01
WO2018145627A1 (en) 2018-08-16
EP3580353A1 (en) 2019-12-18
KR20190114989A (ko) 2019-10-10
US20180223380A1 (en) 2018-08-09
JP2020503067A (ja) 2020-01-30
CN110573628B (zh) 2023-12-22
EP3580353B1 (en) 2023-09-13
JP6799175B2 (ja) 2020-12-09
SG11201907220UA (en) 2019-09-27
CN110573628A (zh) 2019-12-13
EP3580353A4 (en) 2020-03-04
ES2961464T3 (es) 2024-03-12
US11319602B2 (en) 2022-05-03

Similar Documents

Publication Publication Date Title
JP7245872B2 (ja) 腫瘍試料の多重遺伝子分析
CN103667254B (zh) 目标基因片段的富集和检测方法
KR102327119B1 (ko) 암 검출용 프로브 조합
US20230287485A1 (en) Methods and compositions for enrichment of amplification products
JP2021166532A5 (zh)
CN104053786B (zh) 用于多重pcr的方法和组合物
CN107278234A (zh) 基因序列校验组合物、方法和试剂盒
CN110387419B (zh) 实体瘤多基因检测基因芯片及其制备方法和检测装置
BR112013016708B1 (pt) Otimização de análise multigene de amostras de tumor
EP3384054B1 (en) Multiplex cellular reference materials
EP3752604B1 (en) Methods for personalized detection of the recurrence of cancer or metastasis and/or evaluation of treatment response
CN107002123A (zh) 多重转录组分析
US20220356533A1 (en) Biomarker composition for diagnosing or predicting prognosis of thyroid cancer, comprising preparation capable of detecting mutation in plekhs1 gene, and use thereof
Coysh Bioinformatics pipeline development for analyses of data generated by target capture-based Next-Generation Sequencing, to characterise mutations and the utility of using off-target sequences to detect genomic imbalances in Multiple Myeloma patients.
US20230091151A1 (en) Compositions and Methods for Targeted NGS Sequencing of cfRNA and cfTNA
Kassab et al. Science Repository