CN106191270A - 在不同的宫颈病变中的hr‑hpv的诊断转录物和剪接模式 - Google Patents

在不同的宫颈病变中的hr‑hpv的诊断转录物和剪接模式 Download PDF

Info

Publication number
CN106191270A
CN106191270A CN201610584019.4A CN201610584019A CN106191270A CN 106191270 A CN106191270 A CN 106191270A CN 201610584019 A CN201610584019 A CN 201610584019A CN 106191270 A CN106191270 A CN 106191270A
Authority
CN
China
Prior art keywords
transcript
hpv
gene outcome
montage
junction point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610584019.4A
Other languages
English (en)
Other versions
CN106191270B (zh
Inventor
M.施密特
L.吉斯曼
M.帕夫利塔
D.赫夫勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsches Krebsforschungszentrum DKFZ
Original Assignee
Deutsches Krebsforschungszentrum DKFZ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deutsches Krebsforschungszentrum DKFZ filed Critical Deutsches Krebsforschungszentrum DKFZ
Publication of CN106191270A publication Critical patent/CN106191270A/zh
Application granted granted Critical
Publication of CN106191270B publication Critical patent/CN106191270B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/708Specific hybridization probes for papilloma
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/08Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses
    • C07K16/081Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses from DNA viruses
    • C07K16/084Papovaviridae, e.g. papillomavirus, polyomavirus, SV40, BK virus, JC virus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Virology (AREA)
  • Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明涉及在不同的宫颈病变中的HR‑HPV的诊断转录物和剪接模式。本发明还涉及一种用于在具有HR‑HPV的受试者中区分HR‑HPV感染的严重形式和HR‑HPV感染的轻度形式的方法。本发明另外涉及包含探针寡核苷酸混合物的组合物、与本发明的方法结合使用的装置和试剂盒。

Description

在不同的宫颈病变中的HR-HPV的诊断转录物和剪接模式
本申请是申请日为2011年4月28日的中国专利申请201180021993.5“在不同的宫颈病变中的HR-HPV的诊断转录物和剪接模式”的分案申请。
技术领域
本发明涉及在具有高危(HR)-HPV的受试者中区分HR-HPV感染的严重形式和HR-HPV感染的轻度形式的方法。另外涉及包含探针寡核苷酸混合物的组合物、与本发明的方法结合使用的装置和试剂盒。
背景技术
子宫颈癌(CxCa)是全世界女性的第二最常见的恶性肿瘤,由高危的人乳头状瘤病毒造成,在所述病毒中,HPV16是最流行的类型。在发达国家,常规的细胞学筛选程序已经大幅降低了这类癌症的发病率。但是,这些细胞学筛选程序具有一些缺点。
宫颈刮片检查(Papanicolaou test)也经常称作巴氏试验(Pap test),是一种用于检测子宫颈的恶化前和恶性病变的诊断方法。就宫颈刮片检查而言,从宫颈获得样品,并通过光学显微术筛选指示恶性或恶化前细胞的细胞形态学变化。然后,根据观察到的病变的严重性,将样品分类。但是,通过宫颈细胞学进行诊断是一种主观方法,且性质取决于提供服务的实验室的标准。这样,病变分类仅仅是中等可再现的,且具有比阴道镜检查更差的灵敏度(Baldwin, P., R. Laskey,和N. Coleman. 2003. Translational approaches toimproving cervical screening. Nat Rev Cancer 3:217-26)。此外,假阳性结果会导致大量患者被过度治疗。
在近二十年中,开发了多种新的HPV诊断试验。这些方法是基于病毒、分子和生化标志物(诸如HPV蛋白、DNA和RNA)的检测。
FDA批准的Hybrid Capture II试验系统(HC2) (以前的美国的Digene Corp.,现在的荷兰的Qiagen)被认为是在临床实践中检测HPV DNA的黄金标准,但是,它显示出几个缺点:a)没有进行基因分型,而是将HPV感染唯一地归于“低危”或“高危”组,b)不能鉴别多重感染,c)就HPV检测而言,不如基于PCR的方法敏感(Birner等人2001. Mod. Pathol. 14:702-709),和d)就宫颈初癌和癌症风险的预测而言,是中等特异性的。它用于临床目的的一些非特异性可以归因于与非致癌的HPV基因型的交叉反应性(Castle, P. E., D.Solomon, C. M. Wheeler, P. E. Gravitt, S. Wacholder,和M. Schiffman. 2008.Human papillomavirus genotype specificity of hybrid capture 2. J ClinMicrobiol 46:2595-604)。此外,它仅仅允许评估受试者是否被HPV感染。所述试验不允许评估HPV感染的严重性。因而,一旦已经诊断出HPV,需要进一步检查。
在近几年中开发了几种基于PCR的方法,它们允许更精确地检测HPV感染。这些PCR系统中的大多数使用通用引物或普通引物,所述引物结合HPV基因组中的高保守区,例如在L1区域中。然后对扩增的PCR产物进行进一步分析(例如测序、限制性片断长度多态性(RFLP)分析或杂交),以便鉴别特异性的粘膜的HPV基因型。纵向定群调查已经证实,与单独的细胞学试验相比,组合的Pap和HPV试验会表现出更好的灵敏度,并预测更好的针对CIN3的长期保护(在具有两个试验的正常结果的女性中) (Bulkmans, N. W., J. Berkhof, L.Rozendaal, F. J. van Kemenade, A. J. Boeke, S. Bulk, F. J. Voorhorst, R. H.Verheijen, K. van Groningen, M. E. Boon, W. Ruitinga, M. van Ballegooijen, P.J. Snijders,和C. J. Meijer. 2007. Human papillomavirus DNA testing for thedetection of cervical intraepithelial neoplasia grade 3 and cancer: 5-yearfollow-up of a randomised controlled implementation trial. Lancet 370:1764-72, Hoyer, H., C. Scheungraber, R. Kuehne-Heid, K. Teller, C. Greinke, S.Leistritz, B. Ludwig, M. Durst,和A. Schneider. 2005. Cumulative 5-yeardiagnoses of CIN2, CIN3 or cervical cancer after concurrent high-risk HPV andcytology testing in a primary screening setting. Int J Cancer 116:136-43)。但是,HPV PCR试验的高灵敏度也导致临床上不相关的感染或退化病变的鉴别。因此,在单个高危HPV DNA阳性结果以后,晚期病变的存在或宫颈癌的发展的阳性预测值(PPV)较低。得到的高比例的试验阳性的、但是疾病阴性的诊断,会造成过度治疗、额外费用和涉及的女性的非常焦虑(International Agency for Research on Cancer. 2005. Cervix CancerScreening. IARC Press, Lyon)。
不同于HPV DNA试验,RNA检测允许鉴别和分析转录活性的病毒。最近对用于宫颈涂片(其除了保存DNA和细胞形态以外,还保存RNA)的保存介质的介绍,促进了RNA检测方法的发展。迄今为止,已经介绍了2种商业的HPV RNA检测试验:i)来自Biomérieux (以前的NorChip)的PreTect HPV Proofer®,其检测靶向来自HR-HPV 16、18、31、33和45型的E6和E7序列(E6/E7)的早期全长mRNA,和ii) Aptima®HPV试验,来自GenProbe的一种广谱E6/E7全长mRNA扩增方法。来自这些试验的有限数据指示,全长HPV E6/E7 mRNA(而不是单独的HPV DNA)的检测,仅仅轻微增加宫颈癌和它的前体的开发的PPV,与此同时,灵敏度降低,因而阴性预测值(NPV)降低(Cuschieri, K. S., M. J. Whitley,和H. A. Cubie. 2004.Human papillomavirus type specific DNA and RNA persistence--implications forcervical disease progression and monitoring. J Med Virol 73:65-70)。这些技术的主要缺点涉及下述事实:由于仅定性测量单一全长病毒癌基因转录物,它们不能预测疾病。此外,宫颈涂片可以包含不同量的HPV感染的细胞,所述细胞不能通过这些技术进行控制。
宫颈癌的发展与HPV基因组向宿主细胞染色体中的整合密切相关。在低等级病变中,大部分HPV基因组以附加型状态存在,而在高等级病变和癌中,HPV基因组可以整合进宿主基因组中。但是,已经证实,并非在所有宫颈癌病例中HPV基因组总是以整合形式存在(Vinokurova, S., N. Wentzensen, I. Kraus, R. Klaes, C. Driesch, P.Melsheimer, F. Kisseljov, M. Durst, A. Schneider,和M. von Knebel Doeberitz.2008. Type-dependent integration frequency of human papillomavirus genomes incervical lesions. Cancer Res 68:307-13)。仅在大约60%的宫颈癌病例中发现了HPV16基因组向宿主基因组中的整合。因而,仅测定HPV基因组的整合状态的诊断方法对于风险分级而言是不可靠的。
已经提出,HPV16的某些转录物(例如E1C转录物)的定量,和将这些转录物的量与参照转录物的量进行对比,在疾病进展的预测中具有重大价值(Schmitt等人(2010),“Diagnosing Cervical Cancer and High-Grade Precursors by HPV16 TranscriptionPatterns”, Cancer Res. 70: 249-256)。但是,迄今为止这仅关于HP16得到证实。
阴道镜检查允许检查子宫颈和阴道。通过该目检,可以检测出在这些区域中的许多恶化前病变和恶性病变。由于它的高可靠性,阴道镜检查被视作用于诊断宫颈疾病的黄金标准。但是,该诊断操作是成本和时间密集型的。阴道镜检查需要非常熟练的人员,且经常涉及侵入操作(活组织检查和随后的组织学分析)。结果,阴道镜检查不能用于宫颈癌前兆筛选程序中。
发明内容
本发明所要解决的技术问题可以视作,提供用于有效地且可靠地区分高危HPV基因型(HR-HPV)感染的轻度形式和严重形式的装置和方法,且没有上述缺点。另外,不具有整合进基因组中的HPV基因组的受试者的可靠风险分级,需要装置和方法。在权利要求和下文中表征了实施方案解决的技术问题。
因此,本发明涉及一种用于在具有HR-HPV的受试者中区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式的方法,所述受试者不包含整合形式的HR-HPV基因组,所述方法包括下述步骤:a)在所述受试者的样品中,测定E1C的基因产物的存在或缺失,和b)区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式。
本发明的方法优选地是体外方法。此外,它可以包括除了上面明确提及的那些以外的步骤。例如,其它步骤可能涉及样品预处理或通过所述方法得到的结果的评价。本发明的方法优选地用于在被HR-HPV感染的受试者中区分HR-HPV感染的轻度形式和严重形式。但是,本发明的方法还可以用于监测、证实和细分所述受试者。所述方法可以手工地进行,或得到自动化的辅助。优选地,步骤(a)和/或(b)可以全部或部分地得到自动化的辅助,例如,用于步骤(a)的测定中的合适的机器人和感觉设备,或在步骤(b)中的计算机执行的计算或对比步骤。
具体实施方式
本文使用的术语“区分”是指,区别(i) HR-HPV感染的轻度形式和(ii) HR-HPV感染的严重形式。本文使用的该术语优选地包括:区别地诊断/检测HR-HPV感染的轻度形式和严重形式。
本领域技术人员会理解,前述区分通常不表示对于100%的被分析的受试者而言是正确的。但是,该术语要求,所述评估对于被分析的受试者的统计上显著的部分而言是有效的。本领域技术人员使用各种众所周知的统计评价工具,例如,置信区间测定、p-值测定、Student氏t-检验、Mann-Whitney检验等,可以不费周折地确定一个部分是否是统计上显著的。细节参见:Dowdy和Wearden, Statistics for Research, John Wiley & Sons, NewYork 1983。优选的置信区间是至少90%、至少95%、至少97%、至少98%或至少99%。p-值优选地是0.1、0.05、0.01、0.005或0.001。优选地,本发明预见到的概率允许,所述区分对于给定组群中的至少60%、至少70%、至少80%或至少90%的受试者而言是正确的。
本文使用的术语“受试者”是指动物,优选哺乳动物,且更优选人类。但是,根据本发明的前述方法预见到,所述受试者将被HR-HPV感染。优选地,所述受试者被选自下述的HR-HPV感染:HPV18、HPV33、HPV35、HPV52或HOV58 (参见本文别处)。如何评估受试者是否被HR-HPV感染,是本领域众所周知的。例如,通过DNA 印迹和斑点印迹杂交、原位杂交,通过信号放大试验,或通过各种PCR方法,对受试者样品中的HR-HPV DNA进行基因分型(Molijn,A., B. Kleter, W. Quint,和L. J. van Doorn. 2005. Molecular diagnosis of humanpapillomavirus (HPV) infections. J Clin Virol 32 Suppl 1:S43-51),可以评估HR-HPV感染。
本文使用的术语“不包含整合形式的HR-HPV基因组”是指,缺少与宿主细胞的染色体DNA共价地连接的HR-HPV DNA。技术人员会理解术语“整合的”和“附加型”。应当理解,如果HR-HPV基因组整合进受试者的基因组中,并非所述受试者的全部细胞都具有整合进它的基因组中的HR-HPV基因组。优选地,仅受到HR-HPV感染的影响的细胞可能包含整合形式的HR-HPV基因组。优选地,所述细胞存在于所述受试者的泌尿生殖道或口咽道中。应当理解,术语“整合形式”也包括,HR-HPV的某些部分向宿主细胞的染色体DNA中的整合。优选地,HR-HPV基因组的早期区(包括E6、E7的基因和E1 N-端的某些部分)整合进宿主基因组中。应当理解,HR-HPV基因组的晚期区(包括E4、E5和L1基因)也可能整合进宿主基因组中,但是,最优选地,由于基因组重排而是转录上无活性的。此外,已知,E2基因经常在整合过程中丢失或被转录地灭活(Pett, M., 和N. Coleman. 2007. Integration of high-risk humanpapillomavirus: a key event in cervical carcinogenesis? J Pathol 212:356-67)。HR-HPV基因组优选地以“附加型形式”存在于宿主细胞中,如果所述基因组在所述宿主细胞中复制,而不整合进宿主细胞的染色体DNA中(Vinokurova, S., N. Wentzensen, I.Kraus, R. Klaes, C. Driesch, P. Melsheimer, F. Kisseljov, M. Durst, A.Schneider,和M. von Knebel Doeberitz. 2008. Type-dependent integrationfrequency of human papillomavirus genomes in cervical lesions. Cancer Res 68:307-13)。
除了HPV 16以外的高危HPV类型是众所周知的,它们促成所有宫颈癌的约45%。已经证实,整合在所有高危HPV类型的致癌作用中起重要作用。但是,就高危HPV类型16和系统发生上有关的类型31和33而言,整合以更低的频率发生,这提示第二种进展模式,诸如潜在的E1C介导的LCR增量调节,或者,由于E1C和E2开放读码框重叠,在E1C翻译终止以后抑制E2翻译。但是,就这些HPV类型造成的高比例的宫颈癌而言,和就其它类型(包括HPV 18和45)造成的非常高比例的宫颈癌而言,整合仍然是宫颈癌发展中的一个关键事件(Vinokurova,S., N. Wentzensen, I. Kraus, R. Klaes, C. Driesch, P. Melsheimer, F.Kisseljov, M. Durst, A. Schneider,和M. von Knebel Doeberitz. 2008. Type-dependent integration frequency of human papillomavirus genomes in cervicallesions. Cancer Res 68:307-13)。
如何评估HR-HPV基因组的整合状态,是本领域众所周知的。优选地,在所述受试者的样品中测定整合状态。用于测定整合状态的优选方法是:(i)检测病毒-宿主融合转录物(特别是转录活性的病毒整合体)的方法,例如通过扩增乳头状瘤病毒癌基因转录物(APOT-试验)和RNA原位杂交(ISH);和(ii)检测整合的病毒DNA(不论它的转录状态)的方法,例如DNA印迹法、定量实时PCR、限制性位点PCR和DNA ISH (Pett, M., 和N. Coleman. 2007.Integration of high-risk human papillomavirus: a key event in cervicalcarcinogenesis? J Pathol 212:356-67)。
通常,与具有整合形式的HPV16基因组的受试者相比,仅包含附加型形式的HR-HPV基因组的受试者被认为处于更低的遭受HSIL或癌症的风险中(关于术语“附加型形式”和“整合形式”的解释,参见上文)。但是,有证据表明,有些包含仅处于附加型形式的HR-HPV基因组的受试者遭受严重形式的HPV感染,或处于遭受所述严重形式的高危中(Vinokurova,S., N. Wentzensen, I. Kraus, R. Klaes, C. Driesch, P. Melsheimer, F.Kisseljov, M. Durst, A. Schneider,和M. von Knebel Doeberitz. 2008. Type-dependent integration frequency of human papillomavirus genomes in cervicallesions. Cancer Res 68:307-13, Pett, M., 和N. Coleman. 2007. Integration ofhigh-risk human papillomavirus: a key event in cervical carcinogenesis? JPathol 212:356-67)。
术语“人乳头状瘤病毒”(HPV)是指来自乳头状瘤病毒科病毒的一种DNA病毒,其感染人类的皮肤和粘膜。已经描述了超过110个HPV基因型(de Villiers, E. M., C.Fauquet, T. R. Broker, H. U. Bernard,和H. zur Hausen. 2004. Classification ofpapillomaviruses. Virology 324:17-27)。已知大约50个HPV基因型会感染粘膜。基于它们与癌症的流行病学关联,将这些粘膜基因型分类成3个不同的组:“低危”人乳头状瘤病毒(LR-HPV)、“高危”人乳头状瘤病毒(HR-HPV)和“假定的高危”人乳头状瘤病毒(pHR-HPV)。优选地,HPV是高危HPV基因型(HR-HPV),后者是宫颈癌发展的主要原因,更优选地,HPV是HPV31、39、45、51、52、56、58、59、68、73和82,最优选HPV 18 (Genbank登录号: NC_001357.1,GI:9626069)、HPV 33 (Genbank登录号: M12732.1, GI:333049)、HPV 35 (Genbank登录号: M74117.1, GI:333050)、HPV 52 (Genbank登录号: X74481.1 GI:397038)或HPV 58(Genbank登录号: D90400.1 GI:222386)。还已知,HR-HPV可以造成外阴癌、肛门癌、阴道癌、阴茎癌和口咽癌,以及阴道上皮内瘤形成、肛门上皮内瘤形成、外阴上皮内瘤形成和阴茎上皮内瘤形成。
HPV基因组通常是单个双链闭环DNA分子,例如,HPV16基因组由具有大约7,906碱基对的单个双链闭环DNA分子组成(参见,例如Myers, G., H. Delius, J. Icenogle, H.U. Bernard, M. Favre, M. van Ranst,和C. M. Wheeler. 1997. Humanpapillomaviruses 1997: a compilation and analysis of nucleic acid and aminoacid sequences. Theoretical Biology and Biophysics, Los Alamos NationalLaboratory, Los Alamos, N.Mex.)。3个开放读码框(ORF)位于一条链上。已经定义了3个功能区:长控制区(LCR)以及“早期”转录区和“晚期”转录区。所述LCR是850碱基对的长非编码上游区,其负责调节DNA复制和转录。它含有病毒E2和其它细胞转录因子的几个结合位点和病毒E1复制蛋白的一个结合位点。此外,它含有沉默子以及增强子序列,并携带与E6 ORF接近的p97核心启动子;它是病毒基因组中具有最高变化程度的区域。“早期”区由ORF E1、E2、E4、E5、E6和E7组成,这些ORF参与病毒复制和细胞转化。“晚期”区编码形成病毒衣壳的L1和L2结构蛋白。在“早期”蛋白中,对于恶性疾病而言最重要的2种HPV蛋白是E6和E7,它们协同地起作用,以将细胞从正常状态转化成永生状态。本领域已知,HPV转录组(transcriptom)会表现出几个剪接供体(例如在HPV16R参照基因组的核苷酸位置226、880、1302和3632处)和剪接受体位点(例如在HPV16R参照基因组的核苷酸位置409、526、742、2582、2709、3358和5639处),产生至少11个不同的剪接连接点(Baker, C., 和C. Calef.1996. Maps of papillomavirus mRNA transcripts. Los Alamos NationalLaboratories, Los Alamos, NM, USA.; Zheng, Z. M., 和C. C. Baker. 2006.Papillomavirus genome structure, expression, and post-transcriptionalregulation. Front Biosci 11:2286-302)。在本文中,基于用于制备剪接产物的剪接供体和受体位点来表征剪接产物。各个剪接供体和受体被“^”隔开。
本领域已知,HR-HPV感染可以细分成多种表现。宫颈癌从持续性的HR-HPV感染区域发展而成,经历一系列明确定义的阶段,所述阶段在组织学上分类为宫颈上皮内瘤形成1至3 (CIN1至CIN3)。HR-HPV进展阶段在细胞学上也称作低等级和高等级鳞状上皮内病变(LSIL和HSIL)。LSIL相当于CIN1,而CIN2和CIN3优选地相当于HSIL。HPV16的初期感染可以导致CIN1的发生,这表现为上皮的下三分之一的正常分化的抑制。这些病变中的大部分在具有免疫能力的个体中自发地消退,这可能由细胞免疫介导。但是,在有些个体中,例如由于遗传的或诱导的免疫缺陷,存在HR-HPV感染持续和CIN1病变进展成CIN2病变的危险。CIN2病变也显示出高消退率,但是,CIN2病变也可能进展成高等级疾病(CIN3),后者可能进展成癌(原位癌或甚至侵袭癌)。
在本文中提及的“HR-HPV感染的轻度形式”优选地表示这样的HR-HPV感染形式:其在组织学上分类为正常宫颈组织或CIN1 (极轻的或轻度的宫颈发育异常),或在细胞学上分类为NIL/M (上皮内病变或恶性肿瘤阴性的)或LSIL (低等级鳞状上皮内病变)。因而,所述HR-HPV感染的轻度形式优选地包括良性宫颈病变,并因而包括低等级HR-HPV病变(综述参见Smith, J. H. 2002. Bethesda 2001. Cytopathology 13:4-10)。
在本文中提及的“HR-HPV感染的严重形式”优选地表示这样的HR-HPV感染形式:其在组织学上分类为CIN2 (中等的宫颈上皮发育异常)或CIN3 (严重的宫颈发育异常)或癌症(原位癌或侵袭癌)。因此,术语“HR-HPV感染的严重形式”优选地表示这样的HR-HPV感染形式:其在细胞学上分类为HSIL或癌症。因而,所述HR-HPV感染的严重形式优选地包括恶性宫颈病变,并因而包括高等级HR-HPV病变(综述参见Smith, J. H. 2002. Bethesda 2001.Cytopathology 13:4-10)。
通过众所周知的技术,可以得到样品,且包括来自表达或生产在本文中提及的基因产物的那些细胞、组织或器官的样品。优选地,所述样品是来自泌尿生殖道或口咽道的刮片或活组织检查。通过使用刷子、(棉花)拭子、压舌板、冲洗/洗涤流体、穿刺活组织检查装置、用针或外科器械刺洞,可以得到这样的样品。优选地,所述刮片含有粘膜细胞。更优选地,所述样品是宫颈涂片或巴氏涂片。通过分离技术,诸如过滤、离心或细胞分选,可以从体液或组织或器官得到分离的细胞。此外,通过众所周知的方法,可以进一步加工样品,以便进一步富集和/或纯化在本文中提及的基因产物。基因产物的进一步加工优选地依赖于基因产物的性质,即所述基因产物是多肽还是RNA分子。优选地,如果所述基因产物是多肽,那么通过技术人员众所周知的方法富集和/或纯化所述多肽。优选地,如果所述基因产物是mRNA分子,那么通过本领域众所周知的方法富集和/或纯化所述RNA分子。
本文使用的术语“基因产物”优选地是指转录物,并因而指mRNA或多肽。
E1C的基因产物优选地是来自E1基因的转录物,所述E1基因分离自被HR-HPV感染的严重形式影响的个体的样品,且其已经被剪接成包含这样的剪接连接点(splicedjunction):所述剪接连接点具有在HPV基因组的位置800和1000之间(优选地在位置850和950之间)的位置处的剪接供体位点,和在HPV基因组的位置2400和2900之间(优选地在位置2500和2800之间)的剪接受体位点。优选地,E1C的产物是来自E1基因的转录物,所述E1基因已经被剪接成缺失E1基因的5'部分的1500-2100个、优选地1600-2000个或更优选地1700-1900个核苷酸,更优选地在上述位置之间。更优选地,所述基因产物是:包含HPV18的929^2779连接点的剪接转录物,包含HPV33的894^2702连接点的剪接转录物,包含HPV35的883^2649连接点的剪接转录物,包含HPV52的879^2696连接点的剪接转录物,或包含HPV58的898^2706连接点的剪接转录物。最优选地,所述基因产物是这样的剪接转录物:其包含在SEQID NO: 1所示的序列中含有的HPV18的929^2779连接点,包含在SEQ ID NO: 2所示的序列中含有的HPV33的894^2702连接点的剪接转录物,包含在SEQ ID NO: 3所示的序列中含有的HPV35的883^2649连接点的剪接转录物,包含在SEQ ID NO: 25所示的序列中含有的HPV52的879^2696连接点的剪接转录物,或包含在SEQ ID NO: 26所示的序列中含有的HPV58的898^2706连接点(表1)。
但是,也预见到,E1C的基因产物是从E1基因的所述剪接转录物翻译出的多肽。优选地,E1C的基因产物是包含下述氨基酸序列的多肽:HPV18 的madpeghgpd (SEQ ID NO:22)、HPV33的madpegrgan (SEQ ID NO: 23)、HPV35的madpagrgad (SEQ ID NO: 24)、HPV52的medpegrgan (SEQ ID NO: 34)或HPV 58 的mddpegrgan (SEQ ID NO: 35)。更优选地,E1C的基因产物是由下述氨基酸序列组成的肽:HPV18 的madpeghgpd (SEQ ID NO: 22)、HPV33的madpegrgan (SEQ ID NO: 23)、HPV35的madpagrgad (SEQ ID NO: 24)、HPV52 的medpegrgan (SEQ ID NO: 34)或HPV 58 的mddpegrgan (SEQ ID NO: 35)。
本文使用的术语“量”包括:基因产物的绝对量、所述基因产物的相对量或浓度以及与其有关或可以从其衍生出的任意值或参数。这样的值或参数包括强度信号值,后者来自通过直接测量从所述基因产物得到的所有具体物理或化学性质。此外,包括通过在本说明书别处指出的间接测量得到的所有值或参数。例如,就多肽而言,可以从生物读出系统中测定响应于从特性地结合的配体得到的肽或强度信号的应答水平。应当理解,通过所有标准的数学运算,也可以得到与前述量或参数相关联的值。
优选地,测定在本发明中提及的多核苷酸或扩增产物的量,是指测量所述量或浓度,优选地半定量地或定量地。优选地,所述测定包括:用于定量转录物的标准化步骤。示例地,关于NASBA靶物扩增方法,简要地描述该标准化过程。优选地,通过将预定量的校准RNA(Q-RNA)加入扩增扩增混合物中,实现标准化,并从而实现定量。所述校准RNA优选地应当是体外转录的RNA,其可以被能够特异性地扩增要分析的转录物的相同寡核苷酸扩增。但是,所述Q-RNA应当包含探针寡核苷酸的特异性靶区(即未被要分析的转录物包含的靶区)。所述特异性靶区应当允许区分要分析的转录物的扩增产物和Q-RNA的扩增产物。所述标准化的原理是,使用相同寡核苷酸对的Q-RNA和要分析的mRNA的竞争性共扩增(van Gemen等人1993: Quantification of HIV-1 RNA in plasma using NASBA during HIV-1 primaryinfection. J Virol Methods 43:177-87)。应当理解,在本发明的背景下,优选地需要为要分析的每种mRNA滴定Q-RNA量。为了定量,可以将表达水平与使用体外转录的mRNA的标准曲线相对比,或与合适的参比物质相对比。这可以由技术人员不费周折地实现。
技术人员会理解术语“测定基因产物的存在或缺失”。本文使用的该术语优选地是指,评估基因产物是否存在于样品中。优选地,E1C的基因产物在来自受试者的样品中的存在指示,所述受试者遭受HR-HPV感染的严重形式。优选地,E1C的基因产物在来自受试者的样品中的缺失指示,所述受试者遭受HPV感染的轻度形式。
通过众所周知的方法,可以评估基因产物是否存在于样品中。例如,如果基因产物分子的数目低于检测限,那么结论是,所述基因产物不存在;如果所述分子数目高于检测限,那么结论是,所述基因产物存在于样品中。应当理解,所述检测限可能取决于使用的检测系统的类型;例如在基于PCR的试验中,可以检测一个转录物分子,而在ELISA试验中,可能需要几个多肽分子来提供可检测的信号。本领域技术人员知晓如何调节采用的检测系统来实现最大灵敏度和可靠性,包括包含适当的对照物。用于测定基因产物的量的方法取决于所述基因产物的性质,即所述基因产物是转录物还是多肽。
还可以如下测定基因产物在样品中的存在或缺失:测定所述样品中的基因产物的量,并将如此测得的量与参照量进行对比。通过认为适当的任意方法,可以测定受试者样品中的转录物的量,并从而测定mRNA的量。优选地,使用特异性地检测要分析的转录物的探针寡核苷酸,测定转录物的量。用于测定转录物的量的所有方法也可以用于测定上文所述的基因产物的存在或缺失。
用特异性的探针寡核苷酸测定转录物或其扩增产物的量,优选地包括下述步骤:使转录物或其扩增产物(关于“扩增产物”的解释,参见下面)与探针寡核苷酸杂交,所述探针寡核苷酸特异性地结合所述转录物或其扩增产物。在本发明的背景下,探针寡核苷酸优选地是,对所述转录物或其扩增产物特异性的单链核酸分子。技术人员知晓,探针寡核苷酸包括一段核苷酸,后者与靶物特异性地杂交,并因而与靶多核苷酸互补。所述核苷酸段优选地与靶多核苷酸包含的序列区具有85%、90%、95%、99%或更优选地100%同一性。
为了实现转录物或其扩增产物的特异性检测,所述探针寡核苷酸优选地特异性地结合要检测的转录物或扩增产物,但是不特异性地结合所述样品包含的其它多核苷酸。如何选择合适的探针寡核苷酸是本领域已知的。
在表1中显示了适当地包含在用于检测剪接连接点的探针寡核苷酸中的序列实例(“探针序列”,SEQ ID NO: 10、11、12和31)。应当理解,就HPV33和HPV52而言,所述适当地包含的序列是相同的;本领域技术人员知晓如何向探针寡核苷酸添加延伸段,以便获得与给定的序列特异性地杂交(例如在希望区分HPV33的E1C转录物或HPV52的E1C转录物的情况下,与HPV33的E1C转录物或与HPV52的E1C转录物特异性地杂交)的探针寡核苷酸。通过在5'和/或3'侧、优选地在两侧延伸探针序列,可以增加用于检测E1C转录物的探针寡核苷酸的特异性。最优选地,所述探针序列位于用于检测E1C转录物的探针寡核苷酸的中央处或附近。本领域技术人员知晓如何向探针序列添加延伸段,以便获得与给定的序列特异性地杂交的探针寡核苷酸。
可以标记本发明的探针寡核苷酸,或其含有其它修饰,包括允许测定转录物或其扩增产物的量的酶。通过本领域众所周知的多种技术,且取决于要使用的标记物,可以实现标记。在本说明书别处描述了优选的标记物。
所述探针寡核苷酸可以结合在固体表面上,或存在于液相中。作为一个实例,所述探针寡核苷酸结合在提供固体表面的载体上。优选地,所述载体是小颗粒或珠子。小颗粒或珠子的总大小优选地可以是在微米或纳米范围内。使用特异性的染料,更优选地使用特异性的荧光染料,可以将所述珠子和颗粒染色。优选地,通过用不同的染料将不同的载体染色,可以使所述载体彼此区分开。通过使用具有特定探针寡核苷酸(因而,靶向特定序列的扩增多核苷酸的核酸)的特异性染料的载体,可以使所述载体与包含不同染料的其它载体区分开。在一个优选的实施方案中,使用可商业得到的Luminex微球(Luminex Corp.,Austin, Texas, USA)。因而,为了检测转录物或其扩增产物,使探针与荧光标记的聚苯乙烯珠子(Luminex悬浮阵列技术)偶联,它们在合适的、优选严谨的条件下与扩增产物杂交。此外,通过使用微阵列、反向线印迹(Reverse-Line Blots, RLB)、斑点印迹或含有与合适载体相连的特异性寡核苷酸的类似技术,可以鉴别出扩增产物。存在于液相中的探针寡核苷酸可以结合固定化的靶核酸分子或扩增的多核苷酸。本领域技术人员已知的特异性的标记或修饰可能允许靶物检测或信号扩增。另外,通过尺寸分离例如凝胶或毛细管电泳,通过核苷酸组成,使用例如核磁共振,或通过本文别处所述的实时和信号放大方法,可以检测扩增产物。
本领域技术人员能够选择合适的探针寡核苷酸。为了测定剪接转录物,具体地预见到,使用探针寡核苷酸测定所述可变剪接mRNA的量,所述探针寡核苷酸特异性地结合侧接剪接连接点的核苷酸,并因而结合通过连接各个特异性的剪接供体和剪接受体核苷酸而产生的核酸序列。
优选地,转录物的量的测定包括下述步骤:使用特异性地扩增所述转录物的寡核苷酸,扩增所述转录物,并测定如此扩增的转录物的量。因而,为了测定转录物的量,特别优选地,通过本文别处所述的合适的方法,扩增转录物,然后测定扩增产物的量。或者,通过信号放大方法测定转录物的量,所述信号放大方法使用特异性地结合所述转录物并允许线性信号放大和随后测定扩增信号的寡核苷酸探针。
在本发明的背景下,用于扩增转录物的寡核苷酸应当包含许多核苷酸,后者足以进行与靶多核苷酸的序列段的特异性结合。优选地,本文提及的寡核苷酸具有15-40个核苷酸的长度,更优选地18-30个核苷酸的长度,最优选地20-27个核苷酸的长度。在本发明的背景下,探针寡核苷酸允许检测本文提及的转录物和/或所述转录物的扩增产物(参见本文别处)。通过检测转录物或其扩增产物,可以在具有HPV16的受试者的样品中评估特定转录物的量。为了实现转录物或其扩增产物的特异性检测,探针寡核苷酸必须与转录物或其扩增产物充分互补,或与所述转录物或所述扩增产物的某些部分充分互补。特别优选的寡核苷酸具有在本文中提及的具体序列和/或性质。
具体地,可以将所述寡核苷酸生物素化,以便使扩增产物能够结合抗生蛋白链菌素表面或荧光缀合物。此外,在本发明的背景下要使用的标记可以是、但不限于荧光标记,所述荧光标记包括:除了别的以外,荧光染料诸如R-藻红蛋白、Cy3、Cy5、荧光素、罗丹明、Alexa或德克萨斯红。但是,所述标记也可以是酶或抗体。预见到,要用作标记的酶将通过与底物反应而产生可检测的信号。合适的酶、底物和技术是本领域众所周知的。要用作标记的抗体可以特异性地识别靶分子,所述靶分子可以直接地(例如,自身发荧光的靶分子)或间接地(例如,产生可检测的信号的靶分子,诸如酶)检测到。此外,所述寡核苷酸可以含有一般序列,所述一般序列允许通过与互补的检测探针的杂交而检测到,所述检测探针可以含有任一种前述标记或修饰。本发明的寡核苷酸还可以含有5´-限制位点、锁定的核酸分子(LNA),或是肽核酸分子(PNA)的一部分。一般而言,经由肽部分,例如通过抗体,可以检测到这样的PNA。
如何扩增转录物是本领域众所周知的。转录物的扩增优选地是一个模板依赖性的过程,该过程导致对应的核酸分子的量相对于初始量的增加。扩增产物优选地是核酸、DNA或RNA。应当理解,转录物的扩增可以包括额外步骤,诸如通过众所周知的方法反转录转录物。
如何扩增靶信号是本领域众所周知的。信号的扩增优选地是一个模板依赖性的过程,该过程导致报告信号的量相对于初始量的增加。报告信号优选地是可见光、荧光、化学发光和发萤光。信号扩增方法是本领域众所周知的,且可以基于酪胺信号扩增、分支DNA扩增、Dendrimer®扩增、挂锁探针和滚环扩增、Invader®信号扩增和其它信号扩增方法。
通过众所周知的方法,优选地通过聚合酶链式反应(PCR),通过逆转录酶(RT)PCR、实时PCR、基于核酸序列的扩增(NASBA)、转录介导的扩增(TMA)和使用酶和特异性寡核苷酸引物的其它等温扩增方法,可以实现目标转录物的扩增。PCR方法是本领域众所周知的。优选地,使用合适的寡核苷酸对进行扩增。
本发明不限于任一种前述的技术。作为用于扩增转录物的一种示例性方法,将简要地总结NASBA技术。NASBA是用于在一个温度扩增核酸的寡核苷酸依赖性的技术。将包含要扩增的转录物的样品加入反应混合物中,所述反应混合物包含至少2种转录物特异性的寡核苷酸,用于扩增所述转录物。第一寡核苷酸(含有T7 RNA启动子序列)结合它的在模板的3’末端处的靶位。通过反转录,产生RNA/DNA杂交物。酶RNAse H会降解RNA部分。在降解RNA模板以后,第二种寡核苷酸结合单链cDNA的3’-末端,并产生含有完整T7 RNA启动子的双链DNA。然后,酶T7 RNA聚合酶线性地产生反义RNA。每个新合成的反义RNA分子可以自身充当模板(使用第二种引物),并转化成具有功能性T7启动子的DNA中间体。但是,在该情况下,所述寡核苷酸引物以倒序对合,因为新产生的RNA分子在朝向上与原始靶物相反,且得到的DNA中间体仅仅是部分双链的。以此方式, 从重新进入反应的每个RNA靶物产生多个RNA拷贝,导致在等温条件下线性地合成RNA产物。在90 min内得到大约106至109倍扩增(Compton, J. 1991. Nucleic acid sequence-based amplification. Nature 350:91-2)。
为了特异性地扩增本文提及的剪接mRNA,用于扩增转录物的寡核苷酸对优选地应当能够特异性地扩增包含各个剪接连接点的核酸区域。因此,用于扩增的寡核苷酸应当特异性地结合在剪接连接点的5’和3’侧(一种引物在3’,一种引物在5’)的转录物(或其互补链,特别是通过本文别处所述的方案产生的互补的DNA或RNA链)。使用前述寡核苷酸产生的扩增产物将包含各个剪接连接点。但是,本发明也预见到所述寡核苷酸对的一种寡核苷酸特异性地结合E1C转录物的包含剪接连接点的区域,使得仅当所述E1C转录物存在于样品中时,可以发生特异性的结合,并从而发生扩增。在这样的情况下,预期长度的转录物的缺失是所述转录物的缺失的诊断,并因而是HR-HPV感染的轻度形式的诊断。
测定在本说明书中提及的多肽的量是指测量所述量或浓度,优选地半定量地或定量地。测量可以直接地或间接地进行。直接测量是指基于信号来测量肽或多肽的量或浓度,所述信号从肽或多肽本身得到,且所述信号的强度与存在于样品中的肽分子的数目直接相关联。例如,通过测量肽或多肽的特定物理或化学性质的强度值,可以得到这样的信号(有时在本文中称作强度信号)。直接测量包括测量从第二组分(即不是肽或多肽本身的组分)或生物读出系统得到的信号,例如,可测量的细胞应答、配体、标记或酶反应产物。
根据本发明,通过所有已知的用于测定样品中的肽的量的方式(means),可以测定多肽的量。所述方式包括:可以使用标记的分子的免疫测定装置和方法,所述标记的分子处于不同的夹心、竞争或其它测定形式。所述测定会产生指示肽或多肽的存在或缺失的信号。此外,信号强度可以优选地与存在于样品中的多肽的量直接地或间接地(例如成反比)相关联。其它合适的方法包括:测量肽或多肽特有的物理或化学性质,诸如它的精确分子质量或NMR谱。所述方法优选地包括:生物传感器、与免疫测定偶联的光学装置、生物芯片、分析装置诸如质谱仪、NMR-分析仪或色谱装置。另外,方法包括基于微板ELISA的方法、全自动化的或机器人免疫测定(例如可在ElecsysTM分析仪上得到)、CBA (一种酶促的钴结合试验(Cobat Binding Assay),例如可在Roche-HitachiTM分析仪上得到)和胶乳凝集试验(例如可在Roche-HitachiTM分析仪上得到)。
多肽量的测定优选地包括:使用与待测多肽特异性地结合的抗体。优选地,如果待测多肽源自特异性地剪接的HR-HPV转录物的翻译,那么所述抗体应当特异性地结合由侧接剪接连接点的核酸编码的多肽区域。优选的抗体如本文别处所述。
术语“参照量”是用于确定HR-HPV感染是严重或轻度感染的阈值。如果在样品中测得的E1C的基因产物的量超过参照量,那么HR-HPV感染是严重的;如果在样品中测得的E1C的基因产物的量等于或低于参照量,那么HR-HPV感染是轻度的。技术人员知晓如何确定参照量,例如通过测定已经评估HR-HPV感染的严重性的(例如通过巴氏试验)代表性样品集合中的E1C的基因产物的量,并使用得到的结果的统计分析来确定参照量。应当理解,所述参照量可以是0。
上面给出的定义在细节上做必要的修正以后适用于下述的:
在另一个实施方案中,本发明涉及一种用于在具有HR-HPV的受试者中区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式的方法,所述方法包括下述步骤:a)在所述受试者的样品中,测定第一种基因产物的量,所述第一种基因产物是E1C的基因产物,b)测定所述样品中第二种基因产物的量,c)计算在步骤a)中测得的所述第一种基因产物的量和在步骤b)中测得的所述第二种基因产物的量之比例,d)将在步骤c)中计算出的比例与参照比例进行对比,和e)区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式。
优选地,前述方法包括:计算E1C的基因产物的量与参照量之比例。根据本发明的参照量是第二种基因产物的量,其中已知所述第二种基因产物的量在严重HR-HPV感染的情况下不会增加,正如例如细胞持家基因的情况,或例如E1^E4、L1或E5的基因产物的情况,它们在严重HR-HPV感染中的表达是恒定的或降低。如上文所述,就区分HR-HPV感染的轻度形式和严重形式而言,测定E1C的基因产物(或由所述剪接mRNA编码的多肽)的量是特别有利的。
在本发明的前述方法的背景下,第二种基因产物优选地选自:E1^E4的基因产物、Apm1的基因产物、Ubc的基因产物、U1A的基因产物、E1的基因产物、E5的基因产物、L1的基因产物和E6*I的基因产物。
E1^E4的基因产物和E6*I的基因产物优选地是HR-HPV的可变剪接mRNA或由所述可变剪接mRNA编码的多肽。在表2中总结了所述可变剪接mRNA的剪接位点。
表2: HPV 18、33、35. 52和58的E1^E4和E6*I转录物的剪接连接点。*根据在参考文献中描述的方法,测定E1^E4剪接连接点的确切位置
(参考文献:- Sotlar K, Stubner A, Diemer D, 等人Detection of high-riskhuman papillomavirus E6 and E7 oncogene transcripts in cervical scrapes bynested RT-polymerase chain reaction. Journal of medical virology 2004;74:107-16.
- Pim D, Massimi P, Banks L. Alternatively spliced HPV-18 E6* proteininhibits E6 mediated degradation of p53 and suppresses transformed cellgrowth. Oncogene 1997;15:257-64.
- Meyers C, Mayer TJ, Ozbun MA. Synthesis of infectious humanpapillomavirus type 18 in differentiating epithelium transfected with viralDNA. J Virol 1997;71:7381-6.
- Snijders PJ, van den Brule AJ, Schrijnemakers HF, Raaphorst PM, MeijerCJ, Walboomers JM. Human papillomavirus type 33 in a tonsillar carcinomagenerates its putative E7 mRNA via two E6* transcript species which areterminated at different early region poly(A) sites. J Virol 1992;66:3172-8.)。
本文使用的术语“E1^E4的基因产物”优选地表示与HPV16的880^3358剪接mRNA相对应的RNA,优选地包含HPV18的929^3434剪接连接点的转录物或包含HPV33的894^3351剪接连接点的转录物;或该术语是指由与HPV16的880^3358剪接mRNA相对应的所述转录物编码的多肽,所述多肽优选地是E1多肽的N-端与HPV的E4多肽的融合多肽。所述多肽在病毒生命周期的晚期中表达。它们在棘细胞层和颗粒细胞层中检测到,且在HPV感染的晚期具有几种功能。
本文使用的术语“E6*I的基因产物”优选地表示与HPV16的226^409剪接mRNA相对应的mRNA,优选地包含HPV18的233^416剪接连接点的转录物,包含HPV33的231^509剪接连接点的转录物,或包含HPV33的232^415剪接连接点的转录物;或该术语是指由与HPV16的226^409剪接mRNA相对应的所述转录物编码的多肽。已经表明E6*I多肽可能反式激活病毒LCR (Alloul, N., 和L. Sherman. 1999. Transcription-modulatory activities ofdifferentially spliced cDNAs encoding the E2 protein of human papillomavirustype 16. J Gen Virol 80 (Pt 9):2461-70)。
Ubc、U1A和Apm1是由宿主细胞的基因组包含的基因。因而,所述基因并非由HPV16的基因组编码。在本发明的背景下,宿主特异性的基因也称作细胞基因。Ubc、U1A和Apm1的基因产物优选地是由所述基因编码的mRNA和多肽。本发明的方法因而预见到Ubc、U1A和Apm1 mRNA或Ubc、U1A和Apm1多肽的量的测定。
在本文中提及的术语“Ubc”优选地表示泛素C,优选地人泛素C。人Ubc1的核酸序列以及氨基酸序列是本领域众所周知的,且显示在例如GenBank登记号: NM_021009.4 (核酸序列,SEQ ID NO: 16)和GenBank登记号: NP_066289.2 (氨基酸序列,SEQ ID NO: 17)中。
在本文中提及的术语U1A优选地表示U1小核核糖核蛋白多肽A,优选地,人U1小核核糖核蛋白多肽A。人U1A的核酸序列以及氨基酸序列是本领域众所周知的,且显示在例如GenBank登记号: NM_004596.3 (核酸序列,SEQ ID NO: 18)和GenBank登记号: NP_004587.1 (氨基酸序列,SEQ ID NO: 19)中。
在本文中提及的术语Apm1优选地表示“受ME180细胞中的乳头状瘤病毒DNA整合的影响”或“含有锌指和BTB结构域的7C”(ZBTB7C)。人Apm1的核酸序列以及氨基酸序列是本领域众所周知的,且显示在例如GenBank登记号: NM_001039360.1 (核酸序列,SEQ ID NO:20)和GenBank登记号: NP_001034449.1 (氨基酸序列,SEQ ID NO: 21)中。
本发明的方法也预见到测定包含E1转录物的多核苷酸的量或测定E1多肽的量。所述多核苷酸和所述多肽由HR-HPV基因组编码。
E1多肽由含有未剪接的E1 ORF (开放读码框)的转录物编码。E1是病毒复制所必需的,且与SV40大肿瘤抗原具有结构相似性。E1表现出ATP酶、解螺旋酶和核苷酸结合活性,会与细胞的DNA-聚合酶α相互作用,并将细胞的复制起始机制募集至LCR中的病毒复制起点。
本发明的方法也预见到测定包含E5转录物的多核苷酸的量或测定E5多肽的量。所述多核苷酸和所述多肽由HR-HPV基因组编码。
E5多肽从未剪接的E2/E5转录物表达,但是不从E1^E4/E5转录物表达。在HPV基因组整合进宿主基因组中以后,由于E2区域的破坏,E5多肽和转录物表达停止。E5是一种疏水膜蛋白,其在细胞内膜和质膜中发现。认为E5二聚体在感染的早期过程中是重要的,因为它与生长因子受体、EGF-或PDGF-受体相互作用,并造成它们的不依赖于配体的二聚化、随后的细胞溶质的酪氨酸残基的反式-磷酸化和细胞信号转导蛋白的募集。
本发明的方法也预见到测定包含L1转录物的多核苷酸的量,或测定L1多肽的量。所述多核苷酸和所述多肽由HR-HPV基因组编码。
如上所述,HPV的L1多肽是一种衣壳蛋白。在生产性感染的晚期,这种重要的衣壳蛋白(L1多肽)在分化细胞中在上皮顶部附近表达,并与HPV16的L2多肽一起在颗粒层中形成病毒衣壳。
本文使用的术语“对比”包括将如下测得的值与在本说明书别处指定的合适参照源相对比:计算在本发明方法的步骤a)中测得的第一种基因产物的量与在本发明方法的步骤b)中测得的所述第二种基因产物的量之比例。应当理解,本文使用的“对比”表示值的对比。在本发明方法的步骤d)中提及的对比可以手工地或计算机辅助地进行。就计算机辅助的对比而言,可以通过计算机程序将测定的量的值与存储在数据库中的适当参照的对应值相对比。所述计算机程序可以另外评价对比的结果,即自动地提供合适的输出格式的希望的评估。基于在本发明方法的步骤c)中计算的比例与参照比例的对比,可能在具有HR-HPV的受试者中区分HR-HPV感染的轻度形式和HR-HPV感染的严重形式。因此,将选择参照比例,使得对比的值的差异或相似性允许区分HPV16感染的轻度形式和HR-HPV感染的严重形式。
因此,本文使用的术语“参照比例”优选地表示允许区分HR-HPV感染的轻度形式和严重形式的值。因此,所述参照可以如下产生:执行本发明方法的步骤a)和b),并计算在具有HR-HPV感染的受试者的样品中在本发明方法的步骤a)中测得的第一种基因产物的量与在本发明方法的步骤b)中测得的所述第二种基因产物的量之比例,已知所述受试者遭受HR-HPV感染的严重形式诸如HSIL或宫颈癌。并且,所述参照可以如下产生:执行本发明方法的步骤a)和b),并计算在具有HR-HPV感染的受试者的样品中在本发明方法的步骤a)中测得的第一种基因产物的量与在具有HR-HPV感染的受试者的样品中在本发明方法的步骤b)中测得的所述第二种基因产物的量之比例,已知所述受试者会表现出HR-HPV感染的轻度形式(例如分类为LSIL的形式)。通过本发明的方法,可以从要与实验样品一起(即同时或随后)分析的参照样品确定合适的参照比例或阈值。应当理解,参照比例或阈值的值可能随所述基因产物(转录物或多肽)的性质和随如何测定样品中的基因产物的量而变化。例如,如果第一种和第二种基因产物的量的测定包括通过PCR扩增所述基因产物,测定的基因产物的量可能取决于例如用于PCR反应的寡核苷酸,因为用于扩增特定基因产物的不同寡核苷酸对的扩增效率会变化。但是,本领域技术人员在计算参照比例时会考虑这方面。具体地,技术人员知晓,优选地,必须使用相同的装置和方法来测定参照样品中和实验样品中的特定基因产物的量。
可以容易地建立本文所述的标志物的参照量或在本发明背景下的参照比例。此外,可以简单地将在实验样品中的标志物的量或在来自受试者的实验样品中的2种标志物之比例分别与参照比例和参照量相对比。诊断实验的灵敏度和特异性不仅取决于实验的分析“质量”,它们还取决于组成异常结果的定义。在实践中,通常如下计算受试者操作特征曲线或“ROC”曲线:将变量的值相对于它在遭受HPV感染的轻度形式的群体中和在遭受HPV感染的严重形式的群体中的相对频率绘图。就任何特定标志物或标志物比例而言,受试者的标志物水平或标志物比例的分布可能重叠。在这样的条件下,实验不能以100% 准确度绝对地区分具有HPV感染的轻度形式的患者和具有HPV感染的严重形式的患者,并且重叠区域指示所述实验不能区分具有HPV感染的轻度形式的患者和具有HPV感染的严重形式的患者的区域。选择一个阈值,在该阈值以上,认为实验指示严重的,且在该阈值以下,认为实验指示纤维化。ROC曲线下面积是接受的测量会正确诊断受试者的可能性的量度。这些方法是本领域众所周知的。参见,例如,Hanley等人, Radiology 143: 29-36 (1982)。
在某些实施方案中,选择的参照量/比例表现出至少约70% 灵敏度、更优选至少约80% 灵敏度、甚至更优选至少约85% 灵敏度、还更优选至少约90% 灵敏度和最优选至少约95% 灵敏度,并伴随至少约70% 特异性、更优选至少约80% 特异性、甚至更优选至少约85%特异性、还更优选至少约90% 特异性和最优选至少约95% 特异性。在特别优选的实施方案中,灵敏度和特异性都是至少约75%、更优选至少约80%、甚至更优选至少约85%、还更优选至少约90%和最优选至少约95%。
如上所述,可以优选地从遭受HPV感染的严重形式的受试者的样品或从已知遭受HPV感染的轻度形式的受试者的样品获得参照。所述参照也可以是从一组这样的样品得到的平均值或中位值。通过应用本发明的方法,可以得到所述参照结果。可以如本文别处所示,测定所述群体的个体的生物标志物的绝对或相对量。如何计算合适的参照值或比例(优选地,平均值或中位值)是本领域众所周知的。在前面提及的受试者群体应当包含许多受试者,优选地,至少5、10、50、100、1,000或10,000个受试者。应当理解,要通过本发明方法评估的受试者和所述许多受试者中的受试者属于同一物种。
进一步预见到,如下得到“参照”:测定一组参照受试者(即一组已知遭受HPV感染的严重形式的受试者,或一组已知遭受HPV感染的轻度形式的受试者)中的生物标志物的量或2种生物标志物的比例,并通过适当的统计量度(包括本文别处提及的那些,诸如中位值、平均值、分位数、PLS-DA、对数回归方法、随机forest分类或产生阈值的其它方法),计算所述参照。所述阈值应当考虑到实验的灵敏度和特异性的希望的临床设置。
还预见到,可以基于从实验样品得到的实验结果和前述参照结果之间的同一性或相似性程度,即基于关于生物标志物的相同或类似量,进行评估受试者是否遭受HPV感染的严重形式或HPV感染的轻度形式。例如,如果已经从遭受HPV感染的轻度形式的受试者得到参照样品,且如果实验样品中的生物标志物的量或所述比例与参照样品中的所述生物标志物的量或比例类似或相同,那么可以诊断出HPV感染的轻度形式的存在。如果特有特征的值和在定量测定情况下的强度值是相同的,那么实验样品的结果和参照结果是相同的。如果特有特征的值/比例是相同的,但是强度值/比例是不同的,那么所述结果是类似的。这样的差异优选地不是显著的,且应特征在于,强度值至少是在参照值的1-99%、5-95%、10-90%、20-80%、30-70%、40-60%区间内,是参照值的50%、60%、70%、80%、90%或95%。
在本发明方法的背景下还预见到,所述评估可以基于从实验样品得到的实验结果和前述参照结果之间的差异。如果使用如上所述计算的参照,这同样使用。所述差异优选地是本文所述比例的增加或减小,或根据本发明的诊断标志物的绝对或相对量的增加或减小。优选地,相对或绝对量的增加或减小是显著的,即在参照值的45-55%、40-60%、30-70%、20-80%、10-90%、5-95%、1-99%区间之外。
用作阈值的优选参照比例可以源自正常上限(ULN),即在受试者(例如为临床试验招募的患者)群体中发现的生理量的上限。通过各种众所周知的技术,可以确定给定的受试者群体的ULN。
优选地,在本发明的背景下计算的比例是第一种基因产物的量与第二种基因产物的量之比例。还应当理解,可以计算第二种基因产物的量与第一种基因产物的量之比例。
如果计算第一种基因产物的量与第二种基因产物的量之比例,优选地,下述内容适用:
优选地,在实验样品中计算出的比例大于参照比例指示HR-HPV感染的严重形式。更优选地,在实验样品中计算出的比例显著大于参照比例指示HR-HPV感染的严重形式。最优选地,在实验样品中计算出的比例统计上显著地大于参照比例指示HR-HPV感染的严重形式。
优选地,在实验样品中计算出的比例小于参照比例指示HR-HPV感染的轻度形式。更优选地,在实验样品中计算出的比例显著小于参照比例指示HR-HPV感染的轻度形式。最优选地,所述计算比例统计上显著地小于参照比例。
具体地,显著大于(或小于)或统计上显著地大于(或小于)参照比例的比例是被认为对于本文提及的区分而言是显著的比例尺度。术语“大于”、“显著大于”和“统计上显著地大于”、“小于”、“显著小于”和“统计上显著地小于”是本领域技术人员已知的。因而,使用各种众所周知的统计评价工具,本领域技术人员可以不进行过度劳动地确定比例是否是更大(或更小)、显著更大(或更小)、或统计上显著地更大(或更小)。
在另一个实施方案中,本发明涉及一种用于在具有HR-HPV的受试者中区分(i)HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式的装置,所述装置包括:用于测定E1C的基因产物的存在和/或量的装置,和用于对比所述量和参照量、从而允许区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式的装置。
此外,本发明涉及一种用于在具有HR-HPV的受试者中区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式的装置,所述装置包括:用于测定E1C的基因产物的存在和/或量、从而允许区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式的检测剂。
优选地,所述装置另外包括用于对比E1C的基因产物的量和参照量的装置。
本发明也预见到一种用于在具有HR-HPV的受试者中区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式的装置,所述装置包括:用于测定在所述受试者的样品中的第一种基因产物的量的检测剂(所述第一种基因产物是E1C的基因产物),用于测定所述样品中第二种基因产物的量的检测剂,用于计算所述第一种基因产物的量与所述第二种基因产物的量之比例的装置,用于对比所述比例和参照比例的装置,和用于区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式的装置。
此外,本发明预见到一种适于实现上面公开的本发明方法的装置,所述装置包括:
a)分析单元,其包含特异性地结合E1C的基因产物的检测剂,所述检测剂适合用于测定E1C的基因产物的量和/或存在,和,优选地,
b)评价单元,其用于对比所述量和参照量,通过所述评价单元,可以在具有HR-HPV的受试者中区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式,所述单元包含具有至少一个参照比例的数据库和用于实现所述对比的计算机执行的算法,所述参照比例源自遭受HR-HPV感染的轻度形式的受试者或源自遭受HR-HPV感染的严重形式的受试者。
本发明也涉及一种适于实现上面公开的本发明方法的装置,所述装置包括:
a) 分析单元,其包含特异性地结合第一种基因产物的检测剂,所述第一种基因产物是E1C的基因产物,所述检测剂适合用于测定所述第一种基因产物的量,且优选地,所述分析单元包含特异性地结合第二种基因产物的检测剂,所述检测剂适合用于测定所述第二种基因产物的量;和
b) 评价单元,其用于计算所述第一种和所述第二种基因产物的量的比例,并用于对比所述比例和参照比例,通过所述评价单元,可以在具有HR-HPV的受试者中区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式,所述单元包含具有至少一个参照比例的数据库和用于实现所述对比的计算机执行的算法,所述参照比例源自遭受HR-HPV感染的轻度形式的受试者或源自遭受HR-HPV感染的严重形式的受试者。
在本文别处指定了优选的E1C基因产物以及第二种基因产物。优选地,所述HR-HPV和对应的E1C的基因产物是
a) HPV18和包含929^2779连接点的剪接转录物,
b) HPV33和包含894^2702连接点的剪接转录物,
c) HPV35和包含883^2649连接点的剪接转录物,
d) HPV52和包含879^2696连接点的剪接转录物,或
e) HPV58和包含898^2706连接点的剪接转录物。
本文使用的术语“装置”是指这样的系统:其包含彼此可操作地连接的前述单元,从而允许根据本发明的方法进行诊断或监测。本文使用的术语“检测剂”表示这样的试剂:其能够特异性地识别和结合存在于样品中的基因产物。在本文别处详细地公开了优选的检测剂(诸如探针或抗体、特异性地扩增转录物的寡核苷酸)。可以将测得的基因产物的量和/或存在或缺失传递给评价单元。所述评价单元包括数据处理元件,诸如计算机,其具有用于实现测定的量和合适参照之间的对比的执行算法。如本文别处所述,合适参照源自遭受HR-HPV感染的轻度形式的受试者或遭受HR-HPV感染的严重形式的受试者。所述结果可以呈现为参数诊断原始数据的输出,优选地作为绝对量,或更优选地作为相对量。应当理解,这些数据需要由临床医师进行解释。但是,也预见到专家系统装置,其中所述输出包括经过加工的诊断原始数据,其解释不需要专门的临床医师。
本发明另外包括试剂盒,优选地所述试剂盒适于实现本发明的方法,所述试剂盒包括实现所述方法的说明书,所述试剂盒另外包括用于测量E1C的基因产物的存在和/或量的检测剂,和优选地,用于对比所述量和参照量、从而允许区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式的装置。
本发明也涉及一种试剂盒,优选地所述试剂盒适于实现本发明的方法,所述试剂盒包括实现所述方法的说明书,所述试剂盒另外包括用于测量在所述受试者的样品中的第一种基因产物的量的检测剂(所述第一种基因产物是E1C的基因产物),用于测定所述样品中第二种基因产物的量的检测剂,用于计算所述第一种基因产物的量与所述第二种基因产物的量之比例的装置,用于对比所述比例和参照比例的装置,和用于区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式的装置。
在本文别处指定了优选的E1C基因产物以及第二种基因产物。优选地,所述HR-HPV和对应的E1C的基因产物是
a) HPV18和包含929^2779连接点的剪接转录物,
b) HPV33和包含894^2702连接点的剪接转录物,
c) HPV35和包含883^2649连接点的剪接转录物,
d) HPV52和包含879^2696连接点的剪接转录物,或
e) HPV58和包含898^2706连接点的剪接转录物。
本文使用的术语“试剂盒”表示前述组分的集合,优选地,前述组分分别提供或提供在单个容器中。所述容器还包括关于实现本发明的方法的说明书。这些说明书可以是手册的形式,或可以由计算机程序代码提供,当在计算机或数据处理装置上执行时,所述代码能够实现在本发明方法中提及的对比,并相应地建立诊断。所述计算机程序代码可以提供在数据存储介质或装置诸如光学存储介质(例如,光盘)上,或直接地提供在计算机或数据处理装置上。
在另一个优选的实施方案中,本发明涉及包含剪接连接点的HR-HPV基因组的转录物,其中HR-HPV和剪接连接点的组合选自下述列表:a) HPV18和929^2779连接点,b) HPV33和894^2702连接点,c) HPV35和883^2649连接点,d) HPV52和879^2696连接点,和HPV58和898^2706连接点。
此外,本发明涉及寡核苷酸混合物,所述混合物包含:i)至少一种第一寡核苷酸,其与E1C转录物的剪接连接点特异性地杂交,和ii)至少一种第二寡核苷酸,其与选自下述的转录物特异性地杂交:E6*I的转录物、E1^E4的转录物、Apm1的转录物、Ubc的转录物、U1A的转录物、E1的转录物、E5的转录物和L1的转录物。
此外,本发明涉及抗体,其特异性地识别具有在SEQ ID NO: 22、23、24、34或35中所示的序列的肽。优选地,所述抗体特异性地识别具有在SEQ ID NO: 22、23、24、34或35中所示的序列的肽的至少5、6、7或8个连续氨基酸。
使用根据本发明的纯化多肽的片段作为抗原,可以制备出针对本发明的多肽的抗体。这样的片段可以通过蛋白水解消化从本发明的多肽得到,或可以是合成的肽。优选地,本发明的抗体是单克隆抗体、多克隆抗体、单链抗体、人或人源化的抗体或灵长类动物化的、嵌合抗体或其片段。本发明的抗体还包括双特异性的抗体、合成的抗体、抗体片段诸如Fab、Fv或scFv片段等,或这些中的任一种的化学修饰衍生物。本发明的抗体会特异性地结合(即不会与其它多肽或肽交叉反应)本发明的多肽。通过各种众所周知的技术,可以测试特异性的结合。
使用在例如Harlow和Lane“Antibodies, A Laboratory Manual”, CSH Press,Cold Spring Harbor, 1988中描述的方法,可以得到抗体或其片段。通过最初在Köhler和Milstein, Nature 256 (1975), 495和Galfré, Meth. Enzymol. 73 (1981), 3中描述的技术,可以制备单克隆抗体,所述技术包括:使小鼠骨髓瘤细胞与源自免疫的哺乳动物的脾细胞融合。
所述抗体可以用于,例如,本发明的变体多肽的免疫沉淀和免疫定位,以及用于监测所述多肽的存在或量,和用于鉴别与根据本发明的蛋白相互作用的化合物。例如,在BIAcore系统中使用的表面等离子体共振可以用于增加噬菌体抗体的效率,所述噬菌体抗体结合本发明蛋白的表位(Schier, Human Antibodies Hybridomas 7 (1996), 97-105;Malmborg, J. Immunol. Methods 183 (1995), 7-13)。
在本说明书中引用的所有参考文献都通过引用并入本文,这涉及它们的整个公开内容和在本说明书中具体地提及的公开内容。
下述实施例仅仅例证本发明。无论如何,其都不应解释为限制本发明的范围。
实施例
实施例1
HR-HPV 18、33、35、52和58中的HPV16-类似的E1C转录物的鉴别
选择储存在PreservCytTM培养基(ThinPrep取样装置)中的、来自具有低等级至高等级病变或CxCa的患者的宫颈剥脱细胞,用于基于以前的HPV18、33、35、52和58基因分型数据的RNA分离。在剧烈匀浆化以后,将3-12 ml细胞悬浮液转移至15 ml Falcon管,并在10℃、4000 rpm (300 x g)离心10 min。去除上清液,通过轻打试管,将细胞沉淀物重新悬浮于残余体积中。加入无水乙醇(2.5 ml),并通过抽吸,将混合物良好地匀一化。将1.5 ml悬浮液转移进2 ml埃彭道夫管(没有与EZ1 RNA试剂盒一起提供)中,离心,并抛弃上清液,在-80℃保存。根据生产商的说明书,省略DNA酶处理,进行RNA分离。
使用Qiagen一步RT-PCR试剂盒、新设计的正向和反向引物(分别与E7和E2基因对合),扩增截短的PCR产物,所述PCR产物仅在具有高等级病变或CxCa的患者的总RNA中检出。在克隆和测序以后,通过测序可以鉴别各个剪接连接点。
序列表
<110> Deutsches Krebsforschungszentrum
<120> 在不同的宫颈病变中的HR-HPV的诊断转录物和剪接模式
<130> DK10050PC
<160> 35
<170> PatentIn 3.3版
<210> 1
<211> 24
<212> DNA
<213> HPV18
<400> 1
tgatccagaa ggacatggtc caga 24
<210> 2
<211> 24
<212> DNA
<213> HPV33
<400> 2
cgatcctgaa ggacgtggtg caaa 24
<210> 3
<211> 24
<212> DNA
<213> HPV35
<400> 3
tgatcctgca ggacgtggtg caga 24
<210> 4
<211> 11
<212> DNA
<213> HPV18
<400> 4
tgatccagaa g 11
<210> 5
<211> 11
<212> DNA
<213> HPV33
<400> 5
cgatcctgaa g 11
<210> 6
<211> 11
<212> DNA
<213> HPV35
<400> 6
tgatcctgca g 11
<210> 7
<211> 13
<212> DNA
<213> HPV18
<400> 7
gacatggtcc aga 13
<210> 8
<211> 13
<212> DNA
<213> HPV33
<400> 8
gacgtggtgc aaa 13
<210> 9
<211> 13
<212> DNA
<213> HPV35
<400> 9
gacgtggtgc aga 13
<210> 10
<211> 10
<212> DNA
<213> HPV18
<400> 10
agaaggacat 10
<210> 11
<211> 10
<212> DNA
<213> HPV33
<400> 11
tgaaggacgt 10
<210> 12
<211> 10
<212> DNA
<213> HPV35
<400> 12
tgcaggacgt 10
<210> 13
<211> 7857
<212> DNA
<213> HPV18
<400> 13
attaatactt ttaacaattg tagtatataa aaaagggagt aaccgaaaac ggtcgggacc 60
gaaaacggtg tatataaaag atgtgagaaa cacaccacaa tactatggcg cgctttgagg 120
atccaacacg gcgaccctac aagctacctg atctgtgcac ggaactgaac acttcactgc 180
aagacataga aataacctgt gtatattgca agacagtatt ggaacttaca gaggtatttg 240
aatttgcatt taaagattta tttgtggtgt atagagacag tataccccat gctgcatgcc 300
ataaatgtat agatttttat tctagaatta gagaattaag acattattca gactctgtgt 360
atggagacac attggaaaaa ctaactaaca ctgggttata caatttatta ataaggtgcc 420
tgcggtgcca gaaaccgttg aatccagcag aaaaacttag acaccttaat gaaaaacgac 480
gatttcacaa catagctggg cactatagag gccagtgcca ttcgtgctgc aaccgagcac 540
gacaggaacg actccaacga cgcagagaaa cacaagtata atattaagta tgcatggacc 600
taaggcaaca ttgcaagaca ttgtattgca tttagagccc caaaatgaaa ttccggttga 660
ccttctatgt cacgagcaat taagcgactc agaggaagaa aacgatgaaa tagatggagt 720
taatcatcaa catttaccag cccgacgagc cgaaccacaa cgtcacacaa tgttgtgtat 780
gtgttgtaag tgtgaagcca gaattgagct agtagtagaa agctcagcag acgaccttcg 840
agcattccag cagctgtttc tgaacaccct gtcctttgtg tgtccgtggt gtgcatccca 900
gcagtaagca acaatggctg atccagaagg tacagacggg gagggcacgg gttgtaacgg 960
ctggttttat gtacaagcta ttgtagacaa aaaaacagga gatgtaatat cagatgacga 1020
ggacgaaaat gcaacagaca cagggtcgga tatggtagat tttattgata cacaaggaac 1080
attttgtgaa caggcagagc tagagacagc acaggcattg ttccatgcgc aggaggtcca 1140
caatgatgca caagtgttgc atgttttaaa acgaaagttt gcaggaggca gcacagaaaa 1200
cagtccatta ggggagcggc tggaggtgga tacagagtta agtccacggt tacaagaaat 1260
atctttaaat agtgggcaga aaaaggcaaa aaggcggctg tttacaatat cagatagtgg 1320
ctatggctgt tctgaagtgg aagcaacaca gattcaggta actacaaatg gcgaacatgg 1380
cggcaatgta tgtagtggcg gcagtacgga ggctatagac aacgggggca cagagggcaa 1440
caacagcagt gtagacggta caagtgacaa tagcaatata gaaaatgtaa atccacaatg 1500
taccatagca caattaaaag acttgttaaa agtaaacaat aaacaaggag ctatgttagc 1560
agtatttaaa gacacatatg ggctatcatt tacagattta gttagaaatt ttaaaagtga 1620
taaaaccacg tgtacagatt gggttacagc tatatttgga gtaaacccaa caatagcaga 1680
aggatttaaa acactaatac agccatttat attatatgcc catattcaat gtctagactg 1740
taaatgggga gtattaatat tagccctgtt gcgttacaaa tgtggtaaga gtagactaac 1800
agttgctaaa ggtttaagta cgttgttaca cgtacctgaa acttgtatgt taattcaacc 1860
accaaaattg cgaagtagtg ttgcagcact atattggtat agaacaggaa tatcaaatat 1920
tagtgaagta atgggagaca cacctgagtg gatacaaaga cttactatta tacaacatgg 1980
aatagatgat agcaattttg atttgtcaga aatggtacaa tgggcatttg ataatgagct 2040
gacagatgaa agcgatatgg catttgaata tgccttatta gcagacagca acagcaatgc 2100
agctgccttt ttaaaaagca attgccaagc taaatattta aaagattgtg ccacaatgtg 2160
caaacattat aggcgagccc aaaaacgaca aatgaatatg tcacagtgga tacgatttag 2220
atgttcaaaa atagatgaag ggggagattg gagaccaata gtgcaattcc tgcgatacca 2280
acaaatagag tttataacat ttttaggagc cttaaaatca tttttaaaag gaacccccaa 2340
aaaaaattgt ttagtatttt gtggaccagc aaatacagga aaatcatatt ttggaatgag 2400
ttttatacac tttatacaag gagcagtaat atcatttgtg aattccacta gtcatttttg 2460
gttggaaccg ttaacagata ctaaggtggc catgttagat gatgcaacga ccacgtgttg 2520
gacatacttt gatacctata tgagaaatgc gttagatggc aatccaataa gtattgatag 2580
aaagcacaaa ccattaatac aactaaaatg tcctccaata ctactaacca caaatataca 2640
tccagcaaag gataatagat ggccatattt agaaagtaga ataacagtat ttgaatttcc 2700
aaatgcattt ccatttgata aaaatggcaa tccagtatat gaaataaatg acaaaaattg 2760
gaaatgtttt tttgaaagga catggtccag attagatttg cacgaggaag aggaagatgc 2820
agacaccgaa ggaaaccctt tcggaacgtt taagttgcgt gcaggacaaa atcatagacc 2880
actatgaaaa tgacagtaaa gacatagaca gccaaataca gtattggcaa ctaatacgtt 2940
gggaaaatgc aatattcttt gcagcaaggg aacatggcat acagacatta aaccaccagg 3000
tggtgccagc ctataacatt tcaaaaagta aagcacataa agctattgaa ctgcaaatgg 3060
ccctacaagg ccttgcacaa agtcgataca aaaccgagga ttggacactg caagacacat 3120
gcgaggaact atggaataca gaacctactc actgctttaa aaaaggtggc caaacagtac 3180
aagtatattt tgatggcaac aaagacaatt gtatgaccta tgtagcatgg gacagtgtgt 3240
attatatgac tgatgcagga acatgggaca aaaccgctac ctgtgtaagt cacaggggat 3300
tgtattatgt aaaggaaggg tacaacacgt tttatataga atttaaaagt gaatgtgaaa 3360
aatatgggaa cacaggtacg tgggaagtac attttgggaa taatgtaatt gattgtaatg 3420
actctatgtg cagtaccagt gacgacacgg tatccgctac tcagcttgtt aaacagctac 3480
agcacacccc ctcaccgtat tccagcaccg tgtccgtggg caccgcaaag acctacggcc 3540
agacgtcggc tgctacacga cctggacact gtggactcgc ggagaagcag cattgtggac 3600
ctgtcaaccc acttctcggt gcagctacac ctacaggcaa caacaaaaga cggaaactct 3660
gtagtggtaa cactacgcct ataatacatt taaaaggtga cagaaacagt ttaaaatgtt 3720
tacggtacag attgcgaaaa catagcgacc actatagaga tatatcatcc acctggcatt 3780
ggacaggtgc aggcaatgaa aaaacaggaa tactgactgt aacataccat agtgaaacac 3840
aaagaacaaa atttttaaat actgttgcaa ttccagatag tgtacaaata ttggtgggat 3900
acatgacaat gtaatacata tgctgtagta ccaatatgtt atcacttatt tttttatttt 3960
gcttttgtgt atgcatgtat gtgtgctgcc atgtcccgct tttgccatct gtctgtatgt 4020
gtgcgtatgc atgggtattg gtatttgtgt atattgtggt aataacgtcc cctgccacag 4080
cattcacagt atatgtattt tgttttttat tgcccatgtt actattgcat atacatgcta 4140
tattgtcttt acagtaattg tataggttgt tttatacagt gtattgtaca ttgtatattt 4200
tgttttatac cttttatgct ttttgtattt ttgtaataaa agtatggtat cccaccgtgc 4260
cgcacgacgc aaacgggctt cggtaactga cttatataaa acatgtaaac aatctggtac 4320
atgtccacct gatgttgttc ctaaggtgga gggcaccacg ttagcagata aaatattgca 4380
atggtcaagc cttggtatat ttttgggtgg acttggcata ggtactggca gtggtacagg 4440
gggtcgtaca gggtacattc cattgggtgg gcgttccaat acagtggtgg atgttggtcc 4500
tacacgtccc ccagtggtta ttgaacctgt gggccccaca gacccatcta ttgttacatt 4560
aatagaggac tccagtgtgg ttacatcagg tgcacctagg cctacgttta ctggcacgtc 4620
tgggtttgat ataacatctg cgggtacaac tacacctgcg gttttggata tcacaccttc 4680
gtctacctct gtgtctattt ccacaaccaa ttttaccaat cctgcatttt ctgatccgtc 4740
cattattgaa gttccacaaa ctggggaggt ggcaggtaat gtatttgttg gtacccctac 4800
atctggaaca catgggtatg aggaaatacc tttacaaaca tttgcttctt ctggtacggg 4860
ggaggaaccc attagtagta ccccattgcc tactgtgcgg cgtgtagcag gtccccgcct 4920
ttacagtagg gcctaccaac aagtgtcagt ggctaaccct gagtttctta cacgtccatc 4980
ctctttaatt acatatgaca acccggcctt tgagcctgtg gacactacat taacatttga 5040
tcctcgtagt gatgttcctg attcagattt tatggatatt atccgtctac ataggcctgc 5100
tttaacatcc aggcgtggga ctgttcgctt tagtagatta ggtcaacggg caactatgtt 5160
tacccgcagc ggtacacaaa taggtgctag ggttcacttt tatcatgata taagtcctat 5220
tgcaccttcc ccagaatata ttgaactgca gcctttagta tctgccacgg aggacaatga 5280
cttgtttgat atatatgcag atgacatgga ccctgcagtg cctgtaccat cgcgttctac 5340
tacctccttt gcatttttta aatattcgcc cactatatct tctgcctctt cctatagtaa 5400
tgtaacggtc cctttaacct cctcttggga tgtgcctgta tacacgggtc ctgatattac 5460
attaccatct actacctctg tatggcccat tgtatcaccc acggcccctg cctctacaca 5520
gtatattggt atacatggta cacattatta tttgtggcca ttatattatt ttattcctaa 5580
gaaacgtaaa cgtgttccct atttttttgc agatggcttt gtggcggcct agtgacaata 5640
ccgtatatct tccacctcct tctgtggcaa gagttgtaaa taccgatgat tatgtgactc 5700
ccacaagcat attttatcat gctggcagct ctagattatt aactgttggt aatccatatt 5760
ttagggttcc tgcaggtggt ggcaataagc aggatattcc taaggtttct gcataccaat 5820
atagagtatt tagggtgcag ttacctgacc caaataaatt tggtttacct gatactagta 5880
tttataatcc tgaaacacaa cgtttagtgt gggcctgtgc tggagtggaa attggccgtg 5940
gtcagccttt aggtgttggc cttagtgggc atccatttta taataaatta gatgacactg 6000
aaagttccca tgccgccacg tctaatgttt ctgaggacgt tagggacaat gtgtctgtag 6060
attataagca gacacagtta tgtattttgg gctgtgcccc tgctattggg gaacactggg 6120
ctaaaggcac tgcttgtaaa tcgcgtcctt tatcacaggg cgattgcccc cctttagaac 6180
ttaaaaacac agttttggaa gatggtgata tggtagatac tggatatggt gccatggact 6240
ttagtacatt gcaagatact aaatgtgagg taccattgga tatttgtcag tctatttgta 6300
aatatcctga ttatttacaa atgtctgcag atccttatgg ggattccatg tttttttgct 6360
tacggcgtga gcagcttttt gctaggcatt tttggaatag agcaggtact atgggtgaca 6420
ctgtgcctca atccttatat attaaaggca caggtatgcc tgcttcacct ggcagctgtg 6480
tgtattctcc ctctccaagt ggctctattg ttacctctga ctcccagttg tttaataaac 6540
catattggtt acataaggca cagggtcata acaatggtgt ttgctggcat aatcaattat 6600
ttgttactgt ggtagatacc actcccagta ccaatttaac aatatgtgct tctacacagt 6660
ctcctgtacc tgggcaatat gatgctacca aatttaagca gtatagcaga catgttgagg 6720
aatatgattt gcagtttatt tttcagttgt gtactattac tttaactgca gatgttatgt 6780
cctatattca tagtatgaat agcagtattt tagaggattg gaactttggt gttccccccc 6840
ccccaactac tagtttggtg gatacatatc gttttgtaca atctgttgct attacctgtc 6900
aaaaggatgc tgcaccggct gaaaataagg atccctatga taagttaaag ttttggaatg 6960
tggatttaaa ggaaaagttt tctttagact tagatcaata tccccttgga cgtaaatttt 7020
tggttcaggc tggattgcgt cgcaagccca ccataggccc tcgcaaacgt tctgctccat 7080
ctgccactac gtcttctaaa cctgccaagc gtgtgcgtgt acgtgccagg aagtaatatg 7140
tgtgtgtgta tatatatata catctattgt tgtgtttgta tgtcctgtgt ttgtgtttgt 7200
tgtatgattg cattgtatgg tatgtatggt tgttgttgta tgttgtatgt tactatattt 7260
gttggtatgt ggcattaaat aaaatatgtt ttgtggttct gtgtgttatg tggttgcgcc 7320
ctagtgagta acaactgtat ttgtgtttgt ggtatgggtg ttgcttgttg ggctatatat 7380
tgtcctgtat ttcaagttat aaaactgcac accttacagc atccatttta tcctacaatc 7440
ctccattttg ctgtgcaacc gatttcggtt gcctttggct tatgtctgtg gttttctgca 7500
caatacagta cgctggcact attgcaaact ttaatctttt gggcactgct cctacatatt 7560
ttgaacaatt ggcgcgcctc tttggcgcat ataaggcgca cctggtatta gtcattttcc 7620
tgtccaggtg cgctacaaca attgcttgca taactatatc cactccctaa gtaataaaac 7680
tgcttttagg cacatatttt agtttgtttt tacttaagct aattgcatac ttggcttgta 7740
caactacttt catgtccaac attctgtcta cccttaacat gaactataat atgactaagc 7800
tgtgcataca tagtttatgc aaccgaaata ggttgggcag cacatactat acttttc 7857
<210> 14
<211> 7909
<212> DNA
<213> HPV33
<400> 14
gtaaactata atgccaagtt ttaaaaaagt agggtgtaac cgaaagcggt tcaaccgaaa 60
acggtgcata tataaagcaa acattttgca gtaaggtact gcacgactat gtttcaagac 120
actgaggaaa aaccacgaac attgcatgat ttgtgccaag cattggagac aactatacac 180
aacattgaac tacagtgcgt ggaatgcaaa aaacctttgc aacgatctga ggtatatgat 240
tttgcatttg cagatttaac agttgtatat agagagggaa atccatttgg aatatgtaaa 300
ctgtgtttgc ggttcttatc taaaattagt gaatatagac attataatta ttctgtatat 360
ggaaatacat tagaacaaac agttaaaaaa cctttaaatg aaatattaat taggtgtatt 420
atatgtcaaa gacctttgtg tcctcaagaa aaaaaacgac atgtggattt aaacaaacga 480
tttcataata tttcgggtcg ttgggcaggg cgctgtgcgg cgtgttggag gtcccgacgt 540
agagaaactg cactgtgacg tgtaaaaacg ccatgagagg acacaagcca acgttaaagg 600
aatatgtttt agatttatat cctgaaccaa ctgacctata ctgctatgag caattaagtg 660
acagctcaga tgaggatgaa ggcttggacc ggccagatgg acaagcacaa ccagccacag 720
ctgattacta cattgtaacc tgttgtcaca cttgtaacac cacagttcgt ttatgtgtca 780
acagtacagc aagtgaccta cgaaccatac agcaactact tatgggcaca gtgaatattg 840
tgtgccctac ctgtgcacaa caataaacat catctacaat ggccgatcct gaaggtacaa 900
atggggctgg gatggggtgt actggttggt ttgaggtaga agcagtcata gagagaagaa 960
caggagataa tatttcagaa gatgaggatg aaacagcaga tgacagtggc acggatttac 1020
tagagtttat agatgattct atggaaaata gtatacaggc agacacagag gcagcccggg 1080
cattgtttaa tatacaggaa ggggaggatg atttaaatgc tgtgtgtgca ctaaaacgaa 1140
agtttgccgc atgttcacaa agtgctgcgg aggacgttgt tgatcgtgct gcaaacccgt 1200
gtagaacgtc tattaataaa aataaagaat gcacatacag aaaacgaaaa atagatgagc 1260
tagaagacag cggatatggc aatactgaag tggaaactca gcagatggta caacaggtag 1320
aaagtcaaaa tggcgacaca aacttaaatg acttagaatc tagtggggtg ggggatgatt 1380
cagaagtaag ctgtgagaca aatgtagata gctgtgaaaa tgttacgttg caggaaatta 1440
gtaatgttct acatagtagt aatacaaaag caaatatatt atataaattt aaagaggcct 1500
atggaataag ttttatggaa ttagtaagac catttaaaag tgataaaaca agctgtacag 1560
attggtgtat aacaggatat ggaattagtc catcagtagc agaaagttta aaagtattaa 1620
ttaaacagca tagtttgtat actcatttac aatgtttaac ttgcgataga ggaataataa 1680
tattattgtt aattagattt aggtgtagca aaaacaggtt aacagtagca aaactaatga 1740
gtaatttatt atcaatacct gaaacatgta tggttataga gccaccaaaa ttacggagcc 1800
aaacatgtgc attgtattgg tttagaacag caatgtcaaa cattagtgat gtacaaggta 1860
caacacctga atggatagat agactaactg ttttacaaca tagctttaat gataatatat 1920
ttgatttaag tgaaatggta cagtgggcat atgataacga gttaacggac gatagtgaca 1980
ttgcatatta ttatgcacaa cttgcagatt caaatagtaa tgctgctgca tttttaaaaa 2040
gtaactcaca agcaaaaata gtaaaggact gtggaataat gtgtagacat tataaaaaag 2100
cagaaaaacg taaaatgtca ataggacaat ggatacaaag tagatgtgaa aaaacaaatg 2160
atggaggaaa ttggagacca atagtacagt tgttaagata tcaaaacatt gaatttacag 2220
catttttagg tgcatttaaa aagtttttaa aaggtatacc aaaaaaaagc tgtatgctaa 2280
tttgtggacc agcaaataca ggaaagtcat attttggaat gagtttaata cagtttttaa 2340
aagggtgtgt tatatcatgt gtaaattcta aaagtcactt ttggttgcag ccattatcag 2400
atgcaaaaat aggaatgata gatgatgtaa cgccaataag ttggacatat atagatgatt 2460
acatgagaaa tgcgttagat ggaaatgaaa tttcaataga tgtgaaacat agggcattag 2520
tgcaattaaa atgtccacca ctgcttctta cctcaaatac aaatgcaggc acagactcta 2580
gatggccata tttacatagt agattaacag tatttgaatt taaaaatcca ttcccatttg 2640
atgaaaatgg taacccagtg tatgcaataa atgatgaaaa ttggaaatcc tttttctcaa 2700
ggacgtggtg caaattagat ttaatagagg aagaggacaa ggaaaaccat ggaggaaata 2760
tcagcacgtt taaatgcagt gcaggagaaa atactagatc tttacgaagc tgataaaact 2820
gatttaccat cacaaattga acattggaaa ctgatacgca tggagtgtgc tttattgtat 2880
acagccaaac aaatgggatt ttcacattta tgccaccagg tggtgccttc tttgttagca 2940
tcaaagacca aagcatttca agtaattgaa ctacaaatgg cattagagac attaagtaaa 3000
tcacagtata gtacaagcca atggacattg caacaaacaa gcttagaggt gtggctttgt 3060
gaaccaccaa aatgttttaa aaaacaagga gaaacagtaa ctgtgcaata tgacaatgac 3120
aaaaaaaata caatggatta tacaaactgg ggtgaaatat atattataga ggaagataca 3180
tgtactatgg ttacagggaa agtagattat ataggtatgt attatataca taactgtgaa 3240
aaggtatatt ttaaatattt taaagaggat gctgcaaagt attctaaaac acaaatgtgg 3300
gaagtacatg tgggtggtca ggtaattgtt tgtcctacgt ctatatctag caaccaaata 3360
tccactactg aaactgctga catacagaca gacaacgata accgaccacc acaagcagcg 3420
gccaaacgac gacgacctgc agacaccaca gacaccgccc agccccttac aaagctgttc 3480
tgtgcagacc ccgccttgga caatagaaca gcacgtactg caactaactg cacaaacaag 3540
cagcggactg tgtgtagttc taacgttgca cctatagtgc atttaaaagg tgaatcaaat 3600
agtttaaaat gtttaagata cagattaaaa ccttataaag agttgtatag ttctatgtca 3660
tccacctggc attggaccag tgacaacaaa aatagtaaaa atggaattgt aactgtaaca 3720
tttgtaactg aacagcaaca acaaatgttt ttaggtaccg taaaaatacc acctactgtg 3780
caaataagta ctggatttat gacattataa gtgtacatca caagccaata tgtgctgcta 3840
attgtatata accatgatat ttgtttttgt attatgtttt atattgtttt tatgcttatc 3900
cttattatta cgtcctttaa tactttccat ttctacctat gcttggttgc tggtgttggt 3960
attgctgctt tgggtgtttg tgggatctcc tttaaaaatt tttttttgct atttgttgtt 4020
tttatattta ccaatgatgt gtattaattt tcatgcacag catatgacac aacaagagta 4080
atgtatatac atgtatatat tgtttgtata tatgtgcaca tggtggtgtt ttaacattgt 4140
tgttgttatt ttagtttttt tttttttgta ttactaataa atacctttat attttagcag 4200
tgtattatta tgagacacaa acgatctaca aggcgcaagc gtgcatctgc aacacaacta 4260
taccaaacat gcaaggccac aggcacctgc ccacccgatg ttattcctaa agtggaagga 4320
agtaccatag cagatcaaat tcttaaatat ggcagtttag gggttttttt tggtggttta 4380
ggtattggca caggctctgg ttcaggtgga aggactggct atgtacctat tggtactgac 4440
ccacctacag ctgcaatccc cttgcagcct atacgtcctc cggttactgt agacactgtt 4500
ggacctttag actcgtctat agtgtcatta atagaagaaa caagttttat agaggcaggt 4560
gcaccagccc catctattcc tacaccatca ggttttgatg ttactacatc tgcagatact 4620
acacctgcaa ttattaatgt ttcatctgtt ggggagtcat ctattcaaac tatttctaca 4680
catttaaatc ccacatttac tgaaccatct gtactacacc ctccagcgcc tgcagaagcc 4740
tctggacatt ttatattttc ttcccctact gttagcacac aaagttatga aaacatacca 4800
atggatacct ttgttgtttc cacagacagt agtaatgtaa catcaagcac gcccattcca 4860
gggtctcgcc ctgtggcacg ccttggttta tatagtcgca atacccaaca ggttaaggtt 4920
gttgaccctg cttttttaac atcgcctcat aaacttataa catatgataa tcctgcattt 4980
gaaagctttg accctgaaga cacattacaa tttcaacata gtgatatatc acctgctcct 5040
gatcctgact ttctagatat tattgcatta cataggcctg ctattacatc tcgtagacat 5100
actgtgcgtt ttagtagagt aggtcaaaaa gccacactta aaactcgcag tggtaaacaa 5160
attggagcta gaatacatta ttatcaggat ttaagtccta ttgtgccttt agaccacacc 5220
gtgccaaatg aacaatatga attacagcct ttacatgata cttctacatc gtcttatagt 5280
attaatgatg gtttgtatga tgtttatgct gacgatgtgg ataatgtaca caccccaatg 5340
caacactcat acagtacgtt tgcaacaaca cgtaccagca atgtgtctat acctttaaat 5400
acaggatttg atactcctgt tatgtctggc cctgatatac cttccccttt atttcccaca 5460
tctagcccat ttgttcctat ttcgcctttt tttccttttg acaccattgt tgtagacggt 5520
gctgactttg ttttacatcc tagttatttt attttacgtc gcaggcgtaa acgttttcca 5580
tattttttta cagatgtccg tgtggcggcc tagtgaggcc acagtgtacc tgcctcctgt 5640
acctgtatct aaagttgtca gcactgatga atatgtgtct cgcacaagca tttattatta 5700
tgctggtagt tccagacttc ttgctgttgg ccatccatat ttttctatta aaaatcctac 5760
taacgctaaa aaattattgg tacccaaagt atcaggcttg caatataggg tttttagggt 5820
ccgtttacca gatcctaata aatttggatt tcctgacacc tccttttata accctgatac 5880
acaacgatta gtatgggcat gtgtaggcct tgaaataggt agagggcagc cattaggcgt 5940
tggcataagt ggtcatcctt tattaaacaa atttgatgac actgaaaccg gtaacaagta 6000
tcctggacaa ccgggtgctg ataataggga atgtttatcc atggattata aacaaacaca 6060
gttatgttta cttggatgta agcctccaac aggggaacat tggggtaaag gtgttgcttg 6120
tactaatgca gcacctgcca atgattgtcc acctttagaa cttataaata ctattattga 6180
ggatggtgat atggtggaca caggatttgg ttgcatggat tttaaaacat tgcaggctaa 6240
taaaagtgat gttcctattg atatttgtgg cagtacatgc aaatatccag attatttaaa 6300
aatgactagt gagccttatg gtgatagttt atttttcttt cttcgacgtg aacaaatgtt 6360
tgtaagacac ttttttaata gggctggtac attaggagag gctgttcccg atgacctgta 6420
cattaaaggt tcaggaacta ctgcctctat tcaaagcagt gctttttttc ccactcctag 6480
tggatcaatg gttacttccg aatctcagtt atttaataag ccatattggc tacaacgtgc 6540
acaaggtcat aataatggta tttgttgggg caatcaggta tttgttactg tggtagatac 6600
cactcgcagt actaatatga ctttatgcac acaagtaact agtgacagta catataaaaa 6660
tgaaaatttt aaagaatata taagacatgt tgaagaatat gatctacagt ttgtttttca 6720
actatgcaaa gttaccttaa ctgcagaagt tatgacatat attcatgcta tgaatccaga 6780
tattttagaa gattggcaat ttggtttaac acctcctcca tctgctagtt tacaggatac 6840
ctataggttt gttacctctc aggctattac gtgtcaaaaa acagtacctc caaaggaaaa 6900
ggaagacccc ttaggtaaat atacattttg ggaagtggat ttaaaggaaa aattttcagc 6960
agatttagat cagtttcctt tgggacgcaa gtttttatta caggcaggtc ttaaagcaaa 7020
acctaaactt aaacgtgcag cccccacatc cacccgcaca tcgtctgcaa aacgcaaaaa 7080
ggttaaaaaa taacactttg tgtaattgtg ttatgttgtt gttttgttct gtctatgtac 7140
tttgtgttgt tgtgttgtgt tgttgtttgt tttttgtgta tgtgttacaa tgtatgttat 7200
gttgtatgtt actgtgtttg ttttatgtgt acttgtttgt gtgcatgttc tatgtacttg 7260
tcagtttcct gtttgtgtat atgttaataa aacattgtgt gtatttgtta aactatttgt 7320
atgtatgtta tgtatatggg tgtacctata tgagtaagga gttgtattgc ttgccctacc 7380
ctgcattgca atgtacctac ctttatttcc ctatatttgt agtacctaca tgtttagtat 7440
tgctttacct tttgacatac tagtgtccat attgtacaat ttcctccatt ttgtatgcct 7500
aaccgttttc ggttacttgg catacatacc ctatgacatt ggcagaacag ttaatccttt 7560
tctttcctgc actgtgtttg tctgtacttg ctgcattggc atacataccc tatgacattg 7620
gcagaacagt taatcctttt ctttcctgca ctgtgtttgt ctgtacttgc tgcattgact 7680
catatataca tgcagtgcaa ttgcaaaata cttaattgta ctaatagttt acacatgctt 7740
ttaggcacat atttttactt tactttcaaa ccttaagtgc agttttggct tacacaattg 7800
ctttgtatgc caaactatgc cttgtaaaag tgagtcacta cctgtttatt accaggtgtg 7860
gactaaccgt tttaggtcat attggtcatt tataatcttt tatataata 7909
<210> 15
<211> 7851
<212> DNA
<213> HPV35
<400> 15
ccctataaaa aaaacaggga gtgaccgaaa acggtcgtac cgaaaacggt tgccataaaa 60
gcagaagtgc acaaaaaagc agaagtggac agacattgta aggtgcggta tgtttcagga 120
cccagctgaa cgaccttaca aactgcatga tttgtgcaac gaggtagaag aaagcatcca 180
tgaaatttgt ttgaattgtg tatactgcaa acaagaatta cagcggagtg aggtatatga 240
ctttgcatgc tatgatttgt gtatagtata tagagaaggc cagccatatg gagtatgcat 300
gaaatgttta aaattttatt caaaaataag tgaatataga tggtatagat atagtgtgta 360
tggagaaacg ttagaaaaac aatgcaacaa acagttatgt catttattaa ttaggtgtat 420
tacatgtcaa aaaccgctgt gtccagttga aaagcaaaga catttagaag aaaaaaaacg 480
attccataac atcggtggac ggtggacagg tcggtgtatg tcctgttgga aaccaacacg 540
tagagaaacc gaggtgtaat catgcatgga gaaataacta cattgcaaga ctatgtttta 600
gatttggaac ccgaggcaac tgacctatac tgttatgagc aattgtgtga cagctcagag 660
gaggaggaag atactattga cggtccagct ggacaagcaa aaccagacac ctccaattat 720
aatattgtaa cgtcctgttg taaatgtgag gcgacactac gtctgtgtgt acagagcaca 780
cacattgaca tacgtaaatt ggaagattta ttaatgggca catttggaat agtgtgcccc 840
ggctgttcac agagagcata atctacaatg gctgatcctg caggtacaga tgaaggggag 900
gggacgggat gtaatggatg gttttttgta gaagcagtag ttagtagacg tacgggatcc 960
agtgtagagg acgaaaatga agatgactgt gacagggggg aggatatggt ggactttata 1020
aatgatacag atatattaaa catacaggca gaaacagaga cagcacaagc attatttcat 1080
gcacaggagg agcaaacaca caaagaggct gtacaggtcc taaaacgaaa gtatgctagt 1140
agtccactta gcagcgtgag cttatgtgtt aataataaca taagtccacg tttaaaagct 1200
atttgcattg aaaataaaaa tacagcagca aagcgacgat tatttgaact accagacagc 1260
ggttatggca attctgaagt ggaaatacac gagatacaac aggtagaggg gcatgataca 1320
gttgaacaat gtagtatggg cagtggggat agtataacct ctagtagcga tgaaagacat 1380
gatgagactc caacgcgaga cataatacaa atactaaaat gtagtaatgc aaacgcagct 1440
atgttggcta aatttaaaga actatttggt attagtttta cagaacttat tagaccattt 1500
aagagtgata aatccacatg tacagattgg tgtgtggccg catttggaat agccccaagt 1560
gtggcgaact ttaaacatat aacatatgta tacatataca atgtttatcg tgttcatggg 1620
gctatggtaa ttctagcatt attacgattt aaagtcgaaa aacgagaaca acaattgaaa 1680
actattgatg ctaaattgct atgtatttca gctgcaagta tgctaataca accaccaaaa 1740
ttacgtagta ccccagctgc gttatattgg tttaaaacag caatgtcaaa tattagtgag 1800
gttgatggag aaacaccaga atggattcaa agacaaacag tattacagca tagttttaat 1860
gatgcaatat ttgacctatc tgaaatggta caatgggcat atgacaatga ttttatagat 1920
gatagtgata tagcatataa atatgcacaa ttggcagaaa ctaatagtaa tgcatgtgct 1980
tttttaaaaa gtaattcgca agctaaaatt gtaaaagatt gtgcaacaat gtgtagacat 2040
tataaacgag ctgaaaaaag agaaatgaca atgtcacagt ggattaaaag gcgatgtgca 2100
caggtggacg atgacggtga ctggagggac atagtacgat ttttaagata tcaacaagta 2160
gattttgtgg catttttatc tgcactaaaa aattttttac atggtgtgcc taaaaaaaat 2220
tgcatactaa tatatggagc accaaacaca ggtaaatcat tatttggaat gagtctaatg 2280
catttcttac aaggagctat tatatcctat gtaaattcta aaagccattt ttggttgcag 2340
ccattatatg atgccaaaat agctatgtta gatgatgcta catcgccatg tggcatatat 2400
agaccaatat ttaagaaatg cactagatgg aaatcctata tttcatttag atgtaaagca 2460
ttaagcatag tgcatataat gcccaccttt acttattaca tcaatataaa tgcaggcaaa 2520
gatgacaggt ggccatactt acatagcagg gtagtggtct ttacatttca caatgaattc 2580
ccatttgata aaaatggaaa cccagagtat gggcttaatg ataaaaactg gaaatccttt 2640
ttctcaagga cgtggtgcag attaaatttg cacgaggaag aggtcaaaga aaatgatgga 2700
gacgctttcc cagcgtttaa gtgtgtgtca ggacaaaata ctagaacatt acgagactga 2760
tagcacatgt ttgtctgatc acatacagta ttggaaactg attcgtcttg aatgtgcagt 2820
attttataaa gcaagagaaa tgggaattaa aactcttaac caccaagtgg ttccaacgca 2880
ggccatttca aaagccaaag caatgcaagc aattgaactg caattaatgt tagagacatt 2940
aaatacaact gagtatagca cagaggactg gacactgcaa gaaacaagta ttgaactata 3000
tacaacagtt cctacaagat gtttaaaaaa agatgtttat actgtggaag cacaatttga 3060
tggtgataaa caaaatacta tgcattatac taattggaca catatatata tattagagga 3120
cagtatatgt actgttgtaa agggactggt aaattataaa ggtatttatt atgtgcatca 3180
gggtgtagaa acatattatg ttacttttag ggaagaggct aaaaagtatg gaaaaaaaaa 3240
tatatgggaa gtgcatgtgg gtggtcaggt aattgtttgt cctgaatctg tatttagcag 3300
cacagaacta tccactgctg aaattgctac acagctacac gcctacaaca ccaccgagac 3360
ccataccaaa gcctgctccg tgggcaccac agaaacccag aagacaaatc acaaacgact 3420
tcgagggggt accgagctcc cctacaaccc caccaagcga gtgcgactca gtgccgtgga 3480
cagtgttgac agaggggtct actctacatc tgactgcaca aacaaagacc ggtgtggtag 3540
ttgtagtaca actacaccta tagtacattt aaaaggtgat gcaaatacat taaagtgttc 3600
aagatataga ttgggtaaat ataaagcatt gtatcaagat gcttcatcta catggagatg 3660
gacatgtaca aacgataaaa aacaaatagc aattgtaaca ttaacttaca caacagaata 3720
tcaaagggat aaatttttaa ctacagtaaa aatacctaac acagttacag tgtctaaagg 3780
atatatgtct atatgataga ccttacagct tccagtactg tgttgctgtg ctttttgttg 3840
tgcttttgtg tgcttttgtg cttgtgtctg cttgtacgtt cgctattgct atctgtgtca 3900
ttatactcag cattaatatt actggtttta atactgtggg ttactgtagc aacaccacta 3960
cttgcttttg ttgtttcttg cttttgtata tacctatgga tgattaacgc tcatgcacaa 4020
tatttggcag tacagtaatt gtatacaaac attgtgtttg gtactgtgta acatgtgtgt 4080
atggtggttt tattttttgt tgttcattgt atattttgtt tttttactgt ttttaaacat 4140
ttttatttct gtgtttttaa taaattgatc acatggtata accatgcgac acaaaaggtc 4200
tacaaaacgt gttaaacgtg catctgcaac acaactatat cgtacttgca aagctgcagg 4260
aacttgtcca ccagatgtta tacctaaggt tgagggtaat actgttgctg atcaaatttt 4320
aaaatatggc agcatggctg tgttttttgg ggggttagga attggttctg gatctggcac 4380
aggtggaaga tctggatatg ttccactggg tacaacacct ccaacggctg ccacaaacat 4440
tcctatacga ccccctgtaa ctgtggaaag tataccatta gacacaattg gccctttaga 4500
ttcttctata gtgtcattag tagaggaaac tagttttatt gagtctggtg cccctgttgt 4560
tacaccaagg gtcccaccta caacaggttt tacaataacc acatctacag ataccacacc 4620
tgctatttta gatgtgacat ccataagtac acatgataat cctactttca ctgatccttc 4680
tgttttacac ccacccacgc ctgcagaaac ttcaggtcat tttgtacttt catcatcttc 4740
tattagtaca cataattatg aagaaatccc tatggatact tttattgttt ccacagacag 4800
caataatata actaatagca cgcctattcc agggtctcgc cctacgacac gcctaggatt 4860
atatagtaaa ggtacccagc aggttaaggt tgttgaccct gcctttatga cttctcctgc 4920
aaaacttatt acatatgata atcctgcata tgaaggcctt aaccctgata caaccttaca 4980
atttgagcat gaggatatta gcttagctcc ggatcctgac tttatggaca ttatagcttt 5040
acataggcct gcactaacat ctaggaaagg cactattaga tatagtagag taggtaataa 5100
acgtactatg catacacgaa gtggaaaagc tataggggca cgggtacatt attatcagga 5160
tttaagtagt attactgaag atatagaatt acaaccctta caacatgtac catcctcttt 5220
accacatacc actgtttcaa catcattaaa tgatggtatg tttgatattt atgctcctat 5280
agatactgag gaagatatta tattttcagc atcttctaac aatactttat atactacatc 5340
taacactgca tatgttccta gcaatactac tataccatta agtagtggct atgatattcc 5400
tataacagca gggccagaca ttgtatttaa ctctaatact attactaact ctgtactacc 5460
ggtacccaca ggtcctatat attctattat tgcagatggg ggtgactttt atttacaccc 5520
tagttattat ttattaaaac gacgtcgtaa agctatccca tatttttttg cagatgtctc 5580
tgtggcggtc taacgaagcc actgtctacc tgcctccagt gtcagtgtct aaggttgtta 5640
gcactgatga atatgtaaca cgcacaaaca tctactatca tgcaggcagt tctaggctat 5700
tagctgtggg tcacccatac tatgctatta aaaaacaaga ttctaataaa atagcagtac 5760
ccaaggtatc tggtttgcaa tacagagtat ttagagtaaa attaccagat cctaataagt 5820
ttggatttcc agacacatca ttttatgatc cctgcctcca gcgtttggtt tgggcctgta 5880
caggagttga agtaggtcgt ggtcagccat taggagtagg tattagtggt catcctttat 5940
taaataaatt ggatgatact gaaaatctta ataaatatgt tggtaactct ggtaactctg 6000
gtacagataa cagggaatgc atttctatgg attataaaca aacacaattg tgtttaatag 6060
gttgtaggcc tcctataggt gaacattggg gaaaaggcac accttgtaat gctaaccagg 6120
taaaagcagg agaatgtcct cctttggagt tactaaacac tgtactacaa gacggggaca 6180
tggtagacac aggatttggt gcaatggatt ttactacatt acaagctaat aaaagtgatg 6240
ttcccctaga tatatgcagt tccatttgca aatatcctga ttatctaaaa atggtttctg 6300
agccatatgg agatatgtta tttttttatt tacgtaggga gcaaatgttt gttagacatt 6360
tatttaatag ggctggaact gtaggtgaaa cagtacctgc agacctatat attaagggta 6420
ccactggcac attgcctagt actagttatt ttcctactcc tagtggctct atggtaacct 6480
ccgatgcaca aatatttaat aaaccatatt ggttgcaacg tgcacaaggc cataataatg 6540
gtatttgttg gagtaaccaa ttgtttgtta ctgtagttga tacaacccgt agtacaaata 6600
tgtctgtgtg ttctgctgtg tcttctagtg acagtacata taaaaatgac aattttaagg 6660
aatatttaag gcatggtgaa gaatatgatt tacagtttat ttttcagtta tgtaaaataa 6720
cactaacagc agatgttatg acatatattc atagtatgaa cccgtccatt ttagaggatt 6780
ggaattttgg ccttacacca ccgccttctg gtaccttaga ggacacatat cgctatgtaa 6840
catcacaggc tgtaacttgt caaaaaccca gtgcaccaaa acctaaagat gatccattaa 6900
aaaattatac tttttgggag gttgatttaa aggaaaagtt ttctgcagac ttagatcagt 6960
ttccgttggg ccgtaaattt ttgttacaag caggactaaa ggccaggcct aattttagat 7020
taggcaggcg tgcagctcca gcatctacat ctaaaaaatc ttctactaaa cgtagaaaag 7080
taaaaagtta atgtgtaaat gtgtatgcat gtatactgtg tgttatgtgt tgtagtgctt 7140
gtatatatat tatgtgttgt ggtgcctgtt tgtgttgtac atggcgtgta aatgtgtgta 7200
taatattgtg caatgtgttg tacgtgggtg tttttgtact tagtgtgtag tagttcagta 7260
gccataaagt gatgtgtgtg tttataatta acactgtatt gttgtatgac tatggtgcac 7320
cgatatgagc ttacataatt acatgacagc tatattgtgt atataaataa tctacctcca 7380
ttttgtgtgt tagtgtcctt tacattacct ttcaaccgat ttcggttgct gttggtaagc 7440
tttatatgtt ttttacaaaa acattcctac ctcagcagaa cacttaatcc ttgtgttcct 7500
gatatatatt gtttgccaac tttatattgg cttttgccaa tctttaaact tgattcatct 7560
tgcagtatta gtcatttttc atacttgtgg tccacccaca cttgtaacac ttgtaacagt 7620
gcttttaggc acatattttt tgcatttcta aagggcttta attgcacacc ttggctttac 7680
atattatgtg tgtttgccaa caccacccta cacatcctgc caactttaag ttaaaacatg 7740
catgtaaaac attactcact gtattacaca ttgttatatg cacacaggtg tgtccaaccg 7800
atttggatta cagttttata agcatttctt tttattatag ttagtaacaa t 7851
<210> 16
<211> 2602
<212> DNA
<213> 智人
<400> 16
gagccgcggc taaggaacgc gggccgccca cccgctcccg gtgcagcggc ctccgcgccg 60
ggttttggcg cctcccgcgg gcgcccccct cctcacggcg agcgctgcca cgtcagacga 120
agggcgcagc gagcgtcctg atccttccgc ccggacgctc aggacagcgg cccgctgctc 180
ataagactcg gccttagaac cccagtatca gcagaaggac attttaggac gggacttggg 240
tgactctagg gcactggttt tctttccaga gagcggaaca ggcgaggaaa agtagtccct 300
tctcggcgat tctgcggagg gatctccgtg gggcggtgaa cgccgatgat tatataagga 360
cgcgccgggt gtggcacagc tagttccgtc gcagccggga tttgggtcgc agttcttgtt 420
tgtggatcgc tgtgatcgtc acttgacaat gcagatcttc gtgaagactc tgactggtaa 480
gaccatcacc ctcgaggttg agcccagtga caccatcgag aatgtcaagg caaagatcca 540
agataaggaa ggcatccctc ctgaccagca gaggctgatc tttgctggaa aacagctgga 600
agatgggcgc accctgtctg actacaacat ccagaaagag tccaccctgc acctggtgct 660
ccgtctcaga ggtgggatgc aaatcttcgt gaagacactc actggcaaga ccatcaccct 720
tgaggtcgag cccagtgaca ccatcgagaa cgtcaaagca aagatccagg acaaggaagg 780
cattcctcct gaccagcaga ggttgatctt tgccggaaag cagctggaag atgggcgcac 840
cctgtctgac tacaacatcc agaaagagtc taccctgcac ctggtgctcc gtctcagagg 900
tgggatgcag atcttcgtga agaccctgac tggtaagacc atcaccctcg aggtggagcc 960
cagtgacacc atcgagaatg tcaaggcaaa gatccaagat aaggaaggca ttccttctga 1020
tcagcagagg ttgatctttg ccggaaaaca gctggaagat ggtcgtaccc tgtctgacta 1080
caacatccag aaagagtcca ccttgcacct ggtactccgt ctcagaggtg ggatgcaaat 1140
cttcgtgaag acactcactg gcaagaccat cacccttgag gtcgagccca gtgacactat 1200
cgagaacgtc aaagcaaaga tccaagacaa ggaaggcatt cctcctgacc agcagaggtt 1260
gatctttgcc ggaaagcagc tggaagatgg gcgcaccctg tctgactaca acatccagaa 1320
agagtctacc ctgcacctgg tgctccgtct cagaggtggg atgcagatct tcgtgaagac 1380
cctgactggt aagaccatca ctctcgaagt ggagccgagt gacaccattg agaatgtcaa 1440
ggcaaagatc caagacaagg aaggcatccc tcctgaccag cagaggttga tctttgccgg 1500
aaaacagctg gaagatggtc gtaccctgtc tgactacaac atccagaaag agtccacctt 1560
gcacctggtg ctccgtctca gaggtgggat gcagatcttc gtgaagaccc tgactggtaa 1620
gaccatcact ctcgaggtgg agccgagtga caccattgag aatgtcaagg caaagatcca 1680
agacaaggaa ggcatccctc ctgaccagca gaggttgatc tttgctggga aacagctgga 1740
agatggacgc accctgtctg actacaacat ccagaaagag tccaccctgc acctggtgct 1800
ccgtcttaga ggtgggatgc agatcttcgt gaagaccctg actggtaaga ccatcactct 1860
cgaagtggag ccgagtgaca ccattgagaa tgtcaaggca aagatccaag acaaggaagg 1920
catccctcct gaccagcaga ggttgatctt tgctgggaaa cagctggaag atggacgcac 1980
cctgtctgac tacaacatcc agaaagagtc caccctgcac ctggtgctcc gtcttagagg 2040
tgggatgcag atcttcgtga agaccctgac tggtaagacc atcactctcg aagtggagcc 2100
gagtgacacc attgagaatg tcaaggcaaa gatccaagac aaggaaggca tccctcctga 2160
ccagcagagg ttgatctttg ctgggaaaca gctggaagat ggacgcaccc tgtctgacta 2220
caacatccag aaagagtcca ccctgcacct ggtgctccgt ctcagaggtg ggatgcaaat 2280
cttcgtgaag accctgactg gtaagaccat caccctcgag gtggagccca gtgacaccat 2340
cgagaatgtc aaggcaaaga tccaagataa ggaaggcatc cctcctgatc agcagaggtt 2400
gatctttgct gggaaacagc tggaagatgg acgcaccctg tctgactaca acatccagaa 2460
agagtccact ctgcacttgg tcctgcgctt gagggggggt gtctaagttt ccccttttaa 2520
ggtttcaaca aatttcattg cactttcctt tcaataaagt tgttgcattc ccaaaaaaaa 2580
aaaaaaaaaa aaaaaaaaaa aa 2602
<210> 17
<211> 685
<212> PRT
<213> 智人
<400> 17
Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu
1 5 10 15
Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp
20 25 30
Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys
35 40 45
Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu
50 55 60
Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly Met Gln Ile Phe
65 70 75 80
Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu Val Glu Pro Ser
85 90 95
Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp Lys Glu Gly Ile
100 105 110
Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys Gln Leu Glu Asp
115 120 125
Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu Ser Thr Leu His
130 135 140
Leu Val Leu Arg Leu Arg Gly Gly Met Gln Ile Phe Val Lys Thr Leu
145 150 155 160
Thr Gly Lys Thr Ile Thr Leu Glu Val Glu Pro Ser Asp Thr Ile Glu
165 170 175
Asn Val Lys Ala Lys Ile Gln Asp Lys Glu Gly Ile Pro Ser Asp Gln
180 185 190
Gln Arg Leu Ile Phe Ala Gly Lys Gln Leu Glu Asp Gly Arg Thr Leu
195 200 205
Ser Asp Tyr Asn Ile Gln Lys Glu Ser Thr Leu His Leu Val Leu Arg
210 215 220
Leu Arg Gly Gly Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr
225 230 235 240
Ile Thr Leu Glu Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala
245 250 255
Lys Ile Gln Asp Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile
260 265 270
Phe Ala Gly Lys Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn
275 280 285
Ile Gln Lys Glu Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly
290 295 300
Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu
305 310 315 320
Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp
325 330 335
Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys
340 345 350
Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu
355 360 365
Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly Met Gln Ile Phe
370 375 380
Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu Val Glu Pro Ser
385 390 395 400
Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp Lys Glu Gly Ile
405 410 415
Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys Gln Leu Glu Asp
420 425 430
Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu Ser Thr Leu His
435 440 445
Leu Val Leu Arg Leu Arg Gly Gly Met Gln Ile Phe Val Lys Thr Leu
450 455 460
Thr Gly Lys Thr Ile Thr Leu Glu Val Glu Pro Ser Asp Thr Ile Glu
465 470 475 480
Asn Val Lys Ala Lys Ile Gln Asp Lys Glu Gly Ile Pro Pro Asp Gln
485 490 495
Gln Arg Leu Ile Phe Ala Gly Lys Gln Leu Glu Asp Gly Arg Thr Leu
500 505 510
Ser Asp Tyr Asn Ile Gln Lys Glu Ser Thr Leu His Leu Val Leu Arg
515 520 525
Leu Arg Gly Gly Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr
530 535 540
Ile Thr Leu Glu Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala
545 550 555 560
Lys Ile Gln Asp Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile
565 570 575
Phe Ala Gly Lys Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn
580 585 590
Ile Gln Lys Glu Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly
595 600 605
Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu
610 615 620
Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp
625 630 635 640
Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys
645 650 655
Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu
660 665 670
Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly Val
675 680 685
<210> 18
<211> 1626
<212> DNA
<213> 智人
<400> 18
ctttgtggtt tggtctcagg gaagtagcag gcgccggttg agagaactac ggccctgtcg 60
gaaggtaacc tccggtgcaa acgaccatcg gcggcaggcg agcggtacgc ttggcgtccg 120
ggccttcctg ggcccgtctg aggaaacttg ctgctcgagg ccaggctgcc taggacctgt 180
cccttttttc tatactggct cccacatccg ggttttttct ccgggacggc ccttcggatg 240
cttgggccaa tgggaatcgc catttagggt gctccgccca ccgggtcgcg tagagcatcc 300
tggaagtcgt agtaaatctc tcgagagttc tctccgcacg cgggctggag aagcgggtcc 360
tacgcacgct ttgttgtcgc gctttgcctc cgtccttccc cctactcccg ccttacctga 420
cttccttttc ggaggaagat ccttgagcag ccgacgttgg gacaaaggat ttggagaaac 480
ccagggctaa agtcacgttt ttcctccttt aagacttacc tcaacacttc actccatggc 540
agttcccgag acccgcccta accacactat ttatatcaac aacctcaatg agaagatcaa 600
gaaggatgag ctaaaaaagt ccctgtacgc catcttctcc cagtttggcc agatcctgga 660
tatcctggta tcacggagcc tgaagatgag gggccaggcc tttgtcatct tcaaggaggt 720
cagcagcgcc accaacgccc tgcgctccat gcagggtttc cctttctatg acaaacctat 780
gcgtatccag tatgccaaga ccgactcaga tatcattgcc aagatgaaag gcaccttcgt 840
ggagcgggac cgcaagcggg agaagaggaa gcccaagagc caggagaccc cggccaccaa 900
gaaggctgtg caaggcgggg gagccacccc cgtggtgggg gctgtccagg ggcctgtccc 960
gggcatgccg ccgatgactc aggcgccccg cattatgcac cacatgccgg gccagccgcc 1020
ctacatgccg ccccctggta tgatcccccc gccaggcctt gcacctggcc agatcccacc 1080
aggggccatg cccccgcagc agcttatgcc aggacagatg ccccctgccc agcctctttc 1140
tgagaatcca ccgaatcaca tcttgttcct caccaacctg ccagaggaga ccaacgagct 1200
catgctgtcc atgcttttca atcagttccc tggcttcaag gaggtccgtc tggtacccgg 1260
gcggcatgac atcgccttcg tggagtttga caatgaggta caggcagggg cagctcgcga 1320
tgccctgcag ggctttaaga tcacgcagaa caacgccatg aagatctcct ttgccaagaa 1380
gtagcacctt ttccccccat gcctgcccct tcccctgttc tggggccacc cctttccccc 1440
ttggctcagc cccctgaagg taagtccccc cttgggggcc ttcttggagc cgtgtgtgag 1500
tgagtggtcg ccacacagca ttgtacccag agtctgtccc cagacattgc acctggcgct 1560
gttaggccgg aattaaagtg gctttttgag gtttggtttt tcacaaaaaa aaaaaaaaaa 1620
aaaaaa 1626
<210> 19
<211> 282
<212> PRT
<213> 智人
<400> 19
Met Ala Val Pro Glu Thr Arg Pro Asn His Thr Ile Tyr Ile Asn Asn
1 5 10 15
Leu Asn Glu Lys Ile Lys Lys Asp Glu Leu Lys Lys Ser Leu Tyr Ala
20 25 30
Ile Phe Ser Gln Phe Gly Gln Ile Leu Asp Ile Leu Val Ser Arg Ser
35 40 45
Leu Lys Met Arg Gly Gln Ala Phe Val Ile Phe Lys Glu Val Ser Ser
50 55 60
Ala Thr Asn Ala Leu Arg Ser Met Gln Gly Phe Pro Phe Tyr Asp Lys
65 70 75 80
Pro Met Arg Ile Gln Tyr Ala Lys Thr Asp Ser Asp Ile Ile Ala Lys
85 90 95
Met Lys Gly Thr Phe Val Glu Arg Asp Arg Lys Arg Glu Lys Arg Lys
100 105 110
Pro Lys Ser Gln Glu Thr Pro Ala Thr Lys Lys Ala Val Gln Gly Gly
115 120 125
Gly Ala Thr Pro Val Val Gly Ala Val Gln Gly Pro Val Pro Gly Met
130 135 140
Pro Pro Met Thr Gln Ala Pro Arg Ile Met His His Met Pro Gly Gln
145 150 155 160
Pro Pro Tyr Met Pro Pro Pro Gly Met Ile Pro Pro Pro Gly Leu Ala
165 170 175
Pro Gly Gln Ile Pro Pro Gly Ala Met Pro Pro Gln Gln Leu Met Pro
180 185 190
Gly Gln Met Pro Pro Ala Gln Pro Leu Ser Glu Asn Pro Pro Asn His
195 200 205
Ile Leu Phe Leu Thr Asn Leu Pro Glu Glu Thr Asn Glu Leu Met Leu
210 215 220
Ser Met Leu Phe Asn Gln Phe Pro Gly Phe Lys Glu Val Arg Leu Val
225 230 235 240
Pro Gly Arg His Asp Ile Ala Phe Val Glu Phe Asp Asn Glu Val Gln
245 250 255
Ala Gly Ala Ala Arg Asp Ala Leu Gln Gly Phe Lys Ile Thr Gln Asn
260 265 270
Asn Ala Met Lys Ile Ser Phe Ala Lys Lys
275 280
<210> 20
<211> 3774
<212> DNA
<213> 智人
<400> 20
ggctctggct gagaacatgg ccaatgacat tgatgagctc attggcattc ccttccccaa 60
ccacagcagt gaggtcctgt gcagcctcaa tgagcaacgg cacgatggcc tgctgtgtga 120
cgtgctcctg gtggtgcagg agcaggagta tcggacccac cgctccgtcc tggctgcctg 180
cagcaagtac ttcaagaagc ttttcacagc cggcacccta gccagccagc cctacgtcta 240
tgagatcgac tttgtccagc ctgaggctct ggctgctatc ctggagttcg cctacacctc 300
cacgctcacc atcaccgctg gcaatgtcaa gcacatcctc aacgcagcca ggatgctgga 360
gatccagtgc atcgtgaacg tgtgcctgga gatcatggag cctggggggg acggggggga 420
ggaggatgac aaggaggacg atgacgacga cgaagatgat gatgatgagg aggacgaaga 480
ggaggaggag gaagaggagg aggatgacga tgatgacacg gaggactttg ctgaccaaga 540
aaacttgcct gacccccagg acatcagctg ccaccaaagc ccttccaaga cagaccatct 600
cacagagaag gcctattcag acacccccag ggacttccct gactccttcc aggctggcag 660
tcctggccat ctgggggtga tccgggactt ctccatcgaa tctctgctaa gggagaacct 720
gtaccccaag gccaacatcc ccgacaggag accctccttg tctccattcg ccccggactt 780
ctttccacac ctctggccag gggacttcgg tgcctttgcc cagctgcctg agcagcccat 840
ggacagtggg ccactggatc tggtcatcaa gaatcggaag atcaaggagg aggagaagga 900
ggagctgccc ccacccccac cgccaccctt ccctaatgac ttcttcaagg acatgttccc 960
tgacctgccg ggggggcctc tgggacccat caaggcggag aacgactacg gtgcctatct 1020
caacttcctg agtgccaccc acctgggagg cctcttccca ccctggcccc tggtagaaga 1080
gcgcaagctg aagcccaagg cctctcagca gtgccccatc tgccacaaag tcatcatggg 1140
ggccgggaag ctgccgcggc acatgaggac ccataccggg gagaagccat acatgtgcac 1200
catctgcgag gtccgcttca ccaggcagga caagctgaaa atccacatgc ggaagcacac 1260
aggggagcgg ccctacctgt gcatccactg caacgccaag ttcgtgcaca actacgacct 1320
caagaaccac atgcgcatcc acacgggcgt gcggccctac cagtgcgagt tctgctacaa 1380
gagcttcacg cgctctgacc acctgcaccg ccacatcaag cgccagagct gccgcatggc 1440
acggccccga cgcggccgca agcctgctgc gtggagggcc gccagcctgc tcttcgggcc 1500
cggcggcccg gcccccgaca aggcggcctt cgtgatgccc cctgcgctgg gcgaggtggg 1560
cggccacctg ggcggcgcag ctgtgtgcct cccgggcccc agccccgcca agcacttcct 1620
ggcagcgccc aagggcgccc tgagcctgca agagctggag cggcagttcg aggagacaca 1680
gatgaagctg ttcgggcgcg cgcagctgga ggctgagagg aacgcggggg gcctcctggc 1740
cttcgcgctg gccgagaacg tggcggcggc gcggccctac ttcccgctgc ccgacccttg 1800
ggccgccggc ctggccggcc tccctgggct cgccggcctc aaccacgtgg cctccatgtc 1860
cgaagccaac aactaggctg gtccctgtcg gctccagccc accagccctc cagtccttct 1920
ccctccaggc ccactctacc ctaccccatg gatctgaact tttcatttta aaaacacaaa 1980
gggaaaatgg gaaaataata ataatactat cagtgatggc attttcccgg gctcctaaag 2040
cagctgcctc cttttgctgg tctgagacgg gcatcttttc ccaaaaggcc aggagcccgg 2100
gcctccctcc ctgtctctct ggctctcata tagaaacttg caccggccca tgccacaaag 2160
aactgggtgc ccaggggcac ttaggagctg ggtgagtcat gaggggtcag ggggtggttg 2220
gcctggtgcc cagccagcca cagcaggagg aggtaggggc tgggcatgca ccttggttaa 2280
gccccacccc ctatggcaaa gtctctgcca acactcctct gagggctcat tttccagtct 2340
ccagtggccc cggggtcttt ttgagaacta cccacctgcc acatagaaag aaatgctctg 2400
ttggcaggga ggcctcctgg aaccagtcag gaaccaggct ctggaaggcc cgggccattt 2460
cttccctgac ctgtcctgtg accttgacag gtcagccctc tgtagctcag tgtcacctgg 2520
ctatggaagg ggctggtaac tgaggtttcc gccctccacc tctaaacaca tacacaccta 2580
tccccccaga gaatcacaga gatggtagaa gctttgtact ccccaagtcc atggggaaac 2640
agtttatctt tctggactta gttttatcac atccagctct atattagcat attagcatag 2700
gtgagaaata tggccagact agacagagat caggtcatca ggggagcttc cgagcttcag 2760
caaagcccac aggtagctct gcgaactcag aatgctaccc taccttccct gcaggccgct 2820
gttcatgtct ggactcctgg gggcgctatt taatgtttac ccccatctcc agtgccccct 2880
ccaaggctgt gcagtgtctt ggggctctca gggccaacat cgaagagatg ggggccacct 2940
cttaacacct ggcaacagtc tcccctcatc ctgattcctg acaacagaca aaacaccggt 3000
ttctagggtt tatctgtttg ttttttgagt tgagggttcc tcagggcctt ggcattgcta 3060
gtgatggtcc cctttgctgt gtgagaaccc cctcaacccc ttcctcctcc ctctggggat 3120
gaagtgggag tatttggctc cccatttttg acaaaagggc tcagtgcagg gaggtggagg 3180
cctctgaggt ttgaagggct ctgtgagtta gagttgtcac atgttctcct ggttcttgaa 3240
tttgcagcag gtcctgaaaa ggaaggctct gctggccccg tgccttcctg accttctctc 3300
tccttccctc ccctctcttt tcttgccaag tttgctttgg tttctgagca gcccagagag 3360
gaggagggtt cgtccccagg gagagcccag ggctggagtc cccaatccct gtgctatggg 3420
cacaaagaga cttcagctct tcctgttgcc ttggcttttt cctgagcaaa aacacaacaa 3480
acaaaaaggc cagagaagag cacagactct gtccctctca caactctcca gaagagaccc 3540
cctgattctt cacaccaccg gatgccactc cagccagcag gattgctaca cacaccctct 3600
gttctcagaa gtcatctgcc tgggcagccg cctctcagat tcctgtcttc gtttcagaca 3660
cttttctctg aagcatgccc atgtccacca gccaacgtgc ccccgtgttc ccccccatca 3720
gccaagtgat tggggctgaa ccagacttta aaagagagga aaaaaaaaaa aaaa 3774
<210> 21
<211> 619
<212> PRT
<213> 智人
<400> 21
Met Ala Asn Asp Ile Asp Glu Leu Ile Gly Ile Pro Phe Pro Asn His
1 5 10 15
Ser Ser Glu Val Leu Cys Ser Leu Asn Glu Gln Arg His Asp Gly Leu
20 25 30
Leu Cys Asp Val Leu Leu Val Val Gln Glu Gln Glu Tyr Arg Thr His
35 40 45
Arg Ser Val Leu Ala Ala Cys Ser Lys Tyr Phe Lys Lys Leu Phe Thr
50 55 60
Ala Gly Thr Leu Ala Ser Gln Pro Tyr Val Tyr Glu Ile Asp Phe Val
65 70 75 80
Gln Pro Glu Ala Leu Ala Ala Ile Leu Glu Phe Ala Tyr Thr Ser Thr
85 90 95
Leu Thr Ile Thr Ala Gly Asn Val Lys His Ile Leu Asn Ala Ala Arg
100 105 110
Met Leu Glu Ile Gln Cys Ile Val Asn Val Cys Leu Glu Ile Met Glu
115 120 125
Pro Gly Gly Asp Gly Gly Glu Glu Asp Asp Lys Glu Asp Asp Asp Asp
130 135 140
Asp Glu Asp Asp Asp Asp Glu Glu Asp Glu Glu Glu Glu Glu Glu Glu
145 150 155 160
Glu Glu Asp Asp Asp Asp Asp Thr Glu Asp Phe Ala Asp Gln Glu Asn
165 170 175
Leu Pro Asp Pro Gln Asp Ile Ser Cys His Gln Ser Pro Ser Lys Thr
180 185 190
Asp His Leu Thr Glu Lys Ala Tyr Ser Asp Thr Pro Arg Asp Phe Pro
195 200 205
Asp Ser Phe Gln Ala Gly Ser Pro Gly His Leu Gly Val Ile Arg Asp
210 215 220
Phe Ser Ile Glu Ser Leu Leu Arg Glu Asn Leu Tyr Pro Lys Ala Asn
225 230 235 240
Ile Pro Asp Arg Arg Pro Ser Leu Ser Pro Phe Ala Pro Asp Phe Phe
245 250 255
Pro His Leu Trp Pro Gly Asp Phe Gly Ala Phe Ala Gln Leu Pro Glu
260 265 270
Gln Pro Met Asp Ser Gly Pro Leu Asp Leu Val Ile Lys Asn Arg Lys
275 280 285
Ile Lys Glu Glu Glu Lys Glu Glu Leu Pro Pro Pro Pro Pro Pro Pro
290 295 300
Phe Pro Asn Asp Phe Phe Lys Asp Met Phe Pro Asp Leu Pro Gly Gly
305 310 315 320
Pro Leu Gly Pro Ile Lys Ala Glu Asn Asp Tyr Gly Ala Tyr Leu Asn
325 330 335
Phe Leu Ser Ala Thr His Leu Gly Gly Leu Phe Pro Pro Trp Pro Leu
340 345 350
Val Glu Glu Arg Lys Leu Lys Pro Lys Ala Ser Gln Gln Cys Pro Ile
355 360 365
Cys His Lys Val Ile Met Gly Ala Gly Lys Leu Pro Arg His Met Arg
370 375 380
Thr His Thr Gly Glu Lys Pro Tyr Met Cys Thr Ile Cys Glu Val Arg
385 390 395 400
Phe Thr Arg Gln Asp Lys Leu Lys Ile His Met Arg Lys His Thr Gly
405 410 415
Glu Arg Pro Tyr Leu Cys Ile His Cys Asn Ala Lys Phe Val His Asn
420 425 430
Tyr Asp Leu Lys Asn His Met Arg Ile His Thr Gly Val Arg Pro Tyr
435 440 445
Gln Cys Glu Phe Cys Tyr Lys Ser Phe Thr Arg Ser Asp His Leu His
450 455 460
Arg His Ile Lys Arg Gln Ser Cys Arg Met Ala Arg Pro Arg Arg Gly
465 470 475 480
Arg Lys Pro Ala Ala Trp Arg Ala Ala Ser Leu Leu Phe Gly Pro Gly
485 490 495
Gly Pro Ala Pro Asp Lys Ala Ala Phe Val Met Pro Pro Ala Leu Gly
500 505 510
Glu Val Gly Gly His Leu Gly Gly Ala Ala Val Cys Leu Pro Gly Pro
515 520 525
Ser Pro Ala Lys His Phe Leu Ala Ala Pro Lys Gly Ala Leu Ser Leu
530 535 540
Gln Glu Leu Glu Arg Gln Phe Glu Glu Thr Gln Met Lys Leu Phe Gly
545 550 555 560
Arg Ala Gln Leu Glu Ala Glu Arg Asn Ala Gly Gly Leu Leu Ala Phe
565 570 575
Ala Leu Ala Glu Asn Val Ala Ala Ala Arg Pro Tyr Phe Pro Leu Pro
580 585 590
Asp Pro Trp Ala Ala Gly Leu Ala Gly Leu Pro Gly Leu Ala Gly Leu
595 600 605
Asn His Val Ala Ser Met Ser Glu Ala Asn Asn
610 615
<210> 22
<211> 10
<212> PRT
<213> HPV18
<400> 22
Met Ala Asp Pro Glu Gly His Gly Pro Asp
1 5 10
<210> 23
<211> 10
<212> PRT
<213> HPV33
<400> 23
Met Ala Asp Pro Glu Gly Arg Gly Ala Asn
1 5 10
<210> 24
<211> 10
<212> PRT
<213> HPV35
<400> 24
Met Ala Asp Pro Ala Gly Arg Gly Ala Asp
1 5 10
<210> 25
<211> 21
<212> DNA
<213> 人乳头状瘤病毒52型
<400> 25
ggaccctgaa ggacgtggtg c 21
<210> 26
<211> 24
<212> DNA
<213> 人乳头状瘤病毒58型
<400> 26
tgaccctgaa ggacgtggtg caaa 24
<210> 27
<211> 11
<212> DNA
<213> 人乳头状瘤病毒52型
<400> 27
ggaccctgaa g 11
<210> 28
<211> 11
<212> DNA
<213> 人乳头状瘤病毒58型
<400> 28
tgaccctgaa g 11
<210> 29
<211> 10
<212> DNA
<213> 人乳头状瘤病毒52型
<400> 29
gacgtggtgc 10
<210> 30
<211> 13
<212> DNA
<213> 人乳头状瘤病毒58型
<400> 30
gacgtggtgc aaa 13
<210> 31
<211> 11
<212> DNA
<213> 人乳头状瘤病毒58型
<400> 31
ctgaaggacg t 11
<210> 32
<211> 7942
<212> DNA
<213> 人乳头状瘤病毒52型
<400> 32
taaattataa tcttatacta gtaaaaaata gggtgtaacc gaaaacggtc agaccgaaac 60
cggtgtatat atatagaaca cagtgtagct aacgcacggc catgtttgag gatccagcaa 120
cacgaccccg gaccctgcac gaattgtgtg aggtgctgga agaatcggtg catgaaataa 180
ggctgcagtg tgtgcagtgc aaaaaagagc tacaacgaag agaggtatac aagtttctat 240
ttacagattt acgaatagta tatagagaca ataatccata tggcgtgtgt attatgtgcc 300
tacgcttttt atctaagata agtgaatata ggcattatca atattcactg tatgggaaaa 360
cattagaaga gagggtaaaa aaaccattaa gtgaaataac tattagatgt ataatttgtc 420
aaacgccatt atgtcctgaa gaaaaagaaa gacatgttaa tgcaaacaag cgatttcata 480
atattatggg tcgttggaca gggcgctgtt cagagtgttg gagaccccga cctgtgaccc 540
aagtgtaacg tcatgcgtgg agacaaagca actataaaag attatatatt agatctgcaa 600
cctgaaacaa ctgacctaca ctgctatgag caattaggtg acagctcaga tgaggaggat 660
acagatggtg tggaccggcc agatggacaa gcagaacaag ccacaagcaa ttactacatt 720
gtgacatatt gtcacagttg tgatagcaca ctacggctat gcattcatag cactgcgacg 780
gaccttcgta ctctacagca aatgctgttg ggcacattac aagttgtgtg ccccggctgt 840
gcacggctat aaacaaccct gcaatggagg accctgaagg tacagagggc gaaagggagg 900
gatgtacagg ctggtttgaa gtagaggcaa taatagaaaa acaaacagga gataacattt 960
cagaggacga ggatgaaaat gcatatgata gtggaacaga tctaatagat tttatagatg 1020
attcaaatat aaataatgaa caggcagaac atgaggcagc ccgggcattg tttaatgcac 1080
aggaagggga ggatgattta catgctgtgt ctgcagtaaa acgaaagttt acaagcagtc 1140
cggaaagtgc tgggcaagat ggtgtagaaa aacatggtag tccgcgtgca aaacacattt 1200
gtgtaaatac agagtgtgtt ttaccaaaac gcaaaccatg tcacgtagaa gacagcggct 1260
atggcaatag tgaagtggaa gcgcagcaga tggcagacca ggtagacggg caaaatggcg 1320
actggcaaag taacagtagt caatcaagtg gggtgggggc tagtaattca gatgtaagtt 1380
gtactagtat agaggacaat gaggaaaata gtaatagaac gctaaaaagc atacaaaata 1440
ttatgtgcga aaatagcata aaaacaactg tattatttaa atttaaagaa acatatggtg 1500
ttagctttat ggaattagta agaccattta aaagtaatag aagtagttgt acagattggt 1560
gtattatagg aatgggagta acaccatcag ttgcagaagg attaaaagta ttaatacagc 1620
cctatagcat atatgcccat ttgcaatgtt taacatgtga cagaggcgtg cttatactgc 1680
tgctaattag gtttaaatgt ggaaaaaaca gattaacagt gtccaaacta atgtcacagc 1740
tgttaaatat accagaaaca catatggtaa tagaaccacc aaaattacga agtgctacct 1800
gtgcattata ttggtataga acaggtttgt ctaatattag tgaggtatat ggtaccaccc 1860
cagaatggat agaacaacaa acagtattac agcatagctt tgacaatagc atattcgatt 1920
ttggagaaat ggtgcaatgg gcatatgatc atgatataac agatgatagt gacatagcat 1980
ataaatatgc acagttagca gatgtaaata gcaatgctgc agcattccta aaaagcaatt 2040
cgcaagcaaa aatagtaaag gactgtgcaa ccatgtgtag acattataaa cgggcagaaa 2100
gaaaacatat gaatattgga caatggatac agtatagatg tgatagaata gatgatggtg 2160
gagattggag gcctatagta agatttttaa gatatcaaga catagaattt acagcctttt 2220
tagacgcatt taaaaaattt ttaaaaggta tacctaaaaa aaattgttta gtattatatg 2280
gacctgcaaa cacaggaaaa tcatattttg gaatgagttt aattaggttc ttaagtggat 2340
gtgtaatatc ctatgtaaac tcaaaaagcc atttttggct acaaccatta acagatgcaa 2400
aagtgggtat gatagatgat gtaacaccta tatgttggac atatatagat gattatatga 2460
gaaatgcact ggatggaaat gatatatcag tagatgtaaa gcatagagcc ttagtacaaa 2520
taaaatgccc accattaatt ttaacaacaa atacaaatgc aggaacagat cctaggtggc 2580
catatttaca tagtagattg gttgtgtttc atttcaaaaa cccatttcca tttgatgaaa 2640
atggcaatcc tatatatgaa attaacaacg aaaattggaa atcctttttc tcaaggacgt 2700
ggtgcaaatt agatttaata caggaagagg acaaggaaaa cgatggagtc gataccggca 2760
cgtttaaatg cagtgcagga aaaaatacta gatctatacg aagctgatag taatgaccta 2820
aacgcacaaa ttgaacattg gaaattgact cgaatggaat gtgttttgtt ttacaaagca 2880
aaggaactgg gaataactca tataggccac caggtggtgc caccaatggc agtgtctaag 2940
gcaaaggcct gccaagctat tgaactacaa ttggcattgg aggcattaaa caaaacacaa 3000
tatagcacag atggatggac attacaacaa acaagtctag aaatgtggcg tgcagaacca 3060
caaaaatact ttaaaaaaca tgggtataca ataacagtgc aatacgataa tgataaaaac 3120
aatactatgg attatacaaa ctggaaggaa atttatttac ttggtgagtg tgaatgtaca 3180
attgtagaag gacaagtaga ttactatggg ttatattatt ggtgtgatgg agaaaaaata 3240
tattttgtaa aatttagtaa cgatgcaaag caatattgtg taacaggagt atgggaagta 3300
catgtgggtg gtcaggtaat tgtttgtcct gcatctgtat ctagtaacga agtatccact 3360
actgaaactg ctgtccacct atgcaccgaa acctccaaga cctccgcagt gtccgtgggt 3420
gccaaagaca cacacctaca accaccacag aaacgacgac gaccagacgt cacagactcc 3480
agaaacacca agtaccccaa caaccttttg cggggacaac aatccgtgga cagtactaca 3540
cggggactcg tcactgcaac tgagtgcaca aacaaaggac gggttgcaca tacaacttgt 3600
actgcaccta taatacacct aaaaggtgat cctaatagtt taaaatgttt aagatatagg 3660
gtaaaaacac ataaaagttt gtatgttcaa atttcatcta cctggcattg gaccagtaat 3720
gaatgtacaa ataataaact aggtattgta acaataacgt acagtgatga aacacaacgt 3780
caacaatttt taaaaactgt taaaatacca aatactgtgc aagttataca aggtgtcatg 3840
tcattgtgat atttgtacat atgtatatat gtatatgtgt atggtaaaca cccaacacaa 3900
gccaatattg ctgctattgt gtatatataa caatgttagg attatttgta ttttgtttta 3960
ttttgcttat ggtgttttgt gcagtgctta ggccgctctt gctatctata tcggtgtatg 4020
cgcaggtgtt ggtgctggtg cttttgctat gggtatctat tgggtcacca tttaaagtgt 4080
tttttttgta cctactgttt ttatattttc caatgttttg tattcactgt catgcacagt 4140
atttggcaca actgcaataa ctgtacatgt agattggcta catgcatata tgcaaaatat 4200
actttttcac ttttgtagtt tgtctaataa atacttttat attttttaat agcttgtcgc 4260
aatgagatac agacggtcta cacggcacaa acgtgcttct gcaacacagc tatatcaaac 4320
atgcaaagcc tctggcacct gcccccccga tgttattcct aaagtggaag gcacaactat 4380
tgcagatcaa cttttaaaat atggcagcct aggggtgttt tttggaggtt tgggtatagg 4440
tacaggtgca ggctctggtg gtagggcagg ctatgtgcca ttgtccactc gtcctcccac 4500
tagtagtatt accacgtcca ccattcgtcc ccctgtaact gtagaaccca ttggtccctt 4560
agaaccatct atagtttcta tgatagaaga aacaacattt attgagtctg gcgcacctgc 4620
tccatctatt ccatcagcaa cagggtttga tgttacaaca tctgcaaata atactcctgc 4680
aataattaat gtaacatcta taggtgaatc atctgtacaa tcagtttcta cacatttaaa 4740
tcctacattc actgaaccat ctataataca gcccccggca cctgcagaag catctggtca 4800
tgtattgttt tctagtccaa ctattagtac acacacctat gaagaaatcc ctatggatac 4860
atttgttacc tctactgaca gcagcagtgt aacaagtagt acacctattc cagggtctcg 4920
ccctacgaca cgccttggtt tatatagccg tgccacacaa caggttaagg tagtcgaccc 4980
tgcttttatg tcatcaccac agaaattagt aacatataac aatcctgttt ttgagggcgt 5040
tgatacagat gaaactataa tttttgatcg ttcacaactt ttacctgcac cggatcctga 5100
ttttttagac attatagctt tgcataggcc tgcattaacc tctcgaagag gtactgttag 5160
gtttagcagg cttggtaata aggccaccct acgtacacgt agtggaaaac aaattggggc 5220
acgggtacat tattatcatg atattagtcc tatccagcct gctgaagttc aggaagacat 5280
agaattgcaa cctttattac cacagtctgt gtccccttac actattaatg atggtttgta 5340
tgatgtgtat gcagattctt tgcagcaacc cacgtttcac ttaccttcca cactttctac 5400
ccataataat actttcactg tacctattaa tagtggtatt gactttgtat atcaacccac 5460
tatgtccatt gagtcaggtc ctgacattcc attaccttcg ttacccacac atactccttt 5520
tgttcctata gcccctacag ctccatctac atctattatt gttgatggta cagattttat 5580
tttacatcct agttattttt tactacgtcg caggcgtaaa cgttttccat atttttttac 5640
agatgtccgt gtggcggcct agtgaggcca ctgtgtacct gcctcctgta cctgtctcta 5700
aggttgtaag cactgatgag tatgtgtctc gcacaagcat ctattattat gcaggcagtt 5760
ctcgattact aacagtagga catccctatt tttctattaa aaacaccagt agtggtaatg 5820
gtaaaaaagt tttagttccc aaggtgtctg gcctgcaata cagggtattt agaattaaat 5880
tgccggaccc taataaattt ggttttccag atacatcttt ttataaccca gaaacccaaa 5940
ggttggtgtg ggcctgtaca ggcttggaaa ttggtagggg acagccttta ggtgtgggta 6000
ttagtgggca tcctttatta aacaagtttg atgatactga aaccagtaac aaatatgctg 6060
gtaaacctgg tatagataat agggaatgtt tatctatgga ttataagcag actcagttat 6120
gcattttagg atgcaaacct cctataggtg aacattgggg taagggaacc ccttgtaata 6180
ataattcagg aaatcctggg gattgtcctc ccctacagct cattaacagt gtaatacagg 6240
atggggacat ggtagataca ggatttggtt gcatggattt taataccttg caagctagta 6300
aaagtgatgt gcccattgat atatgtagca gtgtatgtaa gtatccagat tatttgcaaa 6360
tggctagcga gccatatggt gacagtttgt tcttttttct tagacgtgag caaatgtttg 6420
ttagacactt ttttaatagg gccggtacct taggtgaccc tgtgccaggt gatttatata 6480
tacaagggtc taactctggc aatactgcca ctgtacaaag cagtgctttt tttcctactc 6540
ctagtggttc tatggtaacc tcagaatccc aattatttaa taaaccgtac tggttacaac 6600
gtgcgcaggg ccacaataat ggcatatgtt ggggcaatca gttgtttgtc acagttgtgg 6660
ataccactcg tagcactaac atgactttat gtgctgaggt taaaaaggaa agcacatata 6720
aaaatgaaaa ttttaaggaa taccttcgtc atggcgagga atttgattta caatttattt 6780
ttcaattgtg caaaattaca ttaacagctg atgttatgac atacattcat aagatggatg 6840
ccactatttt agaggactgg caatttggcc ttaccccacc accgtctgca tctttggagg 6900
acacatacag atttgtcact tctactgcta taacttgtca aaaaaacaca ccacctaaag 6960
gaaaggaaga tcctttaaag gactatatgt tttgggaggt ggatttaaaa gaaaagtttt 7020
ctgcagattt agatcagttt cctttaggta ggaagttttt gttacaggca gggctacagg 7080
ctaggcccaa actaaaacgc cctgcatcat cggccccacg tacctccaca aagaagaaaa 7140
aggttaaaag gtaaccattg tctgttgggt aattgtctgt gtcatgtatg tgttgtgtat 7200
gtcaaacaca ggttaaaagg taaccattgt ttgttatgta attgttttgt gtgtgtactg 7260
tgttgtttgc atgttatgta tgtgtgtgca tgtttgttgt atttgtcagt tcctgtatgt 7320
atgttttgtg tatgtattaa taaagtactg tatttactaa actatttata gtagtcttat 7380
gttatgttat ggttgcaccc acatgagtaa caatacagtt gctcctaatc tattgcatct 7440
cctgccctac cctgtgtccc ctgccctacc ctgtgtccta ctttgttaca ctactaatta 7500
gccttatact ctccattttg taccattttg tactatccac cattttaaat cctaaccgaa 7560
ttcggttggt cttggcacaa ctttggttgt ccttggcaca gtaacaacta tttttatata 7620
agtttcagca aactgcttaa tcctttggtt tcctgcagtc cactggtcta cacttgttgt 7680
cccgcctaaa ctgacttctt gctgactcac aggtcctgca gtgcagctaa acaatacatt 7740
gcctaacatt gcatgtttta aactgctttt aggcacatat tttatttaaa ctttcaatgc 7800
actaattaca gtgttggctt acacaagtac atcctacgcc aaatatgtct tgtaaaacat 7860
gattaaatac tgttactcac caggtgtgca ctacacgacc ggttacggtt accgtaccca 7920
caaccacttt tttttataat ta 7942
<210> 33
<211> 7824
<212> DNA
<213> 人乳头状瘤病毒58型
<400> 33
ctaaactata atgccaaatc ttgtaaaaac tagggtgtaa ccgaaaacgg tctgaccgaa 60
accggtgcat atataaagca gacatttttt ggtaggctac tgcaggacta tgttccagga 120
cgcagaggag aaaccacgga cattgcatga tttgtgtcag gcgttggaga catctgtgca 180
tgaaatcgaa ttgaaatgcg ttgaatgcaa aaagactttg cagcgatctg aggtatatga 240
ctttgtattt gcagatttaa gaatagtgta tagagatgga aatccatttg cagtatgtaa 300
agtgtgctta cgattgctat ctaaaataag tgagtataga cattataatt attcgctata 360
tggagacaca ttagaacaaa cactaaaaaa gtgtttaaat gaaatattaa ttagatgtat 420
tatttgtcaa agaccattgt gtccacaaga aaaaaaaagg catgtggatt taaacaaaag 480
gtttcataat atttcgggtc gttggacagg gcgctgtgca gtgtgttgga gaccccgacg 540
tagacaaaca caagtgtaac ctgtaacaac gccatgagag gaaacaaccc aacgctaaga 600
gaatatattt tagatttaca tcctgaacca actgacctat tctgctatga gcaattatgt 660
gacagctcag acgaggatga aataggcttg gacgggccag atggacaagc acaaccggcc 720
acagctaatt actacattgt aacttgttgt tacacttgtg gcaccacggt tcgtttgtgt 780
atcaacagta caacaaccga cgtacgaacc ctacagcagc tgcttatggg cacatgtacc 840
attgtgtgcc ctagctgtgc acagcaataa acaccatctg caatggatga ccctgaaggt 900
acaaacgggg taggggcggg ctgtactggc tggtttgagg tagaagcggt aatagaacga 960
agaacaggag ataatatttc agatgatgag gacgaaacag cagacgatag tggtacagat 1020
ttaatagagt ttatagatga ttcagtacaa agtactacac aggcagaagc agaggcagcc 1080
cgagcgttgt ttaatgtaca ggaaggggtg gacgatataa atgctgtgtg tgcactaaaa 1140
cgaaagtttg cagcatgctc agaaagtgct gtagaggact gtgtggaccg ggctgcaaat 1200
gtgtgtgtat cgtggaaata taaaaataaa gaatgcacac acagaaaacg aaaaattatt 1260
gagctagaag acagcggata tggcaatact gaagtggaaa ctgagcagat ggcacaccag 1320
gtagaaagcc aaaatggcga cgcagactta aatgactcgg agtctagtgg ggtgggggct 1380
agttcagatg taagcagtga aacggatgta gacagttgta atactgttcc attacaaaat 1440
attagtaata ttctacataa cagtaatact aaagcaacgc tattatataa attcaaagaa 1500
gcttatggag taagttttat ggaattagtt agaccattta aaagtgataa aacaagctgt 1560
acagattggt gtataacagg gtatggaata agtccctccg tagcagaaag tttaaaagta 1620
ctaattaaac agcacagtat atatacacac ctacaatgtt taacgtgtga cagaggaatt 1680
atattattat tgttaattag atttaaatgt agcaaaaata gattaactgt ggcaaaatta 1740
atgagtaatt tactatcaat tcctgaaaca tgtatgatta tcgagccacc aaaattacga 1800
agtcaagcat gtgccttata ttggtttaga acagcaatgt caaatataag tgatgtgcaa 1860
gggacaacac cagaatggat agatagatta acagtgttac agcatagctt taatgatgat 1920
atatttgatt taagtgaaat gatacaatgg gcatatgata atgacattac agatgatagt 1980
gacattgcat ataaatatgc acagttagca gatgttaata gtaatgcagc agcattttta 2040
agaagcaatg cacaagcaaa aatagtaaaa gactgtggcg ttatgtgcag acattataaa 2100
agagcagaaa agcgtggtat gacaatggga caatggatac aaagtaggtg tgaaaaaaca 2160
aatgatggag gtaattggag accaatagta caatttttaa gatatcaaaa tattgaattt 2220
acagcatttt tagttgcatt taaacagttt ttacaaggtg taccaaaaaa aagttgtatg 2280
ttactgtgtg gcccagcaaa tacagggaaa tcatattttg gaatgagttt aatacatttt 2340
ttaaaaggat gcattatttc atatgtaaat tccaaaagtc atttttggtt gcagccatta 2400
tcagatgcta aactaggtat gatagatgat gtaacagcca taagctggac atatatagat 2460
gattatatga gaaatgcatt agatggtaac gacatttcaa tagatgtaaa acatagggca 2520
ttagtacaat taaaatgtcc accattaata attacctcaa atacaaatgc aggcaaagat 2580
tcacgatggc catatttgca cagtagacta acagtatttg aatttaacaa tccatttcca 2640
tttgatgcaa atggtaatcc agtgtataaa ataaatgatg aaaattggaa atcctttttc 2700
tcaaggacgt ggtgcaaatt aggcttaata gaggaagagg acaaggaaaa cgatggagga 2760
aatatcagca cgtttaagtg cagtgcagga caaaatccta gacatatacg aagctgataa 2820
aaatgattta acatcacaaa ttgaacattg gaaactaata cgcatggagt gtgctataat 2880
gtatacagcc agacaaatgg gaatatcaca tttgtgccac caggtggtgc cgtcattggt 2940
agcatcaaag actaaagcgt ttcaagtaat tgaactgcaa atggcattag agacattaaa 3000
tgcatcacca tataaaacag atgaatggac attgcaacaa acaagcttag aagtgtggtt 3060
atcagagcca caaaaatgct ttaaaaaaaa aggcataaca gtaactgtac aatatgacaa 3120
tgataaagca aacacaatgg attatacaaa ttggagtgaa atatatatta ttgaggaaac 3180
aacatgtact ttggtagcag gagaagttga ctatgtgggg ttgtattata tacatggcaa 3240
tgaaaagacg tattttaaat attttaaaga ggatgcaaaa aagtactcta aaacacaatt 3300
atgggaggta catgtgggta gtcgggtaat tgtatgtcct acatctatac ctagtgatca 3360
aatatccact actgaaactg ctgacccaaa gaccaccgag gccaccaaca acgaaagtac 3420
acaggggaca aagcgacgac gactcgattt accagactcc agagacaaca cccagtactc 3480
cacaaagtat acagactgcg ccgtggacag tagaccacga ggaggaggac tacacagtac 3540
aactaactgt acatacaaag ggcggaacgt gtgtagttct aaagtttcac ctatcgtgca 3600
tttaaaaggt gacccaaata gtttaaaatg tttaagatat agattaaaac catttaaaga 3660
cttatactgt aatatgtcat ccacatggca ttggaccagt gatgacaaag gtgacaaagt 3720
aggaattgtt actgtaacat acacaacgga aacacaacga caactgtttt taaacactgt 3780
taaaatacca cccactgtgc aaataagtac tggtgttatg tcattgtaat tgtattgtac 3840
aattactgta tgtaaaccac aagccaatat gtgctgctaa gtgtatatac aatgatatta 3900
cctatttttg ttgtttgttt tatactgttt ttatgcttgt gcattttttt gcggccattg 3960
gtgctatcta tttctatata tgcttggttg ctggtgttgg tgttgctgct ttgggtgtct 4020
gtggggtcgg ctctacgaat ttttttctgt tacttaatat ttttatatat accaatgatg 4080
tgtattaatt ttcatgcaca atacttaacc caacaagact aactgtatac tggttctgca 4140
catggtggta tggtattgta aatatttact gttgtgtgtg ttgtttttat tatttttata 4200
catttactaa taaatacttt tatattttta gcactgtctt attatgagac acaaacggtc 4260
tacaaggcgc aagcgtgcat ctgctacaca actttaccaa acatgcaagg cctcaggcac 4320
ctgcccacct gatgttatac ccaaagttga aggcactact atagcagatc aaatattacg 4380
atatggtagc ttaggggtgt tttttggagg tttaggcatt ggtacagggt cgggtacagg 4440
tggcaggact ggatatgtgc cccttggtag taccccaccg tctgaggcta tacctttaca 4500
gcccatacgt cccccagtta ccgttgatac tgtggggcct ttggattctt ctattgtatc 4560
tttaatagag gaatctagtt ttatagacgc cggtgcacca gccccatcaa ttcccactcc 4620
atctggtttt gatattacca cctctgcaga tactacacct gcaatactta atgtttcctc 4680
tattggagaa tcatctatac aaactgtttc tacacattta aatccctcct ttactgagcc 4740
atccgtactc cgccctcctg cacctgcaga ggcctctgga catttaatat tttcctctcc 4800
tactgttagc acacatagtt atgaaaacat accaatggat acctttgtta tttctactga 4860
cagtggcaat gtcacgtcta gcacacccat tccagggtct cgccctgtgg cacgccttgg 4920
tttatacagt cgcaacaccc aacaagttaa ggttgttgac cctgcttttt taacatctcc 4980
tcatagactt gtaacatatg ataatccagc atttgaaggc tttaaccctg aggacacatt 5040
gcagtttcaa catagtgaca tatcgcctgc tcctgatcct gattttctag atattgttgc 5100
attacacaga cctgcattaa cctctcgcag gggtactgta cgttatagta gggttgggca 5160
aaaggctaca cttcgtactc gcagtggaaa gcaaataggg gctaaagtac attactacca 5220
agacttaagt cccatacagc ctgtccagga acaggtacaa cagcagcaac aatttgaatt 5280
acaatcttta aatacttctg tttctcccta tagtattaat gatggacttt atgatattta 5340
tgctgacgat gctgatacta tacatgattt tcagagtcct ctgcactcac atacgtcctt 5400
tgccaccaca cgtaccagta atgtgtccat accattaaat actggatttg acactcctct 5460
tgtgtcattg gaacctggtc cagacattgc atcttctgta acatctatgt ctagtccatt 5520
tattcctata tctccactaa ctccttttaa taccataatt gtggatggtg ctgattttat 5580
gttgcaccct agctatttta ttttgcgtcg cagacgtaaa cgttttccat atttttttgc 5640
agatgtccgt gtggcggcct agtgaggcca ctgtgtacct gcctcctgtg cctgtgtcta 5700
aggttgtaag cactgatgaa tatgtgtcac gcacaagcat ttattattat gctggcagtt 5760
ccagactttt ggctgttggc aatccatatt tttccatcaa aagtcccaat aacaataaaa 5820
aagtattagt tcccaaggta tcaggcttac agtatagggt ctttagggtg cgtttacctg 5880
atcccaataa atttggtttt cctgatacat ctttttataa ccctgataca caacgtttgg 5940
tctgggcatg tgtaggcctt gaaataggta ggggacagcc attgggtgtt ggcgtaagtg 6000
gtcatcctta tttaaataaa tttgatgaca ctgaaaccag taacagatat cccgcacagc 6060
cagggtctga taacagggaa tgcttatcta tggattataa acaaacacaa ttatgtttaa 6120
ttggctgtaa acctcccact ggtgagcatt ggggtaaagg tgttgcctgt aacaataatg 6180
cagctgctac tgattgtcct ccattggaac tttttaattc tattattgag gatggtgaca 6240
tggtagatac agggtttgga tgcatggact ttggtacatt gcaggctaat aaaagtgatg 6300
tgcctattga tatttgtaac agtacatgca aatatccaga ttatttaaaa atggccagtg 6360
aaccttatgg ggatagtttg ttcttttttc ttagacgtga gcagatgttt gttagacact 6420
tttttaatag ggctggaaaa cttggcgagg ctgtcccgga tgacctttat attaaagggt 6480
ccggtaatac tgcagttatc caaagtagtg cattttttcc aactcctagt ggctctatag 6540
ttacctcaga atcacaatta tttaataagc cttattggct acagcgtgca caaggtcata 6600
acaatggcat ttgctggggc aatcagttat ttgttaccgt ggttgatacc actcgtagca 6660
ctaatatgac attatgcact gaagtaacta aggaaggtac atataaaaat gataatttta 6720
aggaatatgt acgtcatgtt gaagaatatg acttacagtt tgtttttcag ctttgcaaaa 6780
ttacactaac tgcagagata atgacatata tacatactat ggattccaat attttggagg 6840
actggcaatt tggtttaaca cctcctccgt ctgccagttt acaggacaca tatagatttg 6900
ttacctccca ggctattact tgccaaaaaa cagcaccccc taaagaaaag gaagatccat 6960
taaataaata tactttttgg gaggttaact taaaggaaaa gttttctgca gatctagatc 7020
agtttccttt gggacgaaag tttttattac aatcaggcct taaagcaaag cccagactaa 7080
aacgttcggc ccctactacc cgtgcaccat ccaccaaacg caaaaaggtt aaaaaataat 7140
tgttgtggta cttacactat tttattatac atgtttgttt gttttatgta tgtgttgtct 7200
gtttgtttat gtttgtgtat atgttgtatg tgttatgtgt catgtttgtg tacatgttct 7260
atgtccttgt cagtttcctg tttctgtata tatgtaataa actattgtgt gtattgtaaa 7320
ctatttgtat tgtttgggtg tatctatgag taaggtgctg tccctaaatt gccctaccct 7380
gccctgccta ttatgcatac ctatgtaata gtatttgtat gatatgtatt ttatagtttt 7440
taacagtact gcctccattt tactttacct ccattttgtg catgtaaccg atttcggttg 7500
ctggcacaaa cgtgtttttt ttaaactaca atttaaacaa tacagttaat cctttccctt 7560
cctgcactgc ttttgcctat acttgcatat gtgactcata tatacatgca gtgcagttgc 7620
aaaatgttta attatactca tagtttaaac atgcttatag gcacatattt taacttactt 7680
tcaatgctta agtgcagttt tggcttgcac aatagtttgt tatgccaaac tatgtcttgt 7740
aaaagtgact cactaacatt tattgccagg tgtggactaa ccgttttggg tcacattgtt 7800
catgtttcaa cattttatat aata 7824
<210> 34
<211> 10
<212> PRT
<213> 人乳头状瘤病毒52型
<400> 34
Met Glu Asp Pro Glu Gly Arg Gly Ala Asn
1 5 10
<210> 35
<211> 10
<212> PRT
<213> 人乳头状瘤病毒58型
<400> 35
Met Asp Asp Pro Glu Gly Arg Gly Ala Asn
1 5 10

Claims (21)

1.用于测定E1C的基因产物的存在和/或量的检测剂在制备试剂盒中的用途,所述试剂盒用于在具有HR-HPV的受试者中区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式,所述受试者不包含整合形式的HR-HPV基因组,所述区分是通过包括下述步骤的方法:
a)在所述受试者的样品中,测定E1C的基因产物的存在或缺失,和
b)区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式,
其中E1C的基因产物是E1的剪接转录物,其中所述HR-HPV和对应的E1剪接转录物是
i) HPV33和包含894^2702连接点的剪接转录物,
ii) HPV35和包含883^2649连接点的剪接转录物,
iii) HPV52和包含879^2696连接点的剪接转录物,或
iv) HPV58和包含898^2706连接点的剪接转录物,
其中E1C的基因产物是细胞从所述E1的剪接转录物翻译出的多肽。
2.根据权利要求1所述的用途,其中所述转录物的存在或缺失的测定包括下述步骤:如果所述转录物存在,则用特异性地扩增所述转录物的寡核苷酸扩增所述转录物,并测定如此扩增的转录物的量。
3.根据权利要求1所述的用途,其中所述E1C的基因产物的存在指示HR-HPV感染的严重形式。
4.根据权利要求1所述的用途,其中所述E1C的基因产物的缺失指示HR-HPV感染的轻度形式。
5.根据权利要求1所述的方法,其中
a) HR-HPV是HPV33,且其中E1C的基因产物是包含894^2702连接点的转录物,或
b) HR-HPV是HPV35,且其中E1C的基因产物是包含883^2649连接点的转录物。
6.根据权利要求1所述的用途,其中测定E1C的剪接转录物的存在或缺失包括:PCR扩增所述E1C的剪接转录物。
7.根据权利要求6所述的用途,其中PCR扩增使用引物的混合物。
8.根据权利要求1所述的用途,其中使用特异性地检测所述转录物的探针寡核苷酸,测定所述转录物的存在。
9.根据权利要求1所述的用途,其中所述方法包括下述额外步骤:评估在所述受试者的所述样品中的HR-HPV基因组的整合状态。
10.用于测定第一基因产物的存在和/或量的检测剂和用于测定第二基因产物的存在和/或量的检测剂在制备试剂盒中的用途,所述试剂盒用于在具有HR-HPV的受试者中区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式,所述区分是通过包括下述步骤的方法:
a)测定在所述受试者的样品中的第一种基因产物的量,所述第一种基因产物是E1C的基因产物,
b)测定所述样品中第二种基因产物的量,
c)计算在步骤a)中测得的所述第一种基因产物的量与在步骤b)中测得的所述第二种基因产物的量之比例,
d)将在步骤c)中计算出的比例与参照比例进行对比,和
e)区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式,
其中所述第一种基因产物是E1C的剪接转录物,且其中所述第二种基因产物是选自下述的转录物:E6*I的转录物、E1^E4的转录物、Apm1的转录物、Ubc的转录物、U1A的转录物、E1的转录物、E5的转录物和L1的转录物,
其中所述HR-HPV和对应的E1C的剪接转录物是
i) HPV33和包含894^2702连接点的剪接转录物,
ii) HPV35和包含883^2649连接点的剪接转录物,
iii) HPV52和包含879^2696连接点的剪接转录物,或
iv) HPV58和包含898^2706连接点的剪接转录物,
其中所述第一种基因产物是从E1C的剪接转录物翻译出的第一种多肽,且所述第二种基因产物是从选自下述的转录物翻译出的第二种多肽:E6*I的转录物、E1^E4的转录物、Apm1的转录物、Ubc的转录物、U1A的转录物、E1的转录物、E5的转录物和L1的转录物,且其中分别使用特异性地检测所述第一种和所述第二种多肽的抗体,测定所述第一种多肽的量和所述第二种多肽的量。
11.根据权利要求10所述的用途,其中计算所述第一种基因产物的量与所述第二种基因产物的量之比例,且其中(i)大于参照比例的比例指示HR-HPV感染的严重形式,和/或其中(ii)小于参照比例的比例指示HR-HPV感染的轻度形式。
12.根据权利要求10所述的用途,其中所述方法包括下述额外步骤:评估在所述受试者的所述样品中的HR-HPV基因组的整合状态。
13.一种包含探针寡核苷酸混合物的组合物,其中所述寡核苷酸混合物包含至少一种特异性地检测根据权利要求10所述的第一种基因产物的探针寡核苷酸和特异性地检测根据权利要求10所述的第二种基因产物的探针寡核苷酸。
14.一种用于在具有HR-HPV的受试者中区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式的装置,所述装置包括:用于测定E1C的基因产物的存在和/或量的检测剂,和用于对比所述量和参照量、从而允许区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式的装置,其中所述HR-HPV和对应的E1C的基因产物是
a) HPV33和包含894^2702连接点的剪接转录物,
b) HPV35和包含883^2649连接点的剪接转录物,
c) HPV52和包含879^2696连接点的剪接转录物,或
d) HPV58和包含898^2706连接点的剪接转录物。
15.一种试剂盒,其优选地适用于权利要求1的用途,所述试剂盒包括:实现权利要求1所提到的方法的说明书,和用于测定E1C的基因产物的存在和/或量的检测剂,和用于对比所述量和参照量、从而允许区分(i) HR-HPV感染的严重形式和(ii) HR-HPV感染的轻度形式的装置,
其中所述HR-HPV和对应的E1C的基因产物是
a) HPV33和包含894^2702连接点的剪接转录物,
b) HPV35和包含883^2649连接点的剪接转录物,
c) HPV52和包含879^2696连接点的剪接转录物,或
d) HPV58和包含898^2706连接点的剪接转录物,
其中E1C的基因产物是细胞从所述E1的剪接转录物翻译出的多肽。
16.包含剪接连接点的HR-HPV基因组的转录物,其中HR-HPV和剪接连接点的组合选自下述列表:a) HPV33和894^2702连接点,b) HPV35和883^2649连接点,c) HPV52和879^2696连接点,和d) HPV58和898^2706连接点。
17.寡核苷酸混合物,所述混合物包含:i)至少一种第一寡核苷酸,其与E1C转录物的剪接连接点特异性地杂交,和ii)至少一种第二寡核苷酸,其与选自下述的转录物特异性地杂交:E6*I的转录物、E1^E4的转录物、Apm1的转录物、Ubc的转录物、U1A的转录物、E1的转录物、E5的转录物和L1的转录物,
其中所述第一寡核苷酸与选自下述列表的序列特异性地杂交:
SEQ ID NO: 2 (CGATCCTGAAGGACGTGGTGCAAA),
SEQ ID NO: 3 (TGATCCTGCAGGACGTGGTGCAGA),
SEQ ID NO: 25 (GGACCCTGAAGGACGTGGTGC),和
SEQ ID NO: 26 (TGACCCTGAAGGACGTGGTGCAAA)。
18.一种特异性地识别肽序列的抗体,所述肽序列包含:i)在所述剪接位点上游的根据权利要求16所述的转录物的翻译产物的至少2个连续氨基酸,和ii)在所述剪接位点下游的根据权利要求16所述的转录物的翻译产物的至少2个连续氨基酸,且其中i)和ii)的氨基酸被最多一个氨基酸隔开。
19.根据权利要求18所述的抗体,其中所述抗体特异性地识别选自下述列表的肽序列:SEQ ID NO: 23 (madpegrgan)、SEQ ID NO: 24 (madpagrgad)、SEQ ID NO: 34(medpegrgan)和SEQ ID NO: 35 (mddpegrgan)。
20.根据权利要求1所述的方法,其中所述HR-HPV是HPV52,且其中E1C的基因产物是包含879^2696连接点的转录物。
21.根据权利要求1所述的方法,其中所述HR-HPV是HPV58,且其中E1C的基因产物是包含898^2706连接点的转录物。
CN201610584019.4A 2010-05-05 2011-04-28 在不同的宫颈病变中的hr-hpv的诊断转录物和剪接模式 Expired - Fee Related CN106191270B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US33156110P 2010-05-05 2010-05-05
US61/331561 2010-05-05
CN201180021993.5A CN103314117B (zh) 2010-05-05 2011-04-28 在不同的宫颈病变中的hr-hpv的诊断转录物和剪接模式

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201180021993.5A Division CN103314117B (zh) 2010-05-05 2011-04-28 在不同的宫颈病变中的hr-hpv的诊断转录物和剪接模式

Publications (2)

Publication Number Publication Date
CN106191270A true CN106191270A (zh) 2016-12-07
CN106191270B CN106191270B (zh) 2020-03-03

Family

ID=44022984

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201610584019.4A Expired - Fee Related CN106191270B (zh) 2010-05-05 2011-04-28 在不同的宫颈病变中的hr-hpv的诊断转录物和剪接模式
CN201180021993.5A Expired - Fee Related CN103314117B (zh) 2010-05-05 2011-04-28 在不同的宫颈病变中的hr-hpv的诊断转录物和剪接模式

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201180021993.5A Expired - Fee Related CN103314117B (zh) 2010-05-05 2011-04-28 在不同的宫颈病变中的hr-hpv的诊断转录物和剪接模式

Country Status (6)

Country Link
US (2) US9816149B2 (zh)
EP (1) EP2566986B1 (zh)
JP (2) JP6189748B2 (zh)
CN (2) CN106191270B (zh)
CA (1) CA2798224C (zh)
WO (1) WO2011138234A2 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2566986B1 (en) * 2010-05-05 2018-10-24 Deutsches Krebsforschungszentrum Diagnostic transcript and splice patterns of hr-hpv in different cervical lesions
CN105177025B (zh) * 2013-12-03 2022-11-01 北京康乐卫士生物技术股份有限公司 18型重组人乳头瘤病毒病毒样颗粒及其制备方法
WO2016049559A1 (en) * 2014-09-25 2016-03-31 Thuraiayah Vinayagamoorthy Diagnostic and prognostic methods for viruses and associated diseases and conditions
KR101693190B1 (ko) * 2015-01-28 2017-01-05 연세대학교 산학협력단 인유두종바이러스 검사와 mkrn1 발현 패턴에 따른 자궁경부암 예측 및 진단 방법
EP3715477A1 (en) * 2019-03-28 2020-09-30 Institut Pasteur Composition of primers for detecting high grade squamous intraepithelial lesion

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69022246T2 (de) * 1989-12-01 1996-02-29 Amoco Corp Detektion von hpv-transkripts.
US5876937A (en) 1995-07-03 1999-03-02 Akzo Nobel N.V. Method for determining the integrity of nucleic acid
SE515668C2 (sv) * 1999-02-22 2001-09-17 Quantovir Ab Metod och kit för tidig förutsägelse av cancer
US20020168612A1 (en) 2000-09-14 2002-11-14 Novak Eugene J. Bearing for dental handpiece
EP2184368A1 (en) * 2008-11-07 2010-05-12 DKFZ Deutsches Krebsforschungszentrum Diagnostic transcript and splice patterns of HPV16 in different cervical lesions
EP2566986B1 (en) * 2010-05-05 2018-10-24 Deutsches Krebsforschungszentrum Diagnostic transcript and splice patterns of hr-hpv in different cervical lesions

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PETER J. F. SNIJDERS等: "Human Papillomavirus Type 33 in a Tonsillar Carcinoma Generates Its Putative E7 mRNA via Two E6* Transcript Species Which Are Terminated at Different Early Region Poly(A) Sites", 《JOURNAL OF VIROLOGY》 *
SCHMITT M等: "Diagnosing Cervical Cancer and High-Grade Precursors by HPV16 Transcription Patterns", 《CANCER RESEARCH》 *

Also Published As

Publication number Publication date
JP2016182139A (ja) 2016-10-20
WO2011138234A2 (en) 2011-11-10
CN103314117B (zh) 2016-08-17
CN103314117A (zh) 2013-09-18
US20110275059A1 (en) 2011-11-10
JP6189748B2 (ja) 2017-08-30
EP2566986B1 (en) 2018-10-24
CN106191270B (zh) 2020-03-03
US20180094326A1 (en) 2018-04-05
JP2013534806A (ja) 2013-09-09
WO2011138234A3 (en) 2013-11-07
CA2798224A1 (en) 2011-11-10
US9816149B2 (en) 2017-11-14
CA2798224C (en) 2020-06-30
US10731228B2 (en) 2020-08-04
EP2566986A2 (en) 2013-03-13

Similar Documents

Publication Publication Date Title
EP2352845B1 (en) Diagnostic transcript and splice patterns of hpv16 in different cervical lesions
US6346377B1 (en) Screening for papilloma viruses
KR20070105992A (ko) 생물학적 시료에서 사람 유두종 바이러스를 검출하기 위한시스템, 방법 및 조성물
US5824466A (en) Purified polypeptide of human papillomavirus type 49 (HPV49) type 50 (HVP50), and type 55 (HPV55)
US10731228B2 (en) Diagnostic transcript and splice patterns of HR-HPV in different cervical lesions
US20030219726A1 (en) Detection of abnormalities leading to cervical malignancy
EP1951915A2 (en) Detection method for human pappilomavirus (hpv) and its application in cervical cancer
CN111273026A (zh) 一种新型冠状肺炎病毒快速检测试纸条及其应用
KR20070008504A (ko) 사스-관련 코로나바이러스의 복대립 분자 검출
Lo et al. Quantitative analysis of human papillomavirus type 16 in cervical neoplasm: a study in Chinese population
Singh et al. Human papilloma virus genotyping, variants and viral load in tumors, squamous intraepithelial lesions, and controls in a north Indian population subset
CN111593140B (zh) 一种高危型人乳头瘤病毒的检测和分型试剂盒
Gravitt et al. Chapter 5 Measurement of Exposure to Human Papillomaviruses
Choo et al. Analysis of relative binding affinity of E7‐pRB of human papillomavirus 16 clinical variants using the yeast two‐hybrid system
Crum et al. Pathobiology of papillomavirus-related cervical diseases: prospects for immunodiagnosis
EP2362916B1 (en) Hpv types and variants associated with cervical cancer and the uses thereof
Dongsup et al. Prevalence of type-specific oncogenic human papillomavirus infection assessed by HPV E6/E7 mRNA among woman with high-grade cervical lesions
Papillomaviruses MONOGRAPH ON HUMAN PAPILLOMAVIRUSES

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200303