TW200411055A - Vaccine - Google Patents

Vaccine Download PDF

Info

Publication number
TW200411055A
TW200411055A TW092127210A TW92127210A TW200411055A TW 200411055 A TW200411055 A TW 200411055A TW 092127210 A TW092127210 A TW 092127210A TW 92127210 A TW92127210 A TW 92127210A TW 200411055 A TW200411055 A TW 200411055A
Authority
TW
Taiwan
Prior art keywords
ser
thr
leu
val
glu
Prior art date
Application number
TW092127210A
Other languages
English (en)
Inventor
Gerald Wayne Gough
Christopher Michael Roberts
Original Assignee
Glaxo Group Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glaxo Group Ltd filed Critical Glaxo Group Ltd
Publication of TW200411055A publication Critical patent/TW200411055A/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P15/00Drugs for genital or sexual disorders; Contraceptives
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/20Antivirals for DNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/20Antivirals for DNA viruses
    • A61P31/22Antivirals for DNA viruses for herpes viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/01DNA viruses
    • C07K14/025Papovaviridae, e.g. papillomavirus, polyomavirus, SV40, BK virus, JC virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/20011Papillomaviridae
    • C12N2710/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Virology (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Biotechnology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Oncology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Communicable Diseases (AREA)
  • Epidemiology (AREA)
  • Endocrinology (AREA)
  • Dermatology (AREA)
  • Mycology (AREA)
  • Reproductive Health (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Description

200411055 玖、發明說明: 【發明所屬之技術領域】 本發明係關於可用來治療和預防人類乳頭狀瘤病毒感染 的方法和組合物。本發明特別關於編碼以得自不同HP V品 系的早期抗原為基礎之多蛋白的代表性核酸分子,和適合 DNA疫苗遞送的載體,以及含有其之醫藥組合物。亦包括 製造該分子的方法、載體和組合物。 【先前技術】 乳頭狀瘤病毒是高度組織和物種專一的。其感染基底的 上皮細胞’並在細胞核内複製並完成其完整的生命周期。 病毒的基因表現與上皮細胞分化緊密連接,且衣殼的組裝 和成熟僅發生在上皮細胞層之完全分化的上皮細胞内。 以生殖器旎出現之感染人類的乳頭狀瘤病毒基因型,已 知是基因型6b或基因型11。大多數(約90%)的生殖器疣是被 HPV6b感染,而大約1〇%是被hpv-u感染。以與子宮頸癌者 關之感染出現的原發性感染基因型是HPV16和18。 人類生殖器疲可在感染的位置發展,且其亦可成為慢性 的、長期持續或可自發地退化而完全消退,不留下抱痕。 尚未定義引起該退化的因素,但假設細胞反應可能涉及疾 病的消退過程。 乳頭狀瘤病毒天然並不是極具免疫原性的,且在天然感 染的過程中,抗體僅在很晚期(在消退期間或之後)和部分的 患者中出現,而有些患者可能消退疾病,但完全沒有發展 出可檢測到的抗體。 88379 200411055 在數個不同的動物模式系統中,已經廣泛地研究使用乳 頭狀瘤病毒早期抗原的疫苗接種。然而,僅有少數的報告 研究治療性免疫作用。例如,以包括牛乳頭狀瘤病毒(BPV) 蛋白質El、Ε2、Ε4和Ε7之蛋白質的雞尾酒治療性地免疫 牛,顯示與對照組相比較,在動物族群中降低了乳頭狀瘤 疾病的負擔。 已經在各種物種中,包括绵羊、狗、兔子、猴子、牛和 馬,觀察到乳頭狀瘤病毒的感染。已經將人類的乳頭狀瘤 病毒(HPV)分類成 80 型以上[Epidemiology and Biology of
Cervical Cancer Seminars in Surgical Oncology 1999 16:203-211. Wolfgang MJ,Schoell MD,Janicek MF 和 Mirhashemi R.],以DNA序列同種性的程度為基礎,將其中 一些進一步細分為亞-型(例如6a和6b型)。乳頭狀瘤病毒通 常感染上皮,但不同的HP V型引起不同的疾病。例如,1 -4、 7、10和 26_29型引起良性的疣,16、18、31、33、35、39' 45、51、52、56、58、59和68型則與子宮頸癌有關,而6和 11型涉及生殖器疣(生殖道之非-惡性的濕疣)。 已經證實HPV不易在組織培養中生長,所以沒有傳統活 的或減毒的病毒疫苗。亦已經因為缺乏可在其中研究人類 病毒之適當動物模式,而減緩了 HPV疫苗的發展。這是因 為病毒是高度物種專一的,所以利用得自不同物種之宿主 的乳頭戒瘤病毒,非常不易感染動物,因此在首次在人類 身上試驗疫苗之前,需要安全性測試。 乳頭狀瘤病毒具有編碼命名為E1至E7、L1和L2in早期’· 200411055 和π晚期’’基因的DNA基因組。早期基因序列已經顯示具有 與病毒DNA複製和轉錄、躲避宿主免疫力,以及改變正常 宿主細胞周期和其他過程有關的功能。例如,E1蛋白質是 ATP-依賴性DNA解螺旋酶,並涉及病毒DNA複製過程的發 動,而E2是調節蛋白質,控制病毒基因表現和DNA複製。 經由其與E1和病毒複製起點結合的能力,E2引起E1在起點 的局部濃縮,因此刺激病毒DNA複製的發動。E4蛋白質好 像有許多未完全定義的功能,但其中可與宿主細胞之細胞 骨架結合,而E5似乎延遲内囊胞的酸化作用,結果增加了 EGF受體在細胞表面的表現,並已知E6和E7兩者分別與細 胞蛋白質p53和pRB結合。已知得自與子宮頸癌有關之HPV 型的E6和E7蛋白質是致癌基因。L1和L2編碼兩個病毒結構 (衣殼)蛋白質。 在歷史上,已經將疫苗視為一種預防病原體感染的方 法,使免-疫系統認得應該發生感染的病原體,並中和之。 疫苗包括一或多個得自病原體的抗原,通常是完整的生 物,殺死的或為減弱(減毒)之形式,或得自生物之所選用的 抗原性肽。當免疫系統暴露在抗原(們)下時,產生在個體的 一生中保有免疫學”記憶π的細胞。後續暴露在相同的抗原 下時(例如當被病原體感染時),刺激特定的免疫反應,其結 果導致感染原的排除或失活。 免疫犮應有兩樣武器:體液(抗體)反應和細胞-調解的反 應。在被感染之宿主細胞内,加工處理衍生自在細胞内複 製之病原體(病毒和一些細菌)的蛋白質抗原,釋放出短肽, 200411055 接著將其展現在被感染的細胞表面上,與第1類主要組織相 容性分子(MHC I)結合。當該MHC I和肽的結合複合體與抗 原-專一之CD8+ T-細胞接觸時,激活該T-細胞,獲得胞毒 活性。這些胞毒性T-細胞(CTLs)可溶解被感染的宿主細 胞,所以限制了感染病原體的複製和散播。免疫反應的另 一個重要武器是由CD4+ T-細胞控制。當將衍生自病原體的 抗原釋放置細胞外環境内時,它們可被特化的提供-抗原之 細胞(APCs)攝取,並展現在這些細胞的表面上,與MHC II 分子結合。認出在該複合體中之抗體,刺激CD4+ T-細胞分 泌可溶性因子(細胞激動素),其調節其他T-細胞的效應物機 制。抗體是由B-細胞產生。抗原與分泌出之抗體的結合可 中和病原體的感染力,而抗原與在B-細胞表面上與膜結合 之抗體的結合,刺激B-細胞分裂,如此擴大了 細胞反應。 一般而言,控制細菌感染需要良好的抗體反應,而控制病 毒感染則需要抗體和細胞-調解反應(CD8+和CD4+)兩者。 咸相信有可能藉著疫苗接種來利用免疫系統,即使是在 被病毒感染之後,以便藉著病原體的失活或排除,控制或 消退感染。這類M治療性的’’疫苗將需要有效的細胞-調解反 應,且按照理想地將發動體液和細胞-調解之免疫反應。 已經證實(Benvenisty,N和 Reshaf,L. PNAS 83_ 9551-9555) 以磷酸鈣沉澱之DNA接種老鼠,結果表現出由該DNA編碼 的肽。接"著,將尚未沉澱之質體DNA肌肉内注射至老鼠内, 顯示將該DNA攝入肌肉細胞内,並表現編碼蛋白質的結 果。因為DNA的表現,導致在宿主細胞内產生經過編碼之 200411055 病原體蛋白質,像在自然的感染中,該機制可刺激治療性 疫苗接種所需的細胞-調節之免疫反應。在w〇9〇/丨丨〇92中描 述了 DNA疫苗(vical,Inc.)。 可藉著肌肉内注射以外的機制,遞送DNA疫苗。例如, 遞送至皮膚内,利用免疫機制在為感染之障礙的組織,像 是皮膚和黏膜中,是具有高度活性的事實。可經由注射、 噴射注射(其在壓力下迫使液體進入皮膚内),或經由顆粒撞 擊,遞送至皮膚内,其中可以足夠的濃度將DNa塗覆在顆 t上以便男穿上皮(美國專利第5 3 71015號)。這些顆粒發 射至皮膚内,結果直接轉移感染上皮細胞和上皮蘭格漢 (Langerhan)細胞。蘭格漢細胞是提供抗原的細胞(Apc),其 k入DNA,表現編碼之肽,並加工處理這些,以便展現在 細胞表面MHC蛋白質上。經過轉移感染的蘭格漢細胞移動 至淋巴結,在那裡它們將已經展現的抗原片段提交給淋巴 細胞,發動免疫反應。經由顆粒遞送至皮膚内誘發免疫反 應,需要極少量的DNA (0.5-1微克),與已知在直接肌肉内 /主射之後產生免疫反應所需之愛克用量的Dna顯然有別。 已經在例如使用由L1和L2衣殼蛋白質形成之類病毒顆 粒,或僅使用這些蛋白質的研究(1)中,報告Hpv具有不佳 的免疫原性。此外,已經證實HPV基因不易在人類或其他 哺乳動物細胞中表現,導致在發展蛋白質次單元疫苗上的 困難。已經證實單順反子(monocystronic) E1對於在哺乳動 物中由異種的啟動基因來表現,是特別有抵抗力的斤
Virology 1999 73, 3062-3070。Remm m,Remm a及Mart Ustav· 88379.doc -10- 200411055 藉著不連續的掃描機制,從多順反子mRNA轉譯人類乳頭狀 瘤病毒 18 型 El (Human papilloma virus type 18 El is translated from polycistronic mRNA by a discontinuous scanning mechanism))。最常使用含有HPV起點之質體的活 體外DNA複製作為代用品,檢測El的表現(Lu,JZJ,Sun等人 J. Virol 1993 67,713 1-7139和 Del Vecchio AM等人 J. Virol 1992 66, 5949-5958) 〇 國際專利申請案WO 02/08435提供了 HPV多核甞酸,其中 已經使該序列最優化,類似高度表現之人類基因使用率圖 案。特別揭示最優化的密碼子HPV 6b E1和HPV 11 E2。 【發明内容】 本發明提供新穎的核酸構築體,其可用來預防,更特定 而言可用來治療人類乳頭狀瘤病毒引起之生殖器疣,或其 他HPV引起的後果。 根據本發明的第一項觀點,提供編碼含有得自至少兩‘ 不同早期抗原之抗原決定位的多蛋白之核酸構築體。本發 明最好提供編碼包括得自三個不同早期抗原之抗原決定位 的多蛋白之核酸構築體。已經藉由本發明顯示這類構築體 在動物模式中,比單一蛋白質方法更有效。 【實施方式】 較佳的構築體包括編碼得自兩個不同HP V基因型之E2的 核酸,像是HPV6b和得自HPV-11之E2。此外,若出現E1編 碼序列也是較佳的。E1最好是得自HPV 6或11。 較佳的構築體包括具有下列排列的核酸分子: 88379 -11 - 200411055 1) HPV6bEl-HPV6bE2-HPVllE2 2) HPV6bE2-HPV6bEl-HPVllE2 3) HPV6bE2-HPVl lE2-HPV6bEl 最佳的是,所有上述多蛋白的核酸序列都已經是最優化 的密碼子,類似高度表現之人類基因的密碼子使用率。E1 和E2基因較好是實質上全長的,或更佳的是全長的。實質 上全長的意指編碼至少85%,較佳的是90%的E1和E2多肽。 令人驚訝的是,這類構築體表現出與最優化密碼子之個體 蛋白質相等的表現程度,並具有編碼多蛋白之單一質體的 優點,即比三個個別質體更便宜且更容易製造。 這些基因最好是最優化的密碼子,使得密碼子使用率圖 案類似肌動蛋白,一種高度表現的人類基因產物。 多核苷酸序列可以是DNA序列,例如雙股的DNA序列。 該多核苷酸序列較好編碼HPV6、11、16、18、33或45型, 最好是11型、6a亞型或6b亞型的HPV多肽。在某些具體實施 例中,編碼之胺基酸序列是野外型HP V胺基酸序列。在另 一個具體實施例中,編碼之胺基酸序列是突變的HP V胺基 酸序列,包括帶有胺基酸改變的野外型序列,例如胺基酸 點突變,足以降低或使該多肽之一或多個天然生物功能失 活。仍希望突變之胺基酸序列保留野外型多肽的免疫原 性。由本發明之多核苷酸編碼的蛋白質,亦形成本發明之 觀點。 在E1的案例中,主要的生物學角色是在被感染的細胞 中,發動病毒專一的DNA複製。最好是使E1突變,而使其 88379 -12- 複製效能失活。
較佳的突變是:G 482 D
K 83 G R 84 G 較佳的是包括二或多個突變。 最佳的是包括3個突變。 杜的茉例中 咬疋興核蛋 主要複製起點認知蛋白質—樣的广δ的位置,具有舊 製複入1㈣ 功能,並有助於前-起始福 t複口目豆的裝配。最好是使Ε2 較佳突變是Κ111Α。 μ失活。達成該目標的 根據本發明的—项觀點,多核|酸之密碼子使用率圖案 最好排除在人財高度表現之基因中,具有麟0.2之RSCU ^的密碼子。相對同義密碼子使用率(rscu)值是觀察到之 密碼子總數’除以若胺基酸以同㈣率使料有密碼子時 的預期數。本發明之多料酸通常將具有超過Q3之高度表 現 < 人類基因的密碼子使用率係數,較佳的是超過〇 4,最 好疋超過0·5。根據本發明的第二項觀點,提供包括其之表 現載體,並能夠指揮根據本發明之多核苷酸序列的表現, 孩多核甞酸編碼具有得自二或多個早期抗原之抗原決定位 的多肽。該載體適合用來駕馭異種DNA在細菌、昆蟲或哺 乳動物細胞中的表現,特別是人類細胞。在一個具體實施 例中,該表現載體為p7313PLc。 在更進一步的觀點中,本發明提供包括本發明之蛋白質 或載體,或多核苷酸序列的疫苗組合物。該疫苗組合物最 88379 -13 - 200411055 好包括根據本發明之DNA㈣。在較㈣具时施例中, 該疫苗組合物包括多個以包括含有多㈣酸序列之載體的 舰塗覆之顆粒,最好是金顆粒,該多核誓酸序列係編碼 具有得自二或多個早期抗原之抗原決定位的纽。在另外 的具體實施例中,該疫苗組合物包括在藥學上可接受之賦 形劑,以及根據本發明第二項觀點的職載體。該疫苗組 合物亦可包括佐劑。 在更進-步的觀點中,本發明提供製造疫苗組合物的方 法,包括建構編碼具有得自二或多個早期抗原之抗原決定 位的多肽之乡财酸,錢用在藥學上可接受之賦形劑調 配。 亦提供根據本發明之多核苷酸或載體,在治療或預防 HPV感染上的用途,最好是刪6、n、i6_型的感染。 本發明亦提供根據本發明之多核#酸或載體,在治療或預 防皮膚(皮膚)疲生殖器疲、未判定重要性之非典型鱗狀細 胞(ASCUS)、子宮頸發育異常、子宮頸上皮内贅生物(cin) 或子S頸癌上的用途。因此,本發明亦提供根據本發明之 多核甞酸或載體,在製造用來治療或預防HPV感染或任何 與其有關之症狀或疾病之疫苗上的用途。 本發明亦提供治療或預防HPV感染或任何與其有關之症 狀或疾病的方法,包括投予有效含量的根據本發明之蛋白 質、多核甞酸或載體,或疫苗。疫苗的投予,可採用一或 多個個別劑量的形式,例如以,,基礎_補強,,的攝生法。在某 些案例中,"基礎”疫苗接種可經*DNA疫苗遞送,特別是 88379 -14- 200411055 經由根據本發明之多核:y:酸的顆粒調節之DNA遞送,最妤 併入質體-折生的載體内’並藉著投予包括相同多核甞酸序 列的重組病毒載體”補強”。或者,蛋白質佐劑法可擔任基 礎或補強法的一部分,使DNA遞送成為基礎_補強攝生法的 另一助力(該蛋白質與由DNA編碼之蛋白質相同)。 在本說明書和附錄的申請專利範圍中,將”包括"和,,包含,, 一字,以及諸如此類的變化,解釋為包括。即這些字在前 後文容許之處,企圖傳達可能包括其他未特別列舉的元件 或成分。 ’·變體"一詞意指編碼與本發明之其他多核苷酸相同之 胺基酸的多核苷酸,但因其經過冗長的遺傳密碼,故有不 同的核苷酸序列,卻仍維持相同的密碼子使用率圖案,例 如具有與其他多核苷酸相同的密碼子使用率係數,或在〇1 内’較好是在0.05内的密碼子使用率係數。 ’·密碼子使用率圖案π —詞意指在正在討論中之核荅酸^ 列、基因或基因種類(例如高度表現之哺乳動物基因)中,所 有密碼子的平均頻率。可在文獻中找到哺乳動物,包括人 類的密碼子使用率圖案(參見,例如Nakamura等人Nucleic Acids Research 1996, 24:214-215)。 在本發明的多核誓酸中,將密碼子使用率圖案,從人類 乳頭狀瘤病毒的代表圖案,改為更密切代表人類偏愛的密 碼子圖棄。”密碼子使用率係數”是特定多核甞酸序列的密 碼子圖案有多麼類似標靶物種的測量值。至於許多物種的 高度表現基因,密碼子頻率可衍生自文獻來源(參見,例如 88379 -15- 200411055
Nakamura等人Nucleic Acids Research 1996,24.214-215)。對 於20個天然胺基酸的每一個,將61個密碼子中每一個的密 碼子頻率標準化(以在所選擇之基因種類的每1〇〇〇個密碼 子中出現的數目來表示)’將每個胺基酸最常使用之密碼子 的值設足為1,並將較少見之密碼子的頻率按比例放在〇到工 之間。因此,對於標靶物種之高度表現的基因,分別指派 61個密碼子1或較低的值。為了計算特定多核甞酸的密碼子 使用率係數,相對於該物種的高度表現基因,記錄特定多 核菩酸每個密碼子的按比例值,並取得所有這些值的幾何 平均值(藉著將這些值之自然對數的總和除以密碼子之總 數,再取得反-對數)。係數將具有在〇到丨之間的值,且係數 越高,則在該多核苷酸中就有越多的密碼子是常用的密碼 子。若多核謀酸序列具有1之密碼子使用率係數,則所有的 密碼子均是標靶物種之高度表現基因”最常用的,,密碼子。 較短的-多核甞酸序列亦在本發明的範圍内。例如,本奏 明之多核甞酸可編碼HPV蛋白質的片段。只要證實該多枋 苷酸所編碼之多肽具有HP V抗原性,便將編碼長度為至少8 個,例如ι-ίο個胺基酸,或高達20、50、60、7〇、8〇、m 150或200個胺基酸之片段的多核甞酸,視為落在本發明的 範圍内。本發明之觀點,特別但並非唯一地包括當多核苷 酸編碼完整HP V蛋白質序列的片段,並可代表該蛋白質之 一或多個個別抗原決定位的狀況。 如同上文討論的,本發明包括表現載體,其包括本發明 之核誓酸序列。可以分子生物學之技藝例行地建構這類表 88379 -16· 200411055 現載體,並可能涉及例如質體dna,以及適當之起始物、 啟動基因、促進子和其他元件的使用,像是例如可能是必 要的聚腺苷酸化作用信號,其位在正確的方位,以便容許 蛋白質表現。其他適當的載體,對熟諳此藝者而言將是明 顯的。關於這一點,憑藉更多的實例,我們參考Sambrook 等人Molecular Cloning: a Laboratory Manual.第 2版,CSH Laboratory Press· (1989) 〇 較佳的是,本發明之多核苷酸,或在本發明中在載體中 使用的多核甞酸,以可操作之方式與控制序列連接,其能 夠提供由宿主細胞表現密碼序列,即該載體為表現載體。 π以可操作之方式連接’’ 一詞意指並列,其中所述的組份是 以容許它們以其想要之方式發揮功能的關係。以這樣的方 式安置與密碼序列’’以可操作之方式連接的”調節序列,像 是啟動基因,以便在可與該調節序列相容的條件下達成密 碼序列的-表現。 載體可以是例如質體、人造的染色體、病毒或噬菌體載 體,其提供複製起點,可視需要提供用來表現該多核甞酸 的啟動基因,並可視需要提供該啟動基因的調節者。載體 可含有一或多個可選擇標記基因,例如在細菌質體之案例 中為氨苄青黴素或康黴素抗藥性基因,或可供真菌載體使 用的抗藥性基因。可在活體外使用載體,例如用來產製DN A 或RN A「或用來轉移感染或轉化宿主細胞,例如哺乳動物 宿主細胞。亦可改編載體,以供在活體内使用,例如在DNA 疫苗接種或基因治療的方法中。 88379 -17- 200411055 可選擇與企圖在其中表現之宿主細胞可相容的啟動基因 及其他表現調節信號。例如,哺乳動物啟動基因包括金屬 硫肽啟動基因,其可反映諸如鎘之類的重金屬而被謗發, 以及β-肌動蛋白啟動基因。亦可使用病毒啟動基因,像是 SV40大Τ抗原啟動基因、人類細胞巨大病毒(CMV)速發早期 (ΙΕ)啟動基因、勞氏肉瘤病毒LTR啟動基因、腺病毒啟動基 因,或HP V啟動基因,特別是HP V上游調節區(URR)。所有 的這些啟動基因均為此項技藝中可輕易獲得的。 適當之病毒載體的實例,包括單純疱疹病毒載體、牛痘 病毒或α-病毒載體,以及逆轉錄病毒,包括慢病毒、腺病 毒和腺病毒伴隨病毒。使用這些病毒的基因轉移技術,為 熟諳此藝者已知的。例如,可使用逆轉錄病毒載體,將本 發明之多核甞酸穩定地整合到宿主基因組内,雖然這類重 組作用並不是較佳的。相反地,複製-缺陷腺病毒載體仍然 是附加體,並因此容許暫時性的表現。可使用能夠在昆^ 細胞中(例如桿狀病毒載體)、在人類細胞或在細菌中駕馭表 現的載體,以便定量產生由本發明之多核甞酸編碼的HP V 蛋白質,例如用來作為次單元疫苗。較佳的病毒載體是衍 生自非-人類靈長動物腺病毒的那些,像是C68黑猩猩腺病 毒(美國專利第6,083,716號),在他處則稱為Pan 9。 在發現本發明之多核甞酸是用來作為治療劑之處,例如 在接種D_NA疫苗時,將該核酸投予哺乳動物,例如欲接種 疫苗的人。以載體之形式提供核酸,像是RNA或DNA,最 妤是DN A,像是上述的那些,其可在哺乳動物的細胞中表 88379 -18 - 200411055 現。可藉著任何可利用的技術投予該多核苷酸。例如可藉 著、十員/主射,瑕好是皮内、皮下或肌肉内,導入核酸。或 者’可使用核酸遞送裝置,像是顆粒-調節的DNA遞送 (PMDD),直接越過皮膚遞送核酸。在該方法中,以核酸塗 覆惰性的顆粒(像是金小珠),並加速至足以使其貫穿接受者 表面(例如皮膚)的速度,例如藉著在高壓下從投射裝置中發 射(以本發明之核酸分子塗覆的顆粒,亦在本發明的範圍 内,像裝載這些顆粒的裝置一樣)。 將裸露的多核甞酸或載體導入患者内的適當技術,包括 以適當的媒劑局部塗覆。可將核酸局部投予至皮膚,或至 黏膜表面,例如藉著鼻内、口服、陰道内或直腸内投予。 裸露的多核苷酸或載體可與在藥學上可接受之賦形劑一起 提供,像是磷酸緩衝的生理鹽水(PBS)。可藉著在組合物中 加入促進劑,像疋布比卡因(bUpivacaine),進一步促進Dna 的攝取。其他將核酸直接投予接受者的方法,包括超音波-、 電刺激、電穿透作用,以及在美國專利第5,697,9〇1號中揭 示的顯微播種。 可藉著數個已知的轉移感染技術,例如包括使用轉移感 染劑的那些,提高核酸構築體的攝取。這些製劑的實例包 括陽離子性製劑,例如磷酸鈣和DEAE_葡聚糖和脂染體 (lipofectants) ’ 例如月曰染坦(lipofectam)和轉染坦(transfectam) 。可改變欲投予之核酸的劑量。通常以範圍在〗微微克到j 毫克的用量,投予核酸,關於顆粒調解之基因遞送,最好 是1微微克到10微克,至於其他的路徑,則是10微克到1毫 88379 •19- 200411055 克。 亦可藉著在基因療法中使用的特化遞送載劑,投予本發 明之核酸序列。例如,由Verme等人,Nature 1997,389:239·» 242討論了基因治療方法。以病毒為基礎的系統包括逆轉錄 病毒、慢病毒、腺病毒、腺病毒伴隨病毒、疱疹病毒、以 金絲雀痘(CanaryP〇x)和牛痘病毒為基礎的系統。以非_病毒 為基礎之系統包括直接投予核酸和以微脂粒為基礎的系 統。 亦可藉著經過轉化的細胞,投予本發明之核酸序列。這 類細胞包括獲自個體的細胞。可在活體外將本發明之裸露 的多核甞酸或載體導入這類細胞中,稍後可將經過轉化的 細胞送回個體内。可藉著同種重組事件,將本發明之多核 苷酸整合到已經出現在細胞中的核酸内。若需要,可使經 過轉化的細胞在活體外生長,並可在本發明中使用一或多 個所得到的細胞。可藉著已知的手術或顯微手術技術(例如 移植、顯微注射等等),提供在患者之適當位置處的細胞。 本發明之疫苗組合物可包含佐劑化合物,其可用來增加 由蛋白質本身,或由質體DNA編碼之蛋白質謗發的免疫反 應。雖然在本文中提出改變密碼子的偏愛,使其適合接種 疫苗的物種,作為增加表現並藉此補強免疫反應的方法, 但可能仍然想要佐劑,因為雖然DNA疫苗在老鼠模式中有 順利運轉的傾向,但有在較大的物種,像是非_人類靈長類 中效力稍微較弱的證據,認為這是在人類中有類似效力的 預告。 88379 -20 - 200411055 本發明之疫苗組合物亦可包括佐劑,像是例如在具體實 施例中的咪峻莫(imiquimod)、投克爾索(tucaresol)或明礬。 最好與本發明同時投予佐劑,且在較佳的具體實施例 中,與本發明一起調配。本發明期待的這類佐劑,包括但 不限於下列的一覽表,且不排除其他的製劑··合成的咪唑 并ττ奎淋,像是咪4莫[S_26308,R-837](Harrison等人單獨使 用咪喳莫或與糖蛋白疫苗併用,降低再發的HSV疾病 (Reduction of recurrent HSV disease using imiquimod alone or combined with a glycoprotein vaccine), Vaccine 19:1820-1826,(2001))),·以及瑞喜峻莫(resiquimod)[S-28463,R-848] (Vasilakos等人佐劑激活免疫反應修改劑R-848:與CpG ODN 相比較(Adjuvant activates of immune response modifier R_848: Comparison with CpG ODN)1, Cellular immunology 204: 64-74 (2000).),羰基的西福鹽基和胺類,其在組成上 表現在提供抗原之細胞和T-細胞表面上的,像是投克爾索 (Rhodes,J.等人藉著共同刺激之形成西福鹽基的藥物,免疫 系統之治療效力(Therapeutic potentiation of the immune system by costimulatory Schiff-base-forming drugs), Nature 377: 71-75 (1995)),細胞激動素、化學激動素和共同-刺激 之分子,Thl謗導物,像是干擾素γ、IL-2、IL-12、IL-15和 IL-18,Th2謗導物,像是IL-4、IL_5、IL-6、IL-10和 IL_13, 以及其他化學激動素和共同-刺激基因,像是MCP-1、 ΜΙΡ_1α、-ΜΠΜβ、RANTES、TCA-3、CD80、CD86和 CD40L, 其他免疫刺激的標靶配體,像是CTLA-4和L-選擇蛋白,細 胞凋零刺激蛋白質和肽類,像是Fas,(49),以合成之脂質為 88379 -21 - 200411055 基礎的佐劑,像是維克司菲克汀(vaxfectin),(Reyes等人, ’維克司菲克汀提高了抗原專一的抗體力價,並維持對質體 DNA 免疫的 Thl 型免疫反應(Vaxfectin enhances antigen specific antibody titres and maintains Thl type immune responses to plasmid DNA immunization)’,Vaccine 19: 3778-3 786)、角鯊烯、a-生育酚、多乙氧基醚80、DOPC和膽固醇、 内毒素、[LPS]、(Beutler,B·,’内毒素、類-Toll受體4和傳入 肢的先天免疫力(Endotoxin, Toll-like receptor 4, and the afferent limb of innate immunity)’, Current Opinion in Microbiology 3: 23-30 (2000)) ; CpG寡-和二·核苷酸(Sato, Y. 等人,’有效皮内基因免疫所需的免疫刺激之DNA序列 (Immunostimulatory DNA sequences necessary for effective intradermal gene immunization)’,Science 273 (5273): 352-354 (1996)。Hemmi,H·等人,,類-Toll受體認出細菌的DNA(A Toll-like receptor recognizes bacterial DNA)’,Nature 408: 740-745,(2000)),以及其他有效的配體,其誘發Toll受體產 生Thl-謗導之細胞激動素,像是合成的分枝桿菌脂蛋白、 分枝桿菌蛋白pl9、肽聚糖、磷壁酸質和脂質A。 主要謗起Thl -型反應的某些較佳佐劑,包括例如脂質a 衍生物,像是單鱗酸脂質A,或較佳的是3-脫醯化之單 磷酸脂質 A。MPL®佐劑可獲自 Corixa Corporation(Seattle, WA ;參見例如美國專利第4,436,727號;4,877,611號; 4,866,034號和4,912,094號)。含有CpG之寡核嘗酸(其中該 CpG二核钵酸是未被甲基化的)亦主要誘導Thl反應。已知並 在例如 WO 96/02555、WO 99/33488和美國專利第 6,008,200 88379 -22- 200411055 號和5,856,462號中描述了這類寡核苷酸。亦由例如Sato等 人,Science 273··352, 1996,描述了免疫刺激性的DNA序列。、 其他較佳的佐劑包括皂角嘗,像是Quil Α或其衍生物,包括 QS21 和 QS7 (Aquila Biopharmaceuticals Inc., Framingham, ΜΑ);七葉素(Escin);毛地黃皂苷;或絲石竹(Gypsophila) 或昆諾棻(Chenopodium quinoa)皂角甞。 在具體實施例中,佐劑包括免疫刺激性之CpG寡核苷 酸,像市在(WO 96102555)中揭示的。代表性的免疫刺激性 寡核茫酸,長度在8-100個鹼基之間,並包括通式XiCpGX2, 其中Xi.Xa是核苷酸鹼基,且C和G是未被甲基化的。 用在本發明之佐劑或疫苗中較佳的寡核苷酸,較好含有 二或多個二核苷酸CpG基序(motif),較好被至少三個,較佳 的是至少六或多個核苷酸分開。本發明之寡核甞酸通常是 脫氧核甞酸。在較佳的具體實施例中,在寡核苷酸中的核 苷酸間鍵結是二硫代磷酸鹽,或更佳的是硫代磷酸鹽键 結,雖然磷酸二酯和其他的核苷酸間鍵結亦在本發明的範 圍内,包括帶有混合核甞酸間鍵結的寡核苷酸。亦可使用 其他使寡核甞酸穩定的核甞酸間鍵結。在美國專利第 5,666,153號、美國專利第5,278,3 02號和〜〇 95/26204中描述 了產製硫代磷酸鹽寡核苷酸或二硫代磷酸鹽的方法。 較佳之寡核甞酸的實例,具有下列的序列。該序列最好 含有硫代磷酸鹽修改的核甞酸間键結。 寡 1 : TCC ATG ACG TTC CTG ACG TT (CpG 1826)(序列識 別24號) 88379 -23 - 200411055 寡2 : TCT CCC AGC GTG CGC CAT (CpG 1758)(序列識別 25 號)— 寡 3 : ACC GAT GAC GTC GCC GGT GAC GGC ACC ACG (序 列識別26號) 寡4 : TCG TCG TTT TGT CGT TTT GTC GTT (CpG 2006)(序 列識別27號) 寡 5 : TCC ATG ACG TTC CTG ATG CT (CpG 1668)(序列識 別28號) 另一種CpG寡核苷酸可包括上文的較佳序列,即其具有 對其不重要的刪除或添加。 可藉著此項技藝中已知的任何方法(例如歐洲專利第 468520號),來合成在本發明中使用的CpG寡核苷酸。可便 利地使用自動合成器,合成這類寡核嘗酸。含有CpG寡核 嘗酸的佐劑調配物,可以'’ImmunEasy’’之商標名稱購自 Qiagen 〇 - 下列的實例係進一步解釋本發明,並參考附錄的圖片。 1.質體:pWRG7077 6be2 c/o突變的 感興趣的基因: HPV6be2基因的尺寸約為1 · 1 Kb,並使用叫做Syngene的 視覺基本程式創造密碼子最優化序列(對人類表現而言)。此 外,該序列在胺基酸位置111處包括密碼子改變,藉以將在 野外型中的離胺酸殘基(AAG)改為丙胺酸殘基(GCA),創造 突變的基因。該改變使6be2的轉錄活性失活。按照所設計 的,利用在5’和3’端選出的限制位置,將重疊的引子併入完 88379 -24- 200411055 整的基因内。 選殖: 以凝膠純化1.1 kb的PCR片段,並以限制酵素Not I和Bam HI消化,以便連接到載體PWRG7077 (Powderject)内。該基 因在完整的速發早期CMV啟動基因的控制之下’並具有牛 生長荷爾蒙聚A尾。 定序該純種系,指出許多的驗基錯誤。藉著限制消化’ 確認許多能夠建構正確基因序列的純種系。從再度-選殖 中,發現一個純種系C7僅在位置497處具有一個鹼基對錯誤 (丁至C)。其他純種系在該處是沒問題的,而正好需要一個 簡單的片段交換,修正該錯誤。證實最終的純種系C7a是密 碼子最優化的突變6be2 (參見圖2)。 在PWRG7077中的6be2序列(序列識別1號)
ATGGAAGCTATTGCCAAGCGACTGGACGCCTGCCAGGAGCAGCTGCTGGAGCTGTACGA GGAAAACAGCACAGACCTCCACAAGCACGTGCTGCACTGGAAGTGCATGCGCCACGAGT-
CAGTGCTCCTGTACAAGGCCAAGCAGATGGGGCTGTCCCACATCGGGATGCAGGTCGTG
CCCCCGCTGAAGGTGAGCGAAGCCAAGGGCCACAACGCTATCGAGATGCAGATGCACCT
GGAGAGCCTGCTGCGGACCGAATACAGCATGGAGCCCTGGACTCTCCAGGAGACGTCCT
ACGAAATGTGGCAGACTCCTCCGAAGCGCTGTTTCGCAAAGCGCGGCAAGACAGTTGAG
GTGAAATTCGATGGGTGCGCAAACAACACGATGGACTACGTGGTGTGGACCGATGTCTA
CGTGCAGGACAATGACACCTGGGTGAAGGTACATAGTATGGTGGATGCCAAGGGCATCT
ATTACACCTGCGGGCAGTTCAAGACGTACTACGTCAACTTCGTCAAGGAAGCCGAAAAG
TATGGTTCCACCAAGCACTGGGAGGTGTGTTACGGGAGTACTGTGATCTGCAGCCCCGC
CTCCGTGTCGTCCACCACCCAGGAAGTGAGCATTCCGGAGAGCACCACATACACCCCGG
CCCAAACGAGCACGCTCGTCAGCAGCAGCACCAAGGAGGACGCCGTCCAGACGCCCCCC
CGGAAGAGGGCCCGGGGGGTCCAGCAGTCTCCCTGCAATGCCCTGTGCGTTGCTCACAT
CGGCCCTGTCGATTCTGGGAACCACAATCTCATCACGAACAACCACGACCAGCACCAAA
GGCGCAACAACTCTAACAGCTCCGCAACTCCAATAGTGCAGTTCCAGGGGGAGTCCAA.C
TGCCTCAAGTGTTTCCGCTACCGCCTCAACGACCGCCACCGCCACCTGTTCGACTTGAT
CAGTTCCACGTGGCACTGGGCCAGCAGCAAGGCGCCCCACAAACACGCTATCGTGACGG
TGACCTACGACTCCGAGGAGCAGAGGCAGCAGTTCCTGGACGTCGTGAAGATTCCTCCG
ACAATCAGCCACAAGCTTGGCTTCATGTCCCTGCACCTGCTGTGA -25 - 88379 200411055 胺基酸序列(序列識別2號)
MEAIAKRLDA CQEQLLELYE ENSTDLHKHV LHWKCMRHES VLLYKAKQMG LSHIGMQWP PLKVSEAKGH NAIEMQMHLE SLLRTEYSME PWTLQETSYE MWQTPPiCRCF AKRGKTVEVK FDGCANNTMD YWWTDVYVQ DNDTWVKVHS MVDAKGIYYT CGQFKTYYVN FVKEAEKYGS TKHWEVCYGS TVICSPASVS STTQEVSIPE STTYTPAQTS TLVSSSTKED AVQTPPRKRA RGVQQSPCNA LCVAHIGPVD SGNHNLITNN HDQHQRRNNS NSSATPIVQF QGESNCLKCF RYRLNDRHRH LFDLISSTWH WASSKAPHKH AIVTVTYDSE EQRQQFLDW KIPPTISHKL GFMSLHLL 2.質體:p7313plc 6bel c/o mut 感興趣的基因: HPV6bel基因的尺寸約為2 Kb,並使用叫做Syngene的統 計視覺基本程式創造密碼子最優化的野外型(wt)(對大腸样 菌和人類表現而言)。按照所設計的,利用在51和3’端選出 的限制位置,將重疊的引子併入完整的基因内。然後以Bam HI和Not I限制酵素消化合成的基因,以便連接到載體pCIN4 内。從許多選出之純種系的定序資料中,發現許多鹼基錯 誤。藉著在p7313-plc内,混合得自純種系#24的正確Pst I-BamHI片段和得自純種系#21的Notl-Pstl片段,產生正確 的純種系。藉著定序證實正確的純種系(#1)。為了突變生成 作用,設計改變下列胺基酸的引子:在位置83處將離胺酸 (AAA)改為甘胺酸(GGA),在位置84處將精胺酸(CGC)改為 甘胺酸(GGC),並在位置482處將甘胺酸(GGC)改為天冬醯 胺(GAC) 〇 6be 1密碼子最優化的突變序列(序列識別3號)
ATGGCAGACGATTCCGGTACTGAGAACGAAGGTTCTGGTTGTACCGGTTGGTTCATGGT
TGAAGCAATCGTTCAGCATCCGACTGGTACCCAGATCTCCGATGACGAAGACGAAGAAG
TTGAAGATTCTGGTTACGACATGGTTGACTTCATCGATGACTCCAACATCACTCATAAC -26- 88379 200411055
TCTCTGGAAGCACAGGCTCTGTTTAACCGCCAGGAAGCTGATACCCATTACGCTACTGT
TCAGGACCTGGGAGGCAAATATCTGGGCTCTCCGTACGTTTCCCCGATCAACACTATCG
CAGAAGCAGTTGAGTCTGAAATCTCCCCGCGCCTGGACGCTATCAAACTGACTCGTCAG
CCGAAGAAGGTTAAACGTCGTCTGTTCCAGACTCGTGAACTGACCGACTCCGGTTACGG
TTATAGCGAAGTTGAGGCTGGCACCGGCACCCAGGTTGAAAAACACGGTGTACCGGAAA
ACGGCGGCGACGGTCAGGAAAAGGACACCGGCCGCGACATCGAGGGTGAGGAACACACC
GAAGCTGAAGCTCCGACTAACTCTGTTCGTGAACACGCAGGTACTGCGGGTATCCTGGA
ACTGCTGAAATGCAAAGACCTGCGCGCGGCTCTGCTGGGCAAATTCAAAGAATGCTTCG
GCCTGTCTTTCATTGACCTGATCCGTCCGTTTAAGTCTGACAAAACTACCTGTCTGGAC
TGGGTTGTAGCAGGCTTCGGCATCCACCACTCTATCTCTGAAGCATTCCAGAAA.CTGAT
CGAGCCGCTGTCTCTGTACGCGCACATCCAGTGGCTGACTAACGCTTGGGGTATGGTTC
TGCTGGTACTGCTGCGCTTTAAAGTAAACAAATCTCGTTCCACTGTTGCTCGTACTCTG
GCTACCCTGCTGAACATCCCGGAGAACCAGATGCTGATCGAACCGCCGAAAATCCAGTC
TGGTGTAGCTGCACTGTACTGGTTTCGTACTGGCATCTCTAACGCTAGCACTGTTATCG
GTGAAGCACCGGAATGGATCACTCGTCAGACCGTTATCGAACACGGTCTGGCAGATTCT
CAGTTCAAACTGACTGAAATGGTTCAGTGGGCATACGACAACGACATCTGCGAGGAATC
TGAAATTGCGTTCGAATACGCTCAGCGTGGCGACTTCGACTCCAACGCTCGTGCTTTCC
TGAACAGCAACATGCAGGCTAAATACGTAAAAGACTGCGCTACCATGTGCCGTCACTAC
AAACACGCGGAAATGCGTAAAATGTCTATCAAACAGTGGATCAAGCACCGCGGTTCTAA
AATCGAAGGTACCGGTAACTGGAAACCGATCGTTCAGTTCCTGCGCCATCAGAACATCG
AATTCATCCCGTTCCTGACCAAATTCAAGCTGTGGCTGCACGGTACCCCGAAAAAAAAC TGCATCGCTATCGTAGGTCCACCGGACACTGACAAGTCTTACTTCTGTATGTCCCTGAT^
CTCTTTCCTGGGCGGCACTGTAATCTCTCACGTTAACTCTTCCTCCCATTTCTGGCTGC
AGCCACTGGTAGACGCGAAAGTAGCTCTGCTGGACGACGCGACCCAGCCGTGCTGGATC
TACATGGATACTTACATGCGCAACCTGCTGGACGGTAACCCGATGTCTATCGACCGTAA
ACACAAAGCGCTGACTCTGATCAAGTGCCCGCCGCTGCTGGTAACTTCTAACATCGACA
TCACCAAGGAAGATAAATACAAGTACCTGCATACCCGTGTTACTACCTTTACTTTCCCG
AACCCGTTCCCGTTTGATCGTAACGGTAACGCTGTTTACGAACTGTCCAACACTAACTG
GAAATGCTTCTTCGAGCGTCTGTCTTCCTCCCTGGACATCCAGGACTCTGAAGATGAAG
AAGATGGTTCTAACTCTCAGGCTTTCCGTTGTGTTCCGGGTACTGTTGTTCGTACTCTG
TGA 胺基酸序列(序列識別4號)
MADDSGTENE 工DDSNITHNS AVESEISPRL EKHGVPENGG CKDLRAALLG
GSGCTGWFMV LEAQALFNRQ DAIKLTRQPK DGQEKDTGRD KFKECFGLSF
EAIVQHPTGT EADTHYATVQ KVKRRLFQTR IEGEEHTEAE 工DLIRPFKSD
QISDDEDEEV DLGGKYLGSP ELTDSGYGYS APTNSVREHA KTTCLDWWA
EDSGYDMVDF YVSPINTIAE EVEAGTGTQV GTAGILELLK GFGIHHSISE -27- 88379 200411055
AFQKLIEPLS LYAHIQWLTN AWGMVLLVLL RFKVNKSRST VARTLATLLN 工PENQMLIEP PKIQSGVAAL YWFRTGISNA STVIGEAPEW ITRQTVIEHG LADSQFKLTE MVQWAYDNDI CEESEIAFEY AQRGDFDSNA RAFLNSNMQA KYVKDCATMC RHYKHAEMRK MSIKQWIKHR GSKIEGTCNW KPIVQFLRHQ NIEFIPFLTK FKLWLHGTPK KNCIAIVGPP DTDKSYFCMS LISFLGGTVI SHVNSSSHFW LQPLVDAKVA LLDDATQPCW IYMDTYMRNL LDGNPMSIDR KHKALTIilKC PPIiVTSNID ITKEDKYKYIj HTRVTTFTFP NPFPFDRNGN AVYELSNTNW KCFFERLSSS LDIQDSEDEE DGSNSQAFRC VPGTWRTL 3.質體:WRG7077 lle2 c/o mut 感興趣的基因: HPVlle2基因的尺寸約為1.1Kb,並使用叫做Syngene的視 覺基本程式創造密碼子最優化序列(對人類表現而言)。此 外,該序列在胺基酸位置111處包括密碼子改變,藉以將在 野外型中的離胺酸殘基(AAG)改為丙胺酸殘基(GCC),創造 突變的基因。在文獻中已經顯示該改變使E2蛋白質的轉錄 活性失活。按照所設計的,利用在5,和3f端選出的限制位 置’將重疊的引子併入完整的基因内,並用來組裝合成的 密碼子最優化突變種lle2。 選殖: 以凝膠純化1.2 Kb的PCR片段,並以限制酵素Not I和Bam HI消化,以便連接到載體pWRG7077 (Powderject)内。該基 因在完整的速發早期CMV啟動基因的控制之下,並具有牛 生長荷爾蒙聚A尾。 定序該純種系,指出許多的驗基錯誤,接著修正這些錯 誤。發現最終的純種系F1是密碼子最優化的突變11E2。 在PWRG7077中的11 e2序列(序列識別5號) 88379 -28- 200411055
ATGGAAGCCATCGCGAAGAGGCTCGACGCCTGCCAGGACCAGCTGCTCGAGCTGTACGA
GGAGAACAGCATTGACATCCATAAGCACATCATGCACTGGAAGTGCATTCGCCTGGAGA
GCGTGCTGTTGCACAAGGCCAAGCAGATGGGCCTGTCCCACATAGGCCTTCAGGTGGTC
CCCCCTCTGACCGTGTCAGAGACAAAGGGCCATAACGCAATCGAGATGCAGATGCACCT
CGAGTCGCTGGCGAAAACACAGTACGGCGTGGAGCCATGGACCCTGCAGGACACCTCGT
ACGAAATGTGGCTGACCCCACCTAAGCGATGCTTCGCCAAACAGGGCAACACAGTGGAG
GTGAAGTTCGACGGCTGTGAGGATAACGTTATGGAGTATGTCGTGTGGACGCACATCTA
TCTGCAGGACAACGACAGTTGGGTGAAGGTGACCAGCTCCGTGGACGCGAAGGGCATCT
ACTATACCTGTGGGCAGTTTAAAACCTACTATGTGAACTTCAACAAAGAGGCCCAAAAG
TATGGCTCCACCAACCACTGGGAGGTCTGCTATGGGAGCACGGTGATTTGCTCTCCCGC
CAGCGTGTCTAGCACTGTGCGCGAGGTGAGCATTGCCGAGCCGACCACGTACACCCCTG
CCCAGACGACCGCTCCGACCGTGTCTGCTTGTACTACCGAGGACGGCGTGAGCGCTCCA
CCCAGGAAGCGTGCGAGGGGCCCAAGCACCAACAACACCCTCTGTGTGGCGAACATTCG
CAGCGTCGACAGTACCATCAATAACATCGTGACGGATAACTATAACAAGCACCAGAGGC
GTAACAACTGTCACTCTGCCGCAACCCCCATCGTGCAGCTCCAGGGAGACAGCAATTGC
CTTAAGTGCTTCCGCTATCGCCTCAACGACAAGTACAAGCACCTCTTTGAGCTCGCCTC
GTCGACGTGGCACTGGGCCTCACCCGAGGCACCTCACAAGAACGCCATCGTCACTCTCA
CTTACTCCAGTGAGGAGCAGAGACAGCAGTTTCTGAACAGCGTGAAGATCCCACCGACG
ATCCGTCATAAGGTCGGCTTCATGTCACTGCATCTCCTGTGA 胺基酸序列(序列識別6號)
MEAIAKRLDA CQDQLLELYE ENSID工HKHI MHWKCIRLES VLLHKAKQMG LSHIGLQWi PLTVSETKGH NAIEMQMHLE SLAKTQYGVE PWTLQDTSYE MWLTPPKRCF AKQGNTVEVK FDGCEDNVME YWWTHIYLQ DNDSWVKVTS SVDAKGIYYT CGQFKTYYVN FNKEAQKYGS TNHWEVCYGS TVICSPASVS STVREVSIAE PTTYTPAQTT APTVSACTTE DGVSAPPRKR ARGPSTNNTL CVAN工RSVDS T工丽工VTDNY NKHQRRNNCH SAATPIVQLQ GDSNCLKCFR YRLNDKYKHL FELASSTWHW ASPEAPHKNA IVTLTYSSEE QRQQFLNSVK IPPTIRHKVG FMSLHLL 4·免體· HPV102 (p7313me 11 e2 c/o mut) 感興趣的基因·· 從pWRG7077 lle2 c/〇 mut中將密碼子最優化的突變iie2 轉移至另一個表現載體p7313me内。 選殖: 88379 -29- 200411055 藉著Bam HI和Not I限制酵素,切下pWRG7077 lle2載體 的lle2 c/o mut片段。然後使用這些位置,將該片段連接到 p7313me載體内。 在HPV102中的lle2序列(序列識別7號)
ATGGAAGCCATCGCGAAGAGGCTCGACGCCTGCCAGGACCAGCTGCTCGAGCTGTACGA
GGAGAACAGCATTGACATCCATAAGCACATCATGCACTGGAAGTGCATTCGCCTGGAGA
GCGTGCTGTTGCACAAGGCCAAGCAGATGGGCCTGTCCCACATAGGCCTTCAGGTGGTC
CCCCCTCTGACCGTGTCAGAGACAAAGGGCCATAACGCAATCGAGATGCAGATGCACCT
CGAGTCGCTGGCGAAAACACAGTACGGCGTGGAGCCATGGACCCTGCAGGACACCTCGT
ACGAAATGTGGCTGACCCCACCTAAGCGATGCTTCGCCAAACAGGGCAACACAGTGGAG
GTGAAGTTCGACGGCTGTGAGGATAACGTTATGGAGTATGTCGTGTGGACGCACATCTA
TCTGCAGGACAACGACAGTTGGGTGAAGGTGACCAGCTCCGTGGACGCGAAGGGCATCT
ACTATACCTGTGGGCAGTTTAAAACCTACTATGTGAACTTCAACAAAGAGGCCCAAAAG
TATGGCTCCACCAAGCACTGGGAGGTCTGCTATGGGAGCACGGTGATTTGCTCTCCCGC
CAGCGTGTCTAGCACTGTGCGCGAGGTGAGCATTGCCGAGCCGACCACGTACACCCCTG
CCCAGACGACCGCTCCGACCGTGTCTGCTTGTACTACCGAGGACGGCGTGAGeGCTCCA
CCCAGGAAGCGTGCGAGGGGCCCAAGCACCAACAACACCCTCTGTGTGGCGAACATTCG
CAGCGTCGACAGTACCATCAATAACATCGTGACGGATAACTATAACAAGCACCAGAGGC
GTAACAACTGTCACTCTGCCGCAACCCCCATCGTGCAGCTCCAGGGAGACAGCAATTGC CTTAAGTGCTTCCGCTATCGCCTCAACGACAAGTACAAGCACCTCTTTGAGCTCGCCTC^
GTCGACGTGGCACTGGGCCTCACCCGAGGCACCTCACAAGAACGCCATCGTCACTCTCA
CTTACTCCAGTGAGGAGCAGAGACAGCAGTTTCTGAACAGCGTGAAGATCCCACCGACG
ATCCGTCATAAGGTCGGCTTCATGTCACTGCATCTCCTGTGA 胺基酸序列(序列識別8號)
MEAIAKRLDA
PLTVSETKGH
FDGCEDNVME
TNHWEVCYGS
ARGPSTNNTL
YRLNDKYKHL
FMSLHLL
CQDQLLELYE
NAIEMQMHLE
YWWTHIYLQ
TVICSPASVS
CVANIRSVDS
FELASSTWHW
ENSIDIHKHI
SLAKTQYGVE
DNDSWVKVTS
STVREVSIAE
TINNIVTDNY
ASPEAPHKNA
MHWKCIRLES
PWTLQDTSYE
SVDAKGIYYT
PTTYTPAQTT
NKHQRRNNCH
IVTLTYSSEE
VLLHKAKQMG
MWLTPPKRCF
CGQFKTYYVN
APTVSACTTE
SAATPIVQLQ
QRQQFLNSVK
LSHIGLQWP
AKQGNTVEVK
FNKEAQKYGS
DGVSAPPRKR
GDSNCLKCFR
IPPTIRHKVG 88379 -30 - 200411055 5.質體:HPV104 (p7313me 6b/lle2 c/o mut) 感興趣的基因: 使用2xPCR,利用HPV102和HPV110做為模板,以及適當 設計的引子,建構6be2和lle2的融合蛋白質。將約2.2kb之 融合片段選殖到在融合蛋白質之起點帶有6be2的p7313me 表現載體内。 選殖: 以Bam HI和Not I限制酵素消化2.2 kb融合物,並連接到 p7313me表現載體内。藉著定序檢查經過分離的純種系,指 出沒有錯誤已經併入。 在HPV104中的6b/lle2融合序列(序列識別9號)
ATGGAAGCTATTGCCAAGCGACTGGACGCCTGCCAGGAGCAGCTGCTGGAGCTGTACGAGGAAAACAG
CACAGACCTCCACAAGCACGTGCTGCACTGGAAGTGCATGCGCCACGAGTCAGTGCTCCTGTACAAGG
CCAAGCAGATGGGGCTGTCCCACATCGGGATGCAGGTCGTGCCCCCGCTGAAGGTGAGCGAAGCCAAG
GGCCACAACGCTATCGAGATGCAGATGCACCTGGAGAGCCTGCTGCGGACCGAATACAGCATGGAGCC CTGGACTCTCCAGGAGACGTCCTACGAAATGTGGCAGACTCCTCCGAAGCGCTGTTTCGCAAAGCGCG^
GCAAGACAGTTGAGGTGAAATTCGATGGGTGCGCAAACAACACGATGGACTACGTGGTGTGGACCGAT
GTCTACGTGCAGGACAATGACACCTGGGTGAAGGTACATAGTATGGTGGATGCCAAGGGCATCTATTA
CACCTGCGGGCAGTTCAAGACGTACTACGTCAACTTCGTCAAGGAAGCCGAAAAGTATGGTTCCACCA
AGCACTGGGAGGTGTGTTACGGGAGTACTGTGATCTGCAGCCCCGCCTCCGTGTCGTCCACCACCCAG
GAAGTGAGCATTCCGGAGAGCACCACATACACCCCGGCCCAAACGAGCACGCTCGTCAGCAGCAGCAC
CAAGGAGGACGCCGTCCAGACGCCCCCCCGGAAGAGGGCCCGGGGGGTCCAGCAGTCTCCCTGCAATG
CAGCACCAAAGGCGCAACAACTCTAACAGCTCCGCAACTCCAATAGTGCAGTTCCAGGGGGAGTCCAA
CTGCCTCAAGTGTTTCCGCTACCGCCTCAACGACCGCCACCGCCACCTGTTCGACTTGATCAGTTCCA
CGTGGCACTGGGCCAGCAGCAAGGCGCCCCACAAACACGCTATCGTGACGGTGACCTACGACTCCGAG
GAGCAGAGGCAGCAGTTCCTGGACGTCGTGAAGATTCCTCCGACAATCAGCCACAAGCTTGGCTTCAT
GTCCCTGCACCTGCTGATGGAAGCCATCGCGAAGAGGCTCGACGCCTGCCAGGACCAGCTGCTCGAGC
TGTACGAGGAGAACAGCATTGACATCCATAAGCACATCATGCACTGGAAGTGCATTCGCCTGGAGAGC
GTGCTGTTGCACAAGGCCAAGCAGATGGGCCTGTCCCACATAGGCCTTCAGGTGGTCCCCCCTCTGAC
CGTGTCAGAGACAAAGGGCCATAACGCAATCGAGATGCAGATGCACCTCGAGTCGCTGGCGAAAACAC
AGTACGGCGTGGAGCCATGGACCCTGCAGGACACCTCGTACGAAATGTGGCTGACCCCACCTAAGCGA -31 -
88379 200411055
TGCTTCGCCAAACAGGGCAACACAGTGGAGGTGAAGTTCGACGGCTGTGAGGATAACGTTATGGAGTA
TGTCGTGTGGACGCACATCTATCTGCAGGACAACGACAGTTGGGTGAAGGTGACCAGCTCCGTGGACG
CGAAGGGCATCTACTATACCTGTGGGCAGTTTAAAACCTACTATGTGAACTTCAACAAAGAGGCCCAA
AAGTATGGCTCCACCAACCACTGGGAGGTCTGCTATGGGAGCACGGTGATTTGCTCTCCCGCCAGCGT
GTCTAGCACTGTGCGCGAGGTGAGCATTGCCGAGCCGACCACGTACACCCCTGCCCAGACGACCGCTC
CGACCGTGTCTGCTTGTACTACCGAGGACGGCGTGAGCGCTCCACCCAGGAAGCGTGCGAGGGGCCCA
AGCACCAACAACACCCTCTGTGTGGCGAACATTCGCAGCGTCGACAGTACCATCAATAACATCGTGAC
GGATAACTATAACAAGCACCAGAGGCGTAACAACTGTCACTCTGCCGCAACCCCCATCGTGCAGCTCC
AGGGAGACAGCAATTGCCTTAAGTGCTTCCGCTATCGCCTCAACGACAAGTACAAGCACCTCTTTGAG
CTCGCCTCGTCGACGTGGCACTGGGCCTCACCCGAGGCACCTCACAA.GAACGCCATCGTCACTCTCAC
TTACTCCAGTGAGGAGCAGAGACAGCAGTTTCTGAACAGCGTGAAGATCCCACCGACGATCCGTCATA
AGGTCGGCTTCATGTCACTGCATCTCCTGA 胺基酸序列(序列識別10號) MEAIAKRLDA CQEQLLELYE ENSTDLHKHV LHWKCMRHES VLLYKAKQMG LSHIGMQWP PLKVSEAKGH ΝΑ工EMQMHLE SLLRTEYSME PWTLQETSYE MWQTPPKRCF AKRGKTVEVK FDGCANNTMD YWWTDVYVQ DNDTWVKVHS MVDAKGIYYT CGQFKTYYVN FVKEAEKYGS TKHWEVCYGS TVICSPASVS STTQEVSIPE STTYTPAQTS TLVSSSTKED AVQTPPRKRA RGVQQSPCNA LCVAH工GPVD SGNHNLITNN HDQHQRRNNS NSSATPIVQF QGESNCLKCF RYRLNDRHRH LFDLISSTWH WASSKAPHKH AIVTVTYDSE EQRQQFLDW KIPPTISHKL GFMSLHLLME AIAKRLDACQ DQLLELYEEN SIDIHKHIMH WKCIRLESVL LHKAKQMGLS HIGLQWPPL TVSETKGHNA IEMQMHLESL AKTQYGVEPW TLQDTSYEMW LTPPKRCFAK QGNTVEVKFD GCEDNVMEYV VWTHIYLQDN DSWVKVTSSV DAKGIYYTCG QFKTYYVNFN KEAQKYGSTN HWEVCYGSTV ICSPASVSST VREVSIAEPT TYTPAQTTAP TVSACTTEDG _ VSAPPRKRAR GPSTNNTLCV ANIRSVDSTI NNIVTDNYNK HQRRNNCHSA ATPIVQLQGD SNCLKCFRYR LNDKYKHLFE LASSTWHWAS PEAPHKNA工V TLTYSSEEQR QQFLNSVKIP PTIRHKVGFM SLHLL· 6.質體:HPV105 (p7313me ll/6be2 c/o mut) 感興趣的基因: 使用2乂?《1,利用1^¥102和1^¥110做為模板,以及適當 設計的引子,建構6662和1^2的融合蛋白質。將約2.2处之 融合片段選殖到在融合蛋白質之起點帶有lle2的p7313me 表現載體内。 選殖: -32- 88379 200411055 以Bam HI和Not I限制酵素消化2.2 kb融合物,並連接到 p7313me表現載體内。藉著定序檢查經過分離的純種系,指 出沒有錯誤已經併入。 在HPV105中的ll/6bE2融合序列(序列識別ll號)
ATGGAAGCCATCGCGAAGAGGCTCGACGCCTGCCAGGACCAGCTGCTCGAGCTGTACGAGGAGAACAG
CATTGACATCCATAAGCACATCATGCACTGGAAGTGCATTCGCCTGGAGAGCGTGCTGTTGCACAAGG
CCAAGCAGATGGGCCTGTCCCACATAGGCCTTCAGGTGGTCCCCCCTCTGACCGTGTCAGAGACAAAG
GGCCATAACGCAATCGAGATGCAGATGCACCTCGAGTCGCTGGCGAAAA.CACAGTACGGCGTGGAGCC
ATGGACCCTGCAGGACACCTCGTACGAAATGTGGCTGACCCCACCTAAGCGATGCTTCGCCAAACAGG
GCAACACAGTGGAGGTGAAGTTCGACGGCTGTGAGGATAACGTTATGGAGTATGTCGTGTGGACGCAC
ATCTATCTGCAGGACAACGACAGTTGGGTGAAGGTGACCAGCTCCGTGGACGCGAAGGGCATCTACTA
TACCTGTGGGCAGTTTAAAACCTACTATGTGAACTTCAACAAAGAGGCCCAAAAGTATGGCTCCACCA
ACCACTGGGAGGTCTGCTATGGGAGCACGGTGATTTGCTCTCCCGCCAGCGTGTCTAGCACTGTGCGC
GAGGTGAGCATTGCCGAGCCGACCACGTACACCCCTGCCCAGACGACCGCTCCGACCGTGTCTGCTTG
TACTACCGAGGACGGCGTGAGCGCTCCACCCAGGAAGCGTGCGAGGGGCCCAAGCACCAACAACACCC
TCTGTGTGGCGAACATTCGCAGCGTCGACAGTACCATCAATAACATCGTGACGGATAACTATAACAAG
CACCAGAGGCGTAACAACTGTCACTCTGCCGCAACCCCCATCGTGCAGCTCCAGGGAGACAGCAATTG
CCTTAAGTGCTTCCGCTATCGCCTCAACGACAAGTACAAGCACCTCTTTGAGCTCGCCTCGTCGACGT
GGCACTGGGCCTCACCCGAGGCACCTCACAAGAACGCCATCGTCACTCTCACTTACTCCAGTGAGGAG
CAGAGACAGCAGTTTCTGAACAGCGTGAAGATCCCACCGACGATCCGTCATAAGGTCGGCTTCATGTC
ACTGCATCTCCTGATGGAAGCTATTGCCAAGCGACTGGACGCCTGCCAGGAGCAGCTGCTGGAGCTGT ACGAGGAAAACAGCACAGACCTCCACAAGCACGTGCTGCACTGGAAGTGCATGCGCCACGAGTCAGTG j . i CTCCTGTACAAGGCCAAGCAGATGGGGCTGTCCCACATCGGGATGCAGGTCGTGCCCCCGCTGAAGGT |
GAGCGAAGCCAAGGGCCACAACGCTATCGAGATGCAGATGCACCTGGAGAGCCTGCTGCGGACCGAAT ACAGCATGGAGCCCTGGACTCTCCAGGAGACGTCCTACGAAATGTGGCAGACTCCTCCGAAGCGCTGT' !
TTCGCA?^AGCGCGGCAAGACAGTTGAGGTGAAATTCGATGGGTGCGCAAACAACACGATGGACTACGT
GGTGTGGACCGATGTCTACGTGCAGGACAATGACACCTGGGTGAAGGTACATAGTATGGTGGATGCCA
AGGGCATCTATTACACCTGCGGGCAGTTCAAGACGTACTACGTCAACTTCGTCAAGGAAGCCGAAAAG
TATGGTTCCACCAAGCACTGGGAGGTGTGTTACGGGAGTACTGTGATCTGCAGCCCCGCCTCCGTGTC
GTCCACCACCCAGGAAGTGAGCATTCCGGAGAGCACCACATACACCCCGGCCCAAACGAGCACGCTCG
TCAGCAGCAGCACCAAGGAGGACGCCGTCCAGACGCCCCCCCGGAAGAGGGCCCGGGGGGTCCAGCAG
TCTCCCTGCAATGCCCTGTGCGTTGCTCACATCGGCCCTGTCGATTCTGGGAACCACAATCTCATCAC
GAACAACCACGACCAGCACCAAAGGCGCAACAACTCTAACAGCTCCGCAACTCCAATAGTGCAGTTCC
AGGGGGAGTCCAACTGCCTCAAGTGTTTCCGCTACCGCCTCAACGACCGCCACCGCCACCTGTTCGAC
TTGATCAGTTCCACGTGGCACTGGGCCAGCAGCAAGGCGCCCCACAAACACGCTATCGTGACGGTGAC
CTACGACTCCGAGGAGCAGAGGCAGCAGTTCCTGGACGTCGTGAAGATTCCTCCGACAATCAGCCACA
AGCTTGGCTTCATGTCCCTGCACCTGCTGA -33 - 88379 200411055 胺基酸序列(序列識別12號)
MEAIAKRLDA
PLTVSETKGH
FDGCEDNVME
TNHWEVCYGS
ARGPSTNNTL
YRLNDKYKHL
FMSLHLLMEA
IGMQWPPLK
GKTVEVKFDG
EAEKYGSTKH
TPPRKRARGV
SNCLKCFRYR
PTISHKLGFM
CQDQLLELYE
NAIEMQMHLE
YWWTHIYLQ
TVICSPASVS
CVANIRSVDS
FELASSTWHW
IAKRLDACQE
VSEAKGHNAI
CANNTMDYW
WEVCYGSTVI
QQSPCNALCV
LNDRHRHLFD
SLHLL
ENSIDIHKHI
SLAKTQYGVE
DNDSWVKVTS
STVREVSIAE
TINNIVTDNY
ASPEAPHKNA
QLLELYEENS
EMQMHLESLL
WTDVYVQDND
CSPASVSSTT
AHIGPVDSGN
LISSTWHWAS
MHWKCIRLES
PWTLQDTSYE
SVDAKGIYYT
PTTYTPAQTT
NKHQRRNNCH
IVTLTYSSEE
TDLHKHVLHW
RTEYSMEPWT
TWVKVHSMVD
QEVSIPESTT
HNLITNNHDQ
SKAPHKHAIV
VLLHKAKQMG
MWLTPPKRCF
CGQFKTYYVN
APTVSACTTE
SAATPIVQLQ
QRQQFLNSVK
KCMRHESVLL
LQETSYEMWQ
AKGIYYTCGQ
YTPAQTSTLV
HQRRNNSNSS
TVTYDSEEQR
LSHIGLQWP AKQGNTVEVK FNKEAQKYGS DGVSAPPRKR GDSNCLKCFR IPPT工RHKVG YKAKQMGLSH TPPKRCFAKR FKTYYVNFVK SSSTKEDAVQ ATPIVQFQGE QQFLDWKIP 7·質體:HPV108 (p7313ie 6bel c/o mut) 感興趣的基因: 從p7313plc 6bel c/o mut純種系N中將密碼子最優化的突 變6bel轉移至載體p7313ie内。 選殖: — 藉著Not I和Bam HI限制消化,從P7313plc 6be2純種系中 切開6bel c/o mut片段。然後使用這些位置,將該片段連接 到p7313ie載體内。該基因在ie啟動基因(速發早期cmv+表現 序列1)的控制之下,接著是兔子b-球蛋白聚-腺嘗酸化作用 信號。 在p7313ie中的6bel序列(序列識別13號)
ATGGCAGACGATTCCGGTACTGAGAACGAAGGTTCTGGTTGTACCGGTTGGTTCATGGTTGAAGCAAT
CGTTCAGCATCCGACTGGTACCCAGATCTCCGATGACGAAGACGAAGAAGTTGAAGATTCTGGTTACG
ACATGGTTGACTTCATCGATGACTCCAACATCACTCATAACTCTCTGGAAGCACAGGCTCTGTTTAAC
CGCCAGGAAGCTGATACCCATTACGCTACTGTTCAGGACCTGGGAGGCAAATATCTGGGCTCTCCGTA
CGTTTCCCCGATCAACACTATCGCAGAAGCAGTTGAGTCTGAAATCTCCCCGCGCCTGGACGCTATCA -34· 88379 200411055
AACTGACTCGTCAGCCGAAGAAGGTTAAACGTCGTCTGTTCCAGACTCGTGAACTGACCGACTCCGGT
TACGGTTATAGCGAAGTTGAGGCTGGCACCGGCACCCAGGTTGAAAAACACGGTGTACCGGAAAACGG
CGGCGACGGTCAGGAAAAGGACACCGGCCGCGACATCGAGGGTGAGGAACACACCGAAGCTGAAGCTC
CGACTAACTCTGTTCGTGAACACGCAGGTACTGCGGGTATCCTGGAACTGCTGAAATGCAAAGACCTG
CGCGCGGCTCTGCTGGGCAAATTCAAAGAATGCTTCGGCCTGTCTTTCATTGACCTGATCCGTCCGTT
TAAGTCTGACAAAACTACCTGTCTGGACTGGGTTGTAGCAGGCTTCGGCATCCACCACTCTATCTCTG
AAGCATTCCAGAAA.CTGATCGAGCCGCTGTCTCTGTACGCGCACATCCAGTGGCTGACTAACGCTTGG
GGTATGGTTCTGCTGGTACTGCTGCGCTTTAAAGTAAACAAATCTCGTTCCACTGTTGCTCGTACTCT
GGCTACCCTGCTGAACATCCCGGAGAACCAGATGCTGATCGAACCGCCGAAAATCCAGTCTGGTGTAG
CTGCACTGTACTGGTTTCGTACTGGCATCTCTAACGCTAGCACTGTTATCGGTGAAGCACCGGAATGG
ATCACTCGTCAGACCGTTATCGAACACGGTCTGGCAGATTCTCAGTTCAAACTGACTGAAATGGTTCA
GTGGGCATACGACAACGACATCTGCGAGGAATCTGAAATTGCGTTCGAATACGCTCAGCGTGGCGACT
TCGACTCCAACGCTCGTGCTTTCCTGAACAGCAACATGCAGGCTAAATACGTAAAAGACTGCGCTACC
ATGTGCCGTCACTACAAACACGCGGAAATGCGTAAAATGTCTATCAAACAGTGGATCAAGCACCGCGG
TTCTAAAATCGAAGGTACCGGTAACTGGAAACCGATCGTTCAGTTCCTGCGCCATCAGAACATCGAAT
TCATCCCGTTCCTGACCAAATTCAAGCTGTGGCTGCACGGTACCCCGAAAAAAAACTGCATCGCTATC
GTAGGTCCACCGGACACTGACAAGTCTTACTTCTGTATGTCCCTGATCTCTTTCCTGGGCGGCACTGT
AATCTCTCACGTTAACTCTTCCTCCCATTTCTGGCTGCAGCCACTGGTAGACGCGAAAGTAGCTCTGC
TGGACGACGCGACCCAGCCGTGCTGGATCTACATGGATACTTACATGCGCAACCTGCTGGACGGTAAC
CCGATGTCTATCGACCGTAAACACAAAGCGCTGACTCTGATCAAGTGCCCGCCGCTGCTGGTAACTTC
TAACATCGACATCACCAAGGAAGATAAATACAAGTACCTGCATACCCGTGTTACTACCTTTACTTTCC CGAACCCGTTCCCGTTTGATCGTAACGGTAACGCTGTTTACGAACTGTCCAACACTAACTGGAAATGC^
TTCTTCGAGCGTCTGTCTTCCTCCCTGGACATCCAGGACTCTGAAGATGAAGAAGATGGTTCTAACTC
TCAGGCTTTCCGTTGTGTTCCGGGTACTGTTGTTCGTACTCTGTGA 胺基酸序列(序列識別14號)
MADDSGTENE GSGCTGWFMV EAIVQHPTGT QISDDEDEEV EDSGYDMVDF IDDSNITHNS LEAQALFNRQ EADTHYATVQ DLGGKYLGSP YVSPINTIAE AVESEISPRL DAIKLTRQPK KVKRRLFQTR ELTDSGYGYS EVEAGTGTQV EKHGVPENGG DGQEKDTGRD IEGEEHTEAE APTNSVREHA GTAGILELLK CKDLRAALLG KFKECFGLSF IDLIRPFKSD KTTCLDWWA GFGIHHSISE AFQKLIEPLS LYAHIQWLTN AWGMVLLVLL RFKVNKSRST VARTLATLLN IPENQMLIEP PKIQSGVAAL YWFRTGISNA STVIGEAPEW ITRQTVIEHG LADSQFKLTE MVQWAYDNDI CEESEIAFEY AQRGDFDSNA RAFLNSNMQA KYVKDCATMC RHYKHAEMRK MSIKQWIKHR GSKIEGTGNW KPIVQFLRHQ NIEF工PFLTK FKLWLHGTPK KNCIAIVGPP DTDKSYFCMS LISFLGGTVI SHVNSSSHFW LQPLVDAKVA LLDDATQPCW IYMDTXMRNL LDGNPMSIDR KHKALTLIKC PPLLVTSNID ITKEDKYKYL HTRVTTFTFP NPFPFDRNGN AVYELSNTNW KCFFERLSSS LDIQDSEDEE DGSNSQAFRC VPGTWRTL -35 - 88379 200411055 8.質體:HPV110 (ρ7313ie 6be2 c/o mut) 感興趣的基因: 從pWRG7077 6be2中將密碼子最優化的突變6be2轉移至 載體p7313ie内。 選殖: 藉著Not I和Bam HI限制消化,從pWRG7077 6be2純種系 中切開6be2 c/o mut片段。然後使用這些位置,將該片段連 接到p7313ie載體内。該基因在ie啟動基因(速發早期cmv+表 現序列1)的控制之下,接著是兔子b-球蛋白聚-腺苷酸化作 用信號。 在p7313ie中的6be2序列(序列識別15號)
ATGGAAGCTATTGCCAAGCGACTGGACGCCTGCCAGGAGCAGCTGCTGGAGCTGTACGAGGAAAACAG
CACAGACCTCCACAAGCACGTGCTGCACTGGAAGTGCATGCGCCACGAGTCAGTGCTCCTGTACAAGG
CCAAGCAGATGGGGCTGTCCCACATCGGGATGCAGGTCGTGCCCCCGCTGAAGGTGAGCGAAGCCAAG
GGCCACAACGCTATCGAGATGCAGATGCACCTGGAGAGCCTGCTGCGGACCGAATACAGCATGGAGCC CTGGACTCTCCAGGAGACGTCCTACGAAATGTGGCAGACTCCTCCGAAGCGCTGTTTCGCAAAGCGCa
GCAAGACAGTTGAGGTGAAATTCGATGGGTGCGCAAACAACACGATGGACTACGTGGTGTGGACCGAT
GTCTACGTGCAGGACAATGACACCTGGGTGAAGGTACATAGTATGGTGGATGCCAAGGGCATCTATTA
CACCTGCGGGCAGTTCAAGACGTACTACGTCAACTTCGTCAAGGAAGCCGAAAAGTATGGTTCCACCA
AGCACTGGGAGGTGTGTTACGGGAGTACTGTGATCTGCAGCCCCGCCTCCGTGTCGTCCACCACCCAG
GAAGTGAGCATTCCGGAGAGCACCACATACACCCCGGCCCAAACGAGCACGCTCGTCAGCAGCAGCAC
CAAGGAGGACGCCGTCCAGACGCCCCCCCGGAAGAGGGCCCGGGGGGTCCAGCAGTCTCCCTGCAATG
CCCTGTGCGTTGCTCACATCGGCCCTGTCGATTCTGGGAACCACAATCTCATCACGAACAACCACGAC
CAGCACCAAAGGCGCAACAACTCTAACAGCTCCGCAACTCCAATAGTGCAGTTCCAGGGGGAGTCCAA
CTGCCTCAAGTGTTTCCGCTACCGCCTCAACGACCGCCACCGCCACCTGTTCGACTTGATCAGTTCCA
CGTGGCACTGGGCCAGCAGCAAGGCGCCCCACAAACACGCTATCGTGACGGTGACCTACGACTCCGAG
GAGCAGAGGCAGCAGTTCCTGGACGTCGTGAAGATTCCTCCGACAATCAGCCACAAGCTTGGCTTCAT GTCCCTGCACCTGCTGTGA 胺基酸序列(序列識別I6號) -36- 88379 200411055
MEAIAKRLDA CQEQLLELYE ENSTDLHKHV LHWKCMRHES VLLYKAKQMG LSHIGMQWP PLKVSEAKGH NAIEMQMHLE SLLRTEYSME PWTLQETSYE MWQTPPKRCF AKRGKTVEVK FDGCANNTMD YWWTDVYVQ DNDTWVPCVHS MVDAKGIYYT CGQFKTYYW FVKEAEKYGS TKHWEVCYGS TVICSPASVS STTQEVSIPE STTYTPAQTS TLVSSSTKED AVQTPPRKRA RGVQQSPCNA LCVAHIGPVD SGNHNLITNN HDQHQRRNNS NSSATPIVQF QGESNCLKCF RYRLNDRHRH LFDLISSTWH WASSKAPHKH AIVTVTYDSE EQRQQFLDW KIPPTISHKL GFMSLHLL 9·質體:HPV116 (p7313ie 6bel.6be2.lle2) 感興趣的基因: 在構築體HPV116中之多蛋白的基因是三重融合蛋白 質,按順序包括6bel、6be2、lle2所有最優化和突變的密碼 子。藉著PCR,使用2個先前的PCR片段;6bel和6b/lle2, 組裝該多蛋白基因。基因的尺寸約為4.1 kb,藉著PAGE和 西方墨點法觀察到產生約170 kD的多蛋白。 選殖: 以Bam HI + Not I限制酵素消化多蛋白基因,並連接到 p7313ie載體内。所選出之純種系的定序分析,.已經指出’零 星的’’鹼基改變,但這可藉著各種片段交換而克服。發現所 得的純種系hpvll6#l沒有錯誤。 在HPV116中的多蛋白序列(序列識別17號)
ATGGCAGACGATTCCGGTACTGAGAACGAAGGTTCTGGTTGTACCGGTTGGTTCATGGTTGAA.GCAA
TCGTTCAGCATCCGACTGGTACCCAGATCTCCGATGACGAAGACGAAGAAGTTGAAGATTCTGGTTA
CGACATGGTTGACTTCATCGATGACTCCAACATCACTCATAA.CTCTCTGGAAGCACAGGCTCTGTTT
AACCGCCAGGAAGCTGATACCCATTACGCTACTGTTCAGGACCTGGGAGGCAAATATCTGGGCTCTC
CGTACGTTTCCCCGATCAACACTATCGCAGAAGCAGTTGAGTCTGAAATCTCCCCGCGCCTGGACGC
TATCAAACTGACTCGTCAGCCGAAGAAGGTTAAACGTCGTCTGTTCCAGACTCGTGAACTGACCGAC
TCCGGTTACGGTTATAGCGAAGTTGAGGCTGGCACCGGCACCCAGGTTGAAAAACACGGTGTACCGG
A?^AACGGCGGCGACGGTCAGGAAAAGGACACCGGCCGCGACATCGAGGGTGAGGAACACACCGAAGC
TGAAGCTCCGACTAACTCTGTTCGTGAACACGCAGGTACTGCGGGTATCCTGGAACTGCTGAAATGC
AAAGACCTGCGCGCGGCTCTGCTGGGCAAATTCAAAGAATGCTTCGGCCTGTCTTTCATTGACCTGA
TCCGTCCGTTTAAGTCTGACAAAACTACCTGTCTGGACTGGGTTGTAGCAGGCTTCGGCATCCACCA -37- 88379 200411055
CTCTATCTCTGAAGCATTCCAGAAACTGATCGAGCCGCTGTCTCTGTACGCGCACATCCAGTGGCTG ACTAACGCTTGGGGTATGGTTCTGCTGGTACTGCTGCGCTTTAAAGTAAACAAATCTCGTTCCACTG ^(SCTCGTAGTCTGGCTACCCTGCTGAAGATCCCGGAGAAGCAGATGCTGATCGAACCGCCGAAAAT CCAGTCTGGTGTAGCTGCACTGTACTGGTTTCGTACTGGCATCTCTAACGCTAGCACTGTTATCGGT GAAGCACCGGAATGGATCACTCGTCAGACCGTTATCGAACACGGTCTGGCAGATTCTCAGTTCAAAC TGACTGAAATGGTTCAGTGGGCATACGACAACGACATCTGCGAGGAATCTGAAATTGCGTTCGAATA CGCTCAGCGTGGCGACTTCGACTCCAACGCTCGTGCTTTCCTGAACAGCAACATGCAGGCTAAATAC GTAAAAGACTGCGCTACCATGTGCCGTCACTACAAACACGCGGAAATGCGTAAAATGTCTATCAAAC AGTGGATCAAGCACCGCGGTTCTAAAATCGAAGGTACCGGTAACTGGAAACCGATCGTTCAGTTCCT GCGCCATCAGAACATCGAATTCATCCCGTTCCTGACCAAATTCAAGCTGTGGCTGCACGGTACCCCG AAAAAAAACTGCATCGCTATCGTAGGTCCACCGGACACTGACAAGTCTTACTTCTGTATGTCCCTGA TCTCTTTCCTGGGCGGCACTGTAATCTGTCACGTTAACTCTTCCTCCCATTTCTGGCTGCAGCCACT GGTAGACGCGAAAGTAGCTCTGCTGGACGACGCGACCCAGCCGTGCTGGATCTACATGGATACTTAC ATGCGCAACCTGCTGGACGGTAACCCGATGTCTATCGACCGTAAACACAAAGCGCTGACTCTGATCA AGTGCCCGCCGCTGCTGGTAACTTCTAACATCGACATCACCAAGGAAGATAAATACAAGTACCTGCA TACCCGTGTTACTACCTTTACTTTCCCGAACCCGTTCCCGTTTGATCGTAACGGTAACGCTGTTTAC ' GAACTGTCCAACACTAACTGGAAATGCTTCTTCGAGCGTCTGTCTTCCTCCCTGGACATCCAGGACT CTGAAGATGAAGAAGATGGTTCTAACTCTCAGGCTTTCCGTTGTGTTCCGGGTACTGTTGTTCGTAC TCTGATGGAAGCTATTGCCAAGCGACTGGACGCCTGCCAGGAGCAGCTGCTGGAGCTGTACGAGGAA AACAGCACAGACCTCCACAAGCACGTGCTGCACTGGAAGTGCATGCGCCACGAGTCAGTGCTCCTGT ACAAGGCCAA.GCAGATGGGGCTGTCCCACATCGGGATGCAGGTCGTGCCCCCGCTGAAGGTGAGCGA AGCCAAGGGCCACAACGCTATCGAGATGCAGATGCACCTGGAGAGCCTGCTGCGGACCGAATACAGC ATGGAGCCCTGGACTCTCCAGGAGACGTCCTACGAAATGTGGCAGACTCCTCCGAAGCGCTGTTTCG CAAAGCGCGGCAAGACAGTTGAGGTGAAATTCGATGGGTGCGCAAACAACACGATGGACTACGTGGT GTGGACCGATGTCTACGTGCAGGACAATGACACCTGGGTGAAGGTACATAGTATGGTGGATGCCAAG GGCATCTATTACACCTGCGGGCAGTTCAAGACGTACTACGTCAACTTCGTCAAGGAAGCCGAAAAGT ATGGTTCCACCAAGCACTGGGAGGTGTGTTACGGGAGTACTGTGATCTGCAGCCCCGCCTCCGTGTC GTCCACCACCCAGGAAGTGAGCATTCCGGAGAGACCACATACACCCCGGCCCAAACGAGCACGCTCG TCAGCAGCAGCACCAAGGAGGACGCCGTCCAGACGCCCCCCCGGAAGAGGGCCCGGGGGGTCCAGCA GTCTCCCTGCAATGCCCTGTGCGTTGCTCACATCGGCCCTGTCGATTCTGGGAACCACAATCTCATC ACGAACAACCACGACCAGCACCAAAGGCGCAACAACTCTAACAGCTCCGCAACTCCAATAGTGCAGT TCCAGGGGGAGTCCAACTGCCTCAAGTGTTTCCGCTACCGCCTCAACGACCGCCACCGCCACCTGTT CGACTTGATCAGTTCCACGTGGCACTGGGCCAGCAGCAAGGCGCCCCACAAACACGCTATCGTGACG GTGACCTACGACTCCGAGGAGCAGAGGCAGCAGTTCCTGGACGTCGTGAAGATTCCTCCGACAATCA GCCACAAGCTTGGCTTCATGTCCCTGCACCTGCTGATGGAAGCCATCGCGAAGAGGCTCGACGCCTG CCAGGACCAGCTGCTCGAGCTGTACGAGGAGAACAGCATTGACATCCATAAGCACATCATGCACTGG AAGTGCATTCGCCTGGAQAGCGTGCTGTTGCACAAGGCCAAGCAGATGGGCCTGTCCCACATAGGCC • 38 - 88379 200411055
TTCAGGTGGTCCCCCCTCTGACCGTGTCAGAGACAAAGGGCCATAACGCAATCGAGATGCAGATGCA
CCTCGAGTCGCTGGCGAAAACACAGTACGGCGTGGAGCCATGGACCCTGCAGGACACCTCGTACGAA
ATGTGGCTGACCCCACCTAAGCGATGCTTCGCCAAACAGGGCAACACAGTGGAGGTGAAGTTCGACG
GCTGTGAGGATAACGTTATGGAGTATGTCGTGTGGACGCACATCTATCTGCAGGACAACGACAGTTG
GGTGAAGGTGACCAGCTCCGTGGACGCGAAGGGCATCTACTATACCTGTGGGCAGTTTAAAACCTAC
TATGTGAACTTCAACAAAGAGGCCCAAAAGTATGGCTCCACCAACCACTGGGAGGTCTGCTATGGGA
GCACGGTGATTTGCTCTCCCGCCAGCGTGTCTAGCACTGTGCGCGAGGTGAGCATTGCCGAGCCGAC
CACGTACACCCCTGCCCAGACGACCGCTCCGACCGTGTCTGCTTGTACTACCGAGGACGGCGTGAGC
GCTCCACCCAGGAAGCGTGCGAGGGGCCCAAGCACCAACAACACCCTCTGTGTGGCGAACATTCGCA
GCGTCGACAGTACCATCAATAACATCGTGACGGATAACTATAACAAGCACCAGAGGCGTAACAACTG
TCACTCTGCCGCAACCCCCATCGTGCAGCTCCAGGGAGACAGCAATTGCCTTAAGTGCTTCCGCTAT
CGCCTCAACGACAAGTACAAGCACCTCTTTGAGCTCGCCTCGTCGACGTGGCACTGGGCCTCACCCG
AGGCACCTCACAAGAACGCCATCGTCACTCTCACTTACTCCAGTGAGGAGCAGAGACAGCAGTTTCT
GAACAGCGTGAAGATCCCACCGACGATCCGTCATAAGGTCGGCTTCATGTCACTGCATCTCCTGTGA 胺基酸序列(序列識別18號)
MADDSGTENE GSGCTGWFMV EAIVQHPTGT QISDDEDEEV EDSGYDMVDF IDDSNITHNS LEAQALFNRQ EADTHYATVQ DLGGKYLGSP YVSPINTIAE AVESEISPRL DAIKLTRQPK KVKRRLFQTR ELTDSGYGYS EVEAGTGTQV EKHGVPENGG DGQEKDTGRD IEGEEHTEAE APTNSVREHA GTAGILELLK CKDLRAALLG KFKECFGLSF IDLIRPFKSD KTTCLDWWA GFGIHHSISE AFQKLIEPLS LYAHIQWLTN AWGMVLLVLL RFKVNKSRST VARTLATLLN 工PENQMLIEP PKIQSGVAAL YWFRTGISNA STVIGEAPEW ITRQTVIEHG LADSQFKLTE MVQWAYDNDI CEESEIAFEY AQRGDFDSNA RAFLNSNMQA KYVKDCATMC RHYKHAEMRK MSIKQWIKHR GSKIEGTGNW KPIVQFLRHQ NIEFIPFLTK FKLWLHGTPK KNCIAIVGPP DTDKSYFCMS LISFLGGTVI SHVNSSSHFW LQPLVDAKVA LLDDATQPCW IYMDTYMRNL LDGNPMSIDR KHKALTLIKC PPLLVTSNID ITKEDKYKYL HTRVTTFTFP NPFPFDRNGN AVYELSNTNW KCFFERLSSS LDIQDSEDEE DGSNSQAFRC VPGTWRTLM EAIAKRLDAC QEQLLELYEE NSTDLHKHVL HWKCMRHESV LLYKAKQMGL SHIGMQWPP LKVSEAKGHN AIEMQMHLES LLRTEYSMEP WTLQETSYEM WQTPPKRCFA KRGKTVEVKF DGCANNTMDY WWTDVYVQD NDTWVKVHSM VDAKGIYYTC GQFKTYYVNF VKEAEKYGST KHWEVCYGST VICSPASVSS TTQEVSIPES TTYTPAQTST LVSSSTKEDA VQTPPRKRAR GVQQSPCNAL CVAHIGPVDS GNHNLITNNH DQHQRRNNSN SSATPIVQFQ GESNCLKCFR YRLNDRHRHL FDLISSTWHW ASSKAPHKHA IVTVTYDSEE QRQQFLDWK IPPTISHKLG FMSLHLLMEA 工AKRLDACQD QLLELYEENS IDIHKHIMHW KCIRLESVLL HKAKQMGLSH IGLQWPPLT -39- 88379 200411055
VSETKGHNAI EMQMHLESLA KTQYGVEPWT LQDTSYEMWL TPPKRCFAKQ GNTVEVKFDG CEDNVMEYW WTHIYLQDND SWVKVTSSVD AKGIYYTCGQ FKTYYVNFNK EAQKYGSTNH WEVCYGSTVI CSPASVSSTV REVSIAEPTT YTPAQTTAPT VSACTTEDGV SAPPRKRARG PSTNNTLCVA NIRSVDSTIN NIVTDNYNKH QRRNNCHSAA TPIVQLQGDS NCLKCFRYRL NDKYKHLFEL ASSTWHWASP EAPHKNAIVT LTYSSEEQRQ QFLNSVKIPP TIRHKVGFMS LHLL 10.質體:HPV117 (p7313ie 6be2.6bel.lle2) 感興趣的基因: 在構築體HPV117中之多蛋白的基因是三重融合蛋白 質,按順序包括6be2、6bel、lle2所有最優化和突變的密碼 子。藉著PCR,使用3個先前的PCR片段;6be:l、6be2和lle2, 組裝該多蛋白基因。基因的尺寸約為4.1kb,藉著PAGE和西 方墨點法觀察到產生約170 kD的多蛋白。 選殖: 以Bam HI + Not I限制酵素消化多蛋白基因,並連接到 p7313ie載體内。所選出之純種系的定序分析,已經指出’零 星的’鹼基改變,但這可藉著各種片段交換而克服。發現戶弄 得的純種系hpvll7#6沒有錯誤。 在HPV117中的多蛋白序列(序列識別19號)
ATGGAAGCTATTGCCAAGCGACTGGACGCCTGCCAGGAGCAGCTGCTGGAGCTGTACGAGGAAAACAG
CACAGACCTCCACAAGCACGTGCTGCACTGGAAGTGCATGCGCCACGAGTCAGTGCTCCTGTACAAGG
CCAAGCAGATGGGGCTGTCCCACATCGGGATGCAGGTCGTGCCCCCGCTGAAGGTGAGCGAAGCCAAG
GGCCACAACGCTATCGAGATGCAGATGCACCTGGAGAGCCTGCTGCGGACCGAATACAGCATGGAGCC
CTGGACTCTCCAGGAGACGTCCTACGAAATGTGGCAGACTCCTCCGAA.GCGCTGTTTCGCAAAGCGCG
GCAAGACAGTTGAGGTGAAATTCGATGGGTGCGCAAACAACACGATGGACTACGTGGTGTGGACCGAT
GTCTACGTGCAGGACAATGACACCTGGGTGAAGGTACATAGTATGGTGGATGCCAAGGGCATCTATTA -40- 88379 200411055
CACCTGCGGGCAGTTCAAGACGTACTACGTCAACTTCGTCAAGGAAGCCGAAAAGTATGGTTCCACCA
AGCACTGGGAGGTGTGTTACGGGAGTACTGTGATCTGCAGCCCCGCCTCCGTGTCGTCCACCACCCAG
GAAGTGAGCATTCCGGAGAGCACCACATACACCCCGGCCCAAACGAGCACGCTCGTCAGCAGCAGCAC
CAAGGAGGACGCCGTCCAGACGCCCCCCCGGAAGAGGGCCCGGGGGGTCCAGCAGTCTCCCTGCAATG
CCCTGTGCGTTGCTCACATCGGCCCTGTCGATTCTGGGAACCACAATCTCATCACGAACAACCACGAC
CAGCACCAAAGGCGCAACAACTCTAACAGCTCCGCAACTCCAATAGTGCAGTTCCAGGGGGAGTCCAA
CTGCCTCAAGTGTTTCCGCTACCGCCTCAACGACCGCCACCGCCACCTGTTCGACTTGATCAGTTCCA
CGTGGCACTGGGCCAGCAGCAAGGCGCCCCACAAACACGCTATCGTGACGGTGACCTACGACTCCGAG
GAGCAGAGGCAGCAGTTCCTGGACGTCGTGAAGATTCCTCCGACAATCAGCCACAAGCTTGGCTTCAT
GTCCCTGCACCTGCTGATGGCAGACGATTCCGGTACTGAGAACGAAGGTTCTGGTTGTACCGGTTGGT
TCATGGTTGAAGCAATCGTTCAGCATCCGACTGGTACCCAGATCTCCGATGACGAAGACGAAGAAGTT
GAAGATTCTGGTTACGACATGGTTGACTTCATCGATGACTCCAACATCACTCATAACTCTCTGGAAGC
ACAGGCTCTGTTTAACCGCCAGGAAGCTGATACCCATTACGCTACTGTTCAGGACCTGGGAGGCAAAT
ATCTGGGCTCTCCGTACGTTTCCCCGATCAACACTATCGCAGAAGCAGTTGAGTCTGAAATCTCCCCG
CGCCTGGACGCTATCAAACTGACTCGTCAGCCGAAGAAGGTTAAACGTCGTCTGTTCCAGACTCGTGA
ACTGACCGACTCCGGTTACGGTTATAGCGAAGTTGAGGCTGGCACCGGCACCCAGGTTGAAAAACACG
GTGTACCGGAAAACGGCGGCGACGGTCAGGAAAAGGACACCGGCCGCGACATCGAGGGTGAGGAACAC
ACCGAAGCTGAAGCTCCGACTAACTCTGTTCGTGAACACGCAGGTACTGCGGGTATCCTGGAACTGCT
GAAATGCAAAGACCTGCGCGCGGCTCTGCTGGGCAAATTCAAAGAATGCTTCGGCCTGTCTTTCATTG
ACCTGATCCGTCCGTTTAAGTCTGACAAAACTACCTGTCTGGACTGGGTTGTAGCAGGCTTCGGCATC CACCACTCTATCTCTGAAGCATTCCAGAAACTGATCGAGCCGCTGTCTCTGTACGCGCACATCCAGTG_
GCTGACTAACGCTTGGGGTATGGTTCTGCTGGTACTGCTGCGCTTTAAAGTAAACAAATCTCGTTCCA
CTGTTGCTCGTACTCTGGCTACCCTGCTGAACATCCCGGAGA?VCCAGATGCTGATCGAACCGCCGAAA
ATCCAGTCTGGTGTAGCTGCACTGTACTGGTTTCGTACTGGCATCTCTAACGCTAGCACTGTTATCGG
TGAAGCACCGGAATGGATCACTCGTCAGACCGTTATCGAACACGGTCTGGCAGATTCTCAGTTCAAAC
TGACTGAAATGGTTCAGTGGGCATACGACAACGACATCTGCGAGGAATCTGAAATTGCGTTCGAATAC
GCTCAGCGTGGCGACTTCGACTCCAACGCTCGTGCTTTCCTGAACAGCAACATGCAGGCTAAATACGT
AAAAGACTGCGCTACCATGTGCCGTCACTACAAACACGCGGAAATGCGTAAAATGTCTATCAAACAGT
GGATCAAGCACCGCGGTTCTAAAATCGAAGGTACCGGTAACTGGAAACCGATCGTTCAGTTCCTGCGC
CATCAGAACATCGAATTCATCCCGTTCCTGACCAAATTCAAGCTGTGGCTGCACGGTACCCCGAAAAA
AAACTGCATCGCTATCGTAGGTCCACCGGACACTGACAAGTCTTACTTCTGTATGTCCCTGATCTCTT
TCCTGGGCGGCACTGTAATCTCTCACGTTAACTCTTCCTCCCATTTCTGGCTGCAGCCACTGGTAGAC
GCGAAAGTAGCTCTGCTGGACGACGCGACCCAGCCGTGCTGGATCTACATGGATACTTACATGCGCAA
CCTGCTGGACGGTAACCCGATGTCTATCGACCGTAAACACAAAGCGCTGACTCTGATCAAGTGCCCGC
CGCTGCTGGTAACTTCTAACATCGACATCACCAAGGAAGATAAATACAAGTACCTGCATACCCGTGTT -41 -
88379 200411055
ACTACCTTTACTTTCCCGAACCCGTTCCCGTTTGATCGTAACGGTAACGCTGTTTACGAACTGTCCAA
CACTAACTGGAAATGCTTCTTCGAGCGTCTGTCTTCCTCCCTGGACATCCAGGACTCTGAAGATGAAG
AAGATGGTTCTAACTCTCAGGCTTTCCGTTGTGTTCCGGGTACTGTTGTTCGTACTCTGATGGAAGCC
ATCGCGAAGAGGCTCGACGCCTGCCAGGACCAGCTGCTCGAGCTGTACGAGGAGAACAGCATTGACAT
CCATAAGCACATCATGCACTGGAAGTGCATTCGCCTGGAGAGCGTGCTGTTGCACAAGGCCAAGCAGA
TGGGCCTGTCCCACATAGGCCTTCAGGTGGTCCCCCCTCTGACCGTGTCAGAGACAAAGGGCCATAAC
GCAATCGAGATGCAGATGCACCTCGAGTCGCTGGCGAAAACACAGTACGGCGTGGAGCCATGGACCCT
GCAGGACACCTCGTACGAAATGTGGCTGACCCCACCTAAGCGATGCTTCGCCAAACAGGGCAACACAG
TGGAGGTGAAGTTCGACGGCTGTGAGGATAACGTTATGGAGTATGTCGTGTGGACGCACATCTATCTG
CAGGACAACGACAGTTGGGTGAAGGTGACCAGCTCCGTGGACGCGAAGGGCATCTACTATACCTGTGG
GCAGTTTAAAACCTACTATGTGAACTTCAACAAAGAGGCCCAAAAGTATGGCTCCACCAACCACTGGG
AGGTCTGCTATGGGAGCACGGTGATTTGCTCTCCCGCCAGCGTGTCTAGCACTGTGCGCGAGGTGAGC
ATTGCCGAGCCGACCACGTACACCCCTGCCCAGACGACCGCTCCGACCGTGTCTGCTTGTACTACCGA
GGACGGCGTGAGCGCTCCACCCAGGAAGCGTGCGAGGGGCCCAAGCACCAACAACACCCTCTGTGTGG
CGAACATTCGCAGCGTCGACAGTACCATCAATAACATCGTGACGGATAACTATAACAAGCACCAGAGG
CGTAACAACTGTCACTCTGCCGCAACCCCCATCGTGCAGCTCCAGGGAGACAGCAATTGCCTTAAGTG
CTTCCGCTATCGCCTCAACGACAAGTACAAGCACCTCTTTGAGCTCGCCTCGTCGACGTGGCACTGGG
CCTCACCCGAGGCACCTCACAAGAACGCCATCGTCACTCTCACTTACTCCAGTGAGGAGCAGAGACAG
CAGTTTCTGAACAGCGTGAAGATCCCACCGACGATCCGTCATAAGGTCGGCTTCATGTCACTGCATCT
CCTGTGA 胺基酸序列(序列識別20號)
MEAIAKRLDA PLKVSEAKGH FDGCANNTMD TKHWEVCYGS RGVQQSPCNA RYRLNDRHRH GFMSLHLLMA DSNITHNSLE IKLTRQPKKV GEEHTEAEAP TCLDWWAGF
CQEQLLELYE NAIEMQMHLE YVWTDVYVQ TVICSPASVS LCVAHIGPVD LFDLISSTWH DDSGTENEGS AQALFNRQEA KRRLFQTREL TNSVREHAGT GIHHSISEAF
ENSTDLHKHV SLLRTEYSME DNDTWVKVHS STTQEVSIPE SGNHNLITNN WASSKAPHKH GCTGWFMVEA DTHYATVQDL TDSGYGYSEV AGILELLKCK QKLIEPLSLY
LHWKCMRHES PWTLQETSYE MVDAKGIYYT STTYTPAQTS HDQHQRRNNS AIVTVTYDSE 工VQHPTGTQI GGKYLGSPYV EAGTGTQVEK DLRAALLGKF AHIQWLTNAW
VLLYKAKQMG MWQTPPKRCF CGQFKTYYVN TLVSSSTKED NSSATPIVQF EQRQQFLDW SDDEDEEVED SPINTIAEAV HGVPENGGDG KECFGLSFID GMVLLVLLRF
LSHIGMQWP AKRGKTVEVK FVKEAEKYGS AVQTPPRKRA QGESNCLKCF KIPPTISHKL SGYDMVDFID ESEISPRLDA QEKDTGRDIE LIRPFKSDKT KVNKSRSTVA -42- 88379 200411055
RTLATLLNIP DSQFKLTEMV YKHAEMRKMS CIAIVGPPDT MDTYMRNLLD FPFDRNGNAV 工AKRLDACQD VSETKGHNAI CEDNVMEYW WEVCYGSTVI PSTNNTLCVA NDKYKHLFEL LHLL
ENQMLIEPPK
QWAYDNDICE
IKQWIKHRGS
DKSYFCMSLI
GNPMSIDRKH
YELSNTNWKC
QLLELYEENS
EMQMHLESLA
WTHIYLQDND
CSPASVSSTV
NIRSVDSTIN
ASSTWHWASP
工QSGVAALYW ESEIAFEYAQ KIEGTGNWKP SFLGGTVISH KALTLIKCPP FFERLSSSLD IDIHKHIMHW KTQYGVEPWT SWVKVTSSVD REVSIAEPTT NIVTDNYNKH EAPHKNAIVT
FRTGISNAST RGDFDSNARA IVQFLRHQNI VNSSSHFWLQ LLVTSNIDIT 工QDSEDEEDG KCIRLESVLL LQDTSYEMWL AKGIYYTCGQ YTPAQTTAPT QRRNNCHSAA LTYSSEEQRQ
VIGEAPEWIT
FLNSNMQAKY
EFIPFLTKFK
PLVDAKVALL
KEDKYKYLHT
SNSQAFRCVP
HKA.KQMGLSH
TPPKRCFAKQ
FKTYYVNFNK
VSACTTEDGV
TPIVQLQGDS
QFLNSVKIPP
RQTVIEHGLA VKDCATMCRH LWLHGTPKKN DDATQPCWIY RVTTFTFPNP GTWRTLMEA 工 GLQWPPLT GNTVEVKFDG EAQKYGSTNH SAPPRKRARG NCLKCFRYRL TIRHKVGFMS 11.質體:HPV118 (p7313ie 6be2.lle2.6bel) 感興趣的基因: 在構築體HPV118中之多蛋白的基因是三重融合蛋白 質,按順序包括6be2、1 le2、6bel所有最優化和突變的密碼 子。藉著PCR,使用2個先前的PCR片段;6bel和ll/6be2, 組裝該多蛋白基因。基因的尺寸約為4· 1 kb,藉著PAGE和西 方墨點法觀察到產生約170 kD的多蛋白。 選殖: 以Bam HI + Not I限制酵素消化多蛋白基因,並連接到 p7313ie載體内。所選出之純種系的定序分析,已經指出’零 星的'鹼基改變,但這可藉著各種片段交換而克服。發現所 得的純種系hpvll8#3沒有錯誤。 在HPV118中的多蛋白序列(序列識別21號) -43 - 88379 200411055
ATGGAAGCTATTGCCAAGCGACTGGACGCCTGCCAGGAGCAGCTGCTGGAGCTGTACGAGGAAAACAG
CACAGACCTCCACAAGCACGTGCTGCACTGGAAGTGCATGCGCCACGAGTCAGTGCTCCTGTACAAGG
CCAAGCAGATGGGGCTGTCCCACATCGGGATGCAGGTCGTGCCCCCGCTGAAGGTGAGCGAAGCCAAG
GGCCACAACGCTATCGAGATGCAGATGCACCTGGAGAGCCTGCTGCGGACCGAATACAGCATGGAGCC
CTGGACTCTCCAGGAGACGTCCTACGAAATGTGGCAGACTCCTCCGAAGCGCTGTTTCGCAAAGCGCG
GCAAGACAGTTGAGGTGAAATTCGATGGGTGCGCAAACAACACGATGGACTACGTGGTGTGGACCGAT
GTCTACGTGCAGGACAATGACACCTGGGTGAAGGTACATAGTATGGTGGATGCCAAGGGCATCTATTA
CACCTGCGGGCAGTTCAAGACGTACTACGTCAACTTCGTCAAGGAAGCCGAAAAGTATGGTTCCACCA
AGCACTGGGAGGTGTGTTACGGGAGTACTGTGATCTGCAGCCCCGCCTCCGTGTCGTCCACCACCCAG
GAAGTGAGCATTCCGGAGAGCACCACATACACCCCGGCCCAAACGAGCACGCTCGTCAGCAGCAGCAC
CAAGGAGGACGCCGTCCAGACGCCCCCCCGGAAGAGGGCCCGGGGGGTCCAGCAGTCTCCCTGCAATG
CCCTGTGCGTTGCTCACATCGGCCCTGTCGATTCTGGGAACCACAATCTCATCACGAACAACCACGAC
CAGCACCAAAGGCGCAACAACTCTAACAGCTCCGCAACTCCAATAGTGCAGTTCCAGGGGGAGTCCAA
CTGCCTCAAGTGTTTCCGCTACCGCCTCAACGACCGCCACCGCCACCTGTTCGACTTGATCAGTTCCA
CGTGGCACTGGGCCAGCAGCAAGGCGCCCCACAAACACGCTATCGTGACGGTGACCTACGACTCCGAG
GAGCAGAGGCAGCAGTTCCTGGACGTCGTGAAGATTCCTCCGACAATCAGCCACAAGCTTGGCTTCAT
GTCCCTGCACCTGCTGATGGAAGCCATCGCGAAGAGGCTCGACGCCTGCCAGGACCAGCTGCTCGAGC
TGTACGAGGAGAACAGCATTGACATCCATAAGCACATCATGCACTGGAAGTGCATTCGCCTGGAGAGC
GTGCTGTTGCACAAGGCCAAGCAGATGGGCCTGTCCCACATAGGCCTTCAGGTGGTCCCCCCTCTGAC
CGTGTCAGAGACAAAGGGCCATAACGCAATCGAGATGCAGATGCACCTCGAGTCGCTGGCGAAAACAC
AGTACGGCGTGGAGCCATGGACCCTGCAGGACACCTCGTACGAAATGTGGCTGACCCCACCTAAGCGA
TGCTTCGCCAAACAGGGCAACACAGTGGAGGTGAAGTTCGACGGCTGTGAGGATAACGTTATGGAGTA
TGTCGTGTGGACGCACATCTATCTGCAGGACAACGACAGTTGGGTGAAGGTGACCAGCTCCGTGGACG
CGAAGGGCATCTACTATACCTGTGGGCAGTTTAAAACCTACTATGTGAACTTCAACAAAGAGGCCCAA
AAGTATGGCTCCACCAACCACTGGGAGGTCTGCTATGGGAGCACGGTGATTTGCTCTCCCGCCAGCGT
GTCTAGCACTGTGCGCGAGGTGAGCATTGCCGAGCCGACCACGTACACCCCTGCCCAGACGACCGCTC
CGACCGTGTCTGCTTGTACTACCGAGGACGGCGTGAGCGCTCCACCCAGGAAGCGTGCGAGGGGCCCA
AGCACCAACAACACCCTCTGTGTGGCGAACATTCGCAGCGTCGACAGTACCATCAATAACATCGTGAC
GGATAACTATAACAAGCACCAGAGGCGTAACAACTGTCACTCTGCCGCAACCCCCATCGTGCAGCTCC
AGGGAGACAGCAATTGCCTTAAGTGCTTCCGCTATCGCCTCAACGACAAGTACAAGCACCTCTTTGAG
CTCGCCTCGTCGACGTGGCACTGGGCCTCACCCGAGGCACCTCACAAGAACGCCATCGTCACTCTCAC
TTACTCCAGTGAGGAGCAGAGACAGCAGTTTCTGAACAGCGTGAAGATCCCACCGACGATCCGTCATA
AGGTCGGCTTCATGTCACTGCATCTCCTGATGGCAGACGATTCCGGTACTGAGAACGAAGGTTCTGGT
TGTACCGGTTGGTTCATGGTTGAAGCAATCGTTCAGCATCCGACTGGTACCCAGATCTCCGATGACGA
AGACGAAGAAGTTGAAGATTCTGGTTACGACATGGTTGACTTCATCGATGACTCCAACATCACTCATA 44- 88379 200411055
ACTCTCTGGAAGCACAGGCTCTGTTTAACCGCCAGGAAGCTGATACCCATTACGCTACTGTTCAGGAC
CTGGGAGGCAAATATCTGGGCTCTCCGTACGTTTCCCCGATCAACACTATCGCAGAAGCAGTTGAGTC
TGAAATCTCCCCGCGCCTGGACGCTATCAAACTGACTCGTCAGCCGAAGAAGGTTAAACGTCGTCTGT
TCCAGACTCGTGAACTGACCGACTCCGGTTACGGTTATAGCGAAGTTGAGGCTGGCACCGGCACCCAG
GTTGAAAAACACGGTGTACCGGAAAACGGCGGCGACGGTCAGGAAAAGGACACCGGCCGCGACATCGA
GGGTGAGGAACACACCGAAGCTGAAGCTCCGACTAACTCTGTTCGTGAACACGCAGGTACTGCGGGTA
TCCTGGAACTGCTGAAATGCAAAGACCTGCGCGCGGCTCTGCTGGGCAAATTCAAAGAATGCTTCGGC
CTGTCTTTCATTGACCTGATCCGTCCGTTTAAGTCTGACAAAACTACCTGTCTGGACTGGGTTGTAGC
AGGCTTCGGCATCCACCACTCTATCTCTGAAGCATTCCAGAAACTGATCGAGCCGCTGTCTCTGTACG
CGCACATCCAGTGGCTGACTAACGCTTGGGGTATGGTTCTGCTGGTACTGCTGCGCTTTAAAGTAAAC
AAATCTCGTTCCACTGTTGCTCGTACTCTGGCTACCCTGCTGAACATCCCGGAGAACCAGATGCTGAT
CGAACCGCCGAAAATCCAGTCTGGTGTAGCTGCACTGTACTGGTTTCGTACTGGCATCTCTAACGCTA
GCACTGTTATCGGTGAAGCACCGGAATGGATCACTCGTCAGACCGTTATCGAACACGGTCTGGCAGAT
TCTCAGTTCAAACTGACTGAAATGGTTCAGTGGGCATACGACAACGACATCTGCGAGGAATCTGAAAT
TGCGTTCGAATACGCTCAGCGTGGCGACTTCGACTCCAACGCTCGTGCTTTCCTGAACAGCAACATGC
AGGCTAAATACGTAAAAGACTGCGCTACCATGTGCCGTCACTACAAACACGCGGAAATGCGTAAAATG
TCTATCAAACAGTGGATCAAGCACCGCGGTTCTAAAATCGAAGGTACCGGTAACTGGAAACCGATCGT
TCAGTTCCTGCGCCATCAGAACATCGAATTCATCCCGTTCCTGACCAAATTCAAGCTGTGGCTGCACG
GTACCCCGAAAAAAAACTGCATCGCTATCGTAGGTCCACCGGACACTGACAAGTCTTACTTCTGTATG
TCCCTGATCTCTTTCCTGGGCGGCACTGTAATCTCTCACGTTAACTCTTCCTCCCATTTCTGGCTGCA
GCCACTGGTAGACGCGAAAGTAGCTCTGCTGGACGACGCGACCCAGCCGTGCTGGATCTACATGGATA
CTTACATGCGCAACCTGCTGGACGGTAACCCGATGTCTATCGACCGTAAACACAAAGCGCTGACTCTG
ATCAAGTGCCCGCCGCTGCTGGTAACTTCTAACATCGACATCACCAAGGAAGATAAATACAAGTACCT
GCATACCCGTGTTACTACCTTTACTTTCCCGAACCCGTTCCCGTTTGATCGTAACGGTAACGCTGTTT
ACGAACTGTCCAACACTAACTGGAAATGCTTCTTCGAGCGTCTGTCTTCCTCCCTGGACATCCAGGAC
TCTGAAGATGAAGAAGATGGTTCTAACTCTCAGGCTTTCCGTTGTGTTCCGGGTACTGTTGTTCGTAC
TCTGTGA 胺基酸序列(序列識別22號)
MEAIAKRLDA PLKVSEAXGH FDGCANNTMD TKHWEVCYGS RGVQQSPCNA
CQEQLLELYE NAIEMQMHLE YWWTDVYVQ TVICSPASVS LCVAHIGPVD
ENSTDLHKHV SLLRTEYSME DNDTWVKVHS STTQEVSIPE SGNHNLITNN
LHWKCMRHES PWTLQETSYE MVDAKGIYYT STTYTPAQTS HDQHQRRNNS
VLLYKAKQMG MWQTPPKRCF CGQFKTYYVN TLVSSSTKED NSSATPIVQF
LSHIGMQWP AKRGKTVEVK FVKEAEKYGS AVQTPPRKRA QGESNCLKCF 45- 88379 200411055
RYRLNDRHRH GFMSLHLLME HIGLQWPPL QGNTVEVKFD KEAQKYGSTN VSAPPRKRAR SNCLKCFRYR PTIRHKVGFM DMVDFIDDSN 工SPRLDAIKL DTGRDIEGEE PFKSDKTTCL KSRSTVARTL VIEHGLADSQ CATMCRHYKH HGTPKKNCIA TQPCWIYMDT TFTFPNPFPF VRTL
LFDLISSTWH
AIAKRLDACQ
TVSETKGHNA
GCEDNVMEYV
HWEVCYGSTV
GPSTNNTLCV
LNDKYKHLFE
SLHLLMADDS
ITHNSLEAQA
TRQPKKVKRR
HTEAEAPTNS
DWWAGFGIH
ATLLNIPENQ
FKLTEMVQWA
AEMRKMSIKQ
IVGPPDTDKS
YMRNLLDGNP
DRNGNAVYEL
WASSKAPHKH DQLLELYEEN IEMQMHLESL WTHIYLQDN ICS PAS VS ST ANIRSVDSTI LASSTWHWAS GTENEGSGCT LFNRQEADTH LFQTRELTDS VREHAGTAGI HSISEAFQKL MLIEPPKIQS YDNDICEESE WIKHRGSKIE YFCMSLISFL MSIDRKHKAL SNTNWKCFFE
AIVTVTYDSE SIDIHKHIMH AKTQYGVEPW DSWVKVTSSV VREVSIAEPT NNIVTDNYNK PEAPHKNAIV GWFMVEAIVQ YATVQDLGGK GYGYSEVEAG LELLKCKDLR 工EPLSLYAH工 GVAALYWFRT IAFEYAQRGD GTGNWKPIVQ GGTVISHVNS TLIKCPPLLV RLSSSLDIQD
EQRQQFLDW WKCIRLESVL TLQDTSYEMW DAKGIYYTCG TYTPAQTTAP HQRRNNCHSA TLTYSSEEQR HPTGTQISDD YLGSPYVSP工 TGTQVEKHGV AALLGKFKEC QWLTNAWGMV GISNASTVIG FDSNARAFLN FLRHQNIEFI SSHFWLQPLV TSNIDITKED SEDEEDGSNS
KIPPTISHKL
LHKAKQMGLS
LTPPKRCFAK
QFKTYYWFN
TVSACTTEDG
ATPIVQLQGD
QQFLNSVKIP
EDEEVEDSGY
NTIAEAVESE
PENGGDGQEK
FGLSFIDLIR
LLVLLRFKVN
EAPEWITRQT
SNMQAKYVKD
PFLTKFKLWL
DAKVALLDDA
KYKYLHTRVT
QAFRCVPGTV 從來自 David Hodgeson (Warwick University)之質體 pDAH212的繼代純種系中,獲得ColEl cer序歹ij ,並藉著 PCR,使用引子擴大,將EcoRI限制位置放在序列的末端。 然後將cer序列插入p7313-PL的EcoRI位置内,產生質體 p7313-PLc 。對Genbank登記M11411證實已經擴大之cer的序 列。 實例2_在哺乳動物293T細臉中表现 在 37 C 下’在 5%C〇2 中,以每 6孔 Corning CostarTM(Corning Science Products,10 The ValleyCentre,Gordon Road,High Wycombe,Bucks,UK)組織培養盤2X1 〇5個細胞之終濃度,使 哺乳動物293T細胞生長至對數期。製備下列的轉移感染混 合物並複合2 5分鐘: -46- 88379.doc 200411055 感興趣的DNA 2微克 2微克 溶解於無菌的二次蒸餾水中 16微升 OPTI-mem™ (Gibco BRL, Paisley, Scotland) 8微升 脂染胺TM(GibcoBRL) 6微升。 以OPTl-memTM小心地沖洗在孔中的每個細胞單層兩 次。在每孔中加入800微升OPTI-memTM。在每個轉移感染 混合物中加入200微升OPTI-mem™,混合並溫和地加至細 胞單層中。在37°C下,在5%C02中,培養該盤5小時,隨後 拋棄轉移感染混合物和〇PTI-memTM。以細胞生長培養基溫 和地沖洗細胞單層兩次,並在37°C下,在5%C02中,在含 有10%胎牛血清和29.2毫克/毫升L-穀胺醯胺的杜貝可氏 (Dulbecco、)經過修改的鷹式(Eagle)培養基中培養完全轉移 感染的細胞24小時。將細胞刮到微量試管中,以PBS沖洗兩 次,離心並將細胞小球再懸浮於SDS Page Laemmli染料中。 將細胞小球煮沸,並裝入10%SDS Page凝膠中,在IX Tris 甘胺酸SDS緩衝溶液中電泳。在電泳之後,將凝膠沾染到硝 基纖維素膜(Amersham)上,並進行西方墨點法。在室溫下, 以在 PBS 中之 5% MarvelTM (Premier Beverages,Knighton, Adbaston,Stafford,UK)阻斷該确基纖維素膜30分鐘,並以 PBS和0.1 %吐溫20沖洗兩次。以在PBS中之5% MarvelTM稀釋 在兔子中對HPV6bEl之C終端蛋白質序列(蛋白質序列: CSSSLDIQDSEDEEDGSNSQAFR序列識別23號)升高的多株 抗體,並加至硝基纖維素膜上。在室溫下培養1小時,並溫 88379 -47- 200411055 和地攪動。亦使用對抗HPV11E1的多株抗體來檢查交叉反 應性。移出稀釋的抗體,並以PBS和0.1%吐溫20沖洗膜三 次。以PBS和0.1%吐溫20稀釋二級共軛物,豬抗-兔子辣根 過氧化酶(HRP)(DAKO)至1:20000。將其加至經過沖洗的膜 上,並在室溫下溫和地攪動,培養1小時。然後以PBS和0.1 % 吐溫20徹底沖洗該膜。使用化學發光HRP套組(Amersham), 檢查轉移到膜上的蛋白質。 結果: 結果(圖13)顯示分別由含有密碼子最優化HPV多蛋白之 HPV 116、117、118表現的正確蛋白質尺寸。 以大約0.5微克之個別構築體的DNA轉移感染HEK293T細 胞,並在24小時之後收獲細胞。然後藉著第一個聚丙烯醯 胺凝膠電泳分析這些試樣,然後再以西方墨點法分析。使 用兩個肽抗體來檢測多蛋白的表現(約180 kd);抗-6bEl (第 1097 號)和抗-6bE2 (第 1101號)。 實例3 E1抗原的失活和實驗證明 HPVE1蛋白質是完全保留的核蛋白,具有非-專一的DNA 結合、ATP酶和解螺旋酶活性。E1亦與宿主細胞DNA聚合酶 -α引導酶結合,並與HPV E2蛋白質結合,然後其’招募’ E1, 成為前-起始病毒DNA複製複合體。Ε1的主要角色是在被感 染的細胞中,發動病毒專一的DNA複製。 Ε1 (和Ε2)的DNA複製功能,是相對上非·專一的,且許多 研究目前已經顯示得自一個基因型的Ε1和Ε2蛋白質可駕馭 88379 -48- 200411055 帶有得自不同基因型之複製起點序列的質體專一的DNA複 製起點。研究亦已經顯示將高度表現的E1和E2導入業已藏 有低副本數目HPV質體的細胞内,結果明顯地擴大了該質 體。該雜亂使其具有低可能的安全風險,調查這項課題而 加以排除。結果,尋找在E1 (和E2)中使其複製效能失活的 突變。 E1突變G482D出現在高度保留的ATP結合一致序列中,並 已經顯示帶有該突變的E1蛋白質具有多個功能缺陷。已經 顯示其他朝向蛋白質N-終端的突變(K83G、R84G),廢止了 E1的核定位作用。無法定位核的隔間,亦將足以分開E1與 宿主複製蛋白質和病毒DNA,提供無能和安全性的额外標 準。選擇這些突變(G428D、K83G、R84G),並併入E1,成 為HPVDNA免疫治療E1載體的一部分。 使用在活體外的HPVDNA複製測定,證實E1之DNA複製 功能的無能(由於推論的結果,亦能夠在該相同的測定中證 實E2之提高複製活性的突變失活)。簡言之,E1和E2兩者以 共同_操作之方式激活HPV的複製起點,並已知得自HPV 6b 之El和E2蛋白質激活並重新駕馭得自HPV-11起點的DNA 複製。利用攜帶HPV-11複製起點的質體(ori質體),將編碼 我們的密碼予-最優化E1和E2序列之質體共同_轉移至293 細胞内。藉著在共同-轉移感染之後48小時,從細胞中獲得 DNA,來測量輸入ori質體的E1和E2依賴性複製(Hirt溶解)。 首先以限制酵素Hind III消化經過萃取的DNA,然後以Dpn I 消化,其消化未經甲基化未複製的DNA。然後進行DNA的 88379 -49- 200411055 南方墨點法,並與做為探針的〇ri質體DNA雜交。在Dpnl消 化之後,具有等於質體之尺寸的譜帶是重新在活體外複 製之質體DNA的標記。 野外型E1和E2(HPV119 + HPV120)顯示一強譜帶,代表 複製的輸入質體DN A。三個引導構築體的結果顯示均為陰 性的(HPV 116、HPV 117 和 HPV 118);沒有複製。 結論:引導構築體HPV 116、HPV 117和HPV 118沒有DNA 複製活性。 實例4 乳頭狀瘤病毒的E2蛋白質是位置-專一的DNA結合核蛋 白,具有作為主要複製起點認知蛋白質的功能,並幫助前-起始DNA複製複合體的組裝。全長的E2蛋白質亦可作為病 毒轉錄的阻遏物或活化劑(相對於其他轉錄因子之位置),視 其位置及該蛋白質對其關聯結合位置之親和力而定。亦已 知E2影響數個宿主細胞啟動基因的轉錄。已經廣泛地研究 了 E2的突變失活,並已經顯示一個特殊的點突變Lys 111 — Ala (KillA),使E2的轉錄和複製功能兩者失活。該突變亦 可能具有防止蛋白質之核移位的額外益處。將該突變 (K111A)併入每個E2抗原内,成為HPVDNA免疫治療的一部 分。
我們著手證實KillA突變之E2和每個多蛋白構築體,在 活體外CAT轉錄報告者測定中的無能。我們使用兩個陽性 對照組(有活性之E2蛋白質的來源)。有一個構築體表現未 突變(有活性的)HPV-11 E2蛋白質,而第二個載體表現BPV 88379 -50- 200411055 E2蛋白質,一個強轉錄的轉活化劑。在圖14中顯示這些資 料。 結論:這些資料顯示從天然(未突變的)HPV 6b E2載體中 表現的蛋白質,在轉錄上是具有活性的,而突變的(K111A) E2是沒有活性的,就像多蛋白載體HPV 116、117和11 8的每 一個。 實例5 個別基因構築體HPV 116、HP V 117和HPV 118的表現和比 較 比較引導構築體HPV 116、HPV 117和HPV 118的基因表 現研究,在活體外的基因表現中,無法確認任何清楚的差 異。此外,多蛋白的表現等於個別(未融合)抗原在單一質體 中的表現(HPV110)。同樣重要的是,導入點突變不影響基 因表現(HPV 108 和 HPV 110)。 實例6 在老鼠中,在活體内的免疫原性研究 為了比較三種不同構築體HPV 116、HPV 117和HPV 118 在活體内的免疫原性,使用PMID免疫老鼠。 每個免疫包括兩次注射〇·5微克DNA至Balb/c (H-2Kd)或 C57BL6(H-2Kb)老鼠剃過毛的腹部内。以1微克DNA謗發動 物,在21天之後以相等的劑量補強,並在補強5_7天之後揀 選。取得血清和脾臟,分析在PMID之後產生的體液和細胞 免疫反應。 體液測定 88379 -51 - 200411055 使用標準ELISA方法,並以重組的El和E2蛋白質作為捕 捉抗原,評估在PMID免疫之老鼠中升高的抗體。不能可靠 地檢測抗體反應,除了在E2免疫老鼠中延長免疫計畫之 後。我們未證實在老鼠中,對E1抗原之抗體的檢測。將這 些弱/不可檢測的抗體反應保留在公開的文獻中。 細胞測定 使用ELISPOT測定,研究在老鼠中的細胞免疫反應。該 技術適合用來評估在已知密度的培養物中,能夠專一地反 映出現在同基因MHC分子情況下之抗原而分泌細胞激動素 之細胞的頻率。 簡言之,將分離自免疫動物之脾臟細胞的單一細胞懸浮 液加至塗覆有抗-細胞激動素捕捉抗體之專門的微量滴定 盤上,並在由適當標乾細胞提供之抗原的存在下培養過 夜。在直接圍繞細胞之處,藉著與培養盤結合之抗體捕捉 細胞激動素,並當溶解和洗掉細胞時仍保持結合。藉著使 用生物素基化的二級抗-細胞激動素抗體和鏈黴素抗生物 素蛋白鹼性磷酸酶共軛物,完成檢測。該酵素對發色團受 質的作用,容許看見產生細胞激動素之細胞的頻率。 牛痘ELISPOT測定和資料 因為缺乏已定義的老鼠T細胞抗原決定位,以設計用來表 現標靶抗原之重組牛痘病毒的形式提供。使用這類病毒感 染適當的標靶細胞,在ELISPOT測定中將抗原提交給效應 物細胞。 在三個候選構築體對C57BL/6老鼠的PMID之後,檢測對 88379 -52- 200411055 HPV 6bEl的反應。以統計之方式分析2個分開實驗的結果。 在圖15和16中出示代表性實驗的結果。 作為例證的免疫原性資料,在老鼠中使用引導構築體和 PMID : CTL·測定和資料 激活的CD8+ T細胞能夠反映在同基因MHC I分子的情況 下出現之特定肽而溶解細胞。可藉著Eu3 +釋放生物測定, 一種傳統鉻釋放測定的非-放射性修改,來判定該功能。 為了這些目的使用該測定,需要確認衍生自HP V 6bE 1蛋 白質之主要序列的CD8+ T細胞抗原決定位。這可藉著使用 細胞激動素ELISPOT,篩選包括與11重疊之15-聚的肽庫而 達成。藉著標準流動技術,確認反映之組群為CD4 +或CD8 + T細胞。 該技術之基礎涉及溶解以關聯肽脈衝之Eu3 +標示的標乾 細胞。在兩小時的培養期間内,當標靶細胞被細胞溶解T 細胞溶解時,Eu3 +便被釋放到培養物上清液中。這可藉著 時間-決定的螢光測定法檢測之。以在藉著化學方法溶解標 靶細胞時所檢測到之溶解總量的百分比,來表現專一的溶 解作用。 評估細胞免疫學資料 HPV 116、HPV 117和HPV 118的免疫學評估,包括在老 鼠中利用牛痘ELISPOT和CTL測定分析作為免疫學輸出的 重複PMID免疫研究。所有候選者均對每個抗原升高強的免 疫反應。 88379 -53- 200411055 牛痘ELISPOT資料,集體地顯示對El的反應,並未藉由 突變或與E2抗原組份融合而得到解決。此時,比較在 HPV-108(單一 6b E1構築體)、HPV 116、HPV 117與 HPV 118 之間的E1反應,反應在統計學上並無差異。然而,牛痘 ELISPOT資料卻在對HPV-11 E2抗原組份的反應上顯示出 差異。在以HPV 118免疫的老鼠中,E2抗原專一性反應明顯 地比以HPV 116或HPV 117免疫之老鼠中的反應更大。僅以 此為基礎,HPV 118似乎是比HPV 116或HPV 117更優異的 免疫原。 E1抗原專一之CTL溶解的分析,亦顯示出效力的趨勢。 使用T-細胞形式之HPV 118免疫老鼠的專一性溶解百分比 比利用HPV 116或HPV 117的更高。該觀察是可再現的。 總而言之,並以牛痘ELISPOT和CTL溶解兩者的資料為基 礎,HPV 118是較強的免疫原。 結論:在純免疫學的基準上,構築體HPV 118是最具免疫 原性的多蛋白。 實例7 密碼子-最優化COPV E1/E2融合蛋白質的PMID遞送,在 保護對抗犬口腔乳頭狀瘤病毒疾病上,比單獨的密碼子-最 優化E1或密碼子-最優化E2更有效。 導入 犬口腔乳頭狀瘤病毒(COPV)動物模式是黏膜人類乳頭狀 瘤病毒疾病的良好模仿物。在狗由C0PV引起之疾病的特 徵,非常類似發生在人類中的特徵(Nicholls等人Virology 88379 -54- 200411055 2001,283(1) 31-39)。重要的是,它是黏膜乳頭狀瘤病毒的 模式。COP V病毒感染犬黏膜上皮,並在疣出現數週的遲滯 期之後,然後在數週的額外期間之後自動退化。COPV病毒 編碼每個人類乳頭狀瘤病毒基因(El、E2、E4、E6、E7、L1 和L2)的同系物。 先前已經使用狗COPV黏膜疾病模式作為發展人類類病 毒顆粒(VLP)乳頭狀瘤病毒疫苗原理的關鍵模式(Ghim等人,
Vaccines 1995 25,375-379,Suzich等人,PNAS 1995,92 11553-11557)。現在正在發展人類乳頭狀瘤病毒VLP疫苗, 且最近已經完成人類的早期臨床試驗。 我們顯示在藉著PMID投予時,編碼密碼子最優化融合之 E1和E2基因的質體DNA,減輕疾病的負擔,比單獨編碼密 碼子最優化E1或密碼子最優化E2的質體更有效。 方法 密碼子-最優化E2/E1融合裁體6^^ 使用先前描述的方法’產製編碼密碼子_最優化C〇pv E2 序列的合成基因。將其與從純種系pC〇pvEl c/o中回收之合 成的密碼子·最優化COPV E1基因融合,並插入載體 WRG7〇77内,產生新的純種系,將其命名為pC〇pvE2/E1 c/o。該純種系表現包括COPV E2 (N終端)和COPV El (C終 端)融合的多蛋白。藉著西方墨點法判定,該多蛋白具有預 期的尺寸。 利用 pCOPVg上、p_gQPVE2 g/义和 dC〇PVE2/E1 c/o 免癌 + 獵犬 88379 -55- 200411055 藉著PMID,分別利用三種經過純化的質體pC〇PvEl c/〇 、pCOPVE2 c/o和pCOPVE2/El c/o免疫小獄犬。在腹部中線 每一側的12個皮膚位置,6個未重疊的位置免疫動物。所有 的預防接種均在普通的麻醉下進行。每組有五隻動物。在 第一次預防接種之後六週,以相同的方式著手補強接種, 使用相同的程序。 在最後的補強免疫之後2週,以有傳染性的c〇PV病毒攻 毒經過免疫的動物。在每隻動物上唇的黏膜輕輕地劃許多 細痕。將10微克經過純化的CQPV病毒製品分別塗抹在十個 位置(在上唇每一邊各五個),並容許吸收數分鐘。已經描述 了有傳染力之COPV病毒的分離和純化(Vir〇i〇gy 1999,265 (2) 365-374) 〇 在以COP V病毒攻毒之後,每週檢查黏膜攻毒的地方。測 量疲(乳頭狀瘤)出現的時間(在攻毒之後)和虎的尺寸(毫 米)。 在以pCOPVEl c/o免疫的動物中,在攻毒後第7週開始在 黏膜攻毒的地方發展出乳頭狀瘤。乳頭狀瘤持續生長,在 第11週尺寸達到>3.5毫米的平均尺寸。在以pc〇pvE2 c/o免 疫的動物中,在第8週首先出現乳頭狀瘤,但在第丨丨週時平 均的乳頭狀瘤尺寸達到1.5毫米。在以pC〇pvE2/El c/o免疫 的動物中,雖然疾病的第一個症狀與其他組同時發生,但 明顯地降低了整體的疾病負擔。在PCOPVE2/E1 c/o組(五隻) 中有一隻動物,被完全保護而免於疾病的發展,而在該組 中所有其他的動物均僅發展出極小的乳頭狀瘤,並在短期 88379 -56- 200411055 (1-2週)内退化。 在該乳頭狀瘤病毒感染的動物模式中,編碼COPV E1和 COPVE2融合的質體DNA,對於防止疾病的發展,比COPV El或COPV E2任一個都更有效。(圖18) 【圖式簡單說明】 圖1為本發明之HPV免疫治療疫苗構築體的圖解。 圖2為P70776be2的質體輿圖-編碼HPV 6b E2,其已經是最 優化和突變的密碼子。 圖3是p73plc6bel的質體輿圖·編碼HPV 6b E1,其已經是 最優化和突變的密碼子。 圖4是p707711e2的質體輿圖-編碼HPV 11 E2,其已經是最 優化和突變的密碼子。 圖5是HPV 102的質體舆圖_在?7313背景中編碼HPV 11 E2 ° 圖6是HPV 104的質體舆圖-在p7313背景中,融合來自HPV 6b的E2和來自HPV 11的E2。 圖7是HPV 105的質體輿圖-融合最優化、突變的HPV 6b E2密碼子和得自HP V 11的E2。 圖8是HPV 108的質體輿圖·在p7313背景中,最優化、突 變的HPV 6b E1密碼子。 圖9是HPV 110的質體舆圖-在p7313背景中,最優化、突 變的HPV 6b E2密碼子。 圖 10是 HPV 116的質體舆圖-HPV 6b El、HPV 6b E2、HPV 11 E2。 88379 -57- 200411055 圖11是1^¥117的質體輿圖-1^乂65£2、1^¥11£2、1^¥ 6b El。 圖12是HPV118的質體輿圖-HPV6bE2、HPVllE2、HPV 6b El。 圖13是在293 T細胞中,本發明之三個多蛋白構築體的西 方墨點分析。 圖14顯示在活體外,在CAT轉錄報告者測定中ΚΙΙΙΑ突變 之E2的無能。 圖15顯示在老鼠中對E1的細胞免疫反應。 圖16顯示對E2的細胞免疫反應。 圖17在PMID之後,利用HPV 118的-CTL測定資料。 圖18顯示在COPV模式中,在投予E1/E2之後,疣的縮減。 88379 -58- 200411055 序列表 <11〇> 英商葛蘭素集團有限公司 <120> 疫苗 <130> PG4961 <140> 092127210 <141〉 2003-10-23 <150> GB0222953.2 <151〉 2002-10-3 <160> 28 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 1107
<212> DNA <213> HPV <400> 1 atggaagcta ttgccaagcg actggacgcc tgccaggagc agctgctgga gctgtacgag 60 gaaaacagca·cagacctcca caagcacgtg ctgcactgga agtgcatgcg ccacgagtca 120 gtgctcctgt acaaggccaa gcagatgggg ctgtcccaca tcgggatgca ggtcgtgccc 180 ccgctgaagg tgagcgaagc caagggccac aacgctatcg agatgcagat gcacctggag 240 agcctgctgc ggaccgaata cagcatggag ccctggactc tccaggagac gtcctacgaa 300 atgtggcaga ctcctccgaa gcgctgtttc gcaaagcgcg gcaagacagt tgaggtgaaa 360 ttcgatgggt gcgcaaacaa cacgatggac tacgtggtgt ggaccgatgt ctacgtgcag 420 gacaatgaca cctgggtgaa ggtacatagt atggtggatg ccaagggcat ctattacacc 480 tgcgggcagt tcaagacgta ctacgtcaac ttcgtcaagg aagccgaaaa gtatggttcc 540 accaagcact gggaggtgtg ttacgggagt actgtgatct gcagccccgc ctccgtgtcg 600 tccaccaccc aggaagtgag cattccggag agcaccacat acaccccggc ccaaacgagc 660 acgctcgtca gcagcagcac caaggaggac gccgtccaga cgcccccccg gaagagggcc 720 cggggggtcc agcagtctcc ctgcaatgcc ctgtgcgttg ctcacatcgg ccctgtcgat 780 tctgggaacc acaatctcat cacgaacaac cacgaccagc accaaaggcg caacaactct 840 aacagctccg caactccaat agtgcagttc cagggggagt ccaactgcct caagtgtttc 900 cgctaccgcc tcaacgaccg ccaccgccac ctgttcgact tgatcagttc cacgtggcac 960 tgggccagca gcaaggcgcc ccacaaacac gctatcgtga cggtgaccta cgactccgag 1020 gagcagaggc agcagttcct ggacgtcgtg aagattcctc cgacaatcag ccacaagctt 1080 ggcttcatgt ccctgcacct gctgtga 1107
<210> 2 <211> 368 <212>蛋白質 <213> HPV <400> 2
Met Glu Ala lie Ala Lys Arg Leu Asp Ala Cys Gin Glu Gin Leu Leu 1 5 10 15
Glu Leu Tyr Glu Glu Asn Ser Thr Asp Leu His Lys His Val Leu His 20 25 30
Trp Lys Cys Met Arg His Glu Ser Val Leu Leu Tyr Lys Ala Lys Gin 35 40 45
Met Gly Leu Ser His 工le Gly Met Gin Val Val Pro Pro Leu Lys Val 50 55 60
Ser Glu Ala Lys Gly His Asn Ala lie Glu Met Gin Met His Leu Glu 65 70 75 80
Ser Leu Leu Arg Thr Glu Tyr Ser Met Glu Pro Trp Thr Leu Gin Glu 85 90 95
Thr Ser Tyr Glu Met Trp Gin Thr Pro Pro Lys Arg Cys Phe Ala Lys 100 105 110
Arg Gly Lys Thr Val Glu Val Lys Phe Asp Gly Cys Ala Asn Asn Thr 115 120 125
Met Asp Tyr Val Val Trp Thr Asp Val Tyr Val Gin Asp Asn Asp Thr 130 135 140
Trp Val Lys Val His Ser Met Val Asp Ala Lys Gly lie Tyr Tyr Thr 145 150 155 160 . 88379 200411055
Cys Gly Gin Phe Lys Thr Tyr Tyr 165
Lys Tyr Gly Ser Thr Lys His Trp 180 lie Cys Ser Pro Ala Ser Val Ser 195 200
Pro Glu Ser Thr Thr Tyr Thx Pro 210 215
Ser Ser Thr Lys Glu Asp Ala Val 225 230
Arg Gly Val Gin Gin Ser Pro Cys 245
Gly Pro Val Asp Ser Gly Asn His 260
Val Asn Phe Val Lys Glu Ala Glu 170 175
Glu Val Cys Tyr Gly Ser Thr Val 185 190
Ser Thr Thr Gin Glu Val Ser lie 205
Ala Gin Thr Ser Thr Leu Val Ser 220
Gin Thr Pro Pro Arg Lys Arg Ala 235 240
Asn Ala Leu Cys Val Ala His lie 250 255
Asn Leu lie Thr Asn Asn His Asp 265 270
Gin His Gin Arg Arg Asn Asn Ser Asn Ser Ser Ala Thr Pro lie Val 275 280 285
Gin Phe Gin Gly Glu Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu 290 295 300
Asn Asp Arg His Arg His Leu Phe Asp Leu lie Ser Ser Thr Trp His 305 310 315 320
Trp Ala Ser Ser Lys Ala Pro His Lys His Ala lie Val Thr Val Thr 325 330 335
Tyr Asp Ser Glu Glu Gin Arg Gin Gin Phe Leu Asp Val Val Lys lie 340 345 350
Pro Pro Thr lie Ser His Lys Leu Gly Phe Met Ser Leu His Leu Leu 355 360 365
<210> 3 <211> 1950 <212> DNA <213> HPV <400> 3 atggcagacg attccggtac tgagaacgaa ggttctggtt gtaccggttg gttcatggtt 60 gaagcaatcg ttcagcatcc gactggtacc cagatctccg atgacgaaga cgaagaagtt 120 gaagattctg gttacgacat ggttgacttc atcgatgact ccaacatcac tcataactct 180 ctggaagcac aggctctgtt taaccgccag gaagctgata cccattacgc tactgttcag 240 gacctgggag gcaaatatct gggctctccg tacgtttccc cgatcaacac tatcgcagaa 300 gcagttgagt ctgaaatctc cccgcgcctg gacgctatca aactgactcg tcagccgaag 360 aaggttaaac gtcgtctgtt ccagactcgt gaactgaccg actccggtta cggttatagc 420 gaagttgagg ctggcaccgg cacccaggtt gaaaaacacg gtgtaccgga aaacggcggc 480 gacggtcagg aaaaggacac cggccgcgac atcgagggtg aggaacacac cgaagctgaa 540 gctccgacta actctgttcg tgaacacgca ggtactgcgg gtatcctgga actgctgaaa 600 tgcaaagacc tgcgcgcggc tctgctgggc aaattcaaag aatgcttcgg cctgtctttc 660. attgacctga tccgtccgtt taagtctgac aaaactacct gtctggactg ggttgtagca 720 ggcttcggca tccaccactc tatctctgaa gcattccaga aactgatcga gccgctgtct 780 ctgtacgcgc acatccagtg gctgactaac gcttggggta tggttctgct ggtactgctg 840 cgctttaaag taaacaaatc tcgttccact gttgctcgta ctctggctac cctgctgaac 900 atcccggaga accagatgct gatcgaaccg ccgaaaatcc agtctggtgt agctgcactg 960 tactggtttc gtactggcat ctctaacgct agcactgtta tcggtgaagc accggaatgg 1020 atcactcgtc agaccgttat cgaacacggt ctggcagatt ctcagttcaa actgactgaa 1080 atggttcagt gggcatacga caacgacatc tgcgaggaat ctgaaattgc gttcgaatac 1140 gctcagcgtg gcgacttcga ctccaacgct cgtgctttcc tgaacagcaa catgcaggct 1200 aaatacgtaa aagactgcgc taccatgtgc cgtcactaca aacacgcgga aatgcgtaaa 1260 atgtctatca aacagtggat caagcaccgc ggttctaaaa tcgaaggtac cggtaactgg 1320 aaaccgatcg ttcagttcct gcgccatcag aacatcgaat tcatcccgtt cctgaccaaa 1380 ttcaagctgt ggctgcacgg taccccgaaa aaaaactgca tcgctatcgt aggtccaccg 1440 gacactgaca agtcttactt ctgtatgtcc ctgatctctt tcctgggcgg cactgtaatc 1500 tctcacgtta actcttcctc ccatttctgg ctgcagccac tggtagacgc gaaagtagct 1560 ctgctggacg acgcgaccca gccgtgctgg atctacatgg atacttacat gcgcaacctg 1620 ctggacggta acccgatgtc tatcgaccgt aaacacaaag cgctgactct gatcaagtgc 1680 ccgccgctgc tggtaacttc taacatcgac atcaccaagg aagataaata caagtacctg 1740 catacccgtg ttactacctt tactttcccg aacccgttcc cgtttgatcg taacggtaac 1800 gctgtttacg aactgtccaa cactaactgg aaatgcttct tcgagcgtct gtcttcctcc 1860 ctggacatcc aggactctga agatgaagaa gatggttcta actctcaggc tttccgttgt -2- 88379 200411055 gttccgggta ctgttgttcg tactctgtga 1950
<210> 4 <211> 649 <212>蛋白質 <213> HPV <400> 4
Met Ala Asp Asp Ser Gly Thr Glu Asn Glu Gly Ser Gly Cys Thr Gly 15 10 15
Trp Phe Met Val Glu Ala lie Val Gin His Pro Thr Gly Thr Gin lie 20 25 30
Ser Asp Asp Glu Asp Glu Glu Val Glu Asp Ser Gly Tyr Asp Met Val 35 40 45
Asp Phe lie Asp Asp Ser Asn lie Thr His Asn Ser Leu Glu Ala Gin 50 55 60
Ala Leu Phe Asn Arg Gin Glu Ala Asp Thr His Tyr Ala Thr Val Gin 65 70 75 80
Asp Leu Gly Gly Lys Tyr Leu Gly Ser Pro Tyr Val Ser Pro lie Asn 85 90 95
Thr lie Ala Glu Ala Val Glu Ser Glu lie Ser Pro Arg Leu Asp Ala 100 105 110 lie Lys Leu Thr Arg Gin Pro Lys Lys Val Lys Arg Arg Leu Phe Gin
115 120 125
Thr Arg Glu Leu Thr Asp Ser Gly Tyr Gly Tyr Ser Glu Val Glu Ala 130 135 140
Gly Thr Gly Thr Gin Val Glu Lys His Gly Val Pro Glu Asn Gly Gly 145 150 155 160
Asp Gly Gin Glu Lys Asp Thr Gly Arg Asp lie Glu Gly Glu Glu His 165 170 175
Thr Glu Ala Glu Ala Pro Thr Asn Ser Val Arg Glu His Ala Gly Thr 180 185 190
Ala Gly lie Leu Glu Leu Leu Lys Cys Lys Asp Leu Arg Ala Ala Leu 195 200 205
Leu Gly Lys Phe Lys Glu Cys Phe Gly Leu Ser Phe lie Asp Leu lie 210 215 · 220
Arg Pro Phe Lys Ser Asp Lys Thr Thr Cys Leu Asp Trp Val Val Ala 225 230 - 235 240
Gly Phe Gly lie His His Ser lie Ser Glu Ala Phe Gin Lys Leu lie 245 250 255
Glu Pro Leu Ser Leu Tyr Ala His lie Gin Trp Leu Thr Asn Ala Trp 260 - 265 270
Gly Met Val Leu Leu Val Leu Leu Arg Phe Lys Val Asn Lys Ser Arg 275 280 285
Ser Thr Val Ala Arg Thr Leu Ala Thr Leu Leu Asn lie Pro Glu Asn 290 295 300
Gin Met Leu lie Glu Pro Pro Lys 工le Gin Ser Gly Val Ala Ala Leu 305 310 315 320
Tyr Trp Phe Arg Thr Gly lie Ser Asn Ala Ser Thr Val lie Gly Glu 325 330 335
Ala Pro Glu Trp lie Thr Arg Gin Thr Val 工le Glu His Gly Leu Ala 340 345 350
Asp Ser Gin Phe Lys Leu Thr Glu Met Val Gin Tip Ala Tyr Asp Asn 355 360 365
Asp lie Cys Glu Glu Ser Glu lie Ala Phe Glu Tyr Ala Gin Arg Gly 370 375 380
Asp Phe Asp Ser Asn Ala Arg Ala 385 390 Lys Tyr Val Lys Asp Cys Ala Thr 405 Glu Met Arg Lys Met Ser lie Lys 420 Lys lie Glu Gly Thr Gly Asn Trp 435 440 His Gin Asn lie Glu Phe lie Pro 450 455
Phe Leu Asn Ser Asn Met Gin Ala 395 400 Met Cys Arg His Tyr Lys His Ala 410 415 Gin Trp lie Lys His Arg Gly Ser 425 430 Lys Pro lie Val Gin Phe Leu Arg 445 Phe Leu Thr Lys Phe Lys Leu Trp 460 88379 200411055
Leu His Gly Thr 465 Asp Thr Asp Lys Gly Thr Val lie 500
Pro Lys Lys Asn Cys 工le Ala lie Val Gly Pro Pro 470 475 480
Ser Tyr Phe Cys Met Ser Leu lie Ser Phe Leu Gly 485 490 495
Ser His Val Asn Ser Ser Ser His Phe Trp Leu Gin 505 510
Pro Leu Val Asp Ala Lys Val Ala Leu Leu Asp Asp Ala Thr Gin Pro 515 520 525
Cys Trp lie Tyr Met Asp Thr Tyr Met Arg Asn Leu Leu Asp Gly Asn 530 535 540
Pro Met Ser lie Asp Arg Lys His Lys Ala Leu Thr Leu lie Lys Cys 545 550 555 560
Pro Pro Leu Leu Val Thr Ser Asn 工le Asp lie Thr Lys GIn Asp Lys 565 570 575
Tyr. Lys Tyr Leu His Thr Arg Val Thr Thr Phe Thr Phe Pro Asn Pro 580 585 590
Phe Pro Phe Asp Arg Asn Gly Asn Ala Val Tyr Glu Leu Ser Asn Thr 595 600 605
Asn Trp Lys Cys Phe Phe Glu Arg Leu Ser Ser Ser Leu Asp 工le Gin 610 615 620
Asp Ser Glu Asp Glu Glu Asp Gly Ser Asn Ser Gin Ala Phe Arg Cys 625 630 635 640
Val Pro Gly Thr Val Val Arg Thr Leu 645 <210> 5 <211> 1104 <212> DNA <213> hpv <400> 5 atggaagcca tcgcgaagag gctcgacgcc tgccaggacc agctgctcga gctgtacgag 60 gagaacagca ttgacatcca taagcacatc atgcactgga agtgcattcg cctggagagc 120 gtgctgttgc acaaggccaa gcagatgggc ctgtcccaca taggccttca ggtggtcccc 180 cctctgaccg tgtcagagac aaagggccat aacgcaatcg agatgcagat gcacctcgag 240 tcgctggcga aaacacagta cggcgtggag ccatggaccc tgcaggacac ctcgtacgaa 300 atgtggctga ccccacctaa gcgatgcttc gccaaacagg gcaacacagt ggaggtgaag 360 ttcgacggct gtgaggataa cgttatggag tatgtcgtgt ggacgcacat ctatctgcag 420 gacaacgaca gttgggtgaa ggtgaccagc tccgtggacg cgaagggcat ctactatacc 480 tgtgggcagt ttaaaaccta ctatgtgaac ttcaacaaag aggcccaaaa gtatggctcc 540 accaaccact gggaggtctg ctatgggagc acggtgattt gctctcccgc cagcgtgtct 600 agcactgtgc gcgaggtgag cattgccgag ccgaccacgt acacccctgc ccagacgacc 660 gctccgaccg tgtctgcttg tactaccgag gacggcgtga gcgctccacc caggaagcgt 720 gcgaggggcc caagcaccaa caacaccctc tgtgtggcga acattcgcag cgtcgacagt 780. accatcaata acatcgtgac ggataactat aacaagcacc agaggcgtaa caactgtcac 840 tctgccgcaa cccccatcgt gcagctccag ggagacagca attgccttaa gtgcttccgc 900 tatcgcctca acgacaagta caagcacctc tttgagctcg cctcgtcgac gtggcactgg 960 gcctcacccg aggcacctca caagaacgcc atcgtcactc tcacttactc cagtgaggag 1020 cagagacagc agtttctgaa cagcgtgaag atcccaccga cgatccgtca taaggtcggc 1080 ttcatgtcac tgcatctcct gtga 1104
<210> 6 <211> 367 <212>蛋白質 <213> HPV <400> 6
Met Glu Ala lie Ala Lys Arg Leu Asp Ala Cys Gin Asp Gin Leu Leu 15 10 15
Glu Leu Tyr Glu Glu Asn Ser lie Asp lie His Lys His 工le Met His 20 25 30
Trp Lys Cys lie Arg Leu Glu Ser Val Leu Leu His Lys Ala Lys Gin 35 40 45
Met Gly Leu Ser His He Gly Leu Gin Val Val Pro Pro Leu Thr Val 50 55 60 . -4- 88379 200411055
Ser Glu Thr Lys Gly His Asn Ala lie Glu Met Gin Met His Leu Glu 65 7 0 75 80
Ser Leu Ala Lys Thr Gin Tyr Gly Val Glu Pro Trp Thr Leu Gin Asp 85 90 95
Thr Ser Tyr Glu Met Trp Leu Thr Pro Pro Lys Arg Cys Phe Ala Lys 100 105 110
Gin Gly Asn Thr Val Glu Val Lys Phe Asp Gly Cys Glu Asp Asn Val 115 120 125
Met Glu Tyr Val Val Trp Thr His lie Tyr Leu Gin Asp Asn Asp Ser 130 135 140
Trp Val Lys Val Thr Ser Ser Val Asp Ala Lys Gly lie Tyr Tyr Thr 145 150 155 ΙβΟ
Cys Gly Gin Phe Lys Thr Tyr Tyr Val Asn Phe Asn Lys Glu Ala Gin 165 170 175
Lys Tyr Gly Ser Thr Asn His Trp Glu Val Cys Tyr Gly Ser Thr Val 180 185 190 lie Cys Ser Pro Ala Ser Val Ser Ser Thr Val Arg Glu Val Ser lie 195 200 205
Ala Glu Pro Thr Thr Tyr Thr Pro Ala Gin Thr Thr Ala Pro Thr Val 210 215 220
Ser Ala Cys Thr Thr Glu Asp Gly Val Ser Ala Pro Pro Arg Lys Arg 225 230 235 240
Ala Arg Gly Pro Ser Thr Asn Asn Thr Leu Cys Val Ala Asn lie Arg 245 250 255
Ser Val Asp Ser Thr lie Asn Asn lie Val Thr Asp Asn Tyr Asn Lys 260 265 270
His Gin Arg Arg Asn Asn Cys His Ser Ala Ala Thr Pro lie Val Gin 275 280 285
Leu Gin Gly Asp Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu Asn 290 295 300
Asp Lys Tyr Lys His Leu Phe Glu Leu Ala Ser Ser Thr Trp His Trp 305 310 315 320
Ala Ser Pro Glu Ala Pro His Lys Asn Ala 工le Val Thr Leu Thr Tyr 325 330 335
Ser Ser Glu Glu Gin Arg Gin Gin Phe Leu. Asn Ser Val Lys lie Pro 340 345 350
Pro Thr lie Arg His Lys Val Gly Phe Met Ser Leu His Leu Leu 355 360 365
<210> 7 <211> 1104 <212> DNA <213> HPV 60 12 0 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1104 <400> 7 atggaagcca gagaacagca gtgctgttgc cctctgaccg tcgctggcga atgtggctga ttcgacggct gacaacgaca tgtgggcagt accaaccact agcactgtgc gctccgaccg gcgaggggcc accatcaata tctgccgcaa tatcgcctca gcctcacccg cagagacagc ttcatgtcac tcgcgaagag ttgacatcca acaaggccaa tgtcagagac aaacacagta ccccacctaa gtgaggataa gttgggtgaa ttaaaaccta gggaggtctg gcgaggtgag tgtctgcttg caagcaccaa acatcgtgac cccccatcgt acgacaagta aggcacctca agtttctgaa tgcatctcct gctcgacgcc taagcacatc gcagatgggc aaagggccat cggcgtggag gcgatgcttc cgttatggag ggtgaccagc ctatgtgaac ctatgggagc cattgccgag tactaccgag caacaccctc ggataactat gcagctccag caagcacctc caagaacgcc cagcgtgaag gtga tgccaggacc atgcactgga ctgtcccaca aacgcaatcg ccatggaccc gccaaacagg tatgtcgtgt tccgtggacg ttcaacaaag acggtgattt ccgaccacgt gacggcgtga tgtgtggcga aacaagcacc ggagacagca tttgagctcg atcgtcactc atcccaccga agctgctcga agtgcattcg taggccttca agatgcagat tgcaggacac gcaacacagt ggacgcacat cgaagggcat aggcccaaaa gctctcccgc acacccctgc gcgctccacc acattcgcag agaggcgtaa attgccttaa cctcgtcgac tcacttactc cgatccgtca gctgtacgag cctggagagc ggtggtcccc gcacctcgag ctcgtacgaa ggaggtgaag ctatctgcag ctactatacc gtatggctcc cagcgtgtct ccagacgacc caggaagcgt cgtcgacagt caactgtcac gtgcttccgc gtggcactgg cagtgaggag taaggtcggc 88379 200411055
<210> 8 <211> 367 <212>蛋白質 <213> HPV <400> 8
Met Glu Ala lie Ala Lys Arg Leu Asp Ala Cys Gin Asp Gin Leu Leu 15 10 15
Glu Leu Tyr Glu Glu Asn Ser lie Asp lie His Lys His lie Met His 20 25 30
Trp Lys Cys lie Arg Leu Glu Ser Val Leu Leu His Lys Ala Lys Gin 35 40 45
Met Gly Leu Ser His lie Gly Leu Gin Val Val Pro Pro Leu Thr Val 50 55 60
Ser Glu Thr Lys Gly His Asn Ala lie Glu Met Gin Met His Leu Glu 65 70 75 80
Ser Leu Ala Lys Thr Gin Tyr Gly Val Glu Pro Trp Thr Leu Gin Asp 85 90 95
Thr Ser Tyr Glu Met Trp Leu Thr Pro Pro Lys Arg Cys Phe Ala Lys 100 105 110
Gin Gly Asn Thr Val Glu Val Lys Phe Asp Gly Cys Glu Asp Asn Val 115 120 125
Met Glu Tyr Val Val Trp Thr His lie Tyr Leu Gin Asp Asn Asp Ser 130 135 140
Trp Val Lys Val Thr Ser Ser Val Asp Ala Lys Gly lie Tyr Tyr Thr 145 150 155 160
Cys Gly Gin Phe Lys Thr Tyr Tyr Val Asn Phe Asn Lys Glu Ala Gin 165 170 175
Lys Tyr Gly Ser Thr Asn His Trp Glu Val Cys Tyr Gly Ser Thr Val 180 185 190 lie Cys Ser Pro Ala Ser Val Ser Ser Thr Val Arg Glu Val Ser lie 195 200 205
Ala Glu Pro Thr Thr Tyr Thr Pro Ala Gin Thr Thr Ala Pro Thr Val 210 215 220
Ser Ala Cys Thr Thr Glu Asp Gly Val Ser Ala Pro Pro Arg Lys Arg 225 230 235 240
Ala Arg Gly Pro Ser Thr Asn Asn Thr Leu Cys Val Ala Asn lie Arg 245 250 255
Ser Val Asp Ser Thr lie Asn Asn lie Val Thr Asp Asn Tyr Asn Lys 260 265 270
His Gin Arg Arg Asn Asn Cys His Ser Ala Ala Thr Pro lie Val Gin 275 - 280 285
Leu Gin Gly Asp Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu Asn 290 295 300
Asp Lys Tyr Lys His Leu Phe Glu Leu Ala Ser Ser Thr Trp His Trp 305 310 315 320
Ala Ser Pro Glu Ala Pro His Lys Asn Ala lie Val Thr Leu Thr Tyr 325 330 335
Ser Ser Glu Glu Gin Arg Gin Gin Phe Leu Asn Ser Val Lys lie Pro 340 345 350
Pro Thr lie Arg His Lys Val Gly Phe Met Ser Leu His Leu Leu 355 360 365
<210> 9 <211> 2206 <212> DNA <213> HPV <400> 9 atggaagcta ttgccaagcg actggacgcc tgccaggagc agctgctgga gctgtacgag 60 gaaaacagca cagacctcca caagcacgtg ctgcactgga agtgcatgcg ccacgagtca 120 gtgctcctgt acaaggccaa gcagatgggg ctgtcccaca tcgggatgca ggtcgtgccc 180 ccgctgaagg tgagcgaagc caagggccac aacgctatcg agatgcagat gcacctggag 240 agcctgctgc ggaccgaata cagcatggag ccctggactc tccaggagac gtcctacgaa 300 at9tggcaga ctcctccgaa gcgctgtttc gcaaagcgcg gcaagacagt tgaggtgaaa ^60 -6- 88379 200411055 ttcgatgggt gacaatgaca tgcgggcagt accaagcact tccaccaccc acgctcgtca cggggggtcc tctgggaacc aacagctccg cgctaccgcc tgggccagca gagcagaggc ggcttcatgt gaccagctgc tggaagtgca cacataggcc atcgagatgc accctgcagg cagggcaaca gtgtggacgc gacgcgaagg aaagaggccc atttgctctc acgtacaccc gtgagcgctc gcgaacattc caccagaggc agcaattgcc ctcgcctcgt actctcactt ccgacgatcc gcgcaaacaa cctgggtgaa tcaagacgta gggaggtgtg aggaagtgag gcagcagcac agcagtctcc acaatctcat caactccaat tcaacgaccg gcaaggcgcc agcagttcct ccctgcacct tcgagctgta ttcgcctgga ttcaggtggt agatgcacct acacctcgta cagtggaggt acatctatct gcatctacta aaaagtatgg ccgccagcgt ctgcccagac cacccaggaa gcagcgtcga gtaacaactg ttaagtgctt cgacgtggca actccagtga gtcataaggt cacgatggac ggtacatagt ctacgtcaac ttacgggagt cattccggag caaggaggac ctgcaatgcc cacgaacaac agtgcagttc ccaccgccac ccacaaacac ggacgtcgtg gctgatggaa cgaggagaac gagcgtgctg cccccctctg cgagtcgctg cgaaatgtgg gaagttcgac gcaggacaac tacctgtggg ctccaccaac gtctagcact gaccgctccg gcgtgcgagg cagtaccatc tcactctgcc ccgctatcgc ctgggcctca ggagcagaga cggcttcatg tacgtggtgt atggtggatg ttcgtcaagg actgtgatct agcaccacat gccgtccaga ctgtgcgttg cacgaccagc cagggggagt ctgttcgact gctatcgtga aagattcctc gccatcgcga agcattgaca ttgcacaagg accgtgtcag gcgaaaacac ctgaccccac ggctgtgagg gacagttggg cagtttaaaa cactgggagg gtgcgcgagg accgtgtctg ggcccaagca aataacatcg gcaaccccca ctcaacgaca cccgaggcac cagcagtttc tcactgcatc ggaccgatgt ccaagggcat aagccgaaaa gcagccccgc acaccccggc cgcccccccg ctcacatcgg accaaaggcg ccaactgcct tgatcagttc cggtgaccta cgacaatcag agaggctcga tccataagca ccaagcagat agacaaaggg agtacggcgt ctaagcgatg ataacgttat tgaaggtgac cctactatgt tctgctatgg tgagcattgc cttgtactac ccaacaacac tgacggataa tcgtgcagct agtacaagca ctcacaagaa tgaacagcgt tcctga ctacgtgcag ctattacacc gtatggttcc ctccgtgtcg ccaaacgagc gaagagggcc ccctgtcgat caacaactct caagtgtttc cacgtggcac cgactccgag ccacaagctt cgcctgccag catcatgcac gggcctgtcc ccataacgca ggagccatgg cttcgccaaa ggagtatgtc cagctccgtg gaacttcaac gagcacggtg cgagccgacc cgaggacggc cctctgtgtg ctataacaag ccagggagac cctctttgag cgccatcgtc gaagatccca 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2206
<210> 10 <211> 735 <212>蛋白質 <213> HPV <400> 10
Met Glu Ala lie Ala Lys Arg Leu 1 5
Glu Leu Tyr Glu Glu Asn Ser Thr 20
Trp Lys Cys Met Arg His Glu Ser 35 40
Met Gly Leu Ser His lie Gly Met 50 55
Ser Glu Ala Lys Gly His Asn Ala 65 70
Ser Leu Leu Arg Thr Glu Tyr Ser 85
Thr Ser Tyr Glu Met Trp Gin Thr 100
Arg Gly Lys Thr Val Glu Val Lys 115 120
Met Asp Tyr Val Val Trp Thr Asp 130 135
Trp Val Lys Val His Ser Met Val 145 150
Cys Gly Gin Phe Lys Thr Tyr Tyr 165
Lys Tyr Gly Ser Thr Lys His Trp 180 ' lie Cys Ser Pro Ala Ser Val Ser 195 200
Pro Glu Ser Thr Thr Tyr Thr Pro 210 215
Asp Ala Cys Gin Glu Gin Leu Leu 10 15
Asp Leu His Lys His Val Leu His 25 30
Val Leu Leu Tyr Lys Ala Lys Gin 45
Gin Val Val Pro Pro Leu Lys Val 60 lie Glu Met Gin Met His Leu Glu 75 80
Met Glu Pro Trp Thr Leu Gin Glu 90 95
Pro Pro Lys Arg Cys Phe Ala Lys 105 110
Phe Asp Gly Cys Ala Asn Asn Thr 125
Val Tyr Val Gin Asp Asn Asp Thr 140
Asp Ala Lys Gly lie Tyr Tyr Thr 155 160
Val Asn Phe Val Lys Glu Ala Glu 170 175
Glu Val Cys Tyr Gly Ser Thr Val 185 190
Ser Thr Thr Gin Glu Val Ser lie 205
Ala Gin Thr Ser Thr Leu Val Ser 220 88379 200411055
Ser Ser Thr Lys Glu Asp Ala Val Gin Thr Pro Pro Arg Lys Arg Ala 225 230 235 240
Arg Gly Val Gin Gin Ser Pro Cys Asn Ala Leu Cys Val Ala His lie 245 250 255
Gly Pro Val Asp Ser Gly Asn His Asn Leu lie Thr Asn Asn His Asp 260 265 270
Gin His Gin Arg Arg Asn Asn Ser Asn Ser Ser Ala Thr Pro lie Val 275 280 285
Gin Phe Gin Gly Glu Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu 290 295 300
Asn Asp Arg His Arg His Leu Phe Asp Leu lie Ser Ser Thr Trp His 305 310 315 320
Trp Ala Ser Ser Lys Ala Pro His Lys His Ala lie Val Thr Val Thr 325 330 335
Tyr Asp Ser Glu Glu Gin Arg Gin Gin Phe Leu Asp Val Val Lys lie 340 345 350
Pro Pro Thr lie Ser His Lys Leu Gly Phe Met Ser Leu His Leu Leu 355 360 365
Met Glu Ala lie Ala Lys Arg Leu Asp Ala Cys Gin Asp Gin Leu Leu 370 375 380
Glu Leu Tyr Glu Glu Asn Ser lie Asp 工le His Lys His lie Met His 385 390 395 400
Trp Lys Cys lie Arg Leu Glu Ser Val Leu Leu His Lys Ala Lys Gin 405 410 415
Met Gly Leu Ser His lie Gly Leu Gin Val Val Pro Pro Leu Thr Val 420 425 430
Ser Glu Thr Lys Gly His Asn Ala lie Glu Met Gin Met His Leu Glu 435 440 445
Ser Leu Ala Lys Thr Gin Tyr Gly Val Glu Pro Trp Thr Leu Gin Asp 450 455 460
Thr Ser Tyr Glu Met Trp Leu Thr Pro Pro Lys Arg Cys Phe Ala Lys 465 470 475 480
Gin Gly Asn Thr Val Glu Val Lys Phe Asp Gly Cys Glu Asp Asn Val 485 490 495
Met Glu Tyr Val Val Trp Thr His lie Tyr Leu Gin Asp Asn Asp Ser 500 505 510
Trp Val Lys Val Thr Ser Ser Val Asp Ala Lys Gly lie Tyr Tyr Thr 515 520 525
Cys Gly Gin Phe Lys Thr Tyr Tyr Val Asn Phe Asn Lys Glu Ala Gin 530 535 540
Lys Tyr Gly Ser Thr Asn His Trp Glu Val Cys Tyr Gly Ser Thr Val 545 - 550 555 560 工le Cys Ser Pro Ala Ser Val Ser Ser Thr Val Arg Glu Val Ser lie 565 570 575
Ala Glu Pro Thr Thr Tyr Thr Pro Ala Gin Thr Thr Ala Pro Thr Val 580 585 590
Ser Ala Cys Thr Thr Glu Asp Gly Val Ser Ala Pro Pro Arg Lys Arg 595 600 605
Ala Arg Gly Pro Ser Thr Asn Asn Thr Leu Cys Val Ala Asn lie Arg 610 615 620
Ser Val Asp Ser Thr 工le Asn Asn lie Val Thr Asp Asn Tyr Asn Lys 625 630 635 640
His Gin Arg Arg Asn Asn Cys His Ser Ala Ala Thr Pro lie Val Gin 645 650 655
Leu Gin Gly Asp Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu Asn 660 665 670
Asp Lys Tyr Lys His Leu Phe Glu Leu Ala Ser Ser Thr Trp His Trp 675 680 685
Ala Ser Pro Glu Ala Pro His Lys 690 695 Ser Ser Glu Glu Gin Arg Gin Gin 705 710 Pro Thr lie Arg His Lys Val Gly 725
Asn Ala lie Val Thr Leu Thr Tyr 700 Phe Leu Asn Ser Val Lys lie Pro 715 720 Phe Met Ser Leu His Leu Leu 730 735 -8 - 88379 200411055
<210> 11 <211> 2206 <212> DNA <213> HPV <400> 11 atggaagcca gagaacagca gtgctgttgc cctctgaccg tcgctggcga atgtggctga ttcgacggct gacaacgaca tgtgggcagt accaaccact agcactgtgc gctccgaccg gcgaggggcc accatcaata tctgccgcaa tatcgcctca gcctcacccg cagagacagc ttcatgtcac cagctgctgg aagtgcatgc atcgggatgc gagatgcaga ctccaggaga ggcaagacag tggaccgatg gccaagggca gaagccgaaa tgcagccccg tacaccccgg acgccccccc gctcacatcg caccaaaggc tccaactgcc ttgatcagtt acggtgacct ccgacaatca <210> 12 <211> 735 <212>蛋白質 <213> HPV tcgcgaagag ttgacatcca acaaggccaa tgtcagagac aaacacagta ccccacctaa gtgaggataa gttgggtgaa ttaaaaccta gggaggtctg gcgaggtgag tgtctgcttg caagcaccaa acatcgtgac cccccatcgt acgacaagta aggcacctca agtttctgaa tgcatctcct agctgtacga gccacgagtc aggtcgtgcc tgcacctgga cgtcctacga ttgaggtgaa tctacgtgca tctattacac agtatggttc cctccgtgtc cccaaacgag ggaagagggc gccctgtcga gcaacaactc tcaagtgttt ccacgtggca acgactccga gccacaagct gctcgacgcc taagcacatc gcagatgggc aaagggccat cggcgtggsg gcgatgcttc cgttatggag ggtgaccagc ctatgtgaac ctatgggagc cattgccgag tactaccgag caacaccctc ggataactat gcagctccag caagcacctc caagaacgcc cagcgtgaag gatggaagct ggaaaacagc agtgctcctg cccgctgaag gagcctgctg aatgtggcag attcgatggg ggacaatgac ctgcgggcag caccaagcac gtccaccacc cacgctcgtc ccggggggtc ttctgggaac taacagctcc ccgctaccgc ctgggccagc ggagcagagg tggcttcatg tgccaggacc atgcactgga ctgtcccaca aacgcaatcg ccatggaccc gccaaacagg tatgtcgtgt tccgtggacg ttcaacaaag acggtgattt ccgaccacgt gacggcgtga tgtgtggcga aacaagcacc ggagacagca tttgagctcg atcgtcactc atcccaccga attgccaagc acagacctcc tacaaggcca gtgagcgaag cggaccgaat actcctccga tgcgcaaaca acctgggtga ttcaagacgt tgggaggtgt caggaagtga agcagcagca cagcagtctc cacaatctca gcaactccaa ctcaacgacc agcaaggcgc cagcagttcc tccctgcacc agctgctcga agtgcattcg taggccttca agatgcagat tgcaggacac gcaacacagt ggacgcacat cgaagggcat aggcccaaaa gctctcccgc acacccctgc gcgctccacc acattcgcag agaggcgtaa attgccttaa cctcgtcgac tcacttactc cgatccgtca gactggacgc acaagcacgt agcagatggg ccaagggcca acagcatgga agcgctgttt acacgatgga aggtacatag actacgtcaa gttacgggag gcattccgga ccaaggagga cctgcaatgc tcacgaacaa tagtgcagtt gccaccgcca cccacaaaca tggacgtcgt tgctga gctgtacgag cctggagagc ggtggtcccc gcacctcgag ctcgtacgaa ggaggtgaag ctatctgcag ctactatacc gtatggctcc cagcgtgtct ccagacgacc caggaagcgt cgtcgacagt caactgtcac gtgcttccgc gtggcactgg cagtgaggag taaggtcggc ctgccaggag gctgcactgg gctgtcccac caacgctatc gccctggact cgcaaagcgc ctacgtggtg tatggtggat cttcgtcaag tactgtgatc gagcaccaca cgccgtccag cctgtgcgtt ccacgaccag ccagggggag cctgttcgac cgctatcgtg gaagattcct 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2206 <400> 12 Met Glu Ala 1 Glu Leu Tyr Trp Lys Cys 35 Met Gly Leu 50 Ser Glu Thr 65 Ser Leu Ala Thr Ser Tyr Gin Gly Asn 115 工le Ala Lys 5 Glu Glu Asn 20 lie Arg Leu Ser His lie Lys Gly His 70 Lys Thr Gin 85 Glu Met Trp 100 Thr Val Glu
Arg Leu Ser lie Glu Ser 40 Gly Leu 55 Asn Ala Tyr Gly Leu Thr Val Lys 120
Asp Ala 10 Asp lie 25 Val Leu Gin Val He Glu Val Glu 90 Pro Pro 105 Phe Asp
Cys Gin His Lys Leu His Val Pro 60 Met Gin 75 Pro Trp Lys Arg Gly Cys
Asp Gin Leu 15 His lie Met 30 Lys Ala Lys 45 Pro Leu Thr Met His Leu Thr Leu Gin 95 Cys Phe Ala 110 Glu Asp Asn 125
Leu His Gin Val Glu 80 Asp Lys Val 88379 -9- 200411055
Met Glu 130 Trp Val 145 Cys Gly Lys Tyr lie Cys Ala Glu 210 Ser Ala 225 Ala Arg Ser Val His Gin
Tyr Val Val Trp Lys Val Gin Phe
Gly Ser 180 Ser Pro 195 Pro Thr Cys Thr Gly Pro Asp Ser 260 Arg Arg 275
Thr Ser 150 Lys Thr 165 Thr As n
Ala Ser Thr Tyr Thr Glu 230 Ser Thr 245 Thr lie Asn Asn
Thr His lie 135 Ser Val Asp Tyr Tyr Val His Trp Glu 185 Val Ser Ser 200 Thr Pro Ala 215 Asp Gly Val Asn Asn Thr Asn Asn lie 265 Cys His Ser 280
Tyr Leu Ala Lys 155 Asn Phe 170 Val Cys Thr Val Gin Thr Ser Ala 235 Leu Cys 250 Val Thr Ala Ala
Gin Asp 140 Gly He Asn Lys Tyr Gly Arg Glu 205 Thr Ala 220 Pro Pro Val Ala Asp Asn Thr Pro 285
Asn Asp Ser Tyr Tyr Thr 160 Glu Ala Gin 175 Ser Thr Val 190 Val Ser lie Pro Thr Val Arg Lys Arg 240 Asn lie Arg 255 Tyr Asn Lys 270 lie Val Gin
Leu Gin Gly Asp Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu Asn 290 295 300
Asp Lys Tyr Lys His Leu Phe Glu Leu Ala Ser Ser Thr Trp His Trp 305 310 315 320
Ala Ser Pro Glu Ala Pro His Lys Asn Ala 工le Val Thr Leu Thr Tyr 325 330 335
Ser Ser Glu Glu Gin Arg Gin Gin Phe Leu Asn Ser Val Lys 工le Pro 340 345 350
Pro Thr lie Arg His Lys Val Gly Phe Met Ser Leu His Leu Leu Met 355 360 365
Glu Ala lie Ala Lys Arg Leu Asp Ala Cys Gin Glu Gin Leu Leu Glu 370 375 380
Leu Tyr Glu Glu Asn Ser Thr Asp Leu His Lys His Val Leu His Trp 385 390 395 400
Lys Cys Met Arg His Glu Ser Val Leu Leu Tyr Lys Ala Lys Gin Met 405 410 415
Gly Leu Ser His lie Gly Met Gin Val Val Pro Pro Leu Lys Val Ser 420 425 430
Glu Ala Lys Gly His Asn Ala lie Glu Met Gin Met His Leu Glu Ser 435 440 445
Leu Leu Arg Thr Glu Tyr Ser Met Glu Pro Trp Thr Leu Gin Glu Thr 450 - 455 460
Ser Tyr Glu Met Trp Gin Thr Pro Pro Lys Arg Cys Phe Ala Lys Arg 465 470 475 480
Gly Lys Thr Val Glu Val Lys Phe Asp Gly Cys Ala Asn Asn Thr Met 485 490 495
Asp Tyr Val Val Trp Thr Asp Val Tyr Val Gin Asp Asn Asp Thr Trp 500 505 510
Val Lys Val His Ser Met Val Asp Ala Lys Gly lie Tyr Tyr Thr Cys 515 520 525
Gly Gin Phe Lys Thr Tyr Tyr Val Asn Phe Val Lys Glu Ala Glu Lys 530 535 540
Tyr Gly Ser Thr Lys His Trp Glu Val Cys Tyr Gly Ser Thr Val lie 545 550 555 560
Cys Ser Pro Ala Ser Val Ser Ser Thr Thr Gin Glu Val Ser lie Pro 565 570 575
Glu Ser Thr Thr Tyr Thr Pro Ala Gin Thr Ser Thr Leu Val Ser Ser 580 585 590
Ser Thr Lys Glu Asp Ala Val Gin Thr Pro Pro Arg Lys Arg Ala Arg 595 600 605
Gly Val Gin Gin Ser Pro Cys Asn Ala Leu Cys Val Ala His lie Gly 610 615 620
Pro Val Asp Ser Gly Asn His Asn Leu 工le Thr Asn Asn His Asp Gin 625 630 635 640
His Gin Arg Arg Asn Asn Ser Asn Ser Ser Ala Thr Pro lie Val Gin 645 650 655 -10- 88379 200411055
Phe Gin Gly Glu Ser Asn Cys Leu Lys 660 665
Asp Arg His 675 Ala Ser Ser 690 Asp Ser Glu 705 Pro Thr lie
Arg His Leu Phe Asp Leu 680 Lys Ala Pro His Lys His 695 Glu Gin Arg Gin Gin Phe 710 Ser His Lys Leu Gly Phe 725
Cys lie Ala Leu Met 730
Phe Ser lie Asp 715 Ser
Arg Ser Val 700 Val Leu
Tyr Thr 685 Thr Val His
Arg 670 Trp Val Lys Leu
Leu His Thr He Leu 735
Asn Trp Tyr Pro 720
<210> 13 <211> 1950 <212> DNA <213> HPV <400> 13 atggcagacg attccggtac tgagaacgaa ggttctggtt gtaccggttg gttcatggtt gaagcaatcg ttcagcatcc gactggtacc cagatctccg atgacgaaga cgaagaagtt gaagattctg gttacgacat ggttgacttc atcgatgact ccaacatcac tcataactct ctggaagcac aggctctgtt taaccgccag gaagctgata cccattacgc tactgttcag gacctgggag gcaaatatct gggctctccg tacgtttccc cgatcaacac tatcgcagaa gcagttgagt ctgaaatctc cccgcgcctg gacgctatca aactgactcg tcagccgaag aaggttaaac gtcgtctgtt ccagactcgt gaactgaccg actccggtta cggttatagc gaagttgagg ctggcaccgg cacccaggtt gaaaaacacg gtgtaccgga aaacggcggc gacggtcagg aaaaggacac cggccgcgac atcgagggtg aggaacacac cgaagctgaa gctccgacta actctgttcg tgaacacgca ggtactgcgg gtatcctgga actgctgaaa tgcaaagacc tgcgcgcggc tctgctgggc aaattcaaag aatgcttcgg cctgtctttc attgacctga tccgtccgtt taagtctgac aaaactacct gtctggactg ggttgtagca ggcttcggca tccaccactc tatctctgaa gcattccaga aactgatcga gccgctgtct ctgtacgcgc acatccagtg gctgactaac gcttggggta tggttctgct ggtactgctg cgctttaaag taaacaaatc tcgttccact gttgctcgta ctctggctac cctgctgaac atcccggaga accagatgct gatcgaaccg ccgaaaatcc agtctggtgt agctgcactg tactggtttc gtactggcat ctctaacgct agcactgtta tcggtgaagc accggaatgg atcactcgtc agaccgttat cgaacacggt ctggcagatt ctcagttcaa actgactgaa atggttcagt gggcatacga caacgacatc tgcgaggaat ctgaaattgc gttcgaatac gctcagcgtg gcgacttcga ctccaacgct cgtgctttcc tgaacagcaa catgcaggct aaatacgtaa aagactgcgc taccatgtgc cgtcactaca aacacgcgga aatgcgtaaa atgtctatca aacagtggat caagcaccgc ggttctaaaa tcgaaggtac cggtaactgg aaaccgatcg ttcagttcct gcgccatcag aacatcgaat tcatcccgtt cctgaccaaa ttcaagctgt ggctgcacgg taccccgaaa aaaaactgca tcgctatcgt aggtccaccg gacactgaca agtcttactt ctgtatgtcc ctgatctctt tcctgggcgg cactgtaatc tctcacgtta actcttcctc ccatttctgg ctgcagccac tggtagacgc gaaagtagct ctgctggacg acgcgaccca gccgtgctgg atctacatgg atacttacat gcgcaacctg ctggacggta acccgatgtc tatcgaccgt aaacacaaag cgctgactct gatcaagtgc ccgccgctgc tggtaacttc taacatcgac atcaccaagg aagataaata caagtacctg catacccgtg ttactacctt tactttcccg aacccgttcc cgtttgatcg taacggtaac gctgtttacg aactgtccaa cactaactgg aaatgcttct tcgagcgtct gtcttcctcc ctggacatcc aggactctga agatgaagaa gatggttcta actctcaggc tttccgttgt gttccgggta ctgttgttcg tactctgtga 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1950 <210> 14 <211> 649 <212> 蛋白質 <213> HPV <400> 14 Met Ala Asp Asp 1 Trp Phe Met Val 20 Ser Asp Asp Glu 35 Asp Phe lie Asp 50
Ser Gly Thr Glu Asn Glu Gly Ser Gly Cys Thr Gly 5 10 15 Glu Ala lie Val Gin His Pro Thr Gly Thr Gin lie 25 30
Asp Glu Glu Val 40 Asp Ser Asn lie 55
Glu Asp Ser Gly Tyr Asp Met Val 45 Thr His Asn Ser Leu Glu Ala Gin 60 -11- 88379 200411055
Ala Leu Phe Asn Arg Gin Glu Ala Asp Thr His Tyr Ala Thr Val Gin 65 70 75 80
Asp Leu Gly Gly Lys Tyr Leu Gly Ser Pro Tyr Val Ser Pro lie Asn 85 90 95
Thr lie Ala Glu Ala Val Glu Ser Glu lie Ser Pro Arg Leu Asp Ala 100 105 110 工le Lys Leu Thr Arg Gin Pro Lys Lys Val Lys Arg Arg Leu Phe Gin 115 120 125
Thr Arg Glu Leu Thr Asp Ser Gly Tyr Gly Tyr Ser Glu Val Glu Ala 130 135 140
Gly Thr Gly Thr Gin Val Glu Lys His Gly Val Pro Glu Asn Gly Gly 145 150 155 160
Asp Gly Gin Glu Lys Asp Thr Gly Arg Asp lie Glu Gly Glu Glu His 165 170 175
Thr Glu Ala Glu Ala Pro Thr Asn Ser Val Arg Glu His Ala Gly Thr 180 185 190
Ala Gly lie Leu Glu Leu Leu Lys Cys Lys Asp Leu Arg Ala Ala Leu 195 200 205
Leu Gly Lys Phe Lys Glu Cys Phe Gly Leu Ser Phe lie Asp Leu lie 210 215 220
Arg Pro Phe Lys Ser Asp Lys Thr Thr Cys Leu Asp Trp Val Val Ala 225 230 235 240
Gly Phe Gly lie His His Ser lie Ser Glu Ala Phe Gin Lys Leu lie 245 250 255
Glu Pro Leu Ser Leu Tyr Ala His lie Gin Trp Leu Thr Asn Ala Trp 260 265 270
Gly Met Val Leu Leu Val Leu Leu Arg Phe Lys Val Asn Lys Ser Arg 275 280 285
Ser Thr Val Ala Arg Thr Leu Ala Thr Leu Leu Asn lie Pro Glu Asn 290 295 300
Gin Met Leu 工le Glu Pro Pro Lys lie Gin Ser Gly Val Ala Ala Leu 305 310 315 320
Tyr Trp Phe Arg Thr Gly lie Ser Asn Ala Ser Thr Val lie Gly Glu 325 330 335
Ala Pro Glu Trp lie Thr Arg Gin Thr Val lie Glu His Gly Leu Ala 340 345 350
Asp Ser Gin Phe Lys Leu Thr Glu Met Val Gin Trp Ala Tyr Asp Asn 355 360 365
Asp lie Cys Glu Glu Ser Glu lie Ala Phe Glu Tyr Ala Gin Arg Gly 370 375 380
Asp Phe Asp Ser Asn Ala Arg Ala Phe Leu Asn Ser Asn Met Gin Ala 385 .. 390 395 400
Lys Tyr Val Lys Asp Cys Ala Thr Met Cys Arg His Tyr Lys His Ala 405 410 415
Glu Met Arg Lys Met Ser lie Lys Gin Trp lie Lys His Arg Gly Ser 420 425 430
Lys lie Glu Gly Thr Gly Asn Trp Lys Pro 工le Val Gin Phe Leu Arg 435 440 445
His Gin Asn lie Glu Phe lie Pro Phe Leu Thr Lys Phe Lys Leu Trp 450 455 460
Leu His Gly Thr Pro Lys Lys Asn Cys lie Ala lie Val Gly Pro Pro 465 470 475 480
Asp Thr Asp Lys Ser Tyr Phe Cys Met Ser Leu lie Ser Phe Leu Gly 485 490 495
Gly Thr Val 工le Ser His Val Asn Ser Ser Ser His Phe Trp Leu Gin 500 505 510
Pro Leu Val Asp Ala Lys Val Ala Leu Leu Asp Asp Ala Thr Gin Pro 515 520 525
Cys Trp lie Tyr Met Asp Thr Tyr Met Arg Asn Leu Leu Asp Gly Asn 530 535 540
Pro Met Ser 工le Asp Arg Lys His Lys Ala Leu Thr Leu lie Lys Cys 545 550 555 560
Pro Pro Leu Leu Val Thr Ser Asn lie Asp 工le Thr Lys Glu Asp Lys 565 570 575
Tyr Lys Tyr Leu His Thr Arg Val Thr Thr Phe Thr Phe Pro Asn Pro 580 585 590 •12-
88379 200411055
Tyr Glu Leu Ser Asn Thr 605 Ser Ser Leu Asp 工le Gin 620 Ser Gin Ala Phe Arg Cys 635 640
Phe Pro Phe Asp Arg Asn Gly Asn Ala Val 595 600
Asn Trp Lys Cys Phe Phe Glu Arg Leu Ser 610 615
Asp Ser Glu Asp Glu Glu Asp Gly Ser Asn 625 630
Val Pro Gly Thr Val Val Arg Thr Leu 645
<210> 15 <211> 1107 <212> DNA <213> HPV <400> 15 atggaagcta ttgccaagcg actggacgcc tgccaggagc agctgctgga gctgtacgag 60 gaaaacagca cagacctcca caagcacgtg ctgcactgga agtgcatgcg ccacgagtca 120 gtgctcctgt acaaggccaa gcagatgggg ctgtcccaca tcgggatgca ggtcgtgccc 180 ccgctgaagg tgagcgaagc caagggccac aacgctatcg agatgcagat gcacctggag 240 agcctgctgc ggaccgaata cagcatggag ccctggactc tccaggagac gtcctacgaa 300 atgtggcaga ctcctccgaa gcgctgtttc gcaaagcgcg gcaagacagt tgaggtgaaa 360 ttcgatgggt gcgcaaacaa cacgatggac tacgtggtgt ggaccgatgt ctacgtgcag 420 gacaatgaca cctgggtgaa ggtacatagt atggtggatg ccaagggcat ctattacacc 480 tgcgggcagt tcaagacgta ctacgtcaac ttcgtcaagg aagccgaaaa gtatggttcc 540 accaagcact gggaggtgtg ttacgggagt actgtgatct gcagccccgc ctccgtgtcg 600 tccaccaccc aggaagtgag cattccggag agcaccacat acaccccggc ccaaacgagc 660 acgctcgtca gcagcagcac caaggaggac gccgtccaga cgcccccccg gaagagggcc 720 cggggggtcc agcagtctcc ctgcaatgcc ctgtgcgttg ctcacatcgg ccctgtcgat 780 tctgggaacc acaatctcat cacgaacaac cacgaccagc accaaaggcg caacaactct 840 aacagctccg caactccaat agtgcagttc cagggggagt ccaactgcct caagtgtttc 900 cgctaccgcc tcaacgaccg ccaccgccac ctgttcgact tgatcagttc cacgtggcac 960 tgggccagca gcaaggcgcc ccacaaacac gctatcgtga cggtgaccta cgactccgag 1020 gagcagaggc agcagttcct ggacgtcgtg aagattcctc cgacaatcag ccacaagctt 1080 ggcttcatgt ccctgcacct gctgtga 1107
<210> 16 <211> 368 <212>蛋白赏 <213> HPV <400> 16
Met Glu Ala 工le Ala Lys Arg Leu Asp Ala Cys Gin Glu Gin Leu Leu 15 10 15
Glu Leu Tyr Glu Glu Asn Ser Thr Asp Leu His Lys His Val Leu His 20 25 30
Trp Lys Cys Met Arg His Glu Ser Val Leu Leu Tyr Lys Ala Lys Gin 35 40 45
Met Gly Leu Ser His 工le Gly Met Gin Val Val Pro Pro Leu Lys Val 50 55 60
Ser Glu Ala Lys Gly His Asn Ala lie Glu Met Gin Met His Leu Glu 65 70 75 80
Ser Leu Leu Arg Thr Glu Tyr Ser Met Glu Pro Trp Thr Leu Gin Glu 85 90 95
Thr Ser Tyr Glu Met Trp Gin Thr Pro Pro Lys Arg Cys Phe Ala Lys 100 105 110
Arg Gly Lys Thr Val Glu Val Lys Phe Asp Gly Cys Ala Asn Asn Thr 115 120 125
Met Asp Tyr Val Val Trp Thr Asp Val Tyr Val Gin Asp Asn Asp Thr 130 135 140
Trp Val Lys Val His Ser Met Val Asp Ala Lys Gly lie Tyr Tyr Thr 145 150 155 160
Cys Gly Gin Phe Lys Thr Tyr Tyr Val Asn Phe Val Lys Glu Ala Glu 165 170 175
Lys Tyr Gly Ser Thr Lys His Trp Glu Val Cys Tyr Gly Ser Thr Val 180 185 190 e -13 - 88379 200411055 lie Cys Ser Pro Ala Ser Val Ser Ser Thr Thr Gin Glu Val Ser lie 195 200 205
Pro Glu Ser Thr Thr Tyr Thr Pro Ala Gin Thr Ser Thr Leu Val Ser 210 215 220
Ser Ser Thr Lys Glu Asp Ala Val Gin Thr Pro Pro Arg Lys Arg Ala 225 230 235 240
Arg Gly Val Gin Gin Ser Pro Cys Asn Ala Leu Cys Val Ala His lie 245 250 255
Gly Pro Val Asp Ser Gly Asn His Asn Leu lie Thr Asn Asn His Asp 260 265 270
Gin His Gin Arg Arg Asn Asn Ser Asn Ser Ser Ala Thr Pro lie Val 275 280 285
Gin Phe Gin Gly Glu Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu 290 295 300
Asn Asp Arg His Arg His Leu Phe Asp Leu lie Ser Ser Thr Trp His 305 310 315 320
Trp Ala Ser Ser Lys Ala Pro His Lys His Ala 工le Val Thr Val Thr 325 330 335
Tyr Asp Ser Glu Glu Gin Arg Gin Gin Phe Leu Asp Val Val Lys lie 340 345 350
Pro Pro Thr lie Ser His Lys Leu Gly Phe Met Ser Leu His Leu Leu 355 360 365
<210> 17 <211> 4154 <212> DNA <213> HPV <400> 17 atggcagacg gaagcaatcg gaagattctg ctggaagcac gacctgggag gcagttgagt aaggttaaac gaagttgagg gacggtcagg gctccgacta tgcaaagacc attgacctga ggcttcggca ctgtacgcgc cgctttaaag atcccggaga tactggtttc atcactcgtc atggttcagt gctcagcgtg aaatacgtaa atgtctatca aaaccgatcg ttcaagctgt gacactgaca tctcacgtta ctgctggacg ctggacggta ccgccgctgc catacccgtg gctgtttacg ctggacatcc gttccgggta caggagcagc cactggaagt tcccacatcg attccggtac ttcagcatcc gttacgacat aggctctgtt gcaaatatct ctgaaatctc gtcgtctgtt ctggcaccgg aaaaggacac actctgttcg tgcgcgcggc tccgtccgtt tccaccactc acatccagtg taaacaaatc accagatgct gtactggcat agaccgttat gggcatacga gcgacttcga aagactgcgc aacagtggat ttcagttcct ggctgcacgg agtcttactt actcttcctc acgcgaccca acccgatgtc tggtaacttc ttactacctt aactgtccaa aggactctga ctgttgttcg tgctggagct gcatgcgcca ggatgcaggt tgagaacgaa gactggtacc ggttgacttc taaccgccag gggctctccg cccgcgcctg ccagactcgt cacccaggtt cggccgcgac tgaacacgca tctgctgggc taagtctgac tatctctgaa gctgactaac tcgttccact gatcgaaccg ctctaacgct cgaacacggt caacgacatc ctccaacgct taccatgtgc caagcaccgc gcgccatcag taccccgaaa ctgtatgtcc ccatttctgg gccgtgctgg tatcgaccgt taacatcgac tactttcccg cactaactgg agatgaagaa tactctgatg gtacgaggaa cgagtcagtg cgtgcccccg ggttctggtt cagatctccg atcgatgact gaagctgata tacgtttccc gacgctatca gaactgaccg gaaaaacacg atcgagggtg ggtactgcgg aaattcaaag aaaactacct gcattccaga gcttggggta gttgctcgta ccgaaaatcc agcactgtta ctggcagatt tgcgaggaat cgtgctttcc cgtcactaca ggttctaaaa aacatcgaat aaaaactgca ctgatctctt ctgcagccac atctacatgg aaacacaaag atcaccaagg aacccgttcc aaatgcttct gatggttcta gaagctattg aacagcacag ctcctgtaca ctgaaggtga gtaccggttg atgacgaaga ccaacatcac cccattacgc cgatcaacac aactgactcg actccggtta gtgtaccgga aggaacacac gtatcctgga aatgcttcgg gtctggactg aactgatcga tggttctgct ctctggctac agtctggtgt tcggtgaagc ctcagttcaa ctgaaattgc tgaacagcaa aacacgcgga tcgaaggtac tcatcccgtt tcgctatcgt tcctgggcgg tggtagacgc atacttacat cgctgactct aagataaata cgtttgatcg tcgagcgtct actctcaggc ccaagcgact acctccacaa aggccaagca gcgaagccaa gttcatggtt 60 cgaagaagtt 120 tcataactct 180 tactgttcag 240 tatcgcagaa 300 tcagccgaag 360 cggttatagc 420 aaacggcggc 480 cgaagctgaa 540 actgctgaaa 600 cctgtctttc 660 ggttgtagca 720 gccgctgtct 780 ggtactgctg 840 cctgctgaac 900. agctgcactg 960 accggaatgg 1020 actgactgaa 1080 gttcgaatac 1140 catgcaggct 1200 aatgcgtaaa 1260 cggtaactgg 1320 cctgaccaaa 1380 aggtccaccg 1440 cactgtaatc 1500 gaaagtagct 1560 gcgcaacctg 1620 gatcaagtgc 1680 caagtacctg 1740 taacggtaac 1800 gtcttcctcc 1860 tttccgttgt 1920 ggacgcctgc 1980 gcacgtgctg 2040 gatggggctg 2100 gggccacaac ^160 -14· 88379 200411055 gctatcgaga tggactctcc aagcgcggca gtggtgtgga gtggatgcca gtcaaggaag gtgatctgca ccacatacac tccagacgcc gcgttgctca accagcacca gggagtccaa tcgacttgat tcgtgacggt ttcctccgac tcgcgaagag ttgacatcca acaaggccaa tgtcagagac aaacacagta ccccacctaa gtgaggataa gttgggtgaa ttaaaaccta gggaggtctg gcgaggtgag tgtctgcttg caagcaccaa acatcgtgac cccccatcgt acgacaagta aggcacctca agtttctgaa tgcatctcct tgcagatgca a99agacgtc agacagttga ccgatgtcta agggcatcta ccgaaaagta gccccgcctc cccggcccaa cccccggaag catcggccct aaggcgcaac ctgcctcaag cagttccacg gacctacgac aatcagccac gctcgacgcc taagcacatc gcagatgggc aaagggccat cggcgtggag gcgatgcttc cgttatggag ggtgaccagc ctatgtgaac ctatgggagc cattgccgag tactaccgag caacaccctc ggataactat gcagctccag caagcacctc caagaacgcc cagcgtgaag gtga cctggagagc ctacgaaatg ggtgaaattc cgtgcaggac ttacacctgc tggttccacc cgtgtcgtcc acgagcacgc agggcccggg gtcgattctg aactctaaca tgtttccgct tggcactggg tccgaggagc aagcttggct tgccaggacc atgcactgga ctgtcccaca aacgcaatcg ccatggaccc gccaaacagg tatgtcgtgt tccgtggacg ttcaacaaag acggtgattt ccgaccacgt gacggcgtga tgtgtggcga aacaagcacc ggagacagca tttgagctcg atcgtcactc atcccaccga ctgctgcgga tggcagactc gatgggtgcg aatgacacct gggcagttca aagcactggg accacccagg tcgtcagcag gggtccagca ggaaccacaa gctccgcaac accgcctcaa ccagcagcaa agaggcagca tcatgtccct agctgctcga agtgcattcg taggccttca agatgcagat tgcaggacac gcaacacagt ggacgcacat cgaagggcat aggcccaaaa gctctcccgc acacccctgc gcgctccacc acattcgcag agaggcgtaa attgccttaa cctcgtcgac tcacttactc cgatccgtca ccgaatacag ctccgaagcg caaacaacac 999tgaaggt agacgtacta aggtgtgtta aagtgagcat cagcaccaag gtctccctgc tctcatcacg tccaatagtg cgaccgccac ggcgccccac gttcctggac gcacctgctg gctgtacgag cctggagagc ggtggtcccc gcacctcgag ctcgtacgaa ggaggtgaag ctatctgcag ctactatacc gtatggctcc cagcgtgtct ccagacgacc caggaagcgt cgtcgacagt caactgtcac gtgcttccgc gtggcactgg cagtgaggag taaggtcggc catggagccc ctgtttcgca gatggactac acatagtatg cgtcaacttc cgggagtact tccggagaga gaggacgccg aatgccctgt aacaaccacg cagttccagg cgccacctgt aaacacgcta gtcgtgaaga atggaagcca gagaacagca gtgctgttgc cctctgaccg tcgctggcga atgtggctga ttcgacggct gacaacgaca tgtgggcagt accaaccact agcactgtgc gctccgaccg gcgaggggcc accatcaata tctgccgcaa tatcgcctca gcctcacccg cagagacagc ttcatgtcac 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4154
<210> 18 ; <211〉 1384 <212>蛋白質 <213> HPV <400> 18
Met Ala Asp Asp Ser Gly Thr Glu Asn Glu Gly Ser Gly Cys Thr Gly 15 10 15
Trp Phe Met Val Glu Ala He Val Gin His Pro Thr Gly Thr Gin He 20 25 30
Ser Asp Asp Glu Asp Glu Glu Val Glu Asp Ser Gly Tyr Asp Met Val 35 40 45
Asp Phe lie Asp Asp Ser Asn lie Thr His Asn Ser Leu Glu Ala Gin 50 55 60
Ala Leu Phe Asn Arg Gin Glu Ala Asp Thr His Tyr Ala Thr Val Gin 65 70 75 80
Asp Leu Gly Gly Lys Tyr Leu Gly Ser Pro Tyr Val Ser Pro lie Asn 85 90 95
Thr lie Ala Glu Ala Val Glu Ser Glu lie Ser Pro Arg Leu Asp Ala 100 105 110 lie Lys Leu Tlir Arg Gin Pro Lys Lys Val Lys Arg Arg Leu Phe Gin 115 120 125
Thr Arg Glu Leu Thr Asp Ser Gly Tyr Gly Tyr Ser Glu Val Glu Ala 130 135 140
Gly Thr Gly Thr Gin Val Glu Lys His Gly Val Pro Glu Asn Gly Gly 145 150 155 160 Asp Gly Gin Glu Lys Asp Thr Gly Arg Asp lie Glu Gly Glu Glu His 175 Arg Glu His Ala Gly Thr 190 165 170
Thr Glu Ala Glu Ala Pro Thr Asn Ser Val 180 185
Ala Gly lie Leu Glu Leu Leu Lys Cys Lys Asp Leu Arg Ala Ala Leu -15 - 88379 200411055 195 200 205
Leu Gly Lys Phe Lys Glu Cys Phe Gly Leu Ser Phe 工le Asp Leu lie 210 215 220
Arg Pro Phe Lys Ser Asp Lys Thr Thr Cys Leu Asp Trp Val Val Ala 225 230 235 240
Gly Phe Gly lie His His Ser lie Ser Glu Ala Phe Gin Lys Leu lie 245 250 255
Glu Pro Leu Ser Leu Tyr Ala His lie Gin Trp Leu Thr Asn Ala Trp 260 265 270
Gly Met Val Leu Leu Val Leu Leu Arg Phe Lys Val Asn Lys Ser Arg 275 280 285
Ser Thr Val Ala Arg Thr Leu Ala Thr Leu Leu Asn lie Pro Glu Asn 290 295 300
Gin Met Leu lie Glu Pro Pro Lys lie Gin Ser Gly Val Ala Ala Leu 305 310 315 320
Tyr Trp Phe Arg Thr Gly lie Ser Asn Ala Ser Thr Val lie Gly Glu 325 330 335
Ala Pro Glu Trp lie Thr Arg Gin Thr Val lie Glu His Gly Leu Ala 340 345 350
Asp Ser Gin Phe Lys Leu Thr Glu Met Val Gin Trp Ala Tyr Asp Asn 355 360 365
Asp 工le Cys Glu Glu Ser Glu 工le Ala Phe Glu Tyr Ala Gin Arg Gly 370 375 380
Asp Phe Asp Ser Asn Ala Arg Ala Phe Leu Asn Ser Asn Met Gin Ala 385 390 395 400
Lys Tyr Val Lys Asp Cys Ala Thr Met Cys Arg His Tyr Lys His Ala 405 410 415
Glu Met Arg Lys Met Ser lie Lys Gin Trp 工le Lys His Arg Gly Ser 420 425 430
Lys lie Glu Gly Thr Gly Asn Trp Lys Pro lie Val Gin Phe Leu Arg 435 440 445
His Gin Asn lie Glu Phe lie Pro Phe Leu Thr Lys Phe Lys Leu Trp 450 455 460
Leu His Gly Thr Pro Lys Lys Asn Cys 工le Ala 工le Val Gly Pro Pro 465 470 475 480
Asp Thr Asp Lys Ser Tyr Phe Cys Met Ser Leu lie Ser Phe Leu Gly 485 490 495
Gly Thr Val lie Ser His Val Asn Ser Ser Ser His Phe Trp Leu Gin 500 505 510
Pro Leu Val Asp Ala Lys Val Ala Leu Leu Asp Asp Ala Thr Gin Pro 515 520 525
Cys Trp lie Tyr Met Asp Thr Tyr Met Arg Asn Leu Leu Asp Gly Asn 530 535 540
Pro Met Ser lie Asp Arg Lys His Lys Ala Leu Thr Leu lie Lys Cys 545 550 555 560
Pro Pro Leu Leu Val Thr Ser Asn lie Asp lie Thr Lys Glu Asp Lys 565 570 575
Tyr Lys Tyr Leu His Thr Arg Val Thr Thr Phe Thr Phe Pro Asn Pro 580 585 590
Phe Pro Phe Asp Arg Asn Gly Asn Ala Val Tyr Glu Leu Ser Asn Thr 595 600 605
Asn Trp Lys Cys Phe Phe Glu Arg Leu Ser Ser Ser Leu Asp 工le Gin 610 615 620
Asp Ser Glu Asp Glu Glu Asp Gly Ser Asn Ser Gin Ala Phe Arg Cys 625 630 635 640
Val Pro Gly Thr Val Val Arg Thr Leu Met Glu Ala 工le Ala Lys Arg 645 650 655
Leu Asp Ala Cys Gin Glu Gin Leu Leu Glu Leu Tyr Glu Glu Asn Ser 660 665 670
Thr Asp Leu His Lys His Val Leu His Trp Lys Cys Met Arg His Glu 675 680 685
Ser Val Leu Leu iyr Lys Ala Lys Gin Met Gly Leu Ser His lie Gly 690 695 700
Met Gin Val Val Pro Pro Leu Lys Val Ser Glu Ala Lys Gly His Asn 705 710 715 720
Ala lie Glu Met Gin Met His Leu Glu Ser Leu Leu Arg Thr Glu Tyr -16 - 88379 200411055 725 730 735
Ser Met Glu Pro Trp Thr Leu Gin Glu Thr Ser Tyr Glu Met Trp Gin 740 745 750
Thr Pro Pro Lys Arg Cys Phe Ala Lys Arg Gly Lys Thr Val Glu Val 755 760 765
Lys Phe Asp Gly Cys Ala Asn Asn Thr Met Asp Tyr Val Val Trp Thr 770 775 780
Asp Val Tyr Val Gin Asp Asn Asp Thr Trp Val Lys Val His Ser Met 785 790 795 800
Val Asp Ala Lys Gly lie Tyr Tyr Thr Cys Gly Gin Phe Lys Thr Tyr 805 810 815
Tyr Val Asn Phe Val Lys Glu Ala Glu Lys Tyr Gly Ser Thr Lys His 820 825 830
Trp Glu Val Cys Tyr Gly Ser Thr Val lie Cys Ser Pro Ala Ser Val 835 840 845
Ser Ser Thr Thr Gin Glu Val Ser lie Pro Glu Ser Thr Thr Tyr Thr 850 855 860
Pro Ala Gin Thr Ser Thr Leu Val Ser Ser Ser Thr Lys Glu Asp Ala 865 870 875 880
Val Gin Thr Pro Pro Arg Lys Arg Ala Arg Gly Val Gin Gin Ser Pro 885 890 895
Cys Asn Ala Leu Cys Val Ala His lie Gly Pro Val Asp Ser Gly Asn 900 905 910
His Asn Leu lie Thr Asn Asn His Asp Gin His Gin Arg Arg Asn Asn 915 920 925
Ser Asn Ser Ser Ala Thr Pro lie Val Gin Phe Gin Gly Glu Ser Asn 930 935 940
Cys Leu Lys Cys Phe Arg Tyr Arg Leu Asn Asp Arg His Arg His Leu 945 950 955 960
Phe Asp Leu lie Ser Ser Thr Trp His Trp Ala Ser Ser Lys Ala Pro 965 970 975
His Lys His Ala lie Val Thr Val Thr Tyr Asp Ser Glu Glu Gin Arg 980 985 990
Gin Gin Phe Leu Asp Val Val Lys lie Pro Pro Thr lie Ser His Lys 995 1000 1005
Leu Gly Phe Met Ser Leu His Leu Leu Met Glu Ala lie Ala Lys Arg 1010 1015 1020
Leu Asp Ala Cys Gin Asp Gin Leu Leu Glu Leu Tyr Glu Glu Asn Ser 1025 1030 1035 1040 工le Asp 工le His Lys His lie Met His Trp Lys Cys lie Arg Leu Glu 1045 1050 1055
Ser Val Leu Leu Hi-s Lys Ala Lys Gin Met Gly Leu Ser His lie Gly 1060 1065 1070
Leu Gin Val Val Pro Pro Leu Thr Val Ser Glu Thr Lys Gly His Asn 1075 1080 1085
Ala lie Glu Met Gin Met His Leu Glu Ser Leu Ala Lys Thr Gin Tyr 1090 1095 1100
Gly Val Glu Pro Trp Thr Leu Gin Asp Thr Ser Tyr Glu Met Trp Leu 1105 1110 1115 1120
Thr Pro Pro Lys Arg Cys Phe Ala Lys Gin Gly Asn Thr Val Glu Val 1125 1130 1135
Lys Phe Asp Gly Cys Glu Asp Asn Val Met Glu Tyr Val Val Trp Thr 1140 1145 1150
His lie Tyr Leu Gin Asp Asn Asp Ser Trp Val Lys Val Thr Ser Ser 1155 1160 1165
Val Asp Ala Lys Gly lie Tyr Tyr Thr Cys Gly Gin Phe Lys Thr Tyr 1170 1175 1180
Tyr Val Asn Phe Asn Lys Glu Ala Gin Lys Tyr Gly Ser Thr Asn His 1185 1190 1195 1200
Trp Glu Val Cys Tyr Gly Ser Thr Val lie Cys Ser Pro Ala Ser Val 1205 1210 1215
Ser Ser Thr Val Arg Glu Val Ser lie Ala Glu Pro Thr Thr Tyr Thr 1220 1225 1230
Pro Ala Gin Thr Thr Ala Pro Thr Val Ser Ala Cys Thr Thr Glu Asp 1235 1240 1245
Gly Val Ser Ala Pro Pro Arg Lys Arg Ala Arg Gly Pro Ser Thr Asn -17- 88379 200411055 1250 1255 1260
Asn Thr Leu Cys Val Ala Asn lie Arg Ser Val Asp Ser Thr 工le Asn 1265 1270 1275 1280
Asn lie Val Thr Asp Asn Tyr Asn Lys His Gin Arg Arg Asn Asn Cys 1285 1290 1295
His Ser Ala Ala Thr Pro lie Val Gin Leu Gin Gly Asp Ser Asn Cys 1300 1305 1310
Leu Lys Cys Phe Arg Tyr Arg Leu Asn Asp Lys Tyr Lys His Leu Phe 1315 1320 1325
Glu Leu Ala Ser Ser Thr Trp His Trp Ala Ser Pro Glu Ala Pro His 1330 1335 1340
Lys Asn Ala lie Val Thr Leu Thr 1345 1350 Gin Phe Leu Asn Ser Val Lys lie 1365 Gly Phe Met Ser Leu His Leu Leu 1380
Tyr Ser Ser Glu Glu Gin Arg Gin 1355 1360 Pro Pro Thr lie Arg His Lys Val 1370 1375
<210> 19 <211> 4155 <212> DNA <213> HPV <400> 19 atggaagcta ttgccaagcg actggacgcc tgccaggagc agctgctgga gctgtacgag 60 gaaaacagca cagacctcca caagcacgtg ctgcactgga agtgcatgcg ccacgagtca 120 gtgctcctgt acaaggccaa gcagatgggg ctgtcccaca tcgggatgca ggtcgtgccc 180 ccgctgaagg tgagcgaagc caagggccac aacgctatcg agatgcagat gcacctggag 240 agcctgctgc ggaccgaata cagcatggag ccctggactc tccaggagac gtcctacgaa 300 atgtggcaga ctcctccgaa gcgctgtttc gcaaagcgcg gcaagacagt tgaggtgaaa 360 ttcgatgggt gcgcaaacaa cacgatggac tacgtggtgt ggaccgatgt ctacgtgcag 420 gacaatgaca cctgggtgaa ggtacatagt atggtggatg ccaagggcat ctattacacc 480 tgcgggcagt tcaagacgta ctacgtcaac ttcgtcaagg aagccgaaaa gtatggttcc 540 accaagcact gggaggtgtg ttacgggagt actgtgatct gcagccccgc ctccgtgtcg 600 tccaccaccc aggaagtgag cattccggag agcaccacat acaccccggc ccaaacgagc 660 acgctcgtca gcagcagcac caaggaggac gccgtccaga cgcccccccg gaagagggcc 720 cggggggtcc agcagtctcc ctgcaatgcc ctgtgcgttg ctcacatcgg ccctgtcgat 780 tctgggaacc acaatctcat cacgaacaac cacgaccagc accaaaggcg caacaactct 840 aacagctccg caactccaat agtgcagttc cagggggagt ccaactgcct caagtgtttc 900 cgctaccgcc tcaacgaccg ccaccgccac ctgttcgact tgatcagttc cacgtggcac 960 tgggccagca gcaaggcgcc ccacaaacac gctatcgtga cggtgaccta cgactccgag 1020 gagcagaggc agcagttcct ggacgtcgtg aagattcctc cgacaatcag ccacaagctt 1080 ggcttcatgt ccctgcacct gctgatggca gacgattccg gtactgagaa cgaaggttct 1140 ggttgtaccg gttggttcat ggttgaagca atcgttcagc atccgactgg tacccagatc 1200 tccgatgacg aagacgaaga agttgaagat tctggttacg acatggttga cttcatcgat 1260 gactccaaca tcactcataa ctctctggaa gcacaggctc tgtttaaccg ccaggaagct 1320 gatacccatt acgctactgt tcaggacctg ggaggcaaat atctgggctc tccgtacgtt 1380 tccccgatca acactatcgc agaagcagtt gagtctgaaa tctccccgcg cctggacgct 1440 atcaaactga ctcgtcagcc gaagaaggtt aaacgtcgtc tgttccagac tcgtgaactg 1500 accgactccg gttacggtta tagcgaagtt gaggctggca ccggcaccca ggttgaaaaa 1560 cacggtgtac cggaaaacgg cggcgacggt caggaaaagg acaccggccg cgacatcgag 1620 ggtgaggaac acaccgaagc tgaagctccg actaactctg ttcgtgaaca cgcaggtact 1680 gcgggtatcc tggaactgct gaaatgcaaa gacctgcgcg cggctctgct gggcaaattc 1740 aaagaatgct tcggcctgtc tttcattgac ctgatccgtc cgtttaagtc tgacaaaact 1800 acctgtctgg actgggttgt agcaggcttc ggcatccacc actctatctc tgaagcattc 1860 cagaaactga tcgagccgct gtctctgtac gcgcacatcc agtggctgac taacgcttgg 1920 ggtatggttc tgctggtact gctgcgcttt aaagtaaaca aatctcgttc cactgttgct 1980 cgtactctgg ctaccctgct gaacatcccg gagaaccaga tgctgatcga accgccgaaa 2040 atccagtctg gtgtagctgc actgtactgg tttcgtactg gcatctctaa cgctagcact 2100 gttatcggtg aagcaccgga atggatcact cgtcagaccg ttatcgaaca cggtctggca 2160 gattctcagt tcaaactgac tgaaatggtt cagtgggcat acgacaacga catctgcgag 2220 gaatctgaaa ttgcgttcga atacgctcag cgtggcgact tcgactccaa cgctcgtgct 2280 ttcctgaaca gcaacatgca ggctaaatac gtaaaagact gcgctaccat gtgccgtcac 2340 tacaaacacg cggaaatgcg taaaatgtct atcaaacagt ggatcaagca ccgcggttct 2400 aaaatcgaag gtaccggtaa ctggaaaccg atcgttcagt tcctgcgcca tcagaacatc 2460 -18 - 88379 200411055 gaattcatcc tgcatcgcta tctttcctgg ccactggtag atggatactt aaagcgctga aaggaagata ttcccgtttg ttcttcgagc tctaactctc atcgcgaaga attgacatcc cacaaggcca gtgtcagaga aaaacacagt accccaccta tgtgaggata agttgggtga tttaaaacct tgggaggtct cgcgaggtga gtgtctgctt ccaagcacca aacatcgtga acccccatcg aacgacaagt gaggcacctc cagtttctga ctgcatctcc cgttcctgac tcgtaggtcc gcggcactgt acgcgaaagt acatgcgcaa ctctgatcaa aatacaagta atcgtaacgg gtctgtcttc aggctttccg ggctcgacgc ataagcacat agcagatggg caaagggcca acggcgtgga agcgatgctt acgttatgga aggtgaccag actatgtgaa gctatgggag gcattgccga gtactaccga acaacaccct cggataacta tgcagctcca acaagcacct acaagaacgc acagcgtgaa tgtga caaattcaag accggacact aatctctcac agctctgctg cctgctggac gtgcccgccg cctgcatacc taacgctgtt ctccctggac ttgtgttccg ctgccaggac catgcactgg cctgtcccac taacgeaatc gccatggacc cgccaaacag gtatgtcgtg ctccgtggac cttcaacaaa cacggtgatt gccgaccacg ggacggcgtg ctgtgtggcg taacaagcac gggagacagc ctttgagctc catcgtcact gatcccaccg ctgtggctgc gacaagtctt gttaactctt gacgacgcga ggtaacccga ctgctggtaa cgtgttacta tacgaactgt atccaggact ggtactgttg cagctgctcg aagtgcattc ataggccttc gagatgcaga ctgcaggaca ggcaacacag tggacgcaca gcgaagggca gaggcccaaa tgctctcccg tacacccctg agcgctccac aacattcgca cagaggcgta aattgcctta gcctcgtcga ctcacttact acgatccgtc acggtacccc acttctgtat cctcccattt cccagccgtg tgtctatcga cttctaacat cctttacttt ccaacactaa ctgaagatga ttcgtactct agctgtacga gcctggagag aggtggtccc tgcacctcga cctcgtacga tggaggtgaa tctatctgca tctactatac agtatggctc ccagcgtgtc cccagacgac ccaggaagcg gcgtcgacag acaactgtca agtgcttccg cgtggcactg ccagtgagga ataaggtcgg gaaaaaaaac gtccctgatc ctggctgcag ctggatctac ccgtaaacac cgacatcacc cccgaacccg ctggaaatgc agaagatggt gatggaagcc ggagaacagc cgtgctgttg ccctctgacc gtcgctggcg aatgtggctg gttcgacggc ggacaacgac ctgtgggcag caccaaccac tagcactgtg cgctccgacc tgcgaggggc taccatcaat ctctgccgca ctatcgcctc ggcctcaccc gcagagacag cttcatgtca 2520 2580 2640 2700 2760 2820 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4155
<210> 20 <211> 1384 <212>蛋白質 <213> HPV lie Ala 5 Glu Glu 20 Met Arg Ser His Lys Gly Arg Thr 85 Glu Met 100 Thr Val Val Val Val His Phe Lys 165 Ser Thr 180 Pro Ala Thr Thr Lys Glu
Lys Arg Asn Ser His Glu lie Gly 55 His Asn 70 Glu Tyr Trp Gin Glu Val Trp Thr 135 Ser Met 150 Thr Tyr Lys His Ser Val Tyr Thr 215 Asp Ala 230 <400> 20 Met Glu Ala 1
Glu Leu Tyr
Trp Lys Cys 35
Met Gly Leu 50
Ser Glu Ala 65
Ser Leu Leu
Thr Ser Tyr
Arg Gly Lys 115
Met Asp Tyr 130
Trp Val Lys 145
Cys Gly Gin
Lys Tyr Gly 工le Cys Ser 195
Pro Glu Ser 210
Ser Ser Thr 225
Leu Asp Ala 10
Thr Asp Leu 25
Ser Val Leu 40
Met Gin Val
Ala lie Glu
Ser Met Glu 90
Thr Pro Pro 105
Lys Phe Asp 120
Asp Val Tyr
Val Asp Ala
Tyr Val Asn 170
Trp Glu Val 185
Ser Ser Thr 200
Pro Ala Gin Val Gin Thr
Cys Gin His Lys Leu Tyr Val Pro 60 Met Gin 75 Pro Trp Lys Arg Gly Cys Val Gin 140 Lys Gly 155 Phe Val Cys Tyr Thr Gin Thr Ser 220 Pro Pro 235
Glu Gin Leu Leu 15 His Val Leu His 30 Lys Ala Lys Gin 45 Pro Leu Lys Val Met His Leu Glu 80 Thr Leu Gin Glu 95 Cys Phe Ala Lys 110 Ala Asn Asn Thr 125 Asp Asn Asp Thr lie Tyr Tyr Thr 160 Lys Glu Ala Glu 175 Gly Ser Thr Val 190 Glu Val Ser lie 205 Thr Leu Val Ser Arg Lys Arg Ala 240 19- 88379 200411055
Arg Gly Val Gin Gin Ser Pro Cys Asn Ala Leu Cys Val Ala His lie 245 250 255
Gly Pro Val Asp Ser Gly Asn His Asn Leu lie Thr Asn Asn His Asp 260 265 270
Gin His Gin Arg Arg Asn Asn Ser Asn Ser Ser Ala Thr Pro lie Val 275 280 285
Gin Phe Gin Gly Glu Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu 290 295 300
Asn Asp Arg His Arg His Leu Phe Asp Leu lie Ser Ser Thr Trp His 305 310 315 320
Trp Ala Ser Ser Lys Ala Pro His Lys His Ala 工le Val Thr Val Thr 325 330 335
Tyr Asp Ser Glu Glu Gin Arg Gin Gin Phe Leu Asp Val Val Lys lie 340 345 350
Pro Pro Thr lie Ser His Lys Leu Gly Phe Met Ser Leu His Leu Leu 355 360 365
Met Ala Asp Asp Ser Gly Thr Glu Asn Glu Gly Ser Gly Cys Thr Gly 370 375 380
Trp Phe Met Val Glu Ala lie Val Gin His Pro Thr Gly Thr Gin lie 385 390 395 400
Ser Asp Asp Glu Asp Glu Glu Val Glu Asp Ser Gly Tyr Asp Met Val 405 410 415
Asp Phe 工le Asp Asp Ser Asn lie Thr His Asn Ser Leu Glu Ala Gin 420 425 430
Ala Leu Phe Asn Arg Gin Glu Ala Asp Thr His Tyr Ala Thr Val Gin 435 440 445
Asp Leu Gly Gly Lys Tyr Leu Gly Ser Pro Tyr Val Ser Pro lie Asn 450 455 460
Thr lie Ala Glu Ala Val Glu Ser Glu lie Ser Pro Arg Leu Asp Ala 465 470 475 480 lie Lys Leu Thr Arg Gin Pro Lys Lys Val Lys Arg Arg Leu Phe Gin 485 490 495
Thr Arg Glu Leu Thr Asp Ser Gly Tyr Gly Tyr Ser Glu Val Glu Ala 500 505 510
Gly Thr Gly Thr Gin Val Glu Lys His Gly Val Pro Glu Asn Gly Gly 515 520 525
Asp Gly Gin Glu Lys Asp Thr Gly Arg Asp 工le Glu Gly Glu Glu His 530 535 540
Thr Glu Ala Glu Ala Pro Thr Asn Ser Val Arg Glu His Ala Gly Thr 545 550 555 560
Ala Gly lie Leu Glu Leu Leu Lys Cys Lys Asp Leu Arg Ala Ala Leu 565 570 575
Leu Gly Lys Phe Lys Glu Cys Phe Gly Leu Ser Phe 工le Asp Leu lie 580 585 590
Arg Pro Phe Lys Ser Asp Lys Thr Thr Cys Leu Asp Trp Val Val Ala 595 600 605
Gly Phe Gly lie His His Ser lie Ser Glu Ala Phe Gin Lys Leu lie 610 615 620
Glu Pro Leu Ser Leu Tyr Ala His 工le Gin Trp Leu Thr Asn Ala Trp 625 630 635 640
Gly Met Val Leu Leu Val Leu Leu Arg Phe Lys Val Asn Lys Ser Arg 645 650 655
Ser Thr Val Ala Arg Thr Leu Ala Thr Leu Leu Asn lie Pro Glu Asn 660 665 670
Gin Met Leu 工le Glu Pro Pro Lys lie Gin Ser Gly Val Ala Ala Leu 675 680 685
Tyr Trp Phe Arg Thr Gly lie Ser Asn Ala Ser Thr Val lie Gly Glu 690 695 700
Ala Pro Glu Trp lie Thr Arg Gin Thr Val lie Glu His Gly Leu Ala 705 710 715 720
Asp Ser Gin Phe Lys Leu Thr Glu Met Val Gin Trp Ala Tyr Asp Asn 725 730 735
Asp lie Cys Glu Glu Ser Glu lie Ala Phe Glu Tyr Ala Gin Arg Gly 740 745 750
Asp Phe Asp Ser Asn Ala Arg Ala Phe Leu Asn Ser Asn Met Gin Ala 755 760 765 -20 - 88379 200411055
Lys Tyr Val Lys Asp Cys Ala Thr Met Cys Arg His Tyr Lys His Ala 770 775 780
Glu Met Arg Lys Met Ser lie Lys Gin Trp lie Lys His Arg Gly Ser 785 790 795 800
Lys lie Glu Gly Thr Gly Asn Trp Lys Pro lie Val Gin Phe Leu Arg 805 810 815
His Gin Asn lie Glu Phe lie Pro Phe Leu Thr Lys Phe Lys Leu Trp 820 825 830
Leu His Gly Thr Pro Lys Lys Asn Cys 工le Ala 工le Val Gly Pro Pro 835 840 845
Asp Thr Asp Lys Ser Tyr Phe Cys Met Ser Leu lie Ser Phe Leu Gly 850 855 860
Gly Thr Val 工le Ser His Val Asn Ser Ser Ser His Phe Trp Leu Gin 865 870 875 880
Pro Leu Val Asp Ala Lys Val Ala Leu Leu Asp Asp Ala Thr Gin Pro 885 890 895
Cys Trp lie Tyr Met Asp Thr Tyr Met Arg Asn Leu Leu Asp Gly Asn 900 905 910
Pro Met Ser lie Asp Arg Lys His Lys Ala Leu Thr Leu lie Lys Cys 915 920 925
Pro Pro Leu Leu Val Thr Ser Asn lie Asp lie Thr Lys Glu Asp Lys 930 935 940
Tyr Lys Tyr Leu His Thr Arg Val Thr Thr Phe Thr Phe Pro Asn Pro 945 950 955 960
Phe Pro Phe Asp Arg Asn Gly Asn Ala Val Tyr Glu Leu Ser Asn Thr 965 970 975
Asn Trp Lys Cys Phe Phe Glu Arg Leu Ser Ser Ser Leu Asp lie Gin 980 985 990
Asp Ser Glu Asp Glu Glu Asp Gly Ser Asn Ser Gin Ala Phe Arg Cys 995 1000 1005
Val Pro Gly Thr Val Val Arg Thr Leu Met Glu Ala lie Ala Lys Arg 1010 1015 1020
Leu Asp Ala Cys Gin Asp Gin Leu Leu Glu Leu Tyr Glu Glu Asn Ser 1025 1030 1035 1040 lie Asp 工le His Lys His 工le Met His Trp Lys Cys lie Arg Leu Glu 1045 1050 1055
Ser Val Leu Leu His Lys Ala Lys Gin Met Gly Leu Ser His lie Gly 1060 1065 1070
Leu Gin Val Val Pro Pro Leu Thr Val Ser Glu Thr Lys Gly His Asn 1075 1080 1085
Ala lie Glu Met Gin Met His Leu Glu Ser Leu Ala. Lys Thr Gin Tyr 1090 - 1095 1100
Gly Val Glu Pro Trp Thr Leu Gin Asp Thr Ser Tyr Glu Met Trp Leu 1105 1110 1115 1120
Thr Pro Pro Lys Arg Cys Phe Ala Lys Gin Gly Asn Thr Val Glu Val 1125 1130 1135
Lys Phe Asp Gly Cys Glu Asp Asn Val Met Glu Tyr Val Val Trp Thr 1140 1145 1150
His lie Tyr Leu Gin Asp Asn Asp Ser Trp Val Lys Val Thr Ser Ser 1155 1160 1165
Val Asp Ala Lys Gly lie Tyr Tyr Thr Cys Gly Gin Phe Lys Thr Tyr 117-0 1175 1180
Tyr Val Asn Phe Asn Lys Glu Ala Gin Lys Tyr Gly Ser Thr Asn His 1185 1190 1195 1200
Trp Glu Val Cys Tyr Gly Ser Thr Val lie Cys Ser Pro Ala Ser Val 1205 1210 1215
Ser Ser Thr Val Arg Glu Val Ser lie Ala Glu Pro Thr Thr Tyr Thr 1220 1225 1230
Pro Ala Gin Thr Thr Ala Pro Thr Val Ser Ala Cys Thr Thr Glu Asp 1235 1240 1245
Gly Val Ser Ala Pro Pro Arg Lys Arg Ala Arg Gly Pro Ser Thr Asn 1250 1255 1260
Asn Thr Leu Cys Val Ala Asn lie Arg Ser Val Asp Ser Thr lie Asn 1265 1270 1275 1280
Asn lie Val Thr Asp Asn Tyr Asn Lys His Gin Arg Arg Asn Asn Cys 1285 1290 1295 -21-
88379 200411055
His Ser Ala Ala Thr Pro lie Val Gin Leu Gin Gly Asp Ser Asn Cys 1300 1305 1310
Leu Lys Cys Phe Arg Tyr Arg Leu Asn Asp Lys Tyr Lys His Leu Phe 1315 1320 1325
Glu Leu Ala Ser Ser Thr Trp His Trp Ala Ser Pro Glu Ala Pro His 1330 1335 1340
Lys Asn Ala lie Val Thr Leu Thr Tyr Ser Ser Glu Glu Gin Arg Gin 1345 1350 1355 1360
Gin Phe Leu Asn Ser Val Lys lie Pro Pro Thr lie Arg His Lys Val 1365 1370 1375
Gly Phe Met Ser Leu His Leu Leu 1380
<210> 21 <211> 4155 <212> DNA <213> HPV <400> 21 atggaagcta gaaaacagca gtgctcctgt ccgctgaagg agcctgctgc atgtggcaga ttcgatgggt gacaatgaca tgcgggcagt accaagcact tccaccaccc acgctcgtca cggggggtcc tctgggaacc aacagctccg cgctaccgcc tgggccagca gagcagaggc ggcttcatgt gaccagctgc tggaagtgca cacataggcc atcgagatgc accctgcagg cagggcaaca gtgtggacgc gacgcgaagg aaagaggccc atttgctctc acgtacaccc gtgagcgctc gcgaacattc caccagaggc agcaattgcc ctcgcctcgt actctcactt ccgacgatcc ggtactgaga catccgactg gacatggttg ctgtttaacc tatctgggct atctccccgc ctgttccaga accggcaccc gacaccggcc ttgccaagcg cagacctcca acaaggccaa tgagcgaagc ggaccgaata ctcctccgaa gcgcaaacaa cctgggtgaa tcaagacgta gggaggtgtg aggaagtgag gcagcagcac agcagtctcc acaatctcat caactccaat tcaacgaccg gcaaggcgcc agcagttcct ccctgcacct tcgagctgta ttcgcctgga ttcaggtggt agatgcacct acacctcgta cagtggaggt acatctatct gcatctacta aaaagtatgg ccgccagcgt ctgcccagac cacccaggaa gcagcgtcga gtaacaactg ttaagtgctt cgacgtggca actccagtga gtcataaggt acgaaggttc gtacccagat acttcatcga gccaggaagc ctccgtacgt gcctggacgc ctcgtgaact aggttgaaaa gcgacatcga actggacgcc caagcacgtg gcagatgggg caagggccac cagcatggag gcgctgtttc cacgatggac ggtacatagt ctacgtcaac ttacgggagt cattccggag caaggaggac ctgcaatgcc cacgaacaac agtgcagttc ccaccgccac ccacaaacac ggacgtcgtg gctgatggaa cgaggagaac gagcgtgctg cccccctctg cgagtcgctg cgaaatgtgg gaagttcgac gcaggacaac tacctgtggg ctccaccaac gtctagcact gaccgctccg gcgtgcgagg cagtaccatc tcactctgcc ccgctatcgc ctgggcctca ggagcagaga cggcttcatg tggttgtacc ctccgatgac tgactccaac tgatacccat ttccccgatc tatcaaactg gaccgactcc acacggtgta gggtgaggaa tgccaggagc ctgcactgga ctgtcccaca aacgctatcg ccctggactc gcaaagcgcg tacgtggtgt atggtggatg ttcgtcaagg actgtgatct agcaccacat gccgtccaga ctgtgcgttg cacgaccagc cagggggagt ctgttcgact gctatcgtga aagattcctc gccatcgcga agcattgaca ttgcacaagg accgtgtcag gcgaaaacac ctgaccccac ggctgtgagg gacagttggg cagtttaaaa cactgggagg gtgcgcgagg accgtgtctg ggcccaagca aataacatcg gcaaccccca ctcaacgaca cccgaggcac cagcagtttc tcactgcatc ggttggttca gaagacgaag atcactcata tacgctactg aacactatcg actcgtcagc ggttacggtt ccggaaaacg cacaccgaag agctgctgga agtgcatgcg tcgggatgca agatgcagat tccaggagac gcaagacagt ggaccgatgt ccaagggcat aagccgaaaa gcagccccgc acaccccggc cgcccccccg ctcacatcgg accaaaggcg ccaactgcct tgatcagttc cggtgaccta cgacaatcag agaggctcga tccataagca ccaagcagat agacaaaggg agtacggcgt ctaagcgatg ataacgttat tgaaggtgac cctactatgt tctgctatgg tgagcattgc cttgtactac ccaacaacac tgacggataa tcgtgcagct agtacaagca ctcacaagaa tgaacagcgt tcctgatggc tggttgaagc aagttgaaga actctctgga ttcaggacct cagaagcagt cgaagaaggt atagcgaagt gcggcgacgg ctgaagctcc gctgtacgag ccacgagtca ggtcgtgccc gcacctggag gtcctacgaa tgaggtgaaa ctacgtgcag ctattacacc gtatggttcc ctccgtgtcg ccaaacgagc gaagagggcc ccctgtcgat caacaactct caagtgtttc cacgtggcac cgactccgag ccacaagctt cgcctgccag catcatgcac gggcctgtcc ccataacgca ggagccatgg cttcgccaaa ggagtatgtc cagctccgtg gaacttcaac gagcacggtg cgagccgacc cgaggacggc cctctgtgtg ctataacaag ccagggagac cctctttgag cgccatcgtc gaagatccca agacgattcc aatcgttcag ttctggttac agcacaggct gggaggcaaa tgagtctgaa taaacgtcgt tgaggctggc tcaggaaaag gactaactct 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 -22- 88379 200411055 gttcgtgaac gcggctctgc ccgtttaagt cactctatct cagtggctga aaatctcgtt atgctgatcg ggcatctcta gttatcgaac tacgacaacg ttcgactcca tgcgctacca tggatcaagc ttcctgcgcc cacggtaccc tacttctgta tcctcccatt acccagccgt atgtctatcg acttctaaca acctttactt tccaacacta tctgaagatg gttcgtactc acgcaggtac tgggcaaatt ctgacaaaac ctgaagcatt ctaacgcttg ccactgttgc aaccgccgaa acgctagcac acggtctggc acatctgcga acgctcgtgc tgtgccgtca accgcggttc atcagaacat cgaaaaaaaa tgtccctgat tctggctgca gctggatcta accgtaaaca tcgacatcac tcccgaaccc actggaaatg aagaagatgg tgtga tgcgggtatc caaagaatgc tacctgtctg ccagaaactg gggtatggtt tcgtactctg aatccagtct tgttatcggt agattctcag ggaatctgaa tttcctgaac ctacaaacac taaaatcgaa cgaattcatc ctgcatcgct ctctttcctg gccactggta catggatact caaagcgctg caaggaagat gttcccgttt cttcttcgag ttctaactct ctggaactgc ttcggcctgt gactgggttg atcgagccgc ctgctggtac gctaccctgc ggtgtagctg gaagcaccgg ttcaaactga attgcgttcg agcaacatgc gcggaaatgc ggtaccggta ccgttcctga atcgtaggtc ggcggcactg gacgcgaaag tacatgcgca actctgatca aaatacaagt gatcgtaacg cgtctgtctt caggctttcc tgaaatgcaa ctttcattga tagcaggctt tgtctctgta tgctgcgctt tgaacatccc cactgtactg aatggatcac ctgaaatggt aatacgctca aggctaaata gtaaaatgtc actggaaacc ccaaattcaa caccggacac taatctctca tagctctgct acctgctgga agtgcccgcc acctgcatac gtaacgctgt cctccctgga gttgtgttcc agacctgcgc cctgatccgt cggcatccac cgcgcacatc taaagtaaac ggagaaccag gtttcgtact tcgtcagacc tcagtgggca gcgtggcgac cgtaaaagac tatcaaacag gatcgttcag gctgtggctg tgacaagtct cgttaactct ggacgacgcg cggtaacccg gctgctggta ccgtgttact ttacgaactg catccaggac gggtactgtt 2820 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4155
<210> 22 <211> 1384 <212> 蛋白質 <213> HPV <400> 22
Met Glu Ala 工le Ala Lys Arg Leu 1 5
Glu Leu Tyr Glu Glu Asn Ser Thr 20
Trp Lys Cys Met Arg His Glu Ser 35 40
Met Gly Leu Ser His 工le Gly Met 50 55
Ser Glu Ala Lys Gly His Asn Ala 65 70
Ser Leu Leu Arg Thr Glu Tyr Ser 85
Thr Ser Tyr Glu Met Trp Gin Thr 100
Arg Gly Lys Thr Val Glu Val Lys 115 120
Met Asp Tyr Val Val Trp Thr Asp 130 135
Trp Val Lys Val His Ser Met Val 145 150
Cys Gly Gin Phe Lys Thr Tyr Tyr 165
Lys Tyr Gly Ser Thr Lys His Trp 180 lie Cys Ser Pro Ala Ser Val Ser 195 200
Pro Glu Ser Thr Thr Tyr Thr Pro 210 215
Ser Ser Thr Lys Glu Asp Ala Val 225 230
Arg Gly Val Gin Gin Ser Pro Cys 245
Gly Pro Val Asp Ser Gly Asn His 260
Gin His Gin Arg Arg Asn Asn Ser
Asp Ala Cys Gin Glu Gin Leu Leu 10 15
Asp Leu His Lys His Val Leu His 25 30
Val Leu Leu Tyr Lys Ala Lys Gin 45
Gin Val Val Pro Pro Leu Lys Val 60 工le Glu Met Gin Met His Leu Glu 75 80
Met Glu Pro Trp Thr Leu Gin Glu 90 95
Pro Pro Lys Arg Cys Phe Ala Lys 105 110
Phe Asp Gly Cys Ala Asn Asn Thr 125
Val Tyr Val Gin Asp Asn Asp Thr 140
Asp Ala Lys Gly lie Tyr Tyr Thr 155 160
Val Asn Phe Val Lys Glu Ala Glu 170 175
Glu Val Cys Tyr Gly Ser Thr Val 185 190
Ser Thr Thr Gin Glu Val Ser lie 205
Ala Gin Thr Ser Thr Leu Val Ser 220
Gin Thr Pro Pro Arg Lys Arg Ala 235 240
Asn Ala Leu Cys Val Ala His lie 250 255
Asn Leu lie Thr Asn Asn His Asp 265 270
Asn Ser Ser Ala Thr Pro lie Val -23 - 88379 200411055 275 Gin Phe Gin 290 Asn Asp Arg 305 Trp Ala Ser Tyr Asp Ser Pro Pro Thr 355 Met Glu Ala 370 Glu Leu Tyr 385 Trp Lys Cys Met Gly Leu Ser Glu Thr 435 Ser Leu Ala 450 Thr Ser Tyr 465 Gin Gly Asn Met Glu Tyr Trp Val Lys 515 Cys Gly Gin 530 Lys Tyr Gly 545 工le Cys Ser Ala Glu Pro Ser Ala Cys 595 Ala Arg Gly 610 Ser Val Asp 625 His Gin Arg Leu Gin Gly Asp Lys Tyr 675 Ala Ser Pro 690 Ser Ser Glu 705 Pro Thr lie Ala Asp Asp Phe Met Val 755 Asp Asp Glu 770 Phe lie Asp 785 Leu Phe Asn
Ser Asn 295 His Leu 310 Ala Pro Gin Arg His Lys Lys Arg 375 Asn Ser 390 Leu Glu He Gly His Asn Gin Tyr 455 Trp Leu 470 Glu Val Trp Thr Ser Ser Thr Tyr 535 Asn His 550 Ser Val Tyr Thr Glu Asp Thr Asn 615 lie Asn 630 Asn Cys Asn Cys Leu Phe Pro His 695 Arg Gin 710 Lys Val Thr Glu He Val Glu Val 775 Asn lie 790 Glu Ala
Lys Cys Leu lie 315 His Ala 330 Phe Leu Phe Met Ala Cys lie His 395 Leu Leu 410 Val Val Glu Met Glu Pro Pro Lys 475 Asp Gly 490 Tyr Leu Ala Lys Asn Phe Val Cys 555 Thr Val 570 Gin Thr Ser Ala Leu Cys Val Thr 635 Ala Ala 650 Cys Phe Ala Ser Ala lie Leu Asn 715 Met Ser 730 Gly Ser Pro Thr Ser Gly Asn Ser 795 His Tyr
Tyr Arg Leu Thr Trp His 320 Thr Val Thr 335 Val Lys lie 350 His Leu Leu Gin Leu Leu lie Met His 400 Ala Lys Gin 415 Leu Thr Val 430 His Leu Glu Leu Gin Asp Phe Ala Lys 480 Asp Asn Val 495 Asn Asp Ser 510 Tyr Tyr Thr Glu Ala Gin Ser Thr Val 560 Val Ser lie 575 Pro Thr Val 590 Arg Lys Arg Asn lie Arg Tyr Asn Lys 640 He Val Gin 655 Arg Leu Asn 670 Trp His Trp Leu Thr Tyr
Lys 工le Pro 720 Leu Leu Met 735 Thr Gly Trp 750 Gin He Ser Met Val Asp Ala Gin Ala 800 Val Gin Asp
Gly Glu
His Arg
Ser Lys 325 Glu Glu 340 lie Ser 工le Ala
Glu Glu lie Arg 405 Ser His 420
Lys Gly
Lys Thr
Glu Met
Thr Val 485 Val Val 500
Val Thr
Phe Lys
Ser Thr
Pro Ala 565 Thr Thr 580
Thr Thr
Pro Ser
Ser Thr
Arg Asn 645 Asp Ser 660
Lys His
Glu Ala
Glu Gin
Arg His 725 Ser Gly 740
Glu Ala Asp Glu Asp Ser Arg Gin 280
Cys Leu
Phe Asp
His Lys
Gin Gin 345 Leu Gly 360
Leu Asp 工le Asp
Ser Val
Leu Gin 425 Ala lie 440
Gly Val
Thr Pro
Lys Phe
His He 505 Val Asp 520
Tyr Val
Trp Glu
Ser Ser
Pro Ala 585 Gly Val 600
Asn Thr
Asn lie
His Ser
Leu Lys 665 Glu Leu 680
Lys Asn
Gin Phe
Gly Phe
Asn Glu 745 Gin His 760
Glu Asp Thr His Asp Thr 285 Phe Arg 300
Ser Ser lie Val
Asp Val
Ser Leu 365 Gin Asp 380
Lys His
His Lys
Pro Pro
Gin Met 445 Trp Thr 460
Arg Cys
Cys Glu
Gin Asp
Gly lie 525 Asn Lys 540
Tyr Gly
Arg Glu
Thr Ala
Pro Pro 605 Val Ala 620
Asp Asn
Thr Pro
Arg Tyr
Ser Thr 685 Val Thr 700
Ser Val
Leu His
Gly Cys
Gly Thr 765 Tyr Asp 780
Leu Glu Ala Thr 88379 •24- 200411055 805 810 815
Leu Gly Gly Lys Tyr Leu Gly Ser Pro Tyr Val Ser Pro lie Asn Thr 820 825 830 lie Ala Glu Ala Val Glu Ser Glu lie Ser Pro Arg Leu Asp Ala lie 835 840 845
Lys Leu Thr Arg Gin Pro Lys Lys Val Lys Arg Arg Leu Phe Gin Thr 850 855 860
Arg Glu Leu Thr Asp Ser Gly Tyr Gly Tyr Ser Glu Val Glu Ala Gly 865 870 875 880
Thr Gly Thr Gin Val Glu Lys His Gly Val Pro Glu Asn Gly Gly Asp 885 890 895
Gly Gin Glu Lys Asp Thr Gly Arg Asp lie Glu Gly Glu Glu His Thr 900 905 910
Glu Ala Glu Ala Pro Thr Asn Ser Val Arg Glu His Ala Gly Thr Ala 915 920 925
Gly lie Leu Glu Leu Leu Lys Cys Lys Asp Leu Arg Ala Ala Leu Leu 930 935 940
Gly Lys Phe Lys Glu Cys Phe Gly Leu Ser Phe lie Asp Leu lie Arg 945 950 955 960
Pro Phe Lys Ser Asp Lys Thr Thr Cys Leu Asp Trp Val Val Ala Gly 965 970 975
Phe Gly lie His His Ser lie Ser Glu Ala Phe Gin Lys Leu lie Glu 980 985 990
Pro Leu Ser Leu Tyr Ala His lie Gin Trp Leu Thr Asn Ala Trp Gly 995 1000 1005
Met Val Leu Leu Val Leu Leu Arg Phe Lys Val Asn Lys Ser Arg Ser 1010 1015 1020
Thr Val Ala Arg Thr Leu Ala Thr Leu Leu Asn lie Pro Glu Asn Gin 1025 1030 1035 1040
Met Leu lie Glu Pro Pro Lys lie Gin Ser Gly Val Ala Ala Leu Tyr 1045 1050 1055
Trp Phe Arg Thr Gly lie Ser Asn Ala Ser Thr Val lie Gly Glu Ala 1060 1065 1070
Pro Glu Trp lie Thr Arg Gin Thr Val lie Glu His Gly Leu Ala Asp 1075 1080 1085
Ser Gin Phe Lys Leu Thr Glu Met Val Gin Trp Ala Tyr Asp Asn Asp 1090 1095 1100 工le Cys Glu Glu Ser Glu lie Ala Phe Glu Tyr Ala Gin Arg Gly Asp 1105 1110 1115 1120
Phe Asp Ser Asn Ala Arg Ala Phe Leu Asn Ser Asn Met Gin Ala Lys 1125 1130 1135
Tyr Val Lys Asp Cys Ala Thr Met Cys Arg His Tyr Lys His Ala Glu 1140 1145 1150
Met Arg Lys Met Ser 工le Lys Gin Trp lie Lys His Arg Gly Ser Lys 1155 1160 1165 工le Glu Gly Thr Gly Asn Trp Lys Pro lie Val Gin Phe Leu Arg His 1170 1175 1180
Gin Asn lie Glu Phe lie Pro Phe Leu Thr Lys Phe Lys Leu Trp Leu 1185 1190 1195 1200
His Gly Thr Pro Lys Lys Asn Cys lie Ala lie Val Gly Pro Pro Asp 1205 1210 1215
Thr Asp Lys Ser Tyr Phe Cys Met Ser Leu lie Ser Phe Leu Gly Gly 1220 1225 1230
Thr Val 工le Ser His Val Asn Ser Ser Ser His Phe Trp Leu Gin Pro 1235 1240 1245
Leu Val Asp Ala Lys Val Ala Leu Leu Asp Asp Ala Thr Gin Pro Cys 1250 1255 1260
Trp lie Tyr Met Asp Thr Tyr Met Arg Asn Leu Leu Asp Gly Asn Pro 1265 1270 1275 1280
Met Ser lie Asp Arg Lys His Lys Ala Leu Thr Leu lie Lys Cys Pro 1285 1290 1295
Pro Leu Leu Val Thr Ser Asn 工le Asp lie Thr Lys Glu Asp Lys Tyr 1300 1305 1310
Lys Tyr Leu His Thr Arg Val Thr Thr Phe Thr Phe Pro Asn Pro Phe 1315 1320 1325
Pro Phe Asp Arg Asn Gly Asn Ala Val iyr Glu Leu Ser Asn Thr Asn e 25 ·
88379 200411055 1330 1335 1340 Trp Lys Cys Phe Phe Glu Arg Leu Ser Ser Ser Leu Asp lie Gin Asp 1345 1350 1355 1360 Ser Glu Asp Glu Glu Asp Gly Ser Asn Ser Gin Ala Phe Arg Cys Val 1365 1370 1375 Pro Gly Thr Val Val Arg Thr Leu 1380 <210> 23 <211> 23 <212> 蛋白質 <213> HPV <400> 23 Cys Ser Ser Ser Leu Asp lie Gin Asp Ser Glu Asp Glu Glu Asp Gly 15 10 15 Ser Asn Ser Gin Ala Phe Arg 20 <210> 24 <211> 20 <212> DNA <213>人造的序列 <220> <223>免疫刺激性寡核甞酸 <400> 24 tccatgacgt tcctgacgtt <210> 25 <211> 18 <212> DNA <213>人造的序列 <220> <223>免疫刺激性寡核甞酸 20 <400> 25 tctcccagcg tgcgccat <210> 26 <211> 30 <212> DNA <213>人造的序列 <220> <223>免疫刺激性寡核甞酸 <400> 26 accgatgacg tcgccggtga cggcaccacg <210> 27 <211> 24 <212> DNA <213>人造的序列 <220> <223>免疫刺激性寡核甞酸 18 30 <400> 27 tcgtcgtttt gtcgttttgt cgtt <2l〇> 28 88379 -26- 24 200411055 <211> 20 <212> DNA <213>人造的序列 <220> <223>免疫刺激性寡核甞酸 <400> 28 tccatgacgt tcctgatgct -27 88379

Claims (1)

  1. 200411055 拾、申請專利範園: L 一種編碼人類乳頭狀瘤病毒(Hpv)多肽的多核甞酸序 列忒多肽具有得自至少兩個得自兩個不同Hpv品系之早 期抗原或其片段的抗原決定位。 2·根據申請專利範圍第丨項之多核甞酸,其中至少一個抗原 係衍生自HPV E1或其片段。 3·根據申請專利範圍第2項之多核甞酸,其中至少一個抗原 係衍生自HPV E2。 4.根據申請專利範圍第1至3項中任一項之多核苷酸序列, 其為DNA序列。 5·根據申請專利範圍第1至3項中任一項之多核:y:酸序列, 其編碼與子宮頸癌、良性皮膚疣或生殖器疣有關之HP V 型或亞型的HPV多肽。 6·根據申請專利範圍第1至3項中任一項之多核苷酸序列, 其編碼 1:4、6、7、10、11、16、18、26-29、31、33、35、 39、49、51、52、56、58、59和 68型之一的 HPV多肽。 7·根據申請專利範圍第6項之多核:y:酸序列,其編碼與子宮 頸癌或生殖器虎有關之HP V型或亞型的HP V多肽。 8·根據申請專利範圍第4項之多核:y:酸序列,其編碼6、11、 16、18、33或45型之一的HPV多肽。 9·根據申請專利範圍第5項之多核苷酸序列,其編碼選自 HPV 11、6a或6b之HPV型或亞型的HPV多肽。 10·根據申請專利範圍第1至3項中任一項之多核:y:酸序列, 其編碼具有降低生物功能的突變HPV多肽。 88379 200411055 11·根據申請專利範圍第1至3項中任一項之多核省:酸序列, 其編碼包括一或多個點突變之突變的HP V多肽,藉此使該 多肽一或多個天然的生物功能失活。 12·根據申請專利範圍第1至3項中任一項之多核嘗酸序列, 其具有超過0.4但低於1之人類基因的密碼子使用率係數。 根據申請專利範圍第12項之多核苷酸序列,其具有超過 〇·5但低於1之人類基因的密碼子使用率係數。 队一種表現載體,其包括以可操作之方式與控制序列連接
    的根據申請專利範圍第j至3項中任一項之多核甞酸序 列,孩控制序列能夠藉由宿主細胞提供該多核苷酸序列 的表現。 15. 16. 17. 根據申請專利範圍第14項之表現載體,其為p73i3pLc。 種醫藥組合物,其包括根據申請專利範圍第】至3項中 任一項之多核甞酸序列。 /、 :種醫藥組合物’其包括根據中請專利侧第14項之載 18
    =申請專利範圍第16嚷之醫藥組合物,其包括以眶 塗覆之多個金顆粒。 19 20 .=申請專利範圍第17項之醫藥、组合物,其包括以眶 、覆 < 多個金顆粒。 ·=申請專利第16項之醫藥組合物,進—步更包括 ::申請專利範圍第17項之醫藥組合物,進-步更包括 88379 -2- 200411055 22·根據申请專利範圍第2〇項之醫藥組合物,其中編碼該佐 劑’使其與藉著該多核铝酸編碼之HPV多肽融合。 23.根據申請專利範圍第21項之醫藥組合物,其中編碼該佐 劑’使其與藉著該多核苷酸編碼之HPV多肽融合。 24· —種根據申請專利範圍第1至3項中任一項之多核甞酸序 列,在治療或預防HPV感染上的用途。 25· —種根據申請專利範圍第14項之載體的用途,其係用於 治療或預防HP V感染。 26·種根據申請專利知圍第16項之組合物的用途,其係用 _ 於治療或預防HPV感染。 27· —種根據申請專利範圍第17項之組合物的用途,其係用 於治療或預防HPV感染。 28· —種根據申請專利範圍第1至3項中任一項之多核甞酸序 列的用途,其係用於治療或預防皮膚(皮膚)疣、生殖器 疣、未乳定重要性之非典型鱗狀細胞(ASCUS)、子宮頸發 育異常、子宮頸上皮内贊生物(CIN)或子宮頸癌。 傷 29· —種根據申請專利範圍第14項之載體的用途,其係用於 — 治療或預防皮膚(皮膚)疣、生殖器疣、未判定重要性之非 > 典型鱗狀細胞(ASCUS)、子宮頸發育異常、子宮頸上皮内 贅生物(CIN)或子宮頸癌。 30· —種根據申請專利範圍第16項之醫藥組合物的用途,其 係用於治療或預防皮膚(皮膚)疣、生殖器疣、未判定重要 性之非典型鱗狀細胞(ASCUS)、子宮頸發育異常、予宮頸 上皮内贅生物(CIN)或子宫頸癌。 88379 200411055 31· —種根據申請專利範圍第17項之醫藥組合物的用途’其 係用於治療或預防皮膚(皮膚)疣、生殖器疣、未判定重要 性之非典型鱗狀細胞(ASCUS)、子宮頸發育異常、子宮頸 上皮内贅生物(CIN)或子宮頸癌。 32·根據申請專利範圍第16項之醫藥組合物,其係用來治療 或預防HPV感染或任何與其有關的症狀或疾病。 33·根據申請專利範圍第17項之醫藥組合物,其係用來治療 或預防HPV感染或任何與其有關的症狀或疾病。 34· —種用於治療或預防HPV感染或任何與其有關的症狀或 疾病之醫藥組合,包括根據申請專利範圍第16項之醫藥 組a物以及重組的病毒載體或以非-病毒為基礎的系 統,包括根據申請專利範圍第1至3項中任一項之多核苷 酸0 35. 一種用於治療或預防HPV感染或任何與其有關的症狀或 疾病义醫藥組合,包括根據申請專利範圍第”項之醫藥 組合物’以及重組的病毒載體,或轉·病毒為基礎的系 統,包括根據申請專利範圍第1至3項中任一項之多核替 酸0 88379 4-
TW092127210A 2002-10-03 2003-10-01 Vaccine TW200411055A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
GBGB0222953.2A GB0222953D0 (en) 2002-10-03 2002-10-03 Novel Compounds

Publications (1)

Publication Number Publication Date
TW200411055A true TW200411055A (en) 2004-07-01

Family

ID=9945247

Family Applications (1)

Application Number Title Priority Date Filing Date
TW092127210A TW200411055A (en) 2002-10-03 2003-10-01 Vaccine

Country Status (21)

Country Link
US (2) US20060165713A1 (zh)
EP (1) EP1546191A2 (zh)
JP (1) JP2006516386A (zh)
KR (1) KR20050050115A (zh)
CN (1) CN100393878C (zh)
AR (1) AR041515A1 (zh)
AU (1) AU2003294672A1 (zh)
BR (1) BR0314986A (zh)
CA (1) CA2500093A1 (zh)
CO (1) CO5580837A2 (zh)
GB (1) GB0222953D0 (zh)
IS (1) IS7775A (zh)
MA (1) MA27474A1 (zh)
MX (1) MXPA05003558A (zh)
NO (1) NO20051561L (zh)
NZ (1) NZ539154A (zh)
PL (1) PL376534A1 (zh)
RU (1) RU2354701C2 (zh)
TW (1) TW200411055A (zh)
WO (1) WO2004031222A2 (zh)
ZA (1) ZA200503201B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA008777B1 (ru) 2002-10-29 2007-08-31 Коли Фармасьютикал Груп, Лтд. Способы и продукты, относящиеся к лечению и предупреждению инфекции вируса гепатита c
MX2009008118A (es) 2007-01-30 2009-10-13 Transgene Sa Polipeptido e2 del virus del papiloma usado para vacunacion.
GB0710538D0 (en) * 2007-06-01 2007-07-11 Glaxo Group Ltd Vaccine
WO2011161244A1 (en) 2010-06-25 2011-12-29 Vaccibody As Homodimeric protein constructs
CN107001430A (zh) * 2014-10-24 2017-08-01 哈普威克斯有限责任公司 癌症和皮肤病变治疗
EP3452081A1 (en) * 2016-05-04 2019-03-13 Transgene SA Combination therapy with cpg tlr9 ligand

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPN443995A0 (en) * 1995-07-27 1995-08-17 Csl Limited Papillomavirus polyprotein
GB0017990D0 (en) * 2000-07-21 2000-09-13 Glaxo Group Ltd Papilloma virus sequences
IL154009A0 (en) * 2000-07-21 2003-07-31 Glaxo Group Ltd Codon-optimized papilloma virus sequences

Also Published As

Publication number Publication date
WO2004031222A3 (en) 2004-08-19
KR20050050115A (ko) 2005-05-27
AR041515A1 (es) 2005-05-18
US20060165713A1 (en) 2006-07-27
AU2003294672A1 (en) 2004-04-23
MXPA05003558A (es) 2005-06-03
IS7775A (is) 2005-03-29
GB0222953D0 (en) 2002-11-13
ZA200503201B (en) 2006-06-28
CA2500093A1 (en) 2004-04-15
BR0314986A (pt) 2005-08-09
CN1720261A (zh) 2006-01-11
NZ539154A (en) 2007-05-31
PL376534A1 (pl) 2006-01-09
WO2004031222A2 (en) 2004-04-15
MA27474A1 (fr) 2005-08-01
US20070264283A1 (en) 2007-11-15
RU2005109155A (ru) 2006-03-10
CN100393878C (zh) 2008-06-11
NO20051561D0 (no) 2005-03-23
CO5580837A2 (es) 2005-11-30
JP2006516386A (ja) 2006-07-06
NO20051561L (no) 2005-06-02
RU2354701C2 (ru) 2009-05-10
EP1546191A2 (en) 2005-06-29

Similar Documents

Publication Publication Date Title
KR100874552B1 (ko) 코돈-최적화 파필로마 바이러스 서열
US5618536A (en) Chimeric papillomavirus-like particles
US6235523B1 (en) Vectors for DNA immunization against cervical cancer
JP4601956B2 (ja) Hiv−gagのコドン最適化dnaワクチン
CA2305683C (en) Immunogenic peptides from the hpv e7 protein
JPH11501804A (ja) 免疫治療剤として役立つポリペプチド及びポリペプチド調製の方法
PL180639B1 (pl) Szczepionka polinukieotydowa dla ludzi przeciwko wirusowi brodawczaków PL PL PL PL PL PL
AU2008249148A1 (en) Compositions and methods for treating human papillomavirus-mediated disease
EP0561885B1 (en) Subunit papillomavirus vaccine
US7691386B2 (en) Chimeric papillomavirus-like particles
US7132262B2 (en) Papilloma virus sequences
US20070264283A1 (en) Vaccine
US6183745B1 (en) Subunit papilloma virus vaccine and peptides for use therein
WO2008145745A1 (en) Vaccine against hpv
RU2312896C2 (ru) Последовательность нуклеиновой кислоты, кодирующая белок gag вич-1, способ получения указанной последовательности, вектор, содержащий ее, белок, кодируемый ею, фармацевтическая композиция и их применение для профилактики и/или лечения вич-инфекции и спида
AU660954B2 (en) Subunit papillomavirus vaccine and peptides for use therein
ES2364466T3 (es) Vacunas de adn optimizadas por codón rt-nef-gaf para vih.