TW200411055A

TW200411055A - Vaccine

Info

Publication number: TW200411055A
Application number: TW092127210A
Authority: TW
Inventors: Gerald Wayne Gough; Christopher Michael Roberts
Original assignee: Glaxo Group Ltd
Priority date: 2002-10-03
Filing date: 2003-10-01
Publication date: 2004-07-01
Also published as: WO2004031222A3; KR20050050115A; AR041515A1; US20060165713A1; AU2003294672A1; MXPA05003558A; IS7775A; GB0222953D0; ZA200503201B; CA2500093A1; BR0314986A; CN1720261A; NZ539154A; PL376534A1; WO2004031222A2; MA27474A1; US20070264283A1; RU2005109155A; CN100393878C; NO20051561D0

Description

200411055 玖、發明說明：【發明所屬之技術領域】本發明係關於可用來治療和預防人類乳頭狀瘤病毒感染的方法和組合物。本發明特別關於編碼以得自不同HP V品系的早期抗原為基礎之多蛋白的代表性核酸分子，和適合 DNA疫苗遞送的載體，以及含有其之醫藥組合物。亦包括製造該分子的方法、載體和組合物。【先前技術】乳頭狀瘤病毒是高度組織和物種專一的。其感染基底的上皮細胞’並在細胞核内複製並完成其完整的生命周期。病毒的基因表現與上皮細胞分化緊密連接，且衣殼的組裝和成熟僅發生在上皮細胞層之完全分化的上皮細胞内。以生殖器旎出現之感染人類的乳頭狀瘤病毒基因型，已知是基因型6b或基因型11。大多數（約90%)的生殖器疣是被 HPV6b感染，而大約1〇%是被hpv-u感染。以與子宮頸癌者關之感染出現的原發性感染基因型是HPV16和18。人類生殖器疲可在感染的位置發展，且其亦可成為慢性的、長期持續或可自發地退化而完全消退，不留下抱痕。尚未定義引起該退化的因素，但假設細胞反應可能涉及疾病的消退過程。乳頭狀瘤病毒天然並不是極具免疫原性的，且在天然感染的過程中，抗體僅在很晚期（在消退期間或之後）和部分的患者中出現，而有些患者可能消退疾病，但完全沒有發展出可檢測到的抗體。 88379 200411055 在數個不同的動物模式系統中，已經廣泛地研究使用乳頭狀瘤病毒早期抗原的疫苗接種。然而，僅有少數的報告研究治療性免疫作用。例如，以包括牛乳頭狀瘤病毒（BPV) 蛋白質El、Ε2、Ε4和Ε7之蛋白質的雞尾酒治療性地免疫牛，顯示與對照組相比較，在動物族群中降低了乳頭狀瘤疾病的負擔。已經在各種物種中，包括绵羊、狗、兔子、猴子、牛和馬，觀察到乳頭狀瘤病毒的感染。已經將人類的乳頭狀瘤病毒（HPV)分類成 80 型以上[Epidemiology and Biology of

Cervical Cancer Seminars in Surgical Oncology 1999 16:203-211. Wolfgang MJ，Schoell MD，Janicek MF 和 Mirhashemi R.]，以DNA序列同種性的程度為基礎，將其中一些進一步細分為亞-型（例如6a和6b型）。乳頭狀瘤病毒通常感染上皮，但不同的HP V型引起不同的疾病。例如，1 -4、 7、10和 26_29型引起良性的疣，16、18、31、33、35、39' 45、51、52、56、58、59和68型則與子宮頸癌有關，而6和 11型涉及生殖器疣（生殖道之非-惡性的濕疣）。已經證實HPV不易在組織培養中生長，所以沒有傳統活的或減毒的病毒疫苗。亦已經因為缺乏可在其中研究人類病毒之適當動物模式，而減緩了 HPV疫苗的發展。這是因為病毒是高度物種專一的，所以利用得自不同物種之宿主的乳頭戒瘤病毒，非常不易感染動物，因此在首次在人類身上試驗疫苗之前，需要安全性測試。乳頭狀瘤病毒具有編碼命名為E1至E7、L1和L2in早期’· 200411055 和π晚期’’基因的DNA基因組。早期基因序列已經顯示具有與病毒DNA複製和轉錄、躲避宿主免疫力，以及改變正常宿主細胞周期和其他過程有關的功能。例如，E1蛋白質是 ATP-依賴性DNA解螺旋酶，並涉及病毒DNA複製過程的發動，而E2是調節蛋白質，控制病毒基因表現和DNA複製。經由其與E1和病毒複製起點結合的能力，E2引起E1在起點的局部濃縮，因此刺激病毒DNA複製的發動。E4蛋白質好像有許多未完全定義的功能，但其中可與宿主細胞之細胞骨架結合，而E5似乎延遲内囊胞的酸化作用，結果增加了 EGF受體在細胞表面的表現，並已知E6和E7兩者分別與細胞蛋白質p53和pRB結合。已知得自與子宮頸癌有關之HPV 型的E6和E7蛋白質是致癌基因。L1和L2編碼兩個病毒結構 (衣殼）蛋白質。在歷史上，已經將疫苗視為一種預防病原體感染的方法，使免-疫系統認得應該發生感染的病原體，並中和之。疫苗包括一或多個得自病原體的抗原，通常是完整的生物，殺死的或為減弱（減毒）之形式，或得自生物之所選用的抗原性肽。當免疫系統暴露在抗原（們）下時，產生在個體的一生中保有免疫學”記憶π的細胞。後續暴露在相同的抗原下時（例如當被病原體感染時），刺激特定的免疫反應，其結果導致感染原的排除或失活。免疫犮應有兩樣武器：體液（抗體）反應和細胞-調解的反應。在被感染之宿主細胞内，加工處理衍生自在細胞内複製之病原體（病毒和一些細菌）的蛋白質抗原，釋放出短肽， 200411055 接著將其展現在被感染的細胞表面上，與第1類主要組織相容性分子(MHC I)結合。當該MHC I和肽的結合複合體與抗原-專一之CD8+ T-細胞接觸時，激活該T-細胞，獲得胞毒活性。這些胞毒性T-細胞（CTLs)可溶解被感染的宿主細胞，所以限制了感染病原體的複製和散播。免疫反應的另一個重要武器是由CD4+ T-細胞控制。當將衍生自病原體的抗原釋放置細胞外環境内時，它們可被特化的提供-抗原之細胞（APCs)攝取，並展現在這些細胞的表面上，與MHC II 分子結合。認出在該複合體中之抗體，刺激CD4+ T-細胞分泌可溶性因子（細胞激動素），其調節其他T-細胞的效應物機制。抗體是由B-細胞產生。抗原與分泌出之抗體的結合可中和病原體的感染力，而抗原與在B-細胞表面上與膜結合之抗體的結合，刺激B-細胞分裂，如此擴大了細胞反應。一般而言，控制細菌感染需要良好的抗體反應，而控制病毒感染則需要抗體和細胞-調解反應（CD8+和CD4+)兩者。咸相信有可能藉著疫苗接種來利用免疫系統，即使是在被病毒感染之後，以便藉著病原體的失活或排除，控制或消退感染。這類M治療性的’’疫苗將需要有效的細胞-調解反應，且按照理想地將發動體液和細胞-調解之免疫反應。已經證實（Benvenisty，N和 Reshaf，L. PNAS 83_ 9551-9555) 以磷酸鈣沉澱之DNA接種老鼠，結果表現出由該DNA編碼的肽。接"著，將尚未沉澱之質體DNA肌肉内注射至老鼠内，顯示將該DNA攝入肌肉細胞内，並表現編碼蛋白質的結果。因為DNA的表現，導致在宿主細胞内產生經過編碼之 200411055 病原體蛋白質，像在自然的感染中，該機制可刺激治療性疫苗接種所需的細胞-調節之免疫反應。在w〇9〇/丨丨〇92中描述了 DNA疫苗（vical，Inc.)。可藉著肌肉内注射以外的機制，遞送DNA疫苗。例如，遞送至皮膚内，利用免疫機制在為感染之障礙的組織，像是皮膚和黏膜中，是具有高度活性的事實。可經由注射、噴射注射（其在壓力下迫使液體進入皮膚内），或經由顆粒撞擊，遞送至皮膚内，其中可以足夠的濃度將DNa塗覆在顆 t上以便男穿上皮（美國專利第5 3 71015號）。這些顆粒發射至皮膚内，結果直接轉移感染上皮細胞和上皮蘭格漢 (Langerhan)細胞。蘭格漢細胞是提供抗原的細胞（Apc)，其 k入DNA，表現編碼之肽，並加工處理這些，以便展現在細胞表面MHC蛋白質上。經過轉移感染的蘭格漢細胞移動至淋巴結，在那裡它們將已經展現的抗原片段提交給淋巴細胞，發動免疫反應。經由顆粒遞送至皮膚内誘發免疫反應，需要極少量的DNA (0.5-1微克），與已知在直接肌肉内 /主射之後產生免疫反應所需之愛克用量的Dna顯然有別。已經在例如使用由L1和L2衣殼蛋白質形成之類病毒顆粒，或僅使用這些蛋白質的研究（1)中，報告Hpv具有不佳的免疫原性。此外，已經證實HPV基因不易在人類或其他哺乳動物細胞中表現，導致在發展蛋白質次單元疫苗上的困難。已經證實單順反子（monocystronic) E1對於在哺乳動物中由異種的啟動基因來表現，是特別有抵抗力的斤

Virology 1999 73, 3062-3070。Remm m，Remm a及Mart Ustav· 88379.doc -10- 200411055 藉著不連續的掃描機制，從多順反子mRNA轉譯人類乳頭狀瘤病毒 18 型 El (Human papilloma virus type 18 El is translated from polycistronic mRNA by a discontinuous scanning mechanism))。最常使用含有HPV起點之質體的活體外DNA複製作為代用品，檢測El的表現（Lu，JZJ，Sun等人 J. Virol 1993 67，713 1-7139和 Del Vecchio AM等人 J. Virol 1992 66, 5949-5958) 〇國際專利申請案WO 02/08435提供了 HPV多核甞酸，其中已經使該序列最優化，類似高度表現之人類基因使用率圖案。特別揭示最優化的密碼子HPV 6b E1和HPV 11 E2。【發明内容】本發明提供新穎的核酸構築體，其可用來預防，更特定而言可用來治療人類乳頭狀瘤病毒引起之生殖器疣，或其他HPV引起的後果。根據本發明的第一項觀點，提供編碼含有得自至少兩‘ 不同早期抗原之抗原決定位的多蛋白之核酸構築體。本發明最好提供編碼包括得自三個不同早期抗原之抗原決定位的多蛋白之核酸構築體。已經藉由本發明顯示這類構築體在動物模式中，比單一蛋白質方法更有效。【實施方式】較佳的構築體包括編碼得自兩個不同HP V基因型之E2的核酸，像是HPV6b和得自HPV-11之E2。此外，若出現E1編碼序列也是較佳的。E1最好是得自HPV 6或11。較佳的構築體包括具有下列排列的核酸分子： 88379 -11 - 200411055 1) HPV6bEl-HPV6bE2-HPVllE2 2) HPV6bE2-HPV6bEl-HPVllE2 3) HPV6bE2-HPVl lE2-HPV6bEl 最佳的是，所有上述多蛋白的核酸序列都已經是最優化的密碼子，類似高度表現之人類基因的密碼子使用率。E1 和E2基因較好是實質上全長的，或更佳的是全長的。實質上全長的意指編碼至少85%，較佳的是90%的E1和E2多肽。令人驚訝的是，這類構築體表現出與最優化密碼子之個體蛋白質相等的表現程度，並具有編碼多蛋白之單一質體的優點，即比三個個別質體更便宜且更容易製造。這些基因最好是最優化的密碼子，使得密碼子使用率圖案類似肌動蛋白，一種高度表現的人類基因產物。多核苷酸序列可以是DNA序列，例如雙股的DNA序列。該多核苷酸序列較好編碼HPV6、11、16、18、33或45型，最好是11型、6a亞型或6b亞型的HPV多肽。在某些具體實施例中，編碼之胺基酸序列是野外型HP V胺基酸序列。在另一個具體實施例中，編碼之胺基酸序列是突變的HP V胺基酸序列，包括帶有胺基酸改變的野外型序列，例如胺基酸點突變，足以降低或使該多肽之一或多個天然生物功能失活。仍希望突變之胺基酸序列保留野外型多肽的免疫原性。由本發明之多核苷酸編碼的蛋白質，亦形成本發明之觀點。在E1的案例中，主要的生物學角色是在被感染的細胞中，發動病毒專一的DNA複製。最好是使E1突變，而使其 88379 -12- 複製效能失活。

較佳的突變是：G 482 D

K 83 G R 84 G 較佳的是包括二或多個突變。最佳的是包括3個突變。杜的茉例中咬疋興核蛋主要複製起點認知蛋白質—樣的广δ的位置，具有舊製複入1㈣功能，並有助於前-起始福 t複口目豆的裝配。最好是使Ε2 較佳突變是Κ111Α。 μ失活。達成該目標的根據本發明的—项觀點，多核|酸之密碼子使用率圖案最好排除在人財高度表現之基因中，具有麟0.2之RSCU ^的密碼子。相對同義密碼子使用率（rscu)值是觀察到之密碼子總數’除以若胺基酸以同㈣率使料有密碼子時的預期數。本發明之多料酸通常將具有超過Q3之高度表現 < 人類基因的密碼子使用率係數，較佳的是超過〇 4，最好疋超過0·5。根據本發明的第二項觀點，提供包括其之表現載體，並能夠指揮根據本發明之多核苷酸序列的表現，孩多核甞酸編碼具有得自二或多個早期抗原之抗原決定位的多肽。該載體適合用來駕馭異種DNA在細菌、昆蟲或哺乳動物細胞中的表現，特別是人類細胞。在一個具體實施例中，該表現載體為p7313PLc。在更進一步的觀點中，本發明提供包括本發明之蛋白質或載體，或多核苷酸序列的疫苗組合物。該疫苗組合物最 88379 -13 - 200411055 好包括根據本發明之DNA㈣。在較㈣具时施例中，該疫苗組合物包括多個以包括含有多㈣酸序列之載體的舰塗覆之顆粒，最好是金顆粒，該多核誓酸序列係編碼具有得自二或多個早期抗原之抗原決定位的纽。在另外的具體實施例中，該疫苗組合物包括在藥學上可接受之賦形劑，以及根據本發明第二項觀點的職載體。該疫苗組合物亦可包括佐劑。在更進-步的觀點中，本發明提供製造疫苗組合物的方法，包括建構編碼具有得自二或多個早期抗原之抗原決定位的多肽之乡财酸，錢用在藥學上可接受之賦形劑調配。亦提供根據本發明之多核苷酸或載體，在治療或預防 HPV感染上的用途，最好是刪6、n、i6_型的感染。本發明亦提供根據本發明之多核#酸或載體，在治療或預防皮膚（皮膚）疲生殖器疲、未判定重要性之非典型鱗狀細胞（ASCUS)、子宮頸發育異常、子宮頸上皮内贅生物（cin) 或子S頸癌上的用途。因此，本發明亦提供根據本發明之多核甞酸或載體，在製造用來治療或預防HPV感染或任何與其有關之症狀或疾病之疫苗上的用途。本發明亦提供治療或預防HPV感染或任何與其有關之症狀或疾病的方法，包括投予有效含量的根據本發明之蛋白質、多核甞酸或載體，或疫苗。疫苗的投予，可採用一或多個個別劑量的形式，例如以，，基礎_補強，，的攝生法。在某些案例中，"基礎”疫苗接種可經*DNA疫苗遞送，特別是 88379 -14- 200411055 經由根據本發明之多核:y：酸的顆粒調節之DNA遞送，最妤併入質體-折生的載體内’並藉著投予包括相同多核甞酸序列的重組病毒載體”補強”。或者，蛋白質佐劑法可擔任基礎或補強法的一部分，使DNA遞送成為基礎_補強攝生法的另一助力（該蛋白質與由DNA編碼之蛋白質相同）。在本說明書和附錄的申請專利範圍中，將”包括"和，，包含，，一字，以及諸如此類的變化，解釋為包括。即這些字在前後文容許之處，企圖傳達可能包括其他未特別列舉的元件或成分。 ’·變體"一詞意指編碼與本發明之其他多核苷酸相同之胺基酸的多核苷酸，但因其經過冗長的遺傳密碼，故有不同的核苷酸序列，卻仍維持相同的密碼子使用率圖案，例如具有與其他多核苷酸相同的密碼子使用率係數，或在〇1 内’較好是在0.05内的密碼子使用率係數。 ’·密碼子使用率圖案π —詞意指在正在討論中之核荅酸^ 列、基因或基因種類（例如高度表現之哺乳動物基因）中，所有密碼子的平均頻率。可在文獻中找到哺乳動物，包括人類的密碼子使用率圖案（參見，例如Nakamura等人Nucleic Acids Research 1996, 24:214-215)。在本發明的多核誓酸中，將密碼子使用率圖案，從人類乳頭狀瘤病毒的代表圖案，改為更密切代表人類偏愛的密碼子圖棄。”密碼子使用率係數”是特定多核甞酸序列的密碼子圖案有多麼類似標靶物種的測量值。至於許多物種的高度表現基因，密碼子頻率可衍生自文獻來源（參見，例如 88379 -15- 200411055

Nakamura等人Nucleic Acids Research 1996，24.214-215)。對於20個天然胺基酸的每一個，將61個密碼子中每一個的密碼子頻率標準化（以在所選擇之基因種類的每1〇〇〇個密碼子中出現的數目來表示）’將每個胺基酸最常使用之密碼子的值設足為1，並將較少見之密碼子的頻率按比例放在〇到工之間。因此，對於標靶物種之高度表現的基因，分別指派 61個密碼子1或較低的值。為了計算特定多核甞酸的密碼子使用率係數，相對於該物種的高度表現基因，記錄特定多核菩酸每個密碼子的按比例值，並取得所有這些值的幾何平均值（藉著將這些值之自然對數的總和除以密碼子之總數，再取得反-對數）。係數將具有在〇到丨之間的值，且係數越高，則在該多核苷酸中就有越多的密碼子是常用的密碼子。若多核謀酸序列具有1之密碼子使用率係數，則所有的密碼子均是標靶物種之高度表現基因”最常用的，，密碼子。較短的-多核甞酸序列亦在本發明的範圍内。例如，本奏明之多核甞酸可編碼HPV蛋白質的片段。只要證實該多枋苷酸所編碼之多肽具有HP V抗原性，便將編碼長度為至少8 個，例如ι-ίο個胺基酸，或高達20、50、60、7〇、8〇、m 150或200個胺基酸之片段的多核甞酸，視為落在本發明的範圍内。本發明之觀點，特別但並非唯一地包括當多核苷酸編碼完整HP V蛋白質序列的片段，並可代表該蛋白質之一或多個個別抗原決定位的狀況。如同上文討論的，本發明包括表現載體，其包括本發明之核誓酸序列。可以分子生物學之技藝例行地建構這類表 88379 -16· 200411055 現載體，並可能涉及例如質體dna，以及適當之起始物、啟動基因、促進子和其他元件的使用，像是例如可能是必要的聚腺苷酸化作用信號，其位在正確的方位，以便容許蛋白質表現。其他適當的載體，對熟諳此藝者而言將是明顯的。關於這一點，憑藉更多的實例，我們參考Sambrook 等人Molecular Cloning: a Laboratory Manual.第 2版，CSH Laboratory Press· (1989) 〇較佳的是，本發明之多核苷酸，或在本發明中在載體中使用的多核甞酸，以可操作之方式與控制序列連接，其能夠提供由宿主細胞表現密碼序列，即該載體為表現載體。 π以可操作之方式連接’’ 一詞意指並列，其中所述的組份是以容許它們以其想要之方式發揮功能的關係。以這樣的方式安置與密碼序列’’以可操作之方式連接的”調節序列，像是啟動基因，以便在可與該調節序列相容的條件下達成密碼序列的-表現。載體可以是例如質體、人造的染色體、病毒或噬菌體載體，其提供複製起點，可視需要提供用來表現該多核甞酸的啟動基因，並可視需要提供該啟動基因的調節者。載體可含有一或多個可選擇標記基因，例如在細菌質體之案例中為氨苄青黴素或康黴素抗藥性基因，或可供真菌載體使用的抗藥性基因。可在活體外使用載體，例如用來產製DN A 或RN A「或用來轉移感染或轉化宿主細胞，例如哺乳動物宿主細胞。亦可改編載體，以供在活體内使用，例如在DNA 疫苗接種或基因治療的方法中。 88379 -17- 200411055 可選擇與企圖在其中表現之宿主細胞可相容的啟動基因及其他表現調節信號。例如，哺乳動物啟動基因包括金屬硫肽啟動基因，其可反映諸如鎘之類的重金屬而被謗發，以及β-肌動蛋白啟動基因。亦可使用病毒啟動基因，像是 SV40大Τ抗原啟動基因、人類細胞巨大病毒（CMV)速發早期 (ΙΕ)啟動基因、勞氏肉瘤病毒LTR啟動基因、腺病毒啟動基因，或HP V啟動基因，特別是HP V上游調節區（URR)。所有的這些啟動基因均為此項技藝中可輕易獲得的。適當之病毒載體的實例，包括單純疱疹病毒載體、牛痘病毒或α-病毒載體，以及逆轉錄病毒，包括慢病毒、腺病毒和腺病毒伴隨病毒。使用這些病毒的基因轉移技術，為熟諳此藝者已知的。例如，可使用逆轉錄病毒載體，將本發明之多核甞酸穩定地整合到宿主基因組内，雖然這類重組作用並不是較佳的。相反地，複製-缺陷腺病毒載體仍然是附加體，並因此容許暫時性的表現。可使用能夠在昆^ 細胞中（例如桿狀病毒載體）、在人類細胞或在細菌中駕馭表現的載體，以便定量產生由本發明之多核甞酸編碼的HP V 蛋白質，例如用來作為次單元疫苗。較佳的病毒載體是衍生自非-人類靈長動物腺病毒的那些，像是C68黑猩猩腺病毒（美國專利第6,083,716號），在他處則稱為Pan 9。在發現本發明之多核甞酸是用來作為治療劑之處，例如在接種D_NA疫苗時，將該核酸投予哺乳動物，例如欲接種疫苗的人。以載體之形式提供核酸，像是RNA或DNA，最妤是DN A，像是上述的那些，其可在哺乳動物的細胞中表 88379 -18 - 200411055 現。可藉著任何可利用的技術投予該多核苷酸。例如可藉著、十員/主射，瑕好是皮内、皮下或肌肉内，導入核酸。或者’可使用核酸遞送裝置，像是顆粒-調節的DNA遞送 (PMDD)，直接越過皮膚遞送核酸。在該方法中，以核酸塗覆惰性的顆粒（像是金小珠），並加速至足以使其貫穿接受者表面（例如皮膚）的速度，例如藉著在高壓下從投射裝置中發射（以本發明之核酸分子塗覆的顆粒，亦在本發明的範圍内，像裝載這些顆粒的裝置一樣）。將裸露的多核甞酸或載體導入患者内的適當技術，包括以適當的媒劑局部塗覆。可將核酸局部投予至皮膚，或至黏膜表面，例如藉著鼻内、口服、陰道内或直腸内投予。裸露的多核苷酸或載體可與在藥學上可接受之賦形劑一起提供，像是磷酸緩衝的生理鹽水（PBS)。可藉著在組合物中加入促進劑，像疋布比卡因（bUpivacaine)，進一步促進Dna 的攝取。其他將核酸直接投予接受者的方法，包括超音波-、電刺激、電穿透作用，以及在美國專利第5,697,9〇1號中揭示的顯微播種。可藉著數個已知的轉移感染技術，例如包括使用轉移感染劑的那些，提高核酸構築體的攝取。這些製劑的實例包括陽離子性製劑，例如磷酸鈣和DEAE_葡聚糖和脂染體 (lipofectants) ’ 例如月曰染坦（lipofectam)和轉染坦（transfectam) 。可改變欲投予之核酸的劑量。通常以範圍在〗微微克到j 毫克的用量，投予核酸，關於顆粒調解之基因遞送，最好是1微微克到10微克，至於其他的路徑，則是10微克到1毫 88379 •19- 200411055 克。亦可藉著在基因療法中使用的特化遞送載劑，投予本發明之核酸序列。例如，由Verme等人，Nature 1997，389:239·» 242討論了基因治療方法。以病毒為基礎的系統包括逆轉錄病毒、慢病毒、腺病毒、腺病毒伴隨病毒、疱疹病毒、以金絲雀痘（CanaryP〇x)和牛痘病毒為基礎的系統。以非_病毒為基礎之系統包括直接投予核酸和以微脂粒為基礎的系統。亦可藉著經過轉化的細胞，投予本發明之核酸序列。這類細胞包括獲自個體的細胞。可在活體外將本發明之裸露的多核甞酸或載體導入這類細胞中，稍後可將經過轉化的細胞送回個體内。可藉著同種重組事件，將本發明之多核苷酸整合到已經出現在細胞中的核酸内。若需要，可使經過轉化的細胞在活體外生長，並可在本發明中使用一或多個所得到的細胞。可藉著已知的手術或顯微手術技術（例如移植、顯微注射等等），提供在患者之適當位置處的細胞。本發明之疫苗組合物可包含佐劑化合物，其可用來增加由蛋白質本身，或由質體DNA編碼之蛋白質謗發的免疫反應。雖然在本文中提出改變密碼子的偏愛，使其適合接種疫苗的物種，作為增加表現並藉此補強免疫反應的方法，但可能仍然想要佐劑，因為雖然DNA疫苗在老鼠模式中有順利運轉的傾向，但有在較大的物種，像是非_人類靈長類中效力稍微較弱的證據，認為這是在人類中有類似效力的預告。 88379 -20 - 200411055 本發明之疫苗組合物亦可包括佐劑，像是例如在具體實施例中的咪峻莫（imiquimod)、投克爾索（tucaresol)或明礬。最好與本發明同時投予佐劑，且在較佳的具體實施例中，與本發明一起調配。本發明期待的這類佐劑，包括但不限於下列的一覽表，且不排除其他的製劑··合成的咪唑并ττ奎淋，像是咪4莫[S_26308，R-837](Harrison等人單獨使用咪喳莫或與糖蛋白疫苗併用，降低再發的HSV疾病 (Reduction of recurrent HSV disease using imiquimod alone or combined with a glycoprotein vaccine), Vaccine 19:1820-1826，（2001)))，·以及瑞喜峻莫（resiquimod)[S-28463，R-848] (Vasilakos等人佐劑激活免疫反應修改劑R-848:與CpG ODN 相比較（Adjuvant activates of immune response modifier R_848: Comparison with CpG ODN)1, Cellular immunology 204: 64-74 (2000).)，羰基的西福鹽基和胺類，其在組成上表現在提供抗原之細胞和T-細胞表面上的，像是投克爾索 (Rhodes，J.等人藉著共同刺激之形成西福鹽基的藥物，免疫系統之治療效力（Therapeutic potentiation of the immune system by costimulatory Schiff-base-forming drugs), Nature 377: 71-75 (1995))，細胞激動素、化學激動素和共同-刺激之分子，Thl謗導物，像是干擾素γ、IL-2、IL-12、IL-15和 IL-18，Th2謗導物，像是IL-4、IL_5、IL-6、IL-10和 IL_13，以及其他化學激動素和共同-刺激基因，像是MCP-1、 ΜΙΡ_1α、-ΜΠΜβ、RANTES、TCA-3、CD80、CD86和 CD40L，其他免疫刺激的標靶配體，像是CTLA-4和L-選擇蛋白，細胞凋零刺激蛋白質和肽類，像是Fas，（49)，以合成之脂質為 88379 -21 - 200411055 基礎的佐劑，像是維克司菲克汀（vaxfectin)，（Reyes等人， ’維克司菲克汀提高了抗原專一的抗體力價，並維持對質體 DNA 免疫的 Thl 型免疫反應（Vaxfectin enhances antigen specific antibody titres and maintains Thl type immune responses to plasmid DNA immunization)’，Vaccine 19: 3778-3 786)、角鯊烯、a-生育酚、多乙氧基醚80、DOPC和膽固醇、内毒素、[LPS]、（Beutler，B·，’内毒素、類-Toll受體4和傳入肢的先天免疫力（Endotoxin， Toll-like receptor 4, and the afferent limb of innate immunity)’， Current Opinion in Microbiology 3: 23-30 (2000)) ; CpG寡-和二·核苷酸（Sato, Y. 等人，’有效皮内基因免疫所需的免疫刺激之DNA序列 (Immunostimulatory DNA sequences necessary for effective intradermal gene immunization)’，Science 273 (5273): 352-354 (1996)。Hemmi，H·等人，，類-Toll受體認出細菌的DNA(A Toll-like receptor recognizes bacterial DNA)’，Nature 408: 740-745,（2000))，以及其他有效的配體，其誘發Toll受體產生Thl-謗導之細胞激動素，像是合成的分枝桿菌脂蛋白、分枝桿菌蛋白pl9、肽聚糖、磷壁酸質和脂質A。主要謗起Thl -型反應的某些較佳佐劑，包括例如脂質a 衍生物，像是單鱗酸脂質A，或較佳的是3-脫醯化之單磷酸脂質 A。MPL®佐劑可獲自 Corixa Corporation(Seattle， WA ;參見例如美國專利第4,436,727號；4,877,611號； 4,866,034號和4,912,094號）。含有CpG之寡核嘗酸（其中該 CpG二核钵酸是未被甲基化的）亦主要誘導Thl反應。已知並在例如 WO 96/02555、WO 99/33488和美國專利第 6,008,200 88379 -22- 200411055 號和5,856,462號中描述了這類寡核苷酸。亦由例如Sato等人，Science 273··352, 1996,描述了免疫刺激性的DNA序列。、其他較佳的佐劑包括皂角嘗，像是Quil Α或其衍生物，包括 QS21 和 QS7 (Aquila Biopharmaceuticals Inc., Framingham, ΜΑ);七葉素（Escin);毛地黃皂苷；或絲石竹（Gypsophila) 或昆諾棻（Chenopodium quinoa)皂角甞。在具體實施例中，佐劑包括免疫刺激性之CpG寡核苷酸，像市在（WO 96102555)中揭示的。代表性的免疫刺激性寡核茫酸，長度在8-100個鹼基之間，並包括通式XiCpGX2，其中Xi.Xa是核苷酸鹼基，且C和G是未被甲基化的。用在本發明之佐劑或疫苗中較佳的寡核苷酸，較好含有二或多個二核苷酸CpG基序（motif)，較好被至少三個，較佳的是至少六或多個核苷酸分開。本發明之寡核甞酸通常是脫氧核甞酸。在較佳的具體實施例中，在寡核苷酸中的核苷酸間鍵結是二硫代磷酸鹽，或更佳的是硫代磷酸鹽键結，雖然磷酸二酯和其他的核苷酸間鍵結亦在本發明的範圍内，包括帶有混合核甞酸間鍵結的寡核苷酸。亦可使用其他使寡核甞酸穩定的核甞酸間鍵結。在美國專利第 5,666，153號、美國專利第5,278,3 02號和〜〇 95/26204中描述了產製硫代磷酸鹽寡核苷酸或二硫代磷酸鹽的方法。較佳之寡核甞酸的實例，具有下列的序列。該序列最好含有硫代磷酸鹽修改的核甞酸間键結。寡 1 : TCC ATG ACG TTC CTG ACG TT (CpG 1826)(序列識別24號） 88379 -23 - 200411055 寡2 : TCT CCC AGC GTG CGC CAT (CpG 1758)(序列識別 25 號）— 寡 3 : ACC GAT GAC GTC GCC GGT GAC GGC ACC ACG (序列識別26號）寡4 : TCG TCG TTT TGT CGT TTT GTC GTT (CpG 2006)(序列識別27號）寡 5 : TCC ATG ACG TTC CTG ATG CT (CpG 1668)(序列識別28號）另一種CpG寡核苷酸可包括上文的較佳序列，即其具有對其不重要的刪除或添加。可藉著此項技藝中已知的任何方法（例如歐洲專利第 468520號），來合成在本發明中使用的CpG寡核苷酸。可便利地使用自動合成器，合成這類寡核嘗酸。含有CpG寡核嘗酸的佐劑調配物，可以'’ImmunEasy’’之商標名稱購自 Qiagen 〇 - 下列的實例係進一步解釋本發明，並參考附錄的圖片。 1.質體：pWRG7077 6be2 c/o突變的感興趣的基因： HPV6be2基因的尺寸約為1 · 1 Kb，並使用叫做Syngene的視覺基本程式創造密碼子最優化序列（對人類表現而言）。此外，該序列在胺基酸位置111處包括密碼子改變，藉以將在野外型中的離胺酸殘基（AAG)改為丙胺酸殘基（GCA)，創造突變的基因。該改變使6be2的轉錄活性失活。按照所設計的，利用在5’和3’端選出的限制位置，將重疊的引子併入完 88379 -24- 200411055 整的基因内。選殖：以凝膠純化1.1 kb的PCR片段，並以限制酵素Not I和Bam HI消化，以便連接到載體PWRG7077 (Powderject)内。該基因在完整的速發早期CMV啟動基因的控制之下’並具有牛生長荷爾蒙聚A尾。定序該純種系，指出許多的驗基錯誤。藉著限制消化’ 確認許多能夠建構正確基因序列的純種系。從再度-選殖中，發現一個純種系C7僅在位置497處具有一個鹼基對錯誤 (丁至C)。其他純種系在該處是沒問題的，而正好需要一個簡單的片段交換，修正該錯誤。證實最終的純種系C7a是密碼子最優化的突變6be2 (參見圖2)。在PWRG7077中的6be2序列（序列識別1號）

ATGGAAGCTATTGCCAAGCGACTGGACGCCTGCCAGGAGCAGCTGCTGGAGCTGTACGA GGAAAACAGCACAGACCTCCACAAGCACGTGCTGCACTGGAAGTGCATGCGCCACGAGT-

CAGTGCTCCTGTACAAGGCCAAGCAGATGGGGCTGTCCCACATCGGGATGCAGGTCGTG

CCCCCGCTGAAGGTGAGCGAAGCCAAGGGCCACAACGCTATCGAGATGCAGATGCACCT

GGAGAGCCTGCTGCGGACCGAATACAGCATGGAGCCCTGGACTCTCCAGGAGACGTCCT

ACGAAATGTGGCAGACTCCTCCGAAGCGCTGTTTCGCAAAGCGCGGCAAGACAGTTGAG

GTGAAATTCGATGGGTGCGCAAACAACACGATGGACTACGTGGTGTGGACCGATGTCTA

CGTGCAGGACAATGACACCTGGGTGAAGGTACATAGTATGGTGGATGCCAAGGGCATCT

ATTACACCTGCGGGCAGTTCAAGACGTACTACGTCAACTTCGTCAAGGAAGCCGAAAAG

TATGGTTCCACCAAGCACTGGGAGGTGTGTTACGGGAGTACTGTGATCTGCAGCCCCGC

CTCCGTGTCGTCCACCACCCAGGAAGTGAGCATTCCGGAGAGCACCACATACACCCCGG

CCCAAACGAGCACGCTCGTCAGCAGCAGCACCAAGGAGGACGCCGTCCAGACGCCCCCC

CGGAAGAGGGCCCGGGGGGTCCAGCAGTCTCCCTGCAATGCCCTGTGCGTTGCTCACAT

CGGCCCTGTCGATTCTGGGAACCACAATCTCATCACGAACAACCACGACCAGCACCAAA

GGCGCAACAACTCTAACAGCTCCGCAACTCCAATAGTGCAGTTCCAGGGGGAGTCCAA.C

TGCCTCAAGTGTTTCCGCTACCGCCTCAACGACCGCCACCGCCACCTGTTCGACTTGAT

CAGTTCCACGTGGCACTGGGCCAGCAGCAAGGCGCCCCACAAACACGCTATCGTGACGG

TGACCTACGACTCCGAGGAGCAGAGGCAGCAGTTCCTGGACGTCGTGAAGATTCCTCCG

ACAATCAGCCACAAGCTTGGCTTCATGTCCCTGCACCTGCTGTGA -25 - 88379 200411055 胺基酸序列（序列識別2號）

MEAIAKRLDA CQEQLLELYE ENSTDLHKHV LHWKCMRHES VLLYKAKQMG LSHIGMQWP PLKVSEAKGH NAIEMQMHLE SLLRTEYSME PWTLQETSYE MWQTPPiCRCF AKRGKTVEVK FDGCANNTMD YWWTDVYVQ DNDTWVKVHS MVDAKGIYYT CGQFKTYYVN FVKEAEKYGS TKHWEVCYGS TVICSPASVS STTQEVSIPE STTYTPAQTS TLVSSSTKED AVQTPPRKRA RGVQQSPCNA LCVAHIGPVD SGNHNLITNN HDQHQRRNNS NSSATPIVQF QGESNCLKCF RYRLNDRHRH LFDLISSTWH WASSKAPHKH AIVTVTYDSE EQRQQFLDW KIPPTISHKL GFMSLHLL 2.質體：p7313plc 6bel c/o mut 感興趣的基因： HPV6bel基因的尺寸約為2 Kb，並使用叫做Syngene的統計視覺基本程式創造密碼子最優化的野外型（wt)(對大腸样菌和人類表現而言）。按照所設計的，利用在51和3’端選出的限制位置，將重疊的引子併入完整的基因内。然後以Bam HI和Not I限制酵素消化合成的基因，以便連接到載體pCIN4 内。從許多選出之純種系的定序資料中，發現許多鹼基錯誤。藉著在p7313-plc内，混合得自純種系#24的正確Pst I-BamHI片段和得自純種系#21的Notl-Pstl片段，產生正確的純種系。藉著定序證實正確的純種系（#1)。為了突變生成作用，設計改變下列胺基酸的引子：在位置83處將離胺酸 (AAA)改為甘胺酸（GGA)，在位置84處將精胺酸（CGC)改為甘胺酸（GGC)，並在位置482處將甘胺酸（GGC)改為天冬醯胺（GAC) 〇 6be 1密碼子最優化的突變序列（序列識別3號）

ATGGCAGACGATTCCGGTACTGAGAACGAAGGTTCTGGTTGTACCGGTTGGTTCATGGT

TGAAGCAATCGTTCAGCATCCGACTGGTACCCAGATCTCCGATGACGAAGACGAAGAAG

TTGAAGATTCTGGTTACGACATGGTTGACTTCATCGATGACTCCAACATCACTCATAAC -26- 88379 200411055

TCTCTGGAAGCACAGGCTCTGTTTAACCGCCAGGAAGCTGATACCCATTACGCTACTGT

TCAGGACCTGGGAGGCAAATATCTGGGCTCTCCGTACGTTTCCCCGATCAACACTATCG

CAGAAGCAGTTGAGTCTGAAATCTCCCCGCGCCTGGACGCTATCAAACTGACTCGTCAG

CCGAAGAAGGTTAAACGTCGTCTGTTCCAGACTCGTGAACTGACCGACTCCGGTTACGG

TTATAGCGAAGTTGAGGCTGGCACCGGCACCCAGGTTGAAAAACACGGTGTACCGGAAA

ACGGCGGCGACGGTCAGGAAAAGGACACCGGCCGCGACATCGAGGGTGAGGAACACACC

GAAGCTGAAGCTCCGACTAACTCTGTTCGTGAACACGCAGGTACTGCGGGTATCCTGGA

ACTGCTGAAATGCAAAGACCTGCGCGCGGCTCTGCTGGGCAAATTCAAAGAATGCTTCG

GCCTGTCTTTCATTGACCTGATCCGTCCGTTTAAGTCTGACAAAACTACCTGTCTGGAC

TGGGTTGTAGCAGGCTTCGGCATCCACCACTCTATCTCTGAAGCATTCCAGAAA.CTGAT

CGAGCCGCTGTCTCTGTACGCGCACATCCAGTGGCTGACTAACGCTTGGGGTATGGTTC

TGCTGGTACTGCTGCGCTTTAAAGTAAACAAATCTCGTTCCACTGTTGCTCGTACTCTG

GCTACCCTGCTGAACATCCCGGAGAACCAGATGCTGATCGAACCGCCGAAAATCCAGTC

TGGTGTAGCTGCACTGTACTGGTTTCGTACTGGCATCTCTAACGCTAGCACTGTTATCG

GTGAAGCACCGGAATGGATCACTCGTCAGACCGTTATCGAACACGGTCTGGCAGATTCT

CAGTTCAAACTGACTGAAATGGTTCAGTGGGCATACGACAACGACATCTGCGAGGAATC

TGAAATTGCGTTCGAATACGCTCAGCGTGGCGACTTCGACTCCAACGCTCGTGCTTTCC

TGAACAGCAACATGCAGGCTAAATACGTAAAAGACTGCGCTACCATGTGCCGTCACTAC

AAACACGCGGAAATGCGTAAAATGTCTATCAAACAGTGGATCAAGCACCGCGGTTCTAA

AATCGAAGGTACCGGTAACTGGAAACCGATCGTTCAGTTCCTGCGCCATCAGAACATCG

AATTCATCCCGTTCCTGACCAAATTCAAGCTGTGGCTGCACGGTACCCCGAAAAAAAAC TGCATCGCTATCGTAGGTCCACCGGACACTGACAAGTCTTACTTCTGTATGTCCCTGAT^

CTCTTTCCTGGGCGGCACTGTAATCTCTCACGTTAACTCTTCCTCCCATTTCTGGCTGC

AGCCACTGGTAGACGCGAAAGTAGCTCTGCTGGACGACGCGACCCAGCCGTGCTGGATC

TACATGGATACTTACATGCGCAACCTGCTGGACGGTAACCCGATGTCTATCGACCGTAA

ACACAAAGCGCTGACTCTGATCAAGTGCCCGCCGCTGCTGGTAACTTCTAACATCGACA

TCACCAAGGAAGATAAATACAAGTACCTGCATACCCGTGTTACTACCTTTACTTTCCCG

AACCCGTTCCCGTTTGATCGTAACGGTAACGCTGTTTACGAACTGTCCAACACTAACTG

GAAATGCTTCTTCGAGCGTCTGTCTTCCTCCCTGGACATCCAGGACTCTGAAGATGAAG

AAGATGGTTCTAACTCTCAGGCTTTCCGTTGTGTTCCGGGTACTGTTGTTCGTACTCTG

TGA 胺基酸序列（序列識別4號）

MADDSGTENE 工DDSNITHNS AVESEISPRL EKHGVPENGG CKDLRAALLG

GSGCTGWFMV LEAQALFNRQ DAIKLTRQPK DGQEKDTGRD KFKECFGLSF

EAIVQHPTGT EADTHYATVQ KVKRRLFQTR IEGEEHTEAE 工DLIRPFKSD

QISDDEDEEV DLGGKYLGSP ELTDSGYGYS APTNSVREHA KTTCLDWWA

EDSGYDMVDF YVSPINTIAE EVEAGTGTQV GTAGILELLK GFGIHHSISE -27- 88379 200411055

AFQKLIEPLS LYAHIQWLTN AWGMVLLVLL RFKVNKSRST VARTLATLLN 工PENQMLIEP PKIQSGVAAL YWFRTGISNA STVIGEAPEW ITRQTVIEHG LADSQFKLTE MVQWAYDNDI CEESEIAFEY AQRGDFDSNA RAFLNSNMQA KYVKDCATMC RHYKHAEMRK MSIKQWIKHR GSKIEGTCNW KPIVQFLRHQ NIEFIPFLTK FKLWLHGTPK KNCIAIVGPP DTDKSYFCMS LISFLGGTVI SHVNSSSHFW LQPLVDAKVA LLDDATQPCW IYMDTYMRNL LDGNPMSIDR KHKALTIilKC PPIiVTSNID ITKEDKYKYIj HTRVTTFTFP NPFPFDRNGN AVYELSNTNW KCFFERLSSS LDIQDSEDEE DGSNSQAFRC VPGTWRTL 3.質體：WRG7077 lle2 c/o mut 感興趣的基因： HPVlle2基因的尺寸約為1.1Kb，並使用叫做Syngene的視覺基本程式創造密碼子最優化序列（對人類表現而言）。此外，該序列在胺基酸位置111處包括密碼子改變，藉以將在野外型中的離胺酸殘基（AAG)改為丙胺酸殘基（GCC)，創造突變的基因。在文獻中已經顯示該改變使E2蛋白質的轉錄活性失活。按照所設計的，利用在5，和3f端選出的限制位置’將重疊的引子併入完整的基因内，並用來組裝合成的密碼子最優化突變種lle2。選殖：以凝膠純化1.2 Kb的PCR片段，並以限制酵素Not I和Bam HI消化，以便連接到載體pWRG7077 (Powderject)内。該基因在完整的速發早期CMV啟動基因的控制之下，並具有牛生長荷爾蒙聚A尾。定序該純種系，指出許多的驗基錯誤，接著修正這些錯誤。發現最終的純種系F1是密碼子最優化的突變11E2。在PWRG7077中的11 e2序列（序列識別5號） 88379 -28- 200411055

ATGGAAGCCATCGCGAAGAGGCTCGACGCCTGCCAGGACCAGCTGCTCGAGCTGTACGA

GGAGAACAGCATTGACATCCATAAGCACATCATGCACTGGAAGTGCATTCGCCTGGAGA

GCGTGCTGTTGCACAAGGCCAAGCAGATGGGCCTGTCCCACATAGGCCTTCAGGTGGTC

CCCCCTCTGACCGTGTCAGAGACAAAGGGCCATAACGCAATCGAGATGCAGATGCACCT

CGAGTCGCTGGCGAAAACACAGTACGGCGTGGAGCCATGGACCCTGCAGGACACCTCGT

ACGAAATGTGGCTGACCCCACCTAAGCGATGCTTCGCCAAACAGGGCAACACAGTGGAG

GTGAAGTTCGACGGCTGTGAGGATAACGTTATGGAGTATGTCGTGTGGACGCACATCTA

TCTGCAGGACAACGACAGTTGGGTGAAGGTGACCAGCTCCGTGGACGCGAAGGGCATCT

ACTATACCTGTGGGCAGTTTAAAACCTACTATGTGAACTTCAACAAAGAGGCCCAAAAG

TATGGCTCCACCAACCACTGGGAGGTCTGCTATGGGAGCACGGTGATTTGCTCTCCCGC

CAGCGTGTCTAGCACTGTGCGCGAGGTGAGCATTGCCGAGCCGACCACGTACACCCCTG

CCCAGACGACCGCTCCGACCGTGTCTGCTTGTACTACCGAGGACGGCGTGAGCGCTCCA

CCCAGGAAGCGTGCGAGGGGCCCAAGCACCAACAACACCCTCTGTGTGGCGAACATTCG

CAGCGTCGACAGTACCATCAATAACATCGTGACGGATAACTATAACAAGCACCAGAGGC

GTAACAACTGTCACTCTGCCGCAACCCCCATCGTGCAGCTCCAGGGAGACAGCAATTGC

CTTAAGTGCTTCCGCTATCGCCTCAACGACAAGTACAAGCACCTCTTTGAGCTCGCCTC

GTCGACGTGGCACTGGGCCTCACCCGAGGCACCTCACAAGAACGCCATCGTCACTCTCA

CTTACTCCAGTGAGGAGCAGAGACAGCAGTTTCTGAACAGCGTGAAGATCCCACCGACG

ATCCGTCATAAGGTCGGCTTCATGTCACTGCATCTCCTGTGA 胺基酸序列（序列識別6號）

MEAIAKRLDA CQDQLLELYE ENSID工HKHI MHWKCIRLES VLLHKAKQMG LSHIGLQWi PLTVSETKGH NAIEMQMHLE SLAKTQYGVE PWTLQDTSYE MWLTPPKRCF AKQGNTVEVK FDGCEDNVME YWWTHIYLQ DNDSWVKVTS SVDAKGIYYT CGQFKTYYVN FNKEAQKYGS TNHWEVCYGS TVICSPASVS STVREVSIAE PTTYTPAQTT APTVSACTTE DGVSAPPRKR ARGPSTNNTL CVAN工RSVDS T工丽工VTDNY NKHQRRNNCH SAATPIVQLQ GDSNCLKCFR YRLNDKYKHL FELASSTWHW ASPEAPHKNA IVTLTYSSEE QRQQFLNSVK IPPTIRHKVG FMSLHLL 4·免體· HPV102 (p7313me 11 e2 c/o mut) 感興趣的基因·· 從pWRG7077 lle2 c/〇 mut中將密碼子最優化的突變iie2 轉移至另一個表現載體p7313me内。選殖： 88379 -29- 200411055 藉著Bam HI和Not I限制酵素，切下pWRG7077 lle2載體的lle2 c/o mut片段。然後使用這些位置，將該片段連接到 p7313me載體内。在HPV102中的lle2序列（序列識別7號）

ATGGAAGCCATCGCGAAGAGGCTCGACGCCTGCCAGGACCAGCTGCTCGAGCTGTACGA

GGAGAACAGCATTGACATCCATAAGCACATCATGCACTGGAAGTGCATTCGCCTGGAGA

GCGTGCTGTTGCACAAGGCCAAGCAGATGGGCCTGTCCCACATAGGCCTTCAGGTGGTC

CCCCCTCTGACCGTGTCAGAGACAAAGGGCCATAACGCAATCGAGATGCAGATGCACCT

CGAGTCGCTGGCGAAAACACAGTACGGCGTGGAGCCATGGACCCTGCAGGACACCTCGT

ACGAAATGTGGCTGACCCCACCTAAGCGATGCTTCGCCAAACAGGGCAACACAGTGGAG

GTGAAGTTCGACGGCTGTGAGGATAACGTTATGGAGTATGTCGTGTGGACGCACATCTA

TCTGCAGGACAACGACAGTTGGGTGAAGGTGACCAGCTCCGTGGACGCGAAGGGCATCT

ACTATACCTGTGGGCAGTTTAAAACCTACTATGTGAACTTCAACAAAGAGGCCCAAAAG

TATGGCTCCACCAAGCACTGGGAGGTCTGCTATGGGAGCACGGTGATTTGCTCTCCCGC

CAGCGTGTCTAGCACTGTGCGCGAGGTGAGCATTGCCGAGCCGACCACGTACACCCCTG

CCCAGACGACCGCTCCGACCGTGTCTGCTTGTACTACCGAGGACGGCGTGAGeGCTCCA

CCCAGGAAGCGTGCGAGGGGCCCAAGCACCAACAACACCCTCTGTGTGGCGAACATTCG

CAGCGTCGACAGTACCATCAATAACATCGTGACGGATAACTATAACAAGCACCAGAGGC

GTAACAACTGTCACTCTGCCGCAACCCCCATCGTGCAGCTCCAGGGAGACAGCAATTGC CTTAAGTGCTTCCGCTATCGCCTCAACGACAAGTACAAGCACCTCTTTGAGCTCGCCTC^

GTCGACGTGGCACTGGGCCTCACCCGAGGCACCTCACAAGAACGCCATCGTCACTCTCA

CTTACTCCAGTGAGGAGCAGAGACAGCAGTTTCTGAACAGCGTGAAGATCCCACCGACG

ATCCGTCATAAGGTCGGCTTCATGTCACTGCATCTCCTGTGA 胺基酸序列（序列識別8號）

MEAIAKRLDA

PLTVSETKGH

FDGCEDNVME

TNHWEVCYGS

ARGPSTNNTL

YRLNDKYKHL

FMSLHLL

CQDQLLELYE

NAIEMQMHLE

YWWTHIYLQ

TVICSPASVS

CVANIRSVDS

FELASSTWHW

ENSIDIHKHI

SLAKTQYGVE

DNDSWVKVTS

STVREVSIAE

TINNIVTDNY

ASPEAPHKNA

MHWKCIRLES

PWTLQDTSYE

SVDAKGIYYT

PTTYTPAQTT

NKHQRRNNCH

IVTLTYSSEE

VLLHKAKQMG

MWLTPPKRCF

CGQFKTYYVN

APTVSACTTE

SAATPIVQLQ

QRQQFLNSVK

LSHIGLQWP

AKQGNTVEVK

FNKEAQKYGS

DGVSAPPRKR

GDSNCLKCFR

IPPTIRHKVG 88379 -30 - 200411055 5.質體：HPV104 (p7313me 6b/lle2 c/o mut) 感興趣的基因：使用2xPCR，利用HPV102和HPV110做為模板，以及適當設計的引子，建構6be2和lle2的融合蛋白質。將約2.2kb之融合片段選殖到在融合蛋白質之起點帶有6be2的p7313me 表現載體内。選殖：以Bam HI和Not I限制酵素消化2.2 kb融合物，並連接到 p7313me表現載體内。藉著定序檢查經過分離的純種系，指出沒有錯誤已經併入。在HPV104中的6b/lle2融合序列（序列識別9號）

ATGGAAGCTATTGCCAAGCGACTGGACGCCTGCCAGGAGCAGCTGCTGGAGCTGTACGAGGAAAACAG

CACAGACCTCCACAAGCACGTGCTGCACTGGAAGTGCATGCGCCACGAGTCAGTGCTCCTGTACAAGG

CCAAGCAGATGGGGCTGTCCCACATCGGGATGCAGGTCGTGCCCCCGCTGAAGGTGAGCGAAGCCAAG

GGCCACAACGCTATCGAGATGCAGATGCACCTGGAGAGCCTGCTGCGGACCGAATACAGCATGGAGCC CTGGACTCTCCAGGAGACGTCCTACGAAATGTGGCAGACTCCTCCGAAGCGCTGTTTCGCAAAGCGCG^

GCAAGACAGTTGAGGTGAAATTCGATGGGTGCGCAAACAACACGATGGACTACGTGGTGTGGACCGAT

GTCTACGTGCAGGACAATGACACCTGGGTGAAGGTACATAGTATGGTGGATGCCAAGGGCATCTATTA

CACCTGCGGGCAGTTCAAGACGTACTACGTCAACTTCGTCAAGGAAGCCGAAAAGTATGGTTCCACCA

AGCACTGGGAGGTGTGTTACGGGAGTACTGTGATCTGCAGCCCCGCCTCCGTGTCGTCCACCACCCAG

GAAGTGAGCATTCCGGAGAGCACCACATACACCCCGGCCCAAACGAGCACGCTCGTCAGCAGCAGCAC

CAAGGAGGACGCCGTCCAGACGCCCCCCCGGAAGAGGGCCCGGGGGGTCCAGCAGTCTCCCTGCAATG

CAGCACCAAAGGCGCAACAACTCTAACAGCTCCGCAACTCCAATAGTGCAGTTCCAGGGGGAGTCCAA

CTGCCTCAAGTGTTTCCGCTACCGCCTCAACGACCGCCACCGCCACCTGTTCGACTTGATCAGTTCCA

CGTGGCACTGGGCCAGCAGCAAGGCGCCCCACAAACACGCTATCGTGACGGTGACCTACGACTCCGAG

GAGCAGAGGCAGCAGTTCCTGGACGTCGTGAAGATTCCTCCGACAATCAGCCACAAGCTTGGCTTCAT

GTCCCTGCACCTGCTGATGGAAGCCATCGCGAAGAGGCTCGACGCCTGCCAGGACCAGCTGCTCGAGC

TGTACGAGGAGAACAGCATTGACATCCATAAGCACATCATGCACTGGAAGTGCATTCGCCTGGAGAGC

GTGCTGTTGCACAAGGCCAAGCAGATGGGCCTGTCCCACATAGGCCTTCAGGTGGTCCCCCCTCTGAC

CGTGTCAGAGACAAAGGGCCATAACGCAATCGAGATGCAGATGCACCTCGAGTCGCTGGCGAAAACAC

AGTACGGCGTGGAGCCATGGACCCTGCAGGACACCTCGTACGAAATGTGGCTGACCCCACCTAAGCGA -31 -

88379 200411055

TGCTTCGCCAAACAGGGCAACACAGTGGAGGTGAAGTTCGACGGCTGTGAGGATAACGTTATGGAGTA

TGTCGTGTGGACGCACATCTATCTGCAGGACAACGACAGTTGGGTGAAGGTGACCAGCTCCGTGGACG

CGAAGGGCATCTACTATACCTGTGGGCAGTTTAAAACCTACTATGTGAACTTCAACAAAGAGGCCCAA

AAGTATGGCTCCACCAACCACTGGGAGGTCTGCTATGGGAGCACGGTGATTTGCTCTCCCGCCAGCGT

GTCTAGCACTGTGCGCGAGGTGAGCATTGCCGAGCCGACCACGTACACCCCTGCCCAGACGACCGCTC

CGACCGTGTCTGCTTGTACTACCGAGGACGGCGTGAGCGCTCCACCCAGGAAGCGTGCGAGGGGCCCA

AGCACCAACAACACCCTCTGTGTGGCGAACATTCGCAGCGTCGACAGTACCATCAATAACATCGTGAC

GGATAACTATAACAAGCACCAGAGGCGTAACAACTGTCACTCTGCCGCAACCCCCATCGTGCAGCTCC

AGGGAGACAGCAATTGCCTTAAGTGCTTCCGCTATCGCCTCAACGACAAGTACAAGCACCTCTTTGAG

CTCGCCTCGTCGACGTGGCACTGGGCCTCACCCGAGGCACCTCACAA.GAACGCCATCGTCACTCTCAC

TTACTCCAGTGAGGAGCAGAGACAGCAGTTTCTGAACAGCGTGAAGATCCCACCGACGATCCGTCATA

AGGTCGGCTTCATGTCACTGCATCTCCTGA 胺基酸序列（序列識別10號） MEAIAKRLDA CQEQLLELYE ENSTDLHKHV LHWKCMRHES VLLYKAKQMG LSHIGMQWP PLKVSEAKGH ΝΑ工EMQMHLE SLLRTEYSME PWTLQETSYE MWQTPPKRCF AKRGKTVEVK FDGCANNTMD YWWTDVYVQ DNDTWVKVHS MVDAKGIYYT CGQFKTYYVN FVKEAEKYGS TKHWEVCYGS TVICSPASVS STTQEVSIPE STTYTPAQTS TLVSSSTKED AVQTPPRKRA RGVQQSPCNA LCVAH工GPVD SGNHNLITNN HDQHQRRNNS NSSATPIVQF QGESNCLKCF RYRLNDRHRH LFDLISSTWH WASSKAPHKH AIVTVTYDSE EQRQQFLDW KIPPTISHKL GFMSLHLLME AIAKRLDACQ DQLLELYEEN SIDIHKHIMH WKCIRLESVL LHKAKQMGLS HIGLQWPPL TVSETKGHNA IEMQMHLESL AKTQYGVEPW TLQDTSYEMW LTPPKRCFAK QGNTVEVKFD GCEDNVMEYV VWTHIYLQDN DSWVKVTSSV DAKGIYYTCG QFKTYYVNFN KEAQKYGSTN HWEVCYGSTV ICSPASVSST VREVSIAEPT TYTPAQTTAP TVSACTTEDG _ VSAPPRKRAR GPSTNNTLCV ANIRSVDSTI NNIVTDNYNK HQRRNNCHSA ATPIVQLQGD SNCLKCFRYR LNDKYKHLFE LASSTWHWAS PEAPHKNA工V TLTYSSEEQR QQFLNSVKIP PTIRHKVGFM SLHLL· 6.質體：HPV105 (p7313me ll/6be2 c/o mut) 感興趣的基因：使用2乂？《1，利用1^¥102和1^¥110做為模板，以及適當設計的引子，建構6662和1^2的融合蛋白質。將約2.2处之融合片段選殖到在融合蛋白質之起點帶有lle2的p7313me 表現載體内。選殖： -32- 88379 200411055 以Bam HI和Not I限制酵素消化2.2 kb融合物，並連接到 p7313me表現載體内。藉著定序檢查經過分離的純種系，指出沒有錯誤已經併入。在HPV105中的ll/6bE2融合序列（序列識別ll號）

ATGGAAGCCATCGCGAAGAGGCTCGACGCCTGCCAGGACCAGCTGCTCGAGCTGTACGAGGAGAACAG

CATTGACATCCATAAGCACATCATGCACTGGAAGTGCATTCGCCTGGAGAGCGTGCTGTTGCACAAGG

CCAAGCAGATGGGCCTGTCCCACATAGGCCTTCAGGTGGTCCCCCCTCTGACCGTGTCAGAGACAAAG

GGCCATAACGCAATCGAGATGCAGATGCACCTCGAGTCGCTGGCGAAAA.CACAGTACGGCGTGGAGCC

ATGGACCCTGCAGGACACCTCGTACGAAATGTGGCTGACCCCACCTAAGCGATGCTTCGCCAAACAGG

GCAACACAGTGGAGGTGAAGTTCGACGGCTGTGAGGATAACGTTATGGAGTATGTCGTGTGGACGCAC

ATCTATCTGCAGGACAACGACAGTTGGGTGAAGGTGACCAGCTCCGTGGACGCGAAGGGCATCTACTA

TACCTGTGGGCAGTTTAAAACCTACTATGTGAACTTCAACAAAGAGGCCCAAAAGTATGGCTCCACCA

ACCACTGGGAGGTCTGCTATGGGAGCACGGTGATTTGCTCTCCCGCCAGCGTGTCTAGCACTGTGCGC

GAGGTGAGCATTGCCGAGCCGACCACGTACACCCCTGCCCAGACGACCGCTCCGACCGTGTCTGCTTG

TACTACCGAGGACGGCGTGAGCGCTCCACCCAGGAAGCGTGCGAGGGGCCCAAGCACCAACAACACCC

TCTGTGTGGCGAACATTCGCAGCGTCGACAGTACCATCAATAACATCGTGACGGATAACTATAACAAG

CACCAGAGGCGTAACAACTGTCACTCTGCCGCAACCCCCATCGTGCAGCTCCAGGGAGACAGCAATTG

CCTTAAGTGCTTCCGCTATCGCCTCAACGACAAGTACAAGCACCTCTTTGAGCTCGCCTCGTCGACGT

GGCACTGGGCCTCACCCGAGGCACCTCACAAGAACGCCATCGTCACTCTCACTTACTCCAGTGAGGAG

CAGAGACAGCAGTTTCTGAACAGCGTGAAGATCCCACCGACGATCCGTCATAAGGTCGGCTTCATGTC

ACTGCATCTCCTGATGGAAGCTATTGCCAAGCGACTGGACGCCTGCCAGGAGCAGCTGCTGGAGCTGT ACGAGGAAAACAGCACAGACCTCCACAAGCACGTGCTGCACTGGAAGTGCATGCGCCACGAGTCAGTG j . i CTCCTGTACAAGGCCAAGCAGATGGGGCTGTCCCACATCGGGATGCAGGTCGTGCCCCCGCTGAAGGT |

GAGCGAAGCCAAGGGCCACAACGCTATCGAGATGCAGATGCACCTGGAGAGCCTGCTGCGGACCGAAT ACAGCATGGAGCCCTGGACTCTCCAGGAGACGTCCTACGAAATGTGGCAGACTCCTCCGAAGCGCTGT' !

TTCGCA?^AGCGCGGCAAGACAGTTGAGGTGAAATTCGATGGGTGCGCAAACAACACGATGGACTACGT

GGTGTGGACCGATGTCTACGTGCAGGACAATGACACCTGGGTGAAGGTACATAGTATGGTGGATGCCA

AGGGCATCTATTACACCTGCGGGCAGTTCAAGACGTACTACGTCAACTTCGTCAAGGAAGCCGAAAAG

TATGGTTCCACCAAGCACTGGGAGGTGTGTTACGGGAGTACTGTGATCTGCAGCCCCGCCTCCGTGTC

GTCCACCACCCAGGAAGTGAGCATTCCGGAGAGCACCACATACACCCCGGCCCAAACGAGCACGCTCG

TCAGCAGCAGCACCAAGGAGGACGCCGTCCAGACGCCCCCCCGGAAGAGGGCCCGGGGGGTCCAGCAG

TCTCCCTGCAATGCCCTGTGCGTTGCTCACATCGGCCCTGTCGATTCTGGGAACCACAATCTCATCAC

GAACAACCACGACCAGCACCAAAGGCGCAACAACTCTAACAGCTCCGCAACTCCAATAGTGCAGTTCC

AGGGGGAGTCCAACTGCCTCAAGTGTTTCCGCTACCGCCTCAACGACCGCCACCGCCACCTGTTCGAC

TTGATCAGTTCCACGTGGCACTGGGCCAGCAGCAAGGCGCCCCACAAACACGCTATCGTGACGGTGAC

CTACGACTCCGAGGAGCAGAGGCAGCAGTTCCTGGACGTCGTGAAGATTCCTCCGACAATCAGCCACA

AGCTTGGCTTCATGTCCCTGCACCTGCTGA -33 - 88379 200411055 胺基酸序列（序列識別12號）

MEAIAKRLDA

PLTVSETKGH

FDGCEDNVME

TNHWEVCYGS

ARGPSTNNTL

YRLNDKYKHL

FMSLHLLMEA

IGMQWPPLK

GKTVEVKFDG

EAEKYGSTKH

TPPRKRARGV

SNCLKCFRYR

PTISHKLGFM

CQDQLLELYE

NAIEMQMHLE

YWWTHIYLQ

TVICSPASVS

CVANIRSVDS

FELASSTWHW

IAKRLDACQE

VSEAKGHNAI

CANNTMDYW

WEVCYGSTVI

QQSPCNALCV

LNDRHRHLFD

SLHLL

ENSIDIHKHI

SLAKTQYGVE

DNDSWVKVTS

STVREVSIAE

TINNIVTDNY

ASPEAPHKNA

QLLELYEENS

EMQMHLESLL

WTDVYVQDND

CSPASVSSTT

AHIGPVDSGN

LISSTWHWAS

MHWKCIRLES

PWTLQDTSYE

SVDAKGIYYT

PTTYTPAQTT

NKHQRRNNCH

IVTLTYSSEE

TDLHKHVLHW

RTEYSMEPWT

TWVKVHSMVD

QEVSIPESTT

HNLITNNHDQ

SKAPHKHAIV

VLLHKAKQMG

MWLTPPKRCF

CGQFKTYYVN

APTVSACTTE

SAATPIVQLQ

QRQQFLNSVK

KCMRHESVLL

LQETSYEMWQ

AKGIYYTCGQ

YTPAQTSTLV

HQRRNNSNSS

TVTYDSEEQR

LSHIGLQWP AKQGNTVEVK FNKEAQKYGS DGVSAPPRKR GDSNCLKCFR IPPT工RHKVG YKAKQMGLSH TPPKRCFAKR FKTYYVNFVK SSSTKEDAVQ ATPIVQFQGE QQFLDWKIP 7·質體：HPV108 (p7313ie 6bel c/o mut) 感興趣的基因：從p7313plc 6bel c/o mut純種系N中將密碼子最優化的突變6bel轉移至載體p7313ie内。選殖： — 藉著Not I和Bam HI限制消化，從P7313plc 6be2純種系中切開6bel c/o mut片段。然後使用這些位置，將該片段連接到p7313ie載體内。該基因在ie啟動基因（速發早期cmv+表現序列1)的控制之下，接著是兔子b-球蛋白聚-腺嘗酸化作用信號。在p7313ie中的6bel序列（序列識別13號）

ATGGCAGACGATTCCGGTACTGAGAACGAAGGTTCTGGTTGTACCGGTTGGTTCATGGTTGAAGCAAT

CGTTCAGCATCCGACTGGTACCCAGATCTCCGATGACGAAGACGAAGAAGTTGAAGATTCTGGTTACG

ACATGGTTGACTTCATCGATGACTCCAACATCACTCATAACTCTCTGGAAGCACAGGCTCTGTTTAAC

CGCCAGGAAGCTGATACCCATTACGCTACTGTTCAGGACCTGGGAGGCAAATATCTGGGCTCTCCGTA

CGTTTCCCCGATCAACACTATCGCAGAAGCAGTTGAGTCTGAAATCTCCCCGCGCCTGGACGCTATCA -34· 88379 200411055

AACTGACTCGTCAGCCGAAGAAGGTTAAACGTCGTCTGTTCCAGACTCGTGAACTGACCGACTCCGGT

TACGGTTATAGCGAAGTTGAGGCTGGCACCGGCACCCAGGTTGAAAAACACGGTGTACCGGAAAACGG

CGGCGACGGTCAGGAAAAGGACACCGGCCGCGACATCGAGGGTGAGGAACACACCGAAGCTGAAGCTC

CGACTAACTCTGTTCGTGAACACGCAGGTACTGCGGGTATCCTGGAACTGCTGAAATGCAAAGACCTG

CGCGCGGCTCTGCTGGGCAAATTCAAAGAATGCTTCGGCCTGTCTTTCATTGACCTGATCCGTCCGTT

TAAGTCTGACAAAACTACCTGTCTGGACTGGGTTGTAGCAGGCTTCGGCATCCACCACTCTATCTCTG

AAGCATTCCAGAAA.CTGATCGAGCCGCTGTCTCTGTACGCGCACATCCAGTGGCTGACTAACGCTTGG

GGTATGGTTCTGCTGGTACTGCTGCGCTTTAAAGTAAACAAATCTCGTTCCACTGTTGCTCGTACTCT

GGCTACCCTGCTGAACATCCCGGAGAACCAGATGCTGATCGAACCGCCGAAAATCCAGTCTGGTGTAG

CTGCACTGTACTGGTTTCGTACTGGCATCTCTAACGCTAGCACTGTTATCGGTGAAGCACCGGAATGG

ATCACTCGTCAGACCGTTATCGAACACGGTCTGGCAGATTCTCAGTTCAAACTGACTGAAATGGTTCA

GTGGGCATACGACAACGACATCTGCGAGGAATCTGAAATTGCGTTCGAATACGCTCAGCGTGGCGACT

TCGACTCCAACGCTCGTGCTTTCCTGAACAGCAACATGCAGGCTAAATACGTAAAAGACTGCGCTACC

ATGTGCCGTCACTACAAACACGCGGAAATGCGTAAAATGTCTATCAAACAGTGGATCAAGCACCGCGG

TTCTAAAATCGAAGGTACCGGTAACTGGAAACCGATCGTTCAGTTCCTGCGCCATCAGAACATCGAAT

TCATCCCGTTCCTGACCAAATTCAAGCTGTGGCTGCACGGTACCCCGAAAAAAAACTGCATCGCTATC

GTAGGTCCACCGGACACTGACAAGTCTTACTTCTGTATGTCCCTGATCTCTTTCCTGGGCGGCACTGT

AATCTCTCACGTTAACTCTTCCTCCCATTTCTGGCTGCAGCCACTGGTAGACGCGAAAGTAGCTCTGC

TGGACGACGCGACCCAGCCGTGCTGGATCTACATGGATACTTACATGCGCAACCTGCTGGACGGTAAC

CCGATGTCTATCGACCGTAAACACAAAGCGCTGACTCTGATCAAGTGCCCGCCGCTGCTGGTAACTTC

TAACATCGACATCACCAAGGAAGATAAATACAAGTACCTGCATACCCGTGTTACTACCTTTACTTTCC CGAACCCGTTCCCGTTTGATCGTAACGGTAACGCTGTTTACGAACTGTCCAACACTAACTGGAAATGC^

TTCTTCGAGCGTCTGTCTTCCTCCCTGGACATCCAGGACTCTGAAGATGAAGAAGATGGTTCTAACTC

TCAGGCTTTCCGTTGTGTTCCGGGTACTGTTGTTCGTACTCTGTGA 胺基酸序列（序列識別14號）

MADDSGTENE GSGCTGWFMV EAIVQHPTGT QISDDEDEEV EDSGYDMVDF IDDSNITHNS LEAQALFNRQ EADTHYATVQ DLGGKYLGSP YVSPINTIAE AVESEISPRL DAIKLTRQPK KVKRRLFQTR ELTDSGYGYS EVEAGTGTQV EKHGVPENGG DGQEKDTGRD IEGEEHTEAE APTNSVREHA GTAGILELLK CKDLRAALLG KFKECFGLSF IDLIRPFKSD KTTCLDWWA GFGIHHSISE AFQKLIEPLS LYAHIQWLTN AWGMVLLVLL RFKVNKSRST VARTLATLLN IPENQMLIEP PKIQSGVAAL YWFRTGISNA STVIGEAPEW ITRQTVIEHG LADSQFKLTE MVQWAYDNDI CEESEIAFEY AQRGDFDSNA RAFLNSNMQA KYVKDCATMC RHYKHAEMRK MSIKQWIKHR GSKIEGTGNW KPIVQFLRHQ NIEF工PFLTK FKLWLHGTPK KNCIAIVGPP DTDKSYFCMS LISFLGGTVI SHVNSSSHFW LQPLVDAKVA LLDDATQPCW IYMDTXMRNL LDGNPMSIDR KHKALTLIKC PPLLVTSNID ITKEDKYKYL HTRVTTFTFP NPFPFDRNGN AVYELSNTNW KCFFERLSSS LDIQDSEDEE DGSNSQAFRC VPGTWRTL -35 - 88379 200411055 8.質體：HPV110 (ρ7313ie 6be2 c/o mut) 感興趣的基因：從pWRG7077 6be2中將密碼子最優化的突變6be2轉移至載體p7313ie内。選殖：藉著Not I和Bam HI限制消化，從pWRG7077 6be2純種系中切開6be2 c/o mut片段。然後使用這些位置，將該片段連接到p7313ie載體内。該基因在ie啟動基因（速發早期cmv+表現序列1)的控制之下，接著是兔子b-球蛋白聚-腺苷酸化作用信號。在p7313ie中的6be2序列（序列識別15號）

ATGGAAGCTATTGCCAAGCGACTGGACGCCTGCCAGGAGCAGCTGCTGGAGCTGTACGAGGAAAACAG

CACAGACCTCCACAAGCACGTGCTGCACTGGAAGTGCATGCGCCACGAGTCAGTGCTCCTGTACAAGG

CCAAGCAGATGGGGCTGTCCCACATCGGGATGCAGGTCGTGCCCCCGCTGAAGGTGAGCGAAGCCAAG

GGCCACAACGCTATCGAGATGCAGATGCACCTGGAGAGCCTGCTGCGGACCGAATACAGCATGGAGCC CTGGACTCTCCAGGAGACGTCCTACGAAATGTGGCAGACTCCTCCGAAGCGCTGTTTCGCAAAGCGCa

GCAAGACAGTTGAGGTGAAATTCGATGGGTGCGCAAACAACACGATGGACTACGTGGTGTGGACCGAT

GTCTACGTGCAGGACAATGACACCTGGGTGAAGGTACATAGTATGGTGGATGCCAAGGGCATCTATTA

CACCTGCGGGCAGTTCAAGACGTACTACGTCAACTTCGTCAAGGAAGCCGAAAAGTATGGTTCCACCA

AGCACTGGGAGGTGTGTTACGGGAGTACTGTGATCTGCAGCCCCGCCTCCGTGTCGTCCACCACCCAG

GAAGTGAGCATTCCGGAGAGCACCACATACACCCCGGCCCAAACGAGCACGCTCGTCAGCAGCAGCAC

CAAGGAGGACGCCGTCCAGACGCCCCCCCGGAAGAGGGCCCGGGGGGTCCAGCAGTCTCCCTGCAATG

CCCTGTGCGTTGCTCACATCGGCCCTGTCGATTCTGGGAACCACAATCTCATCACGAACAACCACGAC

CAGCACCAAAGGCGCAACAACTCTAACAGCTCCGCAACTCCAATAGTGCAGTTCCAGGGGGAGTCCAA

CTGCCTCAAGTGTTTCCGCTACCGCCTCAACGACCGCCACCGCCACCTGTTCGACTTGATCAGTTCCA

CGTGGCACTGGGCCAGCAGCAAGGCGCCCCACAAACACGCTATCGTGACGGTGACCTACGACTCCGAG

GAGCAGAGGCAGCAGTTCCTGGACGTCGTGAAGATTCCTCCGACAATCAGCCACAAGCTTGGCTTCAT GTCCCTGCACCTGCTGTGA 胺基酸序列（序列識別I6號） -36- 88379 200411055

MEAIAKRLDA CQEQLLELYE ENSTDLHKHV LHWKCMRHES VLLYKAKQMG LSHIGMQWP PLKVSEAKGH NAIEMQMHLE SLLRTEYSME PWTLQETSYE MWQTPPKRCF AKRGKTVEVK FDGCANNTMD YWWTDVYVQ DNDTWVPCVHS MVDAKGIYYT CGQFKTYYW FVKEAEKYGS TKHWEVCYGS TVICSPASVS STTQEVSIPE STTYTPAQTS TLVSSSTKED AVQTPPRKRA RGVQQSPCNA LCVAHIGPVD SGNHNLITNN HDQHQRRNNS NSSATPIVQF QGESNCLKCF RYRLNDRHRH LFDLISSTWH WASSKAPHKH AIVTVTYDSE EQRQQFLDW KIPPTISHKL GFMSLHLL 9·質體：HPV116 (p7313ie 6bel.6be2.lle2) 感興趣的基因：在構築體HPV116中之多蛋白的基因是三重融合蛋白質，按順序包括6bel、6be2、lle2所有最優化和突變的密碼子。藉著PCR，使用2個先前的PCR片段；6bel和6b/lle2，組裝該多蛋白基因。基因的尺寸約為4.1 kb，藉著PAGE和西方墨點法觀察到產生約170 kD的多蛋白。選殖：以Bam HI + Not I限制酵素消化多蛋白基因，並連接到 p7313ie載體内。所選出之純種系的定序分析，.已經指出’零星的’’鹼基改變，但這可藉著各種片段交換而克服。發現所得的純種系hpvll6#l沒有錯誤。在HPV116中的多蛋白序列（序列識別17號）

ATGGCAGACGATTCCGGTACTGAGAACGAAGGTTCTGGTTGTACCGGTTGGTTCATGGTTGAA.GCAA

TCGTTCAGCATCCGACTGGTACCCAGATCTCCGATGACGAAGACGAAGAAGTTGAAGATTCTGGTTA

CGACATGGTTGACTTCATCGATGACTCCAACATCACTCATAA.CTCTCTGGAAGCACAGGCTCTGTTT

AACCGCCAGGAAGCTGATACCCATTACGCTACTGTTCAGGACCTGGGAGGCAAATATCTGGGCTCTC

CGTACGTTTCCCCGATCAACACTATCGCAGAAGCAGTTGAGTCTGAAATCTCCCCGCGCCTGGACGC

TATCAAACTGACTCGTCAGCCGAAGAAGGTTAAACGTCGTCTGTTCCAGACTCGTGAACTGACCGAC

TCCGGTTACGGTTATAGCGAAGTTGAGGCTGGCACCGGCACCCAGGTTGAAAAACACGGTGTACCGG

A?^AACGGCGGCGACGGTCAGGAAAAGGACACCGGCCGCGACATCGAGGGTGAGGAACACACCGAAGC

TGAAGCTCCGACTAACTCTGTTCGTGAACACGCAGGTACTGCGGGTATCCTGGAACTGCTGAAATGC

AAAGACCTGCGCGCGGCTCTGCTGGGCAAATTCAAAGAATGCTTCGGCCTGTCTTTCATTGACCTGA

TCCGTCCGTTTAAGTCTGACAAAACTACCTGTCTGGACTGGGTTGTAGCAGGCTTCGGCATCCACCA -37- 88379 200411055

CTCTATCTCTGAAGCATTCCAGAAACTGATCGAGCCGCTGTCTCTGTACGCGCACATCCAGTGGCTG ACTAACGCTTGGGGTATGGTTCTGCTGGTACTGCTGCGCTTTAAAGTAAACAAATCTCGTTCCACTG ^(SCTCGTAGTCTGGCTACCCTGCTGAAGATCCCGGAGAAGCAGATGCTGATCGAACCGCCGAAAAT CCAGTCTGGTGTAGCTGCACTGTACTGGTTTCGTACTGGCATCTCTAACGCTAGCACTGTTATCGGT GAAGCACCGGAATGGATCACTCGTCAGACCGTTATCGAACACGGTCTGGCAGATTCTCAGTTCAAAC TGACTGAAATGGTTCAGTGGGCATACGACAACGACATCTGCGAGGAATCTGAAATTGCGTTCGAATA CGCTCAGCGTGGCGACTTCGACTCCAACGCTCGTGCTTTCCTGAACAGCAACATGCAGGCTAAATAC GTAAAAGACTGCGCTACCATGTGCCGTCACTACAAACACGCGGAAATGCGTAAAATGTCTATCAAAC AGTGGATCAAGCACCGCGGTTCTAAAATCGAAGGTACCGGTAACTGGAAACCGATCGTTCAGTTCCT GCGCCATCAGAACATCGAATTCATCCCGTTCCTGACCAAATTCAAGCTGTGGCTGCACGGTACCCCG AAAAAAAACTGCATCGCTATCGTAGGTCCACCGGACACTGACAAGTCTTACTTCTGTATGTCCCTGA TCTCTTTCCTGGGCGGCACTGTAATCTGTCACGTTAACTCTTCCTCCCATTTCTGGCTGCAGCCACT GGTAGACGCGAAAGTAGCTCTGCTGGACGACGCGACCCAGCCGTGCTGGATCTACATGGATACTTAC ATGCGCAACCTGCTGGACGGTAACCCGATGTCTATCGACCGTAAACACAAAGCGCTGACTCTGATCA AGTGCCCGCCGCTGCTGGTAACTTCTAACATCGACATCACCAAGGAAGATAAATACAAGTACCTGCA TACCCGTGTTACTACCTTTACTTTCCCGAACCCGTTCCCGTTTGATCGTAACGGTAACGCTGTTTAC ' GAACTGTCCAACACTAACTGGAAATGCTTCTTCGAGCGTCTGTCTTCCTCCCTGGACATCCAGGACT CTGAAGATGAAGAAGATGGTTCTAACTCTCAGGCTTTCCGTTGTGTTCCGGGTACTGTTGTTCGTAC TCTGATGGAAGCTATTGCCAAGCGACTGGACGCCTGCCAGGAGCAGCTGCTGGAGCTGTACGAGGAA AACAGCACAGACCTCCACAAGCACGTGCTGCACTGGAAGTGCATGCGCCACGAGTCAGTGCTCCTGT ACAAGGCCAA.GCAGATGGGGCTGTCCCACATCGGGATGCAGGTCGTGCCCCCGCTGAAGGTGAGCGA AGCCAAGGGCCACAACGCTATCGAGATGCAGATGCACCTGGAGAGCCTGCTGCGGACCGAATACAGC ATGGAGCCCTGGACTCTCCAGGAGACGTCCTACGAAATGTGGCAGACTCCTCCGAAGCGCTGTTTCG CAAAGCGCGGCAAGACAGTTGAGGTGAAATTCGATGGGTGCGCAAACAACACGATGGACTACGTGGT GTGGACCGATGTCTACGTGCAGGACAATGACACCTGGGTGAAGGTACATAGTATGGTGGATGCCAAG GGCATCTATTACACCTGCGGGCAGTTCAAGACGTACTACGTCAACTTCGTCAAGGAAGCCGAAAAGT ATGGTTCCACCAAGCACTGGGAGGTGTGTTACGGGAGTACTGTGATCTGCAGCCCCGCCTCCGTGTC GTCCACCACCCAGGAAGTGAGCATTCCGGAGAGACCACATACACCCCGGCCCAAACGAGCACGCTCG TCAGCAGCAGCACCAAGGAGGACGCCGTCCAGACGCCCCCCCGGAAGAGGGCCCGGGGGGTCCAGCA GTCTCCCTGCAATGCCCTGTGCGTTGCTCACATCGGCCCTGTCGATTCTGGGAACCACAATCTCATC ACGAACAACCACGACCAGCACCAAAGGCGCAACAACTCTAACAGCTCCGCAACTCCAATAGTGCAGT TCCAGGGGGAGTCCAACTGCCTCAAGTGTTTCCGCTACCGCCTCAACGACCGCCACCGCCACCTGTT CGACTTGATCAGTTCCACGTGGCACTGGGCCAGCAGCAAGGCGCCCCACAAACACGCTATCGTGACG GTGACCTACGACTCCGAGGAGCAGAGGCAGCAGTTCCTGGACGTCGTGAAGATTCCTCCGACAATCA GCCACAAGCTTGGCTTCATGTCCCTGCACCTGCTGATGGAAGCCATCGCGAAGAGGCTCGACGCCTG CCAGGACCAGCTGCTCGAGCTGTACGAGGAGAACAGCATTGACATCCATAAGCACATCATGCACTGG AAGTGCATTCGCCTGGAQAGCGTGCTGTTGCACAAGGCCAAGCAGATGGGCCTGTCCCACATAGGCC • 38 - 88379 200411055

TTCAGGTGGTCCCCCCTCTGACCGTGTCAGAGACAAAGGGCCATAACGCAATCGAGATGCAGATGCA

CCTCGAGTCGCTGGCGAAAACACAGTACGGCGTGGAGCCATGGACCCTGCAGGACACCTCGTACGAA

ATGTGGCTGACCCCACCTAAGCGATGCTTCGCCAAACAGGGCAACACAGTGGAGGTGAAGTTCGACG

GCTGTGAGGATAACGTTATGGAGTATGTCGTGTGGACGCACATCTATCTGCAGGACAACGACAGTTG

GGTGAAGGTGACCAGCTCCGTGGACGCGAAGGGCATCTACTATACCTGTGGGCAGTTTAAAACCTAC

TATGTGAACTTCAACAAAGAGGCCCAAAAGTATGGCTCCACCAACCACTGGGAGGTCTGCTATGGGA

GCACGGTGATTTGCTCTCCCGCCAGCGTGTCTAGCACTGTGCGCGAGGTGAGCATTGCCGAGCCGAC

CACGTACACCCCTGCCCAGACGACCGCTCCGACCGTGTCTGCTTGTACTACCGAGGACGGCGTGAGC

GCTCCACCCAGGAAGCGTGCGAGGGGCCCAAGCACCAACAACACCCTCTGTGTGGCGAACATTCGCA

GCGTCGACAGTACCATCAATAACATCGTGACGGATAACTATAACAAGCACCAGAGGCGTAACAACTG

TCACTCTGCCGCAACCCCCATCGTGCAGCTCCAGGGAGACAGCAATTGCCTTAAGTGCTTCCGCTAT

CGCCTCAACGACAAGTACAAGCACCTCTTTGAGCTCGCCTCGTCGACGTGGCACTGGGCCTCACCCG

AGGCACCTCACAAGAACGCCATCGTCACTCTCACTTACTCCAGTGAGGAGCAGAGACAGCAGTTTCT

GAACAGCGTGAAGATCCCACCGACGATCCGTCATAAGGTCGGCTTCATGTCACTGCATCTCCTGTGA 胺基酸序列（序列識別18號）

MADDSGTENE GSGCTGWFMV EAIVQHPTGT QISDDEDEEV EDSGYDMVDF IDDSNITHNS LEAQALFNRQ EADTHYATVQ DLGGKYLGSP YVSPINTIAE AVESEISPRL DAIKLTRQPK KVKRRLFQTR ELTDSGYGYS EVEAGTGTQV EKHGVPENGG DGQEKDTGRD IEGEEHTEAE APTNSVREHA GTAGILELLK CKDLRAALLG KFKECFGLSF IDLIRPFKSD KTTCLDWWA GFGIHHSISE AFQKLIEPLS LYAHIQWLTN AWGMVLLVLL RFKVNKSRST VARTLATLLN 工PENQMLIEP PKIQSGVAAL YWFRTGISNA STVIGEAPEW ITRQTVIEHG LADSQFKLTE MVQWAYDNDI CEESEIAFEY AQRGDFDSNA RAFLNSNMQA KYVKDCATMC RHYKHAEMRK MSIKQWIKHR GSKIEGTGNW KPIVQFLRHQ NIEFIPFLTK FKLWLHGTPK KNCIAIVGPP DTDKSYFCMS LISFLGGTVI SHVNSSSHFW LQPLVDAKVA LLDDATQPCW IYMDTYMRNL LDGNPMSIDR KHKALTLIKC PPLLVTSNID ITKEDKYKYL HTRVTTFTFP NPFPFDRNGN AVYELSNTNW KCFFERLSSS LDIQDSEDEE DGSNSQAFRC VPGTWRTLM EAIAKRLDAC QEQLLELYEE NSTDLHKHVL HWKCMRHESV LLYKAKQMGL SHIGMQWPP LKVSEAKGHN AIEMQMHLES LLRTEYSMEP WTLQETSYEM WQTPPKRCFA KRGKTVEVKF DGCANNTMDY WWTDVYVQD NDTWVKVHSM VDAKGIYYTC GQFKTYYVNF VKEAEKYGST KHWEVCYGST VICSPASVSS TTQEVSIPES TTYTPAQTST LVSSSTKEDA VQTPPRKRAR GVQQSPCNAL CVAHIGPVDS GNHNLITNNH DQHQRRNNSN SSATPIVQFQ GESNCLKCFR YRLNDRHRHL FDLISSTWHW ASSKAPHKHA IVTVTYDSEE QRQQFLDWK IPPTISHKLG FMSLHLLMEA 工AKRLDACQD QLLELYEENS IDIHKHIMHW KCIRLESVLL HKAKQMGLSH IGLQWPPLT -39- 88379 200411055

VSETKGHNAI EMQMHLESLA KTQYGVEPWT LQDTSYEMWL TPPKRCFAKQ GNTVEVKFDG CEDNVMEYW WTHIYLQDND SWVKVTSSVD AKGIYYTCGQ FKTYYVNFNK EAQKYGSTNH WEVCYGSTVI CSPASVSSTV REVSIAEPTT YTPAQTTAPT VSACTTEDGV SAPPRKRARG PSTNNTLCVA NIRSVDSTIN NIVTDNYNKH QRRNNCHSAA TPIVQLQGDS NCLKCFRYRL NDKYKHLFEL ASSTWHWASP EAPHKNAIVT LTYSSEEQRQ QFLNSVKIPP TIRHKVGFMS LHLL 10.質體：HPV117 (p7313ie 6be2.6bel.lle2) 感興趣的基因：在構築體HPV117中之多蛋白的基因是三重融合蛋白質，按順序包括6be2、6bel、lle2所有最優化和突變的密碼子。藉著PCR，使用3個先前的PCR片段；6be：l、6be2和lle2，組裝該多蛋白基因。基因的尺寸約為4.1kb，藉著PAGE和西方墨點法觀察到產生約170 kD的多蛋白。選殖：以Bam HI + Not I限制酵素消化多蛋白基因，並連接到 p7313ie載體内。所選出之純種系的定序分析，已經指出’零星的’鹼基改變，但這可藉著各種片段交換而克服。發現戶弄得的純種系hpvll7#6沒有錯誤。在HPV117中的多蛋白序列（序列識別19號）

ATGGAAGCTATTGCCAAGCGACTGGACGCCTGCCAGGAGCAGCTGCTGGAGCTGTACGAGGAAAACAG

CACAGACCTCCACAAGCACGTGCTGCACTGGAAGTGCATGCGCCACGAGTCAGTGCTCCTGTACAAGG

CCAAGCAGATGGGGCTGTCCCACATCGGGATGCAGGTCGTGCCCCCGCTGAAGGTGAGCGAAGCCAAG

GGCCACAACGCTATCGAGATGCAGATGCACCTGGAGAGCCTGCTGCGGACCGAATACAGCATGGAGCC

CTGGACTCTCCAGGAGACGTCCTACGAAATGTGGCAGACTCCTCCGAA.GCGCTGTTTCGCAAAGCGCG

GCAAGACAGTTGAGGTGAAATTCGATGGGTGCGCAAACAACACGATGGACTACGTGGTGTGGACCGAT

GTCTACGTGCAGGACAATGACACCTGGGTGAAGGTACATAGTATGGTGGATGCCAAGGGCATCTATTA -40- 88379 200411055

CACCTGCGGGCAGTTCAAGACGTACTACGTCAACTTCGTCAAGGAAGCCGAAAAGTATGGTTCCACCA

AGCACTGGGAGGTGTGTTACGGGAGTACTGTGATCTGCAGCCCCGCCTCCGTGTCGTCCACCACCCAG

GAAGTGAGCATTCCGGAGAGCACCACATACACCCCGGCCCAAACGAGCACGCTCGTCAGCAGCAGCAC

CAAGGAGGACGCCGTCCAGACGCCCCCCCGGAAGAGGGCCCGGGGGGTCCAGCAGTCTCCCTGCAATG

CCCTGTGCGTTGCTCACATCGGCCCTGTCGATTCTGGGAACCACAATCTCATCACGAACAACCACGAC

CAGCACCAAAGGCGCAACAACTCTAACAGCTCCGCAACTCCAATAGTGCAGTTCCAGGGGGAGTCCAA

CTGCCTCAAGTGTTTCCGCTACCGCCTCAACGACCGCCACCGCCACCTGTTCGACTTGATCAGTTCCA

CGTGGCACTGGGCCAGCAGCAAGGCGCCCCACAAACACGCTATCGTGACGGTGACCTACGACTCCGAG

GAGCAGAGGCAGCAGTTCCTGGACGTCGTGAAGATTCCTCCGACAATCAGCCACAAGCTTGGCTTCAT

GTCCCTGCACCTGCTGATGGCAGACGATTCCGGTACTGAGAACGAAGGTTCTGGTTGTACCGGTTGGT

TCATGGTTGAAGCAATCGTTCAGCATCCGACTGGTACCCAGATCTCCGATGACGAAGACGAAGAAGTT

GAAGATTCTGGTTACGACATGGTTGACTTCATCGATGACTCCAACATCACTCATAACTCTCTGGAAGC

ACAGGCTCTGTTTAACCGCCAGGAAGCTGATACCCATTACGCTACTGTTCAGGACCTGGGAGGCAAAT

ATCTGGGCTCTCCGTACGTTTCCCCGATCAACACTATCGCAGAAGCAGTTGAGTCTGAAATCTCCCCG

CGCCTGGACGCTATCAAACTGACTCGTCAGCCGAAGAAGGTTAAACGTCGTCTGTTCCAGACTCGTGA

ACTGACCGACTCCGGTTACGGTTATAGCGAAGTTGAGGCTGGCACCGGCACCCAGGTTGAAAAACACG

GTGTACCGGAAAACGGCGGCGACGGTCAGGAAAAGGACACCGGCCGCGACATCGAGGGTGAGGAACAC

ACCGAAGCTGAAGCTCCGACTAACTCTGTTCGTGAACACGCAGGTACTGCGGGTATCCTGGAACTGCT

GAAATGCAAAGACCTGCGCGCGGCTCTGCTGGGCAAATTCAAAGAATGCTTCGGCCTGTCTTTCATTG

ACCTGATCCGTCCGTTTAAGTCTGACAAAACTACCTGTCTGGACTGGGTTGTAGCAGGCTTCGGCATC CACCACTCTATCTCTGAAGCATTCCAGAAACTGATCGAGCCGCTGTCTCTGTACGCGCACATCCAGTG_

GCTGACTAACGCTTGGGGTATGGTTCTGCTGGTACTGCTGCGCTTTAAAGTAAACAAATCTCGTTCCA

CTGTTGCTCGTACTCTGGCTACCCTGCTGAACATCCCGGAGA?VCCAGATGCTGATCGAACCGCCGAAA

ATCCAGTCTGGTGTAGCTGCACTGTACTGGTTTCGTACTGGCATCTCTAACGCTAGCACTGTTATCGG

TGAAGCACCGGAATGGATCACTCGTCAGACCGTTATCGAACACGGTCTGGCAGATTCTCAGTTCAAAC

TGACTGAAATGGTTCAGTGGGCATACGACAACGACATCTGCGAGGAATCTGAAATTGCGTTCGAATAC

GCTCAGCGTGGCGACTTCGACTCCAACGCTCGTGCTTTCCTGAACAGCAACATGCAGGCTAAATACGT

AAAAGACTGCGCTACCATGTGCCGTCACTACAAACACGCGGAAATGCGTAAAATGTCTATCAAACAGT

GGATCAAGCACCGCGGTTCTAAAATCGAAGGTACCGGTAACTGGAAACCGATCGTTCAGTTCCTGCGC

CATCAGAACATCGAATTCATCCCGTTCCTGACCAAATTCAAGCTGTGGCTGCACGGTACCCCGAAAAA

AAACTGCATCGCTATCGTAGGTCCACCGGACACTGACAAGTCTTACTTCTGTATGTCCCTGATCTCTT

TCCTGGGCGGCACTGTAATCTCTCACGTTAACTCTTCCTCCCATTTCTGGCTGCAGCCACTGGTAGAC

GCGAAAGTAGCTCTGCTGGACGACGCGACCCAGCCGTGCTGGATCTACATGGATACTTACATGCGCAA

CCTGCTGGACGGTAACCCGATGTCTATCGACCGTAAACACAAAGCGCTGACTCTGATCAAGTGCCCGC

CGCTGCTGGTAACTTCTAACATCGACATCACCAAGGAAGATAAATACAAGTACCTGCATACCCGTGTT -41 -

88379 200411055

ACTACCTTTACTTTCCCGAACCCGTTCCCGTTTGATCGTAACGGTAACGCTGTTTACGAACTGTCCAA

CACTAACTGGAAATGCTTCTTCGAGCGTCTGTCTTCCTCCCTGGACATCCAGGACTCTGAAGATGAAG

AAGATGGTTCTAACTCTCAGGCTTTCCGTTGTGTTCCGGGTACTGTTGTTCGTACTCTGATGGAAGCC

ATCGCGAAGAGGCTCGACGCCTGCCAGGACCAGCTGCTCGAGCTGTACGAGGAGAACAGCATTGACAT

CCATAAGCACATCATGCACTGGAAGTGCATTCGCCTGGAGAGCGTGCTGTTGCACAAGGCCAAGCAGA

TGGGCCTGTCCCACATAGGCCTTCAGGTGGTCCCCCCTCTGACCGTGTCAGAGACAAAGGGCCATAAC

GCAATCGAGATGCAGATGCACCTCGAGTCGCTGGCGAAAACACAGTACGGCGTGGAGCCATGGACCCT

GCAGGACACCTCGTACGAAATGTGGCTGACCCCACCTAAGCGATGCTTCGCCAAACAGGGCAACACAG

TGGAGGTGAAGTTCGACGGCTGTGAGGATAACGTTATGGAGTATGTCGTGTGGACGCACATCTATCTG

CAGGACAACGACAGTTGGGTGAAGGTGACCAGCTCCGTGGACGCGAAGGGCATCTACTATACCTGTGG

GCAGTTTAAAACCTACTATGTGAACTTCAACAAAGAGGCCCAAAAGTATGGCTCCACCAACCACTGGG

AGGTCTGCTATGGGAGCACGGTGATTTGCTCTCCCGCCAGCGTGTCTAGCACTGTGCGCGAGGTGAGC

ATTGCCGAGCCGACCACGTACACCCCTGCCCAGACGACCGCTCCGACCGTGTCTGCTTGTACTACCGA

GGACGGCGTGAGCGCTCCACCCAGGAAGCGTGCGAGGGGCCCAAGCACCAACAACACCCTCTGTGTGG

CGAACATTCGCAGCGTCGACAGTACCATCAATAACATCGTGACGGATAACTATAACAAGCACCAGAGG

CGTAACAACTGTCACTCTGCCGCAACCCCCATCGTGCAGCTCCAGGGAGACAGCAATTGCCTTAAGTG

CTTCCGCTATCGCCTCAACGACAAGTACAAGCACCTCTTTGAGCTCGCCTCGTCGACGTGGCACTGGG

CCTCACCCGAGGCACCTCACAAGAACGCCATCGTCACTCTCACTTACTCCAGTGAGGAGCAGAGACAG

CAGTTTCTGAACAGCGTGAAGATCCCACCGACGATCCGTCATAAGGTCGGCTTCATGTCACTGCATCT

CCTGTGA 胺基酸序列（序列識別20號）

MEAIAKRLDA PLKVSEAKGH FDGCANNTMD TKHWEVCYGS RGVQQSPCNA RYRLNDRHRH GFMSLHLLMA DSNITHNSLE IKLTRQPKKV GEEHTEAEAP TCLDWWAGF

CQEQLLELYE NAIEMQMHLE YVWTDVYVQ TVICSPASVS LCVAHIGPVD LFDLISSTWH DDSGTENEGS AQALFNRQEA KRRLFQTREL TNSVREHAGT GIHHSISEAF

ENSTDLHKHV SLLRTEYSME DNDTWVKVHS STTQEVSIPE SGNHNLITNN WASSKAPHKH GCTGWFMVEA DTHYATVQDL TDSGYGYSEV AGILELLKCK QKLIEPLSLY

LHWKCMRHES PWTLQETSYE MVDAKGIYYT STTYTPAQTS HDQHQRRNNS AIVTVTYDSE 工VQHPTGTQI GGKYLGSPYV EAGTGTQVEK DLRAALLGKF AHIQWLTNAW

VLLYKAKQMG MWQTPPKRCF CGQFKTYYVN TLVSSSTKED NSSATPIVQF EQRQQFLDW SDDEDEEVED SPINTIAEAV HGVPENGGDG KECFGLSFID GMVLLVLLRF

LSHIGMQWP AKRGKTVEVK FVKEAEKYGS AVQTPPRKRA QGESNCLKCF KIPPTISHKL SGYDMVDFID ESEISPRLDA QEKDTGRDIE LIRPFKSDKT KVNKSRSTVA -42- 88379 200411055

RTLATLLNIP DSQFKLTEMV YKHAEMRKMS CIAIVGPPDT MDTYMRNLLD FPFDRNGNAV 工AKRLDACQD VSETKGHNAI CEDNVMEYW WEVCYGSTVI PSTNNTLCVA NDKYKHLFEL LHLL

ENQMLIEPPK

QWAYDNDICE

IKQWIKHRGS

DKSYFCMSLI

GNPMSIDRKH

YELSNTNWKC

QLLELYEENS

EMQMHLESLA

WTHIYLQDND

CSPASVSSTV

NIRSVDSTIN

ASSTWHWASP

工QSGVAALYW ESEIAFEYAQ KIEGTGNWKP SFLGGTVISH KALTLIKCPP FFERLSSSLD IDIHKHIMHW KTQYGVEPWT SWVKVTSSVD REVSIAEPTT NIVTDNYNKH EAPHKNAIVT

FRTGISNAST RGDFDSNARA IVQFLRHQNI VNSSSHFWLQ LLVTSNIDIT 工QDSEDEEDG KCIRLESVLL LQDTSYEMWL AKGIYYTCGQ YTPAQTTAPT QRRNNCHSAA LTYSSEEQRQ

VIGEAPEWIT

FLNSNMQAKY

EFIPFLTKFK

PLVDAKVALL

KEDKYKYLHT

SNSQAFRCVP

HKA.KQMGLSH

TPPKRCFAKQ

FKTYYVNFNK

VSACTTEDGV

TPIVQLQGDS

QFLNSVKIPP

RQTVIEHGLA VKDCATMCRH LWLHGTPKKN DDATQPCWIY RVTTFTFPNP GTWRTLMEA 工 GLQWPPLT GNTVEVKFDG EAQKYGSTNH SAPPRKRARG NCLKCFRYRL TIRHKVGFMS 11.質體：HPV118 (p7313ie 6be2.lle2.6bel) 感興趣的基因：在構築體HPV118中之多蛋白的基因是三重融合蛋白質，按順序包括6be2、1 le2、6bel所有最優化和突變的密碼子。藉著PCR，使用2個先前的PCR片段；6bel和ll/6be2，組裝該多蛋白基因。基因的尺寸約為4· 1 kb，藉著PAGE和西方墨點法觀察到產生約170 kD的多蛋白。選殖：以Bam HI + Not I限制酵素消化多蛋白基因，並連接到 p7313ie載體内。所選出之純種系的定序分析，已經指出’零星的'鹼基改變，但這可藉著各種片段交換而克服。發現所得的純種系hpvll8#3沒有錯誤。在HPV118中的多蛋白序列（序列識別21號） -43 - 88379 200411055

ATGGAAGCTATTGCCAAGCGACTGGACGCCTGCCAGGAGCAGCTGCTGGAGCTGTACGAGGAAAACAG

CACAGACCTCCACAAGCACGTGCTGCACTGGAAGTGCATGCGCCACGAGTCAGTGCTCCTGTACAAGG

CCAAGCAGATGGGGCTGTCCCACATCGGGATGCAGGTCGTGCCCCCGCTGAAGGTGAGCGAAGCCAAG

GGCCACAACGCTATCGAGATGCAGATGCACCTGGAGAGCCTGCTGCGGACCGAATACAGCATGGAGCC

CTGGACTCTCCAGGAGACGTCCTACGAAATGTGGCAGACTCCTCCGAAGCGCTGTTTCGCAAAGCGCG

GCAAGACAGTTGAGGTGAAATTCGATGGGTGCGCAAACAACACGATGGACTACGTGGTGTGGACCGAT

GTCTACGTGCAGGACAATGACACCTGGGTGAAGGTACATAGTATGGTGGATGCCAAGGGCATCTATTA

CACCTGCGGGCAGTTCAAGACGTACTACGTCAACTTCGTCAAGGAAGCCGAAAAGTATGGTTCCACCA

AGCACTGGGAGGTGTGTTACGGGAGTACTGTGATCTGCAGCCCCGCCTCCGTGTCGTCCACCACCCAG

GAAGTGAGCATTCCGGAGAGCACCACATACACCCCGGCCCAAACGAGCACGCTCGTCAGCAGCAGCAC

CAAGGAGGACGCCGTCCAGACGCCCCCCCGGAAGAGGGCCCGGGGGGTCCAGCAGTCTCCCTGCAATG

CCCTGTGCGTTGCTCACATCGGCCCTGTCGATTCTGGGAACCACAATCTCATCACGAACAACCACGAC

CAGCACCAAAGGCGCAACAACTCTAACAGCTCCGCAACTCCAATAGTGCAGTTCCAGGGGGAGTCCAA

CTGCCTCAAGTGTTTCCGCTACCGCCTCAACGACCGCCACCGCCACCTGTTCGACTTGATCAGTTCCA

CGTGGCACTGGGCCAGCAGCAAGGCGCCCCACAAACACGCTATCGTGACGGTGACCTACGACTCCGAG

GAGCAGAGGCAGCAGTTCCTGGACGTCGTGAAGATTCCTCCGACAATCAGCCACAAGCTTGGCTTCAT

GTCCCTGCACCTGCTGATGGAAGCCATCGCGAAGAGGCTCGACGCCTGCCAGGACCAGCTGCTCGAGC

TGTACGAGGAGAACAGCATTGACATCCATAAGCACATCATGCACTGGAAGTGCATTCGCCTGGAGAGC

GTGCTGTTGCACAAGGCCAAGCAGATGGGCCTGTCCCACATAGGCCTTCAGGTGGTCCCCCCTCTGAC

CGTGTCAGAGACAAAGGGCCATAACGCAATCGAGATGCAGATGCACCTCGAGTCGCTGGCGAAAACAC

AGTACGGCGTGGAGCCATGGACCCTGCAGGACACCTCGTACGAAATGTGGCTGACCCCACCTAAGCGA

TGCTTCGCCAAACAGGGCAACACAGTGGAGGTGAAGTTCGACGGCTGTGAGGATAACGTTATGGAGTA

TGTCGTGTGGACGCACATCTATCTGCAGGACAACGACAGTTGGGTGAAGGTGACCAGCTCCGTGGACG

CGAAGGGCATCTACTATACCTGTGGGCAGTTTAAAACCTACTATGTGAACTTCAACAAAGAGGCCCAA

AAGTATGGCTCCACCAACCACTGGGAGGTCTGCTATGGGAGCACGGTGATTTGCTCTCCCGCCAGCGT

GTCTAGCACTGTGCGCGAGGTGAGCATTGCCGAGCCGACCACGTACACCCCTGCCCAGACGACCGCTC

CGACCGTGTCTGCTTGTACTACCGAGGACGGCGTGAGCGCTCCACCCAGGAAGCGTGCGAGGGGCCCA

AGCACCAACAACACCCTCTGTGTGGCGAACATTCGCAGCGTCGACAGTACCATCAATAACATCGTGAC

GGATAACTATAACAAGCACCAGAGGCGTAACAACTGTCACTCTGCCGCAACCCCCATCGTGCAGCTCC

AGGGAGACAGCAATTGCCTTAAGTGCTTCCGCTATCGCCTCAACGACAAGTACAAGCACCTCTTTGAG

CTCGCCTCGTCGACGTGGCACTGGGCCTCACCCGAGGCACCTCACAAGAACGCCATCGTCACTCTCAC

TTACTCCAGTGAGGAGCAGAGACAGCAGTTTCTGAACAGCGTGAAGATCCCACCGACGATCCGTCATA

AGGTCGGCTTCATGTCACTGCATCTCCTGATGGCAGACGATTCCGGTACTGAGAACGAAGGTTCTGGT

TGTACCGGTTGGTTCATGGTTGAAGCAATCGTTCAGCATCCGACTGGTACCCAGATCTCCGATGACGA

AGACGAAGAAGTTGAAGATTCTGGTTACGACATGGTTGACTTCATCGATGACTCCAACATCACTCATA 44- 88379 200411055

ACTCTCTGGAAGCACAGGCTCTGTTTAACCGCCAGGAAGCTGATACCCATTACGCTACTGTTCAGGAC

CTGGGAGGCAAATATCTGGGCTCTCCGTACGTTTCCCCGATCAACACTATCGCAGAAGCAGTTGAGTC

TGAAATCTCCCCGCGCCTGGACGCTATCAAACTGACTCGTCAGCCGAAGAAGGTTAAACGTCGTCTGT

TCCAGACTCGTGAACTGACCGACTCCGGTTACGGTTATAGCGAAGTTGAGGCTGGCACCGGCACCCAG

GTTGAAAAACACGGTGTACCGGAAAACGGCGGCGACGGTCAGGAAAAGGACACCGGCCGCGACATCGA

GGGTGAGGAACACACCGAAGCTGAAGCTCCGACTAACTCTGTTCGTGAACACGCAGGTACTGCGGGTA

TCCTGGAACTGCTGAAATGCAAAGACCTGCGCGCGGCTCTGCTGGGCAAATTCAAAGAATGCTTCGGC

CTGTCTTTCATTGACCTGATCCGTCCGTTTAAGTCTGACAAAACTACCTGTCTGGACTGGGTTGTAGC

AGGCTTCGGCATCCACCACTCTATCTCTGAAGCATTCCAGAAACTGATCGAGCCGCTGTCTCTGTACG

CGCACATCCAGTGGCTGACTAACGCTTGGGGTATGGTTCTGCTGGTACTGCTGCGCTTTAAAGTAAAC

AAATCTCGTTCCACTGTTGCTCGTACTCTGGCTACCCTGCTGAACATCCCGGAGAACCAGATGCTGAT

CGAACCGCCGAAAATCCAGTCTGGTGTAGCTGCACTGTACTGGTTTCGTACTGGCATCTCTAACGCTA

GCACTGTTATCGGTGAAGCACCGGAATGGATCACTCGTCAGACCGTTATCGAACACGGTCTGGCAGAT

TCTCAGTTCAAACTGACTGAAATGGTTCAGTGGGCATACGACAACGACATCTGCGAGGAATCTGAAAT

TGCGTTCGAATACGCTCAGCGTGGCGACTTCGACTCCAACGCTCGTGCTTTCCTGAACAGCAACATGC

AGGCTAAATACGTAAAAGACTGCGCTACCATGTGCCGTCACTACAAACACGCGGAAATGCGTAAAATG

TCTATCAAACAGTGGATCAAGCACCGCGGTTCTAAAATCGAAGGTACCGGTAACTGGAAACCGATCGT

TCAGTTCCTGCGCCATCAGAACATCGAATTCATCCCGTTCCTGACCAAATTCAAGCTGTGGCTGCACG

GTACCCCGAAAAAAAACTGCATCGCTATCGTAGGTCCACCGGACACTGACAAGTCTTACTTCTGTATG

TCCCTGATCTCTTTCCTGGGCGGCACTGTAATCTCTCACGTTAACTCTTCCTCCCATTTCTGGCTGCA

GCCACTGGTAGACGCGAAAGTAGCTCTGCTGGACGACGCGACCCAGCCGTGCTGGATCTACATGGATA

CTTACATGCGCAACCTGCTGGACGGTAACCCGATGTCTATCGACCGTAAACACAAAGCGCTGACTCTG

ATCAAGTGCCCGCCGCTGCTGGTAACTTCTAACATCGACATCACCAAGGAAGATAAATACAAGTACCT

GCATACCCGTGTTACTACCTTTACTTTCCCGAACCCGTTCCCGTTTGATCGTAACGGTAACGCTGTTT

ACGAACTGTCCAACACTAACTGGAAATGCTTCTTCGAGCGTCTGTCTTCCTCCCTGGACATCCAGGAC

TCTGAAGATGAAGAAGATGGTTCTAACTCTCAGGCTTTCCGTTGTGTTCCGGGTACTGTTGTTCGTAC

TCTGTGA 胺基酸序列（序列識別22號）

MEAIAKRLDA PLKVSEAXGH FDGCANNTMD TKHWEVCYGS RGVQQSPCNA

CQEQLLELYE NAIEMQMHLE YWWTDVYVQ TVICSPASVS LCVAHIGPVD

ENSTDLHKHV SLLRTEYSME DNDTWVKVHS STTQEVSIPE SGNHNLITNN

LHWKCMRHES PWTLQETSYE MVDAKGIYYT STTYTPAQTS HDQHQRRNNS

VLLYKAKQMG MWQTPPKRCF CGQFKTYYVN TLVSSSTKED NSSATPIVQF

LSHIGMQWP AKRGKTVEVK FVKEAEKYGS AVQTPPRKRA QGESNCLKCF 45- 88379 200411055

RYRLNDRHRH GFMSLHLLME HIGLQWPPL QGNTVEVKFD KEAQKYGSTN VSAPPRKRAR SNCLKCFRYR PTIRHKVGFM DMVDFIDDSN 工SPRLDAIKL DTGRDIEGEE PFKSDKTTCL KSRSTVARTL VIEHGLADSQ CATMCRHYKH HGTPKKNCIA TQPCWIYMDT TFTFPNPFPF VRTL

LFDLISSTWH

AIAKRLDACQ

TVSETKGHNA

GCEDNVMEYV

HWEVCYGSTV

GPSTNNTLCV

LNDKYKHLFE

SLHLLMADDS

ITHNSLEAQA

TRQPKKVKRR

HTEAEAPTNS

DWWAGFGIH

ATLLNIPENQ

FKLTEMVQWA

AEMRKMSIKQ

IVGPPDTDKS

YMRNLLDGNP

DRNGNAVYEL

WASSKAPHKH DQLLELYEEN IEMQMHLESL WTHIYLQDN ICS PAS VS ST ANIRSVDSTI LASSTWHWAS GTENEGSGCT LFNRQEADTH LFQTRELTDS VREHAGTAGI HSISEAFQKL MLIEPPKIQS YDNDICEESE WIKHRGSKIE YFCMSLISFL MSIDRKHKAL SNTNWKCFFE

AIVTVTYDSE SIDIHKHIMH AKTQYGVEPW DSWVKVTSSV VREVSIAEPT NNIVTDNYNK PEAPHKNAIV GWFMVEAIVQ YATVQDLGGK GYGYSEVEAG LELLKCKDLR 工EPLSLYAH工 GVAALYWFRT IAFEYAQRGD GTGNWKPIVQ GGTVISHVNS TLIKCPPLLV RLSSSLDIQD

EQRQQFLDW WKCIRLESVL TLQDTSYEMW DAKGIYYTCG TYTPAQTTAP HQRRNNCHSA TLTYSSEEQR HPTGTQISDD YLGSPYVSP工 TGTQVEKHGV AALLGKFKEC QWLTNAWGMV GISNASTVIG FDSNARAFLN FLRHQNIEFI SSHFWLQPLV TSNIDITKED SEDEEDGSNS

KIPPTISHKL

LHKAKQMGLS

LTPPKRCFAK

QFKTYYWFN

TVSACTTEDG

ATPIVQLQGD

QQFLNSVKIP

EDEEVEDSGY

NTIAEAVESE

PENGGDGQEK

FGLSFIDLIR

LLVLLRFKVN

EAPEWITRQT

SNMQAKYVKD

PFLTKFKLWL

DAKVALLDDA

KYKYLHTRVT

QAFRCVPGTV 從來自 David Hodgeson (Warwick University)之質體 pDAH212的繼代純種系中，獲得ColEl cer序歹ij ，並藉著 PCR，使用引子擴大，將EcoRI限制位置放在序列的末端。然後將cer序列插入p7313-PL的EcoRI位置内，產生質體 p7313-PLc 。對Genbank登記M11411證實已經擴大之cer的序列。實例2_在哺乳動物293T細臉中表现在 37 C 下’在 5%C〇2 中，以每 6孔 Corning CostarTM(Corning Science Products，10 The ValleyCentre，Gordon Road，High Wycombe，Bucks，UK)組織培養盤2X1 〇5個細胞之終濃度，使哺乳動物293T細胞生長至對數期。製備下列的轉移感染混合物並複合2 5分鐘： -46- 88379.doc 200411055 感興趣的DNA 2微克 2微克溶解於無菌的二次蒸餾水中 16微升 OPTI-mem™ (Gibco BRL, Paisley, Scotland) 8微升脂染胺TM(GibcoBRL) 6微升。以OPTl-memTM小心地沖洗在孔中的每個細胞單層兩次。在每孔中加入800微升OPTI-memTM。在每個轉移感染混合物中加入200微升OPTI-mem™，混合並溫和地加至細胞單層中。在37°C下，在5%C02中，培養該盤5小時，隨後拋棄轉移感染混合物和〇PTI-memTM。以細胞生長培養基溫和地沖洗細胞單層兩次，並在37°C下，在5%C02中，在含有10%胎牛血清和29.2毫克/毫升L-穀胺醯胺的杜貝可氏 (Dulbecco、）經過修改的鷹式（Eagle)培養基中培養完全轉移感染的細胞24小時。將細胞刮到微量試管中，以PBS沖洗兩次，離心並將細胞小球再懸浮於SDS Page Laemmli染料中。將細胞小球煮沸，並裝入10%SDS Page凝膠中，在IX Tris 甘胺酸SDS緩衝溶液中電泳。在電泳之後，將凝膠沾染到硝基纖維素膜（Amersham)上，並進行西方墨點法。在室溫下，以在 PBS 中之 5% MarvelTM (Premier Beverages，Knighton， Adbaston，Stafford，UK)阻斷該确基纖維素膜30分鐘，並以 PBS和0.1 %吐溫20沖洗兩次。以在PBS中之5% MarvelTM稀釋在兔子中對HPV6bEl之C終端蛋白質序列（蛋白質序列： CSSSLDIQDSEDEEDGSNSQAFR序列識別23號）升高的多株抗體，並加至硝基纖維素膜上。在室溫下培養1小時，並溫 88379 -47- 200411055 和地攪動。亦使用對抗HPV11E1的多株抗體來檢查交叉反應性。移出稀釋的抗體，並以PBS和0.1%吐溫20沖洗膜三次。以PBS和0.1%吐溫20稀釋二級共軛物，豬抗-兔子辣根過氧化酶（HRP)(DAKO)至1:20000。將其加至經過沖洗的膜上，並在室溫下溫和地攪動，培養1小時。然後以PBS和0.1 % 吐溫20徹底沖洗該膜。使用化學發光HRP套組（Amersham)，檢查轉移到膜上的蛋白質。結果：結果（圖13)顯示分別由含有密碼子最優化HPV多蛋白之 HPV 116、117、118表現的正確蛋白質尺寸。以大約0.5微克之個別構築體的DNA轉移感染HEK293T細胞，並在24小時之後收獲細胞。然後藉著第一個聚丙烯醯胺凝膠電泳分析這些試樣，然後再以西方墨點法分析。使用兩個肽抗體來檢測多蛋白的表現（約180 kd);抗-6bEl (第 1097 號）和抗-6bE2 (第 1101號）。實例3 E1抗原的失活和實驗證明 HPVE1蛋白質是完全保留的核蛋白，具有非-專一的DNA 結合、ATP酶和解螺旋酶活性。E1亦與宿主細胞DNA聚合酶 -α引導酶結合，並與HPV E2蛋白質結合，然後其’招募’ E1，成為前-起始病毒DNA複製複合體。Ε1的主要角色是在被感染的細胞中，發動病毒專一的DNA複製。 Ε1 (和Ε2)的DNA複製功能，是相對上非·專一的，且許多研究目前已經顯示得自一個基因型的Ε1和Ε2蛋白質可駕馭 88379 -48- 200411055 帶有得自不同基因型之複製起點序列的質體專一的DNA複製起點。研究亦已經顯示將高度表現的E1和E2導入業已藏有低副本數目HPV質體的細胞内，結果明顯地擴大了該質體。該雜亂使其具有低可能的安全風險，調查這項課題而加以排除。結果，尋找在E1 (和E2)中使其複製效能失活的突變。 E1突變G482D出現在高度保留的ATP結合一致序列中，並已經顯示帶有該突變的E1蛋白質具有多個功能缺陷。已經顯示其他朝向蛋白質N-終端的突變（K83G、R84G)，廢止了 E1的核定位作用。無法定位核的隔間，亦將足以分開E1與宿主複製蛋白質和病毒DNA，提供無能和安全性的额外標準。選擇這些突變（G428D、K83G、R84G)，並併入E1，成為HPVDNA免疫治療E1載體的一部分。使用在活體外的HPVDNA複製測定，證實E1之DNA複製功能的無能（由於推論的結果，亦能夠在該相同的測定中證實E2之提高複製活性的突變失活）。簡言之，E1和E2兩者以共同_操作之方式激活HPV的複製起點，並已知得自HPV 6b 之El和E2蛋白質激活並重新駕馭得自HPV-11起點的DNA 複製。利用攜帶HPV-11複製起點的質體（ori質體），將編碼我們的密碼予-最優化E1和E2序列之質體共同_轉移至293 細胞内。藉著在共同-轉移感染之後48小時，從細胞中獲得 DNA，來測量輸入ori質體的E1和E2依賴性複製（Hirt溶解）。首先以限制酵素Hind III消化經過萃取的DNA，然後以Dpn I 消化，其消化未經甲基化未複製的DNA。然後進行DNA的 88379 -49- 200411055 南方墨點法，並與做為探針的〇ri質體DNA雜交。在Dpnl消化之後，具有等於質體之尺寸的譜帶是重新在活體外複製之質體DNA的標記。野外型E1和E2(HPV119 + HPV120)顯示一強譜帶，代表複製的輸入質體DN A。三個引導構築體的結果顯示均為陰性的（HPV 116、HPV 117 和 HPV 118);沒有複製。結論：引導構築體HPV 116、HPV 117和HPV 118沒有DNA 複製活性。實例4 乳頭狀瘤病毒的E2蛋白質是位置-專一的DNA結合核蛋白，具有作為主要複製起點認知蛋白質的功能，並幫助前-起始DNA複製複合體的組裝。全長的E2蛋白質亦可作為病毒轉錄的阻遏物或活化劑（相對於其他轉錄因子之位置），視其位置及該蛋白質對其關聯結合位置之親和力而定。亦已知E2影響數個宿主細胞啟動基因的轉錄。已經廣泛地研究了 E2的突變失活，並已經顯示一個特殊的點突變Lys 111 — Ala (KillA)，使E2的轉錄和複製功能兩者失活。該突變亦可能具有防止蛋白質之核移位的額外益處。將該突變 (K111A)併入每個E2抗原内，成為HPVDNA免疫治療的一部分。

我們著手證實KillA突變之E2和每個多蛋白構築體，在活體外CAT轉錄報告者測定中的無能。我們使用兩個陽性對照組（有活性之E2蛋白質的來源）。有一個構築體表現未突變（有活性的）HPV-11 E2蛋白質，而第二個載體表現BPV 88379 -50- 200411055 E2蛋白質，一個強轉錄的轉活化劑。在圖14中顯示這些資料。結論：這些資料顯示從天然（未突變的）HPV 6b E2載體中表現的蛋白質，在轉錄上是具有活性的，而突變的（K111A) E2是沒有活性的，就像多蛋白載體HPV 116、117和11 8的每一個。實例5 個別基因構築體HPV 116、HP V 117和HPV 118的表現和比較比較引導構築體HPV 116、HPV 117和HPV 118的基因表現研究，在活體外的基因表現中，無法確認任何清楚的差異。此外，多蛋白的表現等於個別（未融合）抗原在單一質體中的表現（HPV110)。同樣重要的是，導入點突變不影響基因表現（HPV 108 和 HPV 110)。實例6 在老鼠中，在活體内的免疫原性研究為了比較三種不同構築體HPV 116、HPV 117和HPV 118 在活體内的免疫原性，使用PMID免疫老鼠。每個免疫包括兩次注射〇·5微克DNA至Balb/c (H-2Kd)或 C57BL6(H-2Kb)老鼠剃過毛的腹部内。以1微克DNA謗發動物，在21天之後以相等的劑量補強，並在補強5_7天之後揀選。取得血清和脾臟，分析在PMID之後產生的體液和細胞免疫反應。體液測定 88379 -51 - 200411055 使用標準ELISA方法，並以重組的El和E2蛋白質作為捕捉抗原，評估在PMID免疫之老鼠中升高的抗體。不能可靠地檢測抗體反應，除了在E2免疫老鼠中延長免疫計畫之後。我們未證實在老鼠中，對E1抗原之抗體的檢測。將這些弱/不可檢測的抗體反應保留在公開的文獻中。細胞測定使用ELISPOT測定，研究在老鼠中的細胞免疫反應。該技術適合用來評估在已知密度的培養物中，能夠專一地反映出現在同基因MHC分子情況下之抗原而分泌細胞激動素之細胞的頻率。簡言之，將分離自免疫動物之脾臟細胞的單一細胞懸浮液加至塗覆有抗-細胞激動素捕捉抗體之專門的微量滴定盤上，並在由適當標乾細胞提供之抗原的存在下培養過夜。在直接圍繞細胞之處，藉著與培養盤結合之抗體捕捉細胞激動素，並當溶解和洗掉細胞時仍保持結合。藉著使用生物素基化的二級抗-細胞激動素抗體和鏈黴素抗生物素蛋白鹼性磷酸酶共軛物，完成檢測。該酵素對發色團受質的作用，容許看見產生細胞激動素之細胞的頻率。牛痘ELISPOT測定和資料因為缺乏已定義的老鼠T細胞抗原決定位，以設計用來表現標靶抗原之重組牛痘病毒的形式提供。使用這類病毒感染適當的標靶細胞，在ELISPOT測定中將抗原提交給效應物細胞。在三個候選構築體對C57BL/6老鼠的PMID之後，檢測對 88379 -52- 200411055 HPV 6bEl的反應。以統計之方式分析2個分開實驗的結果。在圖15和16中出示代表性實驗的結果。作為例證的免疫原性資料，在老鼠中使用引導構築體和 PMID ： CTL·測定和資料激活的CD8+ T細胞能夠反映在同基因MHC I分子的情況下出現之特定肽而溶解細胞。可藉著Eu3 +釋放生物測定，一種傳統鉻釋放測定的非-放射性修改，來判定該功能。為了這些目的使用該測定，需要確認衍生自HP V 6bE 1蛋白質之主要序列的CD8+ T細胞抗原決定位。這可藉著使用細胞激動素ELISPOT，篩選包括與11重疊之15-聚的肽庫而達成。藉著標準流動技術，確認反映之組群為CD4 +或CD8 + T細胞。該技術之基礎涉及溶解以關聯肽脈衝之Eu3 +標示的標乾細胞。在兩小時的培養期間内，當標靶細胞被細胞溶解T 細胞溶解時，Eu3 +便被釋放到培養物上清液中。這可藉著時間-決定的螢光測定法檢測之。以在藉著化學方法溶解標靶細胞時所檢測到之溶解總量的百分比，來表現專一的溶解作用。評估細胞免疫學資料 HPV 116、HPV 117和HPV 118的免疫學評估，包括在老鼠中利用牛痘ELISPOT和CTL測定分析作為免疫學輸出的重複PMID免疫研究。所有候選者均對每個抗原升高強的免疫反應。 88379 -53- 200411055 牛痘ELISPOT資料，集體地顯示對El的反應，並未藉由突變或與E2抗原組份融合而得到解決。此時，比較在 HPV-108(單一 6b E1構築體）、HPV 116、HPV 117與 HPV 118 之間的E1反應，反應在統計學上並無差異。然而，牛痘 ELISPOT資料卻在對HPV-11 E2抗原組份的反應上顯示出差異。在以HPV 118免疫的老鼠中，E2抗原專一性反應明顯地比以HPV 116或HPV 117免疫之老鼠中的反應更大。僅以此為基礎，HPV 118似乎是比HPV 116或HPV 117更優異的免疫原。 E1抗原專一之CTL溶解的分析，亦顯示出效力的趨勢。使用T-細胞形式之HPV 118免疫老鼠的專一性溶解百分比比利用HPV 116或HPV 117的更高。該觀察是可再現的。總而言之，並以牛痘ELISPOT和CTL溶解兩者的資料為基礎，HPV 118是較強的免疫原。結論：在純免疫學的基準上，構築體HPV 118是最具免疫原性的多蛋白。實例7 密碼子-最優化COPV E1/E2融合蛋白質的PMID遞送，在保護對抗犬口腔乳頭狀瘤病毒疾病上，比單獨的密碼子-最優化E1或密碼子-最優化E2更有效。導入犬口腔乳頭狀瘤病毒（COPV)動物模式是黏膜人類乳頭狀瘤病毒疾病的良好模仿物。在狗由C0PV引起之疾病的特徵，非常類似發生在人類中的特徵（Nicholls等人Virology 88379 -54- 200411055 2001，283(1) 31-39)。重要的是，它是黏膜乳頭狀瘤病毒的模式。COP V病毒感染犬黏膜上皮，並在疣出現數週的遲滯期之後，然後在數週的額外期間之後自動退化。COPV病毒編碼每個人類乳頭狀瘤病毒基因（El、E2、E4、E6、E7、L1 和L2)的同系物。先前已經使用狗COPV黏膜疾病模式作為發展人類類病毒顆粒（VLP)乳頭狀瘤病毒疫苗原理的關鍵模式（Ghim等人，

Vaccines 1995 25，375-379，Suzich等人，PNAS 1995，92 11553-11557)。現在正在發展人類乳頭狀瘤病毒VLP疫苗，且最近已經完成人類的早期臨床試驗。我們顯示在藉著PMID投予時，編碼密碼子最優化融合之 E1和E2基因的質體DNA，減輕疾病的負擔，比單獨編碼密碼子最優化E1或密碼子最優化E2的質體更有效。方法密碼子-最優化E2/E1融合裁體6^^ 使用先前描述的方法’產製編碼密碼子_最優化C〇pv E2 序列的合成基因。將其與從純種系pC〇pvEl c/o中回收之合成的密碼子·最優化COPV E1基因融合，並插入載體 WRG7〇77内，產生新的純種系，將其命名為pC〇pvE2/E1 c/o。該純種系表現包括COPV E2 (N終端）和COPV El (C終端）融合的多蛋白。藉著西方墨點法判定，該多蛋白具有預期的尺寸。利用 pCOPVg上、p_gQPVE2 g/义和 dC〇PVE2/E1 c/o 免癌 + 獵犬 88379 -55- 200411055 藉著PMID，分別利用三種經過純化的質體pC〇PvEl c/〇、pCOPVE2 c/o和pCOPVE2/El c/o免疫小獄犬。在腹部中線每一側的12個皮膚位置，6個未重疊的位置免疫動物。所有的預防接種均在普通的麻醉下進行。每組有五隻動物。在第一次預防接種之後六週，以相同的方式著手補強接種，使用相同的程序。在最後的補強免疫之後2週，以有傳染性的c〇PV病毒攻毒經過免疫的動物。在每隻動物上唇的黏膜輕輕地劃許多細痕。將10微克經過純化的CQPV病毒製品分別塗抹在十個位置（在上唇每一邊各五個），並容許吸收數分鐘。已經描述了有傳染力之COPV病毒的分離和純化（Vir〇i〇gy 1999，265 (2) 365-374) 〇在以COP V病毒攻毒之後，每週檢查黏膜攻毒的地方。測量疲（乳頭狀瘤）出現的時間（在攻毒之後）和虎的尺寸（毫米）。在以pCOPVEl c/o免疫的動物中，在攻毒後第7週開始在黏膜攻毒的地方發展出乳頭狀瘤。乳頭狀瘤持續生長，在第11週尺寸達到>3.5毫米的平均尺寸。在以pc〇pvE2 c/o免疫的動物中，在第8週首先出現乳頭狀瘤，但在第丨丨週時平均的乳頭狀瘤尺寸達到1.5毫米。在以pC〇pvE2/El c/o免疫的動物中，雖然疾病的第一個症狀與其他組同時發生，但明顯地降低了整體的疾病負擔。在PCOPVE2/E1 c/o組（五隻）中有一隻動物，被完全保護而免於疾病的發展，而在該組中所有其他的動物均僅發展出極小的乳頭狀瘤，並在短期 88379 -56- 200411055 (1-2週）内退化。在該乳頭狀瘤病毒感染的動物模式中，編碼COPV E1和 COPVE2融合的質體DNA，對於防止疾病的發展，比COPV El或COPV E2任一個都更有效。(圖18) 【圖式簡單說明】圖1為本發明之HPV免疫治療疫苗構築體的圖解。圖2為P70776be2的質體輿圖-編碼HPV 6b E2,其已經是最優化和突變的密碼子。圖3是p73plc6bel的質體輿圖·編碼HPV 6b E1，其已經是最優化和突變的密碼子。圖4是p707711e2的質體輿圖-編碼HPV 11 E2,其已經是最優化和突變的密碼子。圖5是HPV 102的質體舆圖_在？7313背景中編碼HPV 11 E2 ° 圖6是HPV 104的質體舆圖-在p7313背景中，融合來自HPV 6b的E2和來自HPV 11的E2。圖7是HPV 105的質體輿圖-融合最優化、突變的HPV 6b E2密碼子和得自HP V 11的E2。圖8是HPV 108的質體輿圖·在p7313背景中，最優化、突變的HPV 6b E1密碼子。圖9是HPV 110的質體舆圖-在p7313背景中，最優化、突變的HPV 6b E2密碼子。圖 10是 HPV 116的質體舆圖-HPV 6b El、HPV 6b E2、HPV 11 E2。 88379 -57- 200411055 圖11是1^¥117的質體輿圖-1^乂65£2、1^¥11£2、1^¥ 6b El。圖12是HPV118的質體輿圖-HPV6bE2、HPVllE2、HPV 6b El。圖13是在293 T細胞中，本發明之三個多蛋白構築體的西方墨點分析。圖14顯示在活體外，在CAT轉錄報告者測定中ΚΙΙΙΑ突變之E2的無能。圖15顯示在老鼠中對E1的細胞免疫反應。圖16顯示對E2的細胞免疫反應。圖17在PMID之後，利用HPV 118的-CTL測定資料。圖18顯示在COPV模式中，在投予E1/E2之後，疣的縮減。 88379 -58- 200411055 序列表 <11〇> 英商葛蘭素集團有限公司 <120> 疫苗 <130> PG4961 <140> 092127210 <141〉 2003-10-23 <150> GB0222953.2 <151〉 2002-10-3 <160> 28 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 1107

<212> DNA <213> HPV <400> 1 atggaagcta ttgccaagcg actggacgcc tgccaggagc agctgctgga gctgtacgag 60 gaaaacagca·cagacctcca caagcacgtg ctgcactgga agtgcatgcg ccacgagtca 120 gtgctcctgt acaaggccaa gcagatgggg ctgtcccaca tcgggatgca ggtcgtgccc 180 ccgctgaagg tgagcgaagc caagggccac aacgctatcg agatgcagat gcacctggag 240 agcctgctgc ggaccgaata cagcatggag ccctggactc tccaggagac gtcctacgaa 300 atgtggcaga ctcctccgaa gcgctgtttc gcaaagcgcg gcaagacagt tgaggtgaaa 360 ttcgatgggt gcgcaaacaa cacgatggac tacgtggtgt ggaccgatgt ctacgtgcag 420 gacaatgaca cctgggtgaa ggtacatagt atggtggatg ccaagggcat ctattacacc 480 tgcgggcagt tcaagacgta ctacgtcaac ttcgtcaagg aagccgaaaa gtatggttcc 540 accaagcact gggaggtgtg ttacgggagt actgtgatct gcagccccgc ctccgtgtcg 600 tccaccaccc aggaagtgag cattccggag agcaccacat acaccccggc ccaaacgagc 660 acgctcgtca gcagcagcac caaggaggac gccgtccaga cgcccccccg gaagagggcc 720 cggggggtcc agcagtctcc ctgcaatgcc ctgtgcgttg ctcacatcgg ccctgtcgat 780 tctgggaacc acaatctcat cacgaacaac cacgaccagc accaaaggcg caacaactct 840 aacagctccg caactccaat agtgcagttc cagggggagt ccaactgcct caagtgtttc 900 cgctaccgcc tcaacgaccg ccaccgccac ctgttcgact tgatcagttc cacgtggcac 960 tgggccagca gcaaggcgcc ccacaaacac gctatcgtga cggtgaccta cgactccgag 1020 gagcagaggc agcagttcct ggacgtcgtg aagattcctc cgacaatcag ccacaagctt 1080 ggcttcatgt ccctgcacct gctgtga 1107

<210> 2 <211> 368 <212>蛋白質 <213> HPV <400> 2

Met Glu Ala lie Ala Lys Arg Leu Asp Ala Cys Gin Glu Gin Leu Leu 1 5 10 15

Glu Leu Tyr Glu Glu Asn Ser Thr Asp Leu His Lys His Val Leu His 20 25 30

Trp Lys Cys Met Arg His Glu Ser Val Leu Leu Tyr Lys Ala Lys Gin 35 40 45

Met Gly Leu Ser His 工le Gly Met Gin Val Val Pro Pro Leu Lys Val 50 55 60

Ser Glu Ala Lys Gly His Asn Ala lie Glu Met Gin Met His Leu Glu 65 70 75 80

Ser Leu Leu Arg Thr Glu Tyr Ser Met Glu Pro Trp Thr Leu Gin Glu 85 90 95

Thr Ser Tyr Glu Met Trp Gin Thr Pro Pro Lys Arg Cys Phe Ala Lys 100 105 110

Arg Gly Lys Thr Val Glu Val Lys Phe Asp Gly Cys Ala Asn Asn Thr 115 120 125

Met Asp Tyr Val Val Trp Thr Asp Val Tyr Val Gin Asp Asn Asp Thr 130 135 140

Trp Val Lys Val His Ser Met Val Asp Ala Lys Gly lie Tyr Tyr Thr 145 150 155 160 . 88379 200411055

Cys Gly Gin Phe Lys Thr Tyr Tyr 165

Lys Tyr Gly Ser Thr Lys His Trp 180 lie Cys Ser Pro Ala Ser Val Ser 195 200

Pro Glu Ser Thr Thr Tyr Thx Pro 210 215

Ser Ser Thr Lys Glu Asp Ala Val 225 230

Arg Gly Val Gin Gin Ser Pro Cys 245

Gly Pro Val Asp Ser Gly Asn His 260

Val Asn Phe Val Lys Glu Ala Glu 170 175

Glu Val Cys Tyr Gly Ser Thr Val 185 190

Ser Thr Thr Gin Glu Val Ser lie 205

Ala Gin Thr Ser Thr Leu Val Ser 220

Gin Thr Pro Pro Arg Lys Arg Ala 235 240

Asn Ala Leu Cys Val Ala His lie 250 255

Asn Leu lie Thr Asn Asn His Asp 265 270

Gin His Gin Arg Arg Asn Asn Ser Asn Ser Ser Ala Thr Pro lie Val 275 280 285

Gin Phe Gin Gly Glu Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu 290 295 300

Asn Asp Arg His Arg His Leu Phe Asp Leu lie Ser Ser Thr Trp His 305 310 315 320

Trp Ala Ser Ser Lys Ala Pro His Lys His Ala lie Val Thr Val Thr 325 330 335

Tyr Asp Ser Glu Glu Gin Arg Gin Gin Phe Leu Asp Val Val Lys lie 340 345 350

Pro Pro Thr lie Ser His Lys Leu Gly Phe Met Ser Leu His Leu Leu 355 360 365

<210> 3 <211> 1950 <212> DNA <213> HPV <400> 3 atggcagacg attccggtac tgagaacgaa ggttctggtt gtaccggttg gttcatggtt 60 gaagcaatcg ttcagcatcc gactggtacc cagatctccg atgacgaaga cgaagaagtt 120 gaagattctg gttacgacat ggttgacttc atcgatgact ccaacatcac tcataactct 180 ctggaagcac aggctctgtt taaccgccag gaagctgata cccattacgc tactgttcag 240 gacctgggag gcaaatatct gggctctccg tacgtttccc cgatcaacac tatcgcagaa 300 gcagttgagt ctgaaatctc cccgcgcctg gacgctatca aactgactcg tcagccgaag 360 aaggttaaac gtcgtctgtt ccagactcgt gaactgaccg actccggtta cggttatagc 420 gaagttgagg ctggcaccgg cacccaggtt gaaaaacacg gtgtaccgga aaacggcggc 480 gacggtcagg aaaaggacac cggccgcgac atcgagggtg aggaacacac cgaagctgaa 540 gctccgacta actctgttcg tgaacacgca ggtactgcgg gtatcctgga actgctgaaa 600 tgcaaagacc tgcgcgcggc tctgctgggc aaattcaaag aatgcttcgg cctgtctttc 660. attgacctga tccgtccgtt taagtctgac aaaactacct gtctggactg ggttgtagca 720 ggcttcggca tccaccactc tatctctgaa gcattccaga aactgatcga gccgctgtct 780 ctgtacgcgc acatccagtg gctgactaac gcttggggta tggttctgct ggtactgctg 840 cgctttaaag taaacaaatc tcgttccact gttgctcgta ctctggctac cctgctgaac 900 atcccggaga accagatgct gatcgaaccg ccgaaaatcc agtctggtgt agctgcactg 960 tactggtttc gtactggcat ctctaacgct agcactgtta tcggtgaagc accggaatgg 1020 atcactcgtc agaccgttat cgaacacggt ctggcagatt ctcagttcaa actgactgaa 1080 atggttcagt gggcatacga caacgacatc tgcgaggaat ctgaaattgc gttcgaatac 1140 gctcagcgtg gcgacttcga ctccaacgct cgtgctttcc tgaacagcaa catgcaggct 1200 aaatacgtaa aagactgcgc taccatgtgc cgtcactaca aacacgcgga aatgcgtaaa 1260 atgtctatca aacagtggat caagcaccgc ggttctaaaa tcgaaggtac cggtaactgg 1320 aaaccgatcg ttcagttcct gcgccatcag aacatcgaat tcatcccgtt cctgaccaaa 1380 ttcaagctgt ggctgcacgg taccccgaaa aaaaactgca tcgctatcgt aggtccaccg 1440 gacactgaca agtcttactt ctgtatgtcc ctgatctctt tcctgggcgg cactgtaatc 1500 tctcacgtta actcttcctc ccatttctgg ctgcagccac tggtagacgc gaaagtagct 1560 ctgctggacg acgcgaccca gccgtgctgg atctacatgg atacttacat gcgcaacctg 1620 ctggacggta acccgatgtc tatcgaccgt aaacacaaag cgctgactct gatcaagtgc 1680 ccgccgctgc tggtaacttc taacatcgac atcaccaagg aagataaata caagtacctg 1740 catacccgtg ttactacctt tactttcccg aacccgttcc cgtttgatcg taacggtaac 1800 gctgtttacg aactgtccaa cactaactgg aaatgcttct tcgagcgtct gtcttcctcc 1860 ctggacatcc aggactctga agatgaagaa gatggttcta actctcaggc tttccgttgt -2- 88379 200411055 gttccgggta ctgttgttcg tactctgtga 1950

<210> 4 <211> 649 <212>蛋白質 <213> HPV <400> 4

Met Ala Asp Asp Ser Gly Thr Glu Asn Glu Gly Ser Gly Cys Thr Gly 15 10 15

Trp Phe Met Val Glu Ala lie Val Gin His Pro Thr Gly Thr Gin lie 20 25 30

Ser Asp Asp Glu Asp Glu Glu Val Glu Asp Ser Gly Tyr Asp Met Val 35 40 45

Asp Phe lie Asp Asp Ser Asn lie Thr His Asn Ser Leu Glu Ala Gin 50 55 60

Ala Leu Phe Asn Arg Gin Glu Ala Asp Thr His Tyr Ala Thr Val Gin 65 70 75 80

Asp Leu Gly Gly Lys Tyr Leu Gly Ser Pro Tyr Val Ser Pro lie Asn 85 90 95

Thr lie Ala Glu Ala Val Glu Ser Glu lie Ser Pro Arg Leu Asp Ala 100 105 110 lie Lys Leu Thr Arg Gin Pro Lys Lys Val Lys Arg Arg Leu Phe Gin

115 120 125

Thr Arg Glu Leu Thr Asp Ser Gly Tyr Gly Tyr Ser Glu Val Glu Ala 130 135 140

Gly Thr Gly Thr Gin Val Glu Lys His Gly Val Pro Glu Asn Gly Gly 145 150 155 160

Asp Gly Gin Glu Lys Asp Thr Gly Arg Asp lie Glu Gly Glu Glu His 165 170 175

Thr Glu Ala Glu Ala Pro Thr Asn Ser Val Arg Glu His Ala Gly Thr 180 185 190

Ala Gly lie Leu Glu Leu Leu Lys Cys Lys Asp Leu Arg Ala Ala Leu 195 200 205

Leu Gly Lys Phe Lys Glu Cys Phe Gly Leu Ser Phe lie Asp Leu lie 210 215 · 220

Arg Pro Phe Lys Ser Asp Lys Thr Thr Cys Leu Asp Trp Val Val Ala 225 230 - 235 240

Gly Phe Gly lie His His Ser lie Ser Glu Ala Phe Gin Lys Leu lie 245 250 255

Glu Pro Leu Ser Leu Tyr Ala His lie Gin Trp Leu Thr Asn Ala Trp 260 - 265 270

Gly Met Val Leu Leu Val Leu Leu Arg Phe Lys Val Asn Lys Ser Arg 275 280 285

Ser Thr Val Ala Arg Thr Leu Ala Thr Leu Leu Asn lie Pro Glu Asn 290 295 300

Gin Met Leu lie Glu Pro Pro Lys 工le Gin Ser Gly Val Ala Ala Leu 305 310 315 320

Tyr Trp Phe Arg Thr Gly lie Ser Asn Ala Ser Thr Val lie Gly Glu 325 330 335

Ala Pro Glu Trp lie Thr Arg Gin Thr Val 工le Glu His Gly Leu Ala 340 345 350

Asp Ser Gin Phe Lys Leu Thr Glu Met Val Gin Tip Ala Tyr Asp Asn 355 360 365

Asp lie Cys Glu Glu Ser Glu lie Ala Phe Glu Tyr Ala Gin Arg Gly 370 375 380

Asp Phe Asp Ser Asn Ala Arg Ala 385 390 Lys Tyr Val Lys Asp Cys Ala Thr 405 Glu Met Arg Lys Met Ser lie Lys 420 Lys lie Glu Gly Thr Gly Asn Trp 435 440 His Gin Asn lie Glu Phe lie Pro 450 455

Phe Leu Asn Ser Asn Met Gin Ala 395 400 Met Cys Arg His Tyr Lys His Ala 410 415 Gin Trp lie Lys His Arg Gly Ser 425 430 Lys Pro lie Val Gin Phe Leu Arg 445 Phe Leu Thr Lys Phe Lys Leu Trp 460 88379 200411055

Leu His Gly Thr 465 Asp Thr Asp Lys Gly Thr Val lie 500

Pro Lys Lys Asn Cys 工le Ala lie Val Gly Pro Pro 470 475 480

Ser Tyr Phe Cys Met Ser Leu lie Ser Phe Leu Gly 485 490 495

Ser His Val Asn Ser Ser Ser His Phe Trp Leu Gin 505 510

Pro Leu Val Asp Ala Lys Val Ala Leu Leu Asp Asp Ala Thr Gin Pro 515 520 525

Cys Trp lie Tyr Met Asp Thr Tyr Met Arg Asn Leu Leu Asp Gly Asn 530 535 540

Pro Met Ser lie Asp Arg Lys His Lys Ala Leu Thr Leu lie Lys Cys 545 550 555 560

Pro Pro Leu Leu Val Thr Ser Asn 工le Asp lie Thr Lys GIn Asp Lys 565 570 575

Tyr. Lys Tyr Leu His Thr Arg Val Thr Thr Phe Thr Phe Pro Asn Pro 580 585 590

Phe Pro Phe Asp Arg Asn Gly Asn Ala Val Tyr Glu Leu Ser Asn Thr 595 600 605

Asn Trp Lys Cys Phe Phe Glu Arg Leu Ser Ser Ser Leu Asp 工le Gin 610 615 620

Asp Ser Glu Asp Glu Glu Asp Gly Ser Asn Ser Gin Ala Phe Arg Cys 625 630 635 640

Val Pro Gly Thr Val Val Arg Thr Leu 645 <210> 5 <211> 1104 <212> DNA <213> hpv <400> 5 atggaagcca tcgcgaagag gctcgacgcc tgccaggacc agctgctcga gctgtacgag 60 gagaacagca ttgacatcca taagcacatc atgcactgga agtgcattcg cctggagagc 120 gtgctgttgc acaaggccaa gcagatgggc ctgtcccaca taggccttca ggtggtcccc 180 cctctgaccg tgtcagagac aaagggccat aacgcaatcg agatgcagat gcacctcgag 240 tcgctggcga aaacacagta cggcgtggag ccatggaccc tgcaggacac ctcgtacgaa 300 atgtggctga ccccacctaa gcgatgcttc gccaaacagg gcaacacagt ggaggtgaag 360 ttcgacggct gtgaggataa cgttatggag tatgtcgtgt ggacgcacat ctatctgcag 420 gacaacgaca gttgggtgaa ggtgaccagc tccgtggacg cgaagggcat ctactatacc 480 tgtgggcagt ttaaaaccta ctatgtgaac ttcaacaaag aggcccaaaa gtatggctcc 540 accaaccact gggaggtctg ctatgggagc acggtgattt gctctcccgc cagcgtgtct 600 agcactgtgc gcgaggtgag cattgccgag ccgaccacgt acacccctgc ccagacgacc 660 gctccgaccg tgtctgcttg tactaccgag gacggcgtga gcgctccacc caggaagcgt 720 gcgaggggcc caagcaccaa caacaccctc tgtgtggcga acattcgcag cgtcgacagt 780. accatcaata acatcgtgac ggataactat aacaagcacc agaggcgtaa caactgtcac 840 tctgccgcaa cccccatcgt gcagctccag ggagacagca attgccttaa gtgcttccgc 900 tatcgcctca acgacaagta caagcacctc tttgagctcg cctcgtcgac gtggcactgg 960 gcctcacccg aggcacctca caagaacgcc atcgtcactc tcacttactc cagtgaggag 1020 cagagacagc agtttctgaa cagcgtgaag atcccaccga cgatccgtca taaggtcggc 1080 ttcatgtcac tgcatctcct gtga 1104

<210> 6 <211> 367 <212>蛋白質 <213> HPV <400> 6

Met Glu Ala lie Ala Lys Arg Leu Asp Ala Cys Gin Asp Gin Leu Leu 15 10 15

Glu Leu Tyr Glu Glu Asn Ser lie Asp lie His Lys His 工le Met His 20 25 30

Trp Lys Cys lie Arg Leu Glu Ser Val Leu Leu His Lys Ala Lys Gin 35 40 45

Met Gly Leu Ser His He Gly Leu Gin Val Val Pro Pro Leu Thr Val 50 55 60 . -4- 88379 200411055

Ser Glu Thr Lys Gly His Asn Ala lie Glu Met Gin Met His Leu Glu 65 7 0 75 80

Ser Leu Ala Lys Thr Gin Tyr Gly Val Glu Pro Trp Thr Leu Gin Asp 85 90 95

Thr Ser Tyr Glu Met Trp Leu Thr Pro Pro Lys Arg Cys Phe Ala Lys 100 105 110

Gin Gly Asn Thr Val Glu Val Lys Phe Asp Gly Cys Glu Asp Asn Val 115 120 125

Met Glu Tyr Val Val Trp Thr His lie Tyr Leu Gin Asp Asn Asp Ser 130 135 140

Trp Val Lys Val Thr Ser Ser Val Asp Ala Lys Gly lie Tyr Tyr Thr 145 150 155 ΙβΟ

Cys Gly Gin Phe Lys Thr Tyr Tyr Val Asn Phe Asn Lys Glu Ala Gin 165 170 175

Lys Tyr Gly Ser Thr Asn His Trp Glu Val Cys Tyr Gly Ser Thr Val 180 185 190 lie Cys Ser Pro Ala Ser Val Ser Ser Thr Val Arg Glu Val Ser lie 195 200 205

Ala Glu Pro Thr Thr Tyr Thr Pro Ala Gin Thr Thr Ala Pro Thr Val 210 215 220

Ser Ala Cys Thr Thr Glu Asp Gly Val Ser Ala Pro Pro Arg Lys Arg 225 230 235 240

Ala Arg Gly Pro Ser Thr Asn Asn Thr Leu Cys Val Ala Asn lie Arg 245 250 255

Ser Val Asp Ser Thr lie Asn Asn lie Val Thr Asp Asn Tyr Asn Lys 260 265 270

His Gin Arg Arg Asn Asn Cys His Ser Ala Ala Thr Pro lie Val Gin 275 280 285

Leu Gin Gly Asp Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu Asn 290 295 300

Asp Lys Tyr Lys His Leu Phe Glu Leu Ala Ser Ser Thr Trp His Trp 305 310 315 320

Ala Ser Pro Glu Ala Pro His Lys Asn Ala 工le Val Thr Leu Thr Tyr 325 330 335

Ser Ser Glu Glu Gin Arg Gin Gin Phe Leu. Asn Ser Val Lys lie Pro 340 345 350

Pro Thr lie Arg His Lys Val Gly Phe Met Ser Leu His Leu Leu 355 360 365

<210> 7 <211> 1104 <212> DNA <213> HPV 60 12 0 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1104 <400> 7 atggaagcca gagaacagca gtgctgttgc cctctgaccg tcgctggcga atgtggctga ttcgacggct gacaacgaca tgtgggcagt accaaccact agcactgtgc gctccgaccg gcgaggggcc accatcaata tctgccgcaa tatcgcctca gcctcacccg cagagacagc ttcatgtcac tcgcgaagag ttgacatcca acaaggccaa tgtcagagac aaacacagta ccccacctaa gtgaggataa gttgggtgaa ttaaaaccta gggaggtctg gcgaggtgag tgtctgcttg caagcaccaa acatcgtgac cccccatcgt acgacaagta aggcacctca agtttctgaa tgcatctcct gctcgacgcc taagcacatc gcagatgggc aaagggccat cggcgtggag gcgatgcttc cgttatggag ggtgaccagc ctatgtgaac ctatgggagc cattgccgag tactaccgag caacaccctc ggataactat gcagctccag caagcacctc caagaacgcc cagcgtgaag gtga tgccaggacc atgcactgga ctgtcccaca aacgcaatcg ccatggaccc gccaaacagg tatgtcgtgt tccgtggacg ttcaacaaag acggtgattt ccgaccacgt gacggcgtga tgtgtggcga aacaagcacc ggagacagca tttgagctcg atcgtcactc atcccaccga agctgctcga agtgcattcg taggccttca agatgcagat tgcaggacac gcaacacagt ggacgcacat cgaagggcat aggcccaaaa gctctcccgc acacccctgc gcgctccacc acattcgcag agaggcgtaa attgccttaa cctcgtcgac tcacttactc cgatccgtca gctgtacgag cctggagagc ggtggtcccc gcacctcgag ctcgtacgaa ggaggtgaag ctatctgcag ctactatacc gtatggctcc cagcgtgtct ccagacgacc caggaagcgt cgtcgacagt caactgtcac gtgcttccgc gtggcactgg cagtgaggag taaggtcggc 88379 200411055

<210> 8 <211> 367 <212>蛋白質 <213> HPV <400> 8

Met Glu Ala lie Ala Lys Arg Leu Asp Ala Cys Gin Asp Gin Leu Leu 15 10 15

Glu Leu Tyr Glu Glu Asn Ser lie Asp lie His Lys His lie Met His 20 25 30

Trp Lys Cys lie Arg Leu Glu Ser Val Leu Leu His Lys Ala Lys Gin 35 40 45

Met Gly Leu Ser His lie Gly Leu Gin Val Val Pro Pro Leu Thr Val 50 55 60

Ser Glu Thr Lys Gly His Asn Ala lie Glu Met Gin Met His Leu Glu 65 70 75 80

Ser Leu Ala Lys Thr Gin Tyr Gly Val Glu Pro Trp Thr Leu Gin Asp 85 90 95

Thr Ser Tyr Glu Met Trp Leu Thr Pro Pro Lys Arg Cys Phe Ala Lys 100 105 110

Gin Gly Asn Thr Val Glu Val Lys Phe Asp Gly Cys Glu Asp Asn Val 115 120 125

Met Glu Tyr Val Val Trp Thr His lie Tyr Leu Gin Asp Asn Asp Ser 130 135 140

Trp Val Lys Val Thr Ser Ser Val Asp Ala Lys Gly lie Tyr Tyr Thr 145 150 155 160

Cys Gly Gin Phe Lys Thr Tyr Tyr Val Asn Phe Asn Lys Glu Ala Gin 165 170 175

Ala Glu Pro Thr Thr Tyr Thr Pro Ala Gin Thr Thr Ala Pro Thr Val 210 215 220

Ser Ala Cys Thr Thr Glu Asp Gly Val Ser Ala Pro Pro Arg Lys Arg 225 230 235 240

Ala Arg Gly Pro Ser Thr Asn Asn Thr Leu Cys Val Ala Asn lie Arg 245 250 255

Ser Val Asp Ser Thr lie Asn Asn lie Val Thr Asp Asn Tyr Asn Lys 260 265 270

His Gin Arg Arg Asn Asn Cys His Ser Ala Ala Thr Pro lie Val Gin 275 - 280 285

Leu Gin Gly Asp Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu Asn 290 295 300

Asp Lys Tyr Lys His Leu Phe Glu Leu Ala Ser Ser Thr Trp His Trp 305 310 315 320

Ala Ser Pro Glu Ala Pro His Lys Asn Ala lie Val Thr Leu Thr Tyr 325 330 335

Ser Ser Glu Glu Gin Arg Gin Gin Phe Leu Asn Ser Val Lys lie Pro 340 345 350

Pro Thr lie Arg His Lys Val Gly Phe Met Ser Leu His Leu Leu 355 360 365

<210> 9 <211> 2206 <212> DNA <213> HPV <400> 9 atggaagcta ttgccaagcg actggacgcc tgccaggagc agctgctgga gctgtacgag 60 gaaaacagca cagacctcca caagcacgtg ctgcactgga agtgcatgcg ccacgagtca 120 gtgctcctgt acaaggccaa gcagatgggg ctgtcccaca tcgggatgca ggtcgtgccc 180 ccgctgaagg tgagcgaagc caagggccac aacgctatcg agatgcagat gcacctggag 240 agcctgctgc ggaccgaata cagcatggag ccctggactc tccaggagac gtcctacgaa 300 at9tggcaga ctcctccgaa gcgctgtttc gcaaagcgcg gcaagacagt tgaggtgaaa ^60 -6- 88379 200411055 ttcgatgggt gacaatgaca tgcgggcagt accaagcact tccaccaccc acgctcgtca cggggggtcc tctgggaacc aacagctccg cgctaccgcc tgggccagca gagcagaggc ggcttcatgt gaccagctgc tggaagtgca cacataggcc atcgagatgc accctgcagg cagggcaaca gtgtggacgc gacgcgaagg aaagaggccc atttgctctc acgtacaccc gtgagcgctc gcgaacattc caccagaggc agcaattgcc ctcgcctcgt actctcactt ccgacgatcc gcgcaaacaa cctgggtgaa tcaagacgta gggaggtgtg aggaagtgag gcagcagcac agcagtctcc acaatctcat caactccaat tcaacgaccg gcaaggcgcc agcagttcct ccctgcacct tcgagctgta ttcgcctgga ttcaggtggt agatgcacct acacctcgta cagtggaggt acatctatct gcatctacta aaaagtatgg ccgccagcgt ctgcccagac cacccaggaa gcagcgtcga gtaacaactg ttaagtgctt cgacgtggca actccagtga gtcataaggt cacgatggac ggtacatagt ctacgtcaac ttacgggagt cattccggag caaggaggac ctgcaatgcc cacgaacaac agtgcagttc ccaccgccac ccacaaacac ggacgtcgtg gctgatggaa cgaggagaac gagcgtgctg cccccctctg cgagtcgctg cgaaatgtgg gaagttcgac gcaggacaac tacctgtggg ctccaccaac gtctagcact gaccgctccg gcgtgcgagg cagtaccatc tcactctgcc ccgctatcgc ctgggcctca ggagcagaga cggcttcatg tacgtggtgt atggtggatg ttcgtcaagg actgtgatct agcaccacat gccgtccaga ctgtgcgttg cacgaccagc cagggggagt ctgttcgact gctatcgtga aagattcctc gccatcgcga agcattgaca ttgcacaagg accgtgtcag gcgaaaacac ctgaccccac ggctgtgagg gacagttggg cagtttaaaa cactgggagg gtgcgcgagg accgtgtctg ggcccaagca aataacatcg gcaaccccca ctcaacgaca cccgaggcac cagcagtttc tcactgcatc ggaccgatgt ccaagggcat aagccgaaaa gcagccccgc acaccccggc cgcccccccg ctcacatcgg accaaaggcg ccaactgcct tgatcagttc cggtgaccta cgacaatcag agaggctcga tccataagca ccaagcagat agacaaaggg agtacggcgt ctaagcgatg ataacgttat tgaaggtgac cctactatgt tctgctatgg tgagcattgc cttgtactac ccaacaacac tgacggataa tcgtgcagct agtacaagca ctcacaagaa tgaacagcgt tcctga ctacgtgcag ctattacacc gtatggttcc ctccgtgtcg ccaaacgagc gaagagggcc ccctgtcgat caacaactct caagtgtttc cacgtggcac cgactccgag ccacaagctt cgcctgccag catcatgcac gggcctgtcc ccataacgca ggagccatgg cttcgccaaa ggagtatgtc cagctccgtg gaacttcaac gagcacggtg cgagccgacc cgaggacggc cctctgtgtg ctataacaag ccagggagac cctctttgag cgccatcgtc gaagatccca 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2206

<210> 10 <211> 735 <212>蛋白質 <213> HPV <400> 10

Met Glu Ala lie Ala Lys Arg Leu 1 5

Glu Leu Tyr Glu Glu Asn Ser Thr 20

Trp Lys Cys Met Arg His Glu Ser 35 40

Met Gly Leu Ser His lie Gly Met 50 55

Ser Glu Ala Lys Gly His Asn Ala 65 70

Ser Leu Leu Arg Thr Glu Tyr Ser 85

Thr Ser Tyr Glu Met Trp Gin Thr 100

Arg Gly Lys Thr Val Glu Val Lys 115 120

Met Asp Tyr Val Val Trp Thr Asp 130 135

Trp Val Lys Val His Ser Met Val 145 150

Cys Gly Gin Phe Lys Thr Tyr Tyr 165

Lys Tyr Gly Ser Thr Lys His Trp 180 ' lie Cys Ser Pro Ala Ser Val Ser 195 200

Pro Glu Ser Thr Thr Tyr Thr Pro 210 215

Asp Ala Cys Gin Glu Gin Leu Leu 10 15

Asp Leu His Lys His Val Leu His 25 30

Val Leu Leu Tyr Lys Ala Lys Gin 45

Gin Val Val Pro Pro Leu Lys Val 60 lie Glu Met Gin Met His Leu Glu 75 80

Met Glu Pro Trp Thr Leu Gin Glu 90 95

Pro Pro Lys Arg Cys Phe Ala Lys 105 110

Phe Asp Gly Cys Ala Asn Asn Thr 125

Val Tyr Val Gin Asp Asn Asp Thr 140

Asp Ala Lys Gly lie Tyr Tyr Thr 155 160

Val Asn Phe Val Lys Glu Ala Glu 170 175

Glu Val Cys Tyr Gly Ser Thr Val 185 190

Ser Thr Thr Gin Glu Val Ser lie 205

Ala Gin Thr Ser Thr Leu Val Ser 220 88379 200411055

Ser Ser Thr Lys Glu Asp Ala Val Gin Thr Pro Pro Arg Lys Arg Ala 225 230 235 240

Arg Gly Val Gin Gin Ser Pro Cys Asn Ala Leu Cys Val Ala His lie 245 250 255

Gly Pro Val Asp Ser Gly Asn His Asn Leu lie Thr Asn Asn His Asp 260 265 270

Gin His Gin Arg Arg Asn Asn Ser Asn Ser Ser Ala Thr Pro lie Val 275 280 285

Gin Phe Gin Gly Glu Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu 290 295 300

Asn Asp Arg His Arg His Leu Phe Asp Leu lie Ser Ser Thr Trp His 305 310 315 320

Trp Ala Ser Ser Lys Ala Pro His Lys His Ala lie Val Thr Val Thr 325 330 335

Tyr Asp Ser Glu Glu Gin Arg Gin Gin Phe Leu Asp Val Val Lys lie 340 345 350

Pro Pro Thr lie Ser His Lys Leu Gly Phe Met Ser Leu His Leu Leu 355 360 365

Met Glu Ala lie Ala Lys Arg Leu Asp Ala Cys Gin Asp Gin Leu Leu 370 375 380

Glu Leu Tyr Glu Glu Asn Ser lie Asp 工le His Lys His lie Met His 385 390 395 400

Trp Lys Cys lie Arg Leu Glu Ser Val Leu Leu His Lys Ala Lys Gin 405 410 415

Met Gly Leu Ser His lie Gly Leu Gin Val Val Pro Pro Leu Thr Val 420 425 430

Ser Glu Thr Lys Gly His Asn Ala lie Glu Met Gin Met His Leu Glu 435 440 445

Ser Leu Ala Lys Thr Gin Tyr Gly Val Glu Pro Trp Thr Leu Gin Asp 450 455 460

Thr Ser Tyr Glu Met Trp Leu Thr Pro Pro Lys Arg Cys Phe Ala Lys 465 470 475 480

Gin Gly Asn Thr Val Glu Val Lys Phe Asp Gly Cys Glu Asp Asn Val 485 490 495

Met Glu Tyr Val Val Trp Thr His lie Tyr Leu Gin Asp Asn Asp Ser 500 505 510

Trp Val Lys Val Thr Ser Ser Val Asp Ala Lys Gly lie Tyr Tyr Thr 515 520 525

Cys Gly Gin Phe Lys Thr Tyr Tyr Val Asn Phe Asn Lys Glu Ala Gin 530 535 540

Lys Tyr Gly Ser Thr Asn His Trp Glu Val Cys Tyr Gly Ser Thr Val 545 - 550 555 560 工le Cys Ser Pro Ala Ser Val Ser Ser Thr Val Arg Glu Val Ser lie 565 570 575

Ala Glu Pro Thr Thr Tyr Thr Pro Ala Gin Thr Thr Ala Pro Thr Val 580 585 590

Ser Ala Cys Thr Thr Glu Asp Gly Val Ser Ala Pro Pro Arg Lys Arg 595 600 605

Ala Arg Gly Pro Ser Thr Asn Asn Thr Leu Cys Val Ala Asn lie Arg 610 615 620

Ser Val Asp Ser Thr 工le Asn Asn lie Val Thr Asp Asn Tyr Asn Lys 625 630 635 640

His Gin Arg Arg Asn Asn Cys His Ser Ala Ala Thr Pro lie Val Gin 645 650 655

Leu Gin Gly Asp Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu Asn 660 665 670

Asp Lys Tyr Lys His Leu Phe Glu Leu Ala Ser Ser Thr Trp His Trp 675 680 685

Ala Ser Pro Glu Ala Pro His Lys 690 695 Ser Ser Glu Glu Gin Arg Gin Gin 705 710 Pro Thr lie Arg His Lys Val Gly 725

Asn Ala lie Val Thr Leu Thr Tyr 700 Phe Leu Asn Ser Val Lys lie Pro 715 720 Phe Met Ser Leu His Leu Leu 730 735 -8 - 88379 200411055

<210> 11 <211> 2206 <212> DNA <213> HPV <400> 11 atggaagcca gagaacagca gtgctgttgc cctctgaccg tcgctggcga atgtggctga ttcgacggct gacaacgaca tgtgggcagt accaaccact agcactgtgc gctccgaccg gcgaggggcc accatcaata tctgccgcaa tatcgcctca gcctcacccg cagagacagc ttcatgtcac cagctgctgg aagtgcatgc atcgggatgc gagatgcaga ctccaggaga ggcaagacag tggaccgatg gccaagggca gaagccgaaa tgcagccccg tacaccccgg acgccccccc gctcacatcg caccaaaggc tccaactgcc ttgatcagtt acggtgacct ccgacaatca <210> 12 <211> 735 <212>蛋白質 <213> HPV tcgcgaagag ttgacatcca acaaggccaa tgtcagagac aaacacagta ccccacctaa gtgaggataa gttgggtgaa ttaaaaccta gggaggtctg gcgaggtgag tgtctgcttg caagcaccaa acatcgtgac cccccatcgt acgacaagta aggcacctca agtttctgaa tgcatctcct agctgtacga gccacgagtc aggtcgtgcc tgcacctgga cgtcctacga ttgaggtgaa tctacgtgca tctattacac agtatggttc cctccgtgtc cccaaacgag ggaagagggc gccctgtcga gcaacaactc tcaagtgttt ccacgtggca acgactccga gccacaagct gctcgacgcc taagcacatc gcagatgggc aaagggccat cggcgtggsg gcgatgcttc cgttatggag ggtgaccagc ctatgtgaac ctatgggagc cattgccgag tactaccgag caacaccctc ggataactat gcagctccag caagcacctc caagaacgcc cagcgtgaag gatggaagct ggaaaacagc agtgctcctg cccgctgaag gagcctgctg aatgtggcag attcgatggg ggacaatgac ctgcgggcag caccaagcac gtccaccacc cacgctcgtc ccggggggtc ttctgggaac taacagctcc ccgctaccgc ctgggccagc ggagcagagg tggcttcatg tgccaggacc atgcactgga ctgtcccaca aacgcaatcg ccatggaccc gccaaacagg tatgtcgtgt tccgtggacg ttcaacaaag acggtgattt ccgaccacgt gacggcgtga tgtgtggcga aacaagcacc ggagacagca tttgagctcg atcgtcactc atcccaccga attgccaagc acagacctcc tacaaggcca gtgagcgaag cggaccgaat actcctccga tgcgcaaaca acctgggtga ttcaagacgt tgggaggtgt caggaagtga agcagcagca cagcagtctc cacaatctca gcaactccaa ctcaacgacc agcaaggcgc cagcagttcc tccctgcacc agctgctcga agtgcattcg taggccttca agatgcagat tgcaggacac gcaacacagt ggacgcacat cgaagggcat aggcccaaaa gctctcccgc acacccctgc gcgctccacc acattcgcag agaggcgtaa attgccttaa cctcgtcgac tcacttactc cgatccgtca gactggacgc acaagcacgt agcagatggg ccaagggcca acagcatgga agcgctgttt acacgatgga aggtacatag actacgtcaa gttacgggag gcattccgga ccaaggagga cctgcaatgc tcacgaacaa tagtgcagtt gccaccgcca cccacaaaca tggacgtcgt tgctga gctgtacgag cctggagagc ggtggtcccc gcacctcgag ctcgtacgaa ggaggtgaag ctatctgcag ctactatacc gtatggctcc cagcgtgtct ccagacgacc caggaagcgt cgtcgacagt caactgtcac gtgcttccgc gtggcactgg cagtgaggag taaggtcggc ctgccaggag gctgcactgg gctgtcccac caacgctatc gccctggact cgcaaagcgc ctacgtggtg tatggtggat cttcgtcaag tactgtgatc gagcaccaca cgccgtccag cctgtgcgtt ccacgaccag ccagggggag cctgttcgac cgctatcgtg gaagattcct 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2206 <400> 12 Met Glu Ala 1 Glu Leu Tyr Trp Lys Cys 35 Met Gly Leu 50 Ser Glu Thr 65 Ser Leu Ala Thr Ser Tyr Gin Gly Asn 115 工le Ala Lys 5 Glu Glu Asn 20 lie Arg Leu Ser His lie Lys Gly His 70 Lys Thr Gin 85 Glu Met Trp 100 Thr Val Glu

Arg Leu Ser lie Glu Ser 40 Gly Leu 55 Asn Ala Tyr Gly Leu Thr Val Lys 120

Asp Ala 10 Asp lie 25 Val Leu Gin Val He Glu Val Glu 90 Pro Pro 105 Phe Asp

Cys Gin His Lys Leu His Val Pro 60 Met Gin 75 Pro Trp Lys Arg Gly Cys

Asp Gin Leu 15 His lie Met 30 Lys Ala Lys 45 Pro Leu Thr Met His Leu Thr Leu Gin 95 Cys Phe Ala 110 Glu Asp Asn 125

Leu His Gin Val Glu 80 Asp Lys Val 88379 -9- 200411055

Met Glu 130 Trp Val 145 Cys Gly Lys Tyr lie Cys Ala Glu 210 Ser Ala 225 Ala Arg Ser Val His Gin

Tyr Val Val Trp Lys Val Gin Phe

Gly Ser 180 Ser Pro 195 Pro Thr Cys Thr Gly Pro Asp Ser 260 Arg Arg 275

Thr Ser 150 Lys Thr 165 Thr As n

Ala Ser Thr Tyr Thr Glu 230 Ser Thr 245 Thr lie Asn Asn

Thr His lie 135 Ser Val Asp Tyr Tyr Val His Trp Glu 185 Val Ser Ser 200 Thr Pro Ala 215 Asp Gly Val Asn Asn Thr Asn Asn lie 265 Cys His Ser 280

Tyr Leu Ala Lys 155 Asn Phe 170 Val Cys Thr Val Gin Thr Ser Ala 235 Leu Cys 250 Val Thr Ala Ala

Gin Asp 140 Gly He Asn Lys Tyr Gly Arg Glu 205 Thr Ala 220 Pro Pro Val Ala Asp Asn Thr Pro 285

Asn Asp Ser Tyr Tyr Thr 160 Glu Ala Gin 175 Ser Thr Val 190 Val Ser lie Pro Thr Val Arg Lys Arg 240 Asn lie Arg 255 Tyr Asn Lys 270 lie Val Gin

Leu Gin Gly Asp Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu Asn 290 295 300

Asp Lys Tyr Lys His Leu Phe Glu Leu Ala Ser Ser Thr Trp His Trp 305 310 315 320

Ala Ser Pro Glu Ala Pro His Lys Asn Ala 工le Val Thr Leu Thr Tyr 325 330 335

Ser Ser Glu Glu Gin Arg Gin Gin Phe Leu Asn Ser Val Lys 工le Pro 340 345 350

Pro Thr lie Arg His Lys Val Gly Phe Met Ser Leu His Leu Leu Met 355 360 365

Glu Ala lie Ala Lys Arg Leu Asp Ala Cys Gin Glu Gin Leu Leu Glu 370 375 380

Leu Tyr Glu Glu Asn Ser Thr Asp Leu His Lys His Val Leu His Trp 385 390 395 400

Lys Cys Met Arg His Glu Ser Val Leu Leu Tyr Lys Ala Lys Gin Met 405 410 415

Gly Leu Ser His lie Gly Met Gin Val Val Pro Pro Leu Lys Val Ser 420 425 430

Glu Ala Lys Gly His Asn Ala lie Glu Met Gin Met His Leu Glu Ser 435 440 445

Leu Leu Arg Thr Glu Tyr Ser Met Glu Pro Trp Thr Leu Gin Glu Thr 450 - 455 460

Ser Tyr Glu Met Trp Gin Thr Pro Pro Lys Arg Cys Phe Ala Lys Arg 465 470 475 480

Gly Lys Thr Val Glu Val Lys Phe Asp Gly Cys Ala Asn Asn Thr Met 485 490 495

Asp Tyr Val Val Trp Thr Asp Val Tyr Val Gin Asp Asn Asp Thr Trp 500 505 510

Val Lys Val His Ser Met Val Asp Ala Lys Gly lie Tyr Tyr Thr Cys 515 520 525

Gly Gin Phe Lys Thr Tyr Tyr Val Asn Phe Val Lys Glu Ala Glu Lys 530 535 540

Tyr Gly Ser Thr Lys His Trp Glu Val Cys Tyr Gly Ser Thr Val lie 545 550 555 560

Cys Ser Pro Ala Ser Val Ser Ser Thr Thr Gin Glu Val Ser lie Pro 565 570 575

Glu Ser Thr Thr Tyr Thr Pro Ala Gin Thr Ser Thr Leu Val Ser Ser 580 585 590

Ser Thr Lys Glu Asp Ala Val Gin Thr Pro Pro Arg Lys Arg Ala Arg 595 600 605

Gly Val Gin Gin Ser Pro Cys Asn Ala Leu Cys Val Ala His lie Gly 610 615 620

Pro Val Asp Ser Gly Asn His Asn Leu 工le Thr Asn Asn His Asp Gin 625 630 635 640

His Gin Arg Arg Asn Asn Ser Asn Ser Ser Ala Thr Pro lie Val Gin 645 650 655 -10- 88379 200411055

Phe Gin Gly Glu Ser Asn Cys Leu Lys 660 665

Asp Arg His 675 Ala Ser Ser 690 Asp Ser Glu 705 Pro Thr lie

Arg His Leu Phe Asp Leu 680 Lys Ala Pro His Lys His 695 Glu Gin Arg Gin Gin Phe 710 Ser His Lys Leu Gly Phe 725

Cys lie Ala Leu Met 730

Phe Ser lie Asp 715 Ser

Arg Ser Val 700 Val Leu

Tyr Thr 685 Thr Val His

Arg 670 Trp Val Lys Leu

Leu His Thr He Leu 735

Asn Trp Tyr Pro 720

<210> 13 <211> 1950 <212> DNA <213> HPV <400> 13 atggcagacg attccggtac tgagaacgaa ggttctggtt gtaccggttg gttcatggtt gaagcaatcg ttcagcatcc gactggtacc cagatctccg atgacgaaga cgaagaagtt gaagattctg gttacgacat ggttgacttc atcgatgact ccaacatcac tcataactct ctggaagcac aggctctgtt taaccgccag gaagctgata cccattacgc tactgttcag gacctgggag gcaaatatct gggctctccg tacgtttccc cgatcaacac tatcgcagaa gcagttgagt ctgaaatctc cccgcgcctg gacgctatca aactgactcg tcagccgaag aaggttaaac gtcgtctgtt ccagactcgt gaactgaccg actccggtta cggttatagc gaagttgagg ctggcaccgg cacccaggtt gaaaaacacg gtgtaccgga aaacggcggc gacggtcagg aaaaggacac cggccgcgac atcgagggtg aggaacacac cgaagctgaa gctccgacta actctgttcg tgaacacgca ggtactgcgg gtatcctgga actgctgaaa tgcaaagacc tgcgcgcggc tctgctgggc aaattcaaag aatgcttcgg cctgtctttc attgacctga tccgtccgtt taagtctgac aaaactacct gtctggactg ggttgtagca ggcttcggca tccaccactc tatctctgaa gcattccaga aactgatcga gccgctgtct ctgtacgcgc acatccagtg gctgactaac gcttggggta tggttctgct ggtactgctg cgctttaaag taaacaaatc tcgttccact gttgctcgta ctctggctac cctgctgaac atcccggaga accagatgct gatcgaaccg ccgaaaatcc agtctggtgt agctgcactg tactggtttc gtactggcat ctctaacgct agcactgtta tcggtgaagc accggaatgg atcactcgtc agaccgttat cgaacacggt ctggcagatt ctcagttcaa actgactgaa atggttcagt gggcatacga caacgacatc tgcgaggaat ctgaaattgc gttcgaatac gctcagcgtg gcgacttcga ctccaacgct cgtgctttcc tgaacagcaa catgcaggct aaatacgtaa aagactgcgc taccatgtgc cgtcactaca aacacgcgga aatgcgtaaa atgtctatca aacagtggat caagcaccgc ggttctaaaa tcgaaggtac cggtaactgg aaaccgatcg ttcagttcct gcgccatcag aacatcgaat tcatcccgtt cctgaccaaa ttcaagctgt ggctgcacgg taccccgaaa aaaaactgca tcgctatcgt aggtccaccg gacactgaca agtcttactt ctgtatgtcc ctgatctctt tcctgggcgg cactgtaatc tctcacgtta actcttcctc ccatttctgg ctgcagccac tggtagacgc gaaagtagct ctgctggacg acgcgaccca gccgtgctgg atctacatgg atacttacat gcgcaacctg ctggacggta acccgatgtc tatcgaccgt aaacacaaag cgctgactct gatcaagtgc ccgccgctgc tggtaacttc taacatcgac atcaccaagg aagataaata caagtacctg catacccgtg ttactacctt tactttcccg aacccgttcc cgtttgatcg taacggtaac gctgtttacg aactgtccaa cactaactgg aaatgcttct tcgagcgtct gtcttcctcc ctggacatcc aggactctga agatgaagaa gatggttcta actctcaggc tttccgttgt gttccgggta ctgttgttcg tactctgtga 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1950 <210> 14 <211> 649 <212> 蛋白質 <213> HPV <400> 14 Met Ala Asp Asp 1 Trp Phe Met Val 20 Ser Asp Asp Glu 35 Asp Phe lie Asp 50

Ser Gly Thr Glu Asn Glu Gly Ser Gly Cys Thr Gly 5 10 15 Glu Ala lie Val Gin His Pro Thr Gly Thr Gin lie 25 30

Asp Glu Glu Val 40 Asp Ser Asn lie 55

Glu Asp Ser Gly Tyr Asp Met Val 45 Thr His Asn Ser Leu Glu Ala Gin 60 -11- 88379 200411055

Ala Leu Phe Asn Arg Gin Glu Ala Asp Thr His Tyr Ala Thr Val Gin 65 70 75 80

Asp Leu Gly Gly Lys Tyr Leu Gly Ser Pro Tyr Val Ser Pro lie Asn 85 90 95

Thr lie Ala Glu Ala Val Glu Ser Glu lie Ser Pro Arg Leu Asp Ala 100 105 110 工le Lys Leu Thr Arg Gin Pro Lys Lys Val Lys Arg Arg Leu Phe Gin 115 120 125

Thr Arg Glu Leu Thr Asp Ser Gly Tyr Gly Tyr Ser Glu Val Glu Ala 130 135 140

Gly Thr Gly Thr Gin Val Glu Lys His Gly Val Pro Glu Asn Gly Gly 145 150 155 160

Asp Gly Gin Glu Lys Asp Thr Gly Arg Asp lie Glu Gly Glu Glu His 165 170 175

Thr Glu Ala Glu Ala Pro Thr Asn Ser Val Arg Glu His Ala Gly Thr 180 185 190

Ala Gly lie Leu Glu Leu Leu Lys Cys Lys Asp Leu Arg Ala Ala Leu 195 200 205

Leu Gly Lys Phe Lys Glu Cys Phe Gly Leu Ser Phe lie Asp Leu lie 210 215 220

Arg Pro Phe Lys Ser Asp Lys Thr Thr Cys Leu Asp Trp Val Val Ala 225 230 235 240

Gly Phe Gly lie His His Ser lie Ser Glu Ala Phe Gin Lys Leu lie 245 250 255

Glu Pro Leu Ser Leu Tyr Ala His lie Gin Trp Leu Thr Asn Ala Trp 260 265 270

Gly Met Val Leu Leu Val Leu Leu Arg Phe Lys Val Asn Lys Ser Arg 275 280 285

Ser Thr Val Ala Arg Thr Leu Ala Thr Leu Leu Asn lie Pro Glu Asn 290 295 300

Gin Met Leu 工le Glu Pro Pro Lys lie Gin Ser Gly Val Ala Ala Leu 305 310 315 320

Tyr Trp Phe Arg Thr Gly lie Ser Asn Ala Ser Thr Val lie Gly Glu 325 330 335

Ala Pro Glu Trp lie Thr Arg Gin Thr Val lie Glu His Gly Leu Ala 340 345 350

Asp Ser Gin Phe Lys Leu Thr Glu Met Val Gin Trp Ala Tyr Asp Asn 355 360 365

Asp lie Cys Glu Glu Ser Glu lie Ala Phe Glu Tyr Ala Gin Arg Gly 370 375 380

Asp Phe Asp Ser Asn Ala Arg Ala Phe Leu Asn Ser Asn Met Gin Ala 385 .. 390 395 400

Lys Tyr Val Lys Asp Cys Ala Thr Met Cys Arg His Tyr Lys His Ala 405 410 415

Glu Met Arg Lys Met Ser lie Lys Gin Trp lie Lys His Arg Gly Ser 420 425 430

Lys lie Glu Gly Thr Gly Asn Trp Lys Pro 工le Val Gin Phe Leu Arg 435 440 445

His Gin Asn lie Glu Phe lie Pro Phe Leu Thr Lys Phe Lys Leu Trp 450 455 460

Leu His Gly Thr Pro Lys Lys Asn Cys lie Ala lie Val Gly Pro Pro 465 470 475 480

Asp Thr Asp Lys Ser Tyr Phe Cys Met Ser Leu lie Ser Phe Leu Gly 485 490 495

Gly Thr Val 工le Ser His Val Asn Ser Ser Ser His Phe Trp Leu Gin 500 505 510

Pro Leu Val Asp Ala Lys Val Ala Leu Leu Asp Asp Ala Thr Gin Pro 515 520 525

Cys Trp lie Tyr Met Asp Thr Tyr Met Arg Asn Leu Leu Asp Gly Asn 530 535 540

Pro Met Ser 工le Asp Arg Lys His Lys Ala Leu Thr Leu lie Lys Cys 545 550 555 560

Pro Pro Leu Leu Val Thr Ser Asn lie Asp 工le Thr Lys Glu Asp Lys 565 570 575

Tyr Lys Tyr Leu His Thr Arg Val Thr Thr Phe Thr Phe Pro Asn Pro 580 585 590 •12-

88379 200411055

Tyr Glu Leu Ser Asn Thr 605 Ser Ser Leu Asp 工le Gin 620 Ser Gin Ala Phe Arg Cys 635 640

Phe Pro Phe Asp Arg Asn Gly Asn Ala Val 595 600

Asn Trp Lys Cys Phe Phe Glu Arg Leu Ser 610 615

Asp Ser Glu Asp Glu Glu Asp Gly Ser Asn 625 630

Val Pro Gly Thr Val Val Arg Thr Leu 645

<210> 15 <211> 1107 <212> DNA <213> HPV <400> 15 atggaagcta ttgccaagcg actggacgcc tgccaggagc agctgctgga gctgtacgag 60 gaaaacagca cagacctcca caagcacgtg ctgcactgga agtgcatgcg ccacgagtca 120 gtgctcctgt acaaggccaa gcagatgggg ctgtcccaca tcgggatgca ggtcgtgccc 180 ccgctgaagg tgagcgaagc caagggccac aacgctatcg agatgcagat gcacctggag 240 agcctgctgc ggaccgaata cagcatggag ccctggactc tccaggagac gtcctacgaa 300 atgtggcaga ctcctccgaa gcgctgtttc gcaaagcgcg gcaagacagt tgaggtgaaa 360 ttcgatgggt gcgcaaacaa cacgatggac tacgtggtgt ggaccgatgt ctacgtgcag 420 gacaatgaca cctgggtgaa ggtacatagt atggtggatg ccaagggcat ctattacacc 480 tgcgggcagt tcaagacgta ctacgtcaac ttcgtcaagg aagccgaaaa gtatggttcc 540 accaagcact gggaggtgtg ttacgggagt actgtgatct gcagccccgc ctccgtgtcg 600 tccaccaccc aggaagtgag cattccggag agcaccacat acaccccggc ccaaacgagc 660 acgctcgtca gcagcagcac caaggaggac gccgtccaga cgcccccccg gaagagggcc 720 cggggggtcc agcagtctcc ctgcaatgcc ctgtgcgttg ctcacatcgg ccctgtcgat 780 tctgggaacc acaatctcat cacgaacaac cacgaccagc accaaaggcg caacaactct 840 aacagctccg caactccaat agtgcagttc cagggggagt ccaactgcct caagtgtttc 900 cgctaccgcc tcaacgaccg ccaccgccac ctgttcgact tgatcagttc cacgtggcac 960 tgggccagca gcaaggcgcc ccacaaacac gctatcgtga cggtgaccta cgactccgag 1020 gagcagaggc agcagttcct ggacgtcgtg aagattcctc cgacaatcag ccacaagctt 1080 ggcttcatgt ccctgcacct gctgtga 1107

<210> 16 <211> 368 <212>蛋白赏 <213> HPV <400> 16

Met Glu Ala 工le Ala Lys Arg Leu Asp Ala Cys Gin Glu Gin Leu Leu 15 10 15

Glu Leu Tyr Glu Glu Asn Ser Thr Asp Leu His Lys His Val Leu His 20 25 30

Trp Lys Cys Met Arg His Glu Ser Val Leu Leu Tyr Lys Ala Lys Gin 35 40 45

Met Gly Leu Ser His 工le Gly Met Gin Val Val Pro Pro Leu Lys Val 50 55 60

Ser Glu Ala Lys Gly His Asn Ala lie Glu Met Gin Met His Leu Glu 65 70 75 80

Ser Leu Leu Arg Thr Glu Tyr Ser Met Glu Pro Trp Thr Leu Gin Glu 85 90 95

Thr Ser Tyr Glu Met Trp Gin Thr Pro Pro Lys Arg Cys Phe Ala Lys 100 105 110

Arg Gly Lys Thr Val Glu Val Lys Phe Asp Gly Cys Ala Asn Asn Thr 115 120 125

Met Asp Tyr Val Val Trp Thr Asp Val Tyr Val Gin Asp Asn Asp Thr 130 135 140

Trp Val Lys Val His Ser Met Val Asp Ala Lys Gly lie Tyr Tyr Thr 145 150 155 160

Cys Gly Gin Phe Lys Thr Tyr Tyr Val Asn Phe Val Lys Glu Ala Glu 165 170 175

Lys Tyr Gly Ser Thr Lys His Trp Glu Val Cys Tyr Gly Ser Thr Val 180 185 190 e -13 - 88379 200411055 lie Cys Ser Pro Ala Ser Val Ser Ser Thr Thr Gin Glu Val Ser lie 195 200 205

Pro Glu Ser Thr Thr Tyr Thr Pro Ala Gin Thr Ser Thr Leu Val Ser 210 215 220

Ser Ser Thr Lys Glu Asp Ala Val Gin Thr Pro Pro Arg Lys Arg Ala 225 230 235 240

Arg Gly Val Gin Gin Ser Pro Cys Asn Ala Leu Cys Val Ala His lie 245 250 255

Gly Pro Val Asp Ser Gly Asn His Asn Leu lie Thr Asn Asn His Asp 260 265 270

Gin His Gin Arg Arg Asn Asn Ser Asn Ser Ser Ala Thr Pro lie Val 275 280 285

Gin Phe Gin Gly Glu Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu 290 295 300

Asn Asp Arg His Arg His Leu Phe Asp Leu lie Ser Ser Thr Trp His 305 310 315 320

Trp Ala Ser Ser Lys Ala Pro His Lys His Ala 工le Val Thr Val Thr 325 330 335

Tyr Asp Ser Glu Glu Gin Arg Gin Gin Phe Leu Asp Val Val Lys lie 340 345 350

Pro Pro Thr lie Ser His Lys Leu Gly Phe Met Ser Leu His Leu Leu 355 360 365

<210> 17 <211> 4154 <212> DNA <213> HPV <400> 17 atggcagacg gaagcaatcg gaagattctg ctggaagcac gacctgggag gcagttgagt aaggttaaac gaagttgagg gacggtcagg gctccgacta tgcaaagacc attgacctga ggcttcggca ctgtacgcgc cgctttaaag atcccggaga tactggtttc atcactcgtc atggttcagt gctcagcgtg aaatacgtaa atgtctatca aaaccgatcg ttcaagctgt gacactgaca tctcacgtta ctgctggacg ctggacggta ccgccgctgc catacccgtg gctgtttacg ctggacatcc gttccgggta caggagcagc cactggaagt tcccacatcg attccggtac ttcagcatcc gttacgacat aggctctgtt gcaaatatct ctgaaatctc gtcgtctgtt ctggcaccgg aaaaggacac actctgttcg tgcgcgcggc tccgtccgtt tccaccactc acatccagtg taaacaaatc accagatgct gtactggcat agaccgttat gggcatacga gcgacttcga aagactgcgc aacagtggat ttcagttcct ggctgcacgg agtcttactt actcttcctc acgcgaccca acccgatgtc tggtaacttc ttactacctt aactgtccaa aggactctga ctgttgttcg tgctggagct gcatgcgcca ggatgcaggt tgagaacgaa gactggtacc ggttgacttc taaccgccag gggctctccg cccgcgcctg ccagactcgt cacccaggtt cggccgcgac tgaacacgca tctgctgggc taagtctgac tatctctgaa gctgactaac tcgttccact gatcgaaccg ctctaacgct cgaacacggt caacgacatc ctccaacgct taccatgtgc caagcaccgc gcgccatcag taccccgaaa ctgtatgtcc ccatttctgg gccgtgctgg tatcgaccgt taacatcgac tactttcccg cactaactgg agatgaagaa tactctgatg gtacgaggaa cgagtcagtg cgtgcccccg ggttctggtt cagatctccg atcgatgact gaagctgata tacgtttccc gacgctatca gaactgaccg gaaaaacacg atcgagggtg ggtactgcgg aaattcaaag aaaactacct gcattccaga gcttggggta gttgctcgta ccgaaaatcc agcactgtta ctggcagatt tgcgaggaat cgtgctttcc cgtcactaca ggttctaaaa aacatcgaat aaaaactgca ctgatctctt ctgcagccac atctacatgg aaacacaaag atcaccaagg aacccgttcc aaatgcttct gatggttcta gaagctattg aacagcacag ctcctgtaca ctgaaggtga gtaccggttg atgacgaaga ccaacatcac cccattacgc cgatcaacac aactgactcg actccggtta gtgtaccgga aggaacacac gtatcctgga aatgcttcgg gtctggactg aactgatcga tggttctgct ctctggctac agtctggtgt tcggtgaagc ctcagttcaa ctgaaattgc tgaacagcaa aacacgcgga tcgaaggtac tcatcccgtt tcgctatcgt tcctgggcgg tggtagacgc atacttacat cgctgactct aagataaata cgtttgatcg tcgagcgtct actctcaggc ccaagcgact acctccacaa aggccaagca gcgaagccaa gttcatggtt 60 cgaagaagtt 120 tcataactct 180 tactgttcag 240 tatcgcagaa 300 tcagccgaag 360 cggttatagc 420 aaacggcggc 480 cgaagctgaa 540 actgctgaaa 600 cctgtctttc 660 ggttgtagca 720 gccgctgtct 780 ggtactgctg 840 cctgctgaac 900. agctgcactg 960 accggaatgg 1020 actgactgaa 1080 gttcgaatac 1140 catgcaggct 1200 aatgcgtaaa 1260 cggtaactgg 1320 cctgaccaaa 1380 aggtccaccg 1440 cactgtaatc 1500 gaaagtagct 1560 gcgcaacctg 1620 gatcaagtgc 1680 caagtacctg 1740 taacggtaac 1800 gtcttcctcc 1860 tttccgttgt 1920 ggacgcctgc 1980 gcacgtgctg 2040 gatggggctg 2100 gggccacaac ^160 -14· 88379 200411055 gctatcgaga tggactctcc aagcgcggca gtggtgtgga gtggatgcca gtcaaggaag gtgatctgca ccacatacac tccagacgcc gcgttgctca accagcacca gggagtccaa tcgacttgat tcgtgacggt ttcctccgac tcgcgaagag ttgacatcca acaaggccaa tgtcagagac aaacacagta ccccacctaa gtgaggataa gttgggtgaa ttaaaaccta gggaggtctg gcgaggtgag tgtctgcttg caagcaccaa acatcgtgac cccccatcgt acgacaagta aggcacctca agtttctgaa tgcatctcct tgcagatgca a99agacgtc agacagttga ccgatgtcta agggcatcta ccgaaaagta gccccgcctc cccggcccaa cccccggaag catcggccct aaggcgcaac ctgcctcaag cagttccacg gacctacgac aatcagccac gctcgacgcc taagcacatc gcagatgggc aaagggccat cggcgtggag gcgatgcttc cgttatggag ggtgaccagc ctatgtgaac ctatgggagc cattgccgag tactaccgag caacaccctc ggataactat gcagctccag caagcacctc caagaacgcc cagcgtgaag gtga cctggagagc ctacgaaatg ggtgaaattc cgtgcaggac ttacacctgc tggttccacc cgtgtcgtcc acgagcacgc agggcccggg gtcgattctg aactctaaca tgtttccgct tggcactggg tccgaggagc aagcttggct tgccaggacc atgcactgga ctgtcccaca aacgcaatcg ccatggaccc gccaaacagg tatgtcgtgt tccgtggacg ttcaacaaag acggtgattt ccgaccacgt gacggcgtga tgtgtggcga aacaagcacc ggagacagca tttgagctcg atcgtcactc atcccaccga ctgctgcgga tggcagactc gatgggtgcg aatgacacct gggcagttca aagcactggg accacccagg tcgtcagcag gggtccagca ggaaccacaa gctccgcaac accgcctcaa ccagcagcaa agaggcagca tcatgtccct agctgctcga agtgcattcg taggccttca agatgcagat tgcaggacac gcaacacagt ggacgcacat cgaagggcat aggcccaaaa gctctcccgc acacccctgc gcgctccacc acattcgcag agaggcgtaa attgccttaa cctcgtcgac tcacttactc cgatccgtca ccgaatacag ctccgaagcg caaacaacac 999tgaaggt agacgtacta aggtgtgtta aagtgagcat cagcaccaag gtctccctgc tctcatcacg tccaatagtg cgaccgccac ggcgccccac gttcctggac gcacctgctg gctgtacgag cctggagagc ggtggtcccc gcacctcgag ctcgtacgaa ggaggtgaag ctatctgcag ctactatacc gtatggctcc cagcgtgtct ccagacgacc caggaagcgt cgtcgacagt caactgtcac gtgcttccgc gtggcactgg cagtgaggag taaggtcggc catggagccc ctgtttcgca gatggactac acatagtatg cgtcaacttc cgggagtact tccggagaga gaggacgccg aatgccctgt aacaaccacg cagttccagg cgccacctgt aaacacgcta gtcgtgaaga atggaagcca gagaacagca gtgctgttgc cctctgaccg tcgctggcga atgtggctga ttcgacggct gacaacgaca tgtgggcagt accaaccact agcactgtgc gctccgaccg gcgaggggcc accatcaata tctgccgcaa tatcgcctca gcctcacccg cagagacagc ttcatgtcac 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4154

<210> 18 ； <211〉 1384 <212>蛋白質 <213> HPV <400> 18

Met Ala Asp Asp Ser Gly Thr Glu Asn Glu Gly Ser Gly Cys Thr Gly 15 10 15

Trp Phe Met Val Glu Ala He Val Gin His Pro Thr Gly Thr Gin He 20 25 30

Ser Asp Asp Glu Asp Glu Glu Val Glu Asp Ser Gly Tyr Asp Met Val 35 40 45

Asp Phe lie Asp Asp Ser Asn lie Thr His Asn Ser Leu Glu Ala Gin 50 55 60

Ala Leu Phe Asn Arg Gin Glu Ala Asp Thr His Tyr Ala Thr Val Gin 65 70 75 80

Asp Leu Gly Gly Lys Tyr Leu Gly Ser Pro Tyr Val Ser Pro lie Asn 85 90 95

Thr lie Ala Glu Ala Val Glu Ser Glu lie Ser Pro Arg Leu Asp Ala 100 105 110 lie Lys Leu Tlir Arg Gin Pro Lys Lys Val Lys Arg Arg Leu Phe Gin 115 120 125

Thr Arg Glu Leu Thr Asp Ser Gly Tyr Gly Tyr Ser Glu Val Glu Ala 130 135 140

Gly Thr Gly Thr Gin Val Glu Lys His Gly Val Pro Glu Asn Gly Gly 145 150 155 160 Asp Gly Gin Glu Lys Asp Thr Gly Arg Asp lie Glu Gly Glu Glu His 175 Arg Glu His Ala Gly Thr 190 165 170

Thr Glu Ala Glu Ala Pro Thr Asn Ser Val 180 185

Ala Gly lie Leu Glu Leu Leu Lys Cys Lys Asp Leu Arg Ala Ala Leu -15 - 88379 200411055 195 200 205

Leu Gly Lys Phe Lys Glu Cys Phe Gly Leu Ser Phe 工le Asp Leu lie 210 215 220

Arg Pro Phe Lys Ser Asp Lys Thr Thr Cys Leu Asp Trp Val Val Ala 225 230 235 240

Gly Phe Gly lie His His Ser lie Ser Glu Ala Phe Gin Lys Leu lie 245 250 255

Glu Pro Leu Ser Leu Tyr Ala His lie Gin Trp Leu Thr Asn Ala Trp 260 265 270

Gly Met Val Leu Leu Val Leu Leu Arg Phe Lys Val Asn Lys Ser Arg 275 280 285

Ser Thr Val Ala Arg Thr Leu Ala Thr Leu Leu Asn lie Pro Glu Asn 290 295 300

Gin Met Leu lie Glu Pro Pro Lys lie Gin Ser Gly Val Ala Ala Leu 305 310 315 320

Tyr Trp Phe Arg Thr Gly lie Ser Asn Ala Ser Thr Val lie Gly Glu 325 330 335

Ala Pro Glu Trp lie Thr Arg Gin Thr Val lie Glu His Gly Leu Ala 340 345 350

Asp Ser Gin Phe Lys Leu Thr Glu Met Val Gin Trp Ala Tyr Asp Asn 355 360 365

Asp 工le Cys Glu Glu Ser Glu 工le Ala Phe Glu Tyr Ala Gin Arg Gly 370 375 380

Asp Phe Asp Ser Asn Ala Arg Ala Phe Leu Asn Ser Asn Met Gin Ala 385 390 395 400

Lys Tyr Val Lys Asp Cys Ala Thr Met Cys Arg His Tyr Lys His Ala 405 410 415

Glu Met Arg Lys Met Ser lie Lys Gin Trp 工le Lys His Arg Gly Ser 420 425 430

Lys lie Glu Gly Thr Gly Asn Trp Lys Pro lie Val Gin Phe Leu Arg 435 440 445

His Gin Asn lie Glu Phe lie Pro Phe Leu Thr Lys Phe Lys Leu Trp 450 455 460

Leu His Gly Thr Pro Lys Lys Asn Cys 工le Ala 工le Val Gly Pro Pro 465 470 475 480

Asp Thr Asp Lys Ser Tyr Phe Cys Met Ser Leu lie Ser Phe Leu Gly 485 490 495

Gly Thr Val lie Ser His Val Asn Ser Ser Ser His Phe Trp Leu Gin 500 505 510

Pro Leu Val Asp Ala Lys Val Ala Leu Leu Asp Asp Ala Thr Gin Pro 515 520 525

Cys Trp lie Tyr Met Asp Thr Tyr Met Arg Asn Leu Leu Asp Gly Asn 530 535 540

Pro Met Ser lie Asp Arg Lys His Lys Ala Leu Thr Leu lie Lys Cys 545 550 555 560

Pro Pro Leu Leu Val Thr Ser Asn lie Asp lie Thr Lys Glu Asp Lys 565 570 575

Tyr Lys Tyr Leu His Thr Arg Val Thr Thr Phe Thr Phe Pro Asn Pro 580 585 590

Phe Pro Phe Asp Arg Asn Gly Asn Ala Val Tyr Glu Leu Ser Asn Thr 595 600 605

Asn Trp Lys Cys Phe Phe Glu Arg Leu Ser Ser Ser Leu Asp 工le Gin 610 615 620

Asp Ser Glu Asp Glu Glu Asp Gly Ser Asn Ser Gin Ala Phe Arg Cys 625 630 635 640

Val Pro Gly Thr Val Val Arg Thr Leu Met Glu Ala 工le Ala Lys Arg 645 650 655

Leu Asp Ala Cys Gin Glu Gin Leu Leu Glu Leu Tyr Glu Glu Asn Ser 660 665 670

Thr Asp Leu His Lys His Val Leu His Trp Lys Cys Met Arg His Glu 675 680 685

Ser Val Leu Leu iyr Lys Ala Lys Gin Met Gly Leu Ser His lie Gly 690 695 700

Met Gin Val Val Pro Pro Leu Lys Val Ser Glu Ala Lys Gly His Asn 705 710 715 720

Ala lie Glu Met Gin Met His Leu Glu Ser Leu Leu Arg Thr Glu Tyr -16 - 88379 200411055 725 730 735

Ser Met Glu Pro Trp Thr Leu Gin Glu Thr Ser Tyr Glu Met Trp Gin 740 745 750

Thr Pro Pro Lys Arg Cys Phe Ala Lys Arg Gly Lys Thr Val Glu Val 755 760 765

Lys Phe Asp Gly Cys Ala Asn Asn Thr Met Asp Tyr Val Val Trp Thr 770 775 780

Asp Val Tyr Val Gin Asp Asn Asp Thr Trp Val Lys Val His Ser Met 785 790 795 800

Val Asp Ala Lys Gly lie Tyr Tyr Thr Cys Gly Gin Phe Lys Thr Tyr 805 810 815

Tyr Val Asn Phe Val Lys Glu Ala Glu Lys Tyr Gly Ser Thr Lys His 820 825 830

Trp Glu Val Cys Tyr Gly Ser Thr Val lie Cys Ser Pro Ala Ser Val 835 840 845

Ser Ser Thr Thr Gin Glu Val Ser lie Pro Glu Ser Thr Thr Tyr Thr 850 855 860

Pro Ala Gin Thr Ser Thr Leu Val Ser Ser Ser Thr Lys Glu Asp Ala 865 870 875 880

Val Gin Thr Pro Pro Arg Lys Arg Ala Arg Gly Val Gin Gin Ser Pro 885 890 895

Cys Asn Ala Leu Cys Val Ala His lie Gly Pro Val Asp Ser Gly Asn 900 905 910

His Asn Leu lie Thr Asn Asn His Asp Gin His Gin Arg Arg Asn Asn 915 920 925

Ser Asn Ser Ser Ala Thr Pro lie Val Gin Phe Gin Gly Glu Ser Asn 930 935 940

Cys Leu Lys Cys Phe Arg Tyr Arg Leu Asn Asp Arg His Arg His Leu 945 950 955 960

Phe Asp Leu lie Ser Ser Thr Trp His Trp Ala Ser Ser Lys Ala Pro 965 970 975

His Lys His Ala lie Val Thr Val Thr Tyr Asp Ser Glu Glu Gin Arg 980 985 990

Gin Gin Phe Leu Asp Val Val Lys lie Pro Pro Thr lie Ser His Lys 995 1000 1005

Leu Gly Phe Met Ser Leu His Leu Leu Met Glu Ala lie Ala Lys Arg 1010 1015 1020

Leu Asp Ala Cys Gin Asp Gin Leu Leu Glu Leu Tyr Glu Glu Asn Ser 1025 1030 1035 1040 工le Asp 工le His Lys His lie Met His Trp Lys Cys lie Arg Leu Glu 1045 1050 1055

Ser Val Leu Leu Hi-s Lys Ala Lys Gin Met Gly Leu Ser His lie Gly 1060 1065 1070

Leu Gin Val Val Pro Pro Leu Thr Val Ser Glu Thr Lys Gly His Asn 1075 1080 1085

Ala lie Glu Met Gin Met His Leu Glu Ser Leu Ala Lys Thr Gin Tyr 1090 1095 1100

Gly Val Glu Pro Trp Thr Leu Gin Asp Thr Ser Tyr Glu Met Trp Leu 1105 1110 1115 1120

Thr Pro Pro Lys Arg Cys Phe Ala Lys Gin Gly Asn Thr Val Glu Val 1125 1130 1135

Lys Phe Asp Gly Cys Glu Asp Asn Val Met Glu Tyr Val Val Trp Thr 1140 1145 1150

His lie Tyr Leu Gin Asp Asn Asp Ser Trp Val Lys Val Thr Ser Ser 1155 1160 1165

Val Asp Ala Lys Gly lie Tyr Tyr Thr Cys Gly Gin Phe Lys Thr Tyr 1170 1175 1180

Tyr Val Asn Phe Asn Lys Glu Ala Gin Lys Tyr Gly Ser Thr Asn His 1185 1190 1195 1200

Trp Glu Val Cys Tyr Gly Ser Thr Val lie Cys Ser Pro Ala Ser Val 1205 1210 1215

Ser Ser Thr Val Arg Glu Val Ser lie Ala Glu Pro Thr Thr Tyr Thr 1220 1225 1230

Pro Ala Gin Thr Thr Ala Pro Thr Val Ser Ala Cys Thr Thr Glu Asp 1235 1240 1245

Gly Val Ser Ala Pro Pro Arg Lys Arg Ala Arg Gly Pro Ser Thr Asn -17- 88379 200411055 1250 1255 1260

Asn Thr Leu Cys Val Ala Asn lie Arg Ser Val Asp Ser Thr 工le Asn 1265 1270 1275 1280

Asn lie Val Thr Asp Asn Tyr Asn Lys His Gin Arg Arg Asn Asn Cys 1285 1290 1295

His Ser Ala Ala Thr Pro lie Val Gin Leu Gin Gly Asp Ser Asn Cys 1300 1305 1310

Leu Lys Cys Phe Arg Tyr Arg Leu Asn Asp Lys Tyr Lys His Leu Phe 1315 1320 1325

Glu Leu Ala Ser Ser Thr Trp His Trp Ala Ser Pro Glu Ala Pro His 1330 1335 1340

Lys Asn Ala lie Val Thr Leu Thr 1345 1350 Gin Phe Leu Asn Ser Val Lys lie 1365 Gly Phe Met Ser Leu His Leu Leu 1380

Tyr Ser Ser Glu Glu Gin Arg Gin 1355 1360 Pro Pro Thr lie Arg His Lys Val 1370 1375

<210> 19 <211> 4155 <212> DNA <213> HPV <400> 19 atggaagcta ttgccaagcg actggacgcc tgccaggagc agctgctgga gctgtacgag 60 gaaaacagca cagacctcca caagcacgtg ctgcactgga agtgcatgcg ccacgagtca 120 gtgctcctgt acaaggccaa gcagatgggg ctgtcccaca tcgggatgca ggtcgtgccc 180 ccgctgaagg tgagcgaagc caagggccac aacgctatcg agatgcagat gcacctggag 240 agcctgctgc ggaccgaata cagcatggag ccctggactc tccaggagac gtcctacgaa 300 atgtggcaga ctcctccgaa gcgctgtttc gcaaagcgcg gcaagacagt tgaggtgaaa 360 ttcgatgggt gcgcaaacaa cacgatggac tacgtggtgt ggaccgatgt ctacgtgcag 420 gacaatgaca cctgggtgaa ggtacatagt atggtggatg ccaagggcat ctattacacc 480 tgcgggcagt tcaagacgta ctacgtcaac ttcgtcaagg aagccgaaaa gtatggttcc 540 accaagcact gggaggtgtg ttacgggagt actgtgatct gcagccccgc ctccgtgtcg 600 tccaccaccc aggaagtgag cattccggag agcaccacat acaccccggc ccaaacgagc 660 acgctcgtca gcagcagcac caaggaggac gccgtccaga cgcccccccg gaagagggcc 720 cggggggtcc agcagtctcc ctgcaatgcc ctgtgcgttg ctcacatcgg ccctgtcgat 780 tctgggaacc acaatctcat cacgaacaac cacgaccagc accaaaggcg caacaactct 840 aacagctccg caactccaat agtgcagttc cagggggagt ccaactgcct caagtgtttc 900 cgctaccgcc tcaacgaccg ccaccgccac ctgttcgact tgatcagttc cacgtggcac 960 tgggccagca gcaaggcgcc ccacaaacac gctatcgtga cggtgaccta cgactccgag 1020 gagcagaggc agcagttcct ggacgtcgtg aagattcctc cgacaatcag ccacaagctt 1080 ggcttcatgt ccctgcacct gctgatggca gacgattccg gtactgagaa cgaaggttct 1140 ggttgtaccg gttggttcat ggttgaagca atcgttcagc atccgactgg tacccagatc 1200 tccgatgacg aagacgaaga agttgaagat tctggttacg acatggttga cttcatcgat 1260 gactccaaca tcactcataa ctctctggaa gcacaggctc tgtttaaccg ccaggaagct 1320 gatacccatt acgctactgt tcaggacctg ggaggcaaat atctgggctc tccgtacgtt 1380 tccccgatca acactatcgc agaagcagtt gagtctgaaa tctccccgcg cctggacgct 1440 atcaaactga ctcgtcagcc gaagaaggtt aaacgtcgtc tgttccagac tcgtgaactg 1500 accgactccg gttacggtta tagcgaagtt gaggctggca ccggcaccca ggttgaaaaa 1560 cacggtgtac cggaaaacgg cggcgacggt caggaaaagg acaccggccg cgacatcgag 1620 ggtgaggaac acaccgaagc tgaagctccg actaactctg ttcgtgaaca cgcaggtact 1680 gcgggtatcc tggaactgct gaaatgcaaa gacctgcgcg cggctctgct gggcaaattc 1740 aaagaatgct tcggcctgtc tttcattgac ctgatccgtc cgtttaagtc tgacaaaact 1800 acctgtctgg actgggttgt agcaggcttc ggcatccacc actctatctc tgaagcattc 1860 cagaaactga tcgagccgct gtctctgtac gcgcacatcc agtggctgac taacgcttgg 1920 ggtatggttc tgctggtact gctgcgcttt aaagtaaaca aatctcgttc cactgttgct 1980 cgtactctgg ctaccctgct gaacatcccg gagaaccaga tgctgatcga accgccgaaa 2040 atccagtctg gtgtagctgc actgtactgg tttcgtactg gcatctctaa cgctagcact 2100 gttatcggtg aagcaccgga atggatcact cgtcagaccg ttatcgaaca cggtctggca 2160 gattctcagt tcaaactgac tgaaatggtt cagtgggcat acgacaacga catctgcgag 2220 gaatctgaaa ttgcgttcga atacgctcag cgtggcgact tcgactccaa cgctcgtgct 2280 ttcctgaaca gcaacatgca ggctaaatac gtaaaagact gcgctaccat gtgccgtcac 2340 tacaaacacg cggaaatgcg taaaatgtct atcaaacagt ggatcaagca ccgcggttct 2400 aaaatcgaag gtaccggtaa ctggaaaccg atcgttcagt tcctgcgcca tcagaacatc 2460 -18 - 88379 200411055 gaattcatcc tgcatcgcta tctttcctgg ccactggtag atggatactt aaagcgctga aaggaagata ttcccgtttg ttcttcgagc tctaactctc atcgcgaaga attgacatcc cacaaggcca gtgtcagaga aaaacacagt accccaccta tgtgaggata agttgggtga tttaaaacct tgggaggtct cgcgaggtga gtgtctgctt ccaagcacca aacatcgtga acccccatcg aacgacaagt gaggcacctc cagtttctga ctgcatctcc cgttcctgac tcgtaggtcc gcggcactgt acgcgaaagt acatgcgcaa ctctgatcaa aatacaagta atcgtaacgg gtctgtcttc aggctttccg ggctcgacgc ataagcacat agcagatggg caaagggcca acggcgtgga agcgatgctt acgttatgga aggtgaccag actatgtgaa gctatgggag gcattgccga gtactaccga acaacaccct cggataacta tgcagctcca acaagcacct acaagaacgc acagcgtgaa tgtga caaattcaag accggacact aatctctcac agctctgctg cctgctggac gtgcccgccg cctgcatacc taacgctgtt ctccctggac ttgtgttccg ctgccaggac catgcactgg cctgtcccac taacgeaatc gccatggacc cgccaaacag gtatgtcgtg ctccgtggac cttcaacaaa cacggtgatt gccgaccacg ggacggcgtg ctgtgtggcg taacaagcac gggagacagc ctttgagctc catcgtcact gatcccaccg ctgtggctgc gacaagtctt gttaactctt gacgacgcga ggtaacccga ctgctggtaa cgtgttacta tacgaactgt atccaggact ggtactgttg cagctgctcg aagtgcattc ataggccttc gagatgcaga ctgcaggaca ggcaacacag tggacgcaca gcgaagggca gaggcccaaa tgctctcccg tacacccctg agcgctccac aacattcgca cagaggcgta aattgcctta gcctcgtcga ctcacttact acgatccgtc acggtacccc acttctgtat cctcccattt cccagccgtg tgtctatcga cttctaacat cctttacttt ccaacactaa ctgaagatga ttcgtactct agctgtacga gcctggagag aggtggtccc tgcacctcga cctcgtacga tggaggtgaa tctatctgca tctactatac agtatggctc ccagcgtgtc cccagacgac ccaggaagcg gcgtcgacag acaactgtca agtgcttccg cgtggcactg ccagtgagga ataaggtcgg gaaaaaaaac gtccctgatc ctggctgcag ctggatctac ccgtaaacac cgacatcacc cccgaacccg ctggaaatgc agaagatggt gatggaagcc ggagaacagc cgtgctgttg ccctctgacc gtcgctggcg aatgtggctg gttcgacggc ggacaacgac ctgtgggcag caccaaccac tagcactgtg cgctccgacc tgcgaggggc taccatcaat ctctgccgca ctatcgcctc ggcctcaccc gcagagacag cttcatgtca 2520 2580 2640 2700 2760 2820 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4155

<210> 20 <211> 1384 <212>蛋白質 <213> HPV lie Ala 5 Glu Glu 20 Met Arg Ser His Lys Gly Arg Thr 85 Glu Met 100 Thr Val Val Val Val His Phe Lys 165 Ser Thr 180 Pro Ala Thr Thr Lys Glu

Lys Arg Asn Ser His Glu lie Gly 55 His Asn 70 Glu Tyr Trp Gin Glu Val Trp Thr 135 Ser Met 150 Thr Tyr Lys His Ser Val Tyr Thr 215 Asp Ala 230 <400> 20 Met Glu Ala 1

Glu Leu Tyr

Trp Lys Cys 35

Met Gly Leu 50

Ser Glu Ala 65

Ser Leu Leu

Thr Ser Tyr

Arg Gly Lys 115

Met Asp Tyr 130

Trp Val Lys 145

Cys Gly Gin

Lys Tyr Gly 工le Cys Ser 195

Pro Glu Ser 210

Ser Ser Thr 225

Leu Asp Ala 10

Thr Asp Leu 25

Ser Val Leu 40

Met Gin Val

Ala lie Glu

Ser Met Glu 90

Thr Pro Pro 105

Lys Phe Asp 120

Asp Val Tyr

Val Asp Ala

Tyr Val Asn 170

Trp Glu Val 185

Ser Ser Thr 200

Pro Ala Gin Val Gin Thr

Cys Gin His Lys Leu Tyr Val Pro 60 Met Gin 75 Pro Trp Lys Arg Gly Cys Val Gin 140 Lys Gly 155 Phe Val Cys Tyr Thr Gin Thr Ser 220 Pro Pro 235

Glu Gin Leu Leu 15 His Val Leu His 30 Lys Ala Lys Gin 45 Pro Leu Lys Val Met His Leu Glu 80 Thr Leu Gin Glu 95 Cys Phe Ala Lys 110 Ala Asn Asn Thr 125 Asp Asn Asp Thr lie Tyr Tyr Thr 160 Lys Glu Ala Glu 175 Gly Ser Thr Val 190 Glu Val Ser lie 205 Thr Leu Val Ser Arg Lys Arg Ala 240 19- 88379 200411055

Arg Gly Val Gin Gin Ser Pro Cys Asn Ala Leu Cys Val Ala His lie 245 250 255

Gly Pro Val Asp Ser Gly Asn His Asn Leu lie Thr Asn Asn His Asp 260 265 270

Gin His Gin Arg Arg Asn Asn Ser Asn Ser Ser Ala Thr Pro lie Val 275 280 285

Gin Phe Gin Gly Glu Ser Asn Cys Leu Lys Cys Phe Arg Tyr Arg Leu 290 295 300

Asn Asp Arg His Arg His Leu Phe Asp Leu lie Ser Ser Thr Trp His 305 310 315 320

Trp Ala Ser Ser Lys Ala Pro His Lys His Ala 工le Val Thr Val Thr 325 330 335

Tyr Asp Ser Glu Glu Gin Arg Gin Gin Phe Leu Asp Val Val Lys lie 340 345 350

Pro Pro Thr lie Ser His Lys Leu Gly Phe Met Ser Leu His Leu Leu 355 360 365

Met Ala Asp Asp Ser Gly Thr Glu Asn Glu Gly Ser Gly Cys Thr Gly 370 375 380

Trp Phe Met Val Glu Ala lie Val Gin His Pro Thr Gly Thr Gin lie 385 390 395 400

Ser Asp Asp Glu Asp Glu Glu Val Glu Asp Ser Gly Tyr Asp Met Val 405 410 415

Asp Phe 工le Asp Asp Ser Asn lie Thr His Asn Ser Leu Glu Ala Gin 420 425 430

Ala Leu Phe Asn Arg Gin Glu Ala Asp Thr His Tyr Ala Thr Val Gin 435 440 445

Asp Leu Gly Gly Lys Tyr Leu Gly Ser Pro Tyr Val Ser Pro lie Asn 450 455 460

Thr lie Ala Glu Ala Val Glu Ser Glu lie Ser Pro Arg Leu Asp Ala 465 470 475 480 lie Lys Leu Thr Arg Gin Pro Lys Lys Val Lys Arg Arg Leu Phe Gin 485 490 495

Thr Arg Glu Leu Thr Asp Ser Gly Tyr Gly Tyr Ser Glu Val Glu Ala 500 505 510

Gly Thr Gly Thr Gin Val Glu Lys His Gly Val Pro Glu Asn Gly Gly 515 520 525

Asp Gly Gin Glu Lys Asp Thr Gly Arg Asp 工le Glu Gly Glu Glu His 530 535 540

Thr Glu Ala Glu Ala Pro Thr Asn Ser Val Arg Glu His Ala Gly Thr 545 550 555 560

Ala Gly lie Leu Glu Leu Leu Lys Cys Lys Asp Leu Arg Ala Ala Leu 565 570 575

Leu Gly Lys Phe Lys Glu Cys Phe Gly Leu Ser Phe 工le Asp Leu lie 580 585 590

Arg Pro Phe Lys Ser Asp Lys Thr Thr Cys Leu Asp Trp Val Val Ala 595 600 605

Gly Phe Gly lie His His Ser lie Ser Glu Ala Phe Gin Lys Leu lie 610 615 620

Glu Pro Leu Ser Leu Tyr Ala His 工le Gin Trp Leu Thr Asn Ala Trp 625 630 635 640

Gly Met Val Leu Leu Val Leu Leu Arg Phe Lys Val Asn Lys Ser Arg 645 650 655

Ser Thr Val Ala Arg Thr Leu Ala Thr Leu Leu Asn lie Pro Glu Asn 660 665 670

Gin Met Leu 工le Glu Pro Pro Lys lie Gin Ser Gly Val Ala Ala Leu 675 680 685

Tyr Trp Phe Arg Thr Gly lie Ser Asn Ala Ser Thr Val lie Gly Glu 690 695 700

Ala Pro Glu Trp lie Thr Arg Gin Thr Val lie Glu His Gly Leu Ala 705 710 715 720

Asp Ser Gin Phe Lys Leu Thr Glu Met Val Gin Trp Ala Tyr Asp Asn 725 730 735

Asp lie Cys Glu Glu Ser Glu lie Ala Phe Glu Tyr Ala Gin Arg Gly 740 745 750

Asp Phe Asp Ser Asn Ala Arg Ala Phe Leu Asn Ser Asn Met Gin Ala 755 760 765 -20 - 88379 200411055

Lys Tyr Val Lys Asp Cys Ala Thr Met Cys Arg His Tyr Lys His Ala 770 775 780

Glu Met Arg Lys Met Ser lie Lys Gin Trp lie Lys His Arg Gly Ser 785 790 795 800

Lys lie Glu Gly Thr Gly Asn Trp Lys Pro lie Val Gin Phe Leu Arg 805 810 815

His Gin Asn lie Glu Phe lie Pro Phe Leu Thr Lys Phe Lys Leu Trp 820 825 830

Leu His Gly Thr Pro Lys Lys Asn Cys 工le Ala 工le Val Gly Pro Pro 835 840 845

Asp Thr Asp Lys Ser Tyr Phe Cys Met Ser Leu lie Ser Phe Leu Gly 850 855 860

Gly Thr Val 工le Ser His Val Asn Ser Ser Ser His Phe Trp Leu Gin 865 870 875 880

Pro Leu Val Asp Ala Lys Val Ala Leu Leu Asp Asp Ala Thr Gin Pro 885 890 895

Cys Trp lie Tyr Met Asp Thr Tyr Met Arg Asn Leu Leu Asp Gly Asn 900 905 910

Pro Met Ser lie Asp Arg Lys His Lys Ala Leu Thr Leu lie Lys Cys 915 920 925

Pro Pro Leu Leu Val Thr Ser Asn lie Asp lie Thr Lys Glu Asp Lys 930 935 940

Tyr Lys Tyr Leu His Thr Arg Val Thr Thr Phe Thr Phe Pro Asn Pro 945 950 955 960

Phe Pro Phe Asp Arg Asn Gly Asn Ala Val Tyr Glu Leu Ser Asn Thr 965 970 975

Asn Trp Lys Cys Phe Phe Glu Arg Leu Ser Ser Ser Leu Asp lie Gin 980 985 990

Asp Ser Glu Asp Glu Glu Asp Gly Ser Asn Ser Gin Ala Phe Arg Cys 995 1000 1005

Val Pro Gly Thr Val Val Arg Thr Leu Met Glu Ala lie Ala Lys Arg 1010 1015 1020

Leu Asp Ala Cys Gin Asp Gin Leu Leu Glu Leu Tyr Glu Glu Asn Ser 1025 1030 1035 1040 lie Asp 工le His Lys His 工le Met His Trp Lys Cys lie Arg Leu Glu 1045 1050 1055

Ser Val Leu Leu His Lys Ala Lys Gin Met Gly Leu Ser His lie Gly 1060 1065 1070

Leu Gin Val Val Pro Pro Leu Thr Val Ser Glu Thr Lys Gly His Asn 1075 1080 1085

Ala lie Glu Met Gin Met His Leu Glu Ser Leu Ala. Lys Thr Gin Tyr 1090 - 1095 1100

Thr Pro Pro Lys Arg Cys Phe Ala Lys Gin Gly Asn Thr Val Glu Val 1125 1130 1135

Lys Phe Asp Gly Cys Glu Asp Asn Val Met Glu Tyr Val Val Trp Thr 1140 1145 1150

His lie Tyr Leu Gin Asp Asn Asp Ser Trp Val Lys Val Thr Ser Ser 1155 1160 1165

Val Asp Ala Lys Gly lie Tyr Tyr Thr Cys Gly Gin Phe Lys Thr Tyr 117-0 1175 1180

Trp Glu Val Cys Tyr Gly Ser Thr Val lie Cys Ser Pro Ala Ser Val 1205 1210 1215

Ser Ser Thr Val Arg Glu Val Ser lie Ala Glu Pro Thr Thr Tyr Thr 1220 1225 1230

Pro Ala Gin Thr Thr Ala Pro Thr Val Ser Ala Cys Thr Thr Glu Asp 1235 1240 1245

Gly Val Ser Ala Pro Pro Arg Lys Arg Ala Arg Gly Pro Ser Thr Asn 1250 1255 1260

Asn Thr Leu Cys Val Ala Asn lie Arg Ser Val Asp Ser Thr lie Asn 1265 1270 1275 1280

Asn lie Val Thr Asp Asn Tyr Asn Lys His Gin Arg Arg Asn Asn Cys 1285 1290 1295 -21-

88379 200411055

His Ser Ala Ala Thr Pro lie Val Gin Leu Gin Gly Asp Ser Asn Cys 1300 1305 1310

Leu Lys Cys Phe Arg Tyr Arg Leu Asn Asp Lys Tyr Lys His Leu Phe 1315 1320 1325

Glu Leu Ala Ser Ser Thr Trp His Trp Ala Ser Pro Glu Ala Pro His 1330 1335 1340

Lys Asn Ala lie Val Thr Leu Thr Tyr Ser Ser Glu Glu Gin Arg Gin 1345 1350 1355 1360

Gin Phe Leu Asn Ser Val Lys lie Pro Pro Thr lie Arg His Lys Val 1365 1370 1375

Gly Phe Met Ser Leu His Leu Leu 1380

<210> 21 <211> 4155 <212> DNA <213> HPV <400> 21 atggaagcta gaaaacagca gtgctcctgt ccgctgaagg agcctgctgc atgtggcaga ttcgatgggt gacaatgaca tgcgggcagt accaagcact tccaccaccc acgctcgtca cggggggtcc tctgggaacc aacagctccg cgctaccgcc tgggccagca gagcagaggc ggcttcatgt gaccagctgc tggaagtgca cacataggcc atcgagatgc accctgcagg cagggcaaca gtgtggacgc gacgcgaagg aaagaggccc atttgctctc acgtacaccc gtgagcgctc gcgaacattc caccagaggc agcaattgcc ctcgcctcgt actctcactt ccgacgatcc ggtactgaga catccgactg gacatggttg ctgtttaacc tatctgggct atctccccgc ctgttccaga accggcaccc gacaccggcc ttgccaagcg cagacctcca acaaggccaa tgagcgaagc ggaccgaata ctcctccgaa gcgcaaacaa cctgggtgaa tcaagacgta gggaggtgtg aggaagtgag gcagcagcac agcagtctcc acaatctcat caactccaat tcaacgaccg gcaaggcgcc agcagttcct ccctgcacct tcgagctgta ttcgcctgga ttcaggtggt agatgcacct acacctcgta cagtggaggt acatctatct gcatctacta aaaagtatgg ccgccagcgt ctgcccagac cacccaggaa gcagcgtcga gtaacaactg ttaagtgctt cgacgtggca actccagtga gtcataaggt acgaaggttc gtacccagat acttcatcga gccaggaagc ctccgtacgt gcctggacgc ctcgtgaact aggttgaaaa gcgacatcga actggacgcc caagcacgtg gcagatgggg caagggccac cagcatggag gcgctgtttc cacgatggac ggtacatagt ctacgtcaac ttacgggagt cattccggag caaggaggac ctgcaatgcc cacgaacaac agtgcagttc ccaccgccac ccacaaacac ggacgtcgtg gctgatggaa cgaggagaac gagcgtgctg cccccctctg cgagtcgctg cgaaatgtgg gaagttcgac gcaggacaac tacctgtggg ctccaccaac gtctagcact gaccgctccg gcgtgcgagg cagtaccatc tcactctgcc ccgctatcgc ctgggcctca ggagcagaga cggcttcatg tggttgtacc ctccgatgac tgactccaac tgatacccat ttccccgatc tatcaaactg gaccgactcc acacggtgta gggtgaggaa tgccaggagc ctgcactgga ctgtcccaca aacgctatcg ccctggactc gcaaagcgcg tacgtggtgt atggtggatg ttcgtcaagg actgtgatct agcaccacat gccgtccaga ctgtgcgttg cacgaccagc cagggggagt ctgttcgact gctatcgtga aagattcctc gccatcgcga agcattgaca ttgcacaagg accgtgtcag gcgaaaacac ctgaccccac ggctgtgagg gacagttggg cagtttaaaa cactgggagg gtgcgcgagg accgtgtctg ggcccaagca aataacatcg gcaaccccca ctcaacgaca cccgaggcac cagcagtttc tcactgcatc ggttggttca gaagacgaag atcactcata tacgctactg aacactatcg actcgtcagc ggttacggtt ccggaaaacg cacaccgaag agctgctgga agtgcatgcg tcgggatgca agatgcagat tccaggagac gcaagacagt ggaccgatgt ccaagggcat aagccgaaaa gcagccccgc acaccccggc cgcccccccg ctcacatcgg accaaaggcg ccaactgcct tgatcagttc cggtgaccta cgacaatcag agaggctcga tccataagca ccaagcagat agacaaaggg agtacggcgt ctaagcgatg ataacgttat tgaaggtgac cctactatgt tctgctatgg tgagcattgc cttgtactac ccaacaacac tgacggataa tcgtgcagct agtacaagca ctcacaagaa tgaacagcgt tcctgatggc tggttgaagc aagttgaaga actctctgga ttcaggacct cagaagcagt cgaagaaggt atagcgaagt gcggcgacgg ctgaagctcc gctgtacgag ccacgagtca ggtcgtgccc gcacctggag gtcctacgaa tgaggtgaaa ctacgtgcag ctattacacc gtatggttcc ctccgtgtcg ccaaacgagc gaagagggcc ccctgtcgat caacaactct caagtgtttc cacgtggcac cgactccgag ccacaagctt cgcctgccag catcatgcac gggcctgtcc ccataacgca ggagccatgg cttcgccaaa ggagtatgtc cagctccgtg gaacttcaac gagcacggtg cgagccgacc cgaggacggc cctctgtgtg ctataacaag ccagggagac cctctttgag cgccatcgtc gaagatccca agacgattcc aatcgttcag ttctggttac agcacaggct gggaggcaaa tgagtctgaa taaacgtcgt tgaggctggc tcaggaaaag gactaactct 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 -22- 88379 200411055 gttcgtgaac gcggctctgc ccgtttaagt cactctatct cagtggctga aaatctcgtt atgctgatcg ggcatctcta gttatcgaac tacgacaacg ttcgactcca tgcgctacca tggatcaagc ttcctgcgcc cacggtaccc tacttctgta tcctcccatt acccagccgt atgtctatcg acttctaaca acctttactt tccaacacta tctgaagatg gttcgtactc acgcaggtac tgggcaaatt ctgacaaaac ctgaagcatt ctaacgcttg ccactgttgc aaccgccgaa acgctagcac acggtctggc acatctgcga acgctcgtgc tgtgccgtca accgcggttc atcagaacat cgaaaaaaaa tgtccctgat tctggctgca gctggatcta accgtaaaca tcgacatcac tcccgaaccc actggaaatg aagaagatgg tgtga tgcgggtatc caaagaatgc tacctgtctg ccagaaactg gggtatggtt tcgtactctg aatccagtct tgttatcggt agattctcag ggaatctgaa tttcctgaac ctacaaacac taaaatcgaa cgaattcatc ctgcatcgct ctctttcctg gccactggta catggatact caaagcgctg caaggaagat gttcccgttt cttcttcgag ttctaactct ctggaactgc ttcggcctgt gactgggttg atcgagccgc ctgctggtac gctaccctgc ggtgtagctg gaagcaccgg ttcaaactga attgcgttcg agcaacatgc gcggaaatgc ggtaccggta ccgttcctga atcgtaggtc ggcggcactg gacgcgaaag tacatgcgca actctgatca aaatacaagt gatcgtaacg cgtctgtctt caggctttcc tgaaatgcaa ctttcattga tagcaggctt tgtctctgta tgctgcgctt tgaacatccc cactgtactg aatggatcac ctgaaatggt aatacgctca aggctaaata gtaaaatgtc actggaaacc ccaaattcaa caccggacac taatctctca tagctctgct acctgctgga agtgcccgcc acctgcatac gtaacgctgt cctccctgga gttgtgttcc agacctgcgc cctgatccgt cggcatccac cgcgcacatc taaagtaaac ggagaaccag gtttcgtact tcgtcagacc tcagtgggca gcgtggcgac cgtaaaagac tatcaaacag gatcgttcag gctgtggctg tgacaagtct cgttaactct ggacgacgcg cggtaacccg gctgctggta ccgtgttact ttacgaactg catccaggac gggtactgtt 2820 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4155

<210> 22 <211> 1384 <212> 蛋白質 <213> HPV <400> 22

Met Glu Ala 工le Ala Lys Arg Leu 1 5

Glu Leu Tyr Glu Glu Asn Ser Thr 20

Trp Lys Cys Met Arg His Glu Ser 35 40

Met Gly Leu Ser His 工le Gly Met 50 55

Ser Glu Ala Lys Gly His Asn Ala 65 70

Ser Leu Leu Arg Thr Glu Tyr Ser 85

Thr Ser Tyr Glu Met Trp Gin Thr 100

Arg Gly Lys Thr Val Glu Val Lys 115 120

Met Asp Tyr Val Val Trp Thr Asp 130 135

Trp Val Lys Val His Ser Met Val 145 150

Cys Gly Gin Phe Lys Thr Tyr Tyr 165

Lys Tyr Gly Ser Thr Lys His Trp 180 lie Cys Ser Pro Ala Ser Val Ser 195 200

Pro Glu Ser Thr Thr Tyr Thr Pro 210 215

Ser Ser Thr Lys Glu Asp Ala Val 225 230

Arg Gly Val Gin Gin Ser Pro Cys 245

Gly Pro Val Asp Ser Gly Asn His 260

Gin His Gin Arg Arg Asn Asn Ser

Asp Ala Cys Gin Glu Gin Leu Leu 10 15

Asp Leu His Lys His Val Leu His 25 30

Val Leu Leu Tyr Lys Ala Lys Gin 45

Gin Val Val Pro Pro Leu Lys Val 60 工le Glu Met Gin Met His Leu Glu 75 80

Met Glu Pro Trp Thr Leu Gin Glu 90 95

Pro Pro Lys Arg Cys Phe Ala Lys 105 110

Phe Asp Gly Cys Ala Asn Asn Thr 125

Val Tyr Val Gin Asp Asn Asp Thr 140

Asp Ala Lys Gly lie Tyr Tyr Thr 155 160

Val Asn Phe Val Lys Glu Ala Glu 170 175

Glu Val Cys Tyr Gly Ser Thr Val 185 190

Ser Thr Thr Gin Glu Val Ser lie 205

Ala Gin Thr Ser Thr Leu Val Ser 220

Gin Thr Pro Pro Arg Lys Arg Ala 235 240

Asn Ala Leu Cys Val Ala His lie 250 255

Asn Leu lie Thr Asn Asn His Asp 265 270

Asn Ser Ser Ala Thr Pro lie Val -23 - 88379 200411055 275 Gin Phe Gin 290 Asn Asp Arg 305 Trp Ala Ser Tyr Asp Ser Pro Pro Thr 355 Met Glu Ala 370 Glu Leu Tyr 385 Trp Lys Cys Met Gly Leu Ser Glu Thr 435 Ser Leu Ala 450 Thr Ser Tyr 465 Gin Gly Asn Met Glu Tyr Trp Val Lys 515 Cys Gly Gin 530 Lys Tyr Gly 545 工le Cys Ser Ala Glu Pro Ser Ala Cys 595 Ala Arg Gly 610 Ser Val Asp 625 His Gin Arg Leu Gin Gly Asp Lys Tyr 675 Ala Ser Pro 690 Ser Ser Glu 705 Pro Thr lie Ala Asp Asp Phe Met Val 755 Asp Asp Glu 770 Phe lie Asp 785 Leu Phe Asn

Ser Asn 295 His Leu 310 Ala Pro Gin Arg His Lys Lys Arg 375 Asn Ser 390 Leu Glu He Gly His Asn Gin Tyr 455 Trp Leu 470 Glu Val Trp Thr Ser Ser Thr Tyr 535 Asn His 550 Ser Val Tyr Thr Glu Asp Thr Asn 615 lie Asn 630 Asn Cys Asn Cys Leu Phe Pro His 695 Arg Gin 710 Lys Val Thr Glu He Val Glu Val 775 Asn lie 790 Glu Ala

Lys Cys Leu lie 315 His Ala 330 Phe Leu Phe Met Ala Cys lie His 395 Leu Leu 410 Val Val Glu Met Glu Pro Pro Lys 475 Asp Gly 490 Tyr Leu Ala Lys Asn Phe Val Cys 555 Thr Val 570 Gin Thr Ser Ala Leu Cys Val Thr 635 Ala Ala 650 Cys Phe Ala Ser Ala lie Leu Asn 715 Met Ser 730 Gly Ser Pro Thr Ser Gly Asn Ser 795 His Tyr

Tyr Arg Leu Thr Trp His 320 Thr Val Thr 335 Val Lys lie 350 His Leu Leu Gin Leu Leu lie Met His 400 Ala Lys Gin 415 Leu Thr Val 430 His Leu Glu Leu Gin Asp Phe Ala Lys 480 Asp Asn Val 495 Asn Asp Ser 510 Tyr Tyr Thr Glu Ala Gin Ser Thr Val 560 Val Ser lie 575 Pro Thr Val 590 Arg Lys Arg Asn lie Arg Tyr Asn Lys 640 He Val Gin 655 Arg Leu Asn 670 Trp His Trp Leu Thr Tyr

Lys 工le Pro 720 Leu Leu Met 735 Thr Gly Trp 750 Gin He Ser Met Val Asp Ala Gin Ala 800 Val Gin Asp

Gly Glu

His Arg

Ser Lys 325 Glu Glu 340 lie Ser 工le Ala

Glu Glu lie Arg 405 Ser His 420

Lys Gly

Lys Thr

Glu Met

Thr Val 485 Val Val 500

Val Thr

Phe Lys

Ser Thr

Pro Ala 565 Thr Thr 580

Thr Thr

Pro Ser

Ser Thr

Arg Asn 645 Asp Ser 660

Lys His

Glu Ala

Glu Gin

Arg His 725 Ser Gly 740

Glu Ala Asp Glu Asp Ser Arg Gin 280

Cys Leu

Phe Asp

His Lys

Gin Gin 345 Leu Gly 360

Leu Asp 工le Asp

Ser Val

Leu Gin 425 Ala lie 440

Gly Val

Thr Pro

Lys Phe

His He 505 Val Asp 520

Tyr Val

Trp Glu

Ser Ser

Pro Ala 585 Gly Val 600

Asn Thr

Asn lie

His Ser

Leu Lys 665 Glu Leu 680

Lys Asn

Gin Phe

Gly Phe

Asn Glu 745 Gin His 760

Glu Asp Thr His Asp Thr 285 Phe Arg 300

Ser Ser lie Val

Asp Val

Ser Leu 365 Gin Asp 380

Lys His

His Lys

Pro Pro

Gin Met 445 Trp Thr 460

Arg Cys

Cys Glu

Gin Asp

Gly lie 525 Asn Lys 540

Tyr Gly

Arg Glu

Thr Ala

Pro Pro 605 Val Ala 620

Asp Asn

Thr Pro

Arg Tyr

Ser Thr 685 Val Thr 700

Ser Val

Leu His

Gly Cys

Gly Thr 765 Tyr Asp 780

Leu Glu Ala Thr 88379 •24- 200411055 805 810 815

Leu Gly Gly Lys Tyr Leu Gly Ser Pro Tyr Val Ser Pro lie Asn Thr 820 825 830 lie Ala Glu Ala Val Glu Ser Glu lie Ser Pro Arg Leu Asp Ala lie 835 840 845

Lys Leu Thr Arg Gin Pro Lys Lys Val Lys Arg Arg Leu Phe Gin Thr 850 855 860

Arg Glu Leu Thr Asp Ser Gly Tyr Gly Tyr Ser Glu Val Glu Ala Gly 865 870 875 880

Thr Gly Thr Gin Val Glu Lys His Gly Val Pro Glu Asn Gly Gly Asp 885 890 895

Gly Gin Glu Lys Asp Thr Gly Arg Asp lie Glu Gly Glu Glu His Thr 900 905 910

Glu Ala Glu Ala Pro Thr Asn Ser Val Arg Glu His Ala Gly Thr Ala 915 920 925

Gly lie Leu Glu Leu Leu Lys Cys Lys Asp Leu Arg Ala Ala Leu Leu 930 935 940

Gly Lys Phe Lys Glu Cys Phe Gly Leu Ser Phe lie Asp Leu lie Arg 945 950 955 960

Pro Phe Lys Ser Asp Lys Thr Thr Cys Leu Asp Trp Val Val Ala Gly 965 970 975

Phe Gly lie His His Ser lie Ser Glu Ala Phe Gin Lys Leu lie Glu 980 985 990

Pro Leu Ser Leu Tyr Ala His lie Gin Trp Leu Thr Asn Ala Trp Gly 995 1000 1005

Met Val Leu Leu Val Leu Leu Arg Phe Lys Val Asn Lys Ser Arg Ser 1010 1015 1020

Thr Val Ala Arg Thr Leu Ala Thr Leu Leu Asn lie Pro Glu Asn Gin 1025 1030 1035 1040

Met Leu lie Glu Pro Pro Lys lie Gin Ser Gly Val Ala Ala Leu Tyr 1045 1050 1055

Trp Phe Arg Thr Gly lie Ser Asn Ala Ser Thr Val lie Gly Glu Ala 1060 1065 1070

Pro Glu Trp lie Thr Arg Gin Thr Val lie Glu His Gly Leu Ala Asp 1075 1080 1085

Ser Gin Phe Lys Leu Thr Glu Met Val Gin Trp Ala Tyr Asp Asn Asp 1090 1095 1100 工le Cys Glu Glu Ser Glu lie Ala Phe Glu Tyr Ala Gin Arg Gly Asp 1105 1110 1115 1120

Phe Asp Ser Asn Ala Arg Ala Phe Leu Asn Ser Asn Met Gin Ala Lys 1125 1130 1135

Tyr Val Lys Asp Cys Ala Thr Met Cys Arg His Tyr Lys His Ala Glu 1140 1145 1150

Met Arg Lys Met Ser 工le Lys Gin Trp lie Lys His Arg Gly Ser Lys 1155 1160 1165 工le Glu Gly Thr Gly Asn Trp Lys Pro lie Val Gin Phe Leu Arg His 1170 1175 1180

Gin Asn lie Glu Phe lie Pro Phe Leu Thr Lys Phe Lys Leu Trp Leu 1185 1190 1195 1200

His Gly Thr Pro Lys Lys Asn Cys lie Ala lie Val Gly Pro Pro Asp 1205 1210 1215

Thr Asp Lys Ser Tyr Phe Cys Met Ser Leu lie Ser Phe Leu Gly Gly 1220 1225 1230

Thr Val 工le Ser His Val Asn Ser Ser Ser His Phe Trp Leu Gin Pro 1235 1240 1245

Leu Val Asp Ala Lys Val Ala Leu Leu Asp Asp Ala Thr Gin Pro Cys 1250 1255 1260

Trp lie Tyr Met Asp Thr Tyr Met Arg Asn Leu Leu Asp Gly Asn Pro 1265 1270 1275 1280

Met Ser lie Asp Arg Lys His Lys Ala Leu Thr Leu lie Lys Cys Pro 1285 1290 1295

Pro Leu Leu Val Thr Ser Asn 工le Asp lie Thr Lys Glu Asp Lys Tyr 1300 1305 1310

Lys Tyr Leu His Thr Arg Val Thr Thr Phe Thr Phe Pro Asn Pro Phe 1315 1320 1325

Pro Phe Asp Arg Asn Gly Asn Ala Val iyr Glu Leu Ser Asn Thr Asn e 25 ·

88379 200411055 1330 1335 1340 Trp Lys Cys Phe Phe Glu Arg Leu Ser Ser Ser Leu Asp lie Gin Asp 1345 1350 1355 1360 Ser Glu Asp Glu Glu Asp Gly Ser Asn Ser Gin Ala Phe Arg Cys Val 1365 1370 1375 Pro Gly Thr Val Val Arg Thr Leu 1380 <210> 23 <211> 23 <212> 蛋白質 <213> HPV <400> 23 Cys Ser Ser Ser Leu Asp lie Gin Asp Ser Glu Asp Glu Glu Asp Gly 15 10 15 Ser Asn Ser Gin Ala Phe Arg 20 <210> 24 <211> 20 <212> DNA <213>人造的序列 <220> <223>免疫刺激性寡核甞酸 <400> 24 tccatgacgt tcctgacgtt <210> 25 <211> 18 <212> DNA <213>人造的序列 <220> <223>免疫刺激性寡核甞酸 20 <400> 25 tctcccagcg tgcgccat <210> 26 <211> 30 <212> DNA <213>人造的序列 <220> <223>免疫刺激性寡核甞酸 <400> 26 accgatgacg tcgccggtga cggcaccacg <210> 27 <211> 24 <212> DNA <213>人造的序列 <220> <223>免疫刺激性寡核甞酸 18 30 <400> 27 tcgtcgtttt gtcgttttgt cgtt <2l〇> 28 88379 -26- 24 200411055 <211> 20 <212> DNA <213>人造的序列 <220> <223>免疫刺激性寡核甞酸 <400> 28 tccatgacgt tcctgatgct -27 88379

Claims

200411055 拾、申請專利範園： L 一種編碼人類乳頭狀瘤病毒（Hpv)多肽的多核甞酸序列忒多肽具有得自至少兩個得自兩個不同Hpv品系之早期抗原或其片段的抗原決定位。 2·根據申請專利範圍第丨項之多核甞酸，其中至少一個抗原係衍生自HPV E1或其片段。 3·根據申請專利範圍第2項之多核甞酸，其中至少一個抗原係衍生自HPV E2。 4.根據申請專利範圍第1至3項中任一項之多核苷酸序列，其為DNA序列。 5·根據申請專利範圍第1至3項中任一項之多核：y：酸序列，其編碼與子宮頸癌、良性皮膚疣或生殖器疣有關之HP V 型或亞型的HPV多肽。 6·根據申請專利範圍第1至3項中任一項之多核苷酸序列，其編碼 1:4、6、7、10、11、16、18、26-29、31、33、35、 39、49、51、52、56、58、59和 68型之一的 HPV多肽。 7·根據申請專利範圍第6項之多核:y：酸序列，其編碼與子宮頸癌或生殖器虎有關之HP V型或亞型的HP V多肽。 8·根據申請專利範圍第4項之多核：y：酸序列，其編碼6、11、 16、18、33或45型之一的HPV多肽。 9·根據申請專利範圍第5項之多核苷酸序列，其編碼選自 HPV 11、6a或6b之HPV型或亞型的HPV多肽。 10·根據申請專利範圍第1至3項中任一項之多核：y：酸序列，其編碼具有降低生物功能的突變HPV多肽。 88379 200411055 11·根據申請專利範圍第1至3項中任一項之多核省:酸序列，其編碼包括一或多個點突變之突變的HP V多肽，藉此使該多肽一或多個天然的生物功能失活。 12·根據申請專利範圍第1至3項中任一項之多核嘗酸序列，其具有超過0.4但低於1之人類基因的密碼子使用率係數。根據申請專利範圍第12項之多核苷酸序列，其具有超過〇·5但低於1之人類基因的密碼子使用率係數。队一種表現載體，其包括以可操作之方式與控制序列連接

的根據申請專利範圍第j至3項中任一項之多核甞酸序列，孩控制序列能夠藉由宿主細胞提供該多核苷酸序列的表現。 15. 16. 17. 根據申請專利範圍第14項之表現載體，其為p73i3pLc。種醫藥組合物，其包括根據申請專利範圍第】至3項中任一項之多核甞酸序列。 /、 :種醫藥組合物’其包括根據中請專利侧第14項之載 18

=申請專利範圍第16嚷之醫藥組合物，其包括以眶塗覆之多個金顆粒。 19 20 .=申請專利範圍第17項之醫藥、组合物，其包括以眶、覆 < 多個金顆粒。 ·=申請專利第16項之醫藥組合物，進—步更包括 ::申請專利範圍第17項之醫藥組合物，進-步更包括 88379 -2- 200411055 22·根據申请專利範圍第2〇項之醫藥組合物，其中編碼該佐劑’使其與藉著該多核铝酸編碼之HPV多肽融合。 23.根據申請專利範圍第21項之醫藥組合物，其中編碼該佐劑’使其與藉著該多核苷酸編碼之HPV多肽融合。 24· —種根據申請專利範圍第1至3項中任一項之多核甞酸序列，在治療或預防HPV感染上的用途。 25· —種根據申請專利範圍第14項之載體的用途，其係用於治療或預防HP V感染。 26·種根據申請專利知圍第16項之組合物的用途，其係用 _ 於治療或預防HPV感染。 27· —種根據申請專利範圍第17項之組合物的用途，其係用於治療或預防HPV感染。 28· —種根據申請專利範圍第1至3項中任一項之多核甞酸序列的用途，其係用於治療或預防皮膚（皮膚）疣、生殖器疣、未乳定重要性之非典型鱗狀細胞（ASCUS)、子宮頸發育異常、子宮頸上皮内贊生物（CIN)或子宮頸癌。傷 29· —種根據申請專利範圍第14項之載體的用途，其係用於 — 治療或預防皮膚（皮膚）疣、生殖器疣、未判定重要性之非 > 典型鱗狀細胞（ASCUS)、子宮頸發育異常、子宮頸上皮内贅生物（CIN)或子宮頸癌。 30· —種根據申請專利範圍第16項之醫藥組合物的用途，其係用於治療或預防皮膚（皮膚）疣、生殖器疣、未判定重要性之非典型鱗狀細胞（ASCUS)、子宮頸發育異常、予宮頸上皮内贅生物（CIN)或子宫頸癌。 88379 200411055 31· —種根據申請專利範圍第17項之醫藥組合物的用途’其係用於治療或預防皮膚（皮膚）疣、生殖器疣、未判定重要性之非典型鱗狀細胞（ASCUS)、子宮頸發育異常、子宮頸上皮内贅生物（CIN)或子宮頸癌。 32·根據申請專利範圍第16項之醫藥組合物，其係用來治療或預防HPV感染或任何與其有關的症狀或疾病。 33·根據申請專利範圍第17項之醫藥組合物，其係用來治療或預防HPV感染或任何與其有關的症狀或疾病。 34· —種用於治療或預防HPV感染或任何與其有關的症狀或疾病之醫藥組合，包括根據申請專利範圍第16項之醫藥組a物以及重組的病毒載體或以非-病毒為基礎的系統，包括根據申請專利範圍第1至3項中任一項之多核苷酸0 35. 一種用於治療或預防HPV感染或任何與其有關的症狀或疾病义醫藥組合，包括根據申請專利範圍第”項之醫藥組合物’以及重組的病毒載體，或轉·病毒為基礎的系統，包括根據申請專利範圍第1至3項中任一項之多核替酸0 88379 4-