【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ハムスター口腔パ
ピローマウイルス蛋白の遺伝子に関する。本発明の遺伝
子は、癌に関連するパピローマウイルス感染症の診断に
有用であるのみならず、抗癌剤のスクリーニング、アン
チセンス治療、ワクチン治療、病態モデル動物の作出等
にも利用されうる。
【0002】
【従来の技術】ヒトの体表ならびに機械的刺激が加わり
やすい粘膜は、細胞が積み重なったように配列する重層
扁平上皮により被覆されている。パピローマウイルスは
この扁平上皮の増殖性病変を引き起こし、ヒトにおいて
は子宮頚部等の扁平上皮癌の原因の一つとして注目され
ている。これらの増殖性病変の1つである皮膚の疣贅
(いわゆるいぼ)は古くより存在がしられていたが、今
世紀初頭に濾過性病原体(ウイルス)が原因であること
が明らかとなった。1940年代中頃より、培養細胞を用い
たウイルス分離が行われるようになったが、この疣贅の
原因となるウイルスの分離法は確立しなかった。1970年
代の分子生物学の発展により、プラスミドベクター等を
用いた分子クローニングが可能となり、パピローマウイ
ルスのウイルスゲノムも分子クローニングされるように
なった。その結果、驚くべきことに、当初1種と考えら
れていたヒトパピローマウイルスに非常に多種類の型
(遺伝型)が存在することが明らかにされ、さらに、ヒ
トと動物のパピローマウイルスが異なり、ヒトのパピロ
ーマウイルスはヒトにのみ感染し、動物のパピローマウ
イルスもそれぞれの動物に特異に存在することが明らか
にされた。
【0003】ヒトパピローマウイルスは現在70種を越す
型(遺伝型)の存在が知られているが、これらは感染部
位により大きく2種類に大別され、主として皮膚に感染
する皮膚型と、主として粘膜に感染する粘膜型がある。
さらに、皮膚型は皮膚疣贅の原因となる型群と、特異の
宿主にのみ皮膚病変を形成する疣贅状表皮発育異常症に
関連する型群に分けられる。この内、扁平上皮癌との関
連が推測されているのは、疣贅状表皮発育異常症に関連
する型群と、粘膜型の一部で、これらの型は、癌性病変
ならびに良性(あるいは前癌)病変の両者に検出されて
いる。
【0004】一方、動物のパピローマウイルスとして、
ラット皮膚のMastomys natalensispapillomavirus (MnP
V)、マウス皮膚の Micromys minutus papillomavirus
(MmPV)、ウサギ皮膚の Sylvilagus floidensis papillo
mavirus (CRPV)、ウサギ口腔粘膜のOryctolagus cunicu
lus papillomavirus (ROPV)、ウシ皮膚、消化管のBosta
urus papillomavirus (BPV1-4)、ウマ皮膚の Equus cab
allus papillomavirus (EqPV)、イヌ口腔の Canis fami
liaris papillomavirus (CRPV)、サル陰茎のMacaca mul
ata papillomavirus (RhPV1)と Colobus guereza papi
llomavirus 1(CgPV1)、サル皮膚の Colobus guereza pa
pillomavirus 2 (CgPV2)、シカ皮膚のOdocoileusvirgin
ianus papillomavirus (DPV)、オオシカ皮膚の Alces a
lces papillomavirus (EEPV)、トナカイ皮膚の Rangife
r tarandus papillomavirus(RPV)等が現在まで知られて
いる。これらのうち、発癌との関連が明らかにされてい
るのが、MnPV, MmPV, CRPV, COPV, RpPV1であり、ま
た、実験的に腫瘍を誘発できるのは、MnPV,CRPV, ROPV,
BPV1, BPV4, COPVである。なお、ゴールデンハムスタ
ー固有のパピローマウイルスは知られていなかったが、
実験的にBPV, DPV等がハムスターに感染し、病変を形成
することが可能である。なお、この病変は線維乳頭腫に
限られる。
【0005】化学発癌は、古くより、発癌物質を用いて
実験的に癌を誘発する方法とであり、dimethyl benzant
hrane (以下、DMBAという)が非常に強力な発癌物質とし
て知られている。このDMBAを用いて種々の動物で種々の
癌を誘発する発癌実験系は広く行われており、ゴールデ
ンハムスターにおいては、6〜8週という短期間にハム
スターの口腔粘膜に異形成・扁平上皮癌を誘発する実験
系が確立されている[前田初彦,愛知学院大学歯学会誌
22, 57-110 (1984)、Maeda H. & Kameyama Y., Journa
l of Oral Pathology 15, 21-27 (1986)]。この実験系
で誘発された異形成(前癌病変)にパピローマウイルス
共通抗原であるgenus specific antigenof papillomavi
rusが検出され[Maeda H., Kameyama Y., Nakane S., T
akehanaS., Sato E., Oral Surgery, Oral Medicine, O
ral Pathology 68, 50-56 (1989)]、さらに、電子顕微
鏡を用いて病変内にパピローマウイルス様の直径55 nm
の粒子が検出されたことにより[鈴木純二, 愛知学院大
学歯学会誌 24, 122-164(1986)]、かかる異形成(前癌
病変)がパピローマウイルス感染によるものである可能
性が示唆される。しかしながら、このウイルスゲノムを
クローニングするには至っていない。
【0006】
【発明が解決しようとする課題】本発明の目的は、ゴー
ルデンハムスターの口腔粘膜に誘発した異形成(前癌病
変)に存在するウイルスゲノムをクローニングし、その
構造を明らかにすることである。
【0007】
【課題を解決するための手段】本発明者らは、上記課題
を解決すべく鋭意研究を重ねた結果、ヒトパピローマウ
イルスのゲノムをプローブとし、ゴールデンハムスター
の口腔粘膜に誘発した前癌病変よりパピローマウイルス
蛋白遺伝子をクローニングし、その構造決定を行い、本
発明を完成するに到った。
【0008】すなわち、本発明は、実質的に配列番号1
のアミノ酸配列で表されるハムスター口腔パピローマウ
イルス蛋白(E1)をコードするDNA、実質的に配列
番号2のアミノ酸配列で表されるハムスター口腔パピロ
ーマウイルス蛋白(E2)をコードするDNA、実質的
に配列番号3のアミノ酸配列で表されるハムスター口腔
パピローマウイルス蛋白(E6)をコードするDNA、
実質的に配列番号4のアミノ酸配列で表されるハムスタ
ー口腔パピローマウイルス蛋白(E7)をコードするD
NA、および実質的に配列番号5のアミノ酸配列で表さ
れるハムスター口腔パピローマウイルス蛋白(L1)を
コードするDNAである。本発明はまた、配列番号6〜
10の塩基配列をそれぞれ有する上記のハムスター口腔
パピローマウイルス蛋白(E1〜L1)をコードするD
NAである。
【0009】さらに、本発明は、実質的に配列番号1の
アミノ酸配列で表されるハムスター口腔パピローマウイ
ルス蛋白(E1)、実質的に配列番号2のアミノ酸配列
で表されるハムスター口腔パピローマウイルス蛋白(E
2)、実質的に配列番号3のアミノ酸配列で表されるハ
ムスター口腔パピローマウイルス蛋白(E6)、実質的
に配列番号4のアミノ酸配列で表されるハムスター口腔
パピローマウイルス蛋白(E7)および実質的に配列番
号5のアミノ酸配列で表されるハムスター口腔パピロー
マウイルス蛋白(L1)である。
【0010】本発明において、「実質的に」とは、該パ
ピローマウイルス蛋白の有する活性を保持する限り、ア
ミノ酸配列の1もしくは2あるいは3の複数のアミノ酸が
置換、欠失または付加させたものをも含むことを意味す
る。
【0011】
【発明の実施の形態】本発明のハムスター口腔パピロー
マウイルス蛋白をコードするDNAは、以下の工程を経
て取得、確認することができる。
【0012】(1) プローブの合成 既にクローニングされているヒトパピローマウイルスの
ウイルスゲノムDNAがプローブとして利用される。ヒ
トパピローマウイルスのウイルスゲノムは2重鎖環状D
NAで、通常1箇所で切断される制限酵素箇所でプラス
ミドベクターのクローニング箇所にクローニングされ
る。クローニングされたパピローマウイルスゲノムは、
組換え体プラスミドを大腸菌内で増殖させることによ
り、大量に得ることができる。得られた組換え体プラス
ミドをクローニング箇所の制限酵素で切断し、アガロー
スゲル電気泳動により、パピローマウイルスゲノムDN
A断片のみを分取し、例えばシリカ膜を用いたDNA抽
出キット(Qiagen)等により、ゲル内のDNAを分離・精
製する。精製したDNA断片にKlenow断片を用いたラン
ダムプライマー法 (FeinbergAP & Vogelstein B. Analy
tical Biochemistry 132: 6-13, 1983)により、32P,35S
で標識したデオキシリボヌクレオチドを取り込ませ、比
放射能の高いプローブを作製する。
【0013】(2) DMBA によりゴールデンハムスター口
腔粘膜に誘発した前癌病変組織DNAの抽出、および制
限酵素による該DNAの分解 前田らの方法(1984、1986、1989)により誘発した前癌病変
を有したハムスター口腔粘膜病変3組織を、ドデシル硫
酸ナトリウム溶液中にて、100μg/mlプロテイネースK
(ベーリンガーマンハイム社)で溶解し、溶解液からフェ
ノールおよびクロロフォルムで核酸を抽出し、エタノー
ル沈澱、リボヌクレアーゼ処理を経て、前癌病変組織D
NAを得る。抽出DNAを15種の種々の制限酵素で切断
し、切断産物をアガロースゲル電気泳動することによ
り、DNA断片の分画を行う。分画されたDNAをニト
ロセルロース膜上にSouthernの方法[Southern DM: Jou
rnal of Molecular Biology, 98: 583-617 (1975)]に
より転写し、紫外線照射により固定する。この膜上に
て、(1)に記した既知のヒトパピローマウイルスのDN
Aにアイソトープ標識したプローブとハイブリダイゼー
ションを行なう。オートラジオグラフィーで、この前癌
組織DNAの制限酵素切断様式を、公知のパピローマウ
イルス遺伝子の様式と比較し、目的の遺伝子を含むDN
A断片を同定し、さらに、ウイルス遺伝子を1箇所で切
断する制限酵素についての情報が得られる。
【0014】(3) 新しいパピローマウイルスのウイル
スゲノムDNA断片のプラスミドベクターへの組込みお
よび該組換えベクターによる宿主細胞の形質転換 アガロース電気泳動により分画した前癌病変組織DNA
の制限酵素切断産物のうち、ウイルスゲノムを1箇所で
切断する酵素切断産物から、目的のウイルスゲノムのD
NA断片を含む分画を抽出し、同一の制限酵素で1箇所
切断したプラスミドベクターとT4DNAライゲースによ
り結合する。
【0015】DNAを組込むためのプラスミドベクター
としては、宿主細胞内で自立複製可能で該DNAを安定
保持できるものであれば、いずれをも用いることができ
る。具体的な例として、pBR322, pUC119, pBluescriptI
IKS(+), pGEM4などをあげることができる。この組換え
ベクターを大腸菌、昆虫細胞、動物細胞等の適当な宿主
細胞に導入し、宿主細胞を形質転換する。形質転換は、
エレクトロポレーション法、カルシウム沈澱法等により
行うことができる。
【0016】(4) 目的のウイルスゲノムDNAを保持
する形質転換体の選別・取得 (3)で得られた形質転換体を、培養、増殖せしめ、公知
の方法[Sambrook J.,Fritsch EF., Maniatis T., Mole
cular Cloning, p.1.25, Cold Spring HarborLaborator
y (1989)]によりプラスミドDNAを取得する。このプ
ラスミドDNAを種々の制限酵素で消化し、アガロース
ゲル電気泳動を行い、エチジウムブロマイド染色後の紫
外線下の観察により、ウイルスゲノムDNAを保持した
形質転換体を同定する。
【0017】(5) プラスミドDNAの取得 (4)で目的遺伝子を保持することが認められた形質転換
体を大量培養し、公知の方法[Sambrook J., Fritsch E
F., Maniatis T., Molecular Cloning, p.1.33, Cold S
pring Harbor Laboratory (1989)]によりプラスミドD
NAを取得する。
【0018】(6) 取得プラスミドDNAの制限酵素切
断地図の作成 (5)で取得したプラスミドDNAを種々の制限酵素で切
断して、各断片の大きさとその相互の関係を電気泳動で
しらべることにより、該プラスミドDNAの制限酵素切
断地図を作成する。
【0019】(7) 目的遺伝子のDNA塩基配列の決定 (6)で作成した制限酵素切断地図に基づいて、目的遺伝
子を有したDNAを制限酵素によりさらに断片化し、そ
れぞれの断片をダイデオキシ法、マキサム・ギルバート
法などにより塩基配列を解析する。最終的に各断片の塩
基配列をつなぎあわせて、目的遺伝子の全塩基配列を決
定し、該塩基配列に基づいて目的遺伝子産物であるウイ
ルス蛋白のアミノ酸配列を推定する。
【0020】(8) これまで一般に既知のパピローマウイ
ルスゲノムとの相同性が50%未満の場合、新しい型(遺
伝型)とされてきたが、近年、ウイルス粒子の主要蛋白
をコードするL1(L:後期遺伝子群)ORFの塩基配列の相同
性が90%未満であるとき、新しい型(遺伝型)と判断さ
れる。
【0021】上記のようにして得られたハムスター口腔
パピローマウイルス蛋白をコードする遺伝子は、形質転
換宿主内で複製可能なベクターに組み込んで、組換えD
NAを作製する。得られた組換えDNAを、細菌、酵母
等の微生物、または動物細胞等の宿主細胞に導入するこ
とによって、宿主細胞中で高発現させることができる。
【0022】
【実施例】以下、実施例により、本発明を更に具体的に
説明するが、本発明の範囲は以下の実施例に限定される
ものではない。
【0023】〔実施例1〕 DMBA投与と機械的刺激によ
り誘発されたハムスター口腔粘膜前癌病変からのハムス
ター口腔パピローマウイルスの発見 (1) ハムスター口腔粘膜前癌病変の誘発 前田らの方法(1984, 1986, 1989)により、ゴールデンハ
ムスター(雄)の舌先端部の粘膜に前癌病変を誘発し
た。誘発実験は体重30-35 gの3週齢のゴールデンハムス
ター3匹において行った。舌の先端部の粘膜の週に3回、
4週間(計12回)、0.5% 9,10-dimethyl-1,2-benzanthrace
ne (DMBA) アセトン溶液をブラシで塗布したのちに、麻
酔下で舌の先端よりの2 mmを切除した。切除後再び、0.
5% DMBA アセトン溶液を残存する舌に、毎日DMBAアセト
ン溶液を塗布し、切除後8日に麻酔下でゴールデンハム
スターを屠殺し、残存舌を組織学的ならびに分子生物学
的に解析した。
【0024】(2) 舌の組織学的解析 残存する舌の粘膜には、前田らの報告(1984,1985,1989)
と同様の異形成の像(層状分化の乱れ、コイロサイトー
シス、核異型)を呈した扁平上皮が認められ、た。
【0025】(3) 前癌病変からのDNAの抽出・精製 前癌病変を誘発した3匹の舌病変組織を100 μg/mlプロ
テイネースK (ベーリンガーマンハイム社)と2%ドデシル
硫酸ナトリウムを含む50 mMトリス緩衝液(pH8.0)中で50
℃6時間分解し、飽和フェノールならびにクロロフォル
ム・イソアミルアルコール混合溶媒(24:1)で核酸を抽出
した。2倍量のエタノールを加え、核酸を沈澱させ、そ
れぞれ約50μgの前癌病変組織DNAを得た。
【0026】(4) 前癌病変内のハムスター口腔パピロ
ーマウイルスDNAの存在の確認 (3)で得られた前癌病変組織DNA 2μgを種々の制限酵
素 AccI, AvaI, BamHI, BglII, EcoRI, EcoRV, HincII,
HindIII, KpnI, PstI, SacI, SalI, SmaI, SphI, XbaI
(ベーリンガーマンハイム社)のそれぞれ10 Uを用いて、
制限酵素製造メーカーの指示の状態で、6時間消化し
た。それぞれの消化物と制限酵素未処理の抽出DNAを
1%アガロース中で定電圧(30V)の条件にて24時間電気泳
動した。泳動後、ゲルを塩酸処理10分、アルカリ変性30
分、0.5Mトリス緩衝液30分浸透による中和を行い、転写
に陰圧を利用する転写装置VacuGene XL Vacuum Blottin
g System (Pharmacia)を用いて、ニトロセルロース膜(S
&S社製)上にゲル内の分離されたDNA断片を転写し、
紫外線を用いてDNA断片を膜上に固定するUV crossli
nker (Stratagene)を用いて、DNA断片を膜上に固定
した。
【0027】次に、既知のヒトパピローマウイルス1と5
のそれぞれのDNA断片を鋳型とし、ランダムプライム
法(Feinberg AP & Vogelstein BJ, Analytical Biochem
istry 132: 6-13,1984)により、ヘキサヌクレオチドを
プライマーとして、Klenow断片でαー32PーdCTPを標識
し、それぞれ、106 cpm/mlの活性を有したプローブと、
DNA断片が固定化された膜と、緩やかな条件にてハイ
ブリダイゼーションを行った。
【0028】ハイブリダイゼーションは前記のハムスタ
ーDNA断片群が固定されたニトロセルロース膜を、ヒ
トパピローマウイルス1と5の混合プローブを含む5倍濃
度のデンハルト液(0.1%牛血清アルブミン、0.1%フィコ
ールならびに0.1%ポリビニールピロリドン)、20%脱イオ
ン化ホルムアミド、0.75M塩化ナトリウム、0.075Mクエ
ン酸ナトリウム溶液中で、42℃,16時間行った。
【0029】ハイブリダイゼーション後、上記の液をで
きるだけ取り去った後に、0.1%ドデシル硫酸ナトリウ
ム、0.30M塩化ナトリウム、O.030Mクエン酸ナトリウム
溶液中で5分間室温で洗浄し、続いて0.1%ドデシル硫酸
ナトリウム、0.30M塩化ナトリウム、O.030Mクエン酸ナ
トリウム溶液中で15分間50℃3回洗浄し、ニトロセルロ
ース膜を風乾後、X線フィルムに感光させ、48時間後に
現像した。その結果、ヒトパピローマウイルス1と5のプ
ローブとハイブリダイゼーションするバンドの未処理と
制限酵素処理のサンプルを比較することにより、この病
変内に存在するパピローマウイルスのゲノムは環状2重
鎖DNAで、BglII, KpnI, SmaI, SphI の制限酵素で1
箇所切断され、その大きさは約7.6千塩基であることが
判明した。切断様式の地図を作製し、この切断様式は既
知のパピローマウイルスの切断様式と異なることが判明
した。
【0030】(5) ハムスター口腔パピローマウイルス
ゲノムの分子クローニング 前項でウイルスゲノムが BglII, KpnI, SmaI, SphIの制
限酵素で1箇所切断されることが判明し、このKpnIの切
断箇所でウイルスゲノムのクローニングを行うこととし
た。ハムスター舌粘膜の前癌病変から抽出したDNA 2
0 μgをKpnIで37℃16時間消化し、1%アガロースゲル電
気泳動を行った。エチヂウムブロマイド染色を行い、36
0 nmの長波長の紫外線下で、観察を行い、同時に流した
1 kb DNAマーカー(BRL社製)と比較し、7千塩基と8
千塩基の間のDNAを切りとり、ガラスミルク(BIO 101
社製)を用いて、DNAを分離精製した。一方、分子ク
ローニングを行うためのプラスミドベクターpBluescrip
tIIKS(+)(Stratagene社製)は制限酵素KpnIで消化し、さ
らにウシ小腸アルカリフォスファターゼで処理を行い、
フェノールによるアルカリフォスファターゼ失活後に、
エタノール沈澱を行い、10 ng/μlの濃度になるように
蒸留水に溶解した。このpBluescriptIIKS(+)と精製した
7-8千塩基の分画DNAを混合し、T4 DNAライゲー
ス(NEB社製)を用いて、16℃16時間のライゲーション反
応を行った。
【0031】ライゲーション産物をカルシウム沈澱法に
より、大腸菌JM109ならびにDH5に形質転換を行ない、形
質転換体を得た。96個の形質転換体について、プラスミ
ドDNAの少量調整[Sambrook J., Fritsch EF., Mani
atis T., Molecular Cloning, p.1.25, Cold Spring Ha
rbor Laboratory (1989)]を行った。得られたプラスミ
ドDNAを、それぞれ、KpnIならびにKpnIとPstIの制限
酵素で消化し、アガロースゲル電気泳動を行い、(4)で
得られた切断様式と合致するクローンを1個得ることが
できた。得られたクローンを更に種々の制限酵素で切断
し、それぞれの切断様式も合致することを確認した。
【0032】(6) ハムスター口腔パピローマウイルス
ゲノムの全塩基配列の決定 (5)で得られたクローンが新しいパピローマウイルスで
あり、ハムスター口腔粘膜病変から得られたことより、
ハムスター口腔パピローマウイルス hamster(Mesocrice
tus aurantus) oral papillomavirusと命名し、ウイル
スゲノムの全塩基配列を解析した。最初に、制限酵素切
断地図を参考に、種々の制限酵素で500塩基から1500塩
基前後にウイルスゲノムを断片化し、pUC19 あるいはpB
luescriptIIKS(+)のそれぞれの制限酵素挿入部位にサブ
クローニングした。プラスミドベクター中の塩基配列を
有したオリゴヌクレオチドプライマーを用いて、挿入し
た塩基配列をダイデオキシ法により解析し、さらにこれ
により判明した塩基配列のオリゴヌクレオチドプライマ
ーで解析した。最終的にはDNA2重鎖の両鎖をそれぞ
れ重複するように全塩基配列を検討し、その配列を決定
した(配列番号11)。
【0033】(7) ハムスター口腔パピローマウイルス
ゲノムの特徴 決定したウイルスゲノムの全塩基配列中の開始ならびに
ストップコドンの分布を2重鎖それぞれのストランドに
ついて解析した。その結果、読みとり枠open reading f
rameは一方のストランドにのみ存在し、その5'端から3'
端への順序に少なくとも7個の読みとり枠を認めた。そ
れぞれの読みとり枠の5'端の開始コドンから停止コドン
をアミノ酸に翻訳し、その産物の分子量の比較、さらに
はそのアミノ酸配列の特徴から、他のパピローマウイル
スゲノムと同様の読みとり枠の配列を示し、それぞれE
6、E7、E1、E2、E4、L2、L1とし、E6読みとり枠の5'端
よりの最初の開始コドンのAを101番目のヌクレオチドと
して、全塩基配列を記述した(E1: 配列番号6、E2: 配
列番号7、E6: 配列番号8、E7: 配列番号9、L1: 配列
番号10)。
【0034】(8) ハムスター口腔パピローマウイルス
ゲノムのL1読みとり枠の特徴 L1読みとり枠はヌクレオチド番号5603から7151までで、
最初の開始コドンは5643で、この塩基配列から翻訳され
る蛋白の分子量の予測値は57.2 kDaで、次の開始コドン
5649からの予測値は56.9 kDaであった。この蛋白のアミ
ノ酸配列(配列番号5)と既知の蛋白のアミノ酸配列の
相同性を解析したところ、ヒトパピローマウイルス12の
L1蛋白のアミノ酸配列と62.7%、ヒトパピローマウイル
ス8 L1蛋白と62.6%、ヒトパピローマウイルス5 L1蛋白
と62.4%、ヒトパピローマウイルス4 L1蛋白と62.3%、ヒ
トパピローマウイルス19のL1蛋白と62.3%、ヒトパピロ
ーマウイルス14のL1蛋白と61.4%、ヒトパピローマウイ
ルス25のL1蛋白と61.1%、ヒトパピローマウイルス47のL
1蛋白と60.5% であり、ヒトの皮膚に感染するパピロー
マウイルスのL1蛋白と比較的高い相同性がみられた。
【0035】(9) ハムスター口腔パピローマウイルス
ゲノムのE1読みとり枠の特徴 E1読みとり枠はヌクレオチド番号920から2794までで、
最初の開始コドンは968で、この塩基配列から翻訳され
る蛋白の分子量の予測値は68.6 kDaであった。この蛋白
のアミノ酸配列(配列番号1)と既知の蛋白のアミノ酸
配列の相同性を解析したところ、ヒトパピローマウイル
ス23のE1蛋白と48.6%、ヒトパピローマウイルス15のE1
蛋白と47.7%、ヒトパピローマウイルス16のE1蛋白と47.
3%、ヒトパピローマウイルス36のE1蛋白と47.2%、ヒト
パピローマウイルス63のE1蛋白と47.1%、ヒトパピロー
マウイルス1のE1蛋白と46.8%、ヒトパピローマウイルス
20のE1蛋白と46.8%、ヒトパピローマウイルス5BのE1蛋
白と46.7%、ヒトパピローマウイルス48のE1蛋白と46.7
%、ヒトパピローマウイルス9のE1蛋白と46.3%、ヒトパ
ピローマウイルス22のE1蛋白と46.2%、ヒトパピローマ
ウイルス24のE1蛋白と45.5%、イヌ口腔パピローマウイ
ルスのE1蛋白と45.4%であり、疣贅状表皮発育異常症関
連のヒトパピローマウイルスのE1蛋白との相同性がみら
れた。
【0036】(10) ハムスター口腔パピローマウイルス
ゲノムのE2読みとり枠の特徴 E2読みとり枠はヌクレオチド番号2717から3947までで、
最初の開始コドンは2736で、この塩基配列から翻訳され
る蛋白の分子量の予測値は45.5 kDaで、次の開始コドン
からの予測値は39.7 kDaであった。この蛋白のアミノ酸
配列(配列番号2)と既知の蛋白のアミノ酸配列の相同
性を解析したところ、ヒトパピローマウイルス50のE2蛋
白と38.8%、ヒトパピローマウイルス22のE2蛋白と38.2
%、ヒトパピローマウイルス23のE2蛋白と37.3%、ヒトパ
ピローマウイルス9のE2蛋白と37.1%、ヒトパピローマウ
イルス48のE2蛋白と36.9%、ヒトパピローマウイルス37
のE2蛋白と36.4%、ヒトパピローマウイルス24のE2蛋白
と36.2%、ヒトパピローマウイルス38のE2蛋白と35.2%、
ヒトパピローマウイルス38のE2蛋白と35.2%、ヒトパピ
ローマウイルス8のE2蛋白と35.0%であり、疣贅状表皮発
育異常症関連のヒトパピローマウイルスのE2蛋白との相
同性がみられた。
【0037】(11) ハムスター口腔パピローマウイルス
ゲノムのE6読みとり枠の特徴 E6読みとり枠はヌクレオチド番号71から514までで、最
初の開始コドンは101で、この塩基配列から翻訳される
蛋白の分子量の予測値は15.5 kDaで、次の開始コドンは
200からの予測値は11.8 kDaであった。この蛋白のアミ
ノ酸配列(配列番号3)と既知の蛋白のアミノ酸配列の
相同性を解析したところ、マウスのパピローマウイルス
Micromys minutus papillomavirusのE6蛋白とラットの
パピローマウイルス Mastomys natalensis papillomavi
rusのE6蛋白と39.1%、ヒトパピローマウイルス39のE6蛋
白と32.8%、ヒトパピローマウイルス49のE6蛋白と31.9%
ヒトパピローマウイルス65のE6蛋白と31.1%であり、他
のパピローマウイルスのE6蛋白との相同性は低く、rode
ntに感染するパピローマウイルスのE6蛋白と軽度の相同
性がみられた。
【0038】(12) ハムスター口腔パピローマウイルス
ゲノムのE7読みとり枠の特徴 E7読みとり枠はヌクレオチド番号427から978で、最初の
開始コドンは514で、この塩基配列から翻訳される蛋白
の分子量の予測値は16.6 kDaで、次の開始コドン568か
らの予測値は14.6 kDaであった。この蛋白のアミノ酸配
列(配列番号4)と既知の蛋白のアミノ酸配列の相同性
を解析したところ、ヒトパピローマウイルス10のE7蛋白
と81.6%、ヒトパピローマウイルス57のE7蛋白と56.5%、
ヒトパピローマウイルス2のE7蛋白と51.6%、ヒトパピロ
ーマウイルス16のE7蛋白と43.6%であり、L1蛋白同様に
ヒトパピローマウイルスのE7蛋白との相同性がみられ
た。
【0039】
【配列表】
配列番号:1 配列の長さ:608 配列の型:アミノ酸 トポロジー:直鎖状 配列の種類:タンパク質 配列 Met Ala Asp Lys Gly Thr Asp Gly Asp Glu Gly Cys Ser Gly Trp Tyr 5 10 15 Ile Val Asn Glu Ala Glu Cys Val Asp Asp Ser Leu Asp Asp Leu Glu 20 25 30 Ala Leu Phe Asp Glu Ser Thr Gln Glu Thr Asn Ser Phe Ile Asp Tyr 35 40 45 Asp Glu Val Asp Gln Gly Asn Ser Leu Ser Leu Phe His Glu Gln Leu 50 55 60 Phe Leu Ser Ser Glu Glu Gln Ile Ala Cys Leu Lys Arg Lys Tyr Ala 65 70 75 80 Ala Thr Pro Ser Lys Asp Arg Gln Ser Leu Glu Ile Ala Ser Leu Ser 85 90 95 Pro Arg Leu Glu Ser Val Ser Ile Ser Pro Gln Ser Lys Ser Ser Arg 100 105 110 Arg Lys Leu Phe Gln Asp Ser Gly Ile Gly Asn Glu Thr Gln Asp Thr 115 120 125 Ala Pro Arg Asp Arg Thr Gln Glu Val Ser Thr Gly Pro Ile Pro Asp 130 135 140 Pro Cys Leu Arg Pro Gly Thr Glu Thr Ala Asp Leu Leu Lys Ser Ser 145 150 155 160 Asn Ile Tyr Ala Thr Cys Leu Ser Lys Phe Lys Thr Ala Tyr Gly Cys 165 170 175 Ser Phe Ala Glu Leu Thr Arg Gln Phe Lys Ser Asp Lys Thr Cys Ser 180 185 190 Pro His Trp Val Val Thr Val Phe Gly Ala Pro Glu Gln Leu Val Glu 195 200 205 Ala Ser Lys Val Leu Leu Pro Gln His Cys Glu Tyr Ala Gln Leu Ser 210 215 220 Ile Gly Tyr Ala Gly Asn Ser Lys Val Leu Leu Phe Leu Phe Glu Phe 225 230 235 240 Lys Ala Ser Lys Asn Arg Glu Thr Val Arg Lys Leu Leu Ala Ala Met 245 250 255 Leu Gly Val Gln Glu Cys Leu Ile Ile Ala Glu Pro Pro Lys Glu Arg 260 265 270 Ser Val Leu Ser Ala Leu Phe Phe Tyr Lys Lys Val Met Phe Gln Gly 275 280 285 Ser Asp Thr Phe Gln Cys Gly Gln Leu Pro Glu Trp Val Ala Lys Gln 290 295 300 Thr Leu Val Glu His Gln Ala Ala Thr Ala Glu Ser Phe Asp Leu Ser 305 310 315 320 Arg Met Ile Gln Trp Ala Tyr Asp Asn Asp Tyr Ala Glu Glu Ser Ala 325 330 335 Ile Ala Tyr Asn Tyr Ala Leu Tyr Ala Glu Ala Asp Ala Asn Ala Glu 340 345 350 Ala Phe Leu Lys Ser Asn Cys Gln Ala Lys Tyr Val Lys Asp Cys Ala 355 360 365 Thr Met Val Arg Leu Tyr Lys Arg Gln Glu Met Arg Asp Met Ser Met 370 375 380 Ser Gln Trp Val Lys Lys Cys Cys Asp Ala Thr Glu Glu Asp Glu Gly 385 390 395 400 Asp Trp Lys Val Ile Ala Ala Phe Leu Arg Tyr Gln Glu Val Asn Val 405 410 415 Val Leu Phe Leu Ala Ala Leu Arg His Leu Phe Leu Gly Thr Pro Lys 420 425 430 Lys His Cys Leu Val Ile Tyr Gly Pro Pro Asp Thr Gly Lys Ser Tyr 435 440 445 Phe Cys Thr Thr Leu Val Gly Phe Leu Lys Gly Lys Met Ile Ser Phe 450 455 460 Met Asn Ser Lys Ser Gln Phe Trp Leu Gln Pro Leu Val Asp Ser Lys 465 470 475 480 Ile Gly Phe Leu Asp Asp Ala Thr Thr Ala Cys Trp Gln Tyr Met Asp 485 490 495 Val Phe Met Arg Asn Ala Leu Asp Gly Asn Pro Ile Ser Leu Asp Met 500 505 510 Lys His Arg Ala Pro Thr Gln Ile Lys Leu Pro Pro Leu Leu Ile Thr 515 520 525 Thr Asn Val Asn Val Gln Ala Asn Asp Ser Tyr Lys Phe Leu His Ser 530 535 540 Arg Leu Gln Phe Phe Ala Phe Asn Lys Pro Met Leu Phe Asp Asp Ser 545 550 555 560 Gly Asn Pro Gln Tyr Pro Leu Ser Lys Ala Asn Trp Arg Ser Phe Phe 565 570 575 Thr Arg Leu Gly Lys Gln Leu Gly Ile Gln Asp Asp Glu Asp Ala Asp 580 585 590 Pro Asp Arg Ala Phe Arg Cys Ser Ala Arg Pro Asp Ser Gln Ser His *** 595 600 605
【0040】配列番号:2 配列の長さ:403 配列の型:アミノ酸 トポロジー:直鎖状 配列の種類:タンパク質 配列 Met Pro Thr Leu Thr Glu Arg Phe Asp Ala Val Gln Asp Gln Ile Leu 5 10 15 Asn Leu Ile Glu Lys Gly Ser Thr Ala Leu Ala Asp His Val Leu Tyr 20 25 30 Trp Asp Leu Val Arg Lys Glu Gly Val Leu Gln Tyr Tyr Ala Arg Lys 35 40 45 His Asn Met Asn Arg Leu Gly Leu His Ala Leu Pro Cys Gln Leu Gly 50 55 60 Ala Glu Thr Lys Ala Lys Lys Ala Ile Gln Met Gly Met Leu Leu Arg 65 70 75 80 Ser Leu Leu Asp Ser Lys Tyr Gly Ser Glu Pro Trp Thr Val Ser Glu 85 90 95 Thr Ser Leu Glu Leu Tyr Glu Gln Thr Asp Pro Glu Lys Thr Phe Lys 100 105 110 Lys Gly Gly Gln Thr Ile Glu Val His Tyr Asp Asn Asp Pro Glu Asn 115 120 125 Ser Val Ala Tyr Thr Leu Trp Lys Tyr Leu Tyr Lys Gln Asp Glu Ala 130 135 140 Gly Gln Trp His Lys Leu Glu Gly Gly Val Asp Tyr Ala Gly Leu Tyr 145 150 155 160 Tyr Val Glu Val Asn Gly Met His Val Tyr Tyr Glu Glu Phe Cys Glu 165 170 175 Asp Ser Asp Arg Tyr Gly Gln Ser Ser Thr Trp Thr Val Lys Tyr Asn 180 185 190 Asn Thr Asp Ile Cys Ala Pro Val Thr Ser Ser Thr Arg Glu Glu Gly 195 200 205 Thr Gln Gln Gln Ala Arg Lys Arg Gln Arg Thr Asp Ala Ser Glu Asp 210 215 220 Ser Leu Ser Thr Trp Thr Ala Ser Ser Pro Glu Glu Asp Ser Thr Ser 225 230 235 240 Asp Ile Thr Thr Pro Pro Ser Ser Pro Arg Arg Gly Tyr Gly Pro Ser 245 250 255 His Ser Ser Pro Thr Arg Phe Arg Arg Gly Gly Arg Arg Gly Glu Gln 260 265 270 Gly Glu Pro Thr Pro Ser Pro Thr Phe Asp Ala Ile Ser Pro Ile Pro 275 280 285 Ala Arg His Pro Ala Glu Gly Pro Arg Gly Val Ser Glu Glu Leu Pro 290 295 300 Arg Ala Gly Phe Gly Gly Tyr Pro Glu Val Leu Gly Arg Ser Gly Asp 305 310 315 320 Pro Pro Ile Leu Leu Leu Thr Gly Pro Ala Asn Cys Leu Lys Cys Trp 325 330 335 Arg Asn Arg Val Lys Arg Arg Pro His Arg Leu Tyr Lys Arg Met Ser 340 345 350 Thr Cys Phe Ser Trp Val Ser Glu Thr Gly Ala Gly Thr Glu Asp Gln 355 360 365 Arg Leu Leu Ile Ala Phe Thr Asp Ala Leu Gln Arg Glu Gln Phe Leu 370 375 380 Arg Thr Val Pro Leu Pro Arg Gly Ser Leu Phe Tyr Arg Gly Phe Leu 385 390 395 400 Glu Gly Leu ***
【0041】配列番号:3 配列の長さ:137 配列の型:アミノ酸 トポロジー:直鎖状 配列の種類:タンパク質 配列 Met Ala Phe Pro Ile Glu Leu Pro Ala Leu Ile Gln Leu Leu Asn Thr 5 10 15 Asp Val Thr Arg Ile Val Leu Tyr Cys Leu Phe Cys Asp Arg Pro Leu 20 25 30 Ser Met Gln Asp Lys Phe Asp Tyr Phe Gly Ala Gly Leu Lys Val Val 35 40 45 Cys Arg Lys Gly Gly Met Cys Ile Ala Cys Met Ser Cys Arg Arg Ala 50 55 60 Leu Ala Tyr Ala Glu Asp Leu Arg His Arg Gln Cys Thr Ala Glu Gly 65 70 75 80 Asp Leu Val Glu Arg Ile Thr Gly Lys Ser Leu Leu His Ile Asp Val 85 90 95 Arg Cys Ile Ala Cys Leu Cys Arg Leu Gly Pro Ser Glu Lys Leu Leu 100 105 110 Ala Lys Ala Ser His Lys Pro Phe Tyr Leu Val Arg Ser Leu Trp Arg 115 120 125 Gly Pro Cys Arg Lys Cys Phe Leu Leu *** 130 135
【0042】配列番号:4 配列の長さ:154 配列の型:アミノ酸 トポロジー:直鎖状 配列の種類:タンパク質 配列 Met Arg Gly Pro Glu Asn Pro Arg Leu Ile Ser Val Glu Glu Ala Arg 5 10 15 Lys Cys Met Glu Thr Gly Val Glu Leu Ala Leu Arg Pro Leu Thr Pro 20 25 30 Pro Pro Pro Leu Val Arg Cys Pro Glu Pro Ala Val Ala Val Arg Val 35 40 45 Pro Thr Val Ala Leu Gly Val Pro Val Pro Pro Ala Gln Arg Phe Ala 50 55 60 Cys Val Pro Ala Cys Val Pro Ala Ser Cys Leu Cys Glu Pro Asp Phe 65 70 75 80 Gly Gln Ser Ser Leu Ser Pro Asp Thr Pro Gly Lys Glu Glu Ser Val 85 90 95 Cys Val Ser Leu Asp Pro Tyr Lys Ile Lys Thr Asp Cys Pro Ser Cys 100 105 110 Asp Arg Ile Leu Arg Phe Val Val Ala Ala Thr Pro Ser Thr Phe Arg 115 120 125 Val Leu Lys Asn Leu Leu Leu Glu Asp Leu His Phe Val Cys Pro Thr 130 135 140 Cys Val Lys Val His Val Asn Asp Gly Arg *** 145 150
【0043】配列番号:5 配列の長さ:500 配列の型:アミノ酸 トポロジー:直鎖状 配列の種類:タンパク質 配列 Met Gln Pro Ser Gly Lys Leu Tyr Leu Pro Pro Ala Lys Pro Ile Ala 5 10 15 Arg Val Gln Ser Thr Asp Glu Tyr Leu Gln Pro Thr Ser Phe Tyr Cys 20 25 30 His Ala Ser Thr Glu Arg Leu Leu Thr Val Gly His Pro Tyr Phe Glu 35 40 45 Ile Gln Lys Asp Asp Lys Val Val Val Pro Lys Val Ser Gly Asn Gln 50 55 60 Tyr Arg Val Phe Arg Leu Lys Leu Pro Asp Pro Asn Lys Phe Ala Leu 65 70 75 80 Ala Gln Gln Asp Leu Tyr Asn Pro Asp Arg Glu Arg Leu Val Trp Arg 85 90 95 Leu Arg Gly Leu Glu Ile Gly Arg Gly Gly Pro Leu Gly Val Gly Thr 100 105 110 Thr Gly Ser Pro Leu Phe Asn Lys Leu Gly Asp Thr Glu Asn Pro Asn 115 120 125 Lys Tyr Gln Ser Ala Ser Lys Asp Asn Arg Gln Asn Leu Ser Leu Asp 130 135 140 Pro Lys Gln Thr Gln Met Phe Ile Val Gly Cys Ala Pro Cys Thr Gly 145 150 155 160 Glu His Trp Asp Ile Ala Lys Pro Cys Gly Ala Leu Asp Gln Gly Asp 165 170 175 Cys Pro Pro Ile Gln Leu Val Asn Thr Val Ile Gln Asp Gly Asp Met 180 185 190 Cys Asp Ile Gly Phe Gly Ala Met Asn Phe Lys Thr Leu His Asp Asp 195 200 205 Lys Ser Gly Val Pro Leu Asp Ile Val Asn Ser Ala Cys Lys Trp Pro 210 215 220 Asp Phe Leu Lys Met Thr Asn Glu Val Tyr Gly Asp Arg Met Phe Phe 225 230 235 240 Phe Gly Arg Arg Glu Gln Val Tyr Ala Arg His Tyr Phe Val Arg Asn 245 250 255 Gly Asn Ile Gly Glu Lys Ile Pro Ala Asn Asp Gln Gly Ile Ser Asp 260 265 270 Tyr Tyr Ile Lys Pro Ala Ala Asp Gln Asp Gln Lys Ala Asp Ala Ser 275 280 285 Tyr Ile Tyr Phe Ala Thr Pro Ser Gly Ser Leu Leu Ser Ser Asp Gly 290 295 300 Gln Leu Phe Asn Arg Pro Phe Trp Leu Gln Arg Ala Gln Gly Asn Asn 305 310 315 320 Asn Gly Ile Cys Trp Gly Asn Asp Leu Phe Ile Thr Leu Val Asp Asn 325 330 335 Thr Arg Asn Val Asn Phe Thr Ile Asn Gln Lys Asn Ala His Thr Asp 340 345 350 Asp Tyr Ala Ala Thr Asn Phe Ser Gln Tyr Leu Arg His Val Glu Gln 355 360 365 Phe Glu Ile Ser Cys Ile Phe Gln Ile Cys Lys Val Pro Leu Asp Ala 370 375 380 Asp Val Leu Ala His Leu Asn Val Met Asn Pro Asp Ile Leu Glu Asp 385 390 395 400 Trp Asn Leu Gly Phe Val Pro Pro Pro Asn Ile Pro Ile His Asp Glu 405 410 415 Tyr Arg Tyr Ile Asp Ser Leu Ala Thr Arg Cys Pro Asp Gln Asn Pro 420 425 430 Pro Lys Glu Lys Asp Asp Pro Tyr Lys Asp Tyr Thr Phe Trp Thr Val 435 440 445 Asp Leu Thr Glu Arg Phe Ser Gln Glu Leu Asp Gln Phe Pro Leu Gly 450 455 460 Arg Lys Tyr Leu Tyr Gln Ser Gly Ile Arg Thr Thr Ala Arg Leu Lys 465 470 475 480 Arg Thr Ala Pro Thr Thr Ser Ser Ile Ala Ser Lys Arg Val Val Lys 485 490 495 Arg Arg Lys Lys *** 500
【0044】配列番号:6 配列の長さ:1827 配列の型:核酸 トポロジー:直鎖状 配列の種類:Genomic DNA 配列 ATGGCCGATA AAGGTACAGA TGGAGATGAG GGGTGCAGTG GATGGTATAT TGTGAATGAA 60 GCTGAATGTG TGGACGATTC TCTAGATGAT CTTGAGGCTT TGTTTGACGA GAGTACCCAG 120 GAAACAAATA GCTTTATTGA TTATGATGAG GTGGACCAGG GAAATTCCCT CTCGCTGTTC 180 CATGAGCAAC TGTTTCTTAG CAGTGAGGAG CAGATAGCCT GTCTAAAGCG AAAGTATGCA 240 GCGACTCCTT CCAAGGATAG GCAGAGTTTA GAAATAGCCA GTTTAAGTCC CAGATTAGAA 300 TCAGTGTCAA TATCGCCTCA GAGTAAGAGC AGCAGAAGAA AACTGTTTCA GGACAGTGGA 360 ATAGGAAATG AAACTCAAGA TACTGCTCCG CGGGACAGGA CACAAGAGGT ATCTACCGGA 420 CCGATTCCGG ACCCGTGTTT ACGACCGGGA ACGGAAACGG CTGACCTATT GAAATCTAGC 480 AACATATATG CTACATGCCT ATCAAAATTT AAAACAGCCT ATGGATGTAG CTTTGCAGAA 540 TTAACTAGAC AATTCAAAAG TGATAAGACT TGTAGTCCGC ATTGGGTTGT GACCGTCTTC 600 GGTGCTCCTG AACAGTTAGT AGAAGCTTCA AAAGTTTTGT TGCCACAGCA TTGTGAATAT 660 GCACAGCTGA GCATTGGTTA TGCTGGAAAC AGTAAAGTGC TGTTGTTTTT GTTTGAATTT 720 AAGGCATCTA AAAACAGGGA GACAGTGCGG AAACTGTTGG CCGCCATGTT AGGAGTGCAA 780 GAATGCTTAA TCATTGCCGA GCCTCCGAAG GAGCGTAGTG TGCTTAGTGC ATTGTTTTTT 840 TACAAGAAGG TTATGTTCCA GGGCAGCGAT ACTTTCCAAT GCGGACAGCT ACCAGAATGG 900 GTGGCCAAAC AAACACTGGT TGAACATCAA GCCGCAACAG CGGAGTCATT TGATTTAAGT 960 AGAATGATAC AGTGGGCATA CGACAATGAC TATGCAGAAG AGTCCGCCAT TGCTTATAAC 1020 TATGCACTGT ACGCAGAGGC AGATGCCAAT GCAGAGGCAT TTCTCAAGAG CAACTGCCAG 1080 GCCAAGTATG TTAAGGACTG TGCAACAATG GTTAGGCTGT ATAAAAGGCA GGAGATGAGG 1140 GATATGTCCA TGAGCCAGTG GGTAAAAAAG TGTTGCGATG CAACGGAGGA GGACGAGGGG 1200 GACTGGAAAG TAATAGCAGC CTTCCTGAGA TATCAGGAGG TAAATGTGGT GCTTTTTCTT 1260 GCAGCACTAA GACATCTGTT CCTGGGTACT CCTAAAAAAC ATTGCCTCGT CATTTACGGA 1320 CCCCCAGATA CAGGGAAATC ATATTTTTGC ACTACCCTTG TGGGGTTTCT AAAGGGAAAA 1380 ATGATTTCCT TTATGAATAG CAAAAGTCAA TTCTGGTTGC AGCCACTAGT GGACAGCAAA 1440 ATAGGGTTCT TAGATGATGC TACCACCGCC TGCTGGCAGT ACATGGACGT GTTTATGCGC 1500 AATGCACTAG ATGGCAACCC TATATCTTTA GATATGAAAC ATAGAGCCCC CACCCAAATA 1560 AAACTGCCAC CGCTACTCAT AACAACTAAT GTCAATGTGC AGGCAAATGA CAGCTATAAA 1620 TTTCTGCATA GCCGCTTGCA ATTCTTTGCA TTTAACAAGC CTATGCTTTT TGATGACTCT 1680 GGCAATCCCC AATATCCATT GTCTAAAGCT AACTGGCGGT CTTTCTTTAC AAGGCTGGGT 1740 AAGCAGTTAG GAATACAAGA CGACGAAGAT GCCGACCCTG ACAGAGCGTT TCGATGCAGT 1800 GCAAGACCAG ATTCTCAATC TCATTGA
【0045】配列番号:7 配列の長さ:1212 配列の型:ヌクレオチド トポロジー:直鎖状 配列の種類:Genomic DNA 配列 ATGCCGACCC TGACAGAGCG TTTCGATGCA GTGCAAGACC AGATTCTCAA TCTCATTGAG 60 AAGGGAAGCA CTGCTCTTGC GGACCATGTA CTGTACTGGG ACCTTGTAAG AAAGGAGGGA 120 GTCTTACAGT ACTATGCCAG GAAGCACAAT ATGAACAGGC TTGGCCTACA TGCACTGCCA 180 TGTCAATTAG GCGCCGAAAC AAAGGCCAAA AAAGCAATAC AGATGGGCAT GTTATTGCGG 240 TCTTTGCTGG ACTCCAAGTA TGGGTCGGAA CCATGGACAG TGTCAGAGAC TAGCCTTGAA 300 CTGTATGAGC AAACAGACCC AGAAAAGACA TTTAAAAAGG GTGGCCAAAC AATAGAGGTG 360 CACTATGACA ACGACCCTGA AAACAGTGTG GCCTACACCC TGTGGAAATA TTTATATAAG 420 CAGGATGAAG CTGGACAGTG GCATAAACTT GAAGGGGGTG TTGACTATGC AGGACTGTAT 480 TATGTTGAGG TAAATGGCAT GCATGTGTAT TATGAAGAGT TCTGTGAGGA CTCTGACCGA 540 TATGGTCAAT CATCAACATG GACTGTTAAA TATAACAACA CGGATATTTG TGCTCCTGTC 600 ACTAGTTCCA CCAGAGAAGA GGGCACCCAA CAACAGGCCC GCAAAAGACA GCGAACAGAC 660 GCCTCCGAAG ACTCCCTCTC CACGTGGACC GCCAGCAGCC CCGAAGAAGA CTCCACGTCC 720 GACATCACTA CCCCTCCGTC GTCGCCCAGA AGGGGATACG GACCTAGCCA CTCCTCTCCC 780 ACCAGATTCA GACGAGGAGG AAGGCGAGGG GAACAAGGAG AACCTACCCC CTCCCCCACC 840 TTTGACGCCA TTTCCCCGAT CCCCGCTCGA CACCCTGCTG AAGGACCTCG CGGAGTCTCT 900 GAGGAACTTC CACGAGCAGG TTTCGGAGGG TATCCAGAAG TACTCGGACG GTCTGGGGAT 960 CCCCCCATAC TACTTCTAAC AGGTCCTGCT AATTGCTTAA AATGTTGGCG CAATAGGGTG 1020 AAGCGTAGAC CGCACAGGCT GTATAAAAGA ATGAGCACTT GCTTTTCCTG GGTGTCAGAA 1080 ACTGGTGCTG GGACTGAGGA CCAAAGACTA TTGATTGCAT TCACAGATGC ACTACAAAGA 1140 GAACAATTTC TAAGGACTGT GCCTTTGCCA AGAGGGTCAT TGTTCTACAG AGGGTTCTTG 1200 GAGGGTTTAT GA
【0046】配列番号:8 配列の長さ:414 配列の型:ヌクレオチド トポロジー:直鎖状 配列の種類:Genomic DNA 配列 ATGGCGTTCC CCATTGAGTT GCCCGCTTTG ATACAATTAT TGAATACTGA TGTTACTCGT 60 ATTGTGCTAT ATTGTCTCTT TTGTGATCGT CCTTTGTCTA TGCAAGATAA GTTTGACTAT 120 TTTGGAGCTG GTCTTAAGGT AGTGTGCAGA AAAGGTGGTA TGTGCATTGC TTGCATGTCG 180 TGTCGCAGGG CGCTTGCTTA TGCAGAGGAC CTGAGGCACA GGCAGTGCAC TGCAGAGGGC 240 GATTTGGTTG AGAGGATTAC TGGCAAGAGT CTGCTGCACA TAGATGTGCG TTGCATAGCT 300 TGTTTGTGCA GGCTAGGGCC TTCTGAAAAA CTGCTGGCAA AGGCTTCACA CAAGCCATTC 360 TATTTGGTAC GGTCTCTGTG GCGCGGACCG TGCAGAAAGT GCTTCCTGCT ATAA
【0047】配列番号:9 配列の長さ:465 配列の型:ヌクレオチド トポロジー:直鎖状 配列の種類:Genomic DNA 配列 ATGAGGGGTC CTGAGAATCC TCGACTCATA TCTGTGGAAG AAGCACGGAA ATGCATGGAA 60 ACGGGAGTTG AGCTTGCACT AAGACCCCTG ACTCCTCCGC CTCCGTTGGT TCGATGCCCA 120 GAACCTGCAG TTGCCGTAAG AGTTCCCACG GTTGCCTTGG GTGTTCCTGT GCCCCCGGCA 180 CAGAGATTTG CGTGTGTACC CGCATGTGTG CCAGCCTCTT GTCTGTGTGA ACCGGACTTT 240 GGGCAGTCCT CATTGTCACC AGACACACCA GGCAAGGAGG AGTCAGTATG TGTCAGCCTC 300 GACCCATATA AGATTAAGAC AGATTGTCCG TCCTGCGATC GTATATTAAG GTTTGTGGTA 360 GCAGCAACAC CCAGCACTTT TCGTGTGCTC AAAAACTTGC TGTTAGAGGA CCTGCATTTC 420 GTCTGTCCTA CCTGCGTGAA AGTTCACGTT AACGATGGCC GATAA
【0048】配列番号:10 配列の長さ:1503 配列の型:ヌクレオチド トポロジー:直鎖状 配列の種類:Genomic DNA 配列 ATGCAACCAT CAGGCAAGCT TTACCTTCCC CCTGCAAAGC CCATTGCACG GGTGCAAAGT 60 ACAGACGAAT ATCTGCAACC TACCTCATTC TACTGCCATG CAAGCACTGA ACGGCTGCTT 120 ACTGTGGGAC ATCCATACTT CGAAATACAA AAGGACGATA AGGTGGTGGT GCCCAAAGTA 180 TCAGGAAACC AATACAGGGT TTTTAGACTA AAACTGCCTG ATCCTAACAA GTTTGCACTG 240 GCGCAGCAGG ACTTATACAA CCCAGACAGA GAAAGGCTTG TTTGGAGACT CAGGGGACTT 300 GAAATAGGAC GTGGAGGCCC ACTAGGTGTG GGTACAACAG GATCCCCATT GTTTAATAAA 360 CTTGGGGATA CTGAAAACCC TAATAAGTAT CAGTCTGCTT CTAAAGACAA CAGGCAAAAT 420 CTGTCCCTTG ACCCTAAACA AACTCAAATG TTTATTGTCG GTTGTGCCCC GTGCACAGGT 480 GAGCATTGGG ATATTGCAAA GCCATGTGGG GCTCTAGATC AAGGGGATTG CCCACCAATA 540 CAGCTTGTGA ACACTGTAAT CCAGGATGGA GATATGTGTG ACATTGGGTT TGGAGCAATG 600 AACTTTAAAA CTTTGCATGA TGACAAGTCT GGTGTTCCTC TAGACATTGT AAATTCTGCT 660 TGCAAGTGGC CTGACTTTCT CAAGATGACC AATGAGGTCT ATGGGGACAG AATGTTTTTC 720 TTTGGCCGCC GTGAACAGGT ATATGCTAGG CATTACTTTG TTCGGAATGG GAACATAGGC 780 GAAAAAATAC CTGCTAATGA CCAGGGCATC AGTGACTACT ATATAAAACC TGCGGCTGAT 840 CAGGATCAAA AGGCTGATGC ATCATACATT TACTTTGCAA CCCCAAGTGG ATCCCTACTA 900 TCCAGTGATG GTCAGTTGTT CAACAGACCA TTCTGGTTGC AGCGTGCACA AGGAAACAAC 960 AATGGCATCT GCTGGGGGAA TGACCTGTTC ATTACCCTAG TTGACAACAC CCGCAATGTG 1020 AACTTCACAA TTAACCAAAA GAATGCCCAC ACCGATGACT ATGCAGCCAC GAACTTCTCT 1080 CAGTATCTGC GGCATGTGGA GCAGTTCGAA ATATCTTGCA TTTTCCAGAT TTGTAAGGTG 1140 CCTTTAGATG CTGATGTGTT GGCCCACCTT AATGTTATGA ATCCTGACAT CTTGGAGGAC 1200 TGGAATCTGG GTTTTGTGCC ACCTCCCAAT ATCCCTATAC ATGATGAGTA TAGGTATATA 1260 GATTCTTTAG CCACACGCTG CCCAGACCAA AATCCTCCTA AGGAAAAGGA TGATCCTTAC 1320 AAGGATTATA CTTTCTGGAC CGTTGATCTC ACAGAGCGGT TTTCTCAAGA GCTAGATCAG 1380 TTTCCCCTAG GTCGCAAGTA TCTATACCAG TCGGGTATTC GAACCACTGC ACGGCTAAAA 1440 CGCACAGCAC CCACTACCTC CTCCATTGCT TCTAAACGGG TTGTTAAGAG GCGTAAAAAG 1500 TAA
【0049】配列番号:11 配列の長さ:7647 配列の型:ヌクレオチド トポロジー:直鎖状 配列の種類:Genomic DNA 起源 生物名:ハムスター 細胞の種類:口腔粘膜前癌細胞 配列 ATGATTGTTA ACAACAATCA TCCCTTTGAA ATTTTCGAAG GCGGAGCCGT TAACGGTCGT 60 ATAAATATAG GCGGTCGAGA CCACTCTTTG GAACAGCTAC ATGGCGTTCC CCATTGAGTT 120 GCCCGCTTTG ATACAATTAT TGAATACTGA TGTTACTCGT ATTGTGCTAT ATTGTCTCTT 180 TTGTGATCGT CCTTTGTCTA TGCAAGATAA GTTTGACTAT TTTGGAGCTG GTCTTAAGGT 240 AGTGTGCAGA AAAGGTGGTA TGTGCATTGC TTGCATGTCG TGTCGCAGGG CGCTTGCTTA 300 TGCAGAGGAC CTGAGGCACA GGCAGTGCAC TGCAGAGGGC GATTTGGTTG AGAGGATTAC 360 TGGCAAGAGT CTGCTGCACA TAGATGTGCG TTGCATAGCT TGTTTGTGCA GGCTAGGGCC 420 TTCTGAAAAA CTGCTGGCAA AGGCTTCACA CAAGCCATTC TATTTGGTAC GGTCTCTGTG 480 GCGCGGACCG TGCAGAAAGT GCTTCCTGCT ATAATGAGGG GTCCTGAGAA TCCTCGACTC 540 ATATCTGTGG AAGAAGCACG GAAATGCATG GAAACGGGAG TTGAGCTTGC ACTAAGACCC 600 CTGACTCCTC CGCCTCCGTT GGTTCGATGC CCAGAACCTG CAGTTGCCGT AAGAGTTCCC 660 ACGGTTGCCT TGGGTGTTCC TGTGCCCCCG GCACAGAGAT TTGCGTGTGT ACCCGCATGT 720 GTGCCAGCCT CTTGTCTGTG TGAACCGGAC TTTGGGCAGT CCTCATTGTC ACCAGACACA 780 CCAGGCAAGG AGGAGTCAGT ATGTGTCAGC CTCGACCCAT ATAAGATTAA GACAGATTGT 840 CCGTCCTGCG ATCGTATATT AAGGTTTGTG GTAGCAGCAA CACCCAGCAC TTTTCGTGTG 900 CTCAAAAACT TGCTGTTAGA GGACCTGCAT TTCGTCTGTC CTACCTGCGT GAAAGTTCAC 960 GTTAACGATG GCCGATAAAG GTACAGATGG AGATGAGGGG TGCAGTGGAT GGTATATTGT 1020 GAATGAAGCT GAATGTGTGG ACGATTCTCT AGATGATCTT GAGGCTTTGT TTGACGAGAG 1080 TACCCAGGAA ACAAATAGCT TTATTGATTA TGATGAGGTG GACCAGGGAA ATTCCCTCTC 1140 GCTGTTCCAT GAGCAACTGT TTCTTAGCAG TGAGGAGCAG ATAGCCTGTC TAAAGCGAAA 1200 GTATGCAGCG ACTCCTTCCA AGGATAGGCA GAGTTTAGAA ATAGCCAGTT TAAGTCCCAG 1260 ATTAGAATCA GTGTCAATAT CGCCTCAGAG TAAGAGCAGC AGAAGAAAAC TGTTTCAGGA 1320 CAGTGGAATA GGAAATGAAA CTCAAGATAC TGCTCCGCGG GACAGGACAC AAGAGGTATC 1380 TACCGGACCG ATTCCGGACC CGTGTTTACG ACCGGGAACG GAAACGGCTG ACCTATTGAA 1440 ATCTAGCAAC ATATATGCTA CATGCCTATC AAAATTTAAA ACAGCCTATG GATGTAGCTT 1500 TGCAGAATTA ACTAGACAAT TCAAAAGTGA TAAGACTTGT AGTCCGCATT GGGTTGTGAC 1560 CGTCTTCGGT GCTCCTGAAC AGTTAGTAGA AGCTTCAAAA GTTTTGTTGC CACAGCATTG 1620 TGAATATGCA CAGCTGAGCA TTGGTTATGC TGGAAACAGT AAAGTGCTGT TGTTTTTGTT 1680 TGAATTTAAG GCATCTAAAA ACAGGGAGAC AGTGCGGAAA CTGTTGGCCG CCATGTTAGG 1740 AGTGCAAGAA TGCTTAATCA TTGCCGAGCC TCCGAAGGAG CGTAGTGTGC TTAGTGCATT 1800 GTTTTTTTAC AAGAAGGTTA TGTTCCAGGG CAGCGATACT TTCCAATGCG GACAGCTACC 1860 AGAATGGGTG GCCAAACAAA CACTGGTTGA ACATCAAGCC GCAACAGCGG AGTCATTTGA 1920 TTTAAGTAGA ATGATACAGT GGGCATACGA CAATGACTAT GCAGAAGAGT CCGCCATTGC 1980 TTATAACTAT GCACTGTACG CAGAGGCAGA TGCCAATGCA GAGGCATTTC TCAAGAGCAA 2040 CTGCCAGGCC AAGTATGTTA AGGACTGTGC AACAATGGTT AGGCTGTATA AAAGGCAGGA 2100 GATGAGGGAT ATGTCCATGA GCCAGTGGGT AAAAAAGTGT TGCGATGCAA CGGAGGAGGA 2160 CGAGGGGGAC TGGAAAGTAA TAGCAGCCTT CCTGAGATAT CAGGAGGTAA ATGTGGTGCT 2220 TTTTCTTGCA GCACTAAGAC ATCTGTTCCT GGGTACTCCT AAAAAACATT GCCTCGTCAT 2280 TTACGGACCC CCAGATACAG GGAAATCATA TTTTTGCACT ACCCTTGTGG GGTTTCTAAA 2340 GGGAAAAATG ATTTCCTTTA TGAATAGCAA AAGTCAATTC TGGTTGCAGC CACTAGTGGA 2400 CAGCAAAATA GGGTTCTTAG ATGATGCTAC CACCGCCTGC TGGCAGTACA TGGACGTGTT 2460 TATGCGCAAT GCACTAGATG GCAACCCTAT ATCTTTAGAT ATGAAACATA GAGCCCCCAC 2520 CCAAATAAAA CTGCCACCGC TACTCATAAC AACTAATGTC AATGTGCAGG CAAATGACAG 2580 CTATAAATTT CTGCATAGCC GCTTGCAATT CTTTGCATTT AACAAGCCTA TGCTTTTTGA 2640 TGACTCTGGC AATCCCCAAT ATCCATTGTC TAAAGCTAAC TGGCGGTCTT TCTTTACAAG 2700 GCTGGGTAAG CAGTTAGGAA TACAAGACGA CGAAGATGCC GACCCTGACA GAGCGTTTCG 2760 ATGCAGTGCA AGACCAGATT CTCAATCTCA TTGAGAAGGG AAGCACTGCT CTTGCGGACC 2820 ATGTACTGTA CTGGGACCTT GTAAGAAAGG AGGGAGTCTT ACAGTACTAT GCCAGGAAGC 2880 ACAATATGAA CAGGCTTGGC CTACATGCAC TGCCATGTCA ATTAGGCGCC GAAACAAAGG 2940 CCAAAAAAGC AATACAGATG GGCATGTTAT TGCGGTCTTT GCTGGACTCC AAGTATGGGT 3000 CGGAACCATG GACAGTGTCA GAGACTAGCC TTGAACTGTA TGAGCAAACA GACCCAGAAA 3060 AGACATTTAA AAAGGGTGGC CAAACAATAG AGGTGCACTA TGACAACGAC CCTGAAAACA 3120 GTGTGGCCTA CACCCTGTGG AAATATTTAT ATAAGCAGGA TGAAGCTGGA CAGTGGCATA 3180 AACTTGAAGG GGGTGTTGAC TATGCAGGAC TGTATTATGT TGAGGTAAAT GGCATGCATG 3240 TGTATTATGA AGAGTTCTGT GAGGACTCTG ACCGATATGG TCAATCATCA ACATGGACTG 3300 TTAAATATAA CAACACGGAT ATTTGTGCTC CTGTCACTAG TTCCACCAGA GAAGAGGGCA 3360 CCCAACAACA GGCCCGCAAA AGACAGCGAA CAGACGCCTC CGAAGACTCC CTCTCCACGT 3420 GGACCGCCAG CAGCCCCGAA GAAGACTCCA CGTCCGACAT CACTACCCCT CCGTCGTCGC 3480 CCAGAAGGGG ATACGGACCT AGCCACTCCT CTCCCACCAG ATTCAGACGA GGAGGAAGGC 3540 GAGGGGAACA AGGAGAACCT ACCCCCTCCC CCACCTTTGA CGCCATTTCC CCGATCCCCG 3600 CTCGACACCC TGCTGAAGGA CCTCGCGGAG TCTCTGAGGA ACTTCCACGA GCAGGTTTCG 3660 GAGGGTATCC AGAAGTACTC GGACGGTCTG GGGATCCCCC CATACTACTT CTAACAGGTC 3720 CTGCTAATTG CTTAAAATGT TGGCGCAATA GGGTGAAGCG TAGACCGCAC AGGCTGTATA 3780 AAAGAATGAG CACTTGCTTT TCCTGGGTGT CAGAAACTGG TGCTGGGACT GAGGACCAAA 3840 GACTATTGAT TGCATTCACA GATGCACTAC AAAGAGAACA ATTTCTAAGG ACTGTGCCTT 3900 TGCCAAGAGG GTCATTGTTC TACAGAGGGT TCTTGGAGGG TTTATGAACT GTGTGCTGCT 3960 AAGCATTTGT GACTGTAAAC AATGGTGGCT GCTAATAGGG CCCGAAGGGT CAAAAGGGAC 4020 TCTGCTGAAA ATCTGTATCG CCAATGCCAA ATCACTGGAA ACTGCCCCCC TGATGTTGTG 4080 AATAAAGTTG AGGGAACTAC TCTTGCTGAC AAGCTTACAA AGATATTTGC AAGCATTCTG 4140 TATTTGGGTG GCTTGGGCAT AGGTACCGGA CGCGGTACTG GAGGGGCAAC AGGATATGGG 4200 CCAATAAATC CTGGTGGTGG CCGTATCACA GGCACAGGCA CGGTTATGAG GCCTGGTGTT 4260 GTCATTGAGC CTGTGGGCCC GGGTGATATA GTGTCTGTGG GAGCCACGGA CAGCTCTATA 4320 GTGCCTTTGC TAGAGGCCAC ACCTGACATA CCCATAGAGG GTGGGCCCGA GGTGCCCCCT 4380 GCAGGTCCTG ATGTCAGCAC AGTAGATGTC ACCGCAAATG TTGACCCTAT CAGTGACATA 4440 AATGTAACCA GCAGCACCAC CATAACAAAC CCTGACTCAG CTGTTATAGA TGTACAGCCT 4500 GCACCATCAG GCCCCAGGAG AGTCACTGTG TCCAGGAGTG AATTTCAAAA TGCCTCTTAT 4560 GTGTCAGTCA CCCACCCATC ACAGGGTCTT GGTGAGAGTG GTGGGGCTGT CATTTCTGCT 4620 GATGCAGGGG GATCAGTAGT TTCGTCTTCA CATGAATTAG ATGTGGGAAT CTTAATTGGA 4680 GGGAGGCCAC CTGGTAATTT GAGTGAGTTC CAGACCATTG AGCTTGATGA AATCGTTCAG 4740 ACACAAGGGG TGGATGATTT CGACATTGGA GAGGGGGCAG GCAGAGCGGG TCCTGACACG 4800 AGTACACCTG ATAATTACTT AGGTCGTGCT CTCAGTCGTT TCAGAGAGAT TTATGAAAGA 4860 CCCAGTGACC TGTACACTAG AAGAGTCCAA CAAGTGAGGG TTCGCAATAG AGATCTCTTT 4920 CTTGGGGACC CTGGTAGATT GGTCACTTAT GAATTTGACA ACCCAGCCTT TGAGGGATTG 4980 GGAGAGGACA CCATCATTTT CCATCAAGCC CCTGAGGTGC AGGCAGCGCC TGATGAGGAC 5040 TTCATGGATA TAATTAAACT GGGCAGACAG AGACTTGCAC AAACACCAGG AGGGACTGTG 5100 AGAATCAGTA GGCTTGGACA AAGAGGCACT ATCCGTACAA GGAGTGGCTT GCAAATTGGA 5160 GGGAAAGTGC ATTTCTTCTC TGATTTATCT CCTATAGCGA CAGAAAACAT TGAGCTGTCT 5220 CCCCTAGGGG AGATATCAGG TGAGGCAATG GTTGTTGATG CACTTAGTGA ATATTACCTC 5280 ATTTCTGAAC CTGGCATTGA GCCTGTTCCC TTCATGGATG AGGATCTGTT AGATATTCAA 5340 AGTGAAGACT TCTCAGGTTC CCGCCTGCAT CTTGTTAGGA CTGGCAATAG ATTTGGTGTG 5400 ATTTATGAGC CGTCAGAAAA TTTAGGCGCC AGAACTGTGT TCCCAGATAT TAATACCGGA 5460 GATTTTATCC GTTACCCACA AAGCAACATA AATCCTGCTG ACATCAGCTA TCAAGACCTA 5520 ATACCATTGC AGCCTGGTGT TGACATAAAT GTAGGTTCAA TTTATCCCTC TGTTGATTAC 5580 TATCTGCATC CCAGCCTGCG TAGACGCAAA CGCAAACGCA CTCTTCATTA ATATTTTGCA 5640 GGATGTGGAT GCAACCATCA GGCAAGCTTT ACCTTCCCCC TGCAAAGCCC ATTGCACGGG 5700 TGCAAAGTAC AGACGAATAT CTGCAACCTA CCTCATTCTA CTGCCATGCA AGCACTGAAC 5760 GGCTGCTTAC TGTGGGACAT CCATACTTCG AAATACAAAA GGACGATAAG GTGGTGGTGC 5820 CCAAAGTATC AGGAAACCAA TACAGGGTTT TTAGACTAAA ACTGCCTGAT CCTAACAAGT 5880 TTGCACTGGC GCAGCAGGAC TTATACAACC CAGACAGAGA AAGGCTTGTT TGGAGACTCA 5940 GGGGACTTGA AATAGGACGT GGAGGCCCAC TAGGTGTGGG TACAACAGGA TCCCCATTGT 6000 TTAATAAACT TGGGGATACT GAAAACCCTA ATAAGTATCA GTCTGCTTCT AAAGACAACA 6060 GGCAAAATCT GTCCCTTGAC CCTAAACAAA CTCAAATGTT TATTGTCGGT TGTGCCCCGT 6120 GCACAGGTGA GCATTGGGAT ATTGCAAAGC CATGTGGGGC TCTAGATCAA GGGGATTGCC 6180 CACCAATACA GCTTGTGAAC ACTGTAATCC AGGATGGAGA TATGTGTGAC ATTGGGTTTG 6240 GAGCAATGAA CTTTAAAACT TTGCATGATG ACAAGTCTGG TGTTCCTCTA GACATTGTAA 6300 ATTCTGCTTG CAAGTGGCCT GACTTTCTCA AGATGACCAA TGAGGTCTAT GGGGACAGAA 6360 TGTTTTTCTT TGGCCGCCGT GAACAGGTAT ATGCTAGGCA TTACTTTGTT CGGAATGGGA 6420 ACATAGGCGA AAAAATACCT GCTAATGACC AGGGCATCAG TGACTACTAT ATAAAACCTG 6480 CGGCTGATCA GGATCAAAAG GCTGATGCAT CATACATTTA CTTTGCAACC CCAAGTGGAT 6540 CCCTACTATC CAGTGATGGT CAGTTGTTCA ACAGACCATT CTGGTTGCAG CGTGCACAAG 6600 GAAACAACAA TGGCATCTGC TGGGGGAATG ACCTGTTCAT TACCCTAGTT GACAACACCC 6660 GCAATGTGAA CTTCACAATT AACCAAAAGA ATGCCCACAC CGATGACTAT GCAGCCACGA 6720 ACTTCTCTCA GTATCTGCGG CATGTGGAGC AGTTCGAAAT ATCTTGCATT TTCCAGATTT 6780 GTAAGGTGCC TTTAGATGCT GATGTGTTGG CCCACCTTAA TGTTATGAAT CCTGACATCT 6840 TGGAGGACTG GAATCTGGGT TTTGTGCCAC CTCCCAATAT CCCTATACAT GATGAGTATA 6900 GGTATATAGA TTCTTTAGCC ACACGCTGCC CAGACCAAAA TCCTCCTAAG GAAAAGGATG 6960 ATCCTTACAA GGATTATACT TTCTGGACCG TTGATCTCAC AGAGCGGTTT TCTCAAGAGC 7020 TAGATCAGTT TCCCCTAGGT CGCAAGTATC TATACCAGTC GGGTATTCGA ACCACTGCAC 7080 GGCTAAAACG CACAGCACCC ACTACCTCCT CCATTGCTTC TAAACGGGTT GTTAAGAGGC 7140 GTAAAAAGTA AATGTCAATT ATTATTGTTG TATATAATGT ATGTGTATTT ACCTACCTCT 7200 GTAATGGCTA CCTCTGTAAA TGGCTACCTA ATTGAAACTA TGACTTGGCA ACAATATTTC 7260 CCTGTTTAAT GTGACTCCCA CCTTAATAAA CTGTGACTAA CTGCTGCACC ATTTGTCTCC 7320 TCCCTGTTTG TGCGCACCTG GCGCCTCAGT TGCGCCAGAA ACCTCTCGGG GGAAGGACGG 7380 TAAGCCCACA TCTCCTTTTT TACTGGAATA CTTGTGTTCT TGCCATGGAC CGAAATCGGT 7440 CTAAGCTTGT TCTAGGTATT TCAGCAGCGG ATGATTAAGA CTTAAACTTC CTAAGCACTG 7500 CAAGACAAGA CGAGTTTACC CGACCGCAAG CGTCTCCTAC TAAGCTGGCA GCACAATACA 7560 GGGTGTGTTG TTCCCTTGAG TCTGCCAGCG GCAAGCCTTG CCAAATTTAA GACCGGGACC 7620 GGTACTTGCC TGAACAACCC TCTAATC
【0050】
【発明の効果】本発明によれば、既知のパピローマウイ
ルスゲノムとは異なる遺伝型を有する新規なパピローマ
ウイルスゲノムのクローニングに成功し、その配列決定
がなされた。本発明のハムスター口腔ウイルス蛋白の遺
伝子は、癌に関連するパピローマウイルス感染症の診断
のほか、抗癌剤のスクリーニング、アンチセンス治療、
病態モデル動物の作出等にも有用である。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 (C12N 1/21 C12R 1:19) (C12P 21/02 C12R 1:19)