JP2001188703A - ページ情報取得方法 - Google Patents

ページ情報取得方法

Info

Publication number
JP2001188703A
JP2001188703A JP2000000458A JP2000000458A JP2001188703A JP 2001188703 A JP2001188703 A JP 2001188703A JP 2000000458 A JP2000000458 A JP 2000000458A JP 2000000458 A JP2000000458 A JP 2000000458A JP 2001188703 A JP2001188703 A JP 2001188703A
Authority
JP
Japan
Prior art keywords
page
information
survey
data
operation control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000000458A
Other languages
English (en)
Inventor
Satoru Nakama
悟 中間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
VIDEO RESEARCH COMHOUSE Ltd
Video Research Co Ltd
Original Assignee
VIDEO RESEARCH COMHOUSE Ltd
Video Research Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by VIDEO RESEARCH COMHOUSE Ltd, Video Research Co Ltd filed Critical VIDEO RESEARCH COMHOUSE Ltd
Priority to JP2000000458A priority Critical patent/JP2001188703A/ja
Publication of JP2001188703A publication Critical patent/JP2001188703A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 画像に関する所望のページ情報を確認及び調
査を自動化してページ情報調査データを作成する。 【解決手段】 まず、動作制御パラメータの登録機能が
実行される(S101)。つぎに、登録された動作制御
パラメータの読み込みが行われ(S103)、調査デー
タを作成するためのソフトウェアの動作制御(例えば、
開始日時等のタイミング制御)が実行される(S10
5)。ソフトウェアが実行されると、ページ構造の解析
が行われ(S107)、この処理でページ情報の自動判
定が実行され、調査データが作成・記録される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ページ情報取得方
法に係り、特に、インターネット上に多数存在するWe
bサイトのホームページより配信される、主としてバナ
ー広告等のページ情報を自動的に識別し、調査データを
作成するページ情報取得方法に関する。
【0002】
【従来の技術】従来より、広告は、テレビ、ラジオ、新
聞、雑誌、ポスター、看板など多種多様な媒体・メディ
アを通して、企業の製品販売活動の一環としての製品告
知や労働力の確保などのための企業イメージの向上など
を目的に流されており、企業や組織、団体などの維持・
存続には不可欠ものである。かかる広告に関する各種調
査データは、広告を流す立場である企業や組織、団体は
もちろんのこと、放送局などの媒体者、広告代理店、広
告製作会社等にとっても、経営活動を進める上において
不可欠なデータとしてさまざまな活用が図られている。
従来、テレビ、ラジオ、新聞、雑誌などの広告に関する
調査データは、主に人的労力によって作成されてきた。
実際にテレビや新聞、雑誌などを作業者が直接目で見
て、広告量、宣伝効果など測定している。このような広
告に関する調査データの集計・作成等は、一部自動化・
機械化がされているものの、それが完全ではないため、
最終的には人的労力の介入を必要としている。
【0003】
【発明が解決しようとする課題】一方、インターネット
の場合、比較的新しい媒体であることもあり、広告に関
する調査は極めて少なく、なおかつ、調査対象であるW
ebサイトもしくはホームページの数、あるいは個々の
ページの数は膨大である。数万ページを抱えるホームペ
ージもあり、この膨大なページ上の広告を人的労力によ
り確認あるいは調査するのは極めて困難である。本発明
は、この膨大なページ上の広告の確認及び調査を完全に
自動化し、人的労力の介入を排除して広告調査データを
作成することを目的とする。さらに、本発明は、広告に
関する調査データに限らず、特に画像に関する所望のペ
ージ情報を確認及び調査を自動化して、ページ情報調査
データを作成するページ情報取得方法を提供することを
目的とする。
【0004】
【課題を解決するための手段】本発明では、特に、イン
ターネット上のWebサイトのホームページのデータ構
造について研究した結果、ページ上の画像は電子データ
として取得可能なこと、その中でバナー広告の画像はW
ebサイトごとに縦横の画素数で与えられる大きさがい
くつかのパターンでほぼ決まっていることを見出し、こ
れを判定することにより、多数ある画像の中からバナー
広告のみを正確に抜き出し、既知のバナー広告に対して
蓄積した画像サンプリングデータと照合することによっ
て正確な確認を可能にしている。
【0005】本発明の解決手段によると、ページを取得
するステップと、取得されたページのコード情報を解析
することにより各ぺージ上に挿入された画像データを取
得するステップと、予め指定されたサイズ、形状、縦横
比又は位置のいずれか又は複数に基づいて、取得された
画像データが指定画像データであるかを判定するステッ
プと、取得された画像データについて画像サンプリング
データを作成するステップと、作成された画像サンプリ
ングデータと、予め記憶された既知の画像サンプリング
データとを照合するステップと、照合結果に基づき、取
得された画像データの識別情報、調査対象の上位ページ
の指定情報、取得された該当ページの指定情報、調査時
間に関する情報を含む調査データを作成するステップと
を備えたページ情報取得方法を提供する。
【0006】本発明において、特にバナー広告に関して
は、例えば、以下のことを特徴とする。本発明は、指定
したWebサイトのトップページから自動的にHTMLコー
ドを解析することにより、次々とリンクする次のページ
を取得し、当該ホームページ全体の構造を各ページのUR
L及びページタイトル、トップページからの距離などか
ら構成されるデータにより明らかにするページ構造解析
機能と、ページ構造解析機能の過程で取得されたHTMLコ
ードを解析することにより各ページ上に挿入された多数
の画像データの中から、所定の大きさの画像データをバ
ナー広告と判定して自動的に抜き出し、当該バナー広告
の画像サンプリングデータを既知のバナー広告に対して
蓄積した画像サンプリングデータと比較して照合を行
い、その結果をコンピュータの記録装置上に記録するペ
ージ自動判定機能を備える。
【0007】また、本発明は、バナー広告調査の対象W
ebサイトのトップページのURL、調査開始時刻と調査
間隔、トップページからの距離で示す調査範囲などの動
作制御パラメータを作成し保存する動作制御パラメータ
登録機能、または、保存された動作制御パラメータを読
み込みシステム全体の動作を制御する機能を備えること
もできる。
【0008】
【発明の実施の形態】以下の実施の形態では、ページ情
報として特にバナー広告を対象として説明するが、本発
明はこれに限らず、広くページ情報に対して適用するこ
とができる。また、本発明は、インターネットのホーム
ページにより画像データを取得する場合に限らず、適宜
のネットワークに送信された適宜の画面上の画像データ
に対しても広く適用することができる。
【0009】まず、本発明において使用される用語につ
いて説明する。「インターネット」は、広義には世界規
模のコンピュータ・ネットワークを指し、本稿では、特
に、一般利用者がインターネットサービスプロバイダー
を始めとしたオンライン通信サービス業者を経由して閲
覧可能なデータが蓄積してあるコンピュータの世界規模
のネットワークを指す。
【0010】この閲覧可能なデータの提供者を「Web
サイト」、Webサイトが保持しているコンピュータ上
に蓄積している一般利用者が閲覧可能なデータ全体を
「ホームページ」、ホームページの最初のページを「ト
ップページ」、個々のページにWebサイトが付加した
題名を「ページタイトル」、個々のページを取得もしく
は指定するための記述を「URL(Uniform Resource Locat
or)」、個々のページ内容の記述言語を「HTML(Hyper Te
xt Mark-up Language)」、HTMLで記述されたコードを
「HTMLコード」、一般利用者がホームページを検索、閲
覧するためのソフトウエア及び当該ソフトウエアが表示
する画面を「ブラウザ」と呼ぶ。
【0011】一般利用者はホームページを検索する場
合、通常、マウスのクリック動作によりページを次々と
検索していくが、このページ間のつながりをリンク、ト
ップページから当該ページを表示するに至るまでのマウ
スによるクリック動作の最小回数を「トップページから
の距離」・「調査レベル」と呼び、本発明では、このペ
ージからの距離によってホームページ全体のページ構成
を階層構造として捉えている。さらに本発明では、各ペ
ージにその内容とは無関係に挿入された一般企業や団
体、組織等の広告を「インターネットバナー広告もしく
はバナー広告」、バナー広告をはじめとしたページ上の
画像データを取得もしくは指定するための記述を「画像
ファイル名」、本システムの動作を「バナー広告調査も
しくは調査」、一つのバナー広告の中で画像が動くもの
を「アニメーションバナー広告」、ブラウザ上の同一位
置で利用者が検索する都度変化するバナー広告及び検索
後に同じく同一位置において一定時間間隔で他のバナー
広告に切り替わるものを総称して「ローテーションバナ
ー広告」と呼ぶ。
【0012】以下、本発明の実施の形態について図面を
参照して説明する。図1は、本発明のページ情報取得シ
ステムの構成図である。図1において、インターネット
に接続可能なコンピュータネットワーク1と、複数台の
パーソナルコンピュータ2と、パーソナルコンピュータ
上で動作するページ情報取得システムのために開発され
たページ情報取得ソフトウエア3と、複数台のPCサー
バ4を備える。
【0013】コンピュータネットワーク1は、オンライ
ン通信サービス業者を経由してインターネット上のWe
bサイトよりホームページのデータを取得すると同時
に、複数台のパーソナルコンピュータと複数台のPCサ
ーバを接続し、それらの間でデータを受け渡すためのネ
ットワークである。なお、コンピュータネットワーク1
は、インターネットに限らず適宜のネットワークと接続
されていてもよい。パーソナルコンピュータ2は、バナ
ー広告マスタ1−1b、動作制御パラメータファイル1
−2b、調査データファイル1−3b、ページ構造解析
ファイル1−4bを備える。パーソナルコンピュータ2
は、ページ情報取得ソフトウエア3が動作するマシンで
ある。パーソナルコンピュータ2は、複数設けることに
より、複数の調査を同時に実行可能である。PCサーバ
4は、既知のバナー広告マスタ1−1、動作制御パラメ
ータファイル1−2、調査データファイル1−3、ペー
ジタイトルデータファイル1−4、バナー広告画像デー
タファイル1−5の各ファイルを備える。PCサーバ4
の記録媒体上のファイルは複数台のパーソナルコンピュ
ータが使用もしくは作成するデータを共有もしくは保管
するためのものである。この共有が不必要な場合などに
おいては、PCサーバの記録媒体上のファイルは各パー
ソナルコンピュータ内の記録媒体上に置かれることもあ
る。
【0014】ページ情報取得ソフトウエア3は、この例
では、特に、インターネットホームページに対応するも
のであり、「動作制御パラメータの作成・保存機能」、
「動作制御パラメータの読み込み機能」、「ソフトウエ
アの動作制御機能」、「ページ構造解析機能」、「ペー
ジ情報自動判定機能」を備える。
【0015】図2に、PCサーバのファイルの説明図の
一例を示す。既知のバナー広告マスタ1−1aは、例え
ば、1.バナー広告コード、2.仮のバナー広告コー
ド、3.サイズ(横)、4.サイズ(縦)、5.バナー
広告内容、6.画像サンプリングデータの各情報を含
む。動作制御パラメータ1−2aは、例えば、1.動作
PC番号、2.調査対象Webサイト名称、3.トップ
ページのURL、4.調査レベル(トップページからの
距離)、5.調査日間隔、6.調査開始日、7.調査時
間間隔、8.調査開始時刻、9.ローテーションバナー
広告判定の有無、10.バナー広告サイズ1(横×
縦)、11.バナー広告サイズ2(横×縦)の各情報を
含む。調査データ1−3aは、例えば、1.調査実施
日、2.調査実施時刻、3.ページURL、4.バナー
広告コード、5.仮のバナー広告コード、6.バナー広
告位置の各情報を含む。ページタイトルデータ1−4a
は、例えば、1.ページコード、2.URL、3.調査
レベル、4.ページタイトル名称、5.リンク元文字列
の各情報を含む。バナー広告画像データ1−5aは、例
えば、1.仮のバナー広告コード、2.バナー広告画像
データの各情報を含む。
【0016】以下、本発明の実施の形態の動作を、ペー
ジ情報取得ソフトウエア3の主要な機能に沿って説明す
る。図3に、本発明に係るページ情報取得方法に関し
て、調査データを作成するための全体的なフローチャー
トを示す。このフローチャートでは、まず、動作制御パ
ラメータの登録機能が実行される(S101)。つぎ
に、登録された動作制御パラメータの読み込みが行われ
(S103)、調査データを作成するためのソフトウェ
アの動作制御(例えば、開始日時等のタイミング制御)
が実行される(S105)。ソフトウェアが実行される
と、ページ構造の解析が行われ(S107)、この処理
でページ情報の自動判定が実行され、調査データが作成
・記録される。以下、図3における各処理について説明
する。
【0017】(1)動作制御パラメータの作成・保存機
能 図4に、動作制御パラメータの作成・保存機能のフロー
チャートを示す。この機能は、ページ情報取得ソフトウ
エア3が、自らのバナー広告調査の動作を制御するため
のパラメータを作成・保存する機能である。同ソフトウ
エアの動作画面上には、動作制御パラメータを設定する
画面を表示するためのボタンもしくはメニューが用意さ
れている。使用者がマウスによるクリック等の適宜の操
作によりかかるボタンもしくはメニューを選択すると
(2−1)、同ソフトウエアは動作制御パラメータを設
定するための登録画面を表示する(2−2)。動作制御
パラメータとしては、例えば、バナー広告調査を実施す
る対象のWebサイト名称、トップページのURL、調査
を開始する曜日・時刻・日付・調査時間間隔・調査日間
隔等の調査時間に関する情報、調査対象のページ範囲を
指定するトップページからの距離(調査レベル)、We
bサイトのホームページごとに事前に調査したバナー広
告の大きさ(縦横の画素数で指定)、ローテーションバ
ナー広告の判定をするか否か、などがある。動作制御パ
ラメータを設定する画面において、これらの動作制御パ
ラメータは、適宜の項目を必要に応じて複数指定するこ
とができる(2−3)。使用者がこれらの動作制御パラ
メータを指定した後、画面上に配置された動作制御パラ
メータ登録・保存用のボタンもしくはメニューをマウス
によるクリック等の適宜の操作により選択する(2−
4)。
【0018】つぎに、同ソフトウエアは、使用者が指定
した内容や書式等に問題はないかのチェックを行なう
(2−5)。ここで、指定した内容や書式に問題がある
とは、例えば、指定していない項目がある場合、入力フ
ォーマットエラーが生じている場合、バナー広告の大き
さのように数字で指定されるべき項目に文字が入ってい
る場合やその逆の場合、指定された数字そのものが想定
される範囲を超えている場合、その他指定された内容そ
のものに不備がある場合などを意味する。整合性チェッ
クの結果、指定された内容や書式等に問題があれば(2
−6)、ステップ2−3に戻り、使用者に指定内容の訂
正や再指定を促す。一方、整合性チェックの結果、問題
がなければ(2−6)、PCサーバ4内の動作制御パラ
メータファイル1−2に指定された動作制御パラメータ
を記憶する(2−7)。さらに、パーソナルコンピュー
タ2内のコンピュータメモリ上に動作制御パラメータフ
ァイル1−2bに指定された動作制御バラメータを保存
する(2−8)。なお、ステップ2−7及び2−8は、
いずれを先に実行しても、同時に実行してもよい。
【0019】(2)動作制御パラメータの読み込み機能
とソフトウエアの動作制御機能 図5に、動作制御パラメータの読み込み機能とソフトウ
エアの動作制御機能のフローチャートを示す。まず、動
作制御パラメータの読み込み機能では、ページ情報取得
ソフトウエア3により、読み込み機能が起動され(3−
1)、その後にPCサーバ4内に記録された動作制御パ
ラメータファイル1−2を読み込み(3−2)、同ソフ
トウエアが使用するパーソナルコンピュータ2内の動作
制御パラメータファイル1−2bに必要な動作制御パラ
メータデータを記録する(3−3)。動作制御パラメー
タは同ソフトウエアが終了するまで、パーソナルコンピ
ュータ2内の動作制御パラメータファイル1−2b上に
保持される。
【0020】つぎに、ソフトウエアの動作制御機能で
は、同ソフトウェアが起動された後、所定の時間間隔又
は予め定められたタイミングで、動作制御パラメータフ
ァイル1−2b上に保持された動作制御パラメータの中
から、調査開始日時、曜日、調査時間間隔等の調査時間
に関する情報を読み込み、調査を開始・終了するすべて
の日時を算出する(3−4)。つぎに、計算された日時
と、パーソナルコンピュータ2内に組み込まれたタイマ
ーを参照して得られた現在日時とを比較する(3−
5)。この比較結果が一致しなければ、調査を開始すべ
き時間ではないとして、ステップ3−5に戻る。一方、
比較結果が一致すれば、該当するWebサイトのトップ
ページのURLを、動作制御パラメータファイル1−2b
に記憶された動作制御パラメータから取得して、バナー
広告の調査を開始する(3−6)。
【0021】(3)ページ構造解析機能 図6に、ページ構造解析機能のフローチャートを示す。
ページ構造解析機能では、指定されたホームページ内に
おいて、トップページより順次、リンク先のページのUR
Lを取得し、URL、表示されたページのページタイトル、
トップページからの距離(調査レベル)等を含むデータ
を生成・記録することにより、ホームページ全体の構成
を階層構造として把握する。まず、調査開始時に初期処
理のひとつとして、PCサーバ4内の記録媒体上におい
て既知のバナー広告の情報を保持しているバナー広告マ
スタ1−1を、パーソナルコンピュータ2上のバナー広
告マスタ1−1bに登録する(4−1)。この処理は、
ページ構造の解析機能に直接は関係なく、次に説明する
ページ情報自動判定機能で使用するためのものであっ
て、ここでは省略することもできる。しかし、この段階
で行なうことにより、調査を連続的に実行する場合に最
新のバナー広告マスタ1−1の内容を使用することがで
きるという利点がある。
【0022】つぎに、パーソナルコンピュータ2は、調
査対象のWebサイトのトップページのURLをインター
ネットに対して発行し、当該Webサイトよりトップペ
ージのHTMLコードを取得する(4−2)。HTMLコー
ドの取得が成功したら、パーソナルコンピュータのディ
スプレイ上に、現在時刻、Webサイト名、トップペー
ジのURLなどを表示する。なお、ページ情報取得ソフト
ウエア3は、パーソナルコンピュータ2のディスプレイ
上にソフトウエアの動作状況や調査結果を使用者に知ら
せるための各種の情報を表示する機能を持っており、各
処理段階において逐次、必要と思われる情報を表示する
(図中、「M」印のマーク参照)。
【0023】つぎに、取得したHTMLコードの中から当該
ページのページタイトルを記述してある文字列を検索
し、当該ページのページタイトルを取得し(4−3)、
ディスプレーに表示する。当該ページのURL、ページタ
イトル、トップページからの距離(調査レベル)を含む
データをパーソナルコンピュータ2内のページ構造解析
ファイル1−4b及びPCサーバ4内のページタイトル
データ(1−4)に追加する(4−4)。続いて、HTML
コードを解析してバナー広告の自動判定処理を実行し調
査データを求めるが、これについては、(4)「ページ
情報自動判定機能」で説明する。
【0024】つぎに、先に取得したページの次の階層は
調査対象かどうかを、動作制御パラメータで定められた
調査レベルとクリック等の操作回数とを比較して判定す
る(4−6)。次の階層が調査対象でなければ、当該W
ebサイトの調査が終了したことを意味する。一方、次
の階層が調査対象の場合、現在取得しているHTMLコード
を解析して当該ページにリンクしている次階層のすべて
のページのURL取得する(4−7)。この処理は、例え
ば、HTMLコード中においてURLであることを示す記述の
文字列を検索し、なおかつトップページのURLと同一文
字列が含まれているかどうか、すなわちリンク先が当該
ホームページ内であるかどうかを判定して行なう。この
処理により、当該ホームページ以外のホームページへの
リンクを示すURLは除外される。
【0025】つぎに、パーソナルコンピュータ2は、取
得した次階層ページのURLを当該Webサイトに対して
発行し、当該ページのHTMLコードを取得し(4−8)、
前に説明したように、ステップ4−3(HTMLコード
を解析してページタイトルを取得)、ステップ4−4
(URLとページタイトル、トップページからの距離
(調査レベル)を含むデータを記録媒体上の適宜のペー
ジ構造解析ファイル1−4b及びPCサーバ4内のペー
ジタイトルデータ(1−4)に出力)、及び、ステップ
4−5(バナー広告自動判定機能)の各処理を行なう。
ステップ4−7で取得した次階層ページの処理がすべて
終了したかどうかを判定し(4−9)、終了していなけ
ればステップ4−8からの処理を繰り返す。すべてのペ
ージの処理が終了したらステップ4−6に戻り、さらに
次の階層は調査対象かどうかを判定する。
【0026】以上の一連の動作を繰り返すことにより当
該Webサイトのホームページのページ階層構造を把握
し、各ページURLとページ階層を示す調査レベルとを
含むページ構造解析ファイル1−4b及びPCサーバ4
内のページタイトルデータ(1−4)が作成される。な
お、動作制御パラメータファイル1−2bにより調査レ
ベルが指定されていなければ、ステップ4−6の判定に
おいてステップ4−7に移行し、ステップ4−7におい
て次階層ページのURLの取得処理で、取得すべきURLの数
がゼロになるまでこの一連の動作を繰り返すことによ
り、当該ホームページのすべてのページの解析を行な
い、全体の階層構造を把握することができる。
【0027】(4)ページ情報自動判定機能 図7に、ページ情報自動判定機能のフローチャートを示
す。この機能では、各ページ上に挿入された多数の画像
データの中から、所定の大きさの画像データを自動的に
バナー広告と判定して抜き出し、当該バナー広告の画像
サンプリングデータと、既知のバナー広告に対して蓄積
した画像サンプリングデータとを比較して照合するとと
もに、その結果をパーソナルコンピュータ2の調査デー
タファイル1−3bに記録する。以下の説明は、一例と
してホームページ内のある特定のページにおけるページ
情報(バナー広告)自動判定処理である。まず、ページ
階層構造ファイル1−4bに記憶されたURL、ページタ
イトル、調査レベルを含むデータに基づき、当該ページ
のHTMLコードを再取得もしくは解析して、画像ファイル
名を取得する(5−1)。画像ファイル名は、例えば、
「・・・.gif」や「・・・.bmp」等の識別子から判断す
ることができる。HTMLコードを再取得するのは、例えば
ローテーションバナー広告の場合、HTMLコードを取得す
る都度、バナー広告の画像ファイル名が変化するからで
あり、本システムはそのすべてを調査するために、繰り
返しHTMLコードの再取得を行なう。ここで、すべての画
像ファイルの取得が終了していれば、当該ページのペー
ジ情報自動判定処理は終了したと判断する(5−2)。
【0028】ステップ5−1で画像ファイル名を取得す
ることができれば、ローテーションバナー広告を調査対
象とするか否かの判定を、動作制御パラメータファイル
1−2bに記憶された「ローテーションバナー広告判定
の有無」の情報に基づき行なう。ローテーションバナー
広告を調査対象として処理する場合、ブラウザ上の同一
位置のバナー広告に対して繰り返しURLを発行してHTML
コードを取得し、画像ファイル名の一致・不一致を確認
することにより行なう(5−4)。画像ファイル名が既
に取得済みのものと一致した場合、即ち、ローテーショ
ンが一巡して同一ファイル名になれば、当該位置のバナ
ー広告の判定処理は終了し、次の画像ファイルの処理を
行なうべくステップ5−1に移行する。画像ファイル名
が既に取得済みのものと不一致の場合、即ち、画像ファ
イル名が新しいものであれば、以下の処理(ステップ5
−5)に進む。なお、ここでは、処理している画像ファ
イルがバナー広告そのものであるかどうかの判定処理
(以下のステップ5−7、5−8参照)は、必要としな
い。
【0029】つぎに、今回調査対象とされるトップペー
ジより開始した一連の調査の中で、取得された画像ファ
イル名が、既に処理済みのものと同一の画像ファイル名
が存在しなかったどうか判定する(5−5)。この処理
は、複数のページがリンクされる場合、同一の画像ファ
イルが異なるページで用いられる場合も想定されるの
で、既に判定したバナー広告の処理を省略し、バナー広
告調査を高速化するためである。同一画像ファイル名の
処理を行なっていれば、以下のバナー広告判定のための
一連の処理は行なわず、ステップ5−12のバナー広告
データ作成処理に進む。なお、この高速化のための処理
は、トップページより開始する同一調査の中において同
一画像ファイル名は同一の画像データを有することを前
提にしている。厳密には調査の途中で当該Webサイト
やバナー広告の提供サイト側で同一画像ファイル名に対
して異なる画像データをセットする可能性も考えられる
ため、調査の厳密性を要求された場合のことを考慮し
て、この処理は選択機能としてはずすことができる。
【0030】以上の画像ファイル名のみによる判定可能
な処理を終了した後、パーソナルコンピュータ2は、実
際に当該画像ファイル名をインターネット上に発行して
当該画像ファイルを保持しているWebサイトより画像
データを取得する(5−6)。取得した画像データよ
り、画像のサイズを縦横の画素数等で取得する(5−
7)。取得した画像サイズを、動作制御パラメータ1−
2b上の動作制御パラメータに保持されている当該We
bサイトにおけるバナー広告のサイズ(複数指定)と比
較し、一致しているかどうか判定する(5−8)。一致
の判定条件としては、例えば、縦横の画素数の完全な一
致、所定の誤差範囲での縦横サイズの一致、所定の誤差
範囲における縦横比による一致などがある。なお、ここ
では、画像のサイズ、縦横比等により判定しているが、
これに限らず、画像の位置、形状、色等適宜の要素を用
いることができ、それに応じて、ステップ5−7で取得
されるデータが選択される。ステップ5−8の判定結果
により、一致していなければバナー広告ではないと判断
してステップ5−1の処理に戻り次の画像ファイル名に
ついての処理を行なう。一方、一致していれば当該画像
データをバナー広告であると判定する。
【0031】つぎに、バナー広告と判定された画像デー
タより、画像のサンプリングデータを作成する(5−
9)。画像サンプリングデータは、例えば、画像データ
のファイルサイズ、画像データのファイルヘッダー中に
予め記述されている各種データ、画像データファイルの
構成要素であるバイナリデータの一定間隔の値、これら
の算術的処理により計算された数値、これらの平均・分
散・標準偏差等の統計的処理により計算された数値等、
適宜の方法により形成することができる。取得した画像
データが、既知のものであるかどうか判定するために、
当該画像データの画像サンプリングデータと、ステップ
4−1等の処理で得られたパーソナルコンピュータ2の
バナー広告マスタ1−1b中の画像サンプリングデータ
とを順次比較する(5−10)。バナー広告マスタ1−
1b中のすべての画像サンプリングデータと比較して、
一致するものが無ければ、さらに、PCサーバ4の既知
のバナー広告マスタ1−1の画像サンプリングデータと
比較する(5−11)。これは複数のパーソナルコンピ
ュータ2で同時に処理する場合、当該パーソナルコンピ
ュータ2は既知ではなくても、他のパーソナルコンピュ
ータ2にとっては既知である場合があるので、システム
全体としてみた場合の既知かどうか判定するための処理
である。なお、各パーソナルコンピュータ2とPCサー
バ4とは、コンピュータネットワーク1を介して、適宜
のタイミングで各ファイル等の情報を授受することがで
きる。
【0032】ステップ5−10及び5−11の処理過程
で、画像サンプリングデータが一致するものがあれば、
バナー広告マスタ1−1又は1−1bから、当該画像サ
ンプリングデータに対応するバナー広告コードを取得す
る(5−12)。つぎに、パーソナルコンピュータ2又
はPCサーバ4から、調査実施日、調査実施時刻、当該
バナー広告のページ上の位置(バナー位置)などに関す
る情報を取得する(5−13)。これらの情報と、当該
Webサイト名、当該ページURL、バナーコード(及び
/又は、仮のバナーコード)等を合わせて、調査データ
を作成してPCサーバ4内の調査データファイル1−3
に追加する。同時に調査結果をパーソナルコンピュータ
2のディスプレイ上に表示する(5−14)。なお、調
査データファイルを、パーソナルコンピュータ2内に設
け、そこに又はPCサーバ4と両方に調査データを記録
するようにしても良い。
【0033】ステップ5−10及び5−11の処理で、
画像サンプリングデータが一致するものがなければ、既
知のバナー広告ではないため所定のルールで仮のバナー
広告コードを生成する(5−15)。なお、仮のバナー
広告コードは、例えば、最初又は最後又は特定の位置の
文字・数字等を変えて通常のバナー広告コードと異なる
ようにしたり、フラグを立てたり、また、記憶エリアを
異なるようにする等の手法で適宜生成することができ
る。PCサーバ4の既知のバナー広告マスタ1−1及び
パーソナルコンピュータ2のバナー広告マスタ1−1b
に、この仮のバナー広告コードと画像サンプリングデー
タを追加し(5−16、5−17)、さらに、PCサー
バ4のバナー広告画像データファイル1−5に、画像デ
ータと仮のバナー広告コードを記録する(5−18)。
これは、後に未知のバナー広告の内容を実際に確認する
場合に使用するためである。つぎに、仮のバナー広告コ
ードを使用して、上述のステップ5−13及び5−14
のように、調査データの作成・登録処理を行なう。仮の
バナーコードに対応する画像データについては、使用者
が直接確認する方法や、他のサーバ等が記憶している他
のバナー広告マスタを利用して自動判定を行う方法等が
ある。
【0034】以上の処理によって当該ページ上より事前
に指定した条件に合致するすべてのバナー広告を取得
し、調査データを作成・記録・表示・することができ
る。
【0035】図8に、動作制御パラメータ登録画面の説
明図を示す。図示のように、この登録画面では、使用者
は、調査サイト名称、調査URL、調査レベル、調査日
間隔、調査開始日、調査時間間隔、調査開始時刻等の調
査条件を複数指定することができる。入力後、「登録」
ボタンをクリックすることにより、動作制御パラメータ
が登録される。
【0036】図9に、動作状況モニター画面の説明図を
示す。この画面は、主にパーソナルコンピュータ2上の
画面である。この画面は、上述のように、適宜のタイミ
ングで表示される。
【0037】画面中、「調査中」であるか、「待機中」
であるか表示される。時間情報として、現在時刻、調査
開始時刻、累積調査時間等を指定することができる。調
査条件は、動作制御パラメータ登録画面で指定された内
容が表示される。現在の調査実績は、各ファイルより、
調査サイト名称、調査ページURL、終了ページ数、取
得バナー広告数、調査開始時刻、バナー広告コード、バ
ナー広告内容、調査時間、バナー広告画像等が表示され
る。さらに、累積調査実績として、累積調査サイト数、
累積調査ページ数、累積取得バナー広告数等が表示され
る。これらの累積値は、調査実行時に適宜カウントする
ことにより求めることができる。また、「動作制御パラ
メータ設定」ボタンをクリックすることで、図8の動作
制御パラメータ登録画面を表示することができる。な
お、本発明のページ情報取得方法は、ページ情報取得プ
ログラム記録した記録媒体により提供されることができ
る。
【0038】
【発明の効果】本発明によると、膨大なページ上の広告
の確認及び調査を完全に自動化し、人的労力の介入を排
除して広告調査データを作成することができる。さら
に、本発明は、広告に関する調査データに限らず、特に
画像に関する所望のページ情報を確認及び調査を自動化
してページ情報調査データを作成するページ情報取得方
法を提供することができる。
【図面の簡単な説明】
【図1】本発明のページ情報取得システムの構成図。
【図2】PCサーバのファイルの説明図。
【図3】本発明に係るページ情報取得方法に関して、調
査データを作成するための全体的なフローチャート。
【図4】動作制御パラメータの作成・保存機能のフロー
チャート。
【図5】動作制御パラメータの読み込み機能とソフトウ
エアの動作制御機能のフローチャート。
【図6】ページ構造解析機能のフローチャート。
【図7】ページ情報自動判定機能のフローチャート。
【図8】動作制御パラメータ登録画面の説明図。
【図9】動作状況モニター画面の説明図。
【符号の説明】 1 コンピュータネットワーク 2 パーソナルコンピュータ 3 ページ情報取得ソフトウエア 4 PCサーバ
フロントページの続き Fターム(参考) 5B075 ND06 ND20 ND36 PP03 PP13 PQ02 5B082 EA07 GC04 5B089 GB03 GB04 HA10 JA22 JA36 JB02 JB03 KA04 KC47 KC59

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】ページを取得するステップと、 取得されたページのコード情報を解析することにより各
    ぺージ上に挿入された画像データを取得するステップ
    と、 予め指定されたサイズ、形状、縦横比又は位置のいずれ
    か又は複数に基づいて、取得された画像データが指定画
    像データであるかを判定するステップと、 取得された画像データについて画像サンプリングデータ
    を作成するステップと、 作成された画像サンプリングデータと、予め記憶された
    既知の画像サンプリングデータとを照合するステップ
    と、 照合結果に基づき、取得された画像データの識別情報、
    調査対象の上位ページの指定情報、取得された該当ペー
    ジの指定情報、調査時間に関する情報を含む調査データ
    を作成するステップとを備えたページ情報取得方法。
  2. 【請求項2】前記照合するステップにおいて、 既知の画像サンプリングデータと一致しないとき、取得
    された画像データに対して仮の識別情報を付与して調査
    データを作成するステップをさらに備えた請求項1に記
    載のページ情報取得方法。
  3. 【請求項3】動作制御パラメータにより指定された上位
    ページを取得し、取得した上位ページのコード情報の解
    析によりリンクする他のページを取得し、取得した各ペ
    ージを指定する情報により当該上位ページのページ構造
    を得るためのページ構造解析ステップをさらに備えた請
    求項1又は2に記載のページ情報取得方法。
  4. 【請求項4】同一位置で画像ファイル名が異なる複数の
    画像データがあるか否かを判断し、同一位置におけるひ
    とつ又は複数の画像データを取得することにより、ロー
    テーション画像データを処理するステップをさらに備え
    た請求項1乃至3のいずれかに記載のページ情報取得方
    法。
  5. 【請求項5】前記動作制御パラメータは、サイト名称又
    は調査トップページを指定する情報、調査時間に関する
    情報、トップページからの距離を示す調査レベルを含む
    ことを特徴とする請求項1乃至4のいずれかに記載のペ
    ージ情報取得方法。
  6. 【請求項6】動作制御パラメータによる調査時間に関す
    る情報に基づき、調査を開始するためのステップをさら
    に備えた請求項1乃至5のいずれかに記載のページ情報
    取得方法。
JP2000000458A 2000-01-05 2000-01-05 ページ情報取得方法 Pending JP2001188703A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000000458A JP2001188703A (ja) 2000-01-05 2000-01-05 ページ情報取得方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000000458A JP2001188703A (ja) 2000-01-05 2000-01-05 ページ情報取得方法

Publications (1)

Publication Number Publication Date
JP2001188703A true JP2001188703A (ja) 2001-07-10

Family

ID=18529808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000000458A Pending JP2001188703A (ja) 2000-01-05 2000-01-05 ページ情報取得方法

Country Status (1)

Country Link
JP (1) JP2001188703A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010152893A (ja) * 2008-12-11 2010-07-08 Accenture Global Services Gmbh オンライン広告検出および広告キャンペーン分析
US9332363B2 (en) 2011-12-30 2016-05-03 The Nielsen Company (Us), Llc System and method for determining meter presence utilizing ambient fingerprints
US9489640B2 (en) 2006-07-12 2016-11-08 The Nielsen Company (Us), Llc Methods and systems for compliance confirmation and incentives
US9940631B2 (en) 2009-03-03 2018-04-10 Accenture Global Services Limited Online content collection
US9947017B2 (en) 2009-03-03 2018-04-17 Accenture Global Services Limited Online content campaign classification

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9489640B2 (en) 2006-07-12 2016-11-08 The Nielsen Company (Us), Llc Methods and systems for compliance confirmation and incentives
US10387618B2 (en) 2006-07-12 2019-08-20 The Nielsen Company (Us), Llc Methods and systems for compliance confirmation and incentives
US11741431B2 (en) 2006-07-12 2023-08-29 The Nielsen Company (Us), Llc Methods and systems for compliance confirmation and incentives
JP2010152893A (ja) * 2008-12-11 2010-07-08 Accenture Global Services Gmbh オンライン広告検出および広告キャンペーン分析
US9842339B2 (en) 2008-12-11 2017-12-12 Accenture Global Services Limited Online ad detection and ad campaign analysis
US10891632B2 (en) 2008-12-11 2021-01-12 Accenture Global Services Limited Online ad detection and ad campaign analysis
US9940631B2 (en) 2009-03-03 2018-04-10 Accenture Global Services Limited Online content collection
US9947017B2 (en) 2009-03-03 2018-04-17 Accenture Global Services Limited Online content campaign classification
US9332363B2 (en) 2011-12-30 2016-05-03 The Nielsen Company (Us), Llc System and method for determining meter presence utilizing ambient fingerprints

Similar Documents

Publication Publication Date Title
US7185272B2 (en) Method for automatically filling in web forms
JP4620938B2 (ja) ウェブサイトトラヒック追跡プログラムを設定するブラウザの使用方法
US6484149B1 (en) Systems and methods for viewing product information, and methods for generating web pages
RU2427912C2 (ru) Система для визуального отображения и управления информацией на web-странице с использованием индикатора
US6981224B1 (en) System and method for conditionally associating a plurality of enabled images with a predetermined image
US6917961B2 (en) Evolving interactive dialog box for an internet web page
US20030154442A1 (en) Visualization tool for web analytics
US20100114691A1 (en) Managing a marketing template used in an e-mail marketing campaign
WO2007113573A2 (en) Automated measuring of interaction with user interfaces
JP2001306587A (ja) 情報検索装置、情報検索方法、及び記憶媒体
US20040103027A1 (en) Advertisement distributing server system, and advertise distributing method
US6959424B1 (en) System and method for displaying an enabled image associated with a predetermined image in an iframe of a visual display
EP2113878A1 (en) Method and system for providing contents
JP2003067226A (ja) ファイル管理システム及びプログラム
JP2000207412A (ja) 情報検索システム
KR20000037283A (ko) 자동검색 프로그램을 이용한 인터넷 웹페이지에서 타웹페이지 미리보기 시스템
KR100542294B1 (ko) 인터넷 광고 방법 및 시스템
JP2001188703A (ja) ページ情報取得方法
JPH11219242A (ja) ページ生成方法
CN108205540A (zh) 信息浏览的方法、装置和系统
TW200910186A (en) Information processing apparataus, method, and program
CA2663484A1 (en) Method and system for providing content
JP2003187145A (ja) ウェブ広告表示方式
KR100402642B1 (ko) 인터넷 검색엔진의 검색결과를 표시하는 방법
CN100416464C (zh) 信息处理设备和信息处理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090929

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100223