JP2013228811A - Web閲覧履歴取得装置及びプログラム - Google Patents

Web閲覧履歴取得装置及びプログラム Download PDF

Info

Publication number
JP2013228811A
JP2013228811A JP2012099114A JP2012099114A JP2013228811A JP 2013228811 A JP2013228811 A JP 2013228811A JP 2012099114 A JP2012099114 A JP 2012099114A JP 2012099114 A JP2012099114 A JP 2012099114A JP 2013228811 A JP2013228811 A JP 2013228811A
Authority
JP
Japan
Prior art keywords
display content
web
display
browsing history
change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012099114A
Other languages
English (en)
Other versions
JP5670377B2 (ja
Inventor
Akimichi Tanaka
明通 田中
Masakatsu Aoki
政勝 青木
Masahiro Yuguchi
昌宏 湯口
Masashi Uchiyama
匡 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012099114A priority Critical patent/JP5670377B2/ja
Publication of JP2013228811A publication Critical patent/JP2013228811A/ja
Application granted granted Critical
Publication of JP5670377B2 publication Critical patent/JP5670377B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

【課題】ユーザの操作によって表示内容の一部が変化し、表示内容全体が新しいページに遷移することがない場合でも、閲覧されたWebページの表示内容を取得する。
【解決手段】表示内容変化検出部12が、Webブラウザ40が保持するドキュメントツリー44に変化があった場合に変化検出イベントを出力し、ユーザ操作検出部14が、入力装置から何らかの入力が検出された場合にユーザ操作検出イベントを出力し、表示完了イベント取得部16が、Webブラウザ40から出力される表示完了イベントを取得して出力し、表示内容取得判定部18が、ユーザがWebブラウザ40に対して操作を行ったことにより表示内容が変化した際、及び表示完了イベントを取得した際に、表示内容取得部20が、表示内容取得判定部18からの通知を受けて、ドキュメントツリー44からWebブラウザ40に表示されたWebページの表示内容を取得する。
【選択図】図1

Description

本発明は、ユーザが閲覧したWebページの表示内容を取得するWeb閲覧履歴取得装置及びプログラムに関する。
ユーザが閲覧したWebページの表示内容を取得するシステムとして、例えば、Webページ全体が新たなページに遷移して、その内容の表示が完了したときにWebブラウザから出力された表示完了イベントを検出し、表示完了イベントが検出されたときにWebブラウザが表示している内容を取得する方法が提案されている。(例えば、特許文献1参照)。
特開2011−90384号公報
しかしながら、Webページの中には、Javascript(登録商標)の実行によって表示内容が変化するものが多数存在する。例えば、EC(電子商取引:Electronic commerce)サイトのWebページでは、ユーザが商品を選択することにより、図10(a)に示すような商品詳細ページが表示される。この商品詳細ページにおいて、ユーザにより、商品のカラーやサイズ等の選択がなされ、その後に「ショッピングバッグに入れる」がクリックされると、選択した商品をショッピングバッグに入れる操作が行われると同時に、同図(b)に示すように、例えば画面右上等にショッピングバッグの内容が表示される。これら一連の動作は、Javascript(登録商標)の実行によって行われ、変化する部分はWebページの一部であり、Webページ全体が新たなページに遷移することはない。このため、特許文献1に記載の方法では、ユーザの操作によって、Webページの一部が変化した場合に、Webページの閲覧履歴を取得することができない、という問題があった。上記の例では、商品をショッピングバッグに入れるという操作や、ショッピングバッグの内容という重要な情報が取得されないことになる。
本発明は上記事情に鑑みて成されたものであり、ユーザの操作によって表示内容の一部が変化し、表示内容全体が新しいページに遷移することがない場合でも、閲覧されたWebページの表示内容を取得することができるWeb閲覧履歴取得装置及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明のWeb閲覧履歴取得装置は、WebブラウザがWebサーバより取得したHTMLコンテンツを、画面表示用にツリー上に展開したドキュメントツリーの変化に基づいて、前記Webブラウザに表示されたWebページの表示内容の変化を検出する表示内容変化検出手段と、前記Webブラウザに対するユーザの操作を検出するユーザ操作検出手段と、Webページの表示が完了したか否かを前記Webブラウザから検出する表示完了検出手段と、前記ユーザ操作検出手段により前記ユーザの操作が検出されると共に、前記表示内容変化検出手段により前記表示内容の変化が検出された際、及び前記表示完了検出手段により前記Webページの表示が完了したことが検出された際に、前記表示内容を取得すると判定する表示内容取得判定手段と、前記表示内容取得判定手段により前記表示内容を取得すると判定された際に、前記ドキュメントツリーから前記表示内容を取得する表示内容取得手段と、前記表示内容取得手段により取得された表示内容を示すHTMLファイル、及びWebページの表示日時を含むメタデータをWeb閲覧履歴として取得するWeb閲覧履歴取得手段と、を含んで構成されている。
本発明のWeb閲覧履歴取得装置によれば、Webブラウザにおいて、Webサーバより取得したHTMLコンテンツを、画面表示用にツリー上に展開したドキュメントツリーを保持している。表示内容変化検出手段が、このドキュメントツリーの変化に基づいて、Webブラウザに表示されたWebページの表示内容の変化を検出し、また、ユーザ操作検出手段が、Webブラウザに対するユーザの操作を検出する。そして、表示内容取得判定手段が、ユーザ操作検出手段によりユーザの操作が検出されると共に、表示内容変化検出手段により表示内容の変化が検出された際、及び表示完了検出手段によりWebページの表示が完了したことが検出された際に、表示内容を取得すると判定し、表示内容取得手段が、表示内容取得判定手段により表示内容を取得すると判定された際に、ドキュメントツリーから表示内容を取得する。そして、Web閲覧履歴取得手段が、表示内容取得手段により取得された表示内容を示すHTMLファイル、及びWebページの表示日時を含むメタデータをWeb閲覧履歴として取得する。
このように、ドキュメントツリーの変化に基づいてWebブラウザに表示されたWebページの表示内容の変化を検出し、ユーザの操作と共にこの表示内容の変化が検出された場合に、ドキュメントツリーから表示内容を取得するため、ユーザの操作によって表示内容の一部が変化し、表示内容全体が新しいページに遷移することがない場合でも、閲覧されたWebページの表示内容を取得することができる。
また、本発明のWeb閲覧履歴取得装置は、Webページの遷移を検出するWebページ遷移検出手段を含んで構成することができ、前記表示内容取得判定手段は、前記Webページ遷移検出手段により前記Webページの遷移が検出された際に、前記表示内容を取得すると判定することができる。これにより、ページ遷移が検出されたタイミングで表示内容を取得することができる。
また、前記表示内容変化検出手段は、前記ドキュメントツリーにおけるノードの追加を検出するノード追加検出手段と、前記ドキュメントツリーにおけるノードの削除を検出するノード削除検出手段と、前記ドキュメントツリーにおけるノードの属性の変更を検出するノード属性変更検出手段と、所定時間内の前記ノード追加検出手段、前記ノード削除検出手段、及び前記ノード属性変更検出手段の少なくとも1つの手段による複数の検出を、1回の検出として統合する検出統合手段と、を含んで構成することができる。これにより、表示内容の変化を検出し過ぎて処理が重くなることを防ぐことができる。
また、前記ユーザ操作検出手段は、ユーザによる前記Webブラウザに対するクリック操作を検出するクリック検出手段と、前記クリック検出手段により検出されたクリック操作に対応するタグが予め設定された取得対象タグの場合に、前記Webブラウザに対するユーザの操作として、前記取得対象タグが示す操作内容が行われたと判定するユーザ操作判定手段と、を含んで構成することができる。これにより、表示内容の変化につながる可能性が高いクリックのみをユーザの操作として検出することができるため、多数のユーザ操作を検出し過ぎて処理が重くなることを防ぐことができる。
また、本発明のWeb閲覧履歴取得プログラムは、コンピュータを、上記のWeb閲覧履歴取得装置を構成する各手段として機能させるためのプログラムである。
以上説明したように、本発明のWeb閲覧履歴取得装置及びプログラムによれば、ドキュメントツリーの変化に基づいてWebブラウザに表示されたWebページの表示内容の変化を検出し、ユーザの操作と共にこの表示内容の変化が検出された場合に、ドキュメントツリーから表示内容を取得するため、ユーザの操作によって表示内容の一部が変化し、表示内容全体が新しいページに遷移することがない場合でも、閲覧されたWebページの表示内容を取得することができる、という効果が得られる。
第1の実施の形態に係るWeb閲覧履歴取得装置の機能的構成を示すブロック図である。 HTMLコンテンツの一例を示す概略図である。 ドキュメントツリーの一例を示す概略図である。 閲覧履歴記憶部に保存されるWeb閲覧履歴の一例を示す概略図である。 第1の実施の形態におけるWeb閲覧履歴取得処理ルーチンの内容を示すフローチャートである。 第2の実施の形態に係るWeb閲覧履歴取得装置の機能的構成を示すブロック図である。 第2の実施の形態におけるWeb閲覧履歴取得処理ルーチンの内容を示すフローチャートである。 第3の実施の形態における表示内容変化検出部の機能的構成を示すブロック図である。 第4の実施の形態におけるユーザ操作検出部の機能的構成を示すブロック図である。 従来の問題点を説明するためのイメージ図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
第1の実施の形態に係るWeb閲覧履歴取得装置10は、図1に示すように、ユーザが利用するパーソナルコンピュータや携帯端末等の利用者端末に搭載されたWebブラウザ40の拡張機能として動作する。
Webブラウザ40は、ユーザがWebブラウザ40でWebページを閲覧する際に、Webサーバ50からWebブラウザ40に表示するWebページを示すHTMLコンテンツ42を取得し、取得したHTMLコンテンツ42を、画面上に表示するためにドキュメントツリー44に展開して保持している。図2にHTMLコンテンツ42の一例を、図3に図2のHTMLコンテンツ42をドキュメントツリー44に展開した一例を示す。
ドキュメントツリー44は、トップノード、HTMLコンテンツ42のタグに対応する要素ノード、HTMLコンテンツ42中のテキストに対応するテキストノード、HTMLコンテンツ42中の属性に対応する属性ノードから構成される。例えば、
<a href=“http://www.xxx.co.jp/”>xxx社</a>
というHTMLコンテンツ42中の記述に対応して
・<a>の要素ノード
・「xxx社」のテキストノード
・属性名:href、属性値:http://www.xxx.co.jp/ の属性ノード
のドキュメントツリーが構成される。
Web閲覧履歴取得装置10は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述するWeb閲覧履歴取得処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成することができ、これらは上述の利用者端末が備えるCPU、RAM、及びROMを利用することができる。
このコンピュータは、機能的には、図1に示すように、表示内容変化検出部12と、ユーザ操作検出部14と、表示完了イベント取得部16と、表示内容取得判定部18と、表示内容取得部20と、Web閲覧履歴取得部22とを含んだ構成で表すことができる。なお、表示完了イベント取得部16は、本発明の表示完了検出手段の一例である。
表示内容変化検出部12は、Webブラウザ40が保持するドキュメントツリー44を監視し、ドキュメントツリー44に変化があった場合に、Webブラウザ40に表示されたWebページの表示内容の変化を検出したことを示す変化検出イベントを、表示内容取得判定部18へ出力する。
ユーザ操作検出部14は、マウスやキーボード等の入力装置による入力を監視し、入力装置から何らかの入力が検出された場合に、Webブラウザ40に対するユーザの操作が検出されたことを示すユーザ操作検出イベントを、表示内容取得判定部18へ出力する。
表示完了イベント取得部16は、Webブラウザ40によるドキュメントツリー44に基づくWebページの表示が完了した際に、Webブラウザ40から出力される表示完了イベントを取得し、取得した表示完了イベントを、表示内容取得判定部18へ出力する。
表示内容取得判定部18は、表示内容変化検出部12から出力された変化検出イベントと、ユーザ操作検出部14から出力されたユーザ操作検出イベントとに基づいて、Webブラウザ40に対するユーザの操作が検出されると共に、Webブラウザ40に表示されているWebページの表示内容の変化が検出された際に、表示内容取得部20に対して表示内容を取得するよう通知する。すなわち、ユーザがWebブラウザ40に対して操作を行ったことにより表示内容が変化したタイミングを、表示内容を取得するタイミングとする。
また、表示内容取得判定部18は、表示完了イベント取得部16から表示完了イベントが出力された際にも、表示内容取得部20に対して、表示内容を取得するよう通知する。この場合は、特許文献1等の従来技術と同様に、画面表示全体(ページ全体)が変化したタイミングを、表示内容を取得するタイミングとする。
表示内容取得部20は、表示内容取得判定部18からの通知を受けると、ドキュメントツリー44からWebブラウザ40に表示されたWebページの表示内容を、HTMLの形式で取得する。
Web閲覧履歴取得部22は、表示内容取得部20により取得した表示内容を示すHTMLに、Webページの表示日時、WebページのURL等のメタデータを付与して、Web閲覧履歴として、閲覧履歴記憶部30に保存する。閲覧履歴記憶部30は、例えば、メタデータ記憶部30aとHTML記憶部30bとで構成することができる。この場合、メタデータ記憶部30aには、図4に示すように、付与したメタデータ(ここでは、表示日時及びURL)と、表示内容取得部20により取得されたHTMLファイルのファイル名とが対応付けられたデータが保存される。また、HTML記憶部30bには、メタデータ記憶部30aに保存されたデータのHTMLファイル名と対応付けて、各HTMLファイルが保存される。
次に、本実施の形態のWeb閲覧履歴取得装置10の作用について説明する。利用者端末においてWebブラウザ40が起動されると、Webブラウザ40において、Webサーバ50からWebブラウザ40に表示するWebページを示すHTMLコンテンツ42を取得し、取得したHTMLコンテンツ42を、画面上に表示するためにドキュメントツリー44に展開して保持する。そして、Web閲覧履歴取得装置10において、図5に示すWeb閲覧履歴取得処理が実行される。
ステップ100で、ユーザ操作検出部14が、マウスやキーボード等の入力装置による入力を監視し、Webブラウザ40に対するユーザの操作が検出されたか否かを判定する。ユーザの操作が検出された場合には、ユーザ操作検出イベントを表示内容取得判定部18へ出力して、ステップ102へ移行する。一方、ユーザの操作が検出されない場合には、ステップ104へ移行する。
ステップ102では、表示内容変化検出部12が、Webブラウザ40が保持するドキュメントツリー44を監視し、表示内容の変化が検出されたか否かを判定する。表示内容の変化が検出された場合には、変化検出イベントを表示内容取得判定部18へ出力して、ステップ106へ移行する。一方、表示内容の変化が検出されない場合には、ステップ104へ移行する。
ステップ104では、表示完了イベント取得部16が、Webブラウザ40によるドキュメントツリー44に基づくWebページの表示が完了した際に、Webブラウザ40から出力される表示完了イベントを取得したか否かを判定する。表示完了イベントを取得した場合には、取得した表示完了イベントを表示内容取得判定部18へ出力して、ステップ106へ移行する。一方、表示完了イベントを取得していない場合には、ステップ112へ移行する。
ステップ106では、表示内容取得判定部18が、上記ステップ100及び102で肯定判定されて本ステップへ移行した場合には、ユーザがWebブラウザ40に対して操作を行ったことにより表示内容が変化したと判定して、表示内容取得部20に対して、表示内容を取得するよう通知する。また、上記ステップ104で肯定判定されて本ステップへ移行した場合には、画面表示全体(ページ全体)が変化したと判定して、表示内容取得部20に対して、同様に通知する。
次に、ステップ108で、表示内容取得部20が、上記ステップ106で表示内容取得判定部18から出された通知を受けて、ドキュメントツリー44からWebブラウザ40に表示されたWebページの表示内容を、HTMLの形式で取得する。
次に、ステップ110で、Web閲覧履歴取得部22が、上記ステップ108で取得した表示内容を示すHTMLファイルに、Webページの表示日時、WebページのURL等のメタデータを付与して、Web閲覧履歴として、閲覧履歴記憶部30に保存する。
次に、ステップ112で、Webブラウザ40が終了したか否かを判定し、Webブラウザ40が終了していない場合には、ステップ100へ戻って、ステップ100〜110の処理を繰り返し、Webブラウザ40が終了した場合には、Web閲覧履歴取得処理を終了する。
以上説明したように、第1の実施の形態に係るWeb閲覧履歴取得装置によれば、Webブラウザからの表示完了イベントを取得した場合に加えて、ドキュメントツリーに基づいてWebブラウザに表示されたWebページの表示内容の変化を検出し、ユーザの操作と共にこの表示内容の変化が検出された場合にも、ドキュメントツリーから表示内容を取得するため、ユーザの操作によって表示内容の一部が変化し、表示内容全体が新しいページに遷移することがない場合でも、閲覧されたWebページの表示内容を取得することができる。
また、ユーザの操作の検出のみでは、表示内容の変化を伴わないような特に意味のないマウスクリック等が多数検出される可能性がある。また、ユーザが何も操作しなくても表示内容が自動的に変化し続けるWebページも存在するため、表示内容の変化の検出のみでも、特に意味のない表示内容が取得される可能性がある。本実施の形態のWeb閲覧履歴取得装置のように、ユーザがWebブラウザに対して操作を行ったことにより表示内容が変化したタイミングで表示内容を取得することにより、意味のあるタイミングで表示内容の取得を行うことができるため、不要な表示内容の取得を削減し、処理が重くなり過ぎることを防ぐことができる。
次に、第2の実施の形態について説明する。なお、第2の実施の形態に係るWeb閲覧履歴取得装置について、第1の実施の形態に係るWeb閲覧履歴取得装置10の構成と同一の構成については、同一符号を付して詳細な説明を省略する。
第2の実施の形態に係るWeb閲覧履歴取得装置210を構成するコンピュータは、機能的には、図6に示すように、表示内容変化検出部12と、ユーザ操作検出部14と、表示完了イベント取得部16と、Webページ遷移検出部24と、表示内容取得判定部218と、表示内容取得部20と、Web閲覧履歴取得部22とを含んだ構成で表すことができる。
Webページ遷移検出部24は、Webブラウザ40に表示されたWebページ内のリンクがクリックされた際にWebブラウザ40から出力されたページ遷移イベントを検出し、表示内容取得判定部218へ出力する。
表示内容取得判定部218は、表示内容変化検出部12、ユーザ操作検出部14、及び表示完了イベント取得部16からの出力に基づいて判定される取得タイミングに加えて、Webページ遷移検出部24から出力されたページ遷移イベントを取得した際にも、表示内容取得部20に対して表示内容を取得するよう通知する。
次に、図7を参照して、第2の実施の形態におけるWeb閲覧履歴取得処理について説明する。なお、第1の実施の形態におけるWeb閲覧履歴取得処理と同一の処理については、同一符号を付して詳細な説明を省略する。
ステップ104で否定判定されると、ステップ114へ移行し、Webページ遷移検出部24が、Webブラウザ40に表示されたWebページ内のリンクがクリックされた際にWebブラウザ40から出力されたページ遷移イベントを検出したか否かを判定する。ページ遷移イベントを検出した場合には、検出したページ遷移イベントを表示内容取得判定部218へ出力して、ステップ106へ移行する。一方、ページ遷移イベントを検出していない場合には、ステップ112へ移行する。
以上説明したように、第2の実施の形態に係るWeb閲覧履歴取得装置によれば、Webページの遷移が検出された際も表示内容の取得タイミングとして判定されるため、より詳細なWeb閲覧履歴を取得することができる。
次に、第3の実施の形態について説明する。第3の実施の形態に係るWeb閲覧履歴取得装置310は、表示内容変化検出部が第1の実施の形態と異なるだけであるので、異なる部分について説明し、その他の部分は、同一符号を付して詳細な説明を省略する。
図8に示すように、第3の実施の形態に係るWeb閲覧履歴取得装置310の表示内容変化検出部312は、ノード追加検出部312aと、ノード削除検出部312bと、ノード属性変更検出部312cと、連続イベント統合部312dとを含んだ構成で表すことができる。なお、連続イベント統合部312dは本発明の検出統合手段の一例である。
ノード追加検出部312aは、ドキュメントツリー44にノードの追加が行われたときに、ノードが追加されたことを示すノード追加イベントを出力する。すなわち、図3に示すようなドキュメントツリー44に対して、要素ノード等のノードが新たに追加されたときにノード追加イベントを出力する。
ノード削除検出部312bは、同様のドキュメントツリー44に対して、要素ノード等の削除が行われたときに、ノードが削除されたことを示すノード削除イベントを出力する。
ノード属性変更検出部312cは、同様のドキュメントツリー44に対して、属性ノードに対して属性値の変更が行われたときに、属性値が変更されたことを示すノード属性変更イベントを出力する。
連続イベント統合部312dは、ノード追加検出部312a、ノード削除検出部312b、及びノード属性変更検出部312cの少なくとも1つの検出部から所定時間内に出力された複数のイベントを、1回の変化検出イベントとして統合する。1つのユーザ操作が行われて表示内容が変化した場合に、上記3つの検出部から複数のイベントが連続して出力される場合がある。連続イベント統合部312dでは、予め設定した一定時間内に出力されたイベントを、1つの表示内容の変化を検出した1つの変化検出イベントとして統合する。例えば、ノード追加イベント、ノード削除イベント、ノード属性変更イベントが各1つずつ(合わせて3つ)出力された場合、複数のノード追加イベントが出力された場合、ノード削除イベントが1つとノード属性変更イベントが2つ(合わせて3つ)出力された場合等であっても、これが一定時間内に連続して出力されたものであれば、連続イベント統合部312dにより統合されて、1つの変化検出イベントとして出力される。
第3の実施の形態に係るWeb閲覧履歴取得装置310の作用は、図5のステップ102において出力される表示内容の変化を示す変化検出イベントとして、上記のように統合されたイベントもある点を除いて、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第3の実施の形態に係るWeb閲覧履歴取得装置によれば、多数の変化検出イベントを検出し過ぎて処理が重くなることを防ぐことができる。
次に、第4の実施の形態について説明する。第4の実施の形態に係るWeb閲覧履歴取得装置410は、ユーザ操作検出部が第1の実施の形態と異なるだけであるので、異なる部分について説明し、その他の部分は同一符号を付して詳細な説明を省略する。
図9に示すように、第4の実施の形態に係るWeb閲覧履歴取得装置410のユーザ操作検出部414は、クリック検出部414aと、ユーザ操作判定部414bとを含んだ構成で表すことができる。
クリック検出部414aは、ユーザによるWebブラウザ40に対するクリック操作を検出し、クリック操作が検出されたことを示し、かつクリック操作に対応するタグ情報を含むクリックイベントを出力する。
ユーザ操作判定部414bは、クリック検出部414aから出力されたクリックイベントに基づいて、検出されたクリック操作に対応するタグが予め設定された取得対象タグ32か否かを判定する。取得対象タグ32としては、そのタグがクリックされることにより、表示内容の変化に結びつく可能性が高いタグを予め設定しておく。例えば、ハイパーリンクを指定するという操作内容を示す<A>タグ、画像を表示するという操作内容を示す<IMG>タグ、入力フォームの部品を作成するという操作内容を示す<INPUT>タグ等を設定しておくことができる。ユーザ操作判定部414bは、検出されたクリック操作に対応するタグが予め設定された取得対象タグ32の場合に、クリックされたタグ情報をユーザの操作情報として付与したユーザ操作検出イベントを出力する。
第4の実施の形態に係るWeb閲覧履歴取得装置の作用は、図5のステップ100において検出されるユーザの操作が、上記のように予め設定された取得対象タグに対するクリック操作である点を除いて、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第4の実施の形態に係るWeb閲覧履歴取得装置によれば、取得対象タグの設定を可能にすることで、マウスクリックの中でも表示内容の変化につながる可能性が高いクリックのみをユーザの操作として検出することができるため、多数のユーザ操作を検出し過ぎて処理が重くなることを防ぐことができる。
また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
また、上述のWeb閲覧履歴取得装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10、210、310、410 Web閲覧履歴取得装置
12、312 表示内容変化検出部
14、414 ユーザ操作検出部
16 表示完了イベント取得部
18 表示内容取得判定部
20 表示内容取得部
22 Web閲覧履歴取得部
24 Webページ遷移検出部
30 閲覧履歴記憶部
40 Webブラウザ
42 HTMLコンテンツ
44 ドキュメントツリー
50 Webサーバ
312a ノード追加検出部
312b ノード削除検出部
312c ノード属性変更検出部
312d 連続イベント統合部
414a クリック検出部
414b ユーザ操作判定部

Claims (5)

  1. WebブラウザがWebサーバより取得したHTMLコンテンツを、画面表示用にツリー上に展開したドキュメントツリーの変化に基づいて、前記Webブラウザに表示されたWebページの表示内容の変化を検出する表示内容変化検出手段と、
    前記Webブラウザに対するユーザの操作を検出するユーザ操作検出手段と、
    Webページの表示が完了したか否かを前記Webブラウザから検出する表示完了検出手段と、
    前記ユーザ操作検出手段により前記ユーザの操作が検出されると共に、前記表示内容変化検出手段により前記表示内容の変化が検出された際、及び前記表示完了検出手段により前記Webページの表示が完了したことが検出された際に、前記表示内容を取得すると判定する表示内容取得判定手段と、
    前記表示内容取得判定手段により前記表示内容を取得すると判定された際に、前記ドキュメントツリーから前記表示内容を取得する表示内容取得手段と、
    前記表示内容取得手段により取得された表示内容を示すHTMLファイル、及びWebページの表示日時を含むメタデータをWeb閲覧履歴として取得するWeb閲覧履歴取得手段と、
    を含むWeb閲覧履歴取得装置。
  2. Webページの遷移を検出するWebページ遷移検出手段を含み、
    前記表示内容取得判定手段は、前記Webページ遷移検出手段により前記Webページの遷移が検出された際に、前記表示内容を取得すると判定する
    請求項1記載のWeb閲覧履歴取得装置。
  3. 前記表示内容変化検出手段は、
    前記ドキュメントツリーにおけるノードの追加を検出するノード追加検出手段と、
    前記ドキュメントツリーにおけるノードの削除を検出するノード削除検出手段と、
    前記ドキュメントツリーにおけるノードの属性の変更を検出するノード属性変更検出手段と、
    所定時間内の前記ノード追加検出手段、前記ノード削除検出手段、及び前記ノード属性変更検出手段の少なくとも1つの手段による複数の検出を、1回の検出として統合する検出統合手段と、
    を含む請求項1または請求項2記載のWeb閲覧履歴取得装置。
  4. 前記ユーザ操作検出手段は、
    ユーザによる前記Webブラウザに対するクリック操作を検出するクリック検出手段と、
    前記クリック検出手段により検出されたクリック操作に対応するタグが予め設定された取得対象タグの場合に、前記Webブラウザに対するユーザの操作として、前記取得対象タグが示す操作内容が行われたと判定するユーザ操作判定手段と、
    を含む請求項1〜請求項3のいずれか1項記載のWeb閲覧履歴取得装置。
  5. コンピュータを、請求項1〜請求項4のいずれか1項記載のWeb閲覧履歴取得装置を構成する各手段として機能させるための閲覧履歴取得プログラム。
JP2012099114A 2012-04-24 2012-04-24 Web閲覧履歴取得装置及びプログラム Active JP5670377B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012099114A JP5670377B2 (ja) 2012-04-24 2012-04-24 Web閲覧履歴取得装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012099114A JP5670377B2 (ja) 2012-04-24 2012-04-24 Web閲覧履歴取得装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2013228811A true JP2013228811A (ja) 2013-11-07
JP5670377B2 JP5670377B2 (ja) 2015-02-18

Family

ID=49676402

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012099114A Active JP5670377B2 (ja) 2012-04-24 2012-04-24 Web閲覧履歴取得装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5670377B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001290811A (ja) * 2000-04-10 2001-10-19 Just Syst Corp 文書処理装置、文書処理方法、および記録媒体
WO2010079028A1 (en) * 2009-01-08 2010-07-15 International Business Machines Corporation Method for server-side logging of client browser state through markup language
JP2011043924A (ja) * 2009-08-19 2011-03-03 Ntt Communications Kk Web行動履歴取得システム、Web行動履歴取得方法、ゲートウェイ装置、及びプログラム
JP2011090384A (ja) * 2009-10-20 2011-05-06 Nippon Telegr & Teleph Corp <Ntt> Webフレームページ情報取得方法、Webフレームページ情報取得システム、Webフレームページ情報取得プログラム
JP2012008853A (ja) * 2010-06-25 2012-01-12 Hitachi Ltd ウェブアプリケーションの操作再現方法およびシステム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001290811A (ja) * 2000-04-10 2001-10-19 Just Syst Corp 文書処理装置、文書処理方法、および記録媒体
WO2010079028A1 (en) * 2009-01-08 2010-07-15 International Business Machines Corporation Method for server-side logging of client browser state through markup language
JP2011043924A (ja) * 2009-08-19 2011-03-03 Ntt Communications Kk Web行動履歴取得システム、Web行動履歴取得方法、ゲートウェイ装置、及びプログラム
JP2011090384A (ja) * 2009-10-20 2011-05-06 Nippon Telegr & Teleph Corp <Ntt> Webフレームページ情報取得方法、Webフレームページ情報取得システム、Webフレームページ情報取得プログラム
JP2012008853A (ja) * 2010-06-25 2012-01-12 Hitachi Ltd ウェブアプリケーションの操作再現方法およびシステム

Also Published As

Publication number Publication date
JP5670377B2 (ja) 2015-02-18

Similar Documents

Publication Publication Date Title
CN104077387B (zh) 一种网页内容显示方法和浏览器装置
US8914496B1 (en) Tracking user behavior relative to a network page
US20220121723A1 (en) Distributed systems and methods for facilitating website remediation and promoting assistive technologies and detecting compliance issues
US20150106357A1 (en) Configuring web crawler to extract web page information
CN102999342B (zh) 一种网页中图片的全屏浏览方法及其装置
US20130080910A1 (en) Dynamic visualization of page element access rates in a web application
US9953364B2 (en) Information processing system, information processing system control method, information processing device, information processing device control method, program, and information storage medium
CN106097072B (zh) 一种商品信息的对比方法、装置与终端设备
JP2012529688A (ja) 更新通知方法、およびシステム
JP6936459B1 (ja) 商標使用検知装置、商標使用検知方法及び商標使用検知プログラム
CN111090797B (zh) 数据获取方法、装置、计算机设备和存储介质
CN105528200B (zh) 浏览器标签页的显示方法及装置
WO2021184896A1 (zh) 一种页面截图方法及装置
US9465814B2 (en) Annotating search results with images
CN104809173A (zh) 一种搜索结果的处理方法和装置
CN102999341A (zh) 用于网页的图片全屏浏览方法和装置
US20140006932A1 (en) Web page update notification device and web page update notification method
JP6505849B2 (ja) 要素識別子の生成
TW201525740A (zh) 網頁顯示方法和裝置及電腦可讀取儲存介質
JP2013011999A (ja) トピック変化検出装置及び方法
TW201705021A (zh) 利用網頁視覺特徵及網頁語法特徵之資訊擷取系統與方法
CN108829828B (zh) 一种网页显示方法、装置、电子设备及可读存储介质
TWI489370B (zh) 呈現界面工具集的方法及系統
JP5670377B2 (ja) Web閲覧履歴取得装置及びプログラム
KR20150068256A (ko) 웹 브라우저의 히스토리 관리 방법 및 장치

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140226

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141217

R150 Certificate of patent or registration of utility model

Ref document number: 5670377

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150