JP2014096117A - Web browsing history acquisition system and web browsing history management device and program - Google Patents
Web browsing history acquisition system and web browsing history management device and program Download PDFInfo
- Publication number
- JP2014096117A JP2014096117A JP2012248799A JP2012248799A JP2014096117A JP 2014096117 A JP2014096117 A JP 2014096117A JP 2012248799 A JP2012248799 A JP 2012248799A JP 2012248799 A JP2012248799 A JP 2012248799A JP 2014096117 A JP2014096117 A JP 2014096117A
- Authority
- JP
- Japan
- Prior art keywords
- browsing history
- web
- user terminal
- event information
- history
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
Description
本発明は、ユーザが閲覧したWebページ(フレーム分割されたWebページも含む)の閲覧履歴を取得するWeb閲覧履歴取得システム及びWeb閲覧履歴管理装置及びプログラムに係り、特に、ユーザがWebページを閲覧した端末と、プロキシサーバとで分担して閲覧履歴を取得するWeb閲覧履歴取得システム及びWeb閲覧履歴管理装置及びプログラムに関する。 The present invention relates to a web browsing history acquisition system, a web browsing history management apparatus, and a program for acquiring a browsing history of a web page (including a web page divided into frames) browsed by a user, and in particular, a user browses a web page. The present invention relates to a Web browsing history acquisition system, a Web browsing history management apparatus, and a program that share a browsing history with a terminal and a proxy server.
閲覧履歴を取得する技術としてユーザがWebページを閲覧する端末において、Webページ(フレームに分割されたWebページも含む)の閲覧履歴を取得するシステムがある(例えば、特許文献1参照)。当該システムでは、ユーザ端末内にブラウザ閲覧履歴を蓄積しておき、表示内容、表示URL、表示完了イベント等を取得するものである。 As a technique for acquiring a browsing history, there is a system that acquires a browsing history of a Web page (including a Web page divided into frames) in a terminal where a user browses a Web page (see, for example, Patent Document 1). In this system, the browser browsing history is accumulated in the user terminal, and the display content, display URL, display completion event, and the like are acquired.
また、ユーザがプロキシサーバ経由でWebページを閲覧する場合に、プロキシサーバにおいてWeb閲覧履歴を取得するシステムがある(例えば、特許文献2参照)。 In addition, when a user browses a web page via a proxy server, there is a system that acquires a web browsing history in the proxy server (see, for example, Patent Document 2).
しかしながら、上記の特許文献1に示すようなユーザ端末において閲覧履歴を取得する方式では、閲覧履歴として表示されたWebページのHTMLも取得する場合には、処理負荷が大きくなり、処理性能の低い端末には適用できないという問題があった。
However, in the method of acquiring the browsing history in the user terminal as shown in
また、特許文献2に示すようなプロキシサーバにおいて、閲覧履歴を取得する方式では、ユーザ端末においてWebブラウザのキャッシュを用いた表示が行われたときにはプロキシサーバには記録が残らないという問題、及び、フレームページの遷移をできるだけ正確に把握するためにはHTMLをパースして<frame>タグや<iframe>タグのsrc属性を調べる等の解析を行う必要があり、プロキシサーバでの処理の負荷が大きくなるという問題がある。
In addition, in the proxy server as shown in
本発明は、上記の点に鑑みなされたもので、Webページの閲覧履歴を取得する際に、ユーザ端末やプロキシサーバでの処理負荷を軽減することが可能なWeb閲覧履歴取得システム及びWeb閲覧履歴管理装置及びプログラムを提供することを目的とする。 The present invention has been made in view of the above points, and a Web browsing history acquisition system and a Web browsing history that can reduce the processing load on a user terminal or a proxy server when acquiring a Web page browsing history An object is to provide a management apparatus and a program.
上記の課題を解決するため、本発明(請求項1)は、親子関係を有するフレームに分かれたWebページの閲覧履歴を取得するためのWeb閲覧履歴取得システムであって、
ユーザ端末とプロキシサーバを有し、
前記ユーザ端末は、
Webブラウザが発生するページ遷移イベント及びクリックイベントを検出し、イベント情報をイベント発生記憶手段に格納すると共に、前記プロキシサーバに送信するイベント検出・送信手段を有し、
前記プロキシサーバは、
前記ユーザ端末から前記イベント情報を取得し、該ユーザ端末にWebコンテンツを提供した履歴である閲覧履歴と該イベント情報を対応付けて閲覧履歴記憶手段に格納し、該WebコンテンツのHTMLをHTMLファイルとして格納する閲覧履歴取得手段と、
前記閲覧履歴記憶手段の前記閲覧履歴を解析し、フレームの親子関係を表した履歴を生成する閲覧履歴解析手段と、
前記閲覧履歴解析手段で得られた履歴を前記閲覧履歴記憶手段に追記する閲覧履歴追記手段と、を有する。
In order to solve the above problems, the present invention (Claim 1) is a Web browsing history acquisition system for acquiring a browsing history of a Web page divided into frames having a parent-child relationship,
A user terminal and a proxy server,
The user terminal is
An event detection / transmission means for detecting a page transition event and a click event generated by the Web browser, storing event information in the event generation storage means, and transmitting the event information to the proxy server;
The proxy server is
The event information is acquired from the user terminal, and the browsing history, which is a history of providing the Web content to the user terminal, is stored in the browsing history storage unit in association with the event information, and the HTML of the Web content is converted into an HTML file. Browsing history acquisition means for storing;
Analyzing the browsing history of the browsing history storage means, generating a history representing a parent-child relationship of frames;
Browsing history recording means for additionally writing the history obtained by the browsing history analysis means to the browsing history storage means.
また、本発明(請求項2)は、上記の請求項1の前記プロキシサーバの前記閲覧履歴解析手段において、前記ユーザ端末から受信した前記イベント情報と前記閲覧履歴記憶手段の閲覧履歴とを、該イベント情報と該閲覧履歴のURLと日時で照合する照合手段を含む。
Further, according to the present invention (Claim 2), in the browsing history analysis means of the proxy server according to
また、本発明(請求項3)は、請求項2の前記照合手段において、前記イベント情報と前記閲覧履歴の前記URLと前記日時で照合した結果、照合対象が見つからない場合は、前記閲覧履歴の時間を遡って検索する手段を含む。
Further, according to the present invention (Claim 3), in the collation unit according to
また、本発明(請求項4)は、前記閲覧履歴追記手段において、前記照合手段で前記ユーザ端末から受信したイベント情報と前記閲覧履歴記憶手段の閲覧履歴とを、該イベント情報と該閲覧履歴のURLと日時で照合した結果、該閲覧履歴記憶手段に対応付けがされない閲覧履歴がある場合には、対応付けされていない閲覧履歴を前記ユーザ端末に送信し、該ユーザ端末の前記イベント発生記憶手段に追記させる手段を含む。 Further, according to the present invention (Claim 4), in the browsing history appending means, the event information received from the user terminal by the collating means and the browsing history of the browsing history storage means are combined with the event information and the browsing history. If there is a browsing history that is not associated with the browsing history storage unit as a result of collating the URL with the date and time, the browsing history that is not associated is transmitted to the user terminal, and the event occurrence storage unit of the user terminal Includes means to add to
本発明によれば、ユーザ端末では表示完了イベントの取得という軽い処理のみを行い、HTMLの取得処理を行わないので、ユーザ端末にかける負荷が軽減することができる。 According to the present invention, since the user terminal performs only a light process of acquiring a display completion event and does not perform an HTML acquisition process, the load on the user terminal can be reduced.
プロキシサーバでHTMLの解析を行う際に、ユーザ端末においてWebブラウザが発生するイベントを利用する。すなわち、Webページ全体の遷移、子フレームだけの遷移の違い、マウスクリックのイベントを使った解析を行うことができる。そのため、前述の特許文献2で行っているようなフレーム構造テーブルやリンク解析テーブルを作成した解析を行う必要はなく、プロキシサーバでの処理を軽減することができる。
When analyzing HTML on the proxy server, use the event generated by the Web browser on the user terminal. In other words, it is possible to perform analysis using the transition of the entire Web page, the difference of transition of only the child frame, and mouse click event. For this reason, it is not necessary to perform the analysis for creating the frame structure table or the link analysis table as in
また、従来の技術では、Webブラウザのキャッシュを用いた表示が行われた場合にも、プロキシサーバには記録が残らないが、本発明では、プロキシサーバ側において、ユーザ端末では発生したイベントが記録されるので、これを元にして閲覧履歴を補足することができる。 Also, in the conventional technology, even when a display using a Web browser cache is performed, no record remains in the proxy server. However, in the present invention, an event occurring in the user terminal is recorded on the proxy server side. Therefore, the browsing history can be supplemented based on this.
さらに、ユーザ端末でのイベントの発生は、稀にではあるが発生漏れが起きることがある。そのような場合でも、プロキシサーバには記録が残っているので、それを元にしてユーザ端末側の閲覧履歴を補足することができる。 Furthermore, the occurrence of an event at the user terminal may occur in rare cases. Even in such a case, since the record remains in the proxy server, the browsing history on the user terminal side can be supplemented based on the record.
以下、図面と共に本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図1は、本発明の一実施の形態におけるシステム構成例を示す。 FIG. 1 shows a system configuration example according to an embodiment of the present invention.
ユーザは、プロキシサーバ2を経由してインターネットに接続し、Webページを閲覧する。ユーザがWebページを閲覧するユーザ端末1上では、Webブラウザ10にWebブラウザ拡張機能100が組み込まれている。さらに、プロキシサーバ2には、プロキシサーバ拡張機能20が組み込まれている。
A user connects to the Internet via the
図2は、本発明の一実施の形態におけるWebブラウザ拡張機能の例を示す。 FIG. 2 shows an example of the Web browser extension function in the embodiment of the present invention.
Webブラウザ10は、Webページを閲覧するための、Webページ要求部11とWebページ受信部12に加え、Webブラウザ拡張機能100を有する。Webブラウザ拡張機能100は、表示完了検出部110、フレーム遷移判定部120、クリック検出部130、閲覧履歴送信部140、ページ遷移記録テーブル121、クリック履歴記録テーブル131を有する。
The
ユーザがWebブラウザ10でWebページを閲覧したとき、Webページの表示が完了すると、Webブラウザ10は表示完了のイベントを発生する。表示完了検出部110では、このイベントを検出する。
When the user browses the web page with the
フレーム遷移判定部120では、例えば、特許文献1による方法により、Webページ全体の遷移、子フレームのみの遷移を判定して検出する。例えば、図3に示すようなフレーム構造を持ったWebページを考える。この場合、example.htmlの中には、
<frame src=http://xxx.co.jp/menu.html name="left">
<frame src=http://xxx.co.jp/chap1.html name="right">
というフレーム構造を表す記述が含まれることになる。
The frame
<frame src = http: //xxx.co.jp/menu.html name = "left">
<frame src = http: //xxx.co.jp/chap1.html name = "right">
A description representing the frame structure is included.
このWebページに対して、まず、Webページ全体の遷移が発生し、次に子フレームのみの遷移が発生したとする。このとき、図4に示すような表示完了イベントが発生する。特許文献1の方法等によれば、Webページ全体の遷移、子フレームのみの遷移を検出することができ、ここでは、"2−3"がWebページ全体の遷移、"2−4"が子フレームのみの遷移として検出されるので、その結果は図5のようにページ遷移記録テーブル121に記録される。ここで、URL ID=1が図4の"2−3"に対応する記録、URL ID=2が図4中の"2−4"に対応する記録である。URL ID=2は、子フレームのみの遷移の記録であり、トップフレームのURLと併せて記録される。URL ID=3以降は、その後のWebページの閲覧の際のWebページ遷移である。フレーム遷移判定部120は、ページ遷移記録テーブル121の情報を閲覧履歴送信部140に出力する。
Assume that a transition of the entire web page first occurs and then only a child frame transition occurs for this web page. At this time, a display completion event as shown in FIG. 4 occurs. According to the method of
クリック検出部130では、Webページ上でマウスクリックが行われると、そのイベントを検出し、Webページ遷移のイベントと紐付け、クリックされたタグと共にクリック履歴記録テーブル131に記録する。図6にクリック検出部130によるクリック履歴記録テーブル131への記録の例を示す。同図に示すクリック履歴記録テーブル131は、URLの列に記載されたWebページにおいて、タグの列に記載されたタグがクリックされたことを示している。
When the mouse click is performed on the Web page, the
クリック検出部130は、クリック履歴記録テーブル131の情報を閲覧履歴送信部140に出力する。
The
閲覧履歴送信部140は、表示完了検出後、フレーム遷移判定部120、クリック検出部130の出力をプロキシサーバ2に送信する。
After the display completion is detected, the browsing
図7は、本発明の一実施の形態におけるプロキシサーバ拡張機能の例である。 FIG. 7 is an example of the proxy server extension function according to the embodiment of the present invention.
プロキシサーバ2は、Webページ要求受信部21、Webページ要求部22、Webページ受信部23、Webページ提供部24に加え、プロキシサーバ拡張機能20を有する。
The
プロキシサーバ拡張機能20は、閲覧履歴受信部210、Web閲覧履歴取得部220、Web閲覧履歴解析部230、Web閲覧履歴追記部240を有する。Web閲覧履歴取得部220、Web閲覧履歴解析部230、Web閲覧履歴追記部240には、Web閲覧履歴記憶部40が接続されている。
The proxy server extended
Web閲覧履歴取得部220は、閲覧履歴受信部210がWebブラウザ10から受信した内容をWeb閲覧履歴としてWeb閲覧履歴記憶部40の閲覧履歴テーブル41に保存する。受信したHTMLはファイルとしてHTMLファイル42に保存される。閲覧履歴テーブル41には、HTMLを受信した日時、URL、リファラ、保存したHTMLファイル42のローカルパスが記録される。図8に閲覧履歴テーブル41の例を示す。当該閲覧履歴テーブル41の情報は各Webブラウザ毎に格納される。
The web browsing
閲覧履歴受信部210では、Webブラウザ10の閲覧履歴送信部140からのデータを受信する。受信するデータは、ユーザ端末1で記録されたデータであり、図5、図6に示したページ遷移記録テーブル121、クリック履歴記録テーブル131に格納されたものである。
The browsing
Web閲覧履歴解析部230は、閲覧履歴受信部210からのデータを用いて、Web閲覧履歴の解析を行う。解析は、受信した図5に示すページ遷移記録テーブル121のページ遷移記録を元に、順に処理を行っていく。Web閲覧履歴解析部230及びWeb閲覧履歴追記部240の処理の内容は、次のように場合分けされる。
The web browsing
(1)Webページ全体の遷移の場合:
(ア)閲覧履歴テーブルに存在する場合;
(イ)閲覧履歴テーブルに存在しない場合;
(2)子フレームの遷移の場合:
(ア)閲覧履歴テーブルに存在する場合;
(イ)閲覧履歴テーブルに存在しない場合;
(3)対応するイベントが発生しない場合;
以下に上記の各場合毎に説明する。
(1) For the transition of the entire web page:
(A) When it exists in the browsing history table;
(B) When it does not exist in the browsing history table;
(2) For child frame transition:
(A) When it exists in the browsing history table;
(B) When it does not exist in the browsing history table;
(3) When the corresponding event does not occur;
Hereinafter, each case will be described.
(1)(ア)の場合の処理:
当該処理は、Webブラウザ10から受信したイベント(図5のページ遷移記録テーブルのデータと図6のクリック履歴記録テーブルのデータ)とプロキシサーバ2の閲覧履歴テーブル41とを、URLと日時で照合することによって解析を行う。
(1) Processing for (a):
In this process, the event received from the Web browser 10 (the data in the page transition recording table in FIG. 5 and the data in the click history recording table in FIG. 6) and the browsing history table 41 of the
以下に詳細に説明する。 This will be described in detail below.
Webページ全体の遷移の場合、図5のページ遷移記録テーブル121には、URL ID=1のようなTop URLが空欄である記録がされる。ここに記録されているURLと日時をURL1、DATE1とすると、閲覧履歴受信部210は、
URL1=http://xxx.co.jp/example.html
DATE1=2012/08/23 15:00:01
を取得する。Web閲覧履歴解析部230において、図8の閲覧履歴テーブル41において、URLの列の値がURL1に一致し、日時列の値がDATE1と一定の範囲内で一致する行を検索すると、URL ID=2の行が該当する。図5及び図6において、対応する行の時間差は、HTMLファイルがプロキシサーバ2を通過した時刻と、ユーザ端末1においてWebページの表示が完了した時刻の差であるので、通信速度及びWebページの平均的なサイズを指定すれば、平均的な時間差を設定することができる。
In the case of the transition of the entire Web page, the page transition recording table 121 in FIG. 5 records that the Top URL such as URL ID = 1 is blank. If the URL and date and time recorded here are URL1 and DATE1, the browsing
URL1 = http: //xxx.co.jp/example.html
DATE1 = 2012/08/23 15:00:01
To get. When the Web browsing
もしもこの検索において、一致する行が見つからなかった場合には、後述する(1)(イ)の処理を実行する。 If no matching line is found in this search, processing (1) and (a) described later are executed.
次に、Web閲覧履歴解析部230は、閲覧履歴テーブル41のURL ID=3の行のローカルパス列に書かれたファイルを解析する。このファイルの中には、
http://xxx.co.jp/menu.html
http://xxx.co.jp/chap1.html
がフレーム内の表示内容を示すURLであることが記述されている。これらのURLと一致するURLを図8の閲覧履歴テーブル41から検索すると、URL ID=3,4の行それぞれに一致する。これにより、URL ID=2,3,4の行が1つのWebページ閲覧に対応することが分かる。このことを示すため、Web閲覧履歴追記部240では、図9に示すように、ページIDの列を設け、同一のWebページ閲覧に対応することを示すためにURL ID=2,3,4に対応するページIDに同一のページID=2を記録する。
Next, the web browsing
http://xxx.co.jp/menu.html
http://xxx.co.jp/chap1.html
Is a URL indicating the display content in the frame. When URLs that match these URLs are retrieved from the browsing history table 41 of FIG. 8, they match the URL ID = 3 and 4 rows, respectively. Thus, it can be seen that the lines of URL ID = 2, 3, and 4 correspond to one web page browsing. In order to indicate this, in the web browsing
(1)(イ)の場合の処理:
当該処理は、Webページ全体の遷移の場合において、上記の(1)(ア)において、受信したイベントと閲覧履歴テーブル41の内容がマッチングしない場合に、時間を遡って閲覧履歴テーブル41から一致するものを検索する処理である。
(1) Processing in case of (a):
In the case of the transition of the entire web page, the processing matches the browsing history table 41 by going back in time when the received event and the contents of the browsing history table 41 do not match in the above (1) (a). It is a process of searching for things.
閲覧履歴テーブル41を、URL、日時によって検索したが、対応する行が見つからなかった場合、Webブラウザ10は、ブラウザキャッシュを利用して表示を行い、プロキシサーバ2にはデータが流れなかったと考えられる。この場合は以前にはそのURLに相当する閲覧を行っているので、時間を遡って閲覧履歴テーブル41を検索すれば、URL列がURLに一致している行が見つかるはずである。
When the browsing history table 41 is searched by URL and date and time, but the corresponding row is not found, the
例えば、図5のページ遷移記録テーブル121でURL ID=3の行では、
URL2=http://yyy.co.jp/
DATE2=2012/08/23 15:02:18
である。これらの値を用いて、上記の(1)(ア)と同様に、図8の閲覧履歴テーブル41を検索しても該当する行は見つからない。この場合には、DATE2から(1)(ア)の場合よりも時間を遡って検索を行う。
For example, in the page transition record table 121 of FIG.
URL2 = http: //yyy.co.jp/
DATE2 = 2012/08/23 15:02:18
It is. Using these values, the corresponding row is not found even if the browsing history table 41 in FIG. 8 is searched in the same manner as (1) and (a) above. In this case, the search is performed retroactively from the
見つかった場合に、Web閲覧履歴追記部240はその該当する行の情報を、日時DATE2の箇所にコピーする。図8に示されているものよりも更に日時を遡って閲覧履歴テーブル41を遡って、URL列の値がURL2に一致するものを検索し、見つかった行のリファラがhttp://xxx.co.jp/example.html、ローカルパスの列の値が9001.htmlだったものとする。この場合には、Web閲覧履歴追記部240は、リファラ列、ローカルパス列の値を、日時をDATE2とした図9におけるURL ID=5-1の行に追記する。ここで、URL IDは、URL ID=5及びURL ID=6の間への挿入であるので、URL ID=5-1とした。
If found, the Web browsing
(2)(ア)の場合の処理:
当該処理は、子フレームの遷移の場合、Webブラウザ10から受信したイベントとプロキシサーバ2内に蓄積された閲覧履歴テーブルとをURLと日時で照合することにより、解析するものである。
(2) Processing for (a):
In the case of child frame transition, this processing is performed by comparing the event received from the
子フレームの遷移の場合、図5のページ遷移記録テーブル121のURL ID=2の行に示すように、表示したフレームの内容を示すURLと同時に、トップフレームのURL(Top URL)が記録される。ここで、図5のページ遷移記録テーブル121から
URL3=http://xxx.co.jp/chap2.html
Date3=2012/08/23 15:02:13
TOP3=http://xxx.co.jp/example.html
とする。
In the case of a transition of a child frame, as shown in the line of URL ID = 2 in the page transition recording table 121 in FIG. 5, the top frame URL (Top URL) is recorded simultaneously with the URL indicating the content of the displayed frame. . Here, from the page transition record table 121 of FIG.
URL3 = http: //xxx.co.jp/chap2.html
Date3 = 2012/08/23 15:02:13
TOP3 = http: //xxx.co.jp/example.html
And
URL3、DATE3に対して(1)(ア)と同様に閲覧履歴テーブル41の検索を行うと、URL ID=5の行が該当する。また、TOP3をURLとしてDATE3より閲覧履歴テーブル41の日時を遡る検索を行うと、URL ID=2が一致する。したがって、URL ID=4に相当する閲覧履歴テーブル41は、ページ遷移記録テーブル121の、URL ID=2の時の閲覧の一部が入れ替わったものと分かる。ここで、日時を遡る範囲は、フレームを含むWebページが表示され、親フレームはそのままで子フレームのみ遷移する時間として、想定される最大値を設定する。 When the browsing history table 41 is searched for URL3 and DATE3 in the same manner as (1) and (a), the line of URL ID = 5 corresponds. In addition, when a search is performed using the TOP3 as a URL and going back in the browsing history table 41 from DATE3, URL ID = 2 matches. Therefore, it can be understood that the browsing history table 41 corresponding to URL ID = 4 is a part of browsing when URL ID = 2 in the page transition recording table 121 has been replaced. Here, the range that goes back to the date and time is set to a maximum value that is assumed as the time during which only the child frame transitions without changing the parent frame without changing the Web page including the frame.
次に、図6に示すクリック履歴記録テーブル131のURLがTOP3に一致し、日時をDATE3から遡って検索すると、URL ID=2の「2012/08/23 15:02:12」が検索され、それに対応するクリックタグが<a href=http://xxx.co.jp/chap1.html target=right">であることがわかる。また、図8の閲覧履歴テーブル41のURLがURL3に一致し、日時をDATE3から遡って検索すると、URL ID=5が抽出され、その行のリファラ情報としてmenu.htmlが得られる。 Next, when the URL of the click history record table 131 shown in FIG. 6 matches TOP3 and the date and time is retrieved retroactively from DATE3, “2012/08/23 15:02:12” with URL ID = 2 is searched, It can be seen that the corresponding click tag is <a href=http://xxx.co.jp/chap1.html target=right">. Also, the URL of the browsing history table 41 in FIG. When the date and time are retrieved from DATE3, URL ID = 5 is extracted, and menu.html is obtained as the referrer information of the line.
これにより以下のことが分かる。 This shows the following.
・リファラ情報よりクリックが行われた箇所がわかる。この場合、クリックはmenu.htmlの中で行われた。 -You can see where the click was made from the referrer information. In this case, the click was made in menu.html.
・クリックされたタグの情報より、クリックされたタグの内容が分かる。この場合、rightフレームにて遷移が行われた。 ・ The content of the clicked tag is known from the information of the clicked tag. In this case, a transition was made in the right frame.
したがって、図8の閲覧履歴テーブル41におけるURL ID=5の閲覧は、URL ID=2,3,4の閲覧において、rightフレームであるURL ID=4の内容をchap2.htmlに置き換えたものとなる。この内容にしたがってWeb閲覧履歴追記部240が処理を行うと、図9に示す閲覧履歴テーブル41おいて、URL ID=4-1,4-2の追記が行われる。ここで、URL IDは、URL ID=4及びURL ID=5の間への挿入であるので、URL ID=4−1,4-2とした。
Therefore, the browsing of URL ID = 5 in the browsing history table 41 of FIG. 8 is the same as the browsing of URL ID = 2, 3 and 4, but the content of URL ID = 4 which is a right frame is replaced with chap2.html. . When the web browsing
(2)(イ)の場合の処理:
当該処理は、子フレームの遷移の場合、上記(2)(ア)で照合相手が見つからない場合、時間を遡って、閲覧履歴テーブル41を検索し、照合することにより解析するものである。
(2) Processing in case of (a):
In the case of a transition of a child frame, when the collation partner is not found in the above (2) and (a), the processing is performed by going back in time and searching the browsing history table 41 and analyzing it.
子フレームのみの遷移の場合でも、図5のページ遷移記録テーブル121の行に対応する内容が図8の閲覧履歴テーブル41から見つからない場合は、上記の(1)(イ)の処理と同様である。 Even in the case of the transition of only the child frame, if the content corresponding to the row of the page transition recording table 121 in FIG. 5 is not found in the browsing history table 41 in FIG. 8, the same processing as in the above (1) (a) is performed. is there.
(3)の場合の処理:
当該処理は対応するイベントの発生がない場合の処理である。
Processing for (3):
This processing is processing when there is no corresponding event.
図5のページ遷移記録テーブル121において、URL ID=4におけるURLは、図8の閲覧履歴テーブル41においては、URL ID=7の行に存在するので、これら2つの行が対応することとなる。したがって、図8の閲覧履歴テーブル41のURL ID=6の行に対して、図5のページ遷移記録テーブル121では対応する行が存在しないことになる。これは、ユーザ端末においてイベントの発生漏れが発生したためと考えられる。この場合には、Web閲覧履歴追記部240が、ページ遷移記録テーブル121に追記を行う。図10に追記された後のページ遷移記録テーブル121のイベント発生履歴の例を示す。URL ID=3-1の列に追記が行われている。
In the page transition recording table 121 of FIG. 5, the URL with URL ID = 4 exists in the row of URL ID = 7 in the browsing history table 41 of FIG. 8, so these two rows correspond. Therefore, there is no corresponding row in the page transition recording table 121 in FIG. 5 for the row of URL ID = 6 in the browsing history table 41 in FIG. This is presumably because an event omission occurred in the user terminal. In this case, the web browsing
なお、上記の図7に示すプロキシサーバの構成要素の各部の処理をプログラムとして構築し、プロキシサーバとして利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。 Note that the processing of each part of the components of the proxy server shown in FIG. 7 described above can be constructed as a program, installed on a computer used as a proxy server and executed, or distributed via a network. .
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。 The present invention is not limited to the above-described embodiments, and various modifications and applications are possible within the scope of the claims.
1 ユーザ端末
2 プロキシサーバ
3 Webサーバ
10 Webブラウザ
11 Webページ要求部
12 Webページ受信部
20 プロキシサーバ拡張機能
21 Webページ受信部
22 Webページ要求部
23 Webページ受信部
24 Webページ提供部
30 Webリソース
40 Web閲覧履歴記憶部
41 閲覧履歴テーブル
42 HTMLファイル
100 Webブラウザ拡張機能
110 表示完了検出部
120 フレーム遷移判定部
121 ページ遷移記録テーブル
130 クリック検出部
131 クリック履歴記録テーブル
140 閲覧履歴送信部
210 閲覧履歴受信部
220 Web閲覧履歴取得部
230 Web閲覧履歴解析部
240 Web閲覧履歴追記部
DESCRIPTION OF
Claims (9)
ユーザ端末とプロキシサーバを有し、
前記ユーザ端末は、
Webブラウザが発生するページ遷移イベント及びクリックイベントを検出し、イベント情報をイベント発生記憶手段に格納すると共に、前記プロキシサーバに送信するイベント検出・送信手段を有し、
前記プロキシサーバは、
前記ユーザ端末から前記イベント情報を取得し、該ユーザ端末にWebコンテンツを提供した履歴である閲覧履歴と該イベント情報を対応付けて閲覧履歴記憶手段に格納し、該WebコンテンツのHTMLをHTMLファイルとして格納する閲覧履歴取得手段と、
前記閲覧履歴記憶手段の前記閲覧履歴を解析し、フレームの親子関係を表した履歴を生成する閲覧履歴解析手段と、
前記閲覧履歴解析手段で得られた履歴を前記閲覧履歴記憶手段に追記する閲覧履歴追記手段と、
を有することを特徴とするWeb閲覧履歴取得システム。 A web browsing history acquisition system for acquiring browsing history of a web page divided into frames having a parent-child relationship,
A user terminal and a proxy server,
The user terminal is
An event detection / transmission means for detecting a page transition event and a click event generated by the Web browser, storing event information in the event generation storage means, and transmitting the event information to the proxy server;
The proxy server is
The event information is acquired from the user terminal, and the browsing history, which is a history of providing the Web content to the user terminal, is stored in the browsing history storage unit in association with the event information, and the HTML of the Web content is converted into an HTML file. Browsing history acquisition means for storing;
Analyzing the browsing history of the browsing history storage means, generating a history representing a parent-child relationship of frames;
Browsing history appending means for appending the history obtained by the browsing history analysis means to the browsing history storage means;
Web browsing history acquisition system characterized by having.
前記ユーザ端末から受信した前記イベント情報と前記閲覧履歴記憶手段の閲覧履歴とを、該イベント情報と該閲覧履歴のURLと日時で照合する照合手段を含む
請求項1記載のWeb閲覧履歴取得システム。 The browsing history analysis means of the proxy server is
The Web browsing history acquisition system according to claim 1, further comprising: a matching unit that matches the event information received from the user terminal with the browsing history of the browsing history storage unit based on the date and time of the event information and the URL of the browsing history.
前記イベント情報と前記閲覧履歴の前記URLと前記日時で照合した結果、照合対象が見つからない場合は、前記閲覧履歴の時間を遡って検索する手段を含む
請求項2記載のWeb閲覧履歴取得システム。 The verification means includes
The Web browsing history acquisition system according to claim 2, further comprising means for searching backwards the time of the browsing history when a collation target is not found as a result of matching the event information with the URL of the browsing history and the date and time.
前記照合手段において、前記ユーザ端末から受信したイベント情報と前記閲覧履歴記憶手段の閲覧履歴とを、該イベント情報と該閲覧履歴のURLと日時で照合した結果、該閲覧履歴記憶手段に対応付けがされない閲覧履歴がある場合には、対応付けされていない閲覧履歴を前記ユーザ端末に送信し、該ユーザ端末の前記イベント発生記憶手段に追記させる手段を含む
請求項2記載のWeb閲覧履歴取得システム。 The browsing history appending means is
As a result of collating the event information received from the user terminal and the browsing history of the browsing history storage unit by the date and time of the event information and the URL of the browsing history, the matching unit is associated with the browsing history storage unit. The Web browsing history acquisition system according to claim 2, further comprising: means for transmitting a browsing history that is not associated with the user terminal to be additionally recorded in the event generation storage unit of the user terminal when there is a browsing history that is not performed.
前記ユーザ端末で検出された、前記Webブラウザが発生するページ遷移イベント及びクリックイベントを含むイベント情報を取得するイベント情報取得手段と、
前記ユーザ端末にWebコンテンツを提供した履歴である閲覧履歴と該イベント情報を対応付けて閲覧履歴記憶手段に格納し、該WebコンテンツのHTMLをHTMLファイルとして格納する閲覧履歴取得手段と、
前記閲覧履歴記憶手段の前記閲覧履歴を解析し、フレームの親子関係を表した履歴を生成する閲覧履歴解析手段と、
前記閲覧履歴解析手段で得られた履歴を前記閲覧履歴記憶手段に追記する閲覧履歴追記手段と、
を有することを特徴とするWeb閲覧履歴管理装置。 A web browsing history management device that manages browsing history of web pages divided into frames having parent-child relationships viewed on a user terminal,
Event information acquisition means for acquiring event information including a page transition event and a click event that are detected by the user terminal and generated by the Web browser;
A browsing history acquisition unit that stores the browsing history, which is a history of providing Web content to the user terminal, and the event information in association with the browsing history storage unit, and stores the HTML of the Web content as an HTML file;
Analyzing the browsing history of the browsing history storage means, generating a history representing a parent-child relationship of frames;
Browsing history appending means for appending the history obtained by the browsing history analysis means to the browsing history storage means;
A Web browsing history management device characterized by comprising:
前記ユーザ端末から受信した前記イベント情報と前記閲覧履歴記憶手段の閲覧履歴とを、該イベント情報と該閲覧履歴のURLと日時で照合する照合手段を含む
請求項5記載のWeb閲覧履歴管理装置。 The browsing history analysis means includes
The web browsing history management device according to claim 5, further comprising a collating unit that collates the event information received from the user terminal and the browsing history of the browsing history storage unit with a date and time of the event information and a URL of the browsing history.
前記イベント情報と前記閲覧履歴の前記URLと前記日時で照合した結果、照合対象が見つからない場合は、前記閲覧履歴の時間を遡って検索する手段を含む
請求項6記載のWeb閲覧履歴管理装置。 The verification means includes
The Web browsing history management device according to claim 6, further comprising means for searching backwards the time of the browsing history when a collation target is not found as a result of matching the event information with the URL of the browsing history and the date and time.
前記照合手段において、前記ユーザ端末から受信したイベント情報と前記閲覧履歴記憶手段の閲覧履歴とを、該イベント情報と該閲覧履歴のURLと日時で照合した結果、該閲覧履歴記憶手段に対応付けがされない閲覧履歴がある場合には、対応付けされていない閲覧履歴を前記ユーザ端末に送信し、該ユーザ端末の前記イベント発生記憶手段に追記させる手段を含む
請求項6記載のWeb閲覧履歴管理装置。 The browsing history appending means is
As a result of collating the event information received from the user terminal and the browsing history of the browsing history storage unit by the date and time of the event information and the URL of the browsing history, the matching unit is associated with the browsing history storage unit. The web browsing history management device according to claim 6, further comprising means for transmitting a browsing history that is not associated to the user terminal when there is a browsing history that is not associated with the event occurrence storage unit of the user terminal.
請求項5乃至8のいずれか1項に記載のWeb閲覧履歴管理装置の各手段として機能させるためのWeb閲覧履歴管理プログラム。 Computer
A web browsing history management program for causing each of the means of the web browsing history management apparatus according to any one of claims 5 to 8 to function.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012248799A JP5986896B2 (en) | 2012-11-12 | 2012-11-12 | Web browsing history management apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012248799A JP5986896B2 (en) | 2012-11-12 | 2012-11-12 | Web browsing history management apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014096117A true JP2014096117A (en) | 2014-05-22 |
JP5986896B2 JP5986896B2 (en) | 2016-09-06 |
Family
ID=50939116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012248799A Expired - Fee Related JP5986896B2 (en) | 2012-11-12 | 2012-11-12 | Web browsing history management apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5986896B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016099943A (en) * | 2014-11-26 | 2016-05-30 | 日本電信電話株式会社 | Data collection method, data collection device, and program |
JP2017037422A (en) * | 2015-08-07 | 2017-02-16 | 株式会社ユニクエスト・オンライン | Telephone number kinetic allocation system and computer program for kinetic allocation system |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11175446A (en) * | 1997-12-10 | 1999-07-02 | Fuji Xerox Co Ltd | Data repeater system, request repeater system, data communication system, computer readable recording medium for recorded with data relay program and computer readable record medium recorded with request relay program |
JP2003077396A (en) * | 2001-09-03 | 2003-03-14 | Canon Inc | Manufacturing method of panel-shaped airtight container |
JP2009251831A (en) * | 2008-04-03 | 2009-10-29 | Internatl Business Mach Corp <Ibm> | Guide providing device, method and program for guiding in virtual space |
JP2011090384A (en) * | 2009-10-20 | 2011-05-06 | Nippon Telegr & Teleph Corp <Ntt> | Method, system, and program for obtaining web frame page information |
-
2012
- 2012-11-12 JP JP2012248799A patent/JP5986896B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11175446A (en) * | 1997-12-10 | 1999-07-02 | Fuji Xerox Co Ltd | Data repeater system, request repeater system, data communication system, computer readable recording medium for recorded with data relay program and computer readable record medium recorded with request relay program |
JP2003077396A (en) * | 2001-09-03 | 2003-03-14 | Canon Inc | Manufacturing method of panel-shaped airtight container |
JP2009251831A (en) * | 2008-04-03 | 2009-10-29 | Internatl Business Mach Corp <Ibm> | Guide providing device, method and program for guiding in virtual space |
JP2011090384A (en) * | 2009-10-20 | 2011-05-06 | Nippon Telegr & Teleph Corp <Ntt> | Method, system, and program for obtaining web frame page information |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016099943A (en) * | 2014-11-26 | 2016-05-30 | 日本電信電話株式会社 | Data collection method, data collection device, and program |
JP2017037422A (en) * | 2015-08-07 | 2017-02-16 | 株式会社ユニクエスト・オンライン | Telephone number kinetic allocation system and computer program for kinetic allocation system |
Also Published As
Publication number | Publication date |
---|---|
JP5986896B2 (en) | 2016-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8612416B2 (en) | Domain-aware snippets for search results | |
US7788274B1 (en) | Systems and methods for category-based search | |
US20080288640A1 (en) | Automated tagging of syndication data feeds | |
JP5756386B2 (en) | Method, apparatus, and program for supporting generation and management of metadata for correcting problems of dynamic web application | |
CN106095979B (en) | URL merging processing method and device | |
US20080306913A1 (en) | Dynamic aggregation and display of contextually relevant content | |
TWI592807B (en) | Method and device for web style address merge | |
TW201514845A (en) | Title and body extraction from web page | |
JP2008529133A (en) | Technology to change the presentation of information displayed to end users of computer systems | |
US8938440B2 (en) | Method and device for extracting a meta data fragment from a metadata component associated with multimedia data | |
US8832098B2 (en) | Research tool access based on research session detection | |
US20090083266A1 (en) | Techniques for tokenizing urls | |
US8140508B2 (en) | System and method for contextual commands in a search results page | |
CN106874502A (en) | A kind of method of video search, device and terminal | |
JP2010128928A (en) | Retrieval system and retrieval method | |
US9465814B2 (en) | Annotating search results with images | |
CN108694325B (en) | Method and device for identifying specified type of website | |
JP6147629B2 (en) | Page site server, program, and method for immediately displaying a point of interest for page content | |
JP5986896B2 (en) | Web browsing history management apparatus and program | |
US20090313558A1 (en) | Semantic Image Collection Visualization | |
US9990425B1 (en) | Presenting secondary music search result links | |
US20150169177A1 (en) | Classifying particular images as primary images | |
US9384283B2 (en) | System and method for deterring traversal of domains containing network resources | |
Gali et al. | Extracting representative image from web page | |
US8132090B2 (en) | Dynamic creation of symptom databases from social bookmarks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160808 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5986896 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |