JP5337128B2 - Web page browsing history recording system and Web page browsing history recording program - Google Patents

Web page browsing history recording system and Web page browsing history recording program Download PDF

Info

Publication number
JP5337128B2
JP5337128B2 JP2010236652A JP2010236652A JP5337128B2 JP 5337128 B2 JP5337128 B2 JP 5337128B2 JP 2010236652 A JP2010236652 A JP 2010236652A JP 2010236652 A JP2010236652 A JP 2010236652A JP 5337128 B2 JP5337128 B2 JP 5337128B2
Authority
JP
Japan
Prior art keywords
content
event
web page
generation
web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010236652A
Other languages
Japanese (ja)
Other versions
JP2012089017A (en
Inventor
明通 田中
隆 佐藤
昌宏 湯口
匡 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010236652A priority Critical patent/JP5337128B2/en
Publication of JP2012089017A publication Critical patent/JP2012089017A/en
Application granted granted Critical
Publication of JP5337128B2 publication Critical patent/JP5337128B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ユーザがWebブラウザをもって閲覧したWebページの閲覧履歴を記録するWebページ閲覧履歴記録システムおよびWebページ閲覧履歴記録プログラムに関する。   The present invention relates to a web page browsing history recording system and a web page browsing history recording program for recording a browsing history of a web page browsed by a user with a web browser.

周知のようにブロードバンドの普及に伴い、コンピュータによるインターネット利用者が急激に増加し、現在ではWebページの閲覧はコンピュータの代表的な利用方法になっている。   As is well known, with the widespread use of broadband, the number of Internet users using computers has increased rapidly, and now browsing of Web pages has become a typical method of using computers.

現在普及しているコンピュータの多くは、ウィンドウシステムのオペレーションシステム(OS)を利用し、ユーザはWebページをウィンドウ内に表示して閲覧や作業を行っている。このWebページの閲覧では、アクティブなウィンドウ表示のWebページを変更、あるいは別のウィンドウをアクティブ化する操作によって、ユーザに対して表示される内容が切り替えられている。   Many of the computers that are currently popular use an operation system (OS) of a window system, and a user displays a Web page in a window for browsing and working. In browsing this Web page, the content displayed to the user is switched by an operation of changing the Web page of the active window display or activating another window.

非特許文献1の行動検索手法では、前記各操作に着目してWebページをアクティブに表示していた期間を「アクティブ期間」と定義し、ユーザの行動履歴を解析している。ここではWebブラウザ用に行動履歴自動収集モジュールのプラグインを作成し、該プラグインによりイベントメッセージを取得する。   In the behavior search method of Non-Patent Document 1, a period during which a Web page is actively displayed focusing on each operation is defined as an “active period”, and a user's behavior history is analyzed. Here, a plug-in for the action history automatic collection module is created for the Web browser, and an event message is acquired by the plug-in.

図1(a)(b)に基づき非特許文献1のWeb閲覧履歴記録を説明する。図1(a)は、Webブラウザでウィンドウ1.2を開き、時刻t0〜t4におけるWebページA〜Cの閲覧を時系列に示している。ここではS01〜S04の閲覧操作が行われている。
S01:ウィンドウ1の表示内容をWebページAからWebページBに切り替えた。
S02:ウィンドウ2を新たに開き、WebページCを表示した。
S03:ウィンドウ2を閉じて、ウィンドウ1を表示した。
S04:ウィンドウ1を閉じた。
Web browsing history recording of Non-Patent Document 1 will be described with reference to FIGS. FIG. 1A shows the browsing of Web pages A to C in time series from time t 0 to t 4 by opening window 1.2 with a Web browser. Here, browsing operations of S01 to S04 are performed.
S01: The display content of window 1 is switched from Web page A to Web page B.
S02: Window 2 is newly opened and Web page C is displayed.
S03: Window 2 was closed and window 1 was displayed.
S04: Window 1 is closed.

図1(b)は、S01〜S04の閲覧操作時に作成されるアクティブ期間を示している。ここではS01〜S04の閲覧操作時に、ユーザに対して表示されている内容、即ちアクティブウィンドウが切り替わるため、それぞれの切り替えに応じて4つのアクティブ期間「A」「B1」「C」「B2」が作成される。このときWeb閲覧履歴の記録のために各アクティブ期間の開始時刻と終了時刻とが記録される。同時に各アクティブ期間に対して閲覧Webページのhtmlファイルやサムネイル画像などが保存される。保存された情報は必要に応じて閲覧することができる。 FIG. 1B shows an active period created during the browsing operation of S01 to S04. Here, the contents displayed to the user during the browsing operation of S01 to S04, that is, the active window is switched, so that the four active periods “A”, “B 1 ”, “C”, “B 2 ” are switched according to each switching. Is created. At this time, the start time and end time of each active period are recorded for recording the web browsing history. At the same time, an html file, thumbnail image, etc. of the browsing web page are stored for each active period. The stored information can be browsed as needed.

森田 哲之,倉 恒子,日高哲雄,大浦 啓一郎,田中 明通,加藤泰久,奥 雅博 ”Memory−Retriever:体験獲得情報を想起させる行動検索手法” 情報処理学会論文誌 Vol.47 No.3,Mar.2007Tetsuyuki Morita, Tsuneko Kura, Tetsuo Hidaka, Keiichiro Oura, Akitori Tanaka, Yasuhisa Kato, Masahiro Oku “Memory-Retriever: Behavioral Retrieval Method Recalling Experience Acquisition Information” IPSJ Journal Vol. 47 No. 3, Mar. 2007

しかしながら、非特許文献1のWeb閲覧履歴記録方式は、S01〜S04の各操作をユーザに対して表示されている内容が切り替わる点として同様に扱っているため、以下の問題が生じてしまう。   However, since the Web browsing history recording method of Non-Patent Document 1 treats each operation of S01 to S04 in the same way as the point that the content displayed for the user is switched, the following problem occurs.

すなわち、S01.S02では新たな内容(コンテンツ)のWebページが表示されているのに対して、S03では新たな内容のWebページは表示されず、すでに表示されていたWebページが再度、最前面のウィンドウに表示されにすぎない。この点でS01.S02とS03とでは表示内容が相違している。   That is, S01. In S02, a Web page with new contents (content) is displayed, whereas in S03, a Web page with new contents is not displayed, and the already displayed Web page is displayed again in the foreground window. It is only done. In this respect, S01. The display contents are different between S02 and S03.

ところが、非特許文献1のWeb閲覧履歴記録方式は、前記表示内容の相違を考慮せずにアクティブ期間を作成するため、アクティブ期間B1.B2で同一のhtmlファイルやサムネイル画像等が保存され、保存される履歴の容量が増加し、保存容量を圧迫するおそれがある。 However, since the Web browsing history recording method of Non-Patent Document 1 creates an active period without considering the difference in display contents, the active period B 1 . The same html file, thumbnail image, and the like are stored in B 2 , and the capacity of the history to be stored increases, and there is a risk that the storage capacity will be compressed.

また、保存されたhtmlファイルに処理などを行う場合には、アクティブ期間B1.B2で同一のhtmlファイルやサムネイル画像等が保存されているため、同一の処理を繰り返し、処理効率が低下するおそれもある。 When processing is performed on the stored html file, the active period B 1 . Because the same html files or thumbnail images, etc. In B 2 are stored, repeating the same processing, processing efficiency is also likely to deteriorate.

本発明は、上述のような従来技術の問題点を解決するためになされたものであり、Web閲覧履歴の保存容量を抑制し、該保存履歴の処理を効率化することを解決課題としている。   The present invention has been made in order to solve the above-described problems of the prior art, and it is an object of the present invention to suppress the storage capacity of the Web browsing history and make the processing of the storage history more efficient.

本発明は、ユーザがWebページを閲覧した閲覧履歴を記録するWebページ閲覧履歴記録システムであって、Webページのコンテンツ表示を開始した時にWebブラウザが出す表示開始イベントと、Webページのコンテンツ表示が終了するときにWebブラウザが出す表示終了イベントとを検出する検出手段と、検出手段の検出した表示開始イベントが、Webページのコンテンツ生成を伴うコンテンツ生成イベントと、該コンテンツ生成を伴わないコンテンツ非生成イベントのいずれかを判定する表示開始イベント判定手段と、検出手段の検出した表示終了イベントが、Webページのコンテンツ消滅を伴うコンテンツ消滅イベントと、該コンテンツ消滅を伴わないコンテンツ非消滅イベントのいずれかを判定する表示終了イベント判定手段と、前記各イベント判定手段の判定結果に応じてWebページのコンテンツ情報を閲覧履歴として記録するコンテンツ情報記録手段と、を有し、コンテンツ情報記録手段は、前記判定結果がコンテンツ生成イベント/コンテンツ消滅イベントであれば前記コンテンツ情報を記録する一方、前記判定結果がコンテンツ非生成イベント/コンテンツ非消滅イベントであれば前記コンテンツ情報を記録しないことを特徴とする。 The present invention is a Web page browsing history recording system for recording a browsing history when a user browses a Web page, and includes a display start event issued by a Web browser when a Web page content display is started, and a Web page content display. A detecting means for detecting a display end event issued by the Web browser when it is ended, a display start event detected by the detecting means is a content generation event accompanied by the content generation of the Web page, and content non-generation not accompanied by the content generation The display start event determination means for determining any of the events, and the display end event detected by the detection means are either a content disappearance event that causes the disappearance of the content of the Web page, or a content non-annihilation event that does not accompany the disappearance of the content Display end event to judge And a content information recording unit that records the content information of the Web page as a browsing history according to the determination result of each event determination unit, and the content information recording unit has the determination result as a content generation event / If the content disappearance event, the content information is recorded, while if the determination result is a content non-generation event / content non-annihilation event, the content information is not recorded .

この発明によれば、前記表示内容の生成/消滅を伴う場合に限ってWebページの表示内容が記録されることから、前記表示内容の生成/消滅を伴わない場合はWebページの表示内容は記録されない。   According to the present invention, since the display content of the Web page is recorded only when the display content is generated / erased, the display content of the Web page is recorded when the display content is not generated / erased. Not.

また、コンテンツ生成イベント/コンテンツ消滅イベントではコンテンツ情報が記録される一方、コンテンツ非生成イベント/コンテンツ非消滅イベントではコンテンツ情報が記録されず、コンテンツ情報の重複記録(重複保存)や重複処理の繰り返しが防止される。 In addition, content information is recorded in a content generation event / content disappearance event, while content information is not recorded in a content non-generation event / content non-disappearance event, and content information is duplicated (duplicate storage) or repeated. Is prevented.

本発明の他の態様は、コンテンツ情報記録手段は、前記判定結果がコンテンツ生成イベントであれば、Webページのコンテンツをデータベースに保存し、保存コンテンツ毎にコンテンツID・開始日時を持つコンテンツ遷移情報をコンテンツ遷移テーブルに記録する一方、前記判定結果がコンテンツ消滅イベントであれば、該イベントで消滅するコンテンツ応じた前記遷移テーブルのレコードに表示終了日時を記述することを特徴としている。これにより前記遷移テーブルには保存コンテンツの開始日時〜消滅日時までの遷移が記録される。   In another aspect of the present invention, if the determination result is a content generation event, the content information recording unit stores the content of the Web page in a database, and stores content transition information having a content ID and a start date for each stored content. If the determination result is a content disappearance event while being recorded in the content transition table, the display end date and time is described in a record of the transition table corresponding to the content disappearing at the event. Thereby, the transition from the start date / time to the disappearance date / time of the stored content is recorded in the transition table.

本発明のさらに他の態様は、コンテンツ情報記録手段が、コンテンツ生成イベント/コンテンツ消滅イベント毎にイベント種別・イベント発生日時をイベントテーブルに記録し、コンテンツ非生成イベント/コンテンツ非消滅イベント毎にイベント種別・イベント発生日時をイベントテーブルに記録するイベント情報記録手段をさらに有することを特徴としている。これによりイベントテーブルのレコードを用いて非特許文献1のアクティブ期間を再現することが可能となる。   According to still another aspect of the present invention, the content information recording means records an event type / event occurrence date / time for each content generation event / content extinction event in the event table, and sets an event type for each content non-generation event / content non-extinction event. An event information recording means for recording the event occurrence date and time in the event table is further provided. This makes it possible to reproduce the active period of Non-Patent Document 1 using the event table record.

本発明のさらに他の態様は、前記遷移テーブルに記録されるコンテンツ遷移情報には、コンテンツ毎に振り出される連続番号からなるコンテンツ番号が含まれている一方、イベント情報記録手段は、コンテンツ非生成イベント/コンテンツ非終了イベントを発生させたWebページに応じた前記コンテンツ番号を前記遷移テーブルから取得し、取得したコンテンツ番号をイベントテーブルのレコードに記述することを特徴としている。これにより両テーブル間のレコードがコンテンツ連番を通じて関連付けられる。   According to still another aspect of the present invention, the content transition information recorded in the transition table includes a content number composed of a serial number assigned to each content, while the event information recording means includes a content non-generation The content number corresponding to the Web page that generated the event / content non-end event is acquired from the transition table, and the acquired content number is described in a record of the event table. As a result, the records between the two tables are associated through the content serial number.

なお、本発明は、前記各システムとしてコンピュータを機能させるプログラムの態様としてもよい。このプログラムは、ネットワークや記録媒体などを通じて提供することができる。   In addition, this invention is good also as an aspect of the program which makes a computer function as said each system. This program can be provided through a network or a recording medium.

本発明によれば、Web閲覧履歴の保存容量を抑制し、該保存履歴の処理を効率化することができる。   According to the present invention, the storage capacity of the Web browsing history can be suppressed, and the processing of the storage history can be made efficient.

(a)はWebページA〜Cの閲覧を時系列に示すグラフ、(b)は(a)のグラフに応じた非特許文献1のアクティブ期間の切り替わりを示すグラフ、(c)は(a)のグラフに応じた本発明の実施形態に係るWeb閲覧履歴記録システムの表示開始イベント(コンテンツ生成イベント・コンテンツ非生成イベント)を示すグラフ、(d)は同システムの表示終了イベント(コンテンツ消滅イベント・コンテンツ非消滅イベント)を示すグラフ。(A) is a graph showing browsing of Web pages A to C in time series, (b) is a graph showing switching of the active period of Non-Patent Document 1 according to the graph of (a), and (c) is (a). FIG. 6D is a graph showing a display start event (content generation event / content non-generation event) of the Web browsing history recording system according to the embodiment of the present invention according to the graph of FIG. Graph showing content non-disappearance events. 同 Web閲覧履歴記録システムの構成図。The block diagram of the same web browsing history recording system.

本発明の実施形態に係るWeb閲覧履歴記録システムは、ユーザに対して表示される複数Webページの内容が切り替わる場合をアクティブ・非アクティブ間の切り替えではなく、新たな内容のWebページが表示される否か、あるいは表示されている内容が消滅するか否かという観点から分類し、それぞれの場合に適切な処理を実行する。このとき図1(a)のS02でWebページCを新たに開くときにWebページBが非アクティブとしてバックグラウンドに残っている識別(コンテンツ非消滅イベント)と、S03でWebページCを閉じるときにWebページBがアクティブ化される識別(コンテンツ非生成イベント)とを加えている。   In the Web browsing history recording system according to the embodiment of the present invention, when the contents of a plurality of Web pages displayed to the user are switched, a Web page with new contents is displayed instead of switching between active and inactive. Classification from the viewpoint of whether or not the displayed contents disappear, and appropriate processing is executed in each case. At this time, when the Web page C is newly opened in S02 of FIG. 1A, the identification that the Web page B remains in the background as inactive (content non-annihilation event), and when the Web page C is closed in S03 An identification that the Web page B is activated (content non-generation event) is added.

≪基本原理≫
前記システムは、まずWebの内容を表示時にWebブラウザが発生するイベントを、該イベントの発生タイミング(Webページの表示開始時・Webページの表示終了時)から分類し、つぎにWebページ内容(コンテンツ)の生成・消滅を伴うか否かという観点から分類する。具体的には、Webブラウザが発生するイベントを次のように分類する。
(1)表示開始イベント
Webページが内容表示を開始した時に発生するイベント
(1−1)コンテンツ生成イベント
新たな内容のWebページが表示される時に発生するイベント
(1−2)コンテンツ非生成イベント
非アクティブからアクティブへの切り替えのように、新たな内容のWebページは表示されず、既に表示されていたWebページが再度表示される時に発生するイベント
(2)表示終了イベント
Webページの内容表示を終了した時(別のものに切り替わる場合を含む)に発生するイベント
(2−1)コンテンツ消滅イベント
表示されているWebページの内容が消滅する時に発生するイベント
(2−2)コンテンツ非消滅イベント
アクティブから非アクティブへの切り替えのように、表示されているWebページの内容は消滅せずに背面(バックグラウンド)のウィンドウなどに残るという操作が行われた時に発生するイベント
図1(c)(d)に基づきS01〜S04のそれぞれの操作で発生するイベントを説明する。まず、S01ではWebページAの内容は消滅するのでコンテンツ消滅イベントが発生する(d−1)。また、WebページBの内容は新たに表示されるのでコンテンツ生成イベントが発生する(c−1)。
≪Basic principle≫
The system first classifies events generated by the Web browser when displaying the Web contents from the generation timing of the event (at the start of Web page display or at the end of Web page display), and then the Web page contents (contents) ) From the viewpoint of whether or not it is accompanied by generation / extinction of Specifically, events generated by the Web browser are classified as follows.
(1) Display start event Event that occurs when a Web page starts displaying content (1-1) Content generation event Event that occurs when a Web page with new content is displayed (1-2) Content non-generation event An event that occurs when a Web page that has already been displayed is not displayed again, such as switching from active to active, and a Web page that has already been displayed is displayed again. (2) Display end event Ends the display of the Web page content. (2-1) Content disappearance event Event that occurs when the content of the displayed Web page disappears (2-2) Content non-annihilation event From active to active event (including the case of switching to another) Like switching to inactive Events that occur when an operation is performed in which the content remains in the back (background) window, etc., without disappearing. The events that occur in each operation of S01 to S04 will be described based on FIGS. 1 (c) and 1 (d). . First, in S01, the content disappears because the content of the Web page A disappears (d-1). Further, since the contents of Web page B are newly displayed, a content generation event occurs (c-1).

S02では、WebページBの内容は消滅せずに背面ウィンドウ内に残るので、コンテンツ非生成イベントが発生する(d−2)。また、WebページCの内容は新たに表示されるのでコンテンツ生成イベントが発生する(c−1)。   In S02, the content of the Web page B does not disappear but remains in the back window, so a content non-generation event occurs (d-2). Further, since the content of the Web page C is newly displayed, a content generation event occurs (c-1).

S03では、WebページCの内容は消滅するのでコンテンツ消滅イベントが発生する(d−1)。このときWebページBの内容は新たに表示されるのではなく、以前(S01〜S02間)に表示されていた内容の再表示なので、コンテンツ非生成イベントが発生する(c−2)。   In S03, since the content of the Web page C disappears, a content disappearance event occurs (d-1). At this time, the content of the Web page B is not newly displayed but is redisplayed from the content previously displayed (between S01 and S02), and therefore a content non-generation event occurs (c-2).

S04では、WebページBの内容は消滅するので、コンテンツ消滅イベントが発生する(d−1)。   In S04, since the content of Web page B disappears, a content disappearance event occurs (d-1).

そして、前記システムでは、WebページのHTMLファイルやサムネイルなどに関するコンテンツ情報は、コンテンツ生成イベント/コンテンツ消滅イベントの発生時に限って行われる。したがって、コンテンツ非生成イベント/コンテンツ非生成イベントの発生時にはコンテンツ情報に関する記録は行われない。   In the system, content information relating to HTML files, thumbnails, and the like of Web pages is performed only when a content generation event / content disappearance event occurs. Accordingly, recording of content information is not performed when a content non-generation event / content non-generation event occurs.

≪システム構成例≫
図2に基づき前記システムの構成例を説明する。ここでは前記システム1は、パーソナルコンピュータ(PC)や携帯電話などにより構成され、Webブラウザ2にイベントメッセージを収集・分類する拡張機能が追加されている。
≪System configuration example≫
A configuration example of the system will be described with reference to FIG. Here, the system 1 is configured by a personal computer (PC), a mobile phone, or the like, and an extended function for collecting and classifying event messages is added to the Web browser 2.

具体的には、前記システム1は、Webページの内容(コンテンツ)を表示し始めた時にWebブラウザ2が出すイベントを検出する表示開始イベント検出手段3と、該検出手段3の検出イベントがコンテンツ生成イベントとコンテンツ非生成イベントのいずれかを判定する表示開始イベント判定手段4と、Webページの表示内容が終了する時のWebブラウザの出すイベントを検出する表示終了イベント検出手段5と、該検出手段5の検出イベントがコンテンツ消滅イベントとコンテンツ非消滅イベントのいずれかを判定する表示終了イベント判定手段6と、前記判定手段4.6の判定結果がコンテンツ生成イベント/コンテンツ終了イベントであればイベント情報およびコンテンツ情報を記録するコンテンツ情報取得手段7と、前記判定手段4.6の判定結果がコンテンツ非生成イベント/コンテンツ非終了イベントであればイベント情報を記録するイベント情報記録手段8と、前記情報取得手段7が前記コンテンツ情報のうちコンテンツ遷移情報を記録するコンテンツ遷移テーブル9と、前記情報取得手段7が前記コンテンツ情報のうちコンテンツファイルを保存するコンテンツファイルDB10と、前記両手段7.8がイベント情報を記録するイベントテーブル11と、を有している。   Specifically, the system 1 includes a display start event detection unit 3 that detects an event issued by the Web browser 2 when it starts to display the content (content) of a Web page, and the detection event of the detection unit 3 generates content. Display start event determination means 4 for determining either an event or a content non-generation event, display end event detection means 5 for detecting an event issued by the Web browser when the display content of the Web page ends, and the detection means 5 Display end event determination means 6 for determining whether the detection event is a content disappearance event or a content non-disappearance event, and event information and content if the determination result of the determination means 4.6 is a content generation event / content end event Content information acquisition means 7 for recording information; Event information recording means 8 for recording event information if the determination result of means 4.6 is a content non-generation event / content non-end event, and content for which the information acquisition means 7 records content transition information among the content information The transition table 9 includes a content file DB 10 in which the information acquisition unit 7 stores content files of the content information, and an event table 11 in which both units 7.8 record event information.

この各手段3〜8は、例えばWebブラウザ2にプラグインとして組みことができ、また前記テーブル9.11および前記DB10は、メモリ(RAM)やハードディスクドライブ装置などの記憶装置に構築される。なお、前記システム1は、非特許文献1の行動履歴の自動収集に利用することができる。   Each of these means 3 to 8 can be assembled as a plug-in in the Web browser 2, for example, and the table 9.11 and the DB 10 are constructed in a storage device such as a memory (RAM) or a hard disk drive device. The system 1 can be used for automatic collection of the action history of Non-Patent Document 1.

≪システム1の処理内容≫
前記検出手段3は、ユーザがマウスなどを用いてWebブラウザ2でWebページの表示操作をし、Webページの内容を表示し始めた時に該Webブラウザが出すイベントを検出する。この検出イベントは前記判定手段4に送られる。
<< Processing contents of system 1 >>
The detection means 3 detects an event issued by the web browser when the user performs a web page display operation on the web browser 2 using a mouse or the like and starts displaying the contents of the web page. This detection event is sent to the determination means 4.

前記判定手段4は、前記検出手段3から送られた検出したイベントがコンテンツ生成イベントであるか、コンテンツ非生成イベントであるかを判定する。例えば新規WebページをWebブラウザで表示する場合はコンテンツ生成イベントと判定され、非アクティブなWebページをアクティブに切り替えた場合はコンテンツ非生成イベントと判定される。この判定結果は前記各手段7.8に送られる。   The determination unit 4 determines whether the detected event sent from the detection unit 3 is a content generation event or a content non-generation event. For example, when a new Web page is displayed on a Web browser, it is determined as a content generation event, and when an inactive Web page is switched to active, it is determined as a content non-generation event. This determination result is sent to each means 7.8.

前記情報取得手段7は、前記判定手段4から送られた判定結果がコンテンツ生成イベントであればWebブラウザ2から「URL、htmlファイル、サムネイル」などのWebページの表示内容に関するコンテンツ情報を取得する。ここで取得した「htmlファイル、サムネイル」はコンテンツファイルとして前記DB10に保存する。この保存ファイルのコンテンツ遷移情報を前記テーブル9にレコード挿入し、該イベントのイベント情報を前記テーブル11にレコード挿入する。   If the determination result sent from the determination unit 4 is a content generation event, the information acquisition unit 7 acquires content information related to the display content of the Web page such as “URL, html file, thumbnail” from the Web browser 2. The “html file, thumbnail” acquired here is stored in the DB 10 as a content file. The content transition information of the saved file is inserted into the table 9 and the event information of the event is inserted into the table 11.

Figure 0005337128
Figure 0005337128

表1は、前記テーブル9のレコード例を示している。このレコード中、コンテンツ連番は前記テーブル9にレコードが挿入されるごとに振られる番号、即ちコンテンツごとに振られる連続番号を示している。コンテンツIDは前記DB10に保存されたコンテンツを一意に区別するためのIDを示し、ウィンドウIDはWebブラウザ2のウィンドウを一意に区別するためのIDを示している。このウィンドウIDには前記システム1のOS(Operation System)がWebブラウザ2に自動的に付与するIDを利用する。   Table 1 shows a record example of the table 9. In this record, the content serial number indicates a number assigned each time a record is inserted into the table 9, that is, a serial number assigned for each content. The content ID indicates an ID for uniquely identifying the content stored in the DB 10, and the window ID indicates an ID for uniquely identifying the window of the Web browser 2. As the window ID, an ID automatically assigned to the Web browser 2 by the OS (Operation System) of the system 1 is used.

また、開始日時はコンテンツが存在し始めた日時、即ちコンテンツ生成イベントが発生した日時を示している。終了日時はコンテンツの存在が終了した日時を示し、この時点(コンテンツ生成イベント)では記録されない。URLは該ウィンドウIDのWebブラウザ2が表示するWebページのURLを示し、htmlハッシュは該ウィンドウIDのWebブラウザ2で表示されているhtmlファイルの中身のハッシュ値を示し、htmlパスは前記DB10に保存したhtmlファイルのパス名、サムネイルパスは前記DB10に保存したサムネイルのパス名を示している。   The start date / time indicates the date / time when the content started to exist, that is, the date / time when the content generation event occurred. The end date / time indicates the date / time when the existence of the content ends, and is not recorded at this point (content generation event). The URL indicates the URL of the Web page displayed by the Web browser 2 with the window ID, the html hash indicates the hash value of the contents of the html file displayed by the Web browser 2 with the window ID, and the html path is stored in the DB 10. The path name and thumbnail path of the saved html file indicate the path name of the thumbnail saved in the DB 10.

Figure 0005337128
Figure 0005337128

表2は、前記テーブル11のレコード例を示している。ここではイベント連番は前記テーブル11にレコードが挿入されるごとに自動的に振られる連続番号を示している。コンテンツ連番は前記テーブル9とリレーションを持つための番号を示し、前記テーブル9のコンテンツ連番と同一の番号が記録され、表2では表1のコンテンツ連番と同一の「5」が記録されている。イベントIDは発生したイベントの種類(コンテンツ生成イベント・コンテンツ非生成イベント・コンテンツ消滅イベント・コンテンツ非消滅イベント)を識別するIDを示し、発生日時はイベントが発生した日時を示している。   Table 2 shows a record example of the table 11. Here, the event serial number indicates a serial number automatically assigned every time a record is inserted into the table 11. The content serial number indicates a number for having a relation with the table 9, and the same number as the content serial number of the table 9 is recorded. In Table 2, “5”, which is the same as the content serial number of Table 1, is recorded. ing. The event ID indicates an ID for identifying the type of event that has occurred (content generation event / content non-generation event / content disappearance event / content non-disappearance event), and the occurrence date / time indicates the date / time when the event occurred.

前記情報記録手段8は、前記判定手段4から送られた判定結果がコンテンツ非生成イベントであれば、コンテンツ遷移情報の前記テーブル9への記録やコンテンツファイルの前記DB10への保存をすることなく、前記テーブル11にイベント情報(表2の各項目)のレコード挿入を行う。このとき前記情報記録手段8は、該イベントを発生させたWebブラウザのウィンドウIDをキーに前記テーブル9の対応レコードを探索し、非アクティブからアクティブに切り替わったWebページのコンテンツ連番の番号を取得する。取得した番号を前記テーブル11のコンテンツ連番の項目に記述し、前記テーブル9.11のレコード間を関連付ける。   If the determination result sent from the determination unit 4 is a content non-generation event, the information recording unit 8 does not record the content transition information in the table 9 or save the content file in the DB 10. A record of event information (each item in Table 2) is inserted into the table 11. At this time, the information recording unit 8 searches the corresponding record in the table 9 using the window ID of the Web browser that generated the event as a key, and obtains the content serial number of the Web page that has been switched from inactive to active. To do. The acquired number is described in the content serial number item of the table 11, and the records in the table 9.11.

また、前記検出手段5は、ユーザのマウス操作などによってWebページの内容表示が終了する時(別のものに切り替わる時を含む。)にWebブラウザが出すイベントを検出する。この検出イベントは前記判定手段6に送られる。ここで前記判定手段6は、前記検出手段6から送られた検出イベントがコンテンツ消滅イベントであるか、コンテンツ非消滅イベントであるかを判定する。例えば表示されているWebページをクローズするときには該Webページのコンテンツが消滅するため、コンテンツ消滅イベントと判定され、アクティブなWebページを非アクティブに切り替えた場合には背面ウィンドウに該Webページが残るため、非コンテンツ消滅イベントと判定される。この判定結果は前記各手段7.8に送られる。   The detecting means 5 detects an event issued by the Web browser when the content display of the Web page is terminated (including when switching to another) by a user's mouse operation or the like. This detection event is sent to the determination means 6. Here, the determination means 6 determines whether the detection event sent from the detection means 6 is a content disappearance event or a content non-annihilation event. For example, when the displayed web page is closed, the content of the web page disappears. Therefore, it is determined as a content disappearance event, and when the active web page is switched to inactive, the web page remains in the rear window. It is determined as a non-content disappearance event. This determination result is sent to each means 7.8.

前記情報取得手段7は、前記判定手段6から送られた判定結果がコンテンツ消滅イベントであれば、該イベントを発生させたWebブラウザのウィンドウIDをもとに前記テーブル9中の対応レコードを決定し、該レコードに終了日時を追記する。併せてコンテンツ消滅イベントのイベント情報(表2の各項目)をコンテンツ生成イベントの場合と同様に前記テーブル11にレコード挿入する。   If the determination result sent from the determination unit 6 is a content disappearance event, the information acquisition unit 7 determines a corresponding record in the table 9 based on the window ID of the Web browser that generated the event. The end date and time is added to the record. At the same time, the event information (each item in Table 2) of the content disappearance event is inserted into the table 11 as in the case of the content generation event.

前記情報記録手段8は、前記判定手段6から送られた判定結果がコンテンツ非消滅イベントであれば、前記テーブル9への終了時刻記録を行うことなく、コンテンツ非生成イベントと同様に前記テーブル11にコンテンツ非生成イベントのイベント情報(表2の各項目)のレコード挿入のみを行う。また、コンテンツ非イベントを発生させたWebブラウザのウィンドウIDをキーに前記テーブル9の対応レコードを探索し、アクティブから非アクティブに切り替わったWebページのコンテンツ連番の番号を取得する。取得した番号を前記テーブル11のコンテンツ連番の項目に記述し、前記テーブル9.11のレコード間を関連付ける。   If the determination result sent from the determination unit 6 is a content non-annihilation event, the information recording unit 8 does not record the end time in the table 9 and records it in the table 11 in the same manner as the content non-generation event. Only the record insertion of event information (each item in Table 2) of the content non-generation event is performed. Further, the corresponding record in the table 9 is searched using the window ID of the Web browser that has generated the content non-event as a key, and the content serial number of the Web page switched from active to inactive is acquired. The acquired number is described in the content serial number item of the table 11, and the records in the table 9.11.

したがって、前記システム1によれば、コンテンツ生成イベントの発生時にWebページのHTMLファイル・サムネイルが前記DB10に保存され、コンテンツ生成イベントとコンテンツ消滅イベントのそれぞれの発生時にコンテンツ遷移情報が前記テーブル9に記録される。すなわち、コンテンツ非生成イベントの発生時やコンテンツ非消滅イベントの発生時にはHTMLファイルなどの保存・コンテンツ遷移情報の記録は行われない。   Therefore, according to the system 1, the HTML file / thumbnail of the Web page is stored in the DB 10 when the content generation event occurs, and the content transition information is recorded in the table 9 when each of the content generation event and the content disappearance event occurs. Is done. That is, when a content non-generation event occurs or when a content non-annihilation event occurs, storage / content transition information such as an HTML file is not recorded.

これによりHTMLファイルやサムネイルなどのコンテンツファイルの保存量が削減され、前記DB10の保存容量を抑制することができる。また、前記イベント毎に同一のHTMLファイル、サムネイルなどが前記DB10に重複保存されることがなく、非特許文献1の行動検索手法に利用すれば行動履歴解析などを効率化することもできる。例えば行動シーケンス表示インタフェースのサムネイルの重複表示を防止できる。   As a result, the storage amount of content files such as HTML files and thumbnails is reduced, and the storage capacity of the DB 10 can be suppressed. In addition, the same HTML file, thumbnail, etc. are not redundantly stored in the DB 10 for each event, and if used in the behavior search method of Non-Patent Document 1, behavior history analysis can be made more efficient. For example, it is possible to prevent overlapping display of thumbnails in the action sequence display interface.

さらに、前記テーブル11には、前記各イベントのイベント情報がレコード挿入されているため、該各レコードを非特許文献1のアクティブ期間の再現に利用することもできる。このとき前記テーブル11のレコードは、前記テーブル9のレコードとコンテンツ連番を通じて関連付けられているため、Webページのアクティブ・非アクティブを容易に判別できる。   Furthermore, since the event information of each event is inserted into the table 11, each record can be used for reproducing the active period of Non-Patent Document 1. At this time, since the records in the table 11 are associated with the records in the table 9 through content serial numbers, it is possible to easily determine whether the Web page is active or inactive.

≪プログラムなど≫
本発明は、前記システム1の各手段3〜11の一部もしくは全部としてコンピュータを機能させるWebページ閲覧記録プログラムとしても構成することもできる。このプログラムは、Webサイトや電子メールなどネットワークを通じて提供することができる。
≪Programs≫
The present invention can also be configured as a Web page browsing / recording program that causes a computer to function as part or all of the means 3 to 11 of the system 1. This program can be provided through a network such as a website or e-mail.

また、前記プログラムは、CD−ROM,DVD−ROM,CD−R,CD−RW,DVD−R,DVD−RW,MO,HDD,BD−ROM,BD−R,BD−REなどの記録媒体に記録して、保存・配布することも可能である。この記録媒体は、記録媒体駆動装置を利用して読み出され、そのプログラムコード自体が前記実施形態の処理を実現するので、該記録媒体も本発明を構成する。   The program is stored in a recording medium such as a CD-ROM, DVD-ROM, CD-R, CD-RW, DVD-R, DVD-RW, MO, HDD, BD-ROM, BD-R, or BD-RE. It is also possible to record, save and distribute. This recording medium is read using a recording medium driving device, and the program code itself realizes the processing of the above embodiment, so that the recording medium also constitutes the present invention.

1…Web閲覧履歴記録システム
2…Webブラウザ
3…表示開始イベント検出手段(検出手段)
4…表示開始イベント判定手段(判定手段)
5…表示終了イベント検出手段(検出手段)
6…表示終了イベント判定手段(判定手段)
7…コンテンツ情報取得手段(コンテンツ情報記録手段.情報記録手段)
8…イベント情報記録手段
9…コンテンツ遷移テーブル
10…コンテンツファイルDB
11…イベントテーブル
DESCRIPTION OF SYMBOLS 1 ... Web browsing history recording system 2 ... Web browser 3 ... Display start event detection means (detection means)
4. Display start event determination means (determination means)
5. Display end event detection means (detection means)
6 ... Display end event determination means (determination means)
7. Content information acquisition means (content information recording means. Information recording means)
8 ... Event information recording means 9 ... Content transition table 10 ... Content file DB
11 ... Event table

Claims (5)

ユーザがWebページを閲覧した閲覧履歴を記録するWebページ閲覧履歴記録システムであって、
Webページのコンテンツ表示を開始した時にWebブラウザが出す表示開始イベントと、Webページのコンテンツ表示が終了するときにWebブラウザが出す表示終了イベントとを検出する検出手段と、
検出手段の検出した表示開始イベントが、Webページのコンテンツ生成を伴うコンテンツ生成イベントと、該コンテンツ生成を伴わないコンテンツ非生成イベントのいずれかを判定する表示開始イベント判定手段と、
検出手段の検出した表示終了イベントが、Webページのコンテンツ消滅を伴うコンテンツ消滅イベントと、該コンテンツ消滅を伴わないコンテンツ非消滅イベントのいずれかを判定する表示終了イベント判定手段と、
前記各イベント判定手段の判定結果に応じてWebページのコンテンツ情報を閲覧履歴として記録するコンテンツ情報記録手段と、を有し、
コンテンツ情報記録手段は、前記判定結果がコンテンツ生成イベント/コンテンツ消滅イベントであれば前記コンテンツ情報を記録する一方、前記判定結果がコンテンツ非生成イベント/コンテンツ非消滅イベントであれば前記コンテンツ情報を記録しない
ことを特徴とするWeb閲覧履歴記録システム。
A web page browsing history recording system for recording a browsing history of a user browsing a web page,
Detection means for detecting a display start event issued by the web browser when the content display of the web page is started and a display end event issued by the web browser when the content display of the web page is ended;
A display start event determination unit that determines whether the display start event detected by the detection unit is a content generation event accompanied by content generation of a Web page, or a content non-generation event not accompanied by content generation;
A display end event determining means for determining whether the display end event detected by the detecting means is a content disappearance event accompanying the disappearance of the content of the Web page or a content non-disappearing event not accompanying the content disappearance;
Content information recording means for recording the content information of the Web page as a browsing history according to the determination result of each event determination means,
The content information recording means records the content information if the determination result is a content generation event / content disappearance event, and does not record the content information if the determination result is a content non-generation event / content non-annihilation event. A Web browsing history recording system characterized by that.
コンテンツ情報記録手段は、前記判定結果がコンテンツ生成イベントであれば、Webページのコンテンツをデータベースに保存し、
保存コンテンツ毎にコンテンツID・開始日時を持つコンテンツ遷移情報をコンテンツ遷移テーブルに記録する一方、
前記判定結果がコンテンツ消滅イベントであれば、該イベントで消滅するコンテンツ応じた前記遷移テーブルのレコードに表示終了日時を記述する
ことを特徴とする請求項1に記載のWeb閲覧履歴記録システム。
If the determination result is a content generation event, the content information recording unit stores the content of the web page in a database,
While recording content transition information having a content ID and start date for each stored content in the content transition table,
2. The Web browsing history recording system according to claim 1 , wherein if the determination result is a content disappearance event, a display end date and time is described in a record of the transition table corresponding to the content disappearing in the event.
コンテンツ情報記録手段が、コンテンツ生成イベント/コンテンツ消滅イベント毎にイベント種別・イベント発生日時をイベントテーブルに記録し、
コンテンツ非生成イベント/コンテンツ非消滅イベント毎にイベント種別・イベント発生日時をイベントテーブルに記録するイベント情報記録手段をさらに有する
ことを特徴とする請求項1または2のいずれか1項に記載のWeb閲覧履歴記録システム。
The content information recording means records the event type and event occurrence date and time in the event table for each content generation event / content disappearance event,
The Web browsing according to claim 1 , further comprising an event information recording unit that records an event type and an event occurrence date / time in an event table for each content non-generated event / content non-annihilated event. History recording system.
前記遷移テーブルに記録されるコンテンツ遷移情報には、コンテンツ毎に振り出される連続番号からなるコンテンツ番号が含まれている一方、
イベント情報記録手段は、コンテンツ非生成イベント/コンテンツ非終了イベントを発生させたWebページに応じた前記コンテンツ番号を前記遷移テーブルから取得し、取得したコンテンツ番号をイベントテーブルのレコードに記述する
ことを特徴とする請求項3に記載のWeb閲覧履歴記録システム。
While the content transition information recorded in the transition table includes a content number consisting of a serial number assigned to each content,
The event information recording means acquires the content number corresponding to the Web page that generated the content non-generation event / content non-end event from the transition table, and describes the acquired content number in a record of the event table. The Web browsing history recording system according to claim 3 .
請求項1〜4のいずれか1項に記載のWeb閲覧履歴記録システムの各手段としてコンピュータを機能させるWeb閲覧履歴記録プログラム。 A Web browsing history recording program for causing a computer to function as each means of the Web browsing history recording system according to claim 1 .
JP2010236652A 2010-10-21 2010-10-21 Web page browsing history recording system and Web page browsing history recording program Active JP5337128B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010236652A JP5337128B2 (en) 2010-10-21 2010-10-21 Web page browsing history recording system and Web page browsing history recording program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010236652A JP5337128B2 (en) 2010-10-21 2010-10-21 Web page browsing history recording system and Web page browsing history recording program

Publications (2)

Publication Number Publication Date
JP2012089017A JP2012089017A (en) 2012-05-10
JP5337128B2 true JP5337128B2 (en) 2013-11-06

Family

ID=46260557

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010236652A Active JP5337128B2 (en) 2010-10-21 2010-10-21 Web page browsing history recording system and Web page browsing history recording program

Country Status (1)

Country Link
JP (1) JP5337128B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6043682B2 (en) * 2013-05-22 2016-12-14 日本電信電話株式会社 Terminal operation history collection system and terminal operation history collection method
CN103310007B (en) * 2013-06-28 2017-03-01 小米科技有限责任公司 Webpage changing method, device and equipment
JP6374828B2 (en) * 2015-05-14 2018-08-15 日本電信電話株式会社 History information transmitting method, history information transmitting apparatus, and history information transmitting program
CN111382387B (en) * 2020-03-06 2023-10-24 深圳市盟天科技有限公司 Webpage access method, device, equipment and storage medium based on applet

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3936835B2 (en) * 2000-09-20 2007-06-27 株式会社日立製作所 Terminal device for computer network and operation history recording method
JP2005258686A (en) * 2004-03-10 2005-09-22 Mitsubishi Electric Information Systems Corp Fault analyzing system and program
US20060004785A1 (en) * 2004-06-03 2006-01-05 International Business Machines Corporation Saving multiple browser instances as a selectable web project
JP2007279991A (en) * 2006-04-05 2007-10-25 It System Corp Log management program and recording medium
JP2007328423A (en) * 2006-06-06 2007-12-20 Bank Of Tokyo-Mitsubishi Ufj Ltd Browsing time calculation system for content, browsing time calculation method and program
JP5225004B2 (en) * 2008-10-03 2013-07-03 株式会社東芝 Content visualization apparatus and content visualization method
WO2010103717A1 (en) * 2009-03-11 2010-09-16 パナソニック株式会社 Digital broadcast receiver apparatus and image display method

Also Published As

Publication number Publication date
JP2012089017A (en) 2012-05-10

Similar Documents

Publication Publication Date Title
US20160259805A1 (en) Method for graphical representation of a content collection
US20150334068A1 (en) Message processing method and apparatus
AU2009257930B2 (en) Copying of animation effects from a source object to at least one target object
JP2013505500A (en) Automatic discovery of contextually related task items
JP5337128B2 (en) Web page browsing history recording system and Web page browsing history recording program
JP4469868B2 (en) Explanation expression adding device, program, and explanation expression adding method
JP2008033687A (en) Retrieval query generation device
CN103902404A (en) Method and device for media file backup and user equipment
CN104103087A (en) Picture display and management method and system with text introduction function
CN105956132A (en) Junk data clearing method and system
US20010030666A1 (en) Computer-human interaction apparatus and interaction system
CN105574163A (en) File processing method and device and electronic equipment
WO2021017899A1 (en) Method for efficiently cleaning equipment files and device
JP2006179008A (en) Method and apparatus for marketing using template, list, and activity
JP2008310514A (en) User operation history acquisition display device, user operation history acquisition display method, user operation history acquisition display program and recording medium recording that program
KR20140038418A (en) Search and browse hybrid
JP5271920B2 (en) Using structured data for online searching
JP2007156680A (en) File management device
JP2008504719A (en) Multimedia data playback method and apparatus using MPV profile
JP2009169474A (en) System log management support device and system log management support method
CN103294349A (en) Electronic document previewing method and electronic reading equipment applying same
JP2011059919A (en) Information management device, information management method, and information management program
Şentürk et al. Image and file system support framework for a digital mobile forensics software
JP5499914B2 (en) Information processing program and information processing apparatus
JP2004334530A (en) Web site edition supporting system and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130507

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130708

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130802

R150 Certificate of patent or registration of utility model

Ref document number: 5337128

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350