JP2014106745A - Web browsing history acquisition system and method, proxy server, and web browsing history acquisition program - Google Patents

Web browsing history acquisition system and method, proxy server, and web browsing history acquisition program Download PDF

Info

Publication number
JP2014106745A
JP2014106745A JP2012259134A JP2012259134A JP2014106745A JP 2014106745 A JP2014106745 A JP 2014106745A JP 2012259134 A JP2012259134 A JP 2012259134A JP 2012259134 A JP2012259134 A JP 2012259134A JP 2014106745 A JP2014106745 A JP 2014106745A
Authority
JP
Japan
Prior art keywords
web
browsing history
web page
proxy server
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012259134A
Other languages
Japanese (ja)
Other versions
JP5860389B2 (en
Inventor
Masahiro Yuguchi
昌宏 湯口
Akimichi Tanaka
明通 田中
Masashi Uchiyama
匡 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012259134A priority Critical patent/JP5860389B2/en
Publication of JP2014106745A publication Critical patent/JP2014106745A/en
Application granted granted Critical
Publication of JP5860389B2 publication Critical patent/JP5860389B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To acquire advertisement content information in a Web page while acquiring a Web browsing history on a proxy server.SOLUTION: A proxy server includes: Web browsing history acquisition means which, when a Web page is browsed via the proxy server, records a reception date on the proxy server and a URL into browsing history storage means and stores a received HTML into browsed content storage means as an HTML file; Web page analysis means which analyzes the HTML acquired by the Web browsing history acquisition means to acquire UTL information of an advertisement content; and Web browsing history analysis means which refers to the browsing history storage means to acquire history information having URL information of the advertisement content acquired by the Web page analysis means and records the acquired history information into advertisement distribution history storage means.

Description

本発明は、ユーザが閲覧したWebページの閲覧履歴情報を取得するWeb閲覧履歴取得システム及び方法及びプロキシサーバ及びWeb閲覧履歴取得プログラムに係り、特に、ユーザがWebページを閲覧した際に含まれる広告コンテンツに関する情報をプロキシサーバにて取得するためのWeb閲覧履歴取得システム及び方法及びプロキシサーバ及びWeb閲覧履歴取得プログラムに関する。   The present invention relates to a web browsing history acquisition system and method, a proxy server, and a web browsing history acquisition program for acquiring browsing history information of a web page browsed by a user, and in particular, an advertisement included when a user browses a web page The present invention relates to a Web browsing history acquisition system and method for acquiring information related to content in a proxy server, a proxy server, and a Web browsing history acquisition program.

Webページ中に含まれる広告コンテンツについて、その広告効果を検証するために、ユーザのWeb閲覧行動中に表示された広告コンテンツ情報を収集することが必要となる。   It is necessary to collect advertisement content information displayed during the user's Web browsing behavior in order to verify the advertisement effect of the advertisement content included in the Web page.

ユーザが閲覧したWebページの閲覧履歴情報を取得するシステムとしては、PC上にWebページの閲覧履歴を収集するソフトウェアをインストールし閲覧履歴情報を取得するものがある(例えば、特許文献1参照)。   As a system for acquiring browsing history information of a Web page browsed by a user, there is a system that acquires browsing history information by installing software that collects browsing history of a Web page on a PC (for example, see Patent Document 1).

また、プロキシサーバ経由でWebページを閲覧する場合において、Web閲覧履歴情報を収集し、プロキシサーバを通過するパケット情報を解析するシステムがある(例えば、特許文献2参照)。   Moreover, when browsing a Web page via a proxy server, there is a system that collects Web browsing history information and analyzes packet information passing through the proxy server (see, for example, Patent Document 2).

特開2009-289074号公報JP 2009-289074 特開2011-159102号公報JP 2011-159102 A

しかしながら、上記特許文献1に示すような、ユーザ端末においてWebページの閲覧履歴情報を取得する方式の場合、Webページ中に含まれる広告コンテンツはWebページを構成する一部として取得される。Webページ中の含まれる広告コンテンツ情報を抽出するためには、取得されたWeb閲覧履歴データを元に広告が掲載されている箇所を抽出し、広告コンテンツを取得する必要があるが、ユーザ端末中で広告情報を抽出する場合、処理性能が低い端末では負荷が高くなってしまうという問題がある。また、広告コンテンツが掲載される場所はWebサイトごとに異なるため、Webページごとに広告掲載箇所の解析も必要となり、解析処理による負荷が発生してしまう。   However, in the case of a method of acquiring browsing history information of a Web page at a user terminal as shown in Patent Document 1, advertisement content included in the Web page is acquired as part of the Web page. In order to extract the advertising content information included in the web page, it is necessary to extract the place where the advertisement is posted based on the acquired web browsing history data and acquire the advertising content, but in the user terminal When the advertisement information is extracted by the terminal, there is a problem that the load becomes high in a terminal having low processing performance. In addition, since the location where the advertisement content is posted differs from website to website, it is necessary to analyze the advertisement placement location for each web page, which causes a load due to analysis processing.

また、特許文献2のようにプロキシサーバを通過するパケット情報を解析し、広告情報を収集しようとすると、処理速度の速いプロキシサーバが必要となる。   Also, as disclosed in Patent Document 2, when analyzing packet information passing through a proxy server and collecting advertisement information, a proxy server having a high processing speed is required.

これらから、Web閲覧履歴を収集しながら、効率的に広告コンテンツの情報を取得する方法が必要となっている。   From these, there is a need for a method for efficiently acquiring advertising content information while collecting Web browsing history.

本発明は、上記の点に鑑みなされたもので、プロキシサーバ上でWeb閲覧履歴取得を実施しつつ、Webページ中の広告コンテンツ情報を取得することが可能なWeb閲覧履歴取得システム及び方法及びプロキシサーバ及びWeb閲覧履歴取得プログラムを提供することを目的とする。   The present invention has been made in view of the above points, and a web browsing history acquisition system, method, and proxy capable of acquiring advertisement content information in a web page while performing web browsing history acquisition on a proxy server The purpose is to provide a server and Web browsing history acquisition program.

上記の課題を解決するため、本発明(請求項1)は、ユーザが閲覧したWebページの閲覧履歴情報を取得するWeb閲覧履歴取得システムであって、
ユーザ端末がプロキシサーバ経由で前記Webページの閲覧を行うものとし、
前記プロキシサーバは、
取得した前記コンテンツのHTMLファイルを解析し、広告コンテンツに該当する履歴情報を抽出し、広告配信履歴記憶手段に格納する手段を含む。
In order to solve the above problems, the present invention (Claim 1) is a Web browsing history acquisition system for acquiring browsing history information of a Web page browsed by a user,
The user terminal shall browse the web page via a proxy server,
The proxy server is
A means for analyzing the acquired HTML file of the content, extracting history information corresponding to the advertisement content, and storing the history information in the advertisement distribution history storage means;

また、本発明(請求項2)は、前記プロキシサーバにおいて、
当該プロキシサーバを経由したWebページ閲覧が行われた際に、当該プロキシサーバでの受信日時、URLを閲覧履歴記憶手段に記録し、受信されたHTMLをHTMLファイルとして閲覧コンテンツ記憶手段に保存するWeb閲覧履歴取得手段と、
前記Web閲覧履歴取得手段にて得られた前記HTMLを解析して広告コンテンツのUTL情報を取得するWebページ解析手段と、
前記閲覧履歴記憶手段を参照し、前記Webページ解析手段で得られた前記広告コンテンツのURL情報を持つ履歴情報を取得し、前記広告配信履歴記憶手段に記録するWeb閲覧履歴解析手段と、を有する。
Further, the present invention (Claim 2) is the proxy server,
A Web that records the received date and time and URL at the proxy server in the browsing history storage means when the Web page is browsed via the proxy server, and saves the received HTML as an HTML file in the browsing content storage means Browsing history acquisition means;
Web page analysis means for analyzing the HTML obtained by the Web browsing history acquisition means and acquiring UTL information of advertising content;
Web browsing history analysis means for referring to the browsing history storage means, acquiring history information having URL information of the advertisement content obtained by the Web page analysis means, and recording the history information in the advertisement distribution history storage means; .

また、本発明(請求項3)は、前記Web閲覧履歴解析手段において、
前記Webページ解析手段で取得された受信日時よりも遅い中で最も近い時刻に受信された履歴情報を、Webページに含まれる広告コンテンツの配信履歴情報として前記広告配信履歴記憶手段に格納する手段を含む。
Further, the present invention (Claim 3) is the Web browsing history analyzing means,
Means for storing history information received at the nearest time later than the reception date and time acquired by the web page analyzing means in the advertisement delivery history storage means as distribution history information of advertisement content included in the web page; Including.

本発明を用いることにより、プロキシサーバ上でWeb閲覧履歴取得を実施しつつ、Webページ中の広告コンテンツ情報を取得することが可能となる。また、プロキシサーバでは、WebページのHTMLを解析することなくWebページに関連する広告コンテンツを収集することが可能であるため、プロキシサーバでの処理を軽減することができる。   By using the present invention, it is possible to acquire advertisement content information in a Web page while acquiring a Web browsing history on a proxy server. In addition, since the proxy server can collect advertising content related to the Web page without analyzing the HTML of the Web page, the processing in the proxy server can be reduced.

本発明の第1の実施の形態におけるシステム構成図である。It is a system configuration figure in a 1st embodiment of the present invention. 本発明の第1の実施の形態におけるWebページの例である。It is an example of the web page in the 1st Embodiment of this invention. 本発明の第1の実施の形態におけるプロキシサーバ上での通信状況を示す図である。It is a figure which shows the communication condition on the proxy server in the 1st Embodiment of this invention. 本発明の第1の実施の形態におけるプロキシサーバの構成図である。It is a block diagram of the proxy server in the 1st Embodiment of this invention.

以下、図面と共に本発明の実施の形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

[第1の実施の形態]
図1は、本発明の第1の実施の形態におけるシステム構成を示す。
[First Embodiment]
FIG. 1 shows a system configuration according to the first embodiment of the present invention.

Web閲覧履歴の収集対象となるユーザ端末1は、プロキシサーバ2を経由してインターネットに接続する。このとき、プロキシサーバ2には拡張機能が組み込まれており、ユーザ端末1がプロキシサーバ2を経由してWebページを閲覧した際のWeb閲覧履歴、及び、広告コンテンツ閲覧履歴を収集し、それぞれWeb閲覧履歴記憶部200、広告コンテンツ情報記憶部300に格納する。   The user terminal 1 that is the collection target of the web browsing history connects to the Internet via the proxy server 2. At this time, the proxy server 2 has an extended function, and collects the web browsing history and the advertisement content browsing history when the user terminal 1 browses the web page via the proxy server 2, and They are stored in the browsing history storage unit 200 and the advertisement content information storage unit 300.

図2は、本発明の第1の実施の形態におけるWebページの例である。   FIG. 2 is an example of a Web page according to the first embodiment of the present invention.

Webページ中には、同図に示すように広告コンテンツが様々な箇所に表示されるように構成されている。各広告は、同一ドメインの広告配信サーバや、別ドメインの広告配信サーバにて配信されていることが多く、ユーザ端末1のWebブラウザにて表示されるたびに広告配信サーバ3から広告コンテンツを取得する形式のものなどが存在する。   In the Web page, as shown in the figure, the advertisement content is configured to be displayed at various places. Each advertisement is often distributed by an advertisement distribution server of the same domain or an advertisement distribution server of another domain, and the advertisement content is acquired from the advertisement distribution server 3 each time it is displayed on the web browser of the user terminal 1. There is a format that does.

ユーザ端末1からプロキシサーバ2に対して、Webページの要求が行われた場合、プロキシサーバ2はWebサーバ4に対してWebページの要求を行う。プロキシサーバ2からのWebページの要求に対し、Webサーバ4からプロキシサーバ2にWebページのコンテンツが送信される。プロキシサーバ2は該Webページのコンテンツをユーザ端末1に送信することにより、ユーザ端末1のブラウザ上でWebページが表示される。この際、Webサーバ4からプロキシサーバ2に到着したWebページコンテンツを保存すれば、Web閲覧履歴を収集することが可能となる。   When a web page request is made from the user terminal 1 to the proxy server 2, the proxy server 2 sends a web page request to the web server 4. In response to the web page request from the proxy server 2, the web page content is transmitted from the web server 4 to the proxy server 2. The proxy server 2 transmits the content of the Web page to the user terminal 1 so that the Web page is displayed on the browser of the user terminal 1. At this time, if the Web page content that arrives at the proxy server 2 from the Web server 4 is saved, the Web browsing history can be collected.

図3は、本発明の第1の実施の形態におけるプロキシサーバ上での通信状況を示す。同図の例は、Webページの要求・応答が行われる際のプロキシサーバ2上での通信状況であり、プロキシサーバ2上での通信では、Webサーバ4に対してWebページ要求が行われた後、Webサーバ4からWebページ応答が行われるが、概ね短い時間内でプロキシサーバ2に到着する。このため、Webページを構成するコンテンツを取得する場合、Webページ要求が発生後、該当Webページが到着した時間を中心として周辺時間で通過したWebコンテンツを確認することで、効率的にWebページの構成コンテンツを取得することができる。   FIG. 3 shows the communication status on the proxy server in the first embodiment of the present invention. The example in the figure shows the communication status on the proxy server 2 when a web page request / response is made. In the communication on the proxy server 2, a web page request is made to the web server 4. Thereafter, a web page response is made from the web server 4, but arrives at the proxy server 2 within a short time. For this reason, when acquiring the contents that make up a web page, after the web page request occurs, by checking the web content that passed in the peripheral time centering on the time when the corresponding web page arrived, the web page can be efficiently Configuration content can be obtained.

図4は、本発明の第1の実施の形態におけるプロキシサーバの構成を示す。   FIG. 4 shows a configuration of the proxy server in the first exemplary embodiment of the present invention.

プロキシサーバ2は、Webページ要求受信部21、Webページ要求部22、Webページ提供部23、Webページ受信部24に加えて、プロキシサーバ拡張機能として、Webページ解析部25、Web閲覧履歴取得部26、Web閲覧履歴解析部27を有する。   In addition to the Web page request receiving unit 21, the Web page requesting unit 22, the Web page providing unit 23, and the Web page receiving unit 24, the proxy server 2 includes a Web page analysis unit 25, a Web browsing history acquisition unit as a proxy server extension function. 26, and a web browsing history analysis unit 27.

Web閲覧履歴取得部26では、Webページ受信部24にて受信した内容をWeb閲覧履歴としてWeb閲覧履歴記憶部200に保存する。このとき、受信したHTMLや画像データ等は閲覧コンテンツ保存DB220にファイルとして保存するとし、受信時の日時、URL、リファラ情報、保存したHTMLや画像データファイルのローカルパス情報を履歴情報保存テーブル230に記録する。   The web browsing history acquisition unit 26 stores the content received by the web page receiving unit 24 in the web browsing history storage unit 200 as a web browsing history. At this time, it is assumed that received HTML, image data, and the like are stored as files in the browsing content storage DB 220, and the date / time, URL, referrer information at the time of reception, and local path information of the stored HTML or image data file are stored in the history information storage table 230. Record.

Webページ解析部25では、Web閲覧履歴取得部26にて取得したWeb閲覧履歴中にHTMLが含まれる場合、該HTMLの受信日時情報の取得、及び、該HTMLの解析を行い、該Webページ中に含まれる広告掲載箇所のURL情報を取得する。広告掲載箇所のURL情報を取得する際に、対象とする広告コンテンツとしては、WebページのHTML中のスクリプトやiframe(inline frame)などで広告配信サーバ3から広告コンテンツを読み込む。このような広告の場合、Webページ用のWebサーバ4と広告配信サーバ3のアドレスが異なることから広告掲載箇所のURLを取得することができる。   In the Web page analysis unit 25, when HTML is included in the Web browsing history acquired by the Web browsing history acquisition unit 26, the HTML reception date / time information is acquired and the HTML is analyzed, and the Web page is analyzed. URL information of the advertisement placement location included in is acquired. When acquiring the URL information of the advertisement placement location, as the target advertisement content, the advertisement content is read from the advertisement distribution server 3 by a script or iframe (inline frame) in HTML of the Web page. In the case of such an advertisement, since the addresses of the Web server 4 for web pages and the advertisement distribution server 3 are different, the URL of the advertisement placement location can be acquired.

Web閲覧履歴解析部27では、閲覧履歴情報保存テーブル230を参照し、該Webページ解析部25にて取得された広告のURL情報と一致するURLを持つ履歴情報を抽出する。この際、該Webページ解析部25にて取得された受信日時よりも遅い中で最も近い時刻に受信された履歴情報を、該Webページに含まれる広告コンテンツの配信履歴情報として広告配信履歴保存テーブル210に保存するとし、該Webページの受信日時、該広告コンテンツの受信日時、広告URL、受信時のURL、リファラ情報、保存したコンテンツのローカルパス情報、などを広告配信履歴保存テーブル210に保存する。   The web browsing history analysis unit 27 refers to the browsing history information storage table 230 and extracts history information having a URL that matches the URL information of the advertisement acquired by the web page analysis unit 25. At this time, the history information received at the nearest time later than the reception date and time acquired by the Web page analysis unit 25 is used as the advertisement distribution history storage table as the distribution history information of the advertisement content included in the Web page. 210, the reception date / time of the Web page, the reception date / time of the advertisement content, the advertisement URL, the URL at the time of reception, referrer information, the local path information of the stored content, etc. are stored in the advertisement distribution history storage table 210. .

なお、プロキシサーバ2に接続するユーザ端末1が複数存在する場合は、Web閲覧履歴をユーザ別に分類可能とするため、閲覧履歴情報保存テーブル230、及び、広告配信履歴保存テーブル210にユーザを識別するための情報を記載するとしても良い。   When there are a plurality of user terminals 1 connected to the proxy server 2, the user is identified in the browsing history information storage table 230 and the advertisement distribution history storage table 210 so that the Web browsing history can be classified by user. Information may be described.

なお、図4のWebページ受信部24にて受信した内容のうち、Web閲覧履歴情報、及び、広告配信履歴情報として有用な内容のみ、Web閲覧履歴取得部26にて取得するとしても良い。例えば、ストリーミングコンテンツなどは取得対象から除外するとしても良い。さらに、Webページごとに取得対象を変更するとしても良く、取得対象コンテンツ管理テーブルなどを用いて管理するとしても良い。   Of the contents received by the web page receiving unit 24 in FIG. 4, only the contents useful as the web browsing history information and the advertisement distribution history information may be acquired by the web browsing history acquisition unit 26. For example, streaming content or the like may be excluded from acquisition targets. Furthermore, the acquisition target may be changed for each Web page, or may be managed using an acquisition target content management table or the like.

[第2の実施の形態]
本実施の形態では、広告配信サーバ情報を考慮した例を説明する。
[Second Embodiment]
In this embodiment, an example in which advertisement distribution server information is considered will be described.

本実施の形態におけるシステム構成、及び、プロキシサーバの構成は第1の実施の形態と同様である。   The system configuration and the proxy server configuration in the present embodiment are the same as those in the first embodiment.

Webページへ広告コンテンツを配信するサーバは、広告配信サーバと呼ばれる。広告配信サーバ3のアドレス数は有限のアドレス数でしかないため、広告配信サーバ3のアドレス情報をDBとして蓄積することが可能である。この広告配信サーバ3のアドレス情報を活用することにより、より効率的にWebページ中の広告情報を収集することが可能となる。現実的には、広告配信用サーバ3は管理可能な数のアドレス数でしかないため、事前に広告配信サーバ3のURLのテーブルを作成しておくことにより、当該URLテーブルを参照することにより広告掲載箇所のURLを取得することができる。   A server that distributes advertisement content to a Web page is called an advertisement distribution server. Since the number of addresses of the advertisement distribution server 3 is only a finite number, the address information of the advertisement distribution server 3 can be stored as a DB. By utilizing the address information of the advertisement distribution server 3, it becomes possible to collect the advertisement information in the Web page more efficiently. In reality, since the advertisement distribution server 3 has only a manageable number of addresses, by creating a URL table of the advertisement distribution server 3 in advance, an advertisement can be obtained by referring to the URL table. You can get the URL of the place.

そこで、前述の第1の実施の形態では、プロキシサーバ2のWebページ解析部25においてWeb閲覧履歴取得部26で取得されたHTMLの広告掲載箇所からURL情報を取得するとしたが、同Webページ解析部25において解析対象のHTML中に広告配信サーバ3のアドレスが含まれる場合は、閲覧履歴情報保存テーブル230中の該HTMLの受信日時周辺から該広告配信サーバアドレスを持つ履歴情報を参照し、受信日時よりも遅い中で最も近い時刻の履歴情報を広告配信履歴情報として広告配信履歴保存テーブル230に保存することで、Webページ中に掲載された広告コンテンツ情報を収集することが可能となる。但し、上記の「受信日時よりも遅い中で最も近い時刻」は、ある一定の時間範囲内に含まれる。時間範囲としては、広告配信サーバ3からの到着時間情報を収集し、平均値を求めることで、広告コンテンツが到着完了するまでの平均時間範囲を求めることができる。   Therefore, in the first embodiment described above, the Web page analysis unit 25 of the proxy server 2 acquires URL information from the advertisement placement location of the HTML acquired by the Web browsing history acquisition unit 26. When the address of the advertisement distribution server 3 is included in the analysis target HTML in the unit 25, the history information having the advertisement distribution server address is referred to from the vicinity of the reception date and time of the HTML in the browsing history information storage table 230 and received. By storing the history information at the closest time later than the date and time as the advertisement distribution history information in the advertisement distribution history storage table 230, it is possible to collect the advertisement content information posted in the web page. However, the above “closest time later than the reception date and time” is included in a certain time range. As the time range, the arrival time information from the advertisement distribution server 3 is collected and the average value is obtained, so that the average time range until the arrival of the advertisement content can be obtained.

なお、広告配信サーバ3からの到着時間情報は、時間帯や曜日によって変動する可能性がある。そこで、時間帯や曜日ごとでの最頻値や平均値を用いるとしても良い。   Note that the arrival time information from the advertisement distribution server 3 may vary depending on the time zone and the day of the week. Therefore, a mode value or an average value for each time zone or day of the week may be used.

[第3の実施の形態]
本実施の形態におけるシステム構成、及び、プロキシサーバの構成は第1の実施の形態と同様である。
[Third Embodiment]
The system configuration and the proxy server configuration in the present embodiment are the same as those in the first embodiment.

前述の実施の形態では、広告コンテンツの配信履歴を保存するのみであったが、プロキシサーバ2のWebページ解析部25において、各Webページの広告掲載箇所の位置情報をXPathとして取得し、広告配信履歴保存テーブル230に該XPathを合わせて保存するとしても良い。   In the above-described embodiment, only the distribution history of the advertisement content is stored. However, the Web page analysis unit 25 of the proxy server 2 acquires the position information of the advertisement placement location of each Web page as XPath, and distributes the advertisement. The XPath may be stored in the history storage table 230 together.

これにより、Webページ中のどの位置に掲載される広告コンテンツがユーザ端末1に配信されたのかを記録することが可能となる。   As a result, it is possible to record at which position in the Web page the advertisement content to be posted has been distributed to the user terminal 1.

[第4の実施の形態]
本実施の形態におけるシステム構成、及び、プロキシサーバの構成は第1の実施の形態と同様である。
[Fourth Embodiment]
The system configuration and the proxy server configuration in the present embodiment are the same as those in the first embodiment.

ユーザ端末1のWebブラウザに保存されたキャッシュが閲覧された場合、プロキシサーバ2に対してWebページの要求は発生しないため、プロキシサーバ2上ではWebページを受信しない。しかしながら、広告コンテンツについては、Webブラウザに表示されるごとに広告配信サーバ3に対し、広告コンテンツの要求を行う。この場合、プロキシサーバ上ではWebページは受信されないが、広告コンテンツは受信されることになる。よって、どのWebページに対する広告コンテンツであるか、判別することが困難となる。   When a cache stored in the web browser of the user terminal 1 is viewed, a web page request is not generated for the proxy server 2, and thus the web page is not received on the proxy server 2. However, the advertisement content is requested to the advertisement distribution server 3 every time it is displayed on the web browser. In this case, the Web page is not received on the proxy server, but the advertisement content is received. Therefore, it is difficult to determine which Web page the advertisement content is for.

そこで、本実施の形態では、ユーザ端末1上でWebブラウザのキャッシュにアクセスされた場合の広告配信履歴の保存方法の例を示す。   Therefore, in the present embodiment, an example of a method for storing the advertisement distribution history when the user terminal 1 accesses the cache of the Web browser is shown.

まず、ユーザ端末1のWebブラウザに対し、ブラウザキャッシュによるページ遷移のイベントが発生したかを取得するための拡張機能を追加する。ブラウザの拡張機能では、遷移したWebページのURL、及び、表示完了日時を取得し、プロキシサーバ拡張機能にWebブラウザの遷移情報として送信する。   First, an extended function is added to the Web browser of the user terminal 1 to acquire whether a page transition event has occurred due to the browser cache. In the browser extension function, the URL of the transitioned Web page and the display completion date and time are acquired and transmitted to the proxy server extension function as transition information of the Web browser.

プロキシサーバ拡張機能では、Web閲覧履歴解析部26にて該Webブラウザの遷移情報を解析し、表示完了日時周辺で取得された閲覧履歴情報を抽出する。この閲覧履歴情報のうち、広告配信サーバ3から配信された広告コンテンツの履歴情報について、広告配信履歴情報として扱うものとする。   In the proxy server extended function, the web browsing history analysis unit 26 analyzes the transition information of the web browser, and extracts browsing history information acquired around the display completion date and time. Among the browsing history information, the history information of the advertisement content distributed from the advertisement distribution server 3 is handled as the advertisement distribution history information.

なお、Webブラウザの拡張機能については、ブラウザキャッシュが閲覧された場合のみ、Webブラウザ遷移情報を収集するとしても良い。また、対象のWebページに関して、広告掲載箇所のXPath情報が存在する場合はXPathで定義される箇所のURL情報を取得し、Webブラウザ遷移情報に広告URL情報として保存するようにしても良い。プロキシサーバ側に送信されたWebブラウザ遷移情報に基づき、遷移日時周辺に存在する広告URL情報に一致する履歴情報を、広告配信履歴情報として扱うようにしても良い。   Note that Web browser transition information may be collected only when the browser cache is browsed for the extended functions of the Web browser. In addition, regarding the target Web page, if there is XPath information of the advertisement placement location, the URL information of the location defined by XPath may be acquired and stored as the advertisement URL information in the Web browser transition information. Based on the Web browser transition information transmitted to the proxy server, history information that matches advertisement URL information existing around the transition date and time may be handled as advertisement distribution history information.

なお、本発明は、上記のWeb閲覧履歴取得装置として利用されるプロキシサーバ2の各構成要素の動作をプログラムとして構築し、ネットワークを介して流通させる、または、Web閲覧履歴取得装置として利用されるコンピュータにインストールして実行させることが可能である。   The present invention constructs the operation of each component of the proxy server 2 used as the above-mentioned Web browsing history acquisition device as a program and distributes it via a network, or is used as a Web browsing history acquisition device. It can be installed and executed on a computer.

本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。   The present invention is not limited to the above-described embodiments, and various modifications and applications are possible within the scope of the claims.

1 ユーザ端末
2 プロキシサーバ
3 広告配信サーバ
4 Webサーバ
21 Webページ要求受信部
22 Webページ要求部
23 Webページ提供部
24 Webページ受信部
25 Webページ解析部
26 Web閲覧履歴取得部
27 Web閲覧履歴解析部
200 Web閲覧履歴記憶部
210 広告配信履歴保存テーブル
220 閲覧コンテンツ保存DB
230 閲覧履歴情報保存テーブル
300 広告コンンテンツ情報記憶部
1 User terminal 2 Proxy server 3 Advertisement distribution server 4 Web server 21 Web page request receiving unit 22 Web page requesting unit 23 Web page providing unit 24 Web page receiving unit 25 Web page analyzing unit 26 Web browsing history acquiring unit 27 Web browsing history analyzing Unit 200 Web browsing history storage unit 210 advertisement distribution history storage table 220 browsing content storage DB
230 browsing history information storage table 300 advertisement content information storage unit

Claims (8)

ユーザが閲覧したWebページの閲覧履歴情報を取得するWeb閲覧履歴取得システムであって、
ユーザ端末がプロキシサーバ経由で前記Webページの閲覧を行うものとし、
前記プロキシサーバは、
取得した前記コンテンツのHTMLファイルを解析し、広告コンテンツに該当する履歴情報を抽出し、広告配信履歴記憶手段に格納する手段を有する
ことを特徴とするWeb閲覧履歴取得システム。
A web browsing history acquisition system that acquires browsing history information of web pages browsed by a user,
The user terminal shall browse the web page via a proxy server,
The proxy server is
A Web browsing history acquisition system comprising means for analyzing the acquired HTML file of the content, extracting history information corresponding to the advertisement content, and storing it in the advertisement distribution history storage means.
前記プロキシサーバは、
当該プロキシサーバを経由したWebページ閲覧が行われた際に、当該プロキシサーバでの受信日時、URLを閲覧履歴記憶手段に記録し、受信されたHTMLをHTMLファイルとして閲覧コンテンツ記憶手段に保存するWeb閲覧履歴取得手段と、
前記Web閲覧履歴取得手段にて得られた前記HTMLを解析して広告コンテンツのUTL情報を取得するWebページ解析手段と、
前記閲覧履歴記憶手段を参照し、前記Webページ解析手段で得られた前記広告コンテンツのURL情報を持つ履歴情報を取得し、前記広告配信履歴記憶手段に記録するWeb閲覧履歴解析手段と、
を有する請求項1記載のWeb閲覧履歴取得システム。
The proxy server is
A Web that records the received date and time and URL at the proxy server in the browsing history storage means when the Web page is browsed via the proxy server, and saves the received HTML as an HTML file in the browsing content storage means Browsing history acquisition means;
Web page analysis means for analyzing the HTML obtained by the Web browsing history acquisition means and acquiring UTL information of advertising content;
Web browsing history analysis means for referring to the browsing history storage means, obtaining history information having URL information of the advertising content obtained by the Web page analysis means, and recording it in the advertisement distribution history storage means;
The web browsing history acquisition system according to claim 1, comprising:
前記Web閲覧履歴解析手段は、
前記Webページ解析手段で取得された受信日時よりも遅い中で最も近い時刻に受信された履歴情報を、Webページに含まれる広告コンテンツの配信履歴情報として前記広告配信履歴記憶手段に格納する手段を含む
請求項2記載のWeb閲覧履歴取得システム。
The web browsing history analysis means is:
Means for storing history information received at the nearest time later than the reception date and time acquired by the web page analyzing means in the advertisement delivery history storage means as distribution history information of advertisement content included in the web page; The web browsing history acquisition system according to claim 2, including the system.
ユーザが閲覧したWebページの閲覧履歴情報を取得するWeb閲覧履歴取得方法であって、
ユーザ端末、プロキシサーバ、Webサーバを有するシステムにおいて、
前記ユーザ端末が前記プロキシサーバ経由で前記Webページの閲覧を行うものとし、
前記プロキシサーバにおいて、
取得した前記コンテンツのHTMLファイルを解析し、広告コンテンツに該当する履歴情報を抽出し、広告配信履歴記憶手段に格納する
ことを特徴とするWeb閲覧履歴取得方法。
A web browsing history acquisition method for acquiring browsing history information of a web page viewed by a user,
In systems with user terminals, proxy servers, and web servers,
The user terminal shall browse the web page via the proxy server,
In the proxy server,
A Web browsing history acquisition method comprising: analyzing the acquired HTML file of the content, extracting history information corresponding to the advertisement content, and storing the history information in an advertisement distribution history storage unit.
前記プロキシサーバにおいて、
当該プロキシサーバを経由したWebページ閲覧が行われた際に、当該プロキシサーバでの受信日時、URLを閲覧履歴記憶手段に記録し、受信されたHTMLをHTMLファイルとして閲覧コンテンツ記憶手段に保存するWeb閲覧履歴取得ステップと、
前記Web閲覧履歴取得ステップにて得られた前記HTMLを解析して広告コンテンツのUTL情報を取得するWebページ解析ステップと、
前記閲覧履歴記憶手段を参照し、前記Webページ解析ステップで得られた前記広告コンテンツのURL情報を持つ履歴情報を取得し、前記広告配信履歴記憶手段に記録するWeb閲覧履歴解析ステップと、
を行う請求項4記載のWeb閲覧履歴取得方法。
In the proxy server,
A Web that records the received date and time and URL at the proxy server in the browsing history storage means when the Web page is browsed via the proxy server, and saves the received HTML as an HTML file in the browsing content storage means Browsing history acquisition step;
Web page analysis step of acquiring the UTL information of the advertising content by analyzing the HTML obtained in the Web browsing history acquisition step;
Referencing the browsing history storage means, obtaining history information having URL information of the advertising content obtained in the Web page analysis step, and recording in the advertisement distribution history storage means, a Web browsing history analysis step;
The Web browsing history acquisition method according to claim 4, wherein:
前記Web閲覧履歴解析ステップにおいて、
前記Webページ解析ステップで取得された受信日時よりも遅い中で最も近い時刻に受信された履歴情報を、Webページに含まれる広告コンテンツの配信履歴情報として前記広告配信履歴記憶手段に格納する
請求項5記載のWeb閲覧履歴取得方法。
In the web browsing history analysis step,
The history information received at the closest time later than the reception date and time acquired in the Web page analysis step is stored in the advertisement distribution history storage means as distribution history information of advertisement content included in the Web page. 5. Web browsing history acquisition method according to 5.
ユーザが閲覧したWebページの閲覧履歴情報を取得するシステムにおけるプロキシサーバであって、
当該プロキシサーバを経由したWebページ閲覧が行われた際に、当該プロキシサーバでの受信日時、URLを閲覧履歴記憶手段に記録し、受信されたHTMLをHTMLファイルとして閲覧コンテンツ記憶手段に保存するWeb閲覧履歴取得手段と、
前記Web閲覧履歴取得手段にて得られた前記HTMLを解析して広告コンテンツのUTL情報を取得するWebページ解析手段と、
前記閲覧履歴記憶手段を参照し、前記Webページ解析手段で得られた前記広告コンテンツのURL情報を持つ履歴情報を取得し、前記広告配信履歴記憶手段に記録するWeb閲覧履歴解析手段と、
を有することを特徴とするプロキシサーバ。
A proxy server in a system for obtaining browsing history information of a web page viewed by a user,
A Web that records the received date and time and URL at the proxy server in the browsing history storage means when the Web page is browsed via the proxy server, and saves the received HTML as an HTML file in the browsing content storage means Browsing history acquisition means;
Web page analysis means for analyzing the HTML obtained by the Web browsing history acquisition means and acquiring UTL information of advertising content;
Web browsing history analysis means for referring to the browsing history storage means, obtaining history information having URL information of the advertising content obtained by the Web page analysis means, and recording it in the advertisement distribution history storage means;
A proxy server.
コンピュータを、
請求項7に記載のプロキシサーバを構成する各手段として機能させるためのWeb閲覧履歴取得プログラム。
Computer
A Web browsing history acquisition program for functioning as each means constituting the proxy server according to claim 7.
JP2012259134A 2012-11-27 2012-11-27 Web browsing history acquisition system and method, proxy server, and Web browsing history acquisition program Expired - Fee Related JP5860389B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012259134A JP5860389B2 (en) 2012-11-27 2012-11-27 Web browsing history acquisition system and method, proxy server, and Web browsing history acquisition program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012259134A JP5860389B2 (en) 2012-11-27 2012-11-27 Web browsing history acquisition system and method, proxy server, and Web browsing history acquisition program

Publications (2)

Publication Number Publication Date
JP2014106745A true JP2014106745A (en) 2014-06-09
JP5860389B2 JP5860389B2 (en) 2016-02-16

Family

ID=51028176

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012259134A Expired - Fee Related JP5860389B2 (en) 2012-11-27 2012-11-27 Web browsing history acquisition system and method, proxy server, and Web browsing history acquisition program

Country Status (1)

Country Link
JP (1) JP5860389B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017096794A1 (en) * 2015-12-10 2017-06-15 乐视控股(北京)有限公司 Method, device, and system for transmitting advertising data
JP7397251B1 (en) 2022-09-16 2023-12-13 Lineヤフー株式会社 Information processing device, information processing method, and information processing program

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002202931A (en) * 2000-12-28 2002-07-19 K-Tai Net:Kk Server and recording medium
JP2002530700A (en) * 1998-11-16 2002-09-17 サン・マイクロシステムズ・インコーポレーテッド Local advertising method and apparatus
JP2002287673A (en) * 2001-03-28 2002-10-04 Minolta Co Ltd System and method for distributing information
JP2002535689A (en) * 1998-11-16 2002-10-22 サン・マイクロシステムズ・インコーポレーテッド Method and apparatus for negotiating local advertising terms
JP2003030034A (en) * 2001-07-10 2003-01-31 Nippon Telegr & Teleph Corp <Ntt> Method, device, for providing contents, contents provision program and recording medium in which contents provision program is recorded
JP2003296503A (en) * 2002-04-03 2003-10-17 Dino Co Ltd Internet advertisement evaluation method and system
JP2015527795A (en) * 2012-06-28 2015-09-17 アズキ システムズ, インク. Method and system for inserting advertisements in live media delivery delivered via the Internet

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002530700A (en) * 1998-11-16 2002-09-17 サン・マイクロシステムズ・インコーポレーテッド Local advertising method and apparatus
JP2002535689A (en) * 1998-11-16 2002-10-22 サン・マイクロシステムズ・インコーポレーテッド Method and apparatus for negotiating local advertising terms
JP2002202931A (en) * 2000-12-28 2002-07-19 K-Tai Net:Kk Server and recording medium
JP2002287673A (en) * 2001-03-28 2002-10-04 Minolta Co Ltd System and method for distributing information
JP2003030034A (en) * 2001-07-10 2003-01-31 Nippon Telegr & Teleph Corp <Ntt> Method, device, for providing contents, contents provision program and recording medium in which contents provision program is recorded
JP2003296503A (en) * 2002-04-03 2003-10-17 Dino Co Ltd Internet advertisement evaluation method and system
JP2015527795A (en) * 2012-06-28 2015-09-17 アズキ システムズ, インク. Method and system for inserting advertisements in live media delivery delivered via the Internet

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017096794A1 (en) * 2015-12-10 2017-06-15 乐视控股(北京)有限公司 Method, device, and system for transmitting advertising data
JP7397251B1 (en) 2022-09-16 2023-12-13 Lineヤフー株式会社 Information processing device, information processing method, and information processing program
JP2024042917A (en) * 2022-09-16 2024-03-29 Lineヤフー株式会社 Information processor, method for processing information, and information processing program

Also Published As

Publication number Publication date
JP5860389B2 (en) 2016-02-16

Similar Documents

Publication Publication Date Title
US11032388B2 (en) Methods for prerendering and methods for managing and configuring prerendering operations
CN107463641B (en) System and method for improving access to search results
US8893043B2 (en) Method and system for predictive browsing
US11019179B2 (en) Access to network content
WO2016173200A1 (en) Malicious website detection method and system
CN104426925B (en) Web page resources acquisition methods and device
US9912767B1 (en) Third-party cross-site data sharing
CN102299832A (en) General network flow counting method
CN106294648A (en) A kind of processing method and processing device for page access path
WO2015103122A2 (en) A method and system for tracking and gathering multivariate testing data
Charzinski Traffic properties, client side cachability and CDN usage of popular web sites
CN104572777A (en) Webpage loading method and device based on UIWebView component
WO2017136755A1 (en) Analyzing analytic element network traffic
US20150127771A1 (en) Method and Apparatus
CN111431767A (en) Multi-browser resource synchronization method and device, computer equipment and storage medium
US9396259B1 (en) Capture of web application state
JP5860389B2 (en) Web browsing history acquisition system and method, proxy server, and Web browsing history acquisition program
CN108108381B (en) Page monitoring method and device
CN102694802A (en) Method and device for recording network access information
KR101270393B1 (en) Systme for providing updated data of rss contents using user agent and method thereof
Barsomo et al. Device-aware Adaptation of Websites
CN105938473A (en) Method and device for saving website snapshots

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151027

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151218

R150 Certificate of patent or registration of utility model

Ref document number: 5860389

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees