JP2003157210A - Method for collecting data and implementation device therefor - Google Patents

Method for collecting data and implementation device therefor

Info

Publication number
JP2003157210A
JP2003157210A JP2001354955A JP2001354955A JP2003157210A JP 2003157210 A JP2003157210 A JP 2003157210A JP 2001354955 A JP2001354955 A JP 2001354955A JP 2001354955 A JP2001354955 A JP 2001354955A JP 2003157210 A JP2003157210 A JP 2003157210A
Authority
JP
Japan
Prior art keywords
data
page
client
category
control rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001354955A
Other languages
Japanese (ja)
Inventor
Akihiko Kawasaki
明彦 川崎
Yoshinori Sato
嘉則 佐藤
Toyohisa Morita
豊久 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2001354955A priority Critical patent/JP2003157210A/en
Publication of JP2003157210A publication Critical patent/JP2003157210A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a technique capable of supporting an analysis taking into consideration a control rule at the time when a response page is prepared in analyzing an access status to a server form a client. SOLUTION: This technique has a step for acquiring and outputting contents definition data according to a control rule that corresponds to a page preparation request received from the client, a step for outputting control rule information showing the control rule used in acquiring the contents definition data, a step for transmitting to the client a response page obtained by attaching page category data and additional information data showing the contents of the control rule information to page text data; and a step for transmitting the additional information data in the transmitted response page to a collection server from the client.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明はWWW等のインターネ
ット環境においてクライアントのアクセス状況を表すデ
ータを収集するデータ収集システムに関し、特にクライ
アントのアクセスしたページのカテゴリや特徴を示すデ
ータを収集するデータ収集システムに適用して有効な技
術に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a data collection system that collects data indicating the access status of a client in an Internet environment such as WWW, and more particularly to a data collection system that collects data indicating the category and characteristics of a page accessed by a client. It is related to the technology effectively applied to.

【0002】[0002]

【従来の技術】現在、インターネットと呼ばれるネット
ワーク網において、WWW(World Wide Web)が提供されて
いる。Webクライアントは、WebサーバからHTML(Hyper T
ext Markup Language)で記述されたデータを受信するク
ライアントであり、Webサーバとの通信にはHTTP(Hypert
ext Transfer Protocol)、FTP(File Transfer Protoco
l)等のプロトコルが用いられる。WWW上のリソースは、U
RI(Uniform Resource Identifiers)で参照できる様にな
っており、またHTMLデータには他のリソースへのURIを
含めることができる。
2. Description of the Related Art Currently, WWW (World Wide Web) is provided in a network called the Internet. The web client sends HTML (Hyper T
It is a client that receives data described in ext Markup Language), and HTTP (Hypert
ext Transfer Protocol), FTP (File Transfer Protoco
A protocol such as l) is used. Resources on the WWW are U
It can be referenced by RI (Uniform Resource Identifiers), and HTML data can include URIs to other resources.

【0003】HTML、HTTP、FTP、URI等に関しては、W3C
(World Wide Web Consortium)提供の各種ドキュメント
に述べられている。またインターネット一般の技術はIE
SG(TheInternet Engineering Steering Group)、IETF(I
nternet Engineering Task Force)が策定しているRFC(R
equest for Comment)に述べられている。HTML、URI に
関してはRFC2396、1866、2080、2396等、HTTPに関して
はRFC2068、2069等、FTPについてはRFC765等に述べられ
ている。
W3C for HTML, HTTP, FTP, URI, etc.
It is described in various documents provided by (World Wide Web Consortium). In addition, general Internet technology is IE
SG (The Internet Engineering Steering Group), IETF (I
RFC (R
equest for Comment). RFC2396, 1866, 2080, 2396, etc. for HTML and URI, RFC2068, 2069, etc. for HTTP, and RFC765, etc. for FTP.

【0004】Webサーバの多くは、クライアントからの
リクエストをログデータとして蓄積する機能を有してお
り、Webサーバのアクセスログには、アクセスしてきた
クライアントのホスト名やIPアドレス、タイムスタン
プ、URI等が蓄積される。またWebサーバはcookieを用い
て、繰り返しアクセスしてきたクライアントを特定する
ことが可能であり、これによりWebサーバのログとは別
に、クライアント毎のアクセス状況をデータに残すこと
ができる。この様にURIをベースとするアクセス状況の
蓄積方法を以下では従来技術1と呼ぶ。
Many Web servers have a function of accumulating requests from clients as log data, and the access log of the Web server has a host name, IP address, time stamp, URI, etc. of the accessing client. Is accumulated. In addition, the Web server can specify the client that has repeatedly accessed by using the cookie, and thus the access status of each client can be recorded in the data separately from the Web server log. Such a method of accumulating the access situation based on the URI will be referred to as "prior art 1" below.

【0005】また、アクセス状況に関するデータを蓄積
する別の方法としては、意味内容でページを典型的なカ
テゴリに分類しておき、ページへのアクセスが発生した
際には該当するカテゴリを記録するという方法がある。
この様にページのカテゴリを蓄積可能な方法を以下では
従来技術2と呼ぶ。従来技術2を用いると、アクセスさ
れたカテゴリ毎にログデータを集計することができる。
As another method of accumulating data on access status, pages are classified into typical categories according to the meaning and the corresponding categories are recorded when a page is accessed. There is a way.
Hereinafter, a method capable of accumulating page categories in this way will be referred to as "prior art 2". By using the conventional technique 2, log data can be aggregated for each accessed category.

【0006】またcookieによるクライアントの識別情報
と、ページカテゴリの定義を共有することにより、複数
のWebサーバに対するアクセス状況を従来技術2を用い
てログに蓄積しておき、全てのログデータを後から一つ
にまとめて集計することができる。良く知られた応用方
法は、クライアントが受信するHTMLデータの中に、ログ
データを蓄積するサーバへデータを送信するURIを含め
ておく、というものである。
Further, by sharing the client identification information by the cookie and the definition of the page category, the access statuses to a plurality of Web servers are accumulated in the log by using the conventional technique 2, and all the log data are recorded later. Can be aggregated into one and aggregated. A well-known application method is to include a URI for sending data to a server that stores log data in the HTML data that the client receives.

【0007】なおハイパーテキストシステムのページ構
成の問題の原因・改善策を提示し、容易にページ構成を
改善できるようにするハイパーテキスト解析装置及び方
法については特開2001−166981号公報に記載
されている。またハイパーテキストのリンクを辿り、リ
ンク先の文書データを得ることのできるハイパーテキス
ト閲覧装置及びその表示制御方法並びに記録媒体につい
ては特開2001−154777号公報に記載されてい
る。
A hypertext analysis device and method for presenting the cause / improvement measure of the page structure problem of the hypertext system and easily improving the page structure is described in Japanese Patent Laid-Open No. 2001-166981. There is. Further, JP-A-2001-154777 describes a hypertext browsing device, a display control method thereof, and a recording medium capable of obtaining document data of a link destination by following a hypertext link.

【0008】[0008]

【発明が解決しようとする課題】前記従来技術における
URIは文字列で表現されるリソースの識別子に過ぎず、U
RIが指し示すリソースの内容を直接表している訳ではな
い。従って従来技術1では、蓄積されるデータそれ自体
を用いてページ内容に基づいた分析を実施することが困
難であるという問題がある。
DISCLOSURE OF THE INVENTION Problems to be Solved by the Invention
URI is just a resource identifier expressed as a character string, and U
It does not directly represent the content of the resource pointed to by RI. Therefore, in Conventional Technique 1, there is a problem that it is difficult to perform analysis based on page contents using the accumulated data itself.

【0009】従来技術2では、クライアントに送信する
ページの中に、ページカテゴリを埋め込んでおくこと
で、クライアントがどの様なページにアクセスしたかを
ログに蓄積することが可能である。しかしながら従来技
術2で蓄積されるログデータには、サーバにアクセスし
たクライアントの利用者に対してどの様な情報が提供さ
れていたのかの詳細が残らないという問題がある。例え
ば、クライアントに何らかの検索結果の一覧が表示され
ている状況で、クライアントの利用者が一つの検索結果
を選択した場合、従来技術2においてはどれを選択した
かはログデータとして残るが、何件の中から選ばれたの
かといった類の情報は残らない。
In the prior art 2, by embedding the page category in the page to be sent to the client, it is possible to store in the log what page the client accessed. However, there is a problem that the log data accumulated in the related art 2 does not retain details of what information was provided to the user of the client who accessed the server. For example, when the client user selects one search result in the situation where a list of some search results is displayed on the client, in the prior art 2, which selection remains as log data, but how many There is no information such as whether it was selected from among.

【0010】更に、近年のWWWベースの情報システムに
おいては、同じURIに対して利用者毎若しくはクライア
ント毎に異なったページ内容を割り当てる、パーソナリ
ゼーションと呼ばれる技術が用いられる様になってい
る。従来技術2では、ページのカスタマイズに関する情
報が残らないという問題がある。この様な情報が欠落し
ていると、パーソナリゼーションが利用者の行動に与え
た影響の大きさを推し量ることが困難になり、ログデー
タを用いて何らかの分析を実施する際に適切な結果が得
られない場合がある。例えば、従来技術2のログデータ
からクライアント利用者の趣味嗜好の傾向を抽出したと
する。ある利用者が頻繁に見ているページカテゴリが判
明したとしても、この結果が利用者本来の趣味嗜好を表
しているのか、パーソナリゼーションにより特定カテゴ
リのページが優先的に提示されていたことを表している
のかの区別がつかない。
Further, in recent WWW-based information systems, a technique called personalization has been used in which different page contents are assigned to the same URI for each user or each client. The related art 2 has a problem that information regarding page customization does not remain. The lack of such information makes it difficult to assess the impact of personalization on user behavior, and will give appropriate results when performing some analysis using log data. May not be. For example, assume that the tendency of the hobby and preference of the client user is extracted from the log data of Conventional Technique 2. Even if the page category frequently seen by a certain user is found, it may indicate that this result represents the user's original taste or preference, or that the page of a specific category was preferentially presented by personalization. I can't tell if they are there.

【0011】本発明の目的は上記問題を解決し、クライ
アントからサーバへのアクセス状況を表すログデータを
分析する際に、応答ページ生成時の制御ルールを考慮し
た分析を支援することが可能な技術を提供することにあ
る。本発明の他の目的はクライアントからサーバへのア
クセス状況を表すログデータを分析する際に、応答ペー
ジ生成時の各項目の状況を考慮した分析を支援すること
が可能な技術を提供することにある。
The object of the present invention is to solve the above problems and to support the analysis in consideration of the control rule when the response page is generated when analyzing the log data representing the access status from the client to the server. To provide. Another object of the present invention is to provide a technique capable of supporting an analysis in consideration of the status of each item at the time of generating a response page when analyzing log data representing the access status from a client to a server. is there.

【0012】[0012]

【課題を解決するための手段】本発明は、クライアント
からサーバへのアクセス状況を表すデータを収集するデ
ータ収集システムにおいて、ページ生成リクエストに対
応する応答ページを作成する際に用いられた制御ルール
の情報を収集サーバ中の行動履歴データベースに格納す
るものである。
SUMMARY OF THE INVENTION The present invention relates to a control rule used when a response page corresponding to a page generation request is created in a data collection system that collects data representing the access status from a client to a server. The information is stored in the action history database in the collection server.

【0013】本発明のデータ収集システムでは、クライ
アントからページ生成リクエストを受信すると、ページ
カテゴリ定義データベースを参照し、その受信したペー
ジ生成リクエストに対応するカテゴリを示すページカテ
ゴリデータをページカテゴリ定義データベースから読み
出してページ生成処理部へ出力する。
In the data collection system of the present invention, when a page generation request is received from a client, the page category definition database is referenced, and page category data indicating a category corresponding to the received page generation request is read from the page category definition database. And outputs it to the page generation processing unit.

【0014】また、前記受信したページ生成リクエスト
の引数に対応するコンテンツIDを制御ルールデータベー
スから読み出した後、そのコンテンツIDによりコンテン
ツ定義データベースを参照し、そのページ生成リクエス
トに対応した応答ページを構成する各項目の内容を示す
コンテンツ定義データを取得してページ生成処理部へ出
力し、ページ生成処理部では、前記出力されたコンテン
ツ定義データ中の各項目の内容を用いてページ本文デー
タを作成する。また、前記コンテンツ定義データの取得
の際に用いられた制御ルールを示す制御ルール情報もペ
ージ生成処理部へ出力する。
Further, after the content ID corresponding to the argument of the received page generation request is read from the control rule database, the content definition database is referred to by the content ID, and the response page corresponding to the page generation request is constructed. Content definition data indicating the content of each item is acquired and output to the page generation processing unit, and the page generation processing unit creates page text data using the content of each item in the output content definition data. The control rule information indicating the control rule used when the content definition data is acquired is also output to the page generation processing unit.

【0015】ページ生成処理部は、前記ページカテゴリ
データ及び制御ルール情報の両方が出力されると、それ
らの内容を示す付加情報データを付加情報データ生成処
理部により生成した後、前記生成したページ本文データ
に前記付加情報データを付加して出力ページデータを生
成し、その出力ページデータを応答ページとしてクライ
アントへ送信する。
When both the page category data and the control rule information are output, the page generation processing unit generates additional information data indicating their contents by the additional information data generation processing unit, and then the generated page body. The additional information data is added to the data to generate output page data, and the output page data is transmitted to the client as a response page.

【0016】クライアントでは、前記送信された応答ペ
ージを受信して表示し、その中の付加情報データをクラ
イアントから収集サーバへ送信する。また収集サーバで
は、前記クライアントから受信した付加情報データ中の
ページカテゴリデータ及び制御ルール情報を収集サーバ
中の行動履歴データベースに格納し、クライアントから
サーバへのアクセス状況を分析する際には、制御ルール
に対する影響を考慮してログデータの内容を修正し、正
確な分析を支援する。
The client receives and displays the transmitted response page, and the additional information data therein is transmitted from the client to the collecting server. The collection server stores the page category data and the control rule information in the additional information data received from the client in the action history database in the collection server, and when analyzing the access status from the client to the server, the control rule The contents of the log data are corrected in consideration of the influence on the, and the accurate analysis is supported.

【0017】以上の様に本発明のデータ収集システムに
よれば、ページ生成リクエストに対応する応答ページを
作成する際に用いられた制御ルールの情報を収集サーバ
中の行動履歴データベースに格納するので、クライアン
トからサーバへのアクセス状況を表すログデータを分析
する際に、応答ページ生成時の制御ルールを考慮した分
析を支援することが可能である。
As described above, according to the data collection system of the present invention, the information of the control rule used when creating the response page corresponding to the page generation request is stored in the action history database in the collection server. When analyzing the log data indicating the access status from the client to the server, it is possible to support the analysis in consideration of the control rule when the response page is generated.

【0018】[0018]

【発明の実施の形態】以下にクライアントからサーバへ
のアクセス状況を表すデータを収集する一実施形態のデ
ータ収集システムについて説明する。
BEST MODE FOR CARRYING OUT THE INVENTION A data collection system of one embodiment for collecting data representing the access status from a client to a server will be described below.

【0019】図1は本実施形態のデータ収集システムの
概略構成とデータの流れを示す図である。図1に示す様
に本実施形態のデータ送受信装置100は、ページ生成
処理部101と、ページカテゴリ出力処理部102と、
コンテンツ生成処理部103と、制御ルール出力処理部
104と、構成要素出力処理部105と、タグ生成処理
部106と、特徴量抽出処理部107とを有している。
FIG. 1 is a diagram showing a schematic configuration and a data flow of the data collection system of this embodiment. As shown in FIG. 1, the data transmission / reception device 100 of the present embodiment includes a page generation processing unit 101, a page category output processing unit 102,
The content generation processing unit 103, the control rule output processing unit 104, the component output processing unit 105, the tag generation processing unit 106, and the feature amount extraction processing unit 107 are included.

【0020】ページ生成処理部101は、コンテンツ生
成処理部103で取得されたコンテンツ定義データ中の
各項目の内容を用いてページ本文データを作成し、その
本文データにタグ生成処理部106で生成された付加情
報データを付加して出力ページデータを生成し、その出
力ページデータを応答ページ113としてクライアント
へ送信する処理部である。
The page generation processing unit 101 creates page body data using the contents of each item in the content definition data acquired by the content generation processing unit 103, and the tag generation processing unit 106 generates the page body data. It is a processing unit that adds the additional information data to generate output page data and transmits the output page data as a response page 113 to the client.

【0021】ページカテゴリ出力処理部102は、クラ
イアントから受信したページ生成リクエスト112に対
応するカテゴリを示すページカテゴリデータをページカ
テゴリ定義データベース108から読み出して出力する
処理部である。
The page category output processing unit 102 is a processing unit which reads out from the page category definition database 108 the page category data indicating the category corresponding to the page generation request 112 received from the client and outputs it.

【0022】コンテンツ生成処理部103は、前記受信
したページ生成リクエスト112に対応する制御ルール
に従ってコンテンツ定義データベース110を参照した
りページ生成リクエスト112に対応する処理を実行
し、そのページ生成リクエスト112に対応した応答ペ
ージ113を構成する各項目の内容を示すコンテンツ定
義データを取得して出力する処理部である。
The content generation processing unit 103 refers to the content definition database 110 according to the control rule corresponding to the received page generation request 112 or executes the processing corresponding to the page generation request 112, and responds to the page generation request 112. It is a processing unit that acquires and outputs content definition data indicating the content of each item that constitutes the response page 113.

【0023】制御ルール出力処理部104は、前記コン
テンツ定義データの取得の際に用いられた制御ルールを
示す制御ルール情報を出力する処理部である。構成要素
出力処理部105は、前記取得したコンテンツ定義デー
タ中の各項目の特徴量を特徴量抽出処理部107へ出力
する処理部である。
The control rule output processing unit 104 is a processing unit that outputs control rule information indicating a control rule used when the content definition data is acquired. The component output processing unit 105 is a processing unit that outputs the feature amount of each item in the acquired content definition data to the feature amount extraction processing unit 107.

【0024】タグ生成処理部106は、前記ページカテ
ゴリデータと少なくとも制御ルール情報またはページ要
約データのいずれかが出力された場合にそれらの内容を
示す付加情報データをタグとして生成する付加情報デー
タ生成処理部である。特徴量抽出処理部107は、構成
要素出力処理部105から出力された各項目の特徴量を
抽出してページ要約データとして出力する処理部であ
る。
When the page category data and at least either the control rule information or the page summary data are output, the tag generation processing unit 106 generates the additional information data indicating the content of the page category data as a tag, and the additional information data generation processing. It is a department. The feature amount extraction processing unit 107 is a processing unit that extracts the feature amount of each item output from the component output processing unit 105 and outputs it as page summary data.

【0025】データ送受信装置100をページ生成処理
部101、ページカテゴリ出力処理部102、コンテン
ツ生成処理部103、制御ルール出力処理部104、構
成要素出力処理部105、タグ生成処理部106及び特
徴量抽出処理部107として機能させる為のプログラム
は、CD−ROM等の記録媒体に記録され磁気ディスク
等に格納された後、メモリにロードされて実行されるも
のとする。なお前記プログラムを記録する記録媒体はC
D−ROM以外の他の記録媒体でも良い。また前記プロ
グラムを当該記録媒体から情報処理装置にインストール
して使用しても良いし、ネットワークを通じて当該記録
媒体にアクセスして前記プログラムを使用するものとし
ても良い。
The data transmission / reception device 100 includes a page generation processing unit 101, a page category output processing unit 102, a content generation processing unit 103, a control rule output processing unit 104, a component output processing unit 105, a tag generation processing unit 106, and a feature amount extraction. The program for functioning as the processing unit 107 is recorded on a recording medium such as a CD-ROM and stored in a magnetic disk or the like, and then loaded into a memory and executed. The recording medium for recording the program is C
A recording medium other than the D-ROM may be used. The program may be installed in the information processing apparatus from the recording medium and used, or the recording medium may be accessed through the network to use the program.

【0026】またデータ送受信装置100は、ページカ
テゴリ定義データベース108と、特徴定義データベー
ス109と、コンテンツ定義データベース110と、制
御ルールデータベース111とを有している。
The data transmission / reception device 100 has a page category definition database 108, a feature definition database 109, a content definition database 110, and a control rule database 111.

【0027】ページカテゴリ定義データベース108
は、クライアントから受信したページ生成リクエスト1
12に対して応答される応答ページ113のカテゴリを
示すページカテゴリ定義データを格納するデータベース
である。
Page category definition database 108
Is the page generation request 1 received from the client
12 is a database that stores page category definition data indicating a category of a response page 113 that is responded to.

【0028】特徴定義データベース109は、コンテン
ツ定義データ中の各項目についてその特徴量を算出する
際に用いられる演算の内容を格納するデータベースであ
る。コンテンツ定義データベース110は、ページ生成
リクエスト112に対する応答ページ113を構成する
コンテンツの内容を定義したコンテンツ定義データを格
納するデータベースである。制御ルールデータベース1
11は、ページ生成リクエスト112に対する応答ペー
ジ113を生成する際の制御ルールを示す情報を格納し
たデータベースである。
The feature definition database 109 is a database that stores the contents of the calculation used when calculating the feature amount of each item in the content definition data. The content definition database 110 is a database that stores content definition data that defines the content of the content that forms the response page 113 to the page generation request 112. Control rule database 1
Reference numeral 11 is a database that stores information indicating control rules when generating the response page 113 for the page generation request 112.

【0029】収集サーバ120は、データ受信処理部1
21と、データ格納処理部122と、分析支援処理部1
23とを有している。データ受信処理部121は、クラ
イアントによるページ生成リクエスト112に対応する
カテゴリを示すページカテゴリ116と、そのページ生
成リクエスト112に対応した応答ページ113を構成
する各項目を取得する為の制御ルールを示す制御ルール
情報117、または、そのページ生成リクエスト112
に対応した応答ページ113を構成する各項目の特徴量
を示すページ要約118のいずれかを表す付加情報11
4を当該クライアントから受信する処理部である。
The collection server 120 includes the data reception processing unit 1
21, a data storage processing unit 122, and an analysis support processing unit 1
And 23. The data reception processing unit 121 controls the page category 116 indicating the category corresponding to the page generation request 112 by the client and the control rule for acquiring each item constituting the response page 113 corresponding to the page generation request 112. Rule information 117 or its page generation request 112
Additional information 11 representing any one of page summaries 118 showing the feature amount of each item constituting the response page 113 corresponding to
4 is a processing unit that receives 4 from the client.

【0030】データ格納処理部122は、前記クライア
ントから受信した付加情報114中のページカテゴリ1
16及び制御ルール情報117またはページ要約118
を行動履歴データベースに格納する処理部である。
The data storage processing unit 122 uses the page category 1 in the additional information 114 received from the client.
16 and control rule information 117 or page summary 118
Is a processing unit that stores the action history database.

【0031】分析支援処理部123は、前記行動履歴デ
ータベース中のデータを制御ルール情報117の内容に
応じて修正して行動履歴の分析を支援したり、前記収集
されたページ要約118を提示して行動履歴の分析を支
援する処理部である。
The analysis support processing unit 123 corrects the data in the action history database according to the contents of the control rule information 117 to support the analysis of the action history and presents the collected page summary 118. It is a processing unit that supports analysis of action history.

【0032】収集サーバ120をデータ受信処理部12
1、データ格納処理部122及び分析支援処理部123
として機能させる為のプログラムは、CD−ROM等の
記録媒体に記録され磁気ディスク等に格納された後、メ
モリにロードされて実行されるものとする。なお前記プ
ログラムを記録する記録媒体はCD−ROM以外の他の
記録媒体でも良い。また前記プログラムを当該記録媒体
から情報処理装置にインストールして使用しても良い
し、ネットワークを通じて当該記録媒体にアクセスして
前記プログラムを使用するものとしても良い。本実施形
態においては、ページ生成リクエスト112はURIとな
り、応答ページ113はHTMLデータとなる。
The collection server 120 is replaced by the data reception processing unit 12
1. Data storage processing unit 122 and analysis support processing unit 123
The program for functioning as is recorded on a recording medium such as a CD-ROM and stored in a magnetic disk or the like, and then loaded into a memory and executed. The recording medium for recording the program may be a recording medium other than the CD-ROM. The program may be installed in the information processing apparatus from the recording medium and used, or the recording medium may be accessed through the network to use the program. In this embodiment, the page generation request 112 is a URI and the response page 113 is HTML data.

【0033】図2は本実施形態のデータ送受信装置10
0の内部データ例を示す図である。図2のページカテゴ
リ定義データ201は、ページカテゴリ定義データベー
ス108に格納されるデータの構造を表しており、テー
ブル形式である。URI205、ページカテゴリ206、
ページカテゴリID207は、ページカテゴリ定義データ
201に含まれるテーブルの項目を表している。
FIG. 2 shows the data transmitting / receiving apparatus 10 of this embodiment.
It is a figure which shows the example of internal data of 0. The page category definition data 201 in FIG. 2 represents the structure of data stored in the page category definition database 108 and is in a table format. URI 205, page category 206,
The page category ID 207 represents an item of the table included in the page category definition data 201.

【0034】特徴定義データ202は、特徴定義データ
ベース109に格納されるデータの構造を表しており、
データ項目208、演算内容209、演算ID210は、
特徴定義データ202に含まれるテーブルの項目を表し
ている。
The feature definition data 202 represents the structure of data stored in the feature definition database 109,
The data item 208, the operation content 209, and the operation ID 210 are
The items of the table included in the feature definition data 202 are shown.

【0035】コンテンツ定義データ203は、コンテン
ツ定義データベース110に格納されるデータの構造を
表しており、コンテンツID211、コンテンツ名21
2、価格213、在庫214、画像ファイル名215は
コンテンツ定義データ203に含まれるテーブルの項目
を表している。
The content definition data 203 represents the structure of data stored in the content definition database 110, and has a content ID 211 and a content name 21.
2, price 213, inventory 214, and image file name 215 represent the items of the table included in the content definition data 203.

【0036】制御ルール情報204は、制御ルールデー
タベース111に格納されるデータの構造を表してお
り、その制御ルールが適用されるページ生成リクエスト
の引数を示す条件216、その制御ルールに基づいたペ
ージ生成で用いられるコンテンツを識別する為のコンテ
ンツID217、その制御ルールを識別する為のルールID
218とを有している。
The control rule information 204 represents the structure of the data stored in the control rule database 111, the condition 216 indicating the argument of the page generation request to which the control rule is applied, and the page generation based on the control rule. Content ID 217 for identifying the content used in the, and the rule ID for identifying the control rule
218 and 218.

【0037】図3は本実施形態のデータ送受信装置10
0の入出力データ例を示す図である。図3のページ生成
リクエストデータ301は、データ送受信装置100に
入力されるページ生成リクエスト112の一例を表して
いる。ページ生成リクエストデータ301中の「?」はU
RIの定義にある区切り文字であり、ページ生成リクエス
トデータ301は呼び出しプログラム305と引数30
6からなる。呼び出しプログラム305はクライアント
が呼び出しているプログラムに対する参照を、引数30
6はプログラムへの引数を表す。
FIG. 3 shows a data transmission / reception device 10 of this embodiment.
It is a figure which shows the input / output data example of 0. The page generation request data 301 in FIG. 3 represents an example of the page generation request 112 input to the data transmitting / receiving apparatus 100. "?" In page generation request data 301 is U
It is a delimiter in the RI definition, and the page generation request data 301 is the calling program 305 and the argument 30.
It consists of 6. The calling program 305 uses the argument 30 to refer to the program called by the client.
6 represents an argument to the program.

【0038】出力ページデータ302はデータ送受信装
置100から出力される応答ページ113の内容を表し
ている。付加情報データ303及びページ本文データ3
04は出力ページデータ302の構成要素であり、付加
情報データ303は付加情報114を、ページ本文デー
タ304はページ本文115を表している。付加情報デ
ータ303中の「?」「&」はURIの定義にある区切り文
字であり、付加情報データ303は、HTMLタグ307、
収集プログラム名308、ページカテゴリデータ30
9、制御ルール情報310、平均価格データ311、商
品数データ312、品切れ数データ313からなる。
The output page data 302 represents the content of the response page 113 output from the data transmitting / receiving apparatus 100. Additional information data 303 and page body data 3
Reference numeral 04 is a component of the output page data 302, additional information data 303 represents the additional information 114, and page body data 304 represents the page body 115. “?” And “&” in the additional information data 303 are delimiters in the URI definition, and the additional information data 303 includes the HTML tag 307,
Collection program name 308, page category data 30
9, control rule information 310, average price data 311, product number data 312, and out-of-stock number data 313.

【0039】ページカテゴリデータ309はページカテ
ゴリ出力処理部102から得られるページカテゴリ、制
御ルール情報310は制御ルール出力処理部104から
出力される制御ルールの情報、平均価格データ311、
商品数データ312及び品切れ数データ313は特徴量
抽出処理部107からの要約情報である。
The page category data 309 is the page category obtained from the page category output processing unit 102, the control rule information 310 is the control rule information output from the control rule output processing unit 104, and the average price data 311.
The product number data 312 and the out-of-stock number data 313 are summary information from the feature amount extraction processing unit 107.

【0040】HTMLタグ307中の「IMG」はページの中
に画像を含ませる為のキーワード、「SRC」は画像リソ
ースのURIを指定するキーワードである。HTMLを処理で
きる一般的なクライアント装置がHTMLタグ307の様な
形式のHTMLタグを受信すると、収集プログラム名308
で示された収集サーバ120へ画像リソースを要求し、
本実施形態では、その際にページカテゴリデータ30
9、制御ルール情報310、平均価格データ311、商
品数データ312、品切れ数データ313を送信する処
理を行う。
"IMG" in the HTML tag 307 is a keyword for including an image in the page, and "SRC" is a keyword for specifying the URI of the image resource. When a general client device capable of processing HTML receives an HTML tag such as the HTML tag 307, the collection program name 308
Requesting an image resource from the collection server 120 indicated by
In this embodiment, at that time, the page category data 30
9. The process of transmitting the control rule information 310, the average price data 311, the product number data 312, and the out-of-stock data 313 is performed.

【0041】この様に、クライアント装置が受信するペ
ージの特徴量及びページ生成に用いられた制御ルールを
受信データの中に予め含めておき、それらを収集できる
様にしていることに本実施形態の特徴がある。これによ
りクライアント装置の利用者がどの様な内容のページを
見ていたか、またどの様な制御ルールでページが生成さ
れていたかについての情報をログデータとして収集する
ことが可能になる。但し本実施形態において、付加情報
データ303に制御ルール情報と要約情報とを常にペア
で格納する必要はなく、選択的に格納することが可能で
ある。従って付加情報データ303には、ページカテゴ
リデータ309、制御ルール情報310、平均価格デー
タ311、商品数データ312、品切れ数データ313
の内の必要なものを格納し、運用することができる。
As described above, the feature amount of the page received by the client device and the control rule used for page generation are included in the received data in advance so that they can be collected. There are features. This makes it possible to collect, as log data, information about what content the user of the client device was looking at and what control rule the page was created for. However, in the present embodiment, it is not necessary to always store the control rule information and the summary information in a pair in the additional information data 303, and it is possible to selectively store them. Therefore, the additional information data 303 includes page category data 309, control rule information 310, average price data 311, product number data 312, and out-of-stock number data 313.
You can store and operate what you need.

【0042】図4は本実施形態のデータ送受信装置10
0の処理手順を示すフローチャートである。ステップ4
01でデータ送受信装置100のページ生成処理部10
1は、クライアント装置からアクセスを受付けると、そ
の利用者のユーザID及びパスワードの入力を要求して利
用者のログインを受け付ける。
FIG. 4 shows a data transmission / reception device 10 of this embodiment.
It is a flow chart which shows the processing procedure of 0. Step 4
The page generation processing unit 10 of the data transmitting / receiving device 100
When accepting the access from the client device, 1 requests the input of the user ID and password of the user and accepts the login of the user.

【0043】ステップ402では、前記ログインを受付
けた利用者の個人情報を参照し、その利用者の趣味嗜好
に合わせたページの生成を行う為の制御ルールに対応し
た引数をURIに付加してメニューページを生成し、その
生成したメニューページをクライアント装置へ送信す
る。
At step 402, the menu page is added by referring to the personal information of the user who has accepted the login and adding an argument corresponding to the control rule for generating a page according to the hobby and preference of the user to the URI. Is generated and the generated menu page is transmitted to the client device.

【0044】前記送信したメニューページで利用者によ
って特定のURIがクリックされるとクライアント装置か
らデータ送受信装置100へページ生成リクエスト11
2が送信される。
When the user clicks a specific URI on the transmitted menu page, a page generation request 11 is sent from the client device to the data transmitting / receiving device 100.
2 is transmitted.

【0045】図1(1)の様にステップ403でページ
生成処理部101は、クライアント装置から送信された
ページ生成リクエスト112を受信し、図1(2)の様
にページ生成リクエスト112に含まれる呼び出しプロ
グラム305をページカテゴリ出力処理部102へ出力
する。
As shown in FIG. 1 (1), the page generation processing unit 101 receives the page generation request 112 transmitted from the client device in step 403 and is included in the page generation request 112 as shown in FIG. 1 (2). The calling program 305 is output to the page category output processing unit 102.

【0046】ステップ404でページカテゴリ出力処理
部102は、呼び出しプログラム305を受け取ると、
ページカテゴリ定義データベース108に格納されたペ
ージカテゴリ定義データ201を参照し、URI205の
値が呼び出しプログラム305と一致するレコードデー
タを探す。一致するデータが見つかった場合はステップ
405へ進み、見つかったレコードデータが有するペー
ジカテゴリID207の値とページカテゴリID207の項
目名称をページ生成処理部101へ出力する。一致する
ものが見つからなかった場合はステップ406へ進み、
検索が失敗したことを表す値をページ生成処理部101
へ通知する。ページ生成処理部101は、ページカテゴ
リID207の値及び項目名称若しくは検索が失敗したこ
とを表す通知を受け取ると、ページカテゴリ116を表
すデータとして、タグ生成処理部106による付加情報
データ303の作成開始まで値を保持する。
When the page category output processing unit 102 receives the calling program 305 in step 404,
By referring to the page category definition data 201 stored in the page category definition database 108, record data whose URI 205 value matches the calling program 305 is searched for. If matching data is found, the process proceeds to step 405, and the value of the page category ID 207 and the item name of the page category ID 207 included in the found record data are output to the page generation processing unit 101. If no match is found, proceed to step 406,
The page generation processing unit 101 displays a value indicating that the search has failed.
Notify to. When the page generation processing unit 101 receives the value of the page category ID 207 and the notification indicating that the item name or the search has failed, the page generation processing unit 101 starts generating the additional information data 303 as the data indicating the page category 116 by the tag generation processing unit 106. Holds the value.

【0047】次にステップ407でページ生成処理部1
01は、ページ生成リクエスト112に制御ルールを指
定する為の引数306が指定されているかどうかを調
べ、制御ルールを使用するリクエストである場合には図
1(3)の様にページ生成リクエスト112に含まれる
引数306をコンテンツ生成処理部103へ出力してス
テップ408へ進む。
Next, in step 407, the page generation processing unit 1
01 checks whether or not the argument 306 for designating the control rule is designated in the page generation request 112, and if the request uses the control rule, the page generation request 112 is designated as shown in FIG. 1 (3). The included argument 306 is output to the content generation processing unit 103 and the process proceeds to step 408.

【0048】ステップ408でコンテンツ生成処理部1
03は、引数306を受け取ると、制御ルールデータベ
ース111に格納された制御ルール情報204を参照
し、条件216の値が引数306と一致するレコードデ
ータを探す。一致するものが見つからなかった場合はス
テップ413へ進んで検索が失敗したことを表す値をペ
ージ生成処理部101へ出力し、一致するものが見つか
った場合はステップ409へ進む。
In step 408, the content generation processing unit 1
03 receives the argument 306, refers to the control rule information 204 stored in the control rule database 111, and searches for record data in which the value of the condition 216 matches the argument 306. If no match is found, the process proceeds to step 413, a value indicating that the search has failed is output to the page generation processing unit 101, and if a match is found, the process proceeds to step 409.

【0049】ステップ409では、見つかったレコード
データが有するコンテンツID217の値を用いてコンテ
ンツ定義データベース110に格納されたコンテンツ定
義データ203を参照し、コンテンツID211の値が一
致するレコードデータを探す。一致するものが見つから
なかった場合はステップ413へ進んで検索が失敗した
ことを表す値をページ生成処理部101へ出力し、一致
するものが見つかった場合はステップ410へ進む。
In step 409, the content definition data 203 stored in the content definition database 110 is referred to by using the value of the content ID 217 of the found record data, and the record data having the matching value of the content ID 211 is searched. If no match is found, the process proceeds to step 413, a value indicating that the search has failed is output to the page generation processing unit 101, and if a match is found, the process proceeds to step 410.

【0050】ステップ410では、コンテンツ定義デー
タ203を検索して見つかったレコードデータが有する
コンテンツ名212、価格213、在庫214、画像フ
ァイル名215の名称と値をページ生成処理部101へ
出力する。
In step 410, the name and value of the content name 212, the price 213, the inventory 214, and the image file name 215 that the record data found by searching the content definition data 203 have are output to the page generation processing unit 101.

【0051】ステップ411でページ生成処理部101
は、コンテンツ名212、価格213、在庫214、画
像ファイル名215の名称と値を受け取ると、ページ本
文データ304を作成する。
In step 411, the page generation processing unit 101
Receives the name and value of the content name 212, the price 213, the inventory 214, and the image file name 215, the page body data 304 is created.

【0052】ステップ412で制御ルール出力処理部1
04は、前記(3)のコンテンツ生成処理部103の処
理において、条件216の値が引数306と一致するレ
コードデータが制御ルール情報204中にあった場合
は、図1(4)の様に一致レコードデータが有するルー
ルID218の値と項目名称をページ生成処理部101へ
出力する。ページ生成処理部101はルールID218の
名称と値を受け取ると、制御ルール情報117を表すデ
ータとして、タグ生成処理部106による付加情報デー
タ303の作成開始まで値を保持する。
In step 412, the control rule output processing unit 1
In the processing of the content generation processing unit 103 of (3), when there is record data in which the value of the condition 216 matches the argument 306 in the control rule information 204, 04 matches as in (1) of FIG. The value of the rule ID 218 included in the record data and the item name are output to the page generation processing unit 101. Upon receiving the name and value of the rule ID 218, the page generation processing unit 101 holds the value as data representing the control rule information 117 until the tag generation processing unit 106 starts to create the additional information data 303.

【0053】またステップ407で調べた結果、ページ
生成リクエスト112に制御ルールを指定する為の引数
306が指定されていない場合にはステップ421へ進
み、商品検索処理等、そのリクエストによって要求され
た処理を実行する。
As a result of checking in step 407, when the argument 306 for designating the control rule is not designated in the page generation request 112, the process proceeds to step 421, and the processing requested by the request, such as product search processing. To execute.

【0054】ステップ422では、商品検索エンジン
等、その処理を実行した処理部から処理結果を取得し、
ステップ423では、検索処理結果等、その処理結果を
表示する為の各項目の内容を示すコンテンツ定義データ
203を生成してステップ414へ進む。
In step 422, the processing result is acquired from the processing unit that has executed the processing, such as a product search engine,
In step 423, the content definition data 203 indicating the contents of each item for displaying the processing result such as the search processing result is generated, and the process proceeds to step 414.

【0055】ステップ414で構成要素出力処理部10
5は、前記(3)のコンテンツ生成処理部103のコン
テンツ定義データ203を検索する処理において一致す
るレコードデータがあった場合や、リクエスト処理の実
行によってコンテンツ定義データ203が生成された場
合に、図1(5)の様にコンテンツID211、価格21
3、在庫214等のコンテンツ定義データ203中の各
項目の項目名称と値を特徴量抽出処理部107へ出力す
る。
In step 414, the component output processing unit 10
5 shows a case where there is matching record data in the process of searching the content definition data 203 of the content generation processing unit 103 of (3) or when the content definition data 203 is generated by executing the request process. Content ID 211, price 21 as in 1 (5)
3. The item name and value of each item in the content definition data 203 such as inventory 214 are output to the feature amount extraction processing unit 107.

【0056】ステップ415で特徴量抽出処理部107
は、コンテンツID211、価格213、在庫214等の
項目名称と値を受け取ると、受け取った各項目に対する
処理を行う。まず特徴定義データベース109に格納さ
れた特徴定義データ202のデータ項目208を参照
し、データ項目208の値がコンテンツID211、価格
213、在庫214等の項目名称と一致するレコードデ
ータを探して一致するものが見つかった場合はステップ
416へ進む。
In step 415, the feature quantity extraction processing unit 107
When receiving the item name and value such as the content ID 211, the price 213, the inventory 214, etc., performs the process for each received item. First, referring to the data item 208 of the feature definition data 202 stored in the feature definition database 109, the record item whose value of the data item 208 matches the item name of the content ID 211, the price 213, the inventory 214, etc. is searched and the record data is matched. If found, go to step 416.

【0057】ステップ416では、一致したレコードデ
ータが有する演算内容209の値に基づいて、コンテン
ツID211、価格213、在庫214等の項目の内で一
致した項目の値を演算し、演算ID210の値と組み合わ
せてページ生成処理部101へ出力する。例えば、コン
テンツID211に対する処理の場合は、ページに含まれ
るコンテンツの個数が演算され、ページ生成処理部10
1へ出力される。
In step 416, the value of the matched item among the items such as the content ID 211, the price 213, and the stock 214 is calculated based on the value of the calculated content 209 of the matched record data, and the calculated value is compared with the value of the calculated ID 210. The combination is output to the page generation processing unit 101. For example, in the case of processing for the content ID 211, the number of contents included in the page is calculated, and the page generation processing unit 10
It is output to 1.

【0058】ステップ417では、全ての項目について
特徴量の算出処理が終了したかどうかを調べ、まだ全て
の項目の処理を終了していない場合にはステップ415
に戻り、価格213や在庫214等の他の項目について
も同様の処理を行う。
In step 417, it is checked whether the feature amount calculation processing has been completed for all items, and if the processing of all items has not been completed, step 415
Then, similar processing is performed for other items such as the price 213 and the stock 214.

【0059】ステップ418でページ生成処理部101
は、演算ID210の値と演算結果を受け取り、ページ要
約118を表すデータとして、タグ生成処理部106に
よる付加情報データ303の作成開始まで値を保持す
る。
In step 418, the page generation processing unit 101
Receives the value of the operation ID 210 and the operation result, and holds the value as data representing the page summary 118 until the tag generation processing unit 106 starts to create the additional information data 303.

【0060】図1(6)の様にステップ419でページ
生成処理部101は、ページカテゴリ116、制御ルー
ル情報117、ページ要約118を表すデータが揃う
と、タグ生成処理部106を呼び出して付加情報データ
303の作成を指示する。
As shown in FIG. 1 (6), in step 419, the page generation processing unit 101 calls the tag generation processing unit 106 when the data representing the page category 116, the control rule information 117, and the page summary 118 is complete, and calls the additional information. Instruct to create the data 303.

【0061】タグ生成処理部106は、ページカテゴリ
出力処理部102が出力したページカテゴリ116を表
すデータからページカテゴリデータ309を作成し、制
御ルール出力処理部104から出力された制御ルール情
報117を表すデータから制御ルール情報310を作成
し、特徴量抽出処理部107から出力されたページ要約
を表すデータから、平均価格データ311、商品数デー
タ312、品切れ数データ313を作成して付加情報デ
ータ303を生成する。
The tag generation processing unit 106 creates page category data 309 from the data representing the page category 116 output by the page category output processing unit 102, and represents the control rule information 117 output from the control rule output processing unit 104. The control rule information 310 is created from the data, and the average price data 311, the product quantity data 312, and the out-of-stock quantity data 313 are created from the data representing the page summary output from the feature quantity extraction processing unit 107, and the additional information data 303 is created. To generate.

【0062】次にステップ420でページ生成処理部1
01は、前記生成したページ本文データ304に付加情
報データ303を付加して出力ページデータ302とし
て後、これを応答ページ113としてクライアント装置
へ送信する。
Next, at step 420, the page generation processing unit 1
01 adds additional information data 303 to the generated page body data 304 to form output page data 302, and then transmits this as response page 113 to the client device.

【0063】本実施形態の制御ルール情報117は、コ
ンテンツ生成処理部103での内部状態、ページ要約1
18はコンテンツ生成結果の要約を表している。この様
にコンテンツ生成に関する情報をページの中に埋め込む
ところに本実施形態の特徴がある。
The control rule information 117 of this embodiment is the internal state of the content generation processing unit 103, the page summary 1
Reference numeral 18 represents a summary of the content generation result. The feature of this embodiment lies in embedding information relating to content generation in a page in this way.

【0064】一方、前記送信された応答ページ113を
クライアント装置で受信して表示すると、付加情報デー
タ303中のタグの処理をクライアント装置で実行して
付加情報データ303中の収集プログラム名308で示
された収集サーバ120への画像リソースの要求処理を
実行し、その際にページカテゴリデータ309、制御ル
ール情報310、平均価格データ311、商品数データ
312、品切れ数データ313を収集サーバ120へ送
信する。
On the other hand, when the transmitted response page 113 is received and displayed by the client device, the tag process in the additional information data 303 is executed by the client device and is indicated by the collection program name 308 in the additional information data 303. The requested processing of the image resource to the collection server 120 is executed, and at that time, the page category data 309, the control rule information 310, the average price data 311, the product number data 312, and the out-of-stock number data 313 are transmitted to the collection server 120. .

【0065】収集サーバ120のデータ受信処理部12
1は、クライアント装置からの画像リソースのリクエス
トを受信し、そのリクエストの引数からページカテゴリ
データ309、制御ルール情報310、平均価格データ
311、商品数データ312、品切れ数データ313を
読み出して、クライアント装置によるページ生成リクエ
スト112に対応したページカテゴリ116と、制御ル
ール情報117と、ページ要約118とを表す付加情報
114を当該クライアント装置から受信する処理を行
う。
The data reception processing unit 12 of the collection server 120
1 receives a request for an image resource from a client device, reads page category data 309, control rule information 310, average price data 311, product number data 312, and out-of-stock number data 313 from the arguments of the request, and the client device The page category request 116 corresponding to the page generation request 112, the control rule information 117, and the additional information 114 indicating the page summary 118 are received from the client device.

【0066】そして収集サーバ120のデータ格納処理
部122は、前記クライアント装置から受信した付加情
報114中のページカテゴリデータ309、制御ルール
情報310、平均価格データ311、商品数データ31
2、品切れ数データ313を行動履歴データベースに格
納する処理を行う。
Then, the data storage processing unit 122 of the collection server 120 receives the page category data 309, the control rule information 310, the average price data 311, and the product number data 31 in the additional information 114 received from the client device.
2. The process of storing the out-of-stock data 313 in the action history database is performed.

【0067】収集サーバ120の分析支援処理部123
は、前記行動履歴データベース中のデータを制御ルール
情報117の内容に応じて修正して行動履歴の分析を支
援したり、前記収集されたページ要約118を提示して
行動履歴の分析を支援する処理を行う。
Analysis support processing unit 123 of the collection server 120
Processing for correcting the data in the action history database according to the content of the control rule information 117 to support the analysis of the action history, or presenting the collected page summary 118 to support the analysis of the action history. I do.

【0068】前記の様に本実施形態では、収集サーバ1
20中の行動履歴データベースに平均価格データ31
1、商品数データ312、品切れ数データ313等のペ
ージの特徴を示すページ要約118の情報を蓄積するの
で、収集サーバ120の分析支援処理部123は、前記
収集されたページ要約118中のデータを提示して行動
履歴の分析を支援し、ページ内容に基づいた分析を実施
することができる。例えば、クライアント装置に何らか
の検索結果の一覧が表示されている状況で、クライアン
ト装置の利用者が一つの検索結果を選択した場合、何件
の商品数の中から選ばれたのかといった分析や、品切れ
が多い為に訪問頻度が低下しているのかどうかといった
品切れ数の大小と訪問頻度の関係の分析等を行うことが
可能である。
As described above, in this embodiment, the collection server 1
Average price data 31 in the behavior history database in 20
1. Since the information of the page summary 118 indicating the features of the page such as 1, the number-of-products data 312, the out-of-stock number data 313, etc. is accumulated, the analysis support processing unit 123 of the collection server 120 stores the data in the collected page summary 118. It can be presented to support the analysis of the action history, and the analysis can be performed based on the page content. For example, when a list of search results is displayed on the client device and the user of the client device selects one search result, the number of products selected is analyzed, and the product is out of stock. It is possible to analyze the relationship between the number of out-of-stock items and the frequency of visits, such as whether or not the frequency of visits is decreasing due to the large number of items.

【0069】また本実施形態の収集サーバ120の分析
支援処理部123は、収集サーバ120中の行動履歴デ
ータベースに制御ルール情報310を蓄積するので、同
じURIに対して利用者毎若しくはクライアント毎に異な
ったページ内容を割り当てるパーソナリゼーションと呼
ばれる技術が用いられている場合に、そのページのカス
タマイズに関するパーソナリゼーションが利用者の行動
に与えた影響を考慮したログデータの分析を行うことが
できる。例えば、収集サーバ120中の行動履歴データ
ベースからクライアント利用者の趣味嗜好の傾向を抽出
する際に、そのページのカスタマイズで用いられた制御
ルールの影響を考慮してログデータを修正した後、ある
利用者が頻繁に見ているページカテゴリを調べることに
より、パーソナリゼーションにより特定カテゴリのペー
ジが優先的に提示されていた影響を取り除き、利用者本
来の趣味嗜好を分析結果として得ることが可能である。
Since the analysis support processing unit 123 of the collection server 120 of this embodiment stores the control rule information 310 in the action history database in the collection server 120, it differs for each user or client for the same URI. When a technology called personalization for allocating different page contents is used, it is possible to analyze log data in consideration of the effect of personalization on customization of the page on the user's behavior. For example, when extracting the tendency of the hobby and preference of the client user from the behavior history database in the collection server 120, after correcting the log data in consideration of the influence of the control rule used in the customization of the page, a certain use By examining the page categories that people frequently look at, it is possible to eliminate the influence that the pages of a specific category are preferentially presented by personalization, and obtain the user's original hobbies and tastes as an analysis result.

【0070】ここで、制御ルールの影響を考慮してログ
データを修正する際には、制御ルールを用いてページ生
成を行った場合と制御ルールを用いないでページ生成を
行った場合とで、生成されたページ中の項目の選択頻度
の違いを調べておくことにより、制御ルールを用いた場
合に期待される選択頻度の上昇分を示す期待値を予め求
めておき、制御ルールの用いられたログデータの分析を
行う際にはその制御ルールの期待値に相当する修正を行
うことにより、より正確な行動履歴の分析を支援するこ
とができる。
Here, when the log data is modified in consideration of the influence of the control rule, the page generation is performed using the control rule and the page generation is performed without using the control rule. By checking the difference in the selection frequency of the items in the generated page, the expected value indicating the expected increase in the selection frequency when using the control rule is obtained in advance, and the control rule is used. When analyzing the log data, it is possible to support more accurate analysis of the action history by making a correction corresponding to the expected value of the control rule.

【0071】図4に示した処理手順では、ページ生成リ
クエスト112の引数306によって制御ルールを指定
するものとしていたが、応答ページ113中の所定の項
目がクライアントによって選択された場合に、前記制御
ルールをその所定の項目に対応した応答ページを生成す
る為の制御ルールに変更し、その制御ルールの動的な変
更内容も収集するものとしても良い。例えば、ページ生
成リクエスト112の引数306に対応する制御ルール
により生成された応答ページ113により家具の商品リ
ストをステップ420で提示した結果、その商品リスト
中の商品である「椅子」を買い物かごに入れる操作を利
用者が行った場合には、買い物かご中の商品とセットで
の購入が期待される「机」等の商品を提示する為の制御
ルールに変更してステップ408の処理へ進む様に処理
フローを変更し、動的に変更された制御ルールの情報を
示す付加情報データ303を付加した応答ページ113
をクライアント装置に送信する様にする。この処理によ
り、動的に変更された制御ルールも考慮した行動履歴の
分析を支援することが可能となる。
In the processing procedure shown in FIG. 4, the control rule is specified by the argument 306 of the page generation request 112. However, when a predetermined item in the response page 113 is selected by the client, the control rule is set. May be changed to a control rule for generating a response page corresponding to the predetermined item, and the dynamically changed content of the control rule may be collected. For example, as a result of presenting the product list of furniture in step 420 by the response page 113 generated by the control rule corresponding to the argument 306 of the page generation request 112, as a result, "chair" which is the product in the product list is put in the shopping cart. When the operation is performed by the user, the control rule is changed to present a product such as a "desk" which is expected to be purchased as a set with the product in the shopping cart, and the process proceeds to step 408. Response page 113 in which the processing flow is changed and the additional information data 303 indicating the dynamically changed control rule information is added
To be sent to the client device. By this processing, it becomes possible to support the analysis of the action history in consideration of the dynamically changed control rule.

【0072】図5は本実施形態の商品検索システムの適
用例を示す図である。図5の商品検索システム400
は、データ送受信装置100を商品の検索に適用した場
合の実施形態を表しており、ページ生成処理部101は
Webサーバ402の構成要素である。商品検索エンジン
403は、商品の検索処理を行う検索エンジンであり、
商品検索結果出力処理部404は商品検索エンジン40
3の構成要素である。
FIG. 5 is a diagram showing an application example of the product search system of this embodiment. The product search system 400 of FIG.
Represents an embodiment in which the data transmission / reception device 100 is applied to a product search, and the page generation processing unit 101
It is a component of the Web server 402. The product search engine 403 is a search engine for searching for products,
The product search result output processing unit 404 is a product search engine 40.
It is a component of 3.

【0073】ここで、商品検索エンジン403は図1の
コンテンツ生成処理部103、商品検索結果出力処理部
404は図1の構成要素出力処理部105、商品管理デ
ータベース406は図1のコンテンツ定義データベース
110とそれぞれ対応する。以下、図3、図5を使用
し、図5中の括弧付き番号の順番に沿って商品検索シス
テム400の動作を説明する。
Here, the product search engine 403 is the content generation processing unit 103 of FIG. 1, the product search result output processing unit 404 is the component output processing unit 105 of FIG. 1, and the product management database 406 is the content definition database 110 of FIG. Respectively correspond to. The operation of the product search system 400 will be described below with reference to FIGS. 3 and 5 in the order of parenthesized numbers in FIG.

【0074】図5(1)に示す様にまずWebブラウザ4
01はHTTPを使用して、Webサーバ402に制御ルール
を用いない商品検索を行う為のページ生成リクエスト1
12を送信する。次に、Webサーバ402はページ生成
リクエスト112を受信すると、ページ生成処理部10
1へページ生成リクエスト112を出力する。次に、ペ
ージ生成処理部101は応答ページ113を生成し、HT
TPを使用してWebブラウザ401へ送信する。
First, as shown in FIG. 5A, the Web browser 4
01 is a page generation request 1 for using HTTP to perform a product search without using a control rule on the Web server 402.
12 is transmitted. Next, when the Web server 402 receives the page generation request 112, the page generation processing unit 10
The page generation request 112 is output to 1. Next, the page generation processing unit 101 generates the response page 113, and HT
Send to Web browser 401 using TP.

【0075】図5(2)に示す様にWebブラウザ401
は応答ページ113を受信すると、応答ページ113に
含まれる付加情報114を処理し、HTTPを使用して付加
情報データ303に含まれている収集プログラム名30
8のURIへページカテゴリデータ309と、商品検索処
理で得られた平均価格データ311、商品数データ31
2及び品切れ数データ313等の要約情報とを送信す
る。ここでは、リクエストに含まれている「collectser
ver」が収集サーバ405である。
As shown in FIG. 5B, the web browser 401
Receives the response page 113, processes the additional information 114 included in the response page 113, and uses HTTP to acquire the collection program name 30 included in the additional information data 303.
8 to page category data 309, average price data 311, product number data 31 obtained by the product search process
2 and the summary information such as the out-of-stock data 313 are transmitted. Here, the "collector included in the request
“Ver” is the collection server 405.

【0076】図5(3)に示す様に収集サーバ405の
データ受信処理部121は、ページカテゴリデータ30
9と、平均価格データ311、商品数データ312及び
品切れ数データ313等の要約情報とを受信し、データ
格納処理部122により行動履歴データベース407に
保存する。cookieを使用可能な場合は、Webブラウザ4
01を特定し、Webブラウザ毎に受信データを区別でき
る様に記録する。典型的な記録方法は、受信した各項目
とWebブラウザの識別子を対応付ける方法である。
As shown in FIG. 5C, the data reception processing section 121 of the collection server 405 uses the page category data 30.
9 and the summary information such as the average price data 311, the number-of-goods data 312, the number-of-stock data 313, etc., and the data storage processing unit 122 saves them in the action history database 407. Web browser 4 if cookies are available
Specify 01 and record it so that the received data can be distinguished for each Web browser. A typical recording method is to associate each received item with the identifier of the Web browser.

【0077】この様に、ページカテゴリの他、平均価
格、商品数、品切れ数といった検索結果を要約したペー
ジの特徴量を予めWebブラウザ401に送信しておくこ
とにこの例の特徴がある。これによりWebブラウザ40
1の利用者に対して、どの様な情報が表示されていたか
をログデータとして収集することが可能になる。
As described above, the feature of this example is that the page feature amount, which summarizes the search results such as the average price, the number of products, and the number of sold items, is transmitted to the Web browser 401 in advance in addition to the page category. This allows the web browser 40
It becomes possible to collect what kind of information was displayed for one user as log data.

【0078】図6は本実施形態の商品レコメンドシステ
ムの適用例を示す図である。図6の商品レコメンドシス
テム500は、データ送受信装置100を商品のレコメ
ンドに適用した場合の実施形態を表しており、ページ生
成処理部101はWebサーバ502の構成要素である。
レコメンドエンジン503は、利用者に勧める商品を選
択するエンジンを表しており、レコメンドルール出力処
理部504及びレコメンド結果出力処理部505はレコ
メンドエンジン503の構成要素である。
FIG. 6 is a diagram showing an application example of the product recommendation system of this embodiment. The product recommendation system 500 in FIG. 6 illustrates an embodiment in which the data transmitting / receiving apparatus 100 is applied to product recommendations, and the page generation processing unit 101 is a component of the Web server 502.
The recommendation engine 503 represents an engine that selects products recommended to the user, and the recommendation rule output processing unit 504 and the recommendation result output processing unit 505 are components of the recommendation engine 503.

【0079】ここで、レコメンドエンジン503は図1
のコンテンツ生成処理部103、レコメンドルール出力
処理部504は図1の制御ルール出力処理部104、レ
コメンド結果出力処理部505は図1の構成要素出力処
理部105、商品管理データベース507は図1のコン
テンツ定義データベース110、レコメンドルールデー
タベース508は図1の制御ルールデータベース111
とそれぞれ対応する。以下、図3、図6を使用し、図6
中の括弧付き番号の順番に沿って商品レコメンドシステ
ム500の動作を説明する。
Here, the recommendation engine 503 is shown in FIG.
1, the recommendation rule output processing unit 504 is the control rule output processing unit 104 of FIG. 1, the recommendation result output processing unit 505 is the component output processing unit 105 of FIG. 1, and the product management database 507 is the content of FIG. The definition database 110 and the recommendation rule database 508 are the control rule database 111 of FIG.
Respectively correspond to. Hereinafter, referring to FIG. 3 and FIG.
The operation of the product recommendation system 500 will be described in the order of the parenthesized numbers inside.

【0080】図6(1)に示す様にWebブラウザ501
はHTTPを使用して、Webサーバ502に制御ルールを引
数として指定したページ生成リクエスト112を送信す
る。次に、Webサーバ502はページ生成処理部101
へ受信したページ生成リクエスト112を出力する。次
に、ページ生成処理部101は出力ページデータ302
のページを生成し、HTTPを使用してWebブラウザ501
へ送信する。
As shown in FIG. 6A, the Web browser 501
Sends a page generation request 112 specifying a control rule as an argument to the Web server 502 using HTTP. Next, the web server 502 is the page generation processing unit 101.
The page generation request 112 received is output. Next, the page generation processing unit 101 outputs the output page data 302.
Web page 501 using HTTP
Send to.

【0081】図6(2)に示す様にWebブラウザ501
は出力ページデータ302を受信すると、出力ページデ
ータ302に含まれる付加情報データ303を処理し、
HTTPを使用して付加情報データ303に含まれている収
集プログラム名308のURIへページカテゴリデータ3
09と、制御ルール情報310と、平均価格データ31
1、商品数データ312及び品切れ数データ313等の
要約情報とを送信する。ここでは、リクエストに含まれ
ている「collectserver」が収集サーバ506である。
As shown in FIG. 6B, the Web browser 501
Receives the output page data 302, processes the additional information data 303 included in the output page data 302,
Page category data 3 to the URI of the collection program name 308 included in the additional information data 303 using HTTP
09, control rule information 310, and average price data 31
1, summary information such as the product quantity data 312 and the out-of-stock quantity data 313 are transmitted. Here, the “collect server” included in the request is the collection server 506.

【0082】図6(3)に示す様に収集サーバ506の
データ受信処理部121は、ページカテゴリデータ30
9と、制御ルール情報310と、平均価格データ31
1、商品数データ312及び品切れ数データ313等の
要約情報とを受信し、データ格納処理部122により行
動履歴データベース509に保存する。cookieを使用可
能な場合は、Webブラウザ501を特定し、Webブラウザ
毎の受信データに区別できる様記録する。典型的な記録
方法は、受信した各項目とWebブラウザの識別子を対応
付ける方法である。
As shown in FIG. 6 (3), the data reception processing section 121 of the collection server 506 uses the page category data 30.
9, control rule information 310, and average price data 31
1, the summary information such as the product quantity data 312 and the out-of-stock quantity data 313 are received, and the data storage processing unit 122 saves the summary information in the action history database 509. When the cookie can be used, the Web browser 501 is specified and recorded so that the received data can be distinguished for each Web browser. A typical recording method is to associate each received item with the identifier of the Web browser.

【0083】この様に、商品検索処理の場合と同様なペ
ージカテゴリ及びページの特徴量に加え、ページの生成
条件を示す制御ルールを予めWebブラウザ501に送信
しておくことにこの例の特徴がある。これによりWebブ
ラウザ501の利用者に表示された情報が、どの様に生
成されたかをログデータとして収集することが可能にな
る。
As described above, in addition to the same page category and page feature amount as in the case of the product search process, the control rule indicating the page generation condition is transmitted to the Web browser 501 in advance. is there. This makes it possible to collect, as log data, how the information displayed to the user of the web browser 501 was generated.

【0084】以上説明した様に本実施形態のデータ収集
システムによれば、ページ生成リクエストに対応する応
答ページを作成する際に用いられた制御ルールの情報を
収集サーバ中の行動履歴データベースに格納するので、
クライアントからサーバへのアクセス状況を表すログデ
ータを分析する際に、応答ページ生成時の制御ルールを
考慮した分析を支援することが可能である。
As described above, according to the data collection system of this embodiment, the information of the control rule used when creating the response page corresponding to the page creation request is stored in the action history database in the collection server. So
When analyzing the log data indicating the access status from the client to the server, it is possible to support the analysis in consideration of the control rule when the response page is generated.

【0085】また本実施形態のデータ収集システムによ
れば、ページ生成リクエストに対応する応答ページを作
成する際に用いられた各項目の要約情報を収集サーバ中
の行動履歴データベースに格納するので、クライアント
からサーバへのアクセス状況を表すログデータを分析す
る際に、応答ページ生成時の各項目の状況を考慮した分
析を支援することが可能である。
According to the data collection system of this embodiment, the summary information of each item used when creating the response page corresponding to the page generation request is stored in the action history database in the collection server. When analyzing log data representing the access status from the server to the server, it is possible to support the analysis in consideration of the status of each item when the response page is generated.

【0086】[0086]

【発明の効果】本発明によればページ生成リクエストに
対応する応答ページを作成する際に用いられた制御ルー
ルの情報を収集サーバ中の行動履歴データベースに格納
するので、クライアントからサーバへのアクセス状況を
表すログデータを分析する際に、応答ページ生成時の制
御ルールを考慮した分析を支援することが可能である。
According to the present invention, since the information of the control rule used when creating the response page corresponding to the page generation request is stored in the action history database in the collecting server, the access status from the client to the server is stored. It is possible to support the analysis in consideration of the control rule at the time of generating the response page when analyzing the log data representing the.

【図面の簡単な説明】[Brief description of drawings]

【図1】本実施形態のデータ収集システムの概略構成と
データの流れを示す図である。
FIG. 1 is a diagram showing a schematic configuration and a data flow of a data collection system of this embodiment.

【図2】本実施形態のデータ送受信装置100の内部デ
ータ例を示す図である。
FIG. 2 is a diagram showing an example of internal data of the data transmission / reception device 100 of the present embodiment.

【図3】本実施形態のデータ送受信装置100の入出力
データ例を示す図である。
FIG. 3 is a diagram showing an example of input / output data of the data transmission / reception device 100 of the present embodiment.

【図4】本実施形態のデータ送受信装置100の処理手
順を示すフローチャートである。
FIG. 4 is a flowchart showing a processing procedure of the data transmission / reception device 100 of the present embodiment.

【図5】本実施形態の商品検索システムの適用例を示す
図である。
FIG. 5 is a diagram showing an application example of the product search system of the present embodiment.

【図6】本実施形態の商品レコメンドシステムの適用例
を示す図である。
FIG. 6 is a diagram showing an application example of the product recommendation system of the present embodiment.

【符号の説明】[Explanation of symbols]

100…データ送受信装置、112…ページ生成リクエ
スト、113…応答ページ、114…付加情報、115
…ページ本文、116…ページカテゴリ、117…制御
ルール情報、118…ページ要約、120…収集サー
バ、101…ページ生成処理部、102…ページカテゴ
リ出力処理部、103…コンテンツ生成処理部、104
…制御ルール出力処理部、105…構成要素出力処理
部、106…タグ生成処理部、107…特徴量抽出処理
部、108…ページカテゴリ定義データベース、109
…特徴定義データベース、110…コンテンツ定義デー
タベース、111…制御ルールデータベース、121…
データ受信処理部、122…データ格納処理部、123
…分析支援処理部、200…データ送受信装置内部デー
タ、201…ページカテゴリ定義データ、202…特徴
定義データ、203…コンテンツ定義データ、204…
制御ルール情報、205…URI、206…ページカテゴ
リ、207…ページカテゴリID、208…データ項目、
209…演算内容、210…演算ID、211…コンテン
ツID、212…コンテンツ名、213…価格、214…
在庫、215…画像ファイル名、216…条件、217
…コンテンツID、218…ルールID、300…データ送
受信装置入出力データ、301…ページ生成リクエスト
データ、302…出力ページデータ、303…付加情報
データ、304…ページ本文データ、305…呼び出し
プログラム、306…引数、307…HTMLタグ、308
…収集プログラム名、309…ページカテゴリデータ、
310…制御ルール情報、311…平均価格データ、3
12…商品数データ、313…品切れ数データ、400
…商品検索システム、401…Webブラウザ、402…W
ebサーバ、403…商品検索エンジン、404…商品検
索結果出力処理部、405…収集サーバ、406…商品
管理データベース、407…行動履歴データベース、5
00…商品レコメンドシステム、501…Webブラウ
ザ、502…Webサーバ、503…レコメンドエンジ
ン、504…レコメンドルール出力処理部、505…レ
コメンド結果出力処理部、506…収集サーバ、507
…商品管理データベース、508…レコメンドルールデ
ータベース、509…行動履歴データベース。
100 ... Data transmitting / receiving device, 112 ... Page generation request, 113 ... Response page, 114 ... Additional information, 115
... page body, 116 ... page category, 117 ... control rule information, 118 ... page summary, 120 ... collection server, 101 ... page generation processing section, 102 ... page category output processing section, 103 ... content generation processing section, 104
Control rule output processing unit 105, component output processing unit 106, tag generation processing unit 107, feature amount extraction processing unit 108, page category definition database 109
... Feature definition database, 110 ... Content definition database, 111 ... Control rule database, 121 ...
Data reception processing unit, 122 ... Data storage processing unit, 123
... analysis support processing unit, 200 ... data transmission / reception device internal data, 201 ... page category definition data, 202 ... feature definition data, 203 ... content definition data, 204 ...
Control rule information, 205 ... URI, 206 ... Page category, 207 ... Page category ID, 208 ... Data item,
209 ... Operation content, 210 ... Operation ID, 211 ... Content ID, 212 ... Content name, 213 ... Price, 214 ...
Inventory, 215 ... Image file name, 216 ... Conditions, 217
... content ID, 218 ... rule ID, 300 ... data transmitting / receiving device input / output data, 301 ... page generation request data, 302 ... output page data, 303 ... additional information data, 304 ... page body data, 305 ... calling program, 306 ... Argument, 307 ... HTML tag, 308
… Collection program name, 309… Page category data,
310 ... Control rule information, 311 ... Average price data, 3
12 ... Product number data, 313 ... Out-of-stock data, 400
… Product search system, 401… Web browser, 402… W
eb server, 403 ... Product search engine, 404 ... Product search result output processing unit, 405 ... Collection server, 406 ... Product management database, 407 ... Behavior history database, 5
00 ... Merchandise recommendation system, 501 ... Web browser, 502 ... Web server, 503 ... Recommendation engine, 504 ... Recommendation rule output processing unit, 505 ... Recommendation result output processing unit, 506 ... Collection server, 507
... commodity management database, 508 ... recommendation rule database, 509 ... action history database.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 森田 豊久 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内   ─────────────────────────────────────────────────── ─── Continued front page    (72) Inventor Toyohisa Morita             1099 Ozenji, Aso-ku, Kawasaki City, Kanagawa Prefecture             Ceremony company Hitachi Systems Development Laboratory

Claims (16)

【特許請求の範囲】[Claims] 【請求項1】 クライアントからサーバへのアクセス状
況を表すデータを収集するデータ収集方法において、 クライアントから受信したページ生成リクエストに対応
するカテゴリを示すページカテゴリデータをページカテ
ゴリ定義データベースから読み出して出力するステップ
と、 前記受信したページ生成リクエストに対応する制御ルー
ルに従ってコンテンツ定義データベースを参照し、その
ページ生成リクエストに対応した応答ページを構成する
各項目の内容を示すコンテンツ定義データを取得して出
力するステップと、前記出力されたコンテンツ定義デー
タ中の各項目の内容を用いてページ本文データを作成す
るステップと、前記コンテンツ定義データの取得の際に
用いられた制御ルールを示す制御ルール情報を出力する
ステップと、 前記ページカテゴリデータ及び制御ルール情報の内容を
示す付加情報データを生成するステップと、前記生成し
たページ本文データに前記付加情報データを付加して出
力ページデータを生成し、その出力ページデータを応答
ページとしてクライアントへ送信するステップと、 前記送信された応答ページ中の付加情報データをクライ
アントから収集サーバへ送信するステップとを有するこ
とを特徴とするデータ収集方法。
1. A data collection method for collecting data indicating a status of access from a client to a server, the step of reading out and outputting page category data indicating a category corresponding to a page generation request received from a client from a page category definition database. A step of referring to the content definition database according to the control rule corresponding to the received page generation request, and acquiring and outputting content definition data indicating the contents of each item constituting the response page corresponding to the page generation request; A step of creating page body data using the contents of each item in the output content definition data, and a step of outputting control rule information indicating a control rule used when the content definition data is acquired. , Previous A step of generating additional information data indicating the contents of the page category data and the control rule information, and adding the additional information data to the generated page body data to generate output page data, and outputting the output page data to a response page. And a step of transmitting the additional information data in the transmitted response page from the client to a collection server as a data collection method.
【請求項2】 前記クライアントから送信された付加情
報データ中のページカテゴリデータ及び制御ルール情報
を収集サーバ中の行動履歴データベースに格納するステ
ップを有することを特徴とする請求項1に記載されたデ
ータ収集方法。
2. The data according to claim 1, further comprising a step of storing page category data and control rule information in the additional information data transmitted from the client in an action history database in a collection server. Collection method.
【請求項3】 前記制御ルールに従ってコンテンツ定義
データを読み出す処理は、ページ生成リクエストの引数
に対応するコンテンツIDで識別されるコンテンツ定義
データをコンテンツ定義データベースから読み出すもの
であることを特徴とする請求項1または請求項2のいず
れかに記載されたデータ収集方法。
3. The process of reading the content definition data according to the control rule is to read the content definition data identified by the content ID corresponding to the argument of the page generation request from the content definition database. The data collection method according to claim 1 or claim 2.
【請求項4】 前記応答ページ中の所定の項目がクライ
アントによって選択された場合に、前記制御ルールをそ
の所定の項目に対応した応答ページを生成する為の制御
ルールに変更することを特徴とする請求項1乃至請求項
3のいずれか1項に記載されたデータ収集方法。
4. When a predetermined item in the response page is selected by a client, the control rule is changed to a control rule for generating a response page corresponding to the predetermined item. The data collection method according to any one of claims 1 to 3.
【請求項5】 前記クライアントから送信されたデータ
を制御ルールの内容に応じて修正して行動履歴の分析を
支援することを特徴とする請求項1乃至請求項4のいず
れか1項に記載されたデータ収集方法。
5. The method according to claim 1, wherein the data transmitted from the client is corrected according to the content of the control rule to support the analysis of the action history. Data collection method.
【請求項6】 クライアントからサーバへのアクセス状
況を表すデータを収集するデータ収集方法において、 クライアントから受信したページ生成リクエストに対応
するカテゴリを示すページカテゴリデータをページカテ
ゴリ定義データベースから読み出して出力するステップ
と、 前記受信したページ生成リクエストに対応する処理を実
行し、そのページ生成リクエストに対応した応答ページ
を構成する各項目の内容を示すコンテンツ定義データを
取得して出力するステップと、前記出力されたコンテン
ツ定義データ中の各項目の内容を用いてページ本文デー
タを作成するステップと、前記取得したコンテンツ定義
データ中の各項目の特徴量を抽出してページ要約データ
として出力するステップと、 前記ページカテゴリデータ及びページ要約データの内容
を示す付加情報データを生成するステップと、前記生成
したページ本文データに前記付加情報データを付加して
出力ページデータを生成し、その出力ページデータを応
答ページとしてクライアントへ送信するステップと、 前記送信された応答ページ中の付加情報データをクライ
アントから収集サーバへ送信するステップとを有するこ
とを特徴とするデータ収集方法。
6. A data collection method for collecting data representing a status of access from a client to a server, wherein page category data indicating a category corresponding to a page generation request received from a client is read out from a page category definition database and output. And a step of executing a process corresponding to the received page generation request and acquiring and outputting content definition data indicating the contents of each item forming a response page corresponding to the page generation request, and the output Creating page body data using the contents of each item in the content definition data; extracting feature quantities of each item in the acquired content definition data and outputting as page summary data; Data and page summary Generating additional information data indicating the contents of the data, adding the additional information data to the generated page body data to generate output page data, and transmitting the output page data to the client as a response page. And a step of transmitting the additional information data in the transmitted response page from the client to the collection server.
【請求項7】 前記クライアントから送信された付加情
報データ中のページカテゴリデータ及びページ要約デー
タを行動履歴データベースに格納するステップを有する
ことを特徴とする請求項6に記載されたデータ収集方
法。
7. The data collection method according to claim 6, further comprising the step of storing page category data and page summary data in the additional information data transmitted from the client in an action history database.
【請求項8】 前記取得したコンテンツ定義データ中の
各項目に対して予め定められた演算を行うことにより前
記特徴量を抽出することを特徴とする請求項6または請
求項7のいずれかに記載されたデータ収集方法。
8. The feature amount is extracted by performing a predetermined operation on each item in the acquired content definition data. Data collection method.
【請求項9】 前記収集されたページ要約データを提示
して行動履歴の分析を支援することを特徴とする請求項
6乃至請求項8のいずれか1項に記載されたデータ収集
方法。
9. The data collecting method according to claim 6, wherein the collected page summary data is presented to support analysis of a behavior history.
【請求項10】 収集サーバへ付加情報データを送信す
る為のタグを付加した応答ページをクライアントに送信
し、そのタグの処理をクライアントで実行することによ
りクライアントから収集サーバへ付加情報データを送信
することを特徴とする請求項1乃至請求項9のいずれか
1項に記載されたデータ収集方法。
10. A response page to which a tag for transmitting additional information data is transmitted to the collection server is transmitted to the client, and the client executes the processing of the tag to transmit the additional information data from the client to the collection server. The data collection method according to any one of claims 1 to 9, wherein
【請求項11】 クライアントからサーバへのアクセス
状況を表すデータを送受信するデータ送受信装置におい
て、 クライアントから受信したページ生成リクエストに対応
するカテゴリを示すページカテゴリデータをページカテ
ゴリ定義データベースから読み出して出力するページカ
テゴリ出力処理部と、 前記受信したページ生成リクエストに対応する制御ルー
ルに従ってコンテンツ定義データベースを参照し、その
ページ生成リクエストに対応した応答ページを構成する
各項目の内容を示すコンテンツ定義データを取得して出
力するコンテンツ生成処理部と、前記コンテンツ定義デ
ータの取得の際に用いられた制御ルールを示す制御ルー
ル情報を出力する制御ルール出力処理部と、 前記ページカテゴリデータ及び制御ルール情報の内容を
示す付加情報データを生成する付加情報データ生成処理
部と、前記出力されたコンテンツ定義データ中の各項目
の内容を用いてページ本文データを作成し、その本文デ
ータに前記付加情報データを付加して出力ページデータ
を生成し、その出力ページデータを応答ページとしてク
ライアントへ送信するページ生成処理部とを備えること
を特徴とするデータ送受信装置。
11. A page for reading and outputting page category data indicating a category corresponding to a page generation request received from a client from a page category definition database in a data transmission / reception device for transmitting / receiving data indicating a status of access from a client to a server. According to the category output processing unit and the content definition database according to the control rule corresponding to the received page generation request, the content definition data indicating the contents of each item constituting the response page corresponding to the page generation request is acquired. A content generation processing unit for outputting, a control rule output processing unit for outputting control rule information indicating a control rule used at the time of acquisition of the content definition data, and contents of the page category data and the control rule information. An additional information data generation processing unit that generates additional information data, and page body data is created using the contents of each item in the output content definition data, and the additional information data is added to the body data. A data transmission / reception device, comprising: a page generation processing unit that generates output page data and transmits the output page data as a response page to a client.
【請求項12】 クライアントからサーバへのアクセス
状況を表すデータを送受信するデータ送受信装置におい
て、 クライアントから受信したページ生成リクエストに対応
するカテゴリを示すページカテゴリデータをページカテ
ゴリ定義データベースから読み出して出力するページカ
テゴリ出力処理部と、 前記受信したページ生成リクエストに対応する処理を実
行し、そのページ生成リクエストに対応した応答ページ
を構成する各項目の内容を示すコンテンツ定義データを
取得して出力するコンテンツ生成処理部と、前記取得し
たコンテンツ定義データ中の各項目の特徴量を抽出して
ページ要約データとして出力する特徴量抽出処理部と、 前記ページカテゴリデータ及びページ要約データの内容
を示す付加情報データを生成する付加情報データ生成処
理部と、前記出力されたコンテンツ定義データ中の各項
目の内容を用いてページ本文データを作成し、その本文
データに前記付加情報データを付加して出力ページデー
タを生成し、その出力ページデータを応答ページとして
クライアントへ送信するページ生成処理部とを備えるこ
とを特徴とするデータ送受信装置。
12. A page for reading and outputting page category data indicating a category corresponding to a page generation request received from a client from a page category definition database in a data transmission / reception device for transmitting / receiving data indicating a status of access from a client to a server. A category output processing unit, and a content generation process for executing a process corresponding to the received page generation request and acquiring and outputting content definition data indicating the contents of each item forming a response page corresponding to the page generation request. Section, a feature quantity extraction processing section that extracts the feature quantity of each item in the acquired content definition data and outputs it as page summary data, and additional information data indicating the content of the page category data and page summary data Additional information day Data generation processing section and page text data is created using the contents of each item in the output content definition data, the additional information data is added to the text data to generate output page data, and the output A data transmission / reception device, comprising: a page generation processing unit that transmits page data to a client as a response page.
【請求項13】 クライアントからサーバへのアクセス
状況を表すデータを収集するデータ収集方法において、 クライアントによるページ生成リクエストに対応するカ
テゴリを示すページカテゴリデータと、そのページ生成
リクエストに対応した応答ページを構成する各項目を取
得する為の制御ルールを示す制御ルール情報とを表す付
加情報データを当該クライアントから受信するステップ
と、 前記クライアントから受信した付加情報データ中のペー
ジカテゴリデータ及び制御ルール情報を収集サーバ中の
行動履歴データベースに格納するステップと、 前記行動履歴データベース中のデータを制御ルールの内
容に応じて修正して行動履歴の分析を支援するステップ
とを有することを特徴とするデータ収集方法。
13. A data collection method for collecting data representing a status of access from a client to a server, comprising page category data indicating a category corresponding to a page generation request by a client, and a response page corresponding to the page generation request. A step of receiving additional information data indicating control rule information indicating a control rule for acquiring each item from the client, and page category data and control rule information in the additional information data received from the client. And a step of correcting the data in the action history database according to the content of the control rule to support the analysis of the action history.
【請求項14】 クライアントからサーバへのアクセス
状況を表すデータを収集するデータ収集方法において、 クライアントによるページ生成リクエストに対応するカ
テゴリを示すページカテゴリデータと、そのページ生成
リクエストに対応した応答ページを構成する各項目の特
徴量を示すページ要約データとを表す付加情報データを
当該クライアントから受信するステップと、 前記クライアントから受信した付加情報データ中のペー
ジカテゴリデータ及びページ要約データを行動履歴デー
タベースに格納するステップと、 前記収集されたページ要約データを提示して行動履歴の
分析を支援するステップとを有することを特徴とするデ
ータ収集方法。
14. A data collection method for collecting data representing a status of access from a client to a server, comprising page category data indicating a category corresponding to a page generation request by a client, and a response page corresponding to the page generation request. Receiving additional information data representing page summary data indicating the feature amount of each item from the client, and storing page category data and page summary data in the additional information data received from the client in the action history database. A method for collecting data, comprising: a step of presenting the collected page summary data to support analysis of a behavior history.
【請求項15】 クライアントからサーバへのアクセス
状況を表すデータを収集する収集サーバにおいて、 クライアントによるページ生成リクエストに対応するカ
テゴリを示すページカテゴリデータと、そのページ生成
リクエストに対応した応答ページを構成する各項目を取
得する為の制御ルールを示す制御ルール情報とを表す付
加情報データを当該クライアントから受信するデータ受
信処理部と、 前記クライアントから受信した付加情報データ中のペー
ジカテゴリデータ及び制御ルール情報を収集サーバ中の
行動履歴データベースに格納するデータ格納処理部と、
前記行動履歴データベース中のデータを制御ルールの内
容に応じて修正して行動履歴の分析を支援する分析支援
処理部とを備えることを特徴とする収集サーバ。
15. A collection server that collects data indicating a status of access from a client to a server, and configures page category data indicating a category corresponding to a page generation request by the client and a response page corresponding to the page generation request. A data reception processing unit that receives additional information data indicating control rule information indicating a control rule for acquiring each item from the client, and page category data and control rule information in the additional information data received from the client. A data storage processing unit that stores the action history database in the collection server,
A collection server, comprising: an analysis support processing unit that corrects data in the action history database according to the content of a control rule to support analysis of an action history.
【請求項16】 クライアントからサーバへのアクセス
状況を表すデータを収集する収集サーバにおいて、 クライアントによるページ生成リクエストに対応するカ
テゴリを示すページカテゴリデータと、そのページ生成
リクエストに対応した応答ページを構成する各項目の特
徴量を示すページ要約データとを表す付加情報データを
当該クライアントから受信するデータ受信処理部と、 前記クライアントから受信した付加情報データ中のペー
ジカテゴリデータ及びページ要約データを行動履歴デー
タベースに格納するデータ格納処理部と、前記収集され
たページ要約データを提示して行動履歴の分析を支援す
る分析支援処理部とを備えることを特徴とする収集サー
バ。
16. A collection server that collects data indicating a status of access from a client to a server, and configures page category data indicating a category corresponding to a page generation request by the client and a response page corresponding to the page generation request. A data reception processing unit that receives additional information data representing page summary data indicating the feature amount of each item from the client, and page category data and page summary data in the additional information data received from the client in an action history database. A collection server, comprising: a data storage processing unit that stores the data; and an analysis support processing unit that presents the collected page summary data to support the analysis of the action history.
JP2001354955A 2001-11-20 2001-11-20 Method for collecting data and implementation device therefor Pending JP2003157210A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001354955A JP2003157210A (en) 2001-11-20 2001-11-20 Method for collecting data and implementation device therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001354955A JP2003157210A (en) 2001-11-20 2001-11-20 Method for collecting data and implementation device therefor

Publications (1)

Publication Number Publication Date
JP2003157210A true JP2003157210A (en) 2003-05-30

Family

ID=19166729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001354955A Pending JP2003157210A (en) 2001-11-20 2001-11-20 Method for collecting data and implementation device therefor

Country Status (1)

Country Link
JP (1) JP2003157210A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766910A (en) * 2021-01-21 2021-05-07 深圳市极致科技股份有限公司 Document construction method, document generation device, electronic equipment and storage medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766910A (en) * 2021-01-21 2021-05-07 深圳市极致科技股份有限公司 Document construction method, document generation device, electronic equipment and storage medium
CN112766910B (en) * 2021-01-21 2023-10-27 深圳市极致科技股份有限公司 Document construction method, generation method, device, electronic equipment and storage medium

Similar Documents

Publication Publication Date Title
AU774177B2 (en) Information collection system and information collection method on network, each using technique of internet, and recording medium in which the information collection method is recorded
US7966395B1 (en) System and method for indicating interest of online content
US6959319B1 (en) System and method for automatically personalizing web portals and web services based upon usage history
US8893043B2 (en) Method and system for predictive browsing
US7814147B2 (en) System and method for dynamically changing the content of an Internet web page
US9183316B2 (en) Providing action links to share web content
US9300755B2 (en) System and method for determining information reliability
US6973492B2 (en) Method and apparatus for collecting page load abandons in click stream data
JP4536146B1 (en) RECOMMENDATION DEVICE, RECOMMENDATION METHOD, AND RECOMMENDATION PROGRAM
US7631263B2 (en) Methods, systems, and computer program products for characterizing links to resources not activated
US20020002569A1 (en) Systems, methods and computer program products for associating dynamically generated web page content with web site visitors
US20040205119A1 (en) Method and apparatus for capturing web page content development data
JP2008524695A (en) Search engine for computer networks
JP2008507057A (en) Improved user interface
US20100057695A1 (en) Post-processing search results on a client computer
US6243662B1 (en) Data relay device, information terminal equipment, computer-readable recording medium storing data relay program, and computer-readable recording medium storing information browsing program
JP2004178263A (en) Web server, web server with function of java servlet, and computer program
JP2013512504A (en) Remote printing
WO2021181900A1 (en) Target user feature extraction method, target user feature extraction system, and target user feature extraction server
US6658452B1 (en) Schemes for selecting and passing an application from an application provider to an application service provider
US20080114786A1 (en) Breaking documents
JP2003157210A (en) Method for collecting data and implementation device therefor
JPWO2006109770A1 (en) Semantic search program
WO2002048899A1 (en) A method of tracking browsing activity of a user in a computer network
JP2006209598A (en) Site information collection system