JP2010157151A - System and method for analyzing access - Google Patents

System and method for analyzing access Download PDF

Info

Publication number
JP2010157151A
JP2010157151A JP2008335738A JP2008335738A JP2010157151A JP 2010157151 A JP2010157151 A JP 2010157151A JP 2008335738 A JP2008335738 A JP 2008335738A JP 2008335738 A JP2008335738 A JP 2008335738A JP 2010157151 A JP2010157151 A JP 2010157151A
Authority
JP
Japan
Prior art keywords
access
user terminal
terminal
record
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008335738A
Other languages
Japanese (ja)
Inventor
Ushio Sumida
潮 住田
Toshiaki Ejiri
俊章 江尻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KAN KK
Original Assignee
KAN KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KAN KK filed Critical KAN KK
Priority to JP2008335738A priority Critical patent/JP2010157151A/en
Publication of JP2010157151A publication Critical patent/JP2010157151A/en
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an access analysis system and an access analysis method, for analyzing an access trend of a user terminal based on contents of a content and recording data including a recorded access record running into conversion by detecting and recording access of the user terminal to a Web server opening the content. <P>SOLUTION: In the access analysis system 10, access analysis is executed by use of: a Web structure DB 14 for recording a page structure of a Web site; a page category DB 18 for classifying the page structure into a category and recording it; a path definition DB 17 for defining a path along which each user terminal wanders each page based on the record of an access log DB 11; a customer class DB 16 for defining a class of a customer in order of running into the conversion; a property pattern DB 15 for recording a result obtained by analyzing a property of the customer class by customer class distinction processing; and a control part 20 connected to a display terminal 19. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、複数ページによってコンテンツを公開するウェブサーバへのユーザ端末のアクセスを検出して記録し、コンテンツの内容と記録されたアクセス記録とに基づいてユーザ端末のアクセス動向を解析するアクセス解析システム及びアクセス解析方法に関する。   The present invention relates to an access analysis system that detects and records access of a user terminal to a web server that publishes content by a plurality of pages, and analyzes an access trend of the user terminal based on the content of the content and the recorded access record. And an access analysis method.

近年のインターネットの急速な普及に伴い、インターネットを通じて様々な商品や各種サービスの販売を行うe−コマース(エレクトロニック・コマース:電子商取引)のウェブサイトが増えるに従い、ウェブサイトへの訪問者である消費者(以下、顧客という)がこれらの商品やサービスを購入する機会も増えている。   With the rapid spread of the Internet in recent years, as e-commerce (electronic commerce) websites that sell various products and services through the Internet increase, consumers who are visitors to the website Opportunities for customers to purchase these products and services are increasing.

このような状況下において、e−コマースを運営する企業側もインターネット上での顧客行動に着目することで、伝統的なマーケティングとは異なるe−マーケティングがその重要性を増し、例えば、バーチャル・モール・サイトでは商品購入、コミュニティサイトでは会員登録などのビジネスにとって重要性が増加する顧客のアクション(以下、コンバージョンと呼ぶ)が重要となる。特に、e−マーケティングでは、コンバージョン率を向上させることを目的の一つとし、顧客の好みに合わせた商品・情報の提供をするために顧客のアクションの収集及び分析を行っている。   Under such circumstances, companies that operate e-commerce also pay attention to customer behavior on the Internet, and e-marketing, which is different from traditional marketing, has become more important. For example, virtual malls・ Customer actions (hereinafter referred to as “conversions”) are becoming increasingly important for businesses such as purchasing products on the site and membership registration on the community site. In particular, e-marketing aims to improve the conversion rate, and collects and analyzes customer actions in order to provide products and information according to customer preferences.

一般的に、繰り返し購買を主流とするe−コマースにおいては、POSデータの蓄積により豊富な顧客の購買履歴と商品特性から頻繁に商品を購入する優良顧客の判定が容易となる。これに対して、耐久消費財等の販売を主流とするe−コマースおいては、想定耐用年数が1年以上で比較的購入価格が高いものという性格上、顧客は数年に1回購買するかしないかといういわゆる1回購買となり、顧客の購買履歴情報は存在せず、有力な情報としては、リファラ(当該サイトを訪問する直前のサイトの情報)、ランディング・ページ及びページ閲覧経路等、顧客がもたらすアクセス記録に依拠せざるを得ない。   In general, in e-commerce, where repetitive purchases are the mainstream, it is easy to determine good customers who frequently purchase products based on abundant customer purchase histories and product characteristics by accumulating POS data. On the other hand, in e-commerce, which mainly sells durable consumer goods, the customer purchases once every few years due to the fact that the assumed useful life is one year or more and the purchase price is relatively high. Customer purchase history information does not exist, and the most important information is the referrer (information of the site immediately before visiting the site), landing page, page browsing route, etc. You must rely on the access records that come from.

このような問題を解決する技術として、多くのユーザがアクセスすることでユーザ情報であるユーザプロファイルが頻繁に更新され、商品の入れ替えが頻繁に行われるe−コマースにおいて、これらの情報を組み合わせることによって解決するものがある。特許文献1には、電子的な店舗等において商品等の呈示をユーザの好みに合わせてリコメンデーションするため、顧客の情報を格納しているユーザプロファイルからユーザの好みを取り出すコラボレーティブフィルタリングを用いた静的なリコメンデーションと、アクセスログからユーザのアクセス履歴に基づくデータマイニングを用いた動的なリコメンデーションと、を組み合わせたリコメンデーションシステムが開示されている。   As a technique for solving such a problem, by combining many pieces of information in e-commerce where user profiles, which are user information, are frequently updated as a result of access by many users and products are frequently replaced, There is something to solve. In Patent Document 1, in order to recommend the presentation of products and the like according to the user's preference in an electronic store or the like, a static filter using collaborative filtering that extracts the user's preference from the user profile storing customer information is disclosed. A recommendation system that combines general recommendation and dynamic recommendation using data mining based on a user's access history from an access log is disclosed.

特開2002−366838号公報JP 2002-366838 A

上述した特許文献1は、顧客情報を格納したユーザプロファイルとアクセスログを用いて処理しているものの、このような技術を顧客情報が乏しい1回購買を主流とするe−コマースにおいて顧客の好みを分析することは各商品、各分野に特化した解析ソフトを作る必要があり、容易ではない。   Although the above-mentioned patent document 1 is processed using a user profile storing customer information and an access log, such a technique is used for e-commerce mainly for one-time purchase where customer information is scarce. Analyzing it is necessary to create analysis software specialized for each product and each field, which is not easy.

そこで、本発明は、複数ページによってコンテンツを公開するウェブサーバへのユーザ端末のアクセスを検出して記録し、コンテンツの内容と記録されたコンバージョンに至ったアクセス記録を含む記録データとに基づいて、各商品、各分野に特化する割合を減らし、汎用化した解析ソフトによりユーザ端末のアクセス動向を解析するアクセス解析システムを提供することを目的とする。   Therefore, the present invention detects and records the access of the user terminal to the web server that publishes the content by a plurality of pages, and based on the content of the content and the recorded data including the recorded access record that resulted in the conversion, An object of the present invention is to provide an access analysis system for analyzing access trends of user terminals by using general-purpose analysis software by reducing the rate of specialization for each product and each field.

以上のような目的を達成するために、本発明に係るアクセス解析システムは、ウェブサーバが複数ページによってコンテンツをユーザ端末に公開し、ウェブサーバへのユーザ端末のアクセスを記録してコンテンツの内容と記録されたアクセス記録とに基づいてユーザ端末のアクセス動向を解析するアクセス解析システムにおいて、ビジネスに関係するウェブサーバの各ページを予め決められた数のカテゴリに分類するカテゴリ分類手段と、ビジネスにとって重要性が増加するユーザ端末のアクセス結果であるコンバージョンに結びつくようなユーザ端末のアクセスを、分類されたカテゴリに基づいてコンバージョンに至る連続経路として定義する経路定義手段と、アクセス記録に記録されている付帯情報をさらに組み合わせて、ユーザ端末が複数のページを渡り歩くパターンであるアクセスパターンの傾向を、カテゴリ毎に端末クラスに分類する端末クラス分類手段と、定義された連続経路と分類されたカテゴリとに基づく端末クラスの特性を、相関規則を用いて求めるため、端末クラスに該当するユーザ端末が起こした全アクセスパターン数のうち、ある端末クラスが起こしたアクセスパターンの回数の占める割合であるユーザ端末のサポート値を算出する端末特性算出手段と、当該アクセスパターンの寄与度を求めるため、全アクセスパターン数のうち、当該アクセスパターンを起こした回数の占める割合であるユーザ端末の全体のアクセスに対するコンフィデンス値を算出する端末寄与度算出手段と、算出されたユーザ端末のサポート値及びコンフィデンス値を予め決められたしきい値に基づいてアクセスパターンを絞り込む絞り込み手段と、を有し、絞り込み手段からの情報に基づいて、コンバージョンに至る端末クラスを予想することを特徴とする。   In order to achieve the above object, the access analysis system according to the present invention includes a web server that publishes content to a user terminal by a plurality of pages, records the access of the user terminal to the web server, and In an access analysis system that analyzes access trends of user terminals based on recorded access records, category classification means for classifying each page of a web server related to business into a predetermined number of categories, and important for business Path definition means for defining user terminal access that leads to conversion, which is an access result of the user terminal that increases in nature, as a continuous path leading to conversion based on the classified category, and incidental recorded in the access record By combining information further, the user terminal The terminal class classification means that classifies the tendency of the access pattern, which is a pattern of walking a number of pages, into terminal classes for each category, the characteristics of the terminal class based on the defined continuous route and the classified category, the correlation rule Terminal characteristic calculation means for calculating a support value of a user terminal, which is a ratio of the number of access patterns caused by a certain terminal class, out of the total number of access patterns caused by a user terminal corresponding to the terminal class. In order to obtain the contribution degree of the access pattern, terminal contribution degree calculating means for calculating a confidence value for the entire access of the user terminal, which is a ratio of the number of times the access pattern has occurred among the total number of access patterns, and calculation Support values and confidence values for the user terminals It has a narrowing means Filter access pattern based on a threshold, and based on information from the narrowing means and to predict the terminal class to a conversion.

また、本発明に係るアクセス解析システムにおいて、絞り込み手段は、アクセス記録から取り出したユーザ端末の連続するアクセスパターンを複数の短いアクセスパターンに分割する分割手段と、短いアクセスパターンに基づいて、サポート度及びコンフィデンス度の低い端末クラスのアクセスを予め決められたしきい値により、アクセス記録から弁別する第1のフィルタ手段と、第1のフィルタ手段で得られたアクセス記録から、コンバージョンに至る手前の端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第2のフィルタ手段と、第1と第2のフィルタ手段により弁別され抽出された残りのアクセス記録からコンバージョンに至った端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第3のフィルタ手段と、抽出された端末クラスに関する情報を出力する出力手段と、を有することを特徴とする。   Further, in the access analysis system according to the present invention, the narrowing-down means includes a dividing means for dividing a continuous access pattern of the user terminal extracted from the access record into a plurality of short access patterns, and a support level and A first filter means for discriminating access of a terminal class having a low degree of confidence from an access record based on a predetermined threshold value, and a terminal class before the conversion from the access record obtained by the first filter means Focused on the second filter means that extracts the threshold value of the support value and the confidence value, and the terminal class that led to conversion from the remaining access records that were distinguished and extracted by the first and second filter means Depending on support and confidence value thresholds Third filter means for extracting, and output means for outputting information about the terminal class are extracted, characterized in that it has a.

また、本発明に係るアクセス解析システムにおいて更に、学習用記録と試験用記録との二つのアクセス記録を収集するアクセス記録収集手段と、学習用記録から求められたサポート値及びコンフィデンス値のしきい値に基づいて試験用記録を処理することで、しきい値を検証するしきい値検証手段と、を有することを特徴とする。   The access analysis system according to the present invention further includes an access record collecting means for collecting two access records, a learning record and a test record, and threshold values of support values and confidence values obtained from the learning records. And threshold value verification means for verifying the threshold value by processing the test record based on the above.

また、本発明に係るアクセス解析方法は、ウェブサーバが複数ページによってコンテンツをユーザ端末に公開し、ウェブサーバへのユーザ端末のアクセスを記録してコンテンツの内容と記録されたアクセス記録とに基づいてユーザ端末のアクセス動向を解析するアクセス解析方法において、ビジネスに関係するウェブサーバの各ページを予め決められた数のカテゴリに分類するカテゴリ分類工程と、ビジネスにとって重要性が増加するユーザ端末のアクセス結果であるコンバージョンに結びつくようなユーザ端末のアクセスを、分類されたカテゴリに基づいてコンバージョンに至る連続経路として定義する経路定義工程と、アクセス記録に記録されている付帯情報をさらに組み合わせて、ユーザ端末が複数のページを渡り歩くパターンであるアクセスパターンの傾向を、カテゴリ毎に端末クラスに分類する端末クラス分類工程と、定義された連続経路と分類されたカテゴリとに基づく端末クラスの特性を、相関規則を用いて求めるため、端末クラスに該当するユーザ端末が起こした全アクセスパターン数のうち、ある端末クラスが起こしたアクセスパターンの回数の占める割合であるユーザ端末のサポート値を算出する端末特性算出工程と、当該アクセスパターンの寄与度を求めるため、全アクセスパターン数のうち、当該アクセスパターンを起こした回数の占める割合であるユーザ端末の全体のアクセスに対するコンフィデンス値を算出する端末寄与度算出工程と、算出されたユーザ端末のサポート値及びコンフィデンス値を予め決められたしきい値に基づいてアクセスパターンを絞り込む絞り込み工程と、を含み、絞り込み工程からの情報に基づいて、コンバージョンに至る端末クラスを予想することを特徴とする。   Further, the access analysis method according to the present invention is based on the contents of the content and the recorded access record by the web server publishing the content to the user terminal by a plurality of pages and recording the access of the user terminal to the web server. In an access analysis method for analyzing access trends of user terminals, a category classification step of classifying each page of a web server related to a business into a predetermined number of categories, and access results of user terminals that are increasingly important for business The user terminal further combines the route definition step of defining the user terminal access that leads to the conversion as a continuous route leading to the conversion based on the classified category and the incidental information recorded in the access record. It is a pattern of walking across multiple pages To determine the characteristics of terminal classes based on the terminal class classification process for classifying access pattern trends into terminal classes for each category and the defined continuous routes and the classified categories, using association rules. The terminal characteristic calculation step of calculating the support value of the user terminal, which is the ratio of the number of access patterns generated by a certain terminal class, out of the total number of access patterns generated by the corresponding user terminal, and the contribution degree of the access pattern In order to obtain, a terminal contribution calculation step of calculating a confidence value for the entire access of the user terminal, which is a ratio of the number of times that the access pattern has occurred among all the access patterns, a calculated support value of the user terminal, and Access pattern based on a predetermined threshold It includes a narrowing step to narrow, and based on information from the narrowing process, characterized in that to predict the terminal class to a conversion.

また、本発明に係るアクセス解析方法において、絞り込み工程は、アクセス記録から取り出したユーザ端末の連続するアクセスパターンを複数の短いアクセスパターンに分割する分割工程と、短いアクセスパターンに基づいて、サポート度及びコンフィデンス度の低い端末クラスのアクセスを予め決められたしきい値により、アクセス記録から弁別する第1のフィルタ工程と、第1のフィルタ工程で得られたアクセス記録から、コンバージョンに至る手前の端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第2のフィルタ工程と、第1と第2のフィルタ工程により弁別され抽出された残りのアクセス記録からコンバージョンに至った端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第3のフィルタ工程と、抽出された端末クラスに関する情報を出力する出力工程と、を有することを特徴とする。   Further, in the access analysis method according to the present invention, the narrowing-down step includes a dividing step of dividing a continuous access pattern of the user terminal extracted from the access record into a plurality of short access patterns, and the support level and the short access pattern based on the short access pattern. A first filter step for discriminating access of a terminal class having a low degree of confidence from an access record based on a predetermined threshold, and a terminal class before the conversion from the access record obtained in the first filter step We focused on the second filter process that extracts the threshold value of the support value and the confidence value focused on, and the terminal class that led to conversion from the remaining access records that were discriminated and extracted by the first and second filter processes Extract by threshold value of support value and confidence value And having a third filter process for an output step of outputting information related to the extracted terminal class, a.

また、本発明に係るアクセス解析方法において更に、学習用記録と試験用記録との二つのアクセス記録を収集するアクセス記録収集工程と、学習用記録から求められたサポート値及びコンフィデンス値のしきい値に基づいて試験用記録を処理することで、しきい値を検証するしきい値検証工程と、を有することを特徴とする。   Further, in the access analysis method according to the present invention, an access record collecting step for collecting two access records of a learning record and a test record, and a support value and a confidence value threshold obtained from the learning record And a threshold value verification step for verifying the threshold value by processing the test record based on the above.

本発明を用いると、顧客情報が乏しい1回購買を主流とするe−コマースにおいて、複数ページによってコンテンツを公開するウェブサーバへのユーザ端末のアクセスを検出して記録し、コンテンツの内容と記録されたコンバージョンに至ったアクセス記録を含む記録データとに基づいてユーザ端末のアクセス動向を解析することが可能となる。   With the present invention, in e-commerce mainly for one-time purchases where customer information is scarce, the access of a user terminal to a web server that publishes content by a plurality of pages is detected and recorded, and the contents are recorded. It is possible to analyze the access trend of the user terminal based on the record data including the access record that has led to the conversion.

以下、本発明を実施するための最良の形態(以下実施形態という)を、図面に従って説明する。
(実施形態)
Hereinafter, the best mode for carrying out the present invention (hereinafter referred to as an embodiment) will be described with reference to the drawings.
(Embodiment)

図1はアクセス解析システム10の全体構成を示ている。ウェブサイトホームページは複数のページを有し、ウェブサイトをユーザ端末(31〜33)に公開しているウェブサーバ1はインターネット2を介してコンテンツをユーザ端末(31〜33)に提供する。アクセス解析システム10は、ユーザ端末31を操作する顧客のクリック動作によりアクセスされる各ページの情報を検出し、アクセスログDB(データベース、以下DBと略す)11に記憶する。   FIG. 1 shows the overall configuration of the access analysis system 10. The website home page has a plurality of pages, and the web server 1 that publishes the website to the user terminals (31 to 33) provides contents to the user terminals (31 to 33) via the Internet 2. The access analysis system 10 detects information of each page accessed by a click operation of a customer who operates the user terminal 31 and stores the information in an access log DB (database, hereinafter abbreviated as DB) 11.

アクセス解析システム10は、コンピュータシステムであり、ウェブサイトのページ構造を記録するウェブ構造DB14と、ページ構造をページカテゴリに分類して記録するページカテゴリDB18と、アクセスログDB11の記録に基づいて各ユーザ端末が各ページを渡り歩いた経路を定義する経路定義DB17と、コンバージョンに至る順に顧客のクラスを定義する顧客クラスDB16と、後述する顧客クラス判別処理によって顧客クラスの特性を分析した結果を記録する特性パターンDB15と、表示端末19に接続された制御部20と、を用いてアクセス解析を実行する。また、アクセスログDB11は、後述する顧客クラス判別処理で用いる学習用ログDB12と試験用ログDB13とを有している。   The access analysis system 10 is a computer system, and a web structure DB 14 that records the page structure of a website, a page category DB 18 that classifies and records the page structure into page categories, and a user based on the records in the access log DB 11. A route definition DB 17 that defines the route the terminal has traveled across each page, a customer class DB 16 that defines customer classes in the order of conversion, and a property that records the result of analyzing the characteristics of the customer class by a customer class discrimination process described later Access analysis is executed using the pattern DB 15 and the control unit 20 connected to the display terminal 19. The access log DB 11 includes a learning log DB 12 and a test log DB 13 that are used in a customer class determination process described later.

図2は、本実施形態においてアクセス解析を行った「シビラ(登録商標)」のウェブサイトを示している。「シビラ(登録商標)」はアクセス解析用のソフトウエアであり、1回購買に該当することから、顧客の購買履歴は通常は存在せず、有力な情報要素としては、リファラ(サイトのページのリンクをクリックして別のページに移動したときの、リンク元のページ情報等)、ランディング・ページ(インターネット広告や、検索エンジンの検索結果からのリンク先となるウェブページ)、ページ閲覧経路、ページ閲覧時間、検索キーワード等、顧客がもたらすアクセスログデータだけである。   FIG. 2 shows a website of “Shibira (registered trademark)” for which access analysis is performed in the present embodiment. “Shibira (registered trademark)” is software for access analysis, and since it corresponds to a single purchase, there is usually no customer purchase history, and as a powerful information element, referrer (site page Link page information when you click a link to go to another page, etc.), landing page (web page linked to from Internet advertisements or search engine search results), page browsing route, page Only access log data provided by the customer, such as browsing time and search keywords.

図3は本実施形態におけるアクセス解析処理の流れを示している。本アクセス解析処理では、コンバージョンにアップグレードすると予想される優良顧客を判別するために、学習用ログと試験用ログを用いて顧客クラス判定処理に必要な様々なパラメータを特定し、その後に顧客クラス判定を行うものである。   FIG. 3 shows the flow of access analysis processing in this embodiment. In this access analysis process, in order to identify the good customers who are expected to upgrade to conversion, various parameters necessary for the customer class determination process are specified using the learning log and the test log, and then the customer class determination is performed. Is to do.

アクセス解析処理が実行されると、ループ回数を判定(ステップS10)し、1回目であれば、学習用ログの読み出し(ステップS12)を実行する。次に、ウェブサイトで提供されている複数のページを分類して定義するためにページカテゴリ定義(ステップS14)と、ページカテゴリに関連する顧客クラスを定義するために顧客クラスの定義(ステップS16)を実行する。学習用ログ、ページカテゴリ及び顧客クラスに基づいて固有アクセスパターンの抽出(ステップS18)と、固有アクセスパターンによって特徴付けられた顧客クラスを特定(ステップS20)する。顧客クラス特定時に使用したパラメータによりパラメータを特定(ステップS22)し、顧客クラス判定(ステップS24)を実行し、ステップS26において、判定した顧客クラスの評価を実行して、継続する場合には、ループ先頭であるステップS10へ戻る。   When the access analysis process is executed, the loop count is determined (step S10). If it is the first time, the learning log is read (step S12). Next, a page category definition (step S14) for classifying and defining a plurality of pages provided on the website, and a customer class definition (step S16) for defining a customer class related to the page category. Execute. Based on the learning log, page category, and customer class, the unique access pattern is extracted (step S18), and the customer class characterized by the unique access pattern is specified (step S20). If the parameter is specified by the parameter used when specifying the customer class (step S22), the customer class determination (step S24) is executed, and the evaluation of the determined customer class is executed in step S26. It returns to step S10 which is the head.

ループ回数判定(ステップS10)において、2回目と判定された場合には、試験用ログの読み出し(ステップS30)を実行する。次に、試験用ログ、ページカテゴリ及び顧客クラスに基づいて、固有アクセスパターンの抽出(ステップS18)と、固有アクセスパターンにより特徴付けられて顧客クラスを特定(ステップS20)する。顧客クラス特定時に使用したパラメータによりパラメータを特定(ステップS22)し、顧客クラス判定(ステップS24)を実行し、ステップS26において、判定した顧客クラスの評価を実行し、パラメータの最適化を行う。継続する場合には、ループ先頭であるステップS10へ戻る。   In the loop number determination (step S10), when it is determined to be the second time, the test log is read (step S30). Next, based on the test log, the page category, and the customer class, the unique access pattern is extracted (step S18), and the customer class characterized by the unique access pattern is specified (step S20). The parameter is specified by the parameter used when specifying the customer class (step S22), and the customer class determination (step S24) is executed. In step S26, the determined customer class is evaluated and the parameters are optimized. When continuing, it returns to step S10 which is a loop head.

ループ回数判定(ステップS10)において、3回以上と判定された場合には、アクセスログの読み出し(ステップS32)を実行し、次に、顧客クラス判定(ステップS34)を実行してコンバージョンに至るであろう顧客を予想する。ステップS36において、継続しないと判定されることにより、処理が終了する。   In the loop number determination (step S10), when it is determined that the number of times is 3 or more, the access log is read (step S32), and then the customer class determination (step S34) is performed to reach the conversion. Anticipate potential customers. In step S36, when it is determined not to continue, the process ends.

図4はウェブサイトページカテゴリの一例を示している。1回購買のサイトのコンバージョンに結びつくページカテゴリの内容は、(1)料金表、(2)プレゼント応募、(3)会員登録、(4)お問い合わせ・資料請求(5)お試し、(6)商談予約等の六つに分類することができる。ここで、ビジネスにとっての重要度は、番号が増えるに従いその重要度は高いものとなる。   FIG. 4 shows an example of the website page category. The contents of the page category that leads to the conversion of a one-time purchase site are: (1) price list, (2) gift application, (3) member registration, (4) inquiry / document request (5) trial, (6) It can be classified into six types, such as business negotiation reservations. Here, the importance for business increases as the number increases.

一般に、ウェブサイトは図4に示したように複数の階層(P01−P0101等)に分かれた大量のページによって構成されるため、個々のページに対するアクセス(以下PV:ページビューと略す)単位として顧客のアクセス経路の分析を試みると、各ページの訪問回数に関するヒストグラムが極端に平坦になってしまい、顧客の行動特性を捉えることが困難となる。そこで、内容的に纏まりを持ち、かつ顧客の行動特性を把握できる程度の詳細さを保持しつつ、ページのカテゴリ化を行う必要がある。なお、本実施形態では、ページのカテゴリを六つとした。   In general, since a website is composed of a large number of pages divided into a plurality of layers (P01-P0101 etc.) as shown in FIG. 4, a customer is used as a unit for accessing each page (hereinafter abbreviated as PV: page view). When trying to analyze the access route, the histogram regarding the number of visits to each page becomes extremely flat, making it difficult to capture the behavioral characteristics of the customer. Therefore, it is necessary to categorize the pages while maintaining the details that are summarized in the contents and can grasp the behavioral characteristics of the customers. In the present embodiment, there are six page categories.

図5はウェブサイトの顧客クラスの一例を示している。六つのページのカテゴリ化を行った後、顧客が閲覧したページカテゴリの経路を基に、N個の顧客クラス(C1〜Cn)に分類する。実施形態では、C1〜C4の4個の顧客クラスをページカテゴリの経路から定義した。具体的には、「シビラ(登録商標)」の場合、(1)料金表、(4)お問い合わせ・資料請求、(5)お試し、等を用いて、顧客クラスC1はP01,P04,P05に到達せずにサイトを離脱した顧客。顧客クラスC2はP01を閲覧したが、P04,P05にに到達しない顧客。顧客クラスC3はP04,P05を閲覧したが、送信完了をおこなわなかった顧客。顧客クラスC4はP04,P05を閲覧し、送信完了を行った顧客に分類した。このように顧客クラスを分類することにより、ページカテゴリの経路とスタート地点から、ゴール地点までのアップグレード及びアクセスの流れが表現できるようになる。   FIG. 5 shows an example of the customer class of the website. After the categorization of the six pages, it is classified into N customer classes (C1 to Cn) based on the page category path viewed by the customer. In the embodiment, four customer classes C1 to C4 are defined from the page category path. Specifically, in the case of “Shibira (registered trademark)”, the customer class C1 is P01, P04, P05 using (1) price list, (4) inquiry / material request, (5) trial, etc. Customers who left the site without reaching. Customer class C2 browses P01 but does not reach P04 and P05. Customer class C3 viewed P04 and P05, but did not complete transmission. The customer class C4 browses P04 and P05 and classifies them as customers who have completed transmission. By classifying customer classes in this way, it is possible to represent the flow of upgrade and access from the path and start point of the page category to the goal point.

アクセスパターンは連続するkPV(ページビュー)を基本単位とし、「シビラ(登録商標)」では学習用ログの解析からk=3,K=6とした。PV判別は1〜kPV,2〜(k+1〜)PV,・・・,(K−k+1)〜KPV)つまり、1〜3PV(1,2,3)、2〜4PV(2,3,4)、3〜5PV(3,4,5)、4〜6PV(4,5,6)のPV数を基準として最大6PV以内でクラス判定を行った。   The access pattern has a continuous kPV (page view) as a basic unit, and in “Sybilla (registered trademark)”, k = 3 and K = 6 from the analysis of the learning log. PV discrimination is 1 to kPV, 2 to (k + 1 to) PV,..., (Kk + 1) to KPV), that is, 1 to 3 PV (1, 2, 3), 2 to 4 PV (2, 3, 4). , 3 to 5 PV (3, 4, 5), 4 to 6 PV (4, 5, 6) as a standard, the class was determined within 6 PV at maximum.

アクセスパターンを抽出するため、相関規則の統計的な意味付けとしてサポート値(Support)とコンフィデンス値(Confidence)という値を用いる。C1〜C4のアクセスパターンpに対するサポート値とは、Ciの顧客が起こした全アクセスパターン数の内、アクセスパターンpの起こった回数の占める割合である。また、コンフィデンス値とは、アクセスパターンpの総数の内、Ciがそのアクセスパターンpを起こした回数の占める割合である。   In order to extract the access pattern, values of support value and confidence value are used as statistical meaning of the correlation rule. The support value for the access pattern p of C1 to C4 is a ratio of the number of times that the access pattern p has occurred among the total number of access patterns that have been caused by the customer of Ci. The confidence value is the ratio of the number of times that Ci has caused the access pattern p in the total number of access patterns p.

ある顧客クラスのあるアクセスパターンに対するサポート値が高いということは、そのクラスに属する顧客がそのアクセスパターンを生起する蓋然性が高いことを意味するが、そのことのみによって、そのアクセスパターンがその顧客クラスの特性を表すことには無理がある。   A high support value for an access pattern in a customer class means that there is a high probability that a customer belonging to that class will generate the access pattern. It is impossible to express characteristics.

例えば、サポート値は高くてもコンフィデンス値が低い場合、そのアクセスパターンを起こした顧客が別の顧客クラスに属する蓋然性はより高いことになる。従って、ある顧客クラスの特性としてあるパターンを特性する為には、サポート値とコンフィデンス値の双方とも高い値を持つことが必要である。この理由により、Ciのアクセスパターンpに対して、それぞれのしきい値α,βを上回ったとき、そのアクセスパターンをCiの特性パターンとする。   For example, if the support value is high but the confidence value is low, the probability that the customer who caused the access pattern belongs to another customer class is higher. Therefore, in order to characterize a certain pattern as a characteristic of a certain customer class, it is necessary that both the support value and the confidence value have high values. For this reason, when the threshold value α or β is exceeded for the Ci access pattern p, the access pattern is set as the Ci characteristic pattern.

図6は顧客クラス判別処理の一例を示している。顧客クラス判別処理とは、顧客クラスの特性を把握するために、アクセスログから各顧客クラスに固有のアクセスパターンを抽出し、そのクラスに属する顧客がそのパターンを生起する蓋然性が高い特性を求めることである。また、具体例として、顧客クラスを二つ(C1,C2)、ページビューが(A)P01,(B)P04,(C)P05におけるアクセスパターンが四つしか存在しない場合を示している。   FIG. 6 shows an example of the customer class discrimination process. Customer class discrimination processing is to identify the characteristics of a customer class by extracting access patterns specific to each customer class from the access log and obtaining the characteristics that are likely to cause that pattern to occur for customers belonging to that class. It is. Further, as a specific example, there is shown a case where there are only four access patterns in two customer classes (C1, C2) and page views (A) P01, (B) P04, (C) P05.

図7(A)はアクセスパターンの抽出例を示し、図7(B)は図7(A)から算出されたサポート値、図7(C)は図7(A)から算出されたコンフィデンス値、図7(D)は最終的な特性パターンを示している。   7A shows an example of access pattern extraction, FIG. 7B shows a support value calculated from FIG. 7A, FIG. 7C shows a confidence value calculated from FIG. FIG. 7D shows the final characteristic pattern.

ここで、C2顧客クラスのうちP01,P04,P05(A−B−C)を閲覧し、送信完了をしたページビューパターン1を識別するためのしきい値α,βの選ぶ手順を示す。C2顧客クラスのうち特性パターンA−B−Cを満たすサポート値は0.375であり、コンフィデンス値は0.75であることが図7(D)に示されており、しきい値(α、β)=(0.375,0.75)以上とすると、サポート値0.375を上回る0.445のC1顧客クラスの特性パターンA−C−Bが該当するが、コンフィデンス値が0.44であり、C2顧客クラスの0.75を上回らないため、特性パターンA−C−BはC2顧客クラスでは選択されない。さらに、図7(B),(C)から学習用ログで求められたしきい値は、例えば、(α、β)=(0.35,0.5)としてもC2顧客クラスの特性パターンA−B−Cが選択されることになる。   Here, a procedure for selecting threshold values α and β for identifying page view pattern 1 that has browsed P01, P04, and P05 (ABC) in C2 customer class and has completed transmission will be described. FIG. 7D shows that the support value satisfying the characteristic pattern ABC in the C2 customer class is 0.375 and the confidence value is 0.75, and threshold values (α, If β) = (0.375, 0.75) or higher, 0.445 C1 customer class characteristic pattern A-C-B exceeding the support value 0.375 is applicable, but the confidence value is 0.44. Yes, since it does not exceed 0.75 of the C2 customer class, the characteristic pattern A-C-B is not selected in the C2 customer class. Further, the threshold value obtained from the learning log from FIGS. 7B and 7C is, for example, the characteristic pattern A of the C2 customer class even if (α, β) = (0.35, 0.5). -B-C will be selected.

上述したように、1回購買サイトの分析においては、特性パターンを構成する情報要素としては、リファイラ、ランディング・ページ、ページ閲覧経路、ページ閲覧時間、検索キーワード等、顧客がもたらすアクセスログに依存する。これらの組み合わせでアクセスパターンを構成すれば良いかはウェブサイトのページ構造や、顧客のアクセス行動により一概に決定することができない。そこで、本実施形態では、複数の組み合わせを学習用ログと試験用ログとを用いて評価し、後述する顧客クラス判定処理の評価にて最良の結果をもたらす組み合わせを決定した。   As described above, in the analysis of the one-time purchase site, the information elements constituting the characteristic pattern depend on the access log brought by the customer such as a refiner, landing page, page browsing route, page browsing time, search keyword, etc. . Whether or not the access pattern should be configured by a combination of these cannot be generally determined by the page structure of the website or the access behavior of the customer. Therefore, in the present embodiment, a plurality of combinations are evaluated using the learning log and the test log, and the combination that gives the best result is determined by the evaluation of the customer class determination process described later.

図8は顧客クラス判別処理の流れを示している。本実施形態は、図5のC1−P(C1最終顧客;ステージ1)からアップグレードする顧客クラスの判別において、顧客が六つのページを渡り歩く際、T=1では1〜3PV(ページビュー)に注目して非優良顧客を選別し、T=2では2〜4PVに、T=3では3〜5PVに、T=4では4〜6PVに着目して顧客がアップグレードするか否かの選別を行う。ここで、k=3,K=3,iはCiの添え字とする。   FIG. 8 shows the flow of the customer class discrimination process. In this embodiment, in the determination of the customer class to be upgraded from C1-P (C1 final customer; stage 1) in FIG. 5, when the customer walks across six pages, attention is paid to 1 to 3 PV (page view) at T = 1. Then, non-excellent customers are selected, and whether T2 is 2 to 4 PV, T = 3 is 3 to 5 PV, and T = 4 is 4 to 6 PV, and whether or not the customer is upgraded is selected. Here, k = 3, K = 3, and i are subscripts of Ci.

顧客クラス判別処理が開始すると、最初にT=1を代入する(ステップS40)。次に、1〜3PVのループ外かを判定(ステップS42)し、ループ条件内であれば、ステップS46に移る。また、アップグレードをした場合にはステップS44にて判定を行う。ステップS46ではT時点でステージ1(ステージは1,2,3まで)にいる顧客がアップグレードするのか、最終的に現在の顧客クラスに留まるのかを判定する。この時点でアップグレードすると判定した場合にはそこで判別を終了すべくステップS58に移る。また、T時点でコンバージョンを達成してしまった場合には、以後その顧客を考察の対象から排除(ステップS58)する。もし、アップグレードしないと判定した場合には(T+1)時点以降でも引き続き判別をおこなうべく、ステップS48に移る。   When the customer class discrimination process starts, T = 1 is substituted first (step S40). Next, it is determined whether it is outside the loop of 1 to 3 PV (step S42). If it is within the loop condition, the process proceeds to step S46. If an upgrade has been performed, a determination is made at step S44. In step S46, it is determined whether the customer who is in stage 1 (stages 1, 2, and 3) at the time T upgrades or stays in the current customer class. If it is determined that the upgrade is performed at this time, the process proceeds to step S58 to end the determination. If conversion has been achieved at time T, the customer is subsequently excluded from consideration (step S58). If it is determined not to upgrade, the process proceeds to step S48 in order to continue the determination even after the time (T + 1).

ステップS48において、C1のUCP(ユニーク・キャラクタリスティック・パターン)であるかを判定し、上述のしきい値α、βによりC1顧客クラスの特性パターンと一致することをステップS52で判断する。また、C1のUCP以外へのアップグレードによりC2のUCPを含む場合は、ステップS50に移り、複数クラスのUCPを待つことになる。もし、アップグレードにより複数クラスのUCPを受け取ると、ステップS54にて二つの顧客クラスに共通の特性パターンと一致した時は二つの顧客クラスのサポート値の比率により各顧客クラスに振り分ける。また、サポート比率によっても振り分けができない時には、顧客数比で振り分ける(ステップS56)。これらの処理が終わると、ステップS60に移り、Tに1を加えてステップS62にてループに戻るか否かを判定し、戻る場合には残りのT=2,3,4を順次実行する。   In step S48, it is determined whether it is a U1 (unique characteristic pattern) of C1, and it is determined in step S52 that it matches the characteristic pattern of the C1 customer class based on the above-described threshold values α and β. If the C2 UCP is included by upgrading to a non-C1 UCP, the process moves to step S50 and waits for a plurality of classes of UCPs. If a plurality of classes of UCPs are received as a result of the upgrade, if they match the characteristic pattern common to the two customer classes in step S54, they are distributed to each customer class according to the ratio of the support values of the two customer classes. Further, when the distribution cannot be performed according to the support ratio, the distribution is performed based on the number of customers ratio (step S56). When these processes are completed, the process proceeds to step S60, 1 is added to T, and it is determined whether or not the process returns to the loop in step S62. If the process returns, the remaining T = 2, 3, and 4 are sequentially executed.

なお、ステップS50では、複数クラスのUCPを待ち、リファラ,ランディング・ページ,ページ閲覧時間であるDwell Time等をアクセスパターンに取り入れ、特性パターンの判別精度の参考データを蓄積している。この参考データにより、最良の結果をもたらす組み合わせを評価する。   In step S50, a plurality of classes of UCP are awaited, referrer, landing page, Dwell Time, which is the page browsing time, and the like are taken into the access pattern, and reference data for characteristic pattern discrimination accuracy is accumulated. This reference data evaluates the combination that gives the best results.

上述した顧客クラス判定処理では、学習用ログを用い、特性パターンを表現する情報要素を組み合わせて各顧客クラスの特性パターンを判別するためのしきい値(α,β)を求め、最良の結果をもたらす組み合わせの評価を行った。   In the customer class determination process described above, the learning log is used to obtain threshold values (α, β) for determining the characteristic pattern of each customer class by combining information elements expressing the characteristic pattern, and the best result is obtained. The resulting combination was evaluated.

一般的に、これらのパラメータには許容幅があることから、さらに、試験用ログを用いて顧客クラス判定処理の評価を行うことになる。この評価を行うに当たり、二項分布特性に当てはめたRecall,Precisionの値を算出する。   Generally, since these parameters have an allowable range, the customer class determination process is further evaluated using a test log. In performing this evaluation, values of Recall and Precision applied to the binomial distribution characteristics are calculated.

図9、図10はコンバージョンにアップグレードするであろう優良顧客の選別例を示し、C1のステージ1におけるT=1(1〜3PV)からT=4(4〜6PV)までの4つの段階において、それぞれRecallとPrecisionの値を示している。図9(A)ではT=1(1〜3PV)においてアクセス後すぐに離脱してしまう顧客を弁別した非優良顧客選別結果を示している。ここで、C1−PのPrecisionは高く(72.64%)、非優良顧客を高い精度で選別できていることが分かる。図9(B)T=2における絞り込み1回目は、C2へアップグレードする顧客のPrecisionを(34.37%)しながら、T=3,4でもPresisonを(34.25%,34.67%)というように維持することができ、さらに、Recallも上昇させることに成功し、篩いとして機能していることが分かる。   FIG. 9 and FIG. 10 show examples of selecting good customers who will be upgraded to conversions. In four stages from T = 1 (1 to 3 PV) to T = 4 (4 to 6 PV) in stage 1 of C1, Recall and Precision values are shown, respectively. FIG. 9A shows a non-excellent customer selection result that discriminates customers who leave immediately after access at T = 1 (1 to 3 PV). Here, the precision of C1-P is high (72.64%), and it can be seen that non-excellent customers can be selected with high accuracy. FIG. 9 (B) The first refinement at T = 2 is the Precision of the customer who upgrades to C2 (34.37%), while the Precision is also at T = 3,4 (34.25%, 34.67%) In addition, it was found that Recall was also successfully raised and functioned as a sieve.

さらに、T=4におけるアップグレードのPrecisionを見ると355/1024=34.67%である。これは、一見すると低い精度と思われがちであるが、試験用ログから1024名を無差別に抽出し、それぞれがアップグレードが否かをランダムに判定したときに355名もしくはそれ以上を正しく言い当てる確率と比較は、約0.02%となる。この事実から、顧客クラス判定処理における優良顧客判定の精度が高いものであるかが理解されるであろう。   Furthermore, when viewing the Precision of the upgrade at T = 4, 355/1024 = 34.67%. This tends to seem low accuracy at first glance, but the probability that 1024 people will be indiscriminately extracted from the test log and 355 or more will be correctly identified when each of them randomly determines whether or not an upgrade is possible. And about 0.02%. From this fact, it will be understood whether the accuracy of the good customer judgment in the customer class judgment processing is high.

なお、ランダムに判定した時の確率の算出方法は、正解率をXとし、正解率XはN=1024,θ=アップグレードのオリジナルの値である0.2922の二項分布に従い、Nは十分大きいので正規近似を用いXが355もしくはそれ以上である確率を求めると、その値は約0.00002(0.002%)となる。   In addition, the calculation method of the probability at the time of determining at random sets the correct answer rate to X, and the correct answer rate X follows the binomial distribution of N = 1024, θ = 0.2922 which is the original value of the upgrade, and N is sufficiently large Therefore, when the probability that X is 355 or more is obtained using normal approximation, the value is about 0.00002 (0.002%).

以上、上述したように、本実施形態に係るアクセス解析システムを用いると、顧客情報が乏しい1回購買を主流とするe−コマースにおいて、複数ページによってコンテンツを公開するウェブサーバへのユーザ端末のアクセスを検出して記録し、コンテンツの内容と記録されたコンバージョンに至ったアクセス記録を含む記録データとに基づいてユーザ端末のアクセス動向を解析することが可能となる。   As described above, when the access analysis system according to the present embodiment is used, the user terminal access to the web server that publishes the content by a plurality of pages in the e-commerce mainly for one-time purchase where customer information is scarce. Can be detected and recorded, and the access trend of the user terminal can be analyzed based on the content of the content and the recorded data including the recorded access record that has led to the conversion.

(補遺)
本発明では、主にアクセス解析システム及びアクセス解析方法を説明したが、これにかぎらず、アクセス解析プログラムも重要であることから、以下その内容を記載する。
(Addendum)
In the present invention, the access analysis system and the access analysis method have been mainly described. However, the access analysis program is also important, and the contents will be described below.

本発明に係るアクセス解析プログラムは、ウェブサーバが複数ページによってコンテンツをユーザ端末に公開し、ウェブサーバへのユーザ端末のアクセスを記録してコンテンツの内容と記録されたアクセス記録とに基づいてユーザ端末のアクセス動向を解析するアクセス解析プログラムにおいて、ビジネスに関係するウェブサーバの各ページを予め決められた数のカテゴリに分類するカテゴリ分類ステップと、ビジネスにとって重要性が増加するユーザ端末のアクセス結果であるコンバージョンに結びつくようなユーザ端末のアクセスを、分類されたカテゴリに基づいてコンバージョンに至る連続経路として定義する経路定義ステップと、アクセス記録に記録されている付帯情報をさらに組み合わせて、ユーザ端末が複数のページを渡り歩くパターンであるアクセスパターンの傾向を、カテゴリ毎に端末クラスに分類する端末クラス分類ステップと、定義された連続経路と分類されたカテゴリとに基づく端末クラスの特性を、相関規則を用いて求めるため、端末クラスに該当するユーザ端末が起こした全アクセスパターン数のうち、ある端末クラスが起こしたアクセスパターンの回数の占める割合であるユーザ端末のサポート値を算出する端末特性算出ステップと、当該アクセスパターンの寄与度を求めるため、全アクセスパターン数のうち、当該アクセスパターンを起こした回数の占める割合であるユーザ端末の全体のアクセスに対するコンフィデンス値を算出する端末寄与度算出ステップと、算出されたユーザ端末のサポート値及びコンフィデンス値を予め決められたしきい値に基づいてアクセスパターンを絞り込む絞り込みステップと、をコンピュータによって実行し、絞り込みステップからの情報に基づいて、コンバージョンに至る端末クラスを予想することを特徴とする。   According to the access analysis program of the present invention, a web server publishes content to a user terminal by a plurality of pages, records the access of the user terminal to the web server, and records the content of the content and the recorded access record. In the access analysis program for analyzing the access trend of the user, there are a category classification step for classifying each page of the web server related to the business into a predetermined number of categories, and the access result of the user terminal increasing in importance to the business. By further combining the route definition step of defining user terminal access that leads to conversion as a continuous route leading to conversion based on the classified category, and additional information recorded in the access record, the user terminal can Walk across pages To determine the characteristics of the terminal class based on the terminal class classification step for classifying the access pattern tendency that is a turn into a terminal class for each category and the defined continuous route and the classified category, using the correlation rule, A terminal characteristic calculation step for calculating a support value of the user terminal, which is a ratio of the number of access patterns generated by a certain terminal class, out of the total number of access patterns generated by the user terminal corresponding to the terminal class, In order to obtain the contribution degree, a terminal contribution degree calculation step for calculating a confidence value for the entire access of the user terminal, which is a ratio of the number of times that the access pattern has occurred among the total number of access patterns, and the calculated user terminal Predetermined thresholds for support and confidence values Based executed and refinement steps Filter access pattern, by the computer, based on information from the narrowing step, characterized in that to predict the terminal class to a conversion.

また、本発明に係るアクセス解析プログラムにおいて、絞り込みステップは、アクセス記録から取り出したユーザ端末の連続するアクセスパターンを複数の短いアクセスパターンに分割する分割ステップと、短いアクセスパターンに基づいて、サポート度及びコンフィデンス度の低い端末クラスのアクセスを予め決められたしきい値により、アクセス記録から弁別する第1のフィルタステップと、第1のフィルタステップで得られたアクセス記録から、コンバージョンに至る手前の端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第2のフィルタステップと、第1と第2のフィルタステップにより弁別され抽出された残りのアクセス記録からコンバージョンに至った端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第3のフィルタステップと、抽出された端末クラスに関する情報を出力する出力ステップと、を有することを特徴とする。   In the access analysis program according to the present invention, the narrowing-down step includes a dividing step of dividing a continuous access pattern of the user terminal extracted from the access record into a plurality of short access patterns, and a support level and a short access pattern based on the short access patterns. A first filter step for discriminating access of a terminal class having a low degree of confidence from an access record according to a predetermined threshold, and a terminal class before the conversion from the access record obtained in the first filter step Focused on the second filter step that is extracted based on the support value and the confidence value threshold value, and the terminal class that has been converted from the remaining access records that have been distinguished and extracted by the first and second filter steps Support value and control And having a third filter extracting the threshold Idensu value, and an output step of outputting information about the terminal class extracted.

また、本発明に係るアクセス解析プログラムにおいて更に、学習用記録と試験用記録との二つのアクセス記録を収集するアクセス記録収集ステップと、学習用記録から求められたサポート値及びコンフィデンス値のしきい値に基づいて試験用記録を処理することで、しきい値を検証するしきい値検証ステップと、を有することを特徴とする。   The access analysis program according to the present invention further includes an access record collecting step for collecting two access records, a learning record and a test record, and threshold values of support values and confidence values obtained from the learning records. And a threshold verification step of verifying the threshold by processing the test record based on the above.

本発明は、複数ページによってコンテンツを公開するウェブサーバへのユーザ端末のアクセスを検出して記録し、コンテンツの内容と記録されたアクセス記録とに基づいてユーザ端末のアクセス動向を解析するアクセス解析システムに利用することが可能である。   The present invention relates to an access analysis system that detects and records access of a user terminal to a web server that publishes content by a plurality of pages, and analyzes an access trend of the user terminal based on the content of the content and the recorded access record. It is possible to use it.

本発明の実施形態に係るアクセス解析システムの全体構成を示す構成図である。It is a lineblock diagram showing the whole access analysis system composition concerning an embodiment of the present invention. 本実施形態でアクセス解析をおこなったウェブサイトの一例である。It is an example of the website which performed the access analysis in this embodiment. 本実施形態に係るアクセス解析処理の流れを示すフローチャート図である。It is a flowchart figure which shows the flow of the access analysis process which concerns on this embodiment. 本実施形態に係るページカテゴリの一例を説明する説明図である。It is explanatory drawing explaining an example of the page category which concerns on this embodiment. 本実施形態に係るウェブサイトの顧客クラスを説明する説明図である。It is explanatory drawing explaining the customer class of the website which concerns on this embodiment. 本実施形態に係る顧客クラス判別処理の一例を説明する説明図である。It is explanatory drawing explaining an example of the customer class discrimination | determination process which concerns on this embodiment. 本実施形態に係るアクセスパターンの抽出例を示す模式図である。It is a schematic diagram which shows the example of extraction of the access pattern which concerns on this embodiment. 本実施形態に係る顧客クラス判別処理の流れを示すフローチャート図である。It is a flowchart figure which shows the flow of the customer class discrimination | determination process concerning this embodiment. 本実施形態に係るコンバージョンに至るであろう優良顧客の選別例を示す模式図である。It is a schematic diagram which shows the example of selection of the good customer who will lead to the conversion which concerns on this embodiment. 本実施形態に係るコンバージョンに至るであろう優良顧客の選別例を示す模式図である。It is a schematic diagram which shows the example of selection of the good customer who will lead to the conversion which concerns on this embodiment.

符号の説明Explanation of symbols

1 ウェブサーバ、2 インターネット、10 アクセス解析システム、11 アクセスログDB、12 学習用ログDB、13 試験用ログDB、14 ウェブ構造DB、15 特性パターンDB、16 顧客クラスDB、17 経路定義DB、18 ページカテゴリDB、19 表示端末、20 制御部、31,32,33 ユーザ端末。   1 Web server, 2 Internet, 10 access analysis system, 11 access log DB, 12 learning log DB, 13 test log DB, 14 web structure DB, 15 characteristic pattern DB, 16 customer class DB, 17 route definition DB, 18 Page category DB, 19 display terminal, 20 control unit, 31, 32, 33 user terminal.

Claims (6)

ウェブサーバが複数ページによってコンテンツをユーザ端末に公開し、ウェブサーバへのユーザ端末のアクセスを記録してコンテンツの内容と記録されたアクセス記録とに基づいてユーザ端末のアクセス動向を解析するアクセス解析システムにおいて、
ビジネスに関係するウェブサーバの各ページを予め決められた数のカテゴリに分類するカテゴリ分類手段と、
ビジネスにとって重要性が増加するユーザ端末のアクセス結果であるコンバージョンに結びつくようなユーザ端末のアクセスを、分類されたカテゴリに基づいてコンバージョンに至る連続経路として定義する経路定義手段と、
アクセス記録に記録されている付帯情報をさらに組み合わせて、ユーザ端末が複数のページを渡り歩くパターンであるアクセスパターンの傾向を、カテゴリ毎に端末クラスに分類する端末クラス分類手段と、
定義された連続経路と分類されたカテゴリとに基づく端末クラスの特性を、相関規則を用いて求めるため、端末クラスに該当するユーザ端末が起こした全アクセスパターン数のうち、ある端末クラスが起こしたアクセスパターンの回数の占める割合であるユーザ端末のサポート値を算出する端末特性算出手段と、
当該アクセスパターンの寄与度を求めるため、全アクセスパターン数のうち、当該アクセスパターンを起こした回数の占める割合であるユーザ端末の全体のアクセスに対するコンフィデンス値を算出する端末寄与度算出手段と、
算出されたユーザ端末のサポート値及びコンフィデンス値を予め決められたしきい値に基づいてアクセスパターンを絞り込む絞り込み手段と、
を有し、
絞り込み手段からの情報に基づいて、コンバージョンに至る端末クラスを予想することを特徴とするアクセス解析システム。
An access analysis system in which a web server publishes content to a user terminal by a plurality of pages, records the access of the user terminal to the web server, and analyzes the access trend of the user terminal based on the contents of the content and the recorded access record In
Category classification means for classifying each page of a web server related to business into a predetermined number of categories;
A route definition means for defining user terminal access that leads to conversion, which is a result of user terminal access that is increasingly important to business, as a continuous path leading to conversion based on the classified category;
Further combining the incidental information recorded in the access record, the terminal class classification means for classifying the tendency of the access pattern, which is a pattern in which the user terminal walks across a plurality of pages, into a terminal class for each category;
In order to determine the characteristics of the terminal class based on the defined continuous route and the classified category using the correlation rule, a certain terminal class arose out of the total number of access patterns caused by the user terminal corresponding to the terminal class. Terminal characteristic calculation means for calculating a support value of the user terminal, which is a ratio of the number of access patterns,
In order to obtain the contribution degree of the access pattern, a terminal contribution degree calculation unit that calculates a confidence value for the entire access of the user terminal, which is a ratio of the number of times the access pattern has occurred among the total number of access patterns,
Narrowing means for narrowing down the access pattern based on a predetermined threshold for the calculated support value and confidence value of the user terminal;
Have
An access analysis system that predicts a terminal class leading to conversion based on information from a narrowing-down means.
請求項1に記載のアクセス解析システムにおいて、
絞り込み手段は、
アクセス記録から取り出したユーザ端末の連続するアクセスパターンを複数の短いアクセスパターンに分割する分割手段と、
短いアクセスパターンに基づいて、サポート度及びコンフィデンス度の低い端末クラスのアクセスを予め決められたしきい値により、アクセス記録から弁別する第1のフィルタ手段と、
第1のフィルタ手段で得られたアクセス記録から、コンバージョンに至る手前の端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第2のフィルタ手段と、
第1と第2のフィルタ手段により弁別され抽出された残りのアクセス記録からコンバージョンに至った端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第3のフィルタ手段と、
抽出された端末クラスに関する情報を出力する出力手段と、
を有することを特徴とするアクセス解析システム。
The access analysis system according to claim 1,
Narrowing means
A dividing means for dividing a continuous access pattern of the user terminal extracted from the access record into a plurality of short access patterns;
A first filter means for discriminating access of a terminal class having a low degree of support and confidence based on a short access pattern from an access record according to a predetermined threshold;
A second filter means for extracting from the access record obtained by the first filter means based on a support value and a confidence value threshold value focusing on a terminal class before conversion;
A third filter means for extracting from the remaining access records that are distinguished and extracted by the first and second filter means by a support value and a threshold value of the confidence value focusing on the terminal class that has led to conversion;
An output means for outputting information on the extracted terminal class;
An access analysis system comprising:
請求項1又は2に記載のアクセス解析システムにおいて更に、
学習用記録と試験用記録との二つのアクセス記録を収集するアクセス記録収集手段と、
学習用記録から求められたサポート値及びコンフィデンス値のしきい値に基づいて試験用記録を処理することで、しきい値を検証するしきい値検証手段と、
を有することを特徴とするアクセス解析システム。
The access analysis system according to claim 1 or 2, further comprising:
An access record collecting means for collecting two access records, a learning record and a test record;
Threshold verification means for verifying the threshold by processing the test record based on the support value and the confidence value threshold obtained from the learning record;
An access analysis system comprising:
ウェブサーバが複数ページによってコンテンツをユーザ端末に公開し、ウェブサーバへのユーザ端末のアクセスを記録してコンテンツの内容と記録されたアクセス記録とに基づいてユーザ端末のアクセス動向を解析するアクセス解析方法において、
ビジネスに関係するウェブサーバの各ページを予め決められた数のカテゴリに分類するカテゴリ分類工程と、
ビジネスにとって重要性が増加するユーザ端末のアクセス結果であるコンバージョンに結びつくようなユーザ端末のアクセスを、分類されたカテゴリに基づいてコンバージョンに至る連続経路として定義する経路定義工程と、
アクセス記録に記録されている付帯情報をさらに組み合わせて、ユーザ端末が複数のページを渡り歩くパターンであるアクセスパターンの傾向を、カテゴリ毎に端末クラスに分類する端末クラス分類工程と、
定義された連続経路と分類されたカテゴリとに基づく端末クラスの特性を、相関規則を用いて求めるため、端末クラスに該当するユーザ端末が起こした全アクセスパターン数のうち、ある端末クラスが起こしたアクセスパターンの回数の占める割合であるユーザ端末のサポート値を算出する端末特性算出工程と、
当該アクセスパターンの寄与度を求めるため、全アクセスパターン数のうち、当該アクセスパターンを起こした回数の占める割合であるユーザ端末の全体のアクセスに対するコンフィデンス値を算出する端末寄与度算出工程と、
算出されたユーザ端末のサポート値及びコンフィデンス値を予め決められたしきい値に基づいてアクセスパターンを絞り込む絞り込み工程と、
を含み、
絞り込み工程からの情報に基づいて、コンバージョンに至る端末クラスを予想することを特徴とするアクセス解析方法。
An access analysis method in which a web server publishes content to a user terminal by a plurality of pages, records the access of the user terminal to the web server, and analyzes the access trend of the user terminal based on the contents of the content and the recorded access record In
A category classification step for classifying each page of a web server related to business into a predetermined number of categories;
A path definition step for defining user terminal access that leads to conversion, which is a result of user terminal access increasing in importance to the business, as a continuous path to conversion based on the classified category;
Further combining the incidental information recorded in the access record, a terminal class classification step of classifying the access pattern tendency, which is a pattern in which the user terminal moves across a plurality of pages, into terminal classes for each category;
In order to determine the characteristics of the terminal class based on the defined continuous route and the classified category using the correlation rule, a certain terminal class arose out of the total number of access patterns caused by the user terminal corresponding to the terminal class. A terminal characteristic calculation step of calculating a support value of the user terminal, which is a ratio of the number of access patterns,
In order to determine the contribution degree of the access pattern, a terminal contribution degree calculation step of calculating a confidence value for the entire access of the user terminal, which is a ratio of the number of times the access pattern has occurred among all access pattern numbers,
A narrowing-down process for narrowing down the access pattern based on a predetermined threshold value for the calculated support value and confidence value of the user terminal;
Including
An access analysis method for predicting a terminal class leading to a conversion based on information from a narrowing-down process.
請求項4に記載のアクセス解析方法において、
絞り込み工程は、
アクセス記録から取り出したユーザ端末の連続するアクセスパターンを複数の短いアクセスパターンに分割する分割工程と、
短いアクセスパターンに基づいて、サポート度及びコンフィデンス度の低い端末クラスのアクセスを予め決められたしきい値により、アクセス記録から弁別する第1のフィルタ工程と、
第1のフィルタ工程で得られたアクセス記録から、コンバージョンに至る手前の端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第2のフィルタ工程と、
第1と第2のフィルタ工程により弁別され抽出された残りのアクセス記録からコンバージョンに至った端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第3のフィルタ工程と、
抽出された端末クラスに関する情報を出力する出力工程と、
を有することを特徴とするアクセス解析方法。
The access analysis method according to claim 4,
The refinement process is
A division step of dividing a continuous access pattern of the user terminal extracted from the access record into a plurality of short access patterns;
A first filtering step for discriminating access of a terminal class having a low degree of support and confidence based on a short access pattern from an access record according to a predetermined threshold;
A second filter step of extracting from the access record obtained in the first filter step by a support value and a threshold value of the confidence value focusing on the terminal class before conversion;
A third filtering step for extracting from the remaining access records that have been distinguished and extracted by the first and second filtering steps, based on the support value and the confidence value threshold value focusing on the terminal class that has led to conversion;
An output process for outputting information on the extracted terminal class;
An access analysis method characterized by comprising:
請求項4又は5に記載のアクセス解析方法において更に、
学習用記録と試験用記録との二つのアクセス記録を収集するアクセス記録収集工程と、
学習用記録から求められたサポート値及びコンフィデンス値のしきい値に基づいて試験用記録を処理することで、しきい値を検証するしきい値検証工程と、
を有することを特徴とするアクセス解析方法。
The access analysis method according to claim 4 or 5, further comprising:
An access record collecting process for collecting two access records, a learning record and a test record;
A threshold verification process for verifying the threshold by processing the test record based on the support value and the confidence value threshold obtained from the learning record;
An access analysis method characterized by comprising:
JP2008335738A 2008-12-29 2008-12-29 System and method for analyzing access Pending JP2010157151A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008335738A JP2010157151A (en) 2008-12-29 2008-12-29 System and method for analyzing access

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008335738A JP2010157151A (en) 2008-12-29 2008-12-29 System and method for analyzing access

Publications (1)

Publication Number Publication Date
JP2010157151A true JP2010157151A (en) 2010-07-15

Family

ID=42575027

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008335738A Pending JP2010157151A (en) 2008-12-29 2008-12-29 System and method for analyzing access

Country Status (1)

Country Link
JP (1) JP2010157151A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012005012A2 (en) 2010-07-09 2012-01-12 Furukawa Electric Co., Ltd. Optical interconnection system
CN106909372A (en) * 2017-01-23 2017-06-30 武汉奇米网络科技有限公司 A kind of mobile end subscriber purchase path calculation method and system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172665A (en) * 1998-12-04 2000-06-23 Fuji Xerox Co Ltd Hyper text analyzer, method therefor and storage medium recorded with hypertext analytic program therein
JP2001052017A (en) * 1999-08-11 2001-02-23 Fuji Xerox Co Ltd Hypertext analyzer
JP2003203152A (en) * 2002-01-07 2003-07-18 Toshiba Corp Marketing information providing method, program, and device
JP2005250802A (en) * 2004-03-03 2005-09-15 Toshiba Solutions Corp Device and program for detecting improper access

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172665A (en) * 1998-12-04 2000-06-23 Fuji Xerox Co Ltd Hyper text analyzer, method therefor and storage medium recorded with hypertext analytic program therein
JP2001052017A (en) * 1999-08-11 2001-02-23 Fuji Xerox Co Ltd Hypertext analyzer
JP2003203152A (en) * 2002-01-07 2003-07-18 Toshiba Corp Marketing information providing method, program, and device
JP2005250802A (en) * 2004-03-03 2005-09-15 Toshiba Solutions Corp Device and program for detecting improper access

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012005012A2 (en) 2010-07-09 2012-01-12 Furukawa Electric Co., Ltd. Optical interconnection system
DE112011102307T5 (en) 2010-07-09 2013-05-02 Furukawa Electric Co., Ltd., Optical connection system
CN106909372A (en) * 2017-01-23 2017-06-30 武汉奇米网络科技有限公司 A kind of mobile end subscriber purchase path calculation method and system
CN106909372B (en) * 2017-01-23 2020-08-18 武汉奇米网络科技有限公司 Method and system for calculating purchase path of mobile terminal user

Similar Documents

Publication Publication Date Title
CN109685631B (en) Personalized recommendation method based on big data user behavior analysis
US11107118B2 (en) Management of the display of online ad content consistent with one or more performance objectives for a webpage and/or website
Thorleuchter et al. Predicting e-commerce company success by mining the text of its publicly-accessible website
US20140325056A1 (en) Scoring quality of traffic to network sites
Coussement et al. A Bayesian approach for incorporating expert opinions into decision support systems: A case study of online consumer-satisfaction detection
Pham et al. Preference-based user rating correction process for interactive recommendation systems
KR20200048004A (en) Product recommendation system and method based on user purchase criterion and product review
KR102252188B1 (en) Product recommendation system and method reflecting user purchasing criterion
CN107153656B (en) Information searching method and device
KR20200048183A (en) Method and apparatus for online product recommendation considering reliability of product
Suh et al. A prediction model for the purchase probability of anonymous customers to support real time web marketing: a case study
CN103383702A (en) Method and system for recommending personalized news based on ranking of votes of users
KR102334404B1 (en) Merchandise recommendation server and control method thereof
Khatwani et al. Building personalized and non personalized recommendation systems
KR102097045B1 (en) Method and apparatus to recommend products reflecting characteristics of users
US20150120634A1 (en) Information processing device, information processing method, and program
CN112085549A (en) Commodity recommendation method for E-commerce platform based on data processing technology
KR101647364B1 (en) System and method for recommending contents based on user characteristics and transactions, and recording media thereof
KR20110023750A (en) Object customization and management system
KR101658714B1 (en) Method and system for predicting online customer action based on online activity history
Korganbekova et al. Balancing user privacy and personalization
Bejju Sales analysis of e-commerce websites using data mining techniques
CN117056619A (en) Method and device for determining user behavior characteristics
JP2010157151A (en) System and method for analyzing access
Markellou et al. Personalized e-commerce recommendations

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130806

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140107