JP5541049B2 - DATA GENERATION DEVICE, DATA GENERATION METHOD, AND DATA GENERATION PROGRAM - Google Patents

DATA GENERATION DEVICE, DATA GENERATION METHOD, AND DATA GENERATION PROGRAM Download PDF

Info

Publication number
JP5541049B2
JP5541049B2 JP2010220055A JP2010220055A JP5541049B2 JP 5541049 B2 JP5541049 B2 JP 5541049B2 JP 2010220055 A JP2010220055 A JP 2010220055A JP 2010220055 A JP2010220055 A JP 2010220055A JP 5541049 B2 JP5541049 B2 JP 5541049B2
Authority
JP
Japan
Prior art keywords
product
text
service
data
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010220055A
Other languages
Japanese (ja)
Other versions
JP2012073966A (en
Inventor
慶之 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2010220055A priority Critical patent/JP5541049B2/en
Publication of JP2012073966A publication Critical patent/JP2012073966A/en
Application granted granted Critical
Publication of JP5541049B2 publication Critical patent/JP5541049B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、商品またはサービスの情報提供における技術に関する。   The present invention relates to a technology for providing information on goods or services.

近年、インターネットなどのネットワーク及び携帯用電話機またはパーソナルコンピュータなどの通信端末装置の発達に伴って、webサイトなどの閲覧ページに組み込まれたテキストデータまたは画像データの各種のデータに基づいてユーザの嗜好に合致した商品または店舗を検索することが一般化している(例えば、特許文献1)。特に、最近では、商品の種別、色、機能その他のスペックを示す商品情報、または、提供商品、提供場所などの店舗情報、購買履歴及び他のユーザの定量評価に基づいて、商品または店舗を検索しているユーザに対して当該ユーザの嗜好に合致しているものを予想し、商品または店舗の情報を提供するシステムが知られている(例えば、特許文献2)。   In recent years, with the development of networks such as the Internet and communication terminal devices such as mobile phones or personal computers, the user's preference is based on various data of text data or image data incorporated in a browsing page such as a web site. Searching for a matching product or store has become common (for example, Patent Document 1). In particular, recently, a product or a store is searched based on product information indicating the type, color, function or other specifications of the product, store information such as provided product or location, purchase history, and quantitative evaluation of other users. There is known a system that predicts a user who matches a user's preference and provides information on a product or a store (for example, Patent Document 2).

特開2009−134637号公報JP 2009-134637 A 特開2002−74142号公報JP 2002-74142 A

しかしながら、特許文献2に記載のシステムにあっては、ユーザの特定した商品と、類似性を有する使用感、読後感、味覚、または、ユーザの特定した店舗と、類似性を有する雰囲気、提供される商品(料理)など、ユーザの実体験を基づいた定常的な類似性によって商品または店舗の情報を提供することが難しい。   However, in the system described in Patent Literature 2, a product specified by the user and a feeling of use having similarities, a feeling after reading, a taste, or an atmosphere having similarities with the store specified by the user are provided. It is difficult to provide information on products or stores by regular similarity based on actual experiences of users such as products (cooking).

本発明は、上記課題を解決するためになされたものであり、その目的は、ユーザの実体験に基づいて、ユーザの嗜好に合致する商品または店舗を推薦することが可能なデータ生成装置、データの生成方法及びデータ生成プログラムを提供することにある。   The present invention has been made to solve the above-mentioned problems, and its purpose is to provide a data generation device and data that can recommend a product or a store that matches the user's preference based on the actual experience of the user. And a data generation program.

(1)上記課題を解決するため、本発明のデータ生成装置は、ユーザに対して商品またはサービスの情報を閲覧可能に提供するためのデータを生成するデータ生成装置であって、商品毎またはサービス毎に、当該商品の使用者または当該サービスの享受者によって登録された複数のコメントデータを記憶されているデータベースから取得する取得手段と、前記取得された各コメントデータに対して形態素解析及び構文解析を実行し、前記商品毎または前記サービス毎に、評価表現を示す評価表現テキストと当該テキストが修飾する被修飾語テキストのテキストセットを抽出するとともに、前記コメントデータから前記抽出された評価表現テキストに関する程度表現テキストの抽出、または、前記コメントデータにおける否定文の有無における検出の少なくとも何れか一方を実行する抽出手段と、前記商品毎または前記サービス毎に、前記抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、前記抽出された程度表現テキスト、または、前記コメントデータにおける否定文の有無の少なくとも何れか一方に基づいて同一のテキストセット毎の評価ポイントを調整するポイント算出手段と、前記商品または前記サービス毎に、前記テキストセット毎の評価ポイントに基づいて各商品または各サービスと他の商品または他のサービスとのユーザの評価に対する類似度を算出する類似度算出手段と、前記商品または前記サービス毎に、前記算出された他の商品または他のサービスとの類似度に基づいて、当該商品または当該サービスと類似する類似商品及び類似サービスを特定する特定手段と、前記ユーザによって一の商品または一のサービスの情報に対して閲覧要求がされた場合に、前記特定された類似商品または類似サービスに関する情報を、当該ユーザに対して閲覧可能に提供するためのデータを生成する生成手段と、を備える構成を有している。   (1) In order to solve the above-described problem, a data generation device of the present invention is a data generation device that generates data for providing information on a product or service to a user so that the product can be browsed. Each of the acquisition means for acquiring a plurality of comment data registered by the user of the product or the user of the service from a stored database, and morphological analysis and syntax analysis for each of the acquired comment data And for each product or service, extract a text set of an evaluation expression text indicating an evaluation expression and a modified word text to be modified by the text, and the extracted evaluation expression text from the comment data Extraction of degree expression text And extracting means for executing at least one of the above, and for each product or each service, the number of sets of the same text set in each extracted text set is totaled to obtain an evaluation point for each same text set. A point calculation means for adjusting an evaluation point for each of the same text set based on at least one of the extracted degree expression text and the presence / absence of a negative sentence in the comment data; For each service, similarity calculation means for calculating the degree of similarity of each product or each service and other products or other services to the user's evaluation based on the evaluation points for each text set, and for each product or each service Based on the calculated similarity to other products or services. , A specifying means for specifying similar products and similar services similar to the products or services, and the specified similar products when the user makes a browsing request for information on one product or one service Or it has the structure provided with the production | generation means which produces | generates the data for providing the information regarding a similar service with respect to the said user so that browsing is possible.

この構成により、本発明のデータ生成装置は、商品の使用者またはサービスの享受者が商品またはサービス(以下、「商品等」という。)に対して記載したレビューデータなどのコメントデータから、各商品等の類似する商品等を特定することができる。すなわち、本発明のデータ生成装置は、類似する商品等においては評価表現と被修飾語のテキストセットが類似するという特性を利用し、例えば、商品等のレビューという、複数のユーザの実体験に基づいて商品等毎に定常的な類似性を有する商品等を特定することができる。   With this configuration, the data generation device of the present invention allows each product to be obtained from comment data such as review data described for the product or service (hereinafter referred to as “product etc.”) by the user of the product or the user of the service. And similar products can be identified. That is, the data generation device of the present invention uses the characteristic that the evaluation expression and the text set of the modified word are similar in similar products, etc., for example, based on the actual experience of a plurality of users, such as reviews of products, etc. Thus, it is possible to specify a product having a regular similarity for each product.

したがって、本発明のデータ生成装置は、ユーザによって一の商品等の情報に対して閲覧要求がされた場合に、当該特定された商品等に関する情報を、当該ユーザに対して閲覧可能に提供することができるので、ユーザに対して商品等の選択の幅を広げるための情報を提供すること、または、ユーザの要求に一致する商品等を的確に提供することができる。この結果、本発明のデータ生成装置は、効率的にかつ合理的な広告・宣伝及び商品等の情報の提供を行うことができる。   Therefore, the data generation device of the present invention provides information related to the specified product etc. to the user so that the user can view the information when the user makes a browsing request for the information of one product etc. Therefore, it is possible to provide the user with information for expanding the range of selection of products or the like, or to accurately provide products that match the user's request. As a result, the data generation apparatus according to the present invention can efficiently and rationally provide information such as advertisements and promotions and products.

(2)また、本発明のデータ生成装置は、前記抽出手段が、前記程度表現テキストがリスト化された程度表現辞書データを備えて前記各コメントデータから前記程度表現テキストを抽出するとともに、前記ポイント算出手段が、前記程度表現テキストが抽出されたテキストセットに関しては、前記集計された同一のテキストセットのセット数に、程度表現テキストに基づく所定の値を加算して前記評価ポイントを算出する構成を有している。   (2) Further, in the data generation device of the present invention, the extraction unit includes degree expression dictionary data in which the degree expression text is listed, extracts the degree expression text from each comment data, and the points For the text set from which the degree expression text is extracted, the calculation means adds the predetermined value based on the degree expression text to the set number of the aggregated same text set to calculate the evaluation point. Have.

この構成により、本発明のデータ生成装置は、テキストセットのセット数とともに、例えば、「とても」、「すごく」、「本当」または「かなり」などの程度表現テキストがコメントデータに含まれている場合には、程度表現の有無に基づいて評価ポイントを算出することができるので、使用者または享受者の商品等の評価レベルを反映させた評価ポイントを的確に算出することができる。したがって、本発明のデータ生成装置は、的確な評価ポイントに基づいて類似商品等を特定することができるので、複数のユーザの実体験に基づいて商品等毎に定常的な類似性を有する商品等を的確に特定することができる。   With this configuration, the data generation apparatus according to the present invention includes the number of sets of text sets and, for example, a text that expresses a degree such as “very”, “very”, “true”, or “pretty” in the comment data. Since the evaluation points can be calculated based on the presence or absence of the degree expression, the evaluation points reflecting the evaluation level of the product or the like of the user or the user can be accurately calculated. Therefore, since the data generation device of the present invention can specify similar products based on accurate evaluation points, products having regular similarity for each product based on actual experiences of multiple users Can be accurately identified.

(3)また、本発明のデータ生成装置は、前記程度表現辞書データには、前記程度表現テキストの程度レベルに対応する値が登録されており、前記ポイント算出手段が、前記抽出手段によって前記程度表現テキストが抽出されたテキストセットに関しては、当該テキストセットのセット数に、前記程度表現テキストの程度レベルに対応した値を加算して前記評価ポイントを算出する構成を有している。   (3) Further, in the data generation device of the present invention, a value corresponding to the degree level of the degree expression text is registered in the degree expression dictionary data, and the point calculation means performs the degree by the extraction means. The text set from which the expression text is extracted has a configuration in which the evaluation point is calculated by adding a value corresponding to the degree level of the degree expression text to the number of sets of the text set.

この構成により、本発明のデータ生成装置は、テキストセットのセット数とともに、例えば、「とても」、「すごく」、「本当」または「かなり」などの程度表現テキストがコメントデータに含まれている場合には、程度表現のレベルに基づいて評価ポイントを算出することができるので、使用者または享受者の商品等の評価レベルを反映させた評価ポイントを的確に算出することができる。したがって、本発明のデータ生成装置は、的確な評価ポイントに基づいて類似商品等を特定することができるので、複数のユーザの実体験に基づいて商品等毎に定常的な類似性を有する商品等を的確に特定することができる。   With this configuration, the data generation apparatus according to the present invention includes the number of sets of text sets and, for example, a text that expresses a degree such as “very”, “very”, “true”, or “pretty” in the comment data. Since the evaluation point can be calculated based on the level of the degree expression, the evaluation point reflecting the evaluation level of the product or the like of the user or the user can be accurately calculated. Therefore, since the data generation device of the present invention can specify similar products based on accurate evaluation points, products having regular similarity for each product based on actual experiences of multiple users Can be accurately identified.

(4)また、本発明のデータ生成装置は、前記抽出手段が、反意語の有無及び当該反意語がある場合に該当する反意語と対応付けられた評価表現テキストがリスト化された評価表現辞書データを備え、当該評価表現辞書データを用いて前記各コメントデータから前記評価表現テキストを抽出し、前記ポイント算出手段が、前記抽出手段によって前記各コメントデータに含まれる否定表現が検出された場合に、前記評価表現辞書データを参照して前記抽出された評価表現テキストに対する反意語を含むテキストセットのセット数に、所定の値を加算して前記評価ポイントを算出する構成を有している。   (4) Further, in the data generation device of the present invention, the extraction unit includes evaluation expression dictionary data in which the presence of an antonym and the evaluation expression text associated with the corresponding antonym when there is the antonym are listed. The evaluation expression text is extracted from each comment data using the evaluation expression dictionary data, and the point calculation means detects the evaluation when a negative expression included in each comment data is detected by the extraction means. The evaluation point is calculated by adding a predetermined value to the number of sets of text sets including antonyms for the extracted evaluation expression text with reference to the expression dictionary data.

この構成により、本発明のデータ生成装置は、コメントデータに否定文があった場合には、反意語を含むテキストセットの評価ポイントを変化させることができるので、使用者または享受者の評価を反映させた評価ポイントを的確に算出することができる。したがって、本発明のデータ生成装置は、的確な評価ポイントに基づいて類似商品等を特定することができるので、複数のユーザの実体験に基づいて商品等毎に定常的な類似性を有する商品等を的確に特定することができる。   With this configuration, when there is a negative sentence in the comment data, the data generation apparatus of the present invention can change the evaluation point of the text set including the antonym, so that the evaluation of the user or the user is reflected. Evaluation points can be calculated accurately. Therefore, since the data generation device of the present invention can specify similar products based on accurate evaluation points, products having regular similarity for each product based on actual experiences of multiple users Can be accurately identified.

(5)また、本発明のデータ生成装置は、前記評価表現辞書データには、肯定的表現テキストまたは否定的表現テキストであることを示す評価極性の情報を有する評価表現テキストがリスト化されており、前記抽出手段が、前記評価表現辞書データを用いて評価極性とともに前記評価表現テキスト及びテキストセットを抽出する構成を有している。   (5) Further, in the data generation device of the present invention, the evaluation expression text having evaluation polarity information indicating that it is a positive expression text or a negative expression text is listed in the evaluation expression dictionary data. The extraction means extracts the evaluation expression text and the text set together with the evaluation polarity using the evaluation expression dictionary data.

この構成により、本発明のデータ生成装置は、コメントデータに否定文があった場合には、反意語を含むテキストセットを的確に抽出することができるので、コメントデータにおける否定文の有無に基づいて各テキストセットの評価ポイントを的確に算出することができる。   With this configuration, the data generation device of the present invention can accurately extract a text set including an antonym when there is a negative sentence in the comment data. The evaluation points of the text set can be accurately calculated.

(6)また、本発明のデータ生成装置は、前記ポイント算出手段が、前記商品毎またはサービス毎に、前記算出された同一の前記被修飾語テキストの評価ポイントを累計するとともに前記否定的な表現を含む評価極性を有する当該同一の被修飾語テキストにおける評価ポイントを否定ポイントとして集計し、前記類似度算出手段が、前記否定ポイントが前記ポイント累計の一定の割合以上である場合には、当該否定ポイントにおける前記被修飾語テキストを含むテキストセットを、類似度算出に関して不使用に設定する、構成を有している。   (6) Further, in the data generation device of the present invention, the point calculation means accumulates the calculated evaluation points of the same modified word text for each product or service, and the negative expression. Evaluation points in the same modified text having the evaluation polarity including the negative points, and the similarity calculation means, if the negative points are equal to or greater than a certain percentage of the total points, the negative The text set including the to-be-modified word text at the point is set not to be used for similarity calculation.

この構成により、本発明のデータ生成装置は、否定的な表現に基づいて類似度を算出せずに、肯定的な表現に基づいて評価ポイントを算出することができるので、否定的な観点によって、特定された商品等に関する情報を提供することを防止することができる。   With this configuration, the data generation device of the present invention can calculate the evaluation point based on the positive expression without calculating the similarity based on the negative expression. Providing information on the specified product or the like can be prevented.

(7)また、上記課題を解決するため、本発明のデータの生成方法は、ユーザに対して商品またはサービスの情報を閲覧可能に提供するためのデータを生成するデータの生成方法であって、商品毎またはサービス毎に、当該商品の使用者または当該サービスの享受者によって登録された複数のコメントデータを記憶されているデータベースから取得する取得工程と、前記取得された各コメントデータに対して形態素解析及び構文解析を実行し、前記商品毎または前記サービス毎に、評価表現を示す評価表現テキストと当該テキストが修飾する被修飾語テキストのテキストセットを抽出するとともに、前記コメントデータから前記抽出された評価表現テキストに関する程度表現テキストの抽出、または、前記コメントデータにおける否定文の有無における検出の少なくとも何れか一方を実行する抽出工程と、前記商品毎または前記サービス毎に、前記抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、前記抽出された程度表現テキスト、または、前記コメントデータにおける否定文の有無の少なくとも何れか一方に基づいて同一のテキストセット毎の評価ポイントを調整するポイント算出工程と、前記商品または前記サービス毎に、前記テキストセット毎の評価ポイントに基づいて各商品または各サービスと他の商品または他のサービスとのユーザの評価に対する類似度を算出する類似度算出工程と、前記商品または前記サービス毎に、前記算出された他の商品またはサービスとの類似度に基づいて、当該商品または当該サービスと類似する類似商品及び類似サービスを特定する特定工程と、前記ユーザによって一の商品または一のサービスの情報に対して閲覧要求がされた場合に、前記特定された類似商品または類似サービスに関する情報を、当該ユーザに対して閲覧可能に提供するためのデータを生成する生成工程と、を含む構成を有している。   (7) Moreover, in order to solve the said subject, the data generation method of this invention is a data generation method which produces | generates the data for providing information of goods or services to a user so that browsing is possible, For each product or service, an acquisition step of acquiring a plurality of comment data registered by a user of the product or a user of the service from a stored database, and a morpheme for each of the acquired comment data Analyzing and syntactically analyzing, for each product or each service, extracting a text set of an evaluation expression text indicating an evaluation expression and a modifier text to be modified by the text, and extracting the text set from the comment data Extraction of degree expression text related to evaluation expression text or existence of negative sentence in the comment data An extraction step for performing at least one of the detection in the above, and for each product or each service, the number of sets of the same text set in each extracted text set is aggregated to evaluate each text set A point calculation step of adjusting an evaluation point for each of the same text set based on at least one of the extracted degree expression text and the presence or absence of a negative sentence in the comment data, and the product or For each service, a similarity calculation step for calculating a similarity between each product or each service and another product or other service based on an evaluation point for each text set, and the product or the service Each time, the degree of similarity with the calculated other product or service is Therefore, when the user makes a browsing request for information on one product or one service, the specified step of specifying a similar product and similar service similar to the product or the service is specified. And a generation step of generating data for providing information related to similar products or similar services to the user so as to be viewable.

この構成により、本発明のデータの生成方法は、ユーザによって一の商品等の情報に対して閲覧要求がされた場合に、当該特定された商品等に関する情報を、当該ユーザに対して閲覧可能に提供することができるので、ユーザに対して商品等の選択の幅を広げるための情報を提供すること、または、ユーザの要求に一致する商品等を的確に提供することができる。したがって、本発明のデータの生成方法は、効率的にかつ合理的な広告・宣伝及び商品等の情報の提供を行うことができる。   With this configuration, the data generation method of the present invention makes it possible for the user to browse the information related to the specified product etc. when the user requests browsing of the information about one product etc. Since the information can be provided to the user, information for expanding the selection range of the product etc. can be provided to the user, or the product etc. matching the user's request can be provided accurately. Therefore, the data generation method of the present invention can efficiently and rationally provide information such as advertisements and advertisements and products.

(8)また、上記課題を解決するため、本発明のデータの生成方法は、コンピュータによって、ユーザに対して商品またはサービスの情報を閲覧可能に提供するためのデータを生成するデータ生成プログラムであって、前記コンピュータを、商品毎またはサービス毎に、当該商品の使用者または当該サービスの享受者によって登録された複数のコメントデータを記憶されているデータベースから取得する取得手段、前記取得された各コメントデータに対して形態素解析及び構文解析を実行し、前記商品毎または前記サービス毎に、評価表現を示す評価表現テキストと当該テキストが修飾する被修飾語テキストのテキストセットを抽出するとともに、前記コメントデータから前記抽出された評価表現テキストに関する程度表現テキストの抽出、または、前記コメントデータにおける否定文の有無における検出の少なくとも何れか一方を実行する抽出手段、前記商品毎または前記サービス毎に、前記抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、前記抽出された程度表現テキスト、または、前記コメントデータにおける否定文の有無の少なくとも何れか一方に基づいて同一のテキストセット毎の評価ポイントを調整するポイント算出手段、前記商品または前記サービス毎に、前記テキストセット毎の評価ポイントに基づいて各商品または各サービスと他の商品または他のサービスとのユーザの評価に対する類似度を算出する類似度算出手段、前記商品または前記サービス毎に、前記算出された他の商品またはサービスとの類似度に基づいて、当該商品または当該サービスと類似する類似商品及び類似サービスを特定する特定手段、前記ユーザによって一の商品または一のサービスの情報に対して閲覧要求がされた場合に、前記特定された類似商品または類似サービスに関する情報を、当該ユーザに対して閲覧可能に提供するためのデータを生成する生成手段、として機能させる構成を有している。   (8) Further, in order to solve the above-described problem, the data generation method of the present invention is a data generation program that generates data for providing information on goods or services to a user so as to be browseable by a computer. Acquisition means for acquiring, for each product or service, a plurality of comment data registered by a user of the product or a user of the service from a stored database; Morphological analysis and syntax analysis are performed on the data, and for each product or each service, an evaluation expression text indicating an evaluation expression and a text set of modified word text modified by the text are extracted, and the comment data Extraction of degree expression text relating to the extracted evaluation expression text from Or, extraction means for performing at least one of detections on the presence or absence of a negative sentence in the comment data, the total number of sets of the same text set in each extracted text set for each product or each service And calculating evaluation points for the same text set based on at least one of the extracted degree expression text and the presence / absence of a negative sentence in the comment data. The degree of similarity for calculating the degree of similarity for the user's evaluation between each product or each service and another product or other service based on the evaluation point for each text set, for each point product to be adjusted, the product or the service For each calculation means, the product or the service, the calculated Specific means for identifying similar products and similar services similar to the products or services based on the degree of similarity with other products or services, and a request for browsing the information on one product or one service by the user In such a case, the information processing apparatus is configured to function as a generation unit that generates data for providing information related to the identified similar product or similar service to the user so that the information can be viewed.

この構成により、本発明のデータ生成プログラムは、ユーザによって一の商品等の情報に対して閲覧要求がされた場合に、当該特定された商品等に関する情報を、当該ユーザに対して閲覧可能に提供することができるので、ユーザに対して商品等の選択の幅を広げるための情報を提供すること、または、ユーザの要求に一致する商品等を的確に提供することができる。したがって、本発明のデータ生成プログラムは、効率的にかつ合理的な広告・宣伝及び商品等の情報の提供を行うことができる。   With this configuration, the data generation program of the present invention provides information related to the specified product etc. to the user so that the user can view the information when the user requests browsing of information such as one product. Therefore, it is possible to provide information for expanding the range of selection of products and the like to the user, or to accurately provide products and the like that match the user's request. Therefore, the data generation program of the present invention can efficiently and rationally provide information such as advertisements and promotions and products.

本発明のデータ生成装置、データの生成方法及びデータ生成プログラムは、ユーザによって一の商品等の情報に対して閲覧要求がされた場合に、当該特定された商品等に関する情報を、当該ユーザに対して閲覧可能に提供することができるので、ユーザに対して商品等の選択の幅を広げるための情報を提供すること、または、ユーザの要求に一致する商品等を的確に提供することができる。したがって、本発明は、効率的にかつ合理的な広告・宣伝及び商品等の情報の提供を行うことができる。   The data generation device, the data generation method, and the data generation program according to the present invention provide the user with information related to the specified product when the user makes a browsing request for the information on one product or the like. Therefore, it is possible to provide the user with information for expanding the selection range of the product or the like, or to accurately provide the product or the like that matches the user's request. Therefore, the present invention can efficiently and rationally provide information such as advertisements and promotions and products.

本発明に係る情商品/サービス情報提供システムの構成を示すシステム構成図である。It is a system configuration | structure figure which shows the structure of the information goods / service information provision system which concerns on this invention. 一実施形態におけるレビューデータの登録を説明するための図である。It is a figure for demonstrating registration of the review data in one Embodiment. 一実施形態におけるデータ生成用サーバ装置の構成を示すブロック図である。It is a block diagram which shows the structure of the server apparatus for data generation in one Embodiment. 一実施形態の解析処理を説明するための図である。It is a figure for demonstrating the analysis process of one Embodiment. 一実施形態の評価ポイントの算出処理を説明するための図である。It is a figure for demonstrating the calculation process of the evaluation point of one Embodiment. 一実施形態において、類似度を算出する前の前処理を説明するための図である。In one embodiment, it is a figure for demonstrating the pre-process before calculating a similarity degree. は、一実施形態の類似度算出処理を説明するための図である。These are the figures for demonstrating the similarity calculation process of one Embodiment. は、類似サービスの情報が組み込まれた所定の店舗サービスを提供する店舗のWebページデータの一例である。Is an example of Web page data of a store that provides a predetermined store service in which similar service information is incorporated. は、一の実施形態のデータ生成用サーバ装置における関連情報提供用パーツデータの生成処理の動作を示すフローチャートである。These are the flowcharts which show the operation | movement of the production | generation process of the relevant information provision part data in the data generation server apparatus of one Embodiment.

以下、本発明の各実施形態について、図面を参照しながら説明する。以下に説明する実施形態は、インターネット上において提供されるWorld Wide Web システム(以下、「WWWシステム」という。)などのネットワークを用いて販売商品または店舗サービスの情報の提供を行う商品/サービス情報提供システムに用いられるデータ生成用サーバ装置に、本発明のデータ生成装置、閲覧データ生成方法及びデータ生成プログラムを適用した場合の実施形態である。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the embodiment described below, product / service information provision for providing information on sales products or store services using a network such as a World Wide Web system (hereinafter referred to as “WWW system”) provided on the Internet. In this embodiment, the data generation device, the browsing data generation method, and the data generation program of the present invention are applied to a data generation server device used in the system.

なお、各実施形態においては、文書または画像の要素データをタグと呼ばれる識別子を用いてリソースデータとして構築されるHTML(Hyper Text Markup Language)またはXML(eXtensible Markup Language)などのマークアップ言語によって形成されたWWWシステム用のリソースデータ(以下、「Webページデータ」または「閲覧データ」という。)を用いて各種の情報提供、データ通信その他の処理が実行される。   In each embodiment, element data of a document or an image is formed by a markup language such as HTML (Hyper Text Markup Language) or XML (Extensible Markup Language) constructed as resource data using an identifier called a tag. Various information provision, data communication, and other processes are executed using resource data for the WWW system (hereinafter referred to as “Web page data” or “browsing data”).

[商品/サービス情報提供システム]
まず、図1を用いて本実施形態の商品/サービス情報提供システムSの概要構成について説明する。なお、図1は、商品/サービス情報提供システムSの構成を示すシステム構成図である。
[Product / Service Information Providing System]
First, a schematic configuration of the product / service information providing system S of the present embodiment will be described with reference to FIG. FIG. 1 is a system configuration diagram showing the configuration of the product / service information providing system S.

本実施形態の商品/サービス情報提供システムSは、図1に示すように、ユーザが個々に有する端末装置100に、販売商品の情報(以下、「販売商品情報」という。)またはレストランなどの店舗におけるサービスの情報(以下、「店舗サービス情報」という。)を、閲覧データ(すなわち、Webページデータ)として提供する情報提供用サーバ装置200と、各種のWebページデータ及びWebページデータを構成するための各種のデータ(以下、「パーツデータ」という。)が記憶されるデータベース300と、を有している。また、商品/サービス情報提供システムSは、販売商品情報及び店舗サービス情報における閲覧データの一部のデータであって、端末装置100を介してユーザからの閲覧要求がされた販売商品及び店舗サービスに類似する商品(以下、「類似商品」という。)または類似するサービス(以下、「類似サービス」という。)の情報を提供するためのパーツデータを生成するデータ生成用サーバ装置400と、から構成されている。   As shown in FIG. 1, the product / service information providing system S of the present embodiment has information about sales products (hereinafter referred to as “sales product information”) or a store such as a restaurant on a terminal device 100 that a user individually has. Information providing server apparatus 200 that provides service information (hereinafter referred to as “store service information”) as browsing data (ie, Web page data), and various Web page data and Web page data. And a database 300 in which various data (hereinafter referred to as “part data”) are stored. Further, the product / service information providing system S is a part of the browsing data in the sales product information and the store service information, and is used for the sales product and the store service requested to be browsed by the user via the terminal device 100. A data generation server device 400 that generates part data for providing information on similar products (hereinafter referred to as “similar products”) or similar services (hereinafter referred to as “similar services”). ing.

複数の端末装置100、情報提供用サーバ装置200、データベース300及びデータ生成用サーバ装置400は、インターネットなどのネットワークNにそれぞれ接続され、端末装置100、情報提供用サーバ装置200、データベース300及びデータ生成用サーバ装置400との各種のデータの授受が実行されるようになっている。   The plurality of terminal devices 100, the information providing server device 200, the database 300, and the data generation server device 400 are respectively connected to a network N such as the Internet, and the terminal device 100, the information providing server device 200, the database 300, and the data generation Various types of data are exchanged with the server device 400.

特に、データ生成用サーバ装置400は、販売商品毎または店舗サービス毎に商品の使用者またはサービスの享受者(以下、単にまとめて「ユーザ」ともいう。)によってデータベース300に登録されて記憶されたテキストデータの形式を有するコメントデータ(いわゆる、レビューデータ)に基づいて、販売商品毎または店舗サービス毎に、類似商品または類似サービスをリストアップするようになっている。そして、データ生成用サーバ装置400は、端末装置100を操作してWebページデータを介して一の販売商品または一の店舗サービスの情報における閲覧要求がされた場合に、当該閲覧要求された販売商品に類似する類似商品または当該閲覧要求された店舗サービスに類似する類似サービスの情報を関連情報としてWebページデータに組み込むためのパーツデータ(以下、「関連情報提供用パーツデータ」という。)を生成するようになっている。   In particular, the data generation server device 400 is registered and stored in the database 300 by a user of a product or a user of a service (hereinafter also simply referred to as “user”) for each sold product or each store service. Based on comment data having a text data format (so-called review data), similar products or similar services are listed for each sales product or each store service. Then, when the data generation server device 400 operates the terminal device 100 to make a browsing request for information on one sales product or one store service via the Web page data, the sales product requested to browse is displayed. Parts data (hereinafter referred to as “part information for providing related information”) is generated for incorporating into the Web page data as related information similar product information similar to or similar store information requested to be browsed. It is like that.

また、情報提供用サーバ装置200は、ユーザからのWebページデータの閲覧指示に基づいて、データベース300から該当するWebページデータを読み出すとともに、生成されたパーツデータを当該読み出したWebページデータに組み込みつつ、当該ユーザが使用している端末装置100に閲覧可能に提供するようになっている。なお、情報提供用サーバ装置200は、URL(Uniform Resource Locator)と呼ばれるWebページデータが格納されているアドレス(以下、「URL」という。)によって各Webページデータを管理している。   Further, the information providing server device 200 reads out the corresponding web page data from the database 300 based on the browsing instruction of the web page data from the user, and incorporates the generated part data into the read web page data. The terminal device 100 used by the user is provided so as to be viewable. The information providing server device 200 manages each Web page data by an address (hereinafter referred to as “URL”) in which Web page data called URL (Uniform Resource Locator) is stored.

本実施形態においては、このような構成を有することによって、ユーザによって一の販売商品または店舗サービスの情報に対して閲覧要求がされた場合に、当該特定された販売商品または店舗サービスに関する情報を、当該ユーザに対して閲覧可能に提供することができるので、ユーザに対して商品等の選択の幅を広げるための情報を提供すること、または、ユーザの要求に一致する商品等を的確に提供することができるようになっている。したがって、本実施形態においては、効率的にかつ合理的な広告・宣伝及び商品等の情報の提供を行うことができるようになっている。   In this embodiment, by having such a configuration, when a browsing request is made for information on one sale product or store service by the user, information on the specified sale product or store service is Since the information can be provided to the user so that the user can view the information, the user is provided with information for expanding the range of selection of the product or the like, or the product that matches the user's request is accurately provided. Be able to. Therefore, in this embodiment, it is possible to efficiently and rationally provide information such as advertisements and promotions and products.

(端末装置)
次に、本実施形態の端末装置100について説明する。
(Terminal device)
Next, the terminal device 100 of this embodiment will be described.

各端末装置100は、例えば、PC(Personal Computer)、PDA(Personal Digital Assistants)または携帯用電話機などの通信端末装置である。また、各端末装置100は、キーボードまたはマウスなどの入力インターフェース、ディスプレイ、CPU及びメモリなどによって構成されている。そして、各端末装置100は、Webページデータなどのリソースデータを読み込んで閲覧するためのアプリケーションプログラム(以下、「ブラウザ」という。)を搭載している。   Each terminal device 100 is a communication terminal device such as a PC (Personal Computer), a PDA (Personal Digital Assistant), or a mobile phone. Each terminal device 100 includes an input interface such as a keyboard or a mouse, a display, a CPU, a memory, and the like. Each terminal device 100 is equipped with an application program (hereinafter referred to as “browser”) for reading and browsing resource data such as Web page data.

また、各端末装置100は、このブラウザを起動させ、URLを指定することによって、閲覧データとしてWebページデータを取得し、各端末装置100が備えるモニタなどの画面に販売商品情報または店舗サービス情報を表示することができるようになっている。特に、各端末装置100は、Webページデータによって複数の販売商品及び複数の店舗サービスから一の販売商品及び一の店舗サービスにおける情報の閲覧要求を行うと、ブラウザの機能によってWebページデータに組み込まれた該当する他の販売商品(すなわち、類似商品)または該当する他の店舗サービス(すなわち、類似サービス)の情報を閲覧可能に表示することができるようになっている。   In addition, each terminal device 100 activates this browser and designates a URL to acquire Web page data as browsing data, and displays sales product information or store service information on a screen such as a monitor provided in each terminal device 100. It can be displayed. In particular, when each terminal device 100 makes a browsing request for information on one sales product and one store service from a plurality of sales products and a plurality of store services by Web page data, each terminal device 100 is incorporated into the Web page data by a browser function. In addition, information on other applicable sales products (that is, similar products) or applicable other store services (that is, similar services) can be displayed in a viewable manner.

(情報提供用サーバ装置)
次に、本実施形態の情報提供用サーバ装置200について説明する。
(Information providing server device)
Next, the information providing server device 200 of this embodiment will be described.

情報提供用サーバ装置200は、主にCPU、ROM、RAM及びハードディスクによって構成される。また、この情報提供用サーバ装置200は、所定のアプリケーション上で所定のプログラムが実行されることによって当該情報提供用サーバ装置200における種々の機能を実現するようになっている。   The information providing server device 200 is mainly composed of a CPU, a ROM, a RAM, and a hard disk. In addition, the information providing server device 200 is configured to realize various functions in the information providing server device 200 by executing a predetermined program on a predetermined application.

情報提供用サーバ装置200は、データベース300と連動しつつ、端末装置100を介してユーザの指示(以下、「ユーザ指示」という。)に基づいて、データベース300に記憶されたWebページデータを閲覧させるためのデータ通信を行うようになっている。特に、情報提供用サーバ装置200は、端末装置100に入力されたユーザ指示に基づいて一の販売商品または一の店舗サービスにおける情報の閲覧要求がされた場合に、当該閲覧要求された販売商品の情報または店舗サービスの情報とともに、これらの類似商品または類似サービスの情報を有するパーツデータが組み込まれたWebページデータを端末装置100に提供するようになっている。   The information providing server device 200 browses the web page data stored in the database 300 based on a user instruction (hereinafter referred to as “user instruction”) via the terminal device 100 in conjunction with the database 300. For data communication. In particular, when the information providing server device 200 is requested to view information on one sales product or one store service based on a user instruction input to the terminal device 100, the information providing server device 200 receives the requested sales product. Along with the information or the store service information, the web page data in which the part data having the information on these similar products or similar services is incorporated is provided to the terminal device 100.

(データベース)
次に、図2を用いて本実施形態のデータベース300の構成について説明する。なお、図2は、レビューデータの登録を説明するための図である。
(Database)
Next, the structure of the database 300 of this embodiment is demonstrated using FIG. FIG. 2 is a diagram for explaining the registration of review data.

データベース300には、本、家電、レジャー用品など商品毎、または、レストラン、バー、美容室などの店舗サービス毎に、URLに対応付けられた商品に関するまたは店舗サービスに関するWebページデータが記録されている。特に、各Webページデータは、URLに対応付けてデータベース300に記録されている。また、類似商品データ及び類似サービスデータには、一以上の商品または一以上の店舗サービスに関する情報が含まれる。   In the database 300, Web page data related to a product associated with a URL or a store service is recorded for each product such as a book, home appliance, and leisure goods, or for each store service such as a restaurant, bar, and beauty salon. . In particular, each Web page data is recorded in the database 300 in association with a URL. The similar product data and the similar service data include information on one or more products or one or more store services.

具体的には、Webページデータが販売商品に関する場合には、商品ID、商品名称、商品の特性、商品外観その他の商品情報(以下、「一般商品情報」という。)を示すテキストデータ及び画像データと、使用者からの商品を使用した感想などのレビューデータと、類似する商品の情報を提供するための関連情報提供用パーツデータと、が販売商品毎にデータベース300に記録されている。また、Webページデータが店舗サービスに関する場合には、店舗ID、店舗名称、提供サービスのジャンル、店舗外観その他の店舗サービスの情報(以下、「一般サービス情報」という。)を示すテキストデータ及び画像データと、使用者から実際に店舗に来訪した感想などのレビューデータと、類似する店舗サービスの情報を提供するための関連情報提供用パーツデータと、が店舗情報毎にデータベース300に記録されている。   Specifically, when the Web page data relates to a sales product, text data and image data indicating a product ID, product name, product characteristics, product appearance and other product information (hereinafter referred to as “general product information”). Further, review data such as impressions using products from the user and related information providing part data for providing information on similar products are recorded in the database 300 for each sales product. When the Web page data relates to a store service, text data and image data indicating store ID, store name, provided service genre, store appearance and other store service information (hereinafter referred to as “general service information”). Further, review data such as impressions actually visited by the user from the user and related information providing part data for providing similar store service information are recorded in the database 300 for each store information.

例えば、本実施形態においては、店舗サービスに関するレビューデータに関しては、図2(a)及び(b)に示すような、店舗名称などの一般サービス情報10が提示されたWebページデータ20上に端末装置100を介して記載したレビューデータ30を店舗サービス毎に対応付けて記録(登録)されるようになっている。また、図2(a)は、店舗Aに関するレビューデータ30aの登録時のWebページデータ20aを示し、図2(b)は、店舗Bに関するレビューデータ30bの登録時のWebページデータ20bを示す   For example, in the present embodiment, regarding the review data related to the store service, the terminal device is displayed on the Web page data 20 on which the general service information 10 such as the store name is presented as shown in FIGS. The review data 30 described via 100 is recorded (registered) in association with each store service. 2A shows the Web page data 20a when the review data 30a related to the store A is registered, and FIG. 2B shows the Web page data 20b when the review data 30b related to the store B is registered.

一方、データベース300には、販売商品または店舗サービス毎のテキストセットのデータ、同一テキストセット毎の評価ポイントのデータ、及び、生成された関連情報提供用パーツデータなど、後述する関連情報提供用パーツデータの生成処理に用いられる各種のデータが記憶される。   On the other hand, in the database 300, related information providing part data, such as text set data for each sale product or store service, evaluation point data for each same text set, and generated related information providing part data are described later. Various data used for the generation process is stored.

(データ生成用サーバ装置)
1.データ生成用サーバ装置の構成
次に、図3を用いて本実施形態のデータ生成用サーバ装置400の構成について説明する。なお、図3は、本実施形態のデータ生成用サーバ装置400の構成を示すブロック図である。
(Server device for data generation)
1. Configuration of Data Generation Server Device Next, the configuration of the data generation server device 400 of this embodiment will be described with reference to FIG. FIG. 3 is a block diagram showing the configuration of the data generation server device 400 of this embodiment.

データ生成用サーバ装置400は、関連情報提供用パーツデータを生成すための処理(以下、「関連情報提供用パーツデータの生成処理」ともいう。)を実行するようになっている。具体的には、関連情報提供用パーツデータの生成処理には、
(1)予め定められたタイミングにおいて、登録された商品レビューデータまたは店舗サービスレビューデータを解析する処理(以下、「レビュー解析処理」という。)、
(2)レビュー解析処理の解析結果に基づいて、販売商品または店舗サービス毎に、レビューを登録した商品使用者またはサービス享受者における販売商品または店舗サービスの評価を得点化したポイント(以下、「評価ポイント」という。)を算出する処理(以下、「評価ポイント算出処理」という。)、
(3)算出された販売商品または店舗サービス毎に、該当する評価ポイントに基づいて類似する販売商品または店舗サービスを特定するための類似度を算出する処理(以下、単に「類似度算出処理」という。)、及び
(4)特定された販売商品または店舗商品に基づいて、該当する販売商品または店舗サービスのWebページデータに対応付けて類似商品データまたは類似サービスデータの関連情報提供用パーツデータを生成する処理(以下、単に「パーツデータ生成処理」という。)、
が含まれる。そして、データ生成用サーバ装置400は、レビュー解析処理の解析結果を、算出された各評価ポイントを、及び、生成された関連情報提供用パーツデータを、データとしてデータベース300に記憶するようになっている。
The data generation server device 400 is configured to execute a process for generating related information providing part data (hereinafter also referred to as “related information providing part data generation process”). Specifically, in the process of generating related information providing part data,
(1) Processing for analyzing registered product review data or store service review data at a predetermined timing (hereinafter referred to as “review analysis processing”),
(2) Based on the analysis result of the review analysis process, for each sales product or store service, a score obtained by scoring the evaluation of the sales product or store service by the product user or service recipient who registered the review (hereinafter referred to as “evaluation”) Processing (hereinafter referred to as “evaluation point calculation processing”),
(3) For each calculated sales product or store service, a process for calculating a similarity for specifying a similar sales product or store service based on the corresponding evaluation point (hereinafter simply referred to as “similarity calculation process”) .) And (4) Based on the specified sales product or store product, the related product providing part data for similar product data or similar service data is generated in association with the Web page data of the corresponding sales product or store service. Processing (hereinafter simply referred to as “part data generation processing”),
Is included. Then, the data generation server device 400 stores the analysis result of the review analysis processing, the calculated evaluation points, and the generated related information providing part data in the database 300 as data. Yes.

データ生成用サーバ装置400は、このような処理を実行するために、図3に示すように、ネットワークNを介してデータ通信を行う通信インターフェース410と、関連情報提供用パーツデータを生成するための上述した種々の処理を行うデータ処理部420と、から構成される。そして、通信インターフェース410及びデータ処理部420は、バスBによって互いに接続され、データの授受が実行されるようになっている。   In order to execute such processing, the data generation server device 400 generates a communication interface 410 for performing data communication via the network N and related information providing part data as shown in FIG. And a data processing unit 420 that performs the various processes described above. The communication interface 410 and the data processing unit 420 are connected to each other by a bus B so that data is exchanged.

通信インターフェース410は、ネットワークNに接続され、データ処理部420の制御の下に、各端末装置100、データ生成用サーバ装置400及びデータベース300との通信回線を確立し、種々のデータ通信及び当該データ通信に関する通信制御を行う。   The communication interface 410 is connected to the network N, and under the control of the data processing unit 420, establishes a communication line with each terminal device 100, the data generation server device 400, and the database 300, and performs various data communication and data Performs communication control related to communication.

データ処理部420は、主にCPU、ROM、RAM及びハードディスクによって構成されるコンピュータであって、所定のアプリケーション上で関連情報提供用パーツデータの生成処理のプログラムを実行するようになっている。そして、データ処理部420は、当該プログラムを実行することによってデータ生成用サーバ装置400における種々の機能、すなわち、レビューデータ取得処理、レビュー解析処理、評価ポイント算出処理及び関連情報提供用パーツデータ生成処理を実現するようになっている。例えば、ROMには、データ処理部420の各部を制御するための各種制御情報が記録されるとともに、ハードディスクには、制御プログラムまたはOS(Operating System)などの各種プログラムが記録されている。また、CPUは、ハードディスクに記録されたプログラムを実行することにより、上述の各種の処理を実行し、RAMは、ワークエリアとして用いられる。   The data processing unit 420 is a computer mainly composed of a CPU, a ROM, a RAM, and a hard disk, and executes a program for generating related information providing part data on a predetermined application. The data processor 420 executes various functions in the data generation server device 400 by executing the program, that is, review data acquisition process, review analysis process, evaluation point calculation process, and related information providing part data generation process. Has come to be realized. For example, various control information for controlling each unit of the data processing unit 420 is recorded in the ROM, and various programs such as a control program or an OS (Operating System) are recorded in the hard disk. Further, the CPU executes the various processes described above by executing a program recorded on the hard disk, and the RAM is used as a work area.

一方、データ処理部420は、アプリケーションを起動して関連情報提供用パーツデータの生成処理のプログラムを実行することによって、図3に示すように、所定のタイミングで各レビューデータをデータベース300から取得するデータ取得処理部421と、取得した各レビューデータにおけるレビュー解析処理を実行する解析処理部422と、当該解析結果に基づいて、評価ポイント算出処理を実行するポイント算出処理部423と、算出された評価ポイントに基づいて類似算出処理を実行する類似度算出処理部424と、特定された類似商品または類似サービスに基づいて関連情報提供用パーツデータ生成処理を実行するデータ生成処理部425と、を構築するようになっている。   On the other hand, the data processing unit 420 acquires each review data from the database 300 at a predetermined timing as shown in FIG. 3 by starting an application and executing a program for generating related information providing part data. Data acquisition processing unit 421, analysis processing unit 422 that executes review analysis processing for each acquired review data, point calculation processing unit 423 that executes evaluation point calculation processing based on the analysis results, and calculated evaluation A similarity calculation processing unit 424 that executes similarity calculation processing based on points, and a data generation processing unit 425 that executes related information provision part data generation processing based on the specified similar product or similar service are constructed. It is like that.

なお、例えば、本実施形態のデータ取得処理部421は、本発明の取得手段を構成し、解析処理部422は、本発明の抽出手段を構成する。また、例えば、本実施形態のポイント算出部は、本発明のポイント算出手段を構成し、類似度算出処理部424は、本発明の類似度算出手段を構成する。さらに、例えば、本実施形態のデータ生成処理部425は、本発明の特定手段及び生成手段を構成する。   For example, the data acquisition processing unit 421 of the present embodiment constitutes an acquisition unit of the present invention, and the analysis processing unit 422 constitutes an extraction unit of the present invention. Further, for example, the point calculation unit of the present embodiment constitutes a point calculation unit of the present invention, and the similarity calculation processing unit 424 constitutes a similarity calculation unit of the present invention. Furthermore, for example, the data generation processing unit 425 of the present embodiment constitutes a specifying unit and a generating unit of the present invention.

2.データ処理部
次に、上記の図3及び図4〜図8の各図を用いて本実施形態のデータ処理部420における各部の構成及びその動作の詳細について説明する。
2. Data Processing Unit Next, the configuration and operation of each unit in the data processing unit 420 of this embodiment will be described in detail with reference to FIGS. 3 and 4 to 8 described above.

なお、図4は、本実施形態の解析処理を説明するための図であり、図5は、本実施形態の評価ポイントの算出処理を説明するための図である。また、図6は、類似度を算出する前の前処理を説明するための図であり、図7は、本実施形態の類似度算出処理を説明するための図である。さらに、図8は、類似サービスの情報が組み込まれた所定の店舗サービスを提供する店舗のWebページデータである。   FIG. 4 is a diagram for explaining the analysis processing of the present embodiment, and FIG. 5 is a diagram for explaining the evaluation point calculation processing of the present embodiment. FIG. 6 is a diagram for explaining pre-processing before calculating the similarity, and FIG. 7 is a diagram for explaining the similarity calculation processing of the present embodiment. Further, FIG. 8 shows Web page data of a store that provides a predetermined store service in which information on similar services is incorporated.

データ取得処理部421は、予め定められた時刻となったとき、販売商品または店舗サービスにおける新たなレビューデータが登録されたとき、または、管理者の操作指示を受信したときなど、所定のタイミングに、データベース300からその時点で記憶されている全ての商品レビューデータまたは店舗サービスレビューデータを販売商品毎または店舗サービス毎に取得するようになっている。   The data acquisition processing unit 421 has a predetermined timing such as when a predetermined time is reached, when new review data for a product for sale or store service is registered, or when an operation instruction from an administrator is received. All the product review data or store service review data stored at that time is acquired from the database 300 for each sale product or each store service.

例えば、データ取得処理部421は、一の店舗サービス(レストランA)については、「料理Aの味はおいしい」、「料理Aはとてもおいしい」、「料理Bの味はおいしくない」、「料理Bはまずい」及び「スープCはまずくない」などのレビューデータをテキストデータとして取得するようになっている。   For example, for the one store service (restaurant A), the data acquisition processing unit 421 has “the taste of the dish A is delicious”, “the dish A is very delicious”, “the taste of the dish B is not delicious”, “the dish B” Review data such as “bad” and “soup C is bad” are acquired as text data.

解析処理部422は、取得した各レビューデータに対してそれぞれ形態素解析及び構文解析を実行して評価表現を示す評価表現テキストと当該評価表現テキストが修飾する被修飾語テキストのテキストセットを抽出するとともに、程度表現テキストの有無、当該程度表現がある場合にはそのレベル(以下、「程度レベル」という。)及び否定文の有無を検出するようになっている。そして、解析処理部422は、抽出されたテキストセットと検出された各情報を、テキストセット毎に評価表現データとしてデータベース300に記憶するようになっている。   The analysis processing unit 422 performs a morphological analysis and a syntax analysis on each of the acquired review data, and extracts a text set of an evaluation expression text indicating an evaluation expression and a modified word text modified by the evaluation expression text. The presence / absence of the degree expression text, the level of the degree expression (hereinafter referred to as “degree level”), and the presence / absence of a negative sentence are detected. And the analysis process part 422 memorize | stores the extracted text set and each detected information in the database 300 as evaluation expression data for every text set.

具体的には、解析処理部422は、「おいしい」、「高い」、「甘い」、「新しい」、「すっきり」、「べとべと」、「うるさい」その他の名詞、形容詞、形容動詞を含む質や量の対象の値を表す表現、または、感情を表す評価表現などの評価表現テキストがリスト化されたリストデータ(以下、「評価表現辞書データ」ともいう。)を備えている。特に、評価表現辞書データには、肯定的な表現(以下、「ポジティブ表現」ともいう。)及び否定的な表現(以下、「ネガティブ表現」ともいう。)を含むとともに、肯定的または否定的であることを示す評価極性の情報(以下、「極性情報」という。)が含まれる。すなわち、評価表現辞書データには、ポジティブ表現に対応するネガティブ表現またはネガティブ表現に対応するポジティブ表現(以下、単に「反意評価テキスト」という。)が当該評価表現辞書に登録されているか否かを示す極性情報と、当該反意評価テキストが登録されている場合には、その表現テキストに関する情報(以下、「反意評価テキスト情報」という。)が登録されている。   Specifically, the analysis processing unit 422 has a quality including “noisy”, “high”, “sweet”, “new”, “clean”, “betobeto”, “noisy” and other nouns, adjectives, and adjective verbs. It includes list data (hereinafter also referred to as “evaluation expression dictionary data”) in which evaluation expression texts such as expressions representing values of quantities or evaluation expressions representing emotions are listed. In particular, the evaluation expression dictionary data includes a positive expression (hereinafter also referred to as “positive expression”) and a negative expression (hereinafter also referred to as “negative expression”), and is positive or negative. Information on evaluation polarity (hereinafter referred to as “polarity information”) is included. That is, whether or not a negative expression corresponding to a positive expression or a positive expression corresponding to a negative expression (hereinafter simply referred to as “anti-evaluation text”) is registered in the evaluation expression dictionary data. When the polarity information to be shown and the anti-evaluation text are registered, information about the expression text (hereinafter referred to as “anti-evaluation text information”) is registered.

なお、例えば、評価表現辞書データにおいては、ポジティブ表現の評価極性情報としては「P」という記号が、ネガティブ表現の評価極性情報としては「N」という記号がそれぞれ登録されている。また、評価表現辞書データにおいては、ポジティブ表現でもネガティブ表現でも無い評価表現テキストについては無極性情報(例えば、「O」を用いる)が登録されている。   For example, in the evaluation expression dictionary data, a symbol “P” is registered as evaluation polarity information for positive expressions, and a symbol “N” is registered as evaluation polarity information for negative expressions. In the evaluation expression dictionary data, nonpolar information (for example, “O” is used) is registered for evaluation expression text that is neither a positive expression nor a negative expression.

また、解析処理部422は、評価表現辞書データに基づいて、取得したレビューデータに対して形態素解析及び構文解析を実行し、当該レビューデータから当該評価表現辞書データにある評価表現テキストと一致する語句(テキスト)を抽出するようになっている。また、解析処理部422は、当該一致したテキストがレビューデータ上において係る語句、すなわち、当該テキストがレビューデータ上において修飾する語句(被修飾語テキスト)を検出し、評価表現テキストと被修飾語テキストの組み合わせ(テキストセット)を、極性情報とともに抽出するようになっている。   In addition, the analysis processing unit 422 performs morphological analysis and syntax analysis on the acquired review data based on the evaluation expression dictionary data, and a phrase that matches the evaluation expression text in the evaluation expression dictionary data from the review data (Text) is extracted. In addition, the analysis processing unit 422 detects a phrase related to the matched text on the review data, that is, a phrase (modified text) that the text modifies on the review data, and the evaluation expression text and the modified text The combination (text set) is extracted together with the polarity information.

一方、解析処理部422は、「とても」、「すごく」、「本当」、「かなり」その他の評価表現における程度を示す程度表現テキストと、当該程度表現テキストの程度レベルに対応する値がリスト化された程度表現辞書データを備えている。そして、解析処理部422は、取得したレビューデータに対して形態素解析及び構文解析を実行する際に、上記に加えて、程度表現辞書データに基づいて、抽出するテキストセット毎に、該当するレビューデータに程度表現テキストが含まれているか、また、当該程度表現テキストが含まれている場合には、その程度評価テキストを抽出するようになっている。   On the other hand, the analysis processing unit 422 lists “very”, “very”, “true”, “pretty” other degree expression text indicating the degree in the evaluation expression, and a value corresponding to the degree level of the degree expression text. Degree expression dictionary data is provided. When the analysis processing unit 422 performs morphological analysis and syntax analysis on the acquired review data, in addition to the above, based on the degree expression dictionary data, the corresponding review data is extracted for each text set to be extracted. If a degree expression text is included, and if the degree expression text is included, the degree evaluation text is extracted.

さらに、解析処理部422は、「おいしくない」の場合における「ない」などの評価表現に対して否定を行う助動詞その他の否定表現を検出するようになっている。そして、解析処理部422は、取得したレビューデータに対して形態素解析及び構文解析を実行する際に、上記に加えて、抽出するテキストセット毎に、該当するレビューデータに否定表現テキストが含まれているか、また、当該否定表現テキストが含まれている場合には、当該否定表現が含まれていることを示すフラグ情報(以下、「否定フラグ情報」という。)を各テキストセットに登録するようになっている。   Further, the analysis processing unit 422 detects auxiliary verbs and other negative expressions that negate an evaluation expression such as “not” in the case of “not delicious”. When the analysis processing unit 422 performs morphological analysis and syntax analysis on the acquired review data, in addition to the above, the negative review text is included in the corresponding review data for each text set to be extracted. If the negative expression text is included, flag information (hereinafter referred to as “negative flag information”) indicating that the negative expression is included is registered in each text set. It has become.

解析処理部422は、上記のような構成を有し、例えば、データ取得処理部421によって、上述したような、一の店舗サービスに関するレビューデータが取得された場合には、図4に示すように、被修飾語テキスト(以下、「評価属性」ともいう。)、評価表現テキスト、程度評価テキスト、否定フラグ情報をテキストセット毎に抽出してデータベース300に記憶するようになっている。すなわち、解析処理部422は、上記の各レビューデータを解析することによって、
(1)「料理Aの味はおいしい」のレビューデータ30については、
「味、おいしい(P)、NULL、FALSE」、
(2)「料理Aはとてもおいしい」のレビューデータ30については、
「料理A、おいしい(P)、とても、FALSE」、
(3)「料理Bの味はおいしくない」のレビューデータ30については、
「味、おいしい(P)、NULL、TRUE」、
(4)「料理Bはまずい」のレビューデータ30については、
「料理B、まずい(N)、NULL、FALSE」、及び
(5)「スープCはまずくない」のレビューデータ30については、
「スープC、まずい(N)、NULL、TRUE」
と極性情報、程度表現テキスト及び否定フラグ情報を含んだテキストセット35を抽出し、販売商品毎または店舗サービス毎に抽出したテキストセット35のデータをデータベース300に記憶するようになっている。
The analysis processing unit 422 has the above-described configuration. For example, when the data acquisition processing unit 421 acquires the review data related to one store service as described above, as illustrated in FIG. Qualified word text (hereinafter also referred to as “evaluation attribute”), evaluation expression text, degree evaluation text, and negative flag information are extracted for each text set and stored in the database 300. That is, the analysis processing unit 422 analyzes each review data described above,
(1) About the review data 30 of “the taste of dish A is delicious”
"Taste, delicious (P), NULL, FALSE",
(2) About the review data 30 of “Cooking A is very delicious”
"Cooking A, delicious (P), very, FALSE",
(3) About the review data 30 of “the taste of dish B is not delicious”
"Taste, delicious (P), NULL, TRUE",
(4) About the review data 30 of “Cooking B is bad”
For review data 30 of “Cooking B, Bad (N), NULL, FALSE” and (5) “Soup C is bad”
"Soup C, bad (N), NULL, TRUE"
The text set 35 including the polarity information, the degree expression text, and the negative flag information is extracted, and the data of the text set 35 extracted for each sale product or each store service is stored in the database 300.

ポイント算出処理部423は、販売商品毎または店舗サービス毎に、抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、抽出された程度表現テキスト、及び、レビューデータにおける否定文の有無に基づいて同一のテキストセット毎の評価ポイントを調整するようになっている。そして、ポイント算出処理部423は、各評価ポイントを販売商品毎または店舗サービス毎に、かつ、同一のテキストセット毎にデータベース300に記憶するようになっている。   The point calculation processing unit 423 calculates the evaluation points for the same text set by calculating the number of sets of the same text set in each extracted text set for each sale product or each store service, and extracted The evaluation points for the same text set are adjusted based on the degree expression text and the presence or absence of a negative sentence in the review data. And the point calculation process part 423 memorize | stores each evaluation point in the database 300 for every sales goods or every store service, and for every same text set.

具体的には、ポイント算出処理部423は、形態素解析及び構文解析された全てのレビューデータから、以下の処理を実行し、商品毎またはサービス毎に、かつ、同一のテキストセット毎に、評価ポイントを算出し、かつ、調整するようになっている。すなわち、ポイント算出処理部423は、   Specifically, the point calculation processing unit 423 executes the following processing from all review data subjected to morphological analysis and syntax analysis, and evaluates points for each product or service and for each identical text set. Is calculated and adjusted. That is, the point calculation processing unit 423

(1)商品毎またはサービス毎に、同一のテキストセットにおけるセット数を集計し、基準となる評価ポイントを算出する処理の実行
(2)集計された同一のテキストセットのセット数(基準の評価ポイント)に、抽出された程度表現テキストに基づく所定の値の加算、及び、
(3)集計された同一のテキストセットのセット数(基準の評価ポイント)にレビューデータにおける否定文の有無に基づく所定の値の加算
を行う各演算を実行し、商品毎またはサービス毎に、かつ、同一のテキストセット毎に、評価ポイントを算出し、かつ、調整するようになっている。
(1) Execution of processing for calculating the number of sets in the same text set for each product or service and calculating a reference evaluation point (2) Number of sets in the same text set (reference evaluation points) ) To a predetermined value based on the extracted degree expression text, and
(3) Execute each calculation for adding a predetermined value based on the presence or absence of a negative sentence in the review data to the set number of the same text set (reference evaluation point), and for each product or service, and The evaluation points are calculated and adjusted for each identical text set.

特に、ポイント算出処理部423は、程度表現テキストが抽出されたテキストセットであって、否定フラグ情報が「FALSE(無し)」のテキストセットにおける基準の評価ポイントには「1」ポイントと、程度表現辞書データを参照し、当該程度表現辞書データに登録されている対応する値、すなわち、程度表現のレベルに対応する値と、を加算するようになっている。また、ポイント算出処理部423は、程度表現テキストが抽出されなかったテキストセット(すなわち、NULLとなっているテキストセット)であって、否定フラグ情報が「TRUE(有り)」のテキストセットについては、評価表現辞書データを参照し、当該テキストセットの評価表現に対して反意語が評価表現として含まれるテキストセットの評価ポイントに「1」ポイントを加算するようになっている。さらに、ポイント算出処理部423は、程度表現テキストが抽出されたテキストセットであって、否定フラグ情報が「TRUE(有り)」のテキストセットについては、評価表現辞書データを参照し、当該テキストセットの評価表現に対して反意語が評価表現として含まれるテキストセットの評価ポイントに「1」ポイントを加算するとともに、程度表現辞書データを参照し、当該程度表現辞書データに登録されている対応する値、すなわち、程度表現のレベルに対応する値を加算するようになっている。   In particular, the point calculation processing unit 423 is a text set from which the degree expression text is extracted, and the reference evaluation point in the text set whose negative flag information is “FALSE (none)” is “1” points and the degree expression. With reference to the dictionary data, a corresponding value registered in the degree expression dictionary data, that is, a value corresponding to the level of the degree expression is added. In addition, the point calculation processing unit 423 is a text set from which the degree expression text is not extracted (that is, a text set that is NULL), and the negative flag information is “TRUE (present)”. With reference to the evaluation expression dictionary data, “1” points are added to the evaluation points of the text set in which the antonym is included as the evaluation expression for the evaluation expression of the text set. Further, the point calculation processing unit 423 refers to the evaluation expression dictionary data for a text set in which the degree expression text is extracted and the negative flag information is “TRUE (present)”, and “1” points are added to the evaluation points of the text set in which an antonym is included as an evaluation expression for the evaluation expression, and the corresponding value registered in the degree expression dictionary data by referring to the degree expression dictionary data, that is, The value corresponding to the level of the degree expression is added.

ポイント算出処理部423は、上記のような構成を有することによって、レストランAまたはレストランBについて、評価対象、評価表現、評価極性を有する所定のテキストセットが抽出されている場合には、図5(a)及び(b)に示すように、当該各テキストセットに対応付けて評価ポイントを算出するようになっている。また、図5(a)は、レストランAに関するテキストセット毎の評価ポイントを表として示したものであり、図5(b)は、レストランBに関するテキストセット毎の評価ポイントを表として示したものである。   When the point calculation processing unit 423 has the above-described configuration and a predetermined text set having an evaluation target, an evaluation expression, and an evaluation polarity is extracted for the restaurant A or the restaurant B, FIG. As shown in a) and (b), an evaluation point is calculated in association with each text set. FIG. 5A shows the evaluation points for each text set relating to the restaurant A as a table, and FIG. 5B shows the evaluation points for each text set relating to the restaurant B as a table. is there.

なお、ポイント算出処理部423は、抽出されたテキストセットに反意語のテキストセットが無い場合には、同一の評価対象について反意語を評価表現テキストとしたテキストセットを新たに生成するようになっている。この場合において、ポイント算出処理部423は、基の評価極性情報が「P」の場合には「N」に、「N」の場合には「P」に、または、「O」の場合は、そのまま「O」の評価極性情報を付与するようになっている。また、ポイント算出処理部423は、否定フラグ情報が「TRUE」の場合であって、抽出されたテキストセットに反意語のテキストセットが無く、かつ、評価表現辞書データに反意語が登録されていない場合には、評価表現テキストに「否定」というテキストを付与したテキストセットを新たに生成し、当該新たに生成されたテキストセットに対して評価ポイントを算出するようになっている。この場合においても、ポイント算出処理部423は、基の評価極性情報が「P」の場合には「N」に、「N」の場合には「P」に、または、「O」の場合は、そのまま「O」の評価極性情報を付与するようになっている。   In addition, when there is no antonym text set in the extracted text set, the point calculation processing unit 423 newly generates a text set using the antonym as an evaluation expression text for the same evaluation target. In this case, the point calculation processing unit 423 is “N” when the basic evaluation polarity information is “P”, “P” when “N”, or “O”. The evaluation polarity information of “O” is added as it is. Also, the point calculation processing unit 423 is in the case where the negative flag information is “TRUE”, the extracted text set has no antonym text set, and the antonym is not registered in the evaluation expression dictionary data. Is configured to newly generate a text set in which the text “No” is added to the evaluation expression text, and to calculate an evaluation point for the newly generated text set. Even in this case, the point calculation processing unit 423 is “N” when the basic evaluation polarity information is “P”, “P” when “N”, or “O” when the basic evaluation polarity information is “P”. The evaluation polarity information of “O” is added as it is.

類似度算出処理部424は、一の販売商品(以下、「評価商品」ともいう。)毎または一の店舗サービス(以下、「評価サービス」ともいう。)毎に、ネガティブ表現を基準にした類似度の算出を防止するための処理(以下、単に「前処理」という。)を行いつつ、他の各販売商品(以下、「比較対象商品」ともいう。)または他の各店舗サービス(以下、「比較対象サービス」ともいう。)と、テキストセット毎の評価ポイントに基づいて各販売商品または各店舗サービスの評価に対する類似度を算出するようになっている。   The similarity calculation processing unit 424 uses a negative expression as a reference for each sale product (hereinafter also referred to as “evaluation product”) or for each store service (hereinafter also referred to as “evaluation service”). While performing processing for preventing the calculation of the degree (hereinafter simply referred to as “pre-processing”), other sales products (hereinafter also referred to as “comparison products”) or other store services (hereinafter referred to as “comparison products”) "Also referred to as" comparison target service "), and the degree of similarity for the evaluation of each sales product or each store service is calculated based on the evaluation points for each text set.

具体的には、類似度算出処理部424は、前処理としては、図6(a)及び(b)に示すように、評価商品毎または評価サービス毎に、評価ポイントが算出されている各テキストセットにおける同一の被修飾語テキストの評価ポイントを累計するようになっている。また、類似度算出処理部424は、累計された各テキストセットの中からネガティブ表現の評価極性を有する(すなわち、「N」の情報を有する)被修飾語テキストにおける評価ポイントを否定ポイントとして集計するようになっている。そして、類似度算出処理部424は、集計された否定ポイントが累計されたポイント累計の一定の割合以上(例えば、3割以上)である場合には、当該否定ポイントにおける被修飾語テキストを含むテキストセットを、類似度算出に関して不使用に設定するようになっている。   Specifically, the similarity calculation processing unit 424 performs, as preprocessing, each text for which evaluation points are calculated for each evaluation product or each evaluation service, as shown in FIGS. The evaluation points of the same modified word text in the set are accumulated. Also, the similarity calculation processing unit 424 aggregates the evaluation points in the modified word text having negative expression evaluation polarity (that is, having “N” information) as negative points from the accumulated text sets. It is like that. Then, the similarity calculation processing unit 424, when the aggregated negative points are equal to or greater than a certain percentage of the accumulated points (for example, 30% or more), the text including the modified word text at the negative points The set is set not to be used for similarity calculation.

なお、図6(a)は、前処理の前のレストランAにおける各テキストセットの評価ポイントを表として示したものであり、図6(b)は、前処理を行った際の各評価対象におけるポイント累計、否定ポイント(以下、「Nポイント」ともいう。)及びその割合(以下、「Nの割合」ともいう。)を表として示したものである。この場合には、例えば、評価対象「接客」については、否定ポイントの割合3割以上であるので、当該被修飾語テキスト(この場合「接客」)を含むテキストセットを、類似度算出に関して不使用に設定するようになっている。   FIG. 6 (a) shows the evaluation points of each text set in the restaurant A before the preprocessing as a table, and FIG. 6 (b) shows each evaluation target when the preprocessing is performed. The accumulated points, negative points (hereinafter also referred to as “N points”) and their ratios (hereinafter also referred to as “N ratio”) are shown in a table. In this case, for example, the evaluation object “customer service” has a negative point ratio of 30% or more, so the text set including the modified target text (in this case “customer service”) is not used for similarity calculation. It is supposed to be set to.

一方、類似度算出処理部424は、一の販売商品毎または一の店舗サービス毎に、上記の前処理において使用可能となったテキストセットの評価ポイントに基づいて、各販売商品または各店舗サービスと他の各販売商品または各店舗サービスとの類似度を算出するようになっている。特に、本実施形態においては、類似度算出処理部424は、基準となる一の販売商品または一の店舗サービスと他の販売商品または店舗サービスにおける同一のテキストセット(すなわち、同一の評価表現テキスト及び同一の被修飾語テキスト)の評価ポイントに基づいて、所定の演算処理を実行し、類似度を算出するようになっている。具体的には、類似度算出処理部424は、所定の演算処理としては、(式1)に基づくベクトルの内積及びベクトルの長さを用いたコサイン類似度演算を実行し、各比較商品または各比較サービスと他の比較対象商品または各比較対象サービスとの類似度Zを算出するようになっている   On the other hand, the similarity calculation processing unit 424 determines each sale product or each store service for each sale product or each store service based on the evaluation points of the text set that can be used in the above preprocessing. The degree of similarity with each other sales product or each store service is calculated. In particular, in the present embodiment, the similarity calculation processing unit 424 uses the same text set (that is, the same evaluation expression text and the same sales product or store service as the reference and another sales product or store service). Based on the evaluation point of the same modified word text), a predetermined calculation process is executed to calculate the similarity. Specifically, the similarity calculation processing unit 424 performs cosine similarity calculation using the inner product of the vector and the length of the vector based on (Equation 1) as the predetermined calculation process, and each comparison product or each The similarity Z between the comparison service and another comparison target product or each comparison target service is calculated.

Z= (x・y)/(|x||y|) ・・・(式1)         Z = (x · y) / (| x || y |) (Formula 1)

例えば、類似度算出処理部424によって、上記の(式1)に基づいて図7(a)に示されるレストランAの評価サービスと、図7(b)に示されるレストランBの比較対象サービスとの類似度Z(レストランA)を算出すると、すなわち、図7(c)に示す評価対象及び評価表現におけるテキストセットをベクトル要素として算出すると、類似度Z{(レストランA)by(レストランB)}は、以下のような値を示す。 For example, the similarity calculation processing unit 424 performs a comparison between the evaluation service of the restaurant A shown in FIG. 7A based on the above (Formula 1) and the comparison target service of the restaurant B shown in FIG. When the similarity Z (restaurant A) is calculated, that is, when the text set in the evaluation object and the evaluation expression shown in FIG. 7C is calculated as a vector element, the similarity Z {(restaurant A) by (restaurant B)} is The following values are shown.

類似度Z{(レストランA)by(レストランB)} = 0.608648 ・・・(式2) Similarity Z {(restaurant A) by (restaurant B)} = 0.608648 (Formula 2)

なお、(式1)において、「x」は、評価商品または評価サービスの各テキストセットにおける評価ポイントのベクトル要素から構成されるベクトル、「y」は、他の一の比較対象商品または他の一の比較対象サービスの各テキストセットにおける評価ポイントのベクトル要素から構成されるベクトルを示し、「|x|」は、xベクトルにおけるベクトルの長さ、及び、「|y|」は、yベクトルにけるベクトルの長さを示す。また、(x・y)はベクトルの内積の演算を示す。ただし、ベクトル演算においては、評価ポイントのテキストセットは、評価商品と比較対象商品または評価サービスと比較対象サービスとを合致させるための処理を行ってから、すなわち、評価商品と比較対象商品または評価サービスと比較対象サービスとにおいて同一のテキストセット同士の評価ポイントをベクトルとして合致させてから実行するようになっている。例えば、該当するテキストセットの評価ポイントが存在しない場合には、「0」として該当するベクトル要素を設定して各演算を行うようになっている。さらに、本実施形態においては、類似度Zは、値が高いほど類似度が高くなり、完全一致する場合には、類似度Zは、「1.0」となる。   In (Equation 1), “x” is a vector composed of vector elements of evaluation points in each text set of the evaluation product or evaluation service, and “y” is another one comparison target product or another one. Indicates a vector composed of vector elements of evaluation points in each text set of the comparison target services of “”, where “| x |” is the length of the vector in the x vector, and “| y |” is in the y vector Indicates the length of the vector. Further, (x · y) indicates the calculation of the inner product of vectors. However, in the vector operation, the evaluation point text set is processed after processing for matching the evaluation product with the comparison target product or evaluation service and the comparison target service, that is, the evaluation product and the comparison target product or evaluation service. And the comparison target service are executed after matching the evaluation points of the same text sets as vectors. For example, when there is no evaluation point of the corresponding text set, the corresponding vector element is set as “0” to perform each calculation. Further, in the present embodiment, the similarity Z increases as the value increases, and the similarity Z becomes “1.0” when the values match completely.

他方、類似度算出処理部424は、販売商品毎または店舗サービス毎に、上述のように算出された各類似度Zをデータベース300に記憶するようになっている。   On the other hand, the similarity calculation processing unit 424 stores each similarity Z calculated as described above in the database 300 for each sale product or each store service.

データ生成処理部425は、販売商品または店舗サービス毎に、算出された他の販売商品または店舗サービスとの各類似度に基づいて、当該販売商品(すなわち、評価商品)または店舗サービス(すなわち、評価サービス)と類似する類似商品及び類似サービスを特定するようになっている。そして、データ生成処理部425は、特定された類似商品または類似サービスに関する情報を、評価商品または評価サービスのWebページデータに組み込むための関連情報提供用パーツデータを生成するようになっている。   The data generation processing unit 425, for each sales product or store service, based on the respective similarities to the other sales product or store service calculated, the sales product (ie, evaluation product) or store service (ie, evaluation) Service) and similar products and similar services. Then, the data generation processing unit 425 generates related information providing part data for incorporating information relating to the specified similar product or similar service into the Web page data of the evaluation product or evaluation service.

具体的には、データ生成処理部425は、類似商品及び類似サービスの特定にあっては、販売商品または店舗サービス毎に、算出された他の販売商品または店舗サービスとの各類似度の上位(例えば、上位3つ)を類似商品または類似サービスと特定するようになっている。   Specifically, in specifying similar products and similar services, the data generation processing unit 425 has a higher rank (for each sales product or store service) of each similarity with the calculated other sales product or store service ( For example, the top three) are identified as similar products or similar services.

また、データ生成処理部425は、各販売商品または各店舗サービスの情報を提供するWebページデータに、特定された類似商品または類似サービスに関する情報を、組み込むための関連情報提供用パーツデータを生成するようになっている。すなわち、データ生成処理部425は、各販売商品または各店舗サービスの情報の閲覧を要求したユーザに対して、特定された類似商品または類似サービスに関する情報をも閲覧可能に提供するためのWebページデータを生成するようになっている。特に、特定された類似商品または類似サービスに関する情報としては、商品名称、商品の特性、商品外観その他の商品情報を示すテキストデータ及び画像データ、店舗名称、提供サービスのジャンル、店舗外観その他の店舗サービスの情報を示すテキストデータ及び画像データなどの一般情報とともに、類似度を算出した際に用いた各テキストセットと各テキストセットに対応する評価ポイントとから構成される評価情報(以下、「類似評価情報」という。)とが含まれる。   In addition, the data generation processing unit 425 generates related information providing part data for incorporating information relating to the specified similar product or similar service into the Web page data providing information on each sales product or each store service. It is like that. That is, the data generation processing unit 425 provides Web page data for providing information related to the specified similar product or similar service to a user who has requested browsing of information on each sales product or each store service. Is supposed to generate. In particular, information relating to the specified similar product or similar service includes product name, product characteristics, text data and image data indicating product appearance and other product information, store name, provided service genre, store appearance and other store services. Evaluation information (hereinafter referred to as “similarity evaluation information”) including general information such as text data and image data indicating the information of the text, and each text set used when calculating the similarity and an evaluation point corresponding to each text set. ")").

例えば、データ生成処理部425は、図8に示すように、店舗Aに関するWebページデータ20の一部に、店舗Aの一般サービス情報10及び評価情報40に関して類似度の高い上位2つの店舗である、店舗Bと店舗Dの一般サービス情報50及び評価情報60を、端末装置100を介して店舗Aの情報について閲覧要求したユーザに対して閲覧可能になるような関連情報提供用パーツデータを生成するようになっている。   For example, as illustrated in FIG. 8, the data generation processing unit 425 is the top two stores having a high degree of similarity with respect to the general service information 10 and the evaluation information 40 of the store A in a part of the Web page data 20 related to the store A. The related service providing part data is generated so that the general service information 50 and the evaluation information 60 of the store B and the store D can be browsed by the user who has requested browsing of the store A information via the terminal device 100. It is like that.

また、本実施形態においては、データ生成処理部425は、類似商品または類似サービスにおける各類似評価情報には、テキストセットを抽出する際に用いられたレビューデータが参照可能となるための情報が含まれており、図8の店舗Dのように、類似評価における一の評価テキストまたは評価ポイントの何れかを選択指示(すなわち、操作部による該当表示エリアのクリック)を実行すると、レビューデータが閲覧可能になるようなパーツデータ、すなわち、ポップアップ表示70を行うことが可能な関連情報提供用パーツデータを生成するようになっている。   Further, in the present embodiment, the data generation processing unit 425 includes information for making it possible to refer to the review data used when extracting the text set, in each similarity evaluation information for similar products or services. As shown in the store D of FIG. 8, the review data can be browsed by executing an instruction to select one of the evaluation texts or evaluation points in the similar evaluation (that is, click on the corresponding display area by the operation unit). That is, part information for providing related information capable of performing pop-up display 70 is generated.

なお、データ生成処理部425は、特定された類似商品または類似サービスの一般サービス情報及び評価情報については、各販売商品または各店舗サービスの情報について提供される複数のWebページデータのうち、一のWebページデータに組み込むための関連情報提供用パーツデータを生成するようにしてもよい。   It should be noted that the data generation processing unit 425 determines the general service information and evaluation information of the specified similar product or similar service from among a plurality of Web page data provided for the information on each sales product or each store service. You may make it produce | generate the related data provision part data for incorporating in Web page data.

(関連情報提供用パーツデータの生成処理)
次に、図9を用いて本実施形態のデータ生成用サーバ装置400における関連情報提供用パーツデータの生成処理の動作について説明する。なお、図9は、本実施形態のデータ生成用サーバ装置400における関連情報提供用パーツデータの生成処理の動作を示すフローチャートである。
(Process for generating related data providing parts data)
Next, the operation of the related information providing part data generation process in the data generation server device 400 of this embodiment will be described with reference to FIG. FIG. 9 is a flowchart showing the operation of the related information providing part data generation process in the data generation server device 400 of this embodiment.

本動作においては、複数のレビューデータが販売商品毎または店舗サービス毎にデータベース300に既に記録(登録)されているものとする。また、所定のアプリケーションが既に起動され、レビューデータを取得するための処理、レビュー解析処理、評価ポイント算出処理及び関連情報提供用パーツデータ生成処理が実行可能な状態であるものとする。   In this operation, it is assumed that a plurality of review data is already recorded (registered) in the database 300 for each sale product or each store service. In addition, it is assumed that a predetermined application has already been started and a process for acquiring review data, a review analysis process, an evaluation point calculation process, and a related information providing part data generation process can be executed.

まず、データ取得処理部421が、予め定められた時刻になったとき、データベース300からの通知により新規なレビューデータが登録された旨を通信インターフェース410を介して受信したとき、または、システム管理者の操作指示を受信したときなど、所定のタイミングを検出すると(ステップS101)、当該データ取得処理部421は、データベース300との通信回線を確立して登録されている販売商品毎及び店舗サービス毎の各レビューデータを取得する(ステップS102)。   First, when the data acquisition processing unit 421 receives a notification through the communication interface 410 that new review data has been registered by a notification from the database 300 when a predetermined time comes, or a system administrator When a predetermined timing is detected (step S101), the data acquisition processing unit 421 establishes a communication line with the database 300 for each sales product and each store service registered. Each review data is acquired (step S102).

次いで、解析処理部422は、取得した各レビューデータに対してそれぞれ形態素解析及び構文解析を実行してテキストセットを抽出するとともに、程度表現テキストの有無、当該程度表現がある場合にはその程度レベル及び否定文の有無を検出する(ステップS103)。例えば、解析処理部422は、上述したように、図4に示す評価属性、評価表現、程度表現及び否定フラグ情報から構成されるテキストセットを抽出する。なお、解析処理部422は、販売商品毎または店舗サービス毎に抽出したテキストセットのデータをデータベース300に記憶する。   Next, the analysis processing unit 422 performs morphological analysis and syntactic analysis on each of the obtained review data to extract a text set, and whether or not there is a degree expression text, and if there is such degree expression, the degree level And the presence or absence of a negative sentence is detected (step S103). For example, as described above, the analysis processing unit 422 extracts a text set including the evaluation attribute, the evaluation expression, the degree expression, and the negative flag information illustrated in FIG. The analysis processing unit 422 stores text set data extracted for each sale product or each store service in the database 300.

次いで、ポイント算出処理部423は、販売商品毎または店舗サービス毎に、抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、抽出された程度表現テキスト、及び、レビューデータにおける否定文の有無に基づいて同一のテキストセット毎の評価ポイントを調整する(ステップS104)。例えば、ポイント算出処理部423は、上述したように、図5に示す販売商品毎または店舗サービス毎の各テキストセットにおける評価ポイントを算出する。なお、ポイント算出処理部423は、各評価ポイントを販売商品毎または店舗サービス毎に、かつ、同一のテキストセット毎にデータベース300に記憶する。   Next, the point calculation processing unit 423 calculates the evaluation points for the same text set by calculating the number of sets of the same text set in each extracted text set for each sale product or each store service and extracting the same. The evaluation points for the same text set are adjusted based on the determined degree expression text and the presence or absence of a negative sentence in the review data (step S104). For example, as described above, the point calculation processing unit 423 calculates evaluation points in each text set for each sales commodity or each store service shown in FIG. The point calculation processing unit 423 stores each evaluation point in the database 300 for each sales product or each store service and for each identical text set.

次いで、類似度算出処理部424は、類似度を算出するにあたり、一の販売商品毎または一の店舗サービス毎に、ネガティブ表現を基準にした類似度の算出を防止するための前処理を行う(ステップS105)。   Next, when calculating the similarity, the similarity calculation processing unit 424 performs pre-processing for preventing the calculation of the similarity based on the negative expression for each sale product or for each store service ( Step S105).

次いで、類似度算出処理部424は、テキストセット毎に、所定の演算式に基づいて、該当するテキストセットにおける各評価ポイントと他の各販売商品または他の各店舗サービスの評価ポイントとの類似度を算出する(ステップS106)。   Next, the similarity calculation processing unit 424, for each text set, based on a predetermined arithmetic expression, the similarity between each evaluation point in the corresponding text set and the evaluation point of each other sales product or each other store service Is calculated (step S106).

次いで、データ生成処理部425は、販売商品または店舗サービス毎に、算出された他の販売商品または店舗サービスとの各類似度に基づいて、各販売商品または各店舗サービスと類似する類似商品及び類似サービスを特定する(ステップS107)。例えば、データ生成処理部425は、上述の(式1)によって販売商品または店舗サービス毎に、算出された他の販売商品または他の店舗サービスとの各類似度を算出し、上位3つの類似度を有する他の販売商品または他の店舗サービスを類似商品または類似サービスを特定する。   Next, the data generation processing unit 425, for each sales product or store service, based on each similarity with the calculated other sales product or store service, similar products and similar to each sales product or each store service A service is specified (step S107). For example, the data generation processing unit 425 calculates each similarity with another sales product or other store service calculated for each sales product or store service according to (Equation 1) described above, and obtains the top three similarities. Other sales products or other store services having a similar product or similar service are identified.

次いで、データ生成処理部425は、特定された類似商品または類似サービスに関する情報を、該当する販売商品または店舗サービスのWebページデータに組み込むための関連情報提供用パーツデータを生成し、生成した関連情報提供用パーツデータをデータベース300に記録する(ステップS108)。   Next, the data generation processing unit 425 generates part information for providing related information for incorporating information related to the specified similar product or similar service into the Web page data of the corresponding sales product or store service, and generates the related information generated. The providing part data is recorded in the database 300 (step S108).

なお、販売商品または店舗サービス毎に、関連情報提供用パーツデータが生成されてデータベース300に記録されると、ユーザが端末装置100を介して一の販売商品(すなわち、選択商品)または一の店舗サービス(すなわち、選択サービス)の情報における閲覧要求が行われたときに、特定された類似商品または類似サービスに関する情報が、選択商品または選択サービスとともに当該端末装置100において閲覧可能に提供される。   When related information providing part data is generated and recorded in the database 300 for each sales product or store service, the user can select one sales product (ie, selected product) or one store via the terminal device 100. When a browsing request for information on a service (that is, a selected service) is made, information regarding the identified similar product or similar service is provided so as to be browseable together with the selected product or the selected service.

(作用効果)
以上、本実施形態のデータ生成用サーバ装置400は、類似商品または類似サービスにおいては評価表現が類似するという特性を利用し、販売商品または店舗サービスのレビューデータに含まれると想定される各ユーザの実体験に基づいて販売商品または店舗サービス毎に定常的な類似性を有する商品等を特定することができる。したがって、本実施形態のデータ生成用サーバ装置400は、ユーザによって一の販売商品または一の店舗サービスの情報の閲覧要求がされた場合に、当該特定された販売商品または店舗サービスに関する情報を、当該ユーザに対して閲覧可能に提供することができる。すなわち、本実施形態のデータ生成用サーバ装置400は、ユーザに対して販売商品または店舗サービスの選択の幅を広げるための情報を提供し、かつ、ユーザの要求に一致する販売商品または店舗サービスを的確に提供することができるので、効率的にかつ合理的な広告・宣伝及び商品等の情報の提供を行うことができる。
(Function and effect)
As described above, the data generation server device 400 according to the present embodiment uses the characteristic that evaluation expressions are similar in similar products or similar services, and is assumed to be included in the review data of sales products or store services. Based on the actual experience, it is possible to specify a product or the like having regular similarity for each sales product or store service. Therefore, the data generation server device 400 according to the present embodiment, when a user requests browsing of information on one sales product or one store service, It can be provided so as to be viewable to the user. That is, the data generation server device 400 according to the present embodiment provides the user with information for expanding the selection range of the sales product or the store service, and selects the sales product or the store service that matches the user's request. Since the information can be provided accurately, it is possible to efficiently and rationally provide information such as advertisements and promotions and products.

本実施形態のデータ生成用サーバ装置400は、程度表現テキストがレビューデータに含まれている場合には、程度表現の有無に基づいて評価ポイントを算出することができるので、使用者または享受者の商品等の評価レベルを反映させた評価ポイントを的確に算出することができる。したがって、本実施形態のデータ生成用サーバ装置400は、的確な評価ポイントに基づいて類似商品または類似サービスを特定することができるので、複数のユーザの実体験に基づいて販売商品毎または店舗サービス毎に定常的な類似性を有する商品等を的確に特定することができる。   When the degree expression text is included in the review data, the data generation server apparatus 400 according to the present embodiment can calculate the evaluation points based on the presence or absence of the degree expression. Evaluation points reflecting the evaluation level of products and the like can be accurately calculated. Accordingly, since the data generation server device 400 according to the present embodiment can specify similar products or similar services based on accurate evaluation points, each sales product or each store service based on the actual experience of a plurality of users. It is possible to accurately specify a product or the like having a constant similarity to the product.

また、本実施形態のデータ生成用サーバ装置400は、テキストセットのセット数とともに、程度表現のレベルに基づいて評価ポイントを算出することができるので、使用者または享受者の商品等の評価レベルを反映させた評価ポイントを的確に算出することができる。したがって、本実施形態のデータ生成用サーバ装置400は、的確な評価ポイントに基づいて類似商品等を特定することができるので、複数のユーザの実体験に基づいて商品等毎に定常的な類似性を有する商品等を的確に特定することができる。   In addition, since the data generation server device 400 according to the present embodiment can calculate the evaluation points based on the level of the degree expression together with the number of sets of text sets, the evaluation level of the product or the like of the user or the user can be set. The reflected evaluation points can be accurately calculated. Therefore, since the data generation server device 400 according to the present embodiment can specify similar products based on accurate evaluation points, steady similarity for each product based on actual experiences of a plurality of users. It is possible to accurately specify a product or the like having

本実施形態のデータ生成用サーバ装置400は、レビューデータに否定文があった場合には、反意語を含むテキストセットの評価ポイントが変化させることができるので、使用者または享受者の評価を反映させた評価ポイントを的確に算出することができる。   The server device 400 for data generation according to the present embodiment reflects the evaluation of the user or the user because the evaluation point of the text set including the antonym can be changed when there is a negative sentence in the review data. Evaluation points can be calculated accurately.

また、本実施形態のデータ生成用サーバ装置400は、レビューデータに否定文があった場合には、反意語を含むテキストセットを的確に抽出することができるので、コメントデータにおける否定文の有無に基づいて各テキストセットの評価ポイントを的確に算出することができる。   In addition, when the review data includes a negative sentence, the data generation server apparatus 400 according to the present embodiment can accurately extract a text set including an antonym, and thus based on the presence or absence of a negative sentence in the comment data. Thus, the evaluation points for each text set can be accurately calculated.

また、本実施形態のデータ生成用サーバ装置400は、類似度を算出する際に否定的な表現に基づいて類似度を算出せずに、肯定的な表現に基づいて評価ポイントを算出することができるとともに、否定的な観点によって、特定された商品等に関する情報を提供することを防止することができる。   In addition, the data generation server device 400 according to the present embodiment may calculate the evaluation points based on the positive expression without calculating the similarity based on the negative expression when calculating the similarity. While being able to do so, it is possible to prevent providing information on the specified product or the like from a negative viewpoint.

(変形例)
次に、本実施形態の商品/サービス情報提供システムSの変形例について説明する。
(Modification)
Next, a modified example of the product / service information providing system S of the present embodiment will be described.

本実施形態においては、類似商品または類似サービスとして特定された販売商品または店舗サービスの情報を提供するため、Webページデータへ組み込むための関連情報提供用パーツデータを生成するようになっているが、特定された販売商品または店舗サービスの情報を提供するためのWebページデータを生成し、当該生成されたWebページデータをURLアドレスによってリンクさせ、当該リンクによって販売商品または店舗サービスの情報を提供するためのWebページデータから閲覧可能に構成するようにしてもよい。   In the present embodiment, in order to provide information on sales products or store services identified as similar products or similar services, related information providing part data to be incorporated into Web page data is generated. In order to generate Web page data for providing the specified sales product or store service information, link the generated Web page data by a URL address, and provide the sales product or store service information by the link The web page data may be configured to be viewable.

本実施形態においては、評価ポイントを算出する際に、程度表現テキストの程度レベルに対応させたポイントをセット数に加算して評価ポイントを算出、すなわち、評価ポイントを調整するようになっているが、程度表現テキストが抽出された場合には該当するテキストセットに一律に所定のポイント(例えば、2ポイント)を加算するようにしてもよい。   In the present embodiment, when calculating the evaluation point, the point corresponding to the level of the degree expression text is added to the number of sets to calculate the evaluation point, that is, the evaluation point is adjusted. When the degree expression text is extracted, a predetermined point (for example, 2 points) may be uniformly added to the corresponding text set.

本実施形態においては、評価ポイントを算出する際に、程度表現テキストの抽出及び否定文の検出の双方に基づいてポイントをセット数に加算して評価ポイントを算出するようになっているが、程度表現テキストの抽出または否定文の検出の何れか一方のみによって評価ポイントを算出する、すなわち、調整するようにしてもよい。   In the present embodiment, when calculating the evaluation point, the evaluation point is calculated by adding the point to the number of sets based on both the extraction of the degree expression text and the detection of the negative sentence. The evaluation points may be calculated, that is, adjusted by only one of extraction of the expression text and detection of a negative sentence.

本実施形態においては、類似度を算出する前に前処理を実行するようになっているが、当該前処理を実行しなくてもよいし、ネガティブ表現に基づいて類似度を算出することが防止できるものであれば、上記の前処理に限られない。   In the present embodiment, preprocessing is performed before calculating the similarity, but it is not necessary to perform the preprocessing, and it is possible to prevent the similarity from being calculated based on a negative expression. If possible, it is not limited to the above pre-processing.

本発明の情報処理システムは、インターネットなどのネットワークNを用いて商品を販売する通信販売システムなどの商品または店舗サービスに関する情報を提供するシステムに適用することができる。   The information processing system of the present invention can be applied to a system that provides information related to products or store services such as a mail order system that sells products using a network N such as the Internet.

S … 商品/サービス情報提供システム
100 … 端末装置
200 … 情報提供用サーバ装置
300 … データベース
400 … データ生成用サーバ装置
410 … 通信インターフェース
420 … データ処理部
421 … データ取得処理部
422 … 解析処理部
423 … ポイント算出処理部
424 … 類似度算出処理部
425 … データ生成処理部
S ... Product / service information providing system 100 ... Terminal device 200 ... Information providing server device 300 ... Database 400 ... Data generating server device 410 ... Communication interface 420 ... Data processing unit 421 ... Data acquisition processing unit 422 ... Analysis processing unit 423 ... Point calculation processing unit 424 ... Similarity calculation processing unit 425 ... Data generation processing unit

Claims (8)

ユーザに対して商品またはサービスの情報を閲覧可能に提供するためのデータを生成するデータ生成装置であって、
商品毎またはサービス毎に、当該商品の使用者または当該サービスの享受者によって登録された複数のコメントデータを記憶されているデータベースから取得する取得手段と、
前記取得された各コメントデータに対して形態素解析及び構文解析を実行し、前記商品毎または前記サービス毎に、評価表現を示す評価表現テキストと当該テキストが修飾する被修飾語テキストのテキストセットを抽出するとともに、前記コメントデータから前記抽出された評価表現テキストに関する程度表現テキストの抽出、または、前記コメントデータにおける否定文の有無における検出の少なくとも何れか一方を実行する抽出手段と、
前記商品毎または前記サービス毎に、前記抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、前記抽出された程度表現テキスト、または、前記コメントデータにおける否定文の有無の少なくとも何れか一方に基づいて同一のテキストセット毎の評価ポイントを調整するポイント算出手段と、
前記商品または前記サービス毎に、前記テキストセット毎の評価ポイントに基づいて各商品または各サービスと他の商品または他のサービスとのユーザの評価に対する類似度を算出する類似度算出手段と、
前記商品または前記サービス毎に、前記算出された他の商品またはサービスとの類似度に基づいて、当該商品または当該サービスと類似する類似商品及び類似サービスを特定する特定手段と、
前記ユーザによって一の商品または一のサービスの情報に対して閲覧要求がされた場合に、前記特定された類似商品または類似サービスに関する情報を、当該ユーザに対して閲覧可能に提供するためのデータを生成する生成手段と、
を備えることを特徴とするデータ生成装置。
A data generation device for generating data for providing information on a product or service to a user so as to be viewable,
An acquisition means for acquiring a plurality of comment data registered by a user of the product or a user of the service for each product or service from a stored database;
Performs morphological analysis and syntax analysis on each of the acquired comment data, and extracts, for each product or each service, a text set of an evaluation expression text indicating an evaluation expression and a modified word text modified by the text. And extracting means for performing at least one of extraction of a degree expression text related to the extracted evaluation expression text from the comment data, or detection of the presence or absence of a negative sentence in the comment data;
For each product or each service, the number of sets of the same text set in each extracted text set is totaled to calculate an evaluation point for each same text set, and the extracted degree expression text, or Point calculation means for adjusting an evaluation point for each of the same text set based on at least one of the presence or absence of a negative sentence in the comment data;
For each product or service, similarity calculation means for calculating the similarity of each product or service to another product or other service based on an evaluation point for each text set;
A specifying unit that specifies a similar product and a similar service similar to the product or the service based on the calculated similarity to the other product or service for each of the product or the service;
Data for providing information related to the identified similar product or similar service to the user so that the user can view the information when the user requests browsing of the information on the one product or one service. Generating means for generating;
A data generation device comprising:
請求項1に記載のデータ生成装置において、
前記抽出手段が、前記程度表現テキストがリスト化された程度表現辞書データを備えて前記各コメントデータから前記程度表現テキストを抽出するとともに、
前記ポイント算出手段が、前記程度表現テキストが抽出されたテキストセットに関しては、前記集計された同一のテキストセットのセット数に、程度表現テキストに基づく所定の値を加算して前記評価ポイントを算出する、データ生成装置。
The data generation device according to claim 1,
The extraction means includes degree expression dictionary data in which the degree expression text is listed, and extracts the degree expression text from each comment data;
For the text set from which the degree expression text is extracted, the point calculation means calculates the evaluation point by adding a predetermined value based on the degree expression text to the total number of sets of the same text set. , Data generation device.
請求項2に記載のデータ生成装置において、
前記程度表現辞書データには、前記程度表現テキストの程度レベルに対応する値が登録されており、
前記ポイント算出手段が、前記抽出手段によって前記程度表現テキストが抽出されたテキストセットに関しては、当該テキストセットのセット数に、前記程度表現テキストの程度レベルに対応した値を加算して前記評価ポイントを算出する、データ生成装置。
The data generation device according to claim 2,
In the degree expression dictionary data, a value corresponding to the degree level of the degree expression text is registered,
For the text set from which the degree expression text has been extracted by the extraction means, the point calculation means adds the value corresponding to the degree level of the degree expression text to the number of sets of the text set, and calculates the evaluation point. A data generation device for calculating.
請求項1に記載のデータ生成装置において、
前記抽出手段が、反意語の有無及び当該反意語がある場合に該当する反意語と対応付けられた評価表現テキストがリスト化された評価表現辞書データを備え、当該評価表現辞書データを用いて前記各コメントデータから前記評価表現テキストを抽出し、
前記ポイント算出手段が、前記抽出手段によって前記各コメントデータに含まれる否定表現が検出された場合に、前記評価表現辞書データを参照して前記抽出された評価表現テキストに対する反意語を含むテキストセットのセット数に、所定の値を加算して前記評価ポイントを算出する、データ生成装置。
The data generation device according to claim 1,
The extraction means includes evaluation expression dictionary data in which evaluation expression text associated with an antonym corresponding to the presence or absence of an antonym and the corresponding antonym is listed, and each comment data using the evaluation expression dictionary data The evaluation expression text is extracted from
A set of text sets including an antonym for the extracted evaluation expression text with reference to the evaluation expression dictionary data when the point calculation means detects a negative expression included in each comment data by the extraction means A data generation device that calculates the evaluation point by adding a predetermined value to a number.
請求項4に記載のデータ生成装置において、
前記評価表現辞書データには、肯定的表現テキストまたは否定的表現テキストであることを示す評価極性の情報を有する評価表現テキストがリスト化されており、
前記抽出手段が、前記評価表現辞書データを用いて評価極性とともに前記評価表現テキスト及びテキストセットを抽出する、データ生成装置。
The data generation device according to claim 4,
In the evaluation expression dictionary data, evaluation expression texts having evaluation polarity information indicating that they are positive expression texts or negative expression texts are listed,
The data generation device, wherein the extraction unit extracts the evaluation expression text and the text set together with the evaluation polarity using the evaluation expression dictionary data.
請求項5に記載のデータ生成装置において、
前記ポイント算出手段が、前記商品毎またはサービス毎に、前記算出された同一の前記被修飾語テキストの評価ポイントを累計するとともに前記否定的な表現を含む評価極性を有する当該同一の被修飾語テキストにおける評価ポイントを否定ポイントとして集計し、
前記類似度算出手段が、前記否定ポイントが前記ポイント累計の一定の割合以上である場合には、当該否定ポイントにおける前記被修飾語テキストを含むテキストセットを、類似度算出に関して不使用に設定する、データ生成装置。
The data generation device according to claim 5,
The same modified word text having the evaluation polarity including the negative expression while the point calculation means accumulates the calculated evaluation points of the same modified word text for each product or service The evaluation points in are counted as negative points,
The similarity calculation means, when the negative point is equal to or greater than a certain percentage of the cumulative point, set the text set including the modified text at the negative point is not used for similarity calculation; Data generator.
ユーザに対して商品またはサービスの情報を閲覧可能に提供するためのデータを生成するデータの生成方法であって、
商品毎またはサービス毎に、当該商品の使用者または当該サービスの享受者によって登録された複数のコメントデータを記憶されているデータベースから取得する取得工程と、
前記取得された各コメントデータに対して形態素解析及び構文解析を実行し、前記商品毎または前記サービス毎に、評価表現を示す評価表現テキストと当該テキストが修飾する被修飾語テキストのテキストセットを抽出するとともに、前記コメントデータから前記抽出された評価表現テキストに関する程度表現テキストの抽出、または、前記コメントデータにおける否定文の有無における検出の少なくとも何れか一方を実行する抽出工程と、
前記商品毎または前記サービス毎に、前記抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、前記抽出された程度表現テキスト、または、前記コメントデータにおける否定文の有無の少なくとも何れか一方に基づいて同一のテキストセット毎の評価ポイントを調整するポイント算出工程と、
前記商品または前記サービス毎に、前記テキストセット毎の評価ポイントに基づいて各商品または各サービスと他の商品または他のサービスとのユーザの評価に対する類似度を算出する類似度算出工程と、
前記商品または前記サービス毎に、前記算出された他の商品またはサービスとの類似度に基づいて、当該商品または当該サービスと類似する類似商品及び類似サービスを特定する特定工程と、
前記ユーザによって一の商品または一のサービスの情報に対して閲覧要求がされた場合に、前記特定された類似商品または類似サービスに関する情報を、当該ユーザに対して閲覧可能に提供するためのデータを生成する生成工程と、
を含むことを特徴とするデータの生成方法。
A data generation method for generating data for providing information on a product or service to a user so as to be viewable,
An acquisition step of acquiring a plurality of comment data registered by a user of the product or a user of the service for each product or service from a stored database;
Performs morphological analysis and syntax analysis on each of the acquired comment data, and extracts, for each product or each service, a text set of an evaluation expression text indicating an evaluation expression and a modified word text modified by the text. And an extraction step of performing at least one of extraction of a degree expression text related to the extracted evaluation expression text from the comment data, or detection in the presence or absence of a negative sentence in the comment data;
For each product or each service, the number of sets of the same text set in each extracted text set is totaled to calculate an evaluation point for each same text set, and the extracted degree expression text, or A point calculation step of adjusting an evaluation point for each identical text set based on at least one of the presence or absence of a negative sentence in the comment data;
For each of the products or the services, a similarity calculation step of calculating a similarity to the user's evaluation between each product or each service and another product or another service based on an evaluation point for each text set;
For each product or service, a specifying step for identifying a similar product and a similar service similar to the product or the service based on the similarity to the calculated other product or service;
Data for providing information related to the identified similar product or similar service to the user so that the user can view the information when the user requests browsing of the information on the one product or one service. A generation process to generate;
A method of generating data, comprising:
コンピュータによって、ユーザに対して商品またはサービスの情報を閲覧可能に提供するためのデータを生成するデータ生成プログラムであって、
前記コンピュータを、
商品毎またはサービス毎に、当該商品の使用者または当該サービスの享受者によって登録された複数のコメントデータを記憶されているデータベースから取得する取得手段、
前記取得された各コメントデータに対して形態素解析及び構文解析を実行し、前記商品毎または前記サービス毎に、評価表現を示す評価表現テキストと当該テキストが修飾する被修飾語テキストのテキストセットを抽出するとともに、前記コメントデータから前記抽出された評価表現テキストに関する程度表現テキストの抽出、または、前記コメントデータにおける否定文の有無における検出の少なくとも何れか一方を実行する抽出手段、
前記商品毎または前記サービス毎に、前記抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、前記抽出された程度表現テキスト、または、前記コメントデータにおける否定文の有無の少なくとも何れか一方に基づいて同一のテキストセット毎の評価ポイントを調整するポイント算出手段、
前記商品または前記サービス毎に、前記テキストセット毎の評価ポイントに基づいて各商品または各サービスと他の商品または他のサービスとのユーザの評価に対する類似度を算出する類似度算出手段、
前記商品または前記サービス毎に、前記算出された他の商品またはサービスとの類似度に基づいて、当該商品または当該サービスと類似する類似商品及び類似サービスを特定する特定手段、
前記ユーザによって一の商品または一のサービスの情報に対して閲覧要求がされた場合に、前記特定された類似商品または類似サービスに関する情報を、当該ユーザに対して閲覧可能に提供するためのデータを生成する生成手段、
として機能させることを特徴とするデータ生成プログラム。
A data generation program for generating data for providing information on goods or services to a user so as to be viewable by a computer,
The computer,
An acquisition means for acquiring, for each product or service, a plurality of comment data registered by a user of the product or a user of the service from a stored database;
Performs morphological analysis and syntax analysis on each of the acquired comment data, and extracts, for each product or each service, a text set of an evaluation expression text indicating an evaluation expression and a modified word text modified by the text. And extracting means for performing at least one of extraction of a degree expression text related to the extracted evaluation expression text from the comment data, or detection of the presence or absence of a negative sentence in the comment data,
For each product or each service, the number of sets of the same text set in each extracted text set is totaled to calculate an evaluation point for each same text set, and the extracted degree expression text, or Point calculation means for adjusting an evaluation point for each same text set based on at least one of the presence or absence of a negative sentence in the comment data;
Similarity calculation means for calculating the degree of similarity between each product or each service and another product or other service based on the evaluation point for each text set for each product or service,
A specifying unit that specifies a similar product and a similar service similar to the product or the service based on the calculated similarity to the other product or service for each product or the service;
Data for providing information related to the identified similar product or similar service to the user so that the user can view the information when the user requests browsing of the information on the one product or one service. Generating means for generating,
A data generation program characterized by functioning as
JP2010220055A 2010-09-29 2010-09-29 DATA GENERATION DEVICE, DATA GENERATION METHOD, AND DATA GENERATION PROGRAM Expired - Fee Related JP5541049B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010220055A JP5541049B2 (en) 2010-09-29 2010-09-29 DATA GENERATION DEVICE, DATA GENERATION METHOD, AND DATA GENERATION PROGRAM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010220055A JP5541049B2 (en) 2010-09-29 2010-09-29 DATA GENERATION DEVICE, DATA GENERATION METHOD, AND DATA GENERATION PROGRAM

Publications (2)

Publication Number Publication Date
JP2012073966A JP2012073966A (en) 2012-04-12
JP5541049B2 true JP5541049B2 (en) 2014-07-09

Family

ID=46170043

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010220055A Expired - Fee Related JP5541049B2 (en) 2010-09-29 2010-09-29 DATA GENERATION DEVICE, DATA GENERATION METHOD, AND DATA GENERATION PROGRAM

Country Status (1)

Country Link
JP (1) JP5541049B2 (en)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5806974B2 (en) * 2012-05-17 2015-11-10 日本電信電話株式会社 Neighboring information retrieval apparatus, method and program
JP5877126B2 (en) * 2012-05-31 2016-03-02 株式会社Nttドコモ Information providing server, related information server, information providing system, and information providing method
CN103870973B (en) * 2012-12-13 2017-12-19 阿里巴巴集团控股有限公司 Information push, searching method and the device of keyword extraction based on electronic information
JP5890385B2 (en) * 2013-12-20 2016-03-22 ヤフー株式会社 Data processing apparatus and data processing method
JP6539962B2 (en) * 2014-09-04 2019-07-10 富士ゼロックス株式会社 Information presentation program and information processing apparatus
CN107645559B (en) * 2017-09-30 2020-10-09 广东美的制冷设备有限公司 Household appliance information pushing method, server, mobile terminal and storage medium
CN107515954A (en) * 2017-09-30 2017-12-26 广东美的制冷设备有限公司 Generation method, big data system and the storage medium of housed device report
JP6748245B2 (en) * 2019-02-19 2020-08-26 ヤフー株式会社 Information processing apparatus, information processing method, and information processing program
JP7106500B2 (en) * 2019-08-23 2022-07-26 ヤフー株式会社 Provision device, provision method and provision program
JP2021064226A (en) * 2019-10-15 2021-04-22 ヤフー株式会社 Information processing device, information processing method, and information processing program
CN112052388A (en) * 2020-08-20 2020-12-08 深思考人工智能科技(上海)有限公司 Method and system for recommending gourmet stores

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000187666A (en) * 1998-12-22 2000-07-04 Ntt Data Corp Related information providing system and taste similarity evaluating system and its method information introducing system and related information obtaining method and recording medium
JP3402598B1 (en) * 2001-11-20 2003-05-06 株式会社ジャストシステム Information processing apparatus, information processing method, and information processing program
JP2007179276A (en) * 2005-12-27 2007-07-12 Internatl Business Mach Corp <Ibm> Conformity judgment method, device, and program
JP4359787B2 (en) * 2007-07-02 2009-11-04 ソニー株式会社 Information processing apparatus, content reputation search method, and content reputation search system
JP2009123015A (en) * 2007-11-15 2009-06-04 Bbmedia Inc Brand ranking system and method
JP4524709B2 (en) * 2007-12-03 2010-08-18 ソニー株式会社 Information processing apparatus and method, and program
JP4774087B2 (en) * 2008-08-20 2011-09-14 ヤフー株式会社 Movie evaluation method, apparatus and program

Also Published As

Publication number Publication date
JP2012073966A (en) 2012-04-12

Similar Documents

Publication Publication Date Title
JP5541049B2 (en) DATA GENERATION DEVICE, DATA GENERATION METHOD, AND DATA GENERATION PROGRAM
JP6242426B2 (en) System and method for using knowledge representation to provide information based on environmental inputs
JP2016146213A (en) System and method for performing semantic operation on digital social network
JP6415619B2 (en) Analysis device, analysis method, and program
JP6936459B1 (en) Trademark use detection device, trademark use detection method and trademark use detection program
JP6529133B2 (en) Apparatus, program and method for analyzing the evaluation of topics in multiple regions
JP5577753B2 (en) Recommended product selection device, recommended product selection method, recommended product selection program, and sales support system
EP2665004A1 (en) Information processing device, information processing method, information processing device program, and recording medium
JP5768492B2 (en) Information processing apparatus, information processing method, and program
JP6018338B1 (en) Information processing apparatus, information processing method, and information processing program
JP2009048408A (en) Document preparation system, user terminal, server device and program
JP6037540B1 (en) Search system, search method and program
JP4743766B2 (en) Impression determination system, advertisement article generation system, impression determination method, advertisement article generation method, impression determination program, and advertisement article generation program
JP2012043289A (en) Information providing device, information providing method, program, and information recording medium
JP2012243032A (en) Information processing apparatus, information processing method, and program
JP5890385B2 (en) Data processing apparatus and data processing method
JP6960253B2 (en) Product evaluation device, product evaluation method, and program
JP5138621B2 (en) Information processing apparatus, dissatisfied product discovery method and program
JPWO2012023541A1 (en) Information providing apparatus, information providing method, program, and information recording medium
JP2009223372A (en) Recommendation device, recommendation system, control method for recommendation device and control method for recommendation system
JP6960553B2 (en) Brand dictionary creation device, product evaluation device, brand dictionary creation method and program
JP6320465B2 (en) Method and apparatus for providing information of interest to one or more users
JP6050273B2 (en) Search function link creation device, method, user terminal, and advertisement distribution method
JP7133674B1 (en) Information processing device, information processing method and information processing program
JP6964445B2 (en) Brand dictionary creation device, brand dictionary creation method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130722

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140408

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140421

R150 Certificate of patent or registration of utility model

Ref document number: 5541049

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees