JP2015036923A - Assessment collection device, assessment ranking preparation device, method for assessment collection and program - Google Patents
Assessment collection device, assessment ranking preparation device, method for assessment collection and program Download PDFInfo
- Publication number
- JP2015036923A JP2015036923A JP2013168707A JP2013168707A JP2015036923A JP 2015036923 A JP2015036923 A JP 2015036923A JP 2013168707 A JP2013168707 A JP 2013168707A JP 2013168707 A JP2013168707 A JP 2013168707A JP 2015036923 A JP2015036923 A JP 2015036923A
- Authority
- JP
- Japan
- Prior art keywords
- evaluation
- words
- unit
- phrase
- emotion expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本願は、商品又は役務の評価を集計する評価集計装置、評価順位作成装置、評価集計方法及びプログラムに関する。 The present application relates to an evaluation totaling apparatus, an evaluation rank creating apparatus, an evaluation totaling method, and a program for totalizing evaluations of products or services.
1つの映画に関連する推奨映画を、数値と対応付けた感情項目に基づいて提供するサービスがある(例えば、特許文献1参照)。特許文献1に係るサービスは、第三者から提供された作品評価データに含まれる感情項目を入力し、入力した感情項目に対応する数値を集計して、その集計結果を表示する。
There is a service that provides a recommended movie related to one movie based on emotion items associated with numerical values (see, for example, Patent Document 1). The service according to
しかしながら、特許文献1に係るサービスの場合、第三者から提供される作品評価データの数と、当該作品評価データに含まれる感情項目の数とには限りがあり、推奨映画の集計数値に関する信頼性が乏しい。
However, in the case of the service according to
本願は、かかる事情に鑑みてなされたものである。その目的は、商品又は役務に関して信頼性の高い評価を集計することができる評価集計装置、評価順位作成装置、評価集計方法及びプログラムを提供することにある。 The present application has been made in view of such circumstances. An object of the present invention is to provide an evaluation totaling apparatus, an evaluation rank creating apparatus, an evaluation totaling method, and a program capable of totaling highly reliable evaluations regarding products or services.
本願の一観点は、ウェブサイトから収集した文書に基づいて、商品又は役務の評価に係る数値を集計する評価集計装置であって、商品又は役務の名称が記載されたウェブページに書き込まれた該商品又は役務の評価に係る文書をウェブサイトから収集する収集部と、該収集部が収集した文書を語句に分割する分割部と、感情表現語句に一致及び類似する語句並びに該語句に夫々対応する数値を各対応付けて予め記憶した記憶部と、該記憶部の内容に基づいて、前記分割部が分割した語句に前記感情表現語句に一致又は類似する語句が含まれる場合、該語句に対応する数値を集計する集計部とを備える。 One aspect of the present application is an evaluation and aggregation device that aggregates numerical values related to evaluation of goods or services based on documents collected from a website, and is written on a web page on which the names of goods or services are written. A collection unit that collects documents related to product or service evaluation from a website, a division unit that divides the documents collected by the collection unit into words, and a phrase that matches and resembles emotional phrases and corresponding to the phrases respectively. Corresponding to the phrase when the phrase divided by the dividing unit includes a phrase that matches or is similar to the emotion expression phrase based on the contents of the storage unit that stores each numerical value in advance in association with each other And a counting unit that counts the numerical values.
本願の一観点によれば、商品又は役務に関して信頼性の高い評価を集計することができる。 According to one aspect of the present application, highly reliable evaluations regarding products or services can be aggregated.
本実施の形態に係る評価順位作成装置を、その図面に基づいて説明する。本実施の形態に係る評価順位作成装置は、不特定多数の人の主観的評価による商品及び役務の評価ランキングを作成する。ここでの商品は、有体物及び無体物を含む。商品は、あらゆる商売の例えば物品、動産、不動産、無体物であり、例えば映画の記憶媒体、小説、漫画等の書籍、ゲームプログラムの記憶媒体、音楽の記憶媒体、金融機関の商品、ノベルティ商品、コンピュータプログラム等を含む。ここでの役務は、労働などによるつとめであり、例えばシアターでの映画上映サービス、コンピュータプログラムのダウンロードサービス、音楽に係るデータのダウンロードサービスを含む。また、役務は、レストランで提供されるサービス、レジャー施設で提供される乗り物への乗車サービス、金融機関で提供されるサービス、旅行会社で提供されるサービス等を含む。以下では、商品例として映画の記憶媒体を挙げ、評価順位作成装置を説明する。 An evaluation rank creating apparatus according to the present embodiment will be described with reference to the drawings. The evaluation rank creating apparatus according to the present embodiment creates an evaluation ranking of products and services based on subjective evaluation of an unspecified number of people. The goods here include tangible and intangibles. The product is any goods such as goods, movable property, real estate, intangibles, such as movie storage media, novels, comic books, game program storage media, music storage media, financial institution products, novelty products, Includes computer programs. The service here is a work by labor or the like, and includes, for example, a movie screening service in a theater, a computer program download service, and a music data download service. Services include services provided at restaurants, ride services on vehicles provided at leisure facilities, services provided at financial institutions, services provided at travel agencies, and the like. In the following, a movie storage medium is cited as an example of a product, and the evaluation order creating device will be described.
実施の形態1
図1は、評価順位作成装置10のハードウェア構成例を示すブロック図である。評価順位作成装置10は、例えば汎用コンピュータ、ワークステーション、デスクトップ型PC(パーソナルコンピュータ)等である。
評価順位作成装置10は、CPU(Central Processing Unit)(収集部、分割部、集計部、生成部、作成部、変更部)11を含む。また、評価順位作成装置10は、ROM(Read Only Memory)12、RAM(Random Access Memory)13、ハードディスク14、ディスクドライブ15、表示部16、操作部(受付部)17、タイマ18及び通信部(受付部)19を含む。
FIG. 1 is a block diagram illustrating a hardware configuration example of the evaluation
The evaluation
CPU11は、ソフトウェアプログラムに記述された命令セットを実行するためのプロセッサである。CPU11は、評価順位作成装置10の各構成部を制御する。CPU11は、ハードディスク14に記憶されたプログラム1PをRAM13に読み出し、RAM13に読み出したプログラム1Pを実行する。
The CPU 11 is a processor for executing an instruction set described in a software program. The CPU 11 controls each component of the evaluation
ROM12は、例えば不揮発性の半導体メモリ又は半導体メモリ以外の読み出し専用記憶媒体である。ROM12は、評価順位作成装置10の起動時にCPU11が実行するBIOS(Basic Input/Output System)、ファームウェア等を記憶している。
The
RAM13は、主記憶装置である。RAM13は、例えばSRAM又はDRAMであり、CPU11が実行する処理の過程で必要な作業変数、データ等を一時的に記憶する。なお、RAM13の代わりにフラッシュメモリ、メモリカード等が用いられてもよい。
The
ハードディスク14は、補助記憶装置である。ハードディスク14は、大容量の情報の記憶が可能なフラッシュメモリ又はCD(Compact Disc)、DVD(Digital Versatile Disc)、BD(Blu-ray Disc、登録商標)等の光ディスク1dで代替されてもよい。ハードディスク14は、CPU11が実行するプログラム1P、各種テーブル及び各種ファイルを記憶している。各種テーブルは、商品役務テーブル1T、レビューテーブル2T、検索キーワードテーブル(記憶部)3T、つながり語句テーブル(つながり語句記憶部)4T、レビュー別スコアテーブル5T及びランキングテーブル6Tを含む。これらのテーブルの詳細については、後述する。また、各種ファイルは、係り受け関係重み値ファイル1Fを含む。係り受け関係重み値ファイル1Fの詳細については、後述する。
The
ハードディスク14は、評価順位作成装置10の内部に取り付けられるものであっても、評価順位作成装置10の外部に置かれるものであってもよい。例えば、ハードディスク14に記憶された各種テーブルは、外部のデータベースサーバに記憶されていてもよい。かかる場合、評価順位作成装置10は、通信部19を介して、外部のデータベースサーバにアクセスして、各種テーブルの内容を取得する。また、評価順位作成装置10は、通信部19を介して、外部のデータベースサーバにアクセスして、各種テーブルに情報を書き込む。
The
ディスクドライブ15は、補助記憶装置である。ディスクドライブ15は、外部の記憶媒体であるCD、DVD、BD等の光ディスク1dから情報を読み出し、光ディスク1dに情報を記録する。
The
表示部16は、画像を表示する表示装置である。表示部16は、例えば液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ、CRT(Cathode Ray Tube)ディスプレイ等の画面を有し、CPU11からの指示に従って、プログラム1Pに係る各種情報を表示する。
The
操作部17は、電源スイッチ、ディスクドライブ15から光ディスク1dを排出するための操作ボタン、ユーザが各種の入力を行うためのキーボード、マウス等の入力デバイスである。操作部17は、ユーザによる操作に基づいて入力信号を生成する。生成された入力信号は、バス1bを介してCPU11に送信される。
The
タイマ18は、クロックを数えることで一定時間の経過を計時する装置である。タイマ18は、計時した結果をCPU11に出力する。
The
通信部19は、有線又は無線通信のモデム、LAN(Local Area Network)カード、ルータ、USB(Universal Serial Bus)端子、接続コネクタ等である。通信部19は、LAN、WAN(Wide Area Network)、電話回線、衛星通信回線、インターネット等のネットワーク1Nと接続されている。
The
なお、CPU11は、ディスクドライブ15を介して、プログラム1Pを光ディスク1dから読み込んでもよい。CPU11は、通信部19を介して、プログラム1Pを外部の情報処理装置又は記憶装置から読み込んでもよい。さらに、プログラム1Pを記憶したフラッシュメモリ等の半導体メモリ1mが、評価順位作成装置10内に実装されていてもよい。
Note that the CPU 11 may read the
次に、ハードディスク14に記憶されている各種テーブル及び係り受け関係重み値ファイル1Fについて説明する。
図2は、商品役務テーブル1Tのレコードレイアウトの一例を示す説明図である。商品役務テーブル1Tは、商品及び役務の属性を管理するマスタテーブルである。図2は、商品が映画の記憶媒体である場合を例示している。
Next, various tables stored in the
FIG. 2 is an explanatory diagram showing an example of a record layout of the product service table 1T. The product / service table 1T is a master table for managing the attributes of products and services. FIG. 2 illustrates the case where the product is a movie storage medium.
商品役務テーブル1Tは、商品役務ID、商品役務名、製作年、製作国、監督及び出演者の各列を含む。商品役務IDは、商品又は役務を識別する識別記号である。商品役務IDは、例えば映画の光ディスク1dの製品番号である。商品役務名は、商品又は役務の名称であり、図2では映画の名称である。製作年は、映画が製作された年である。製作国は、映画が製作された国である。監督は、映画を監督した者の氏名である。出演者は、映画に出演した俳優の名称である。商品役務テーブル1Tが映画に関するその他の属性を記憶する列を更に含んでもよいことは勿論である。
The product service table 1T includes columns of product service ID, product service name, production year, production country, director, and performer. The product service ID is an identification symbol for identifying the product or service. The product service ID is, for example, the product number of the movie
図3は、レビューテーブル2Tのレコードレイアウトの一例を示す説明図である。レビューテーブル2Tは、不特定多数の人がウェブページに書き込んだ映画についての主観的評価による文書を記憶するテーブルである。プログラム1Pは、クラウド上の文書や画像などを周期的に取得し、自動的にデータベース化するプログラムであるクローラを含む。CPU11は、商品役務テーブル1Tに記憶された商品役務名に対応する映画について書き込まれたレビューをクラウド上から収集し、収集したレビューをレビューテーブル2Tに書き込む。
FIG. 3 is an explanatory diagram showing an example of a record layout of the review table 2T. The review table 2T is a table that stores a document by subjective evaluation of a movie written by an unspecified number of people on a web page. The
レビューテーブル2Tは、商品役務ID、レビューID、書き込み文書及びURL(Uniform Resource Locator)の各列を含む。商品役務IDは、商品役務テーブル1Tの商品役務IDと同一であり、CPU11がレビューを収集したウェブページに記載されていた映画の名称に対応する。レビューIDは、レビューを識別する識別記号である。書き込み文書は、不特定多数の人により、夫々書き込まれたレビューの文字列である。URLは、レビューを収集した対象のウェブサイトのURLである。レビューテーブル2Tは、他にレビューを書き込んだ人の属性(例えば、氏名、ニックネーム、年齢、性別等)を格納する列を含んでもよい。 The review table 2T includes columns of product service ID, review ID, written document, and URL (Uniform Resource Locator). The merchandise service ID is the same as the merchandise service ID in the merchandise service table 1T, and corresponds to the name of the movie described on the web page where the CPU 11 has collected the reviews. The review ID is an identification symbol that identifies the review. The written document is a review character string written by an unspecified number of people. The URL is the URL of the target website for which the review has been collected. The review table 2T may include a column that stores other attributes (for example, name, nickname, age, gender, etc.) of the person who wrote the review.
図4は、検索キーワードテーブル3Tのレコードレイアウトの一例を示す説明図である。検索キーワードテーブル3Tは、点数と対応付けた感情表現語句を互いに類似する語句毎に記憶するテーブルである。ここで感情表現語句は、人が商品又は役務を「気持ち」、「テイスト」等で表現する場合に用いられる語句である。感情表現語句は、図4に例示列挙したものの他に、例えば「泣ける」、「ヤンデレ」、「ユルユル」、「スカッと」、「ワクワクする」、「痛快」、「ファンタジー」、「前向きになる」等を含む。 FIG. 4 is an explanatory diagram showing an example of a record layout of the search keyword table 3T. The search keyword table 3T is a table that stores emotion expression words / phrases associated with scores for each similar word / phrase. Here, the emotion expression phrase is a phrase used when a person expresses a product or service with “feelings”, “taste”, and the like. In addition to those enumerated in FIG. 4, for example, “crying”, “Yandere”, “Yuruyuru”, “squatting”, “exciting”, “exciting”, “fantasy”, “proactive” And the like.
検索キーワードテーブル3Tは、キーワード、類似語1、類似語2、類似語3、類似語4及び類似語5の各列を含む。キーワードは、感情表現語句の1つである。類似語1〜類似語5は、キーワードに類似する感情表現語句である。検索キーワードテーブル3Tが他の類似語を記憶する列を更に含んでもよいことは勿論である。
The search keyword table 3T includes columns of a keyword, a
検索キーワードテーブル3Tは、キーワード、類似語1、類似語2、類似語3、類似語4及び類似語5に夫々対応する点数の各列を含む。点数は、商品又は役務を感情表現語句に基づいて評価するために基本となる数値である。図4の例では、点数は整数であるが、点数は実数であればよい。検索キーワードテーブル3Tに限らず、評価順位作成装置10が商品又は役務に関する評価ランキングを作成するために扱う数値は、実数であればよい。
The search keyword table 3T includes columns of scores corresponding to the keyword, the
図5は、つながり語句テーブル4Tのレコードレイアウトの一例を示す説明図である。つながり語句テーブル4Tは、検索キーワードテーブル3Tの感情表現語句(キーワード又は類似語)につながる語句と、点数とを対応付けて記憶するテーブルである。ここで感情表現語句につながる語句は、感情表現語句と係り受け関係にある語句であり、例えば感情表現語句を否定又は強調する助動詞、形容詞、副詞等である。 FIG. 5 is an explanatory diagram showing an example of the record layout of the connected word / phrase table 4T. The connected word / phrase table 4T is a table that stores words associated with emotion expression words / phrases (keywords or similar words) in the search keyword table 3T in association with points. Here, the phrase connected to the emotion expression phrase is a phrase having a dependency relationship with the emotion expression phrase, for example, an auxiliary verb, an adjective, an adverb or the like that denies or emphasizes the emotion expression phrase.
つながり語句テーブル4Tは、キーワード−類似語、つながり語句及び点数の各列を含む。キーワード−類似語は、検索キーワードテーブル3Tのキーワード、類似語1〜類似語5である。つながり語句は、感情表現語句につながる語句である。点数は、レビューの中に感情表現語句と、感情表現語句につながる語句とが含まれる場合に、検索キーワードテーブル3Tのキーワード又は類似語1〜類似語5に対応する数値を調整するための数値である。例えば、感情表現語句と、つながる語句との係り受け関係が否定である場合、つながり語句テーブル4Tの点数に負の数値が設定される。感情表現語句と、つながる語句との係り受け関係が肯定的な強調である場合、つながり語句テーブル4Tの点数に正の数値が設定される。なお、つながる語句が感情表現語句をぼかす語句又は曖昧にする語句である場合、点数に負の数値が設定されてもよい。
The connected phrase table 4T includes columns of keyword-similar word, connected phrase, and score. The keyword-similar words are keywords,
図6は、レビュー別スコアテーブル5Tのレコードレイアウトの一例を示す説明図である。レビュー別スコアテーブル5Tは、商品役務毎及びレビュー毎に、レビューに含まれるキーワード及び類似語に基づいて集計した数値を記憶するテーブルである。以下では、商品役務毎及びレビュー毎に集計した数値をスコアと呼ぶ。 FIG. 6 is an explanatory diagram showing an example of a record layout of the review-specific score table 5T. The review-specific score table 5 </ b> T is a table that stores numerical values that are tabulated based on keywords and similar words included in reviews for each product service and each review. Below, the numerical value totaled for every product service and every review is called a score.
レビュー別スコアテーブル5Tは、商品役務ID、レビューID、キーワード及びスコアの各列を含む。商品役務IDは、商品役務テーブル1Tの商品役務IDと同一である。レビューIDは、レビューテーブル2TのレビューIDと同一である。キーワードは、検索キーワードテーブル3Tのキーワードと同じである。スコアは、レビューに含まれるキーワード及び類似語に基づいて集計された数値である。 The review-specific score table 5T includes columns of product service ID, review ID, keyword, and score. The product service ID is the same as the product service ID in the product service table 1T. The review ID is the same as the review ID of the review table 2T. The keyword is the same as the keyword in the search keyword table 3T. The score is a numerical value calculated based on keywords and similar words included in the review.
図7は、ランキングテーブル6Tのレコードレイアウトの一例を示す説明図である。ランキングテーブルは、商品又は役務の評価ランキングを商品別又は役務別に記憶するテーブルである。 FIG. 7 is an explanatory diagram showing an example of the record layout of the ranking table 6T. The ranking table is a table that stores the evaluation ranking of products or services by product or service.
ランキングテーブル6Tは、順位、商品役務名、キーワード、総レビュー数及び総合スコアの各列を含む。順位は、総合スコアの降順を示す数字である。商品役務名は、評価の対象である商品又は役務の名称である。キーワードは、検索キーワードテーブル3Tのキーワードである。総レビュー数は、1つの商品又は役務を評価したレビューの総数である。総合スコアは、商品役務毎の各レビューのスコアの合計及び総レビュー数に基づいて算出された数値である。 The ranking table 6T includes columns of rank, product service name, keyword, total number of reviews, and total score. The rank is a number indicating the descending order of the overall score. The product / service name is the name of the product or service to be evaluated. The keyword is a keyword in the search keyword table 3T. The total number of reviews is the total number of reviews that evaluated one product or service. The total score is a numerical value calculated based on the total score of each review for each product service and the total number of reviews.
図8は、係り受け関係重み値ファイル1Fの内容の一例を示す説明図である。係り受け関係重み値ファイル1Fは、レビューに含まれている単語間に認められる係り受け関係の強さを数値化した重み値を記憶するファイルである。重み値は、単語間における一定のルールに基づいて評価ランキング装置10により生成される。例えば、重み値は、係り受け関係にある単語同士のレビューにおける隔たりが長いほど小さい値に設定される。
図8は、「この映画は喜劇なので泣けない」というレビュー例について生成された重み値を例示している。
FIG. 8 is an explanatory diagram showing an example of the contents of the dependency relationship
FIG. 8 exemplifies the weight value generated for the review example “This movie is a comedy and cannot be cryed”.
評価順位作成装置10は、商品又は役務に関する評価ランキングを作成する処理を実行する都度、係り受け関係重み値ファイル1Fを作成し、ハードディスク14に記憶する。つまり、係り受け関係重み値ファイル1Fは、作業用のファイルである。なお、係り受け関係重み値ファイル1Fは、例えば配列としてRAM13に記憶されてもよい。
The evaluation
図9は、評価順位作成装置10の機能構成例を示す機能ブロック図である。評価順位作成装置10の各機能部は、ハードディスク14に記憶されたプログラム1Pと、CPU11、RAM13等のハードウェア資源とが協働して動作することにより実現される。
FIG. 9 is a functional block diagram illustrating a functional configuration example of the evaluation
評価順位作成装置10は、記憶部20、収集部30、分割部40、算出部50、生成部60、集計部70、作成部80、受付部90及び変更部100を含む。
記憶部20は、ハードウェアのハードディスク14及びRAM13に対応する機能部である。記憶部20は、商品又は役務の評価ランキングを作成するために必要な各種テーブルを記憶している。また、記憶部20は、CPU11が作業用のデータを一時的に記憶するために使用される。
The evaluation
The
収集部30は、クラウド上から商品又は役務の評価に係る文書を収集するクローラに対応する機能部である。収集部30は、商品役務テーブル1Tを参照し、商品又は役務の名称が含まれたウェブページから、不特定多数の人が書き込んだレビューを収集し、収集したレビューをレビューテーブル2Tの書き込み文書に書き込む。本実施の形態では、レビューは映画の批評に係る文書である。
The
分割部40は、収集部30が収集したレビューを形態素解析により品詞分解する機能部である。分割部40は、商品又は役務別に、レビューテーブル2Tの書き込み文書からレビューを読み出し、読み出した文書を品詞に分割する。分割部40は、品詞すなわち単語に分割したレビューを記憶部20に記憶する。
The dividing
算出部50は、商品又は役務別かつレビュー別に、レビューのスコアを算出する機能部である。算出部50は、分割部40が分割したレビューの単語から検索キーワードテーブル3Tのキーワード及び類似語1〜5を検索する。算出部50は、レビューの単語から検索キーワードテーブル3Tのキーワード又は類似語1〜5を検索した場合、検索したキーワード又は類似語1〜5に対応する検索キーワードテーブル3Tの点数を抽出する。算出部50は、抽出した点数を用いて、商品又は役務別かつレビュー別のスコアを算出する。
The
次に、具体的なレビュー、キーワード及び類似語を例示して、算出部50がレビュー別スコアを算出する処理について説明する。
いま、レビューは、「この映画はとても泣けて涙が出た」であるものとする。このレビューを評価するためのキーワードは「泣ける」であり、キーワードの類似語は「涙」であるものとする。更に、検索キーワードテーブル3Tにおいて、キーワード「泣ける」と、類似語「涙」の点数は、夫々3点、2点であるものとする。
分割部40は、レビューを、「この」、「映画」、「は」、「とても」、「泣ける」、「て」、「涙」、「が」、「出る」、「た」の10品詞に分割する。
Next, a process in which the
The review now assumes that this movie was very crying and tearing. It is assumed that the keyword for evaluating this review is “cry” and the similar word of the keyword is “tears”. Further, in the search keyword table 3T, the score of the keyword “can cry” and the similar word “tears” are 3 points and 2 points, respectively.
The dividing
算出部50は、レビューにおける感情表現語句の割合を考慮し、次の式(1)を用いて、レビュー別スコアを算出する。
The
まず、算出部50は、式(1)の右辺の分子である品詞別点数合計を算出する。ただし、算出部50は、品詞別点数合計の算出に先立ち、キーワードに対応する点数を生成部60が生成した重み値を用いて調整する。上記の例の場合、算出部50は、3点(「泣ける」)と、2点(「涙」)とを加算する前に、「泣ける」の3点を生成部60が生成した重み値を用いて調整する。そこで、算出部50による品詞別点数合計の算出処理を説明する前に、生成部60について説明する。
First, the
生成部60は、係り受け関係重み値ファイル1Fを生成する機能部である。生成部60は、分割部40が分割したレビューの単語について、係り受け解析を実行し、一定のルールに従って単語と単語との組合せ毎に重み値を生成する。生成部60は、生成した組合せ毎の重み値を係り受け関係重み値ファイル1Fとして、記憶部20に記憶する。
The
算出部50は、キーワードに対応する点数を重み値により調整した調整値に変換する。具体的には、調整値=検索キーワードテーブル3Tの点数×つながり語句テーブル4Tの点数×係り受け関係重み値ファイル1Fの重み値である。
例えば、つながり語句テーブル4Tにおいて、キーワード−類似語=「泣ける」、つながり語句=「とても」、点数=1.2であるものとする(図5参照)。また、係り受け関係重み値ファイル1Fにおいて、「とても」と「泣ける」との組合せに対する重み値は、5点であるものとする。かかる場合、キーワード「泣ける」の調整値=3点(「泣ける」)×1.2点(「とても」)×5点(「とても」と「泣ける」との組合せに対する重み値)=18点となる。
なお、調整値は、つながり語句テーブル4Tの点数により、正の値になる場合と、負の値になる場合とがある。上記は、調整値が正の値である場合を例示している。
The
For example, in the connected word / phrase table 4T, it is assumed that the keyword-similar word = “cry”, the connected word = “very”, and the score = 1.2 (see FIG. 5). In the dependency relationship
The adjustment value may be a positive value or a negative value depending on the score of the connected word / phrase table 4T. The above illustrates the case where the adjustment value is a positive value.
算出部50は、キーワードに対応する調整値に、キーワードの類似語に対応する点数を加算して、品詞別点数合計を求める。上記の例における品詞別点数合計を次に示す。
品詞別点数合計=18点(「泣ける」の調整値)+2点(「涙」)=20点
The
Total score by part of speech = 18 points (adjusted value for “crying”) + 2 points (“tears”) = 20 points
式(1)に含まれるレビュー内総品詞数は10個なので、
レビュー内総品詞数+1=10+1=11
である。
従って、式(1)より、
レビュー別スコア=20/ln11=8.340648点
となる。
Since the total number of parts of speech included in the formula (1) is 10,
Total number of parts in review + 1 = 10 + 1 = 11
It is.
Therefore, from equation (1),
Review score = 20 / ln11 = 8.340648 points.
算出部50は、算出したレビュー別スコアを商品役務ID、レビューID及びキーワードと共に、レビュー別スコアテーブル5Tのスコア列に書き込む。
The
集計部70は、算出部50が算出したレビュー別スコアを、商品又は役務毎に集計する機能部である。集計部70は、レビューの総数を考慮し、次の式(2)を用いて、商品又は役務別スコアを集計する。
The totaling
式(2)における総レビュー数は、同一の商品又は役務を評価したレビューの総数であり、ランキングテーブル6Tにおける総レビュー数と同じである。商品又は役務別レビュー点数合計は、同一の商品又は役務を評価した各レビューのスコアを合計した数値である。集計部70は、レビュー別スコアテーブル5Tから、商品役務IDが同一であるスコアを集計して、商品又は役務別レビュー点数合計を求める。集計部70は、式(2)を用いて求めた商品又は役務別スコアを、ランキングテーブル6Tの総合スコアに書き込む。また、集計部70は、順位以外のランキングテーブル6Tの列(商品役務名、キーワード及び総レビュー数)にも、対応するデータを書き込む。
The total number of reviews in equation (2) is the total number of reviews that have evaluated the same product or service, and is the same as the total number of reviews in the ranking table 6T. The total number of reviews for each product or service is a numerical value obtained by adding up the scores of each review that evaluated the same product or service. The totaling
作成部80は、商品又は役務別の評価ランキングを作成する機能部である。具体的には作成部80は、ランキングテーブル6Tのレコードを、商品役務名毎に、総合スコアの降順に並べ替える機能部である。作成部80は、ランキングテーブル6Tにおいて並べ替えたレコードの順位列に総合スコアの降順に対応する数字を書き込む。
The
受付部90は、ハードウェアの操作部17又は通信部19に対応する機能部である。受付部90は、商品又は役務について実施された評価アンケートの結果に係る評価ランキングを受け付ける。ここでのアンケートは、街頭アンケート、ウェブを利用したアンケート、電話アンケート、郵便を利用したアンケート、店舗でのアンケート等を含む。
The
変更部100は、受付部90が受け付けた評価ランキングと、作成部80が作成した評価ランキングとを同一の商品又は役務について比較し、その比較結果に基づいて、作成部80が作成した評価ランキングを変更する機能部である。変更部100が実施する比較処理の1つは、例えばアンケートに基づく評価ランキングと、作成部80が作成した評価ランキングとの相関係数を算出することである。ここでの相関係数は、例えば一般的な相関係数、スピアマンの順位相関係数、ケンドールの順位相関係数等である。
The changing
変更部100は、算出した相関係数が一定値(例えば、0.7)以上である場合、作成部80が作成した評価ランキングを変更しない。他方、変更部100は、算出した相関係数が一定値以下である場合、作成部80が作成した評価ランキングと、アンケートに基づく評価ランキングとを比較し、作成部80が作成した評価ランキングを例えばより上位から変更する。
The
例えば変更部100は、作成部80が作成した評価ランキングについて、アンケートに基づく評価ランキングとの違いが生じているより上位の順位から、1ランクずつアンケートに基づく評価ランキングに近づく方向へ変更する。変更部100は、変更した評価ランキングと、アンケートに基づく評価ランキングとの相関係数を再び算出し、算出した相関係数が一定値以上になるまで、上記の変更と、相関係数の算出を繰り返す。変更部100は、算出した相関係数が一定値以上になった場合、評価ランキングの変更を停止し、変更を停止した評価ランキングを変更後の評価ランキングに決定する。
For example, the changing
次に、評価順位作成装置10の動作について説明する。
図10及び図11は、評価ランキング作成処理の手順の一例を示すフローチャートである。CPU11は、商品役務テーブル1Tを参照し、クラウド上から商品又は役務の評価に係る文書を収集する(ステップS101)。CPU11は、収集した文書をレビューテーブル2Tに書き込む(ステップS102)。CPU11は、レビューテーブル2Tのレコード数が一定値以上であるか否かを判定する(ステップS103)。
Next, the operation of the evaluation
10 and 11 are flowcharts illustrating an example of the procedure of the evaluation ranking creation process. The CPU 11 refers to the merchandise / service table 1T and collects documents related to the evaluation of the merchandise or service from the cloud (step S101). The CPU 11 writes the collected document in the review table 2T (step S102). The CPU 11 determines whether or not the number of records in the review table 2T is greater than or equal to a certain value (step S103).
CPU11は、レビューテーブル2Tのレコード数が一定値以上でないと判定した場合(ステップS103:NO)、ステップS101へ処理を戻す。CPU11は、レビューテーブル2Tのレコード数が一定値以上であると判定した場合(ステップS103:YES)、ステップS104へ処理を進める。CPU11は、ステップS101〜ステップS103の処理を繰り返し、レビューテーブル2Tのレコード数を一定値以上に増大させる。これにより、作成される評価ランキングの基となるレビュー数(サンプル数)の統計学的信頼性を保障することができる。 If the CPU 11 determines that the number of records in the review table 2T is not equal to or greater than a certain value (step S103: NO), the process returns to step S101. If the CPU 11 determines that the number of records in the review table 2T is equal to or greater than a certain value (step S103: YES), the process proceeds to step S104. CPU11 repeats the process of step S101-step S103, and increases the number of records of the review table 2T to a fixed value or more. Thereby, it is possible to guarantee the statistical reliability of the number of reviews (number of samples) that is the basis of the created evaluation ranking.
CPU11は、レビューを評価するための商品役務IDと、感情表現語句に係るキーワードとを受け付ける(ステップS104)。CPU11は、レビューテーブル2Tの先頭から、受け付けた商品役務IDに対応する未処理の書き込み文書に係るレビューを1件読み出す(ステップS105)。CPU11は、読み出したレビューを形態素解析により品詞分解する(ステップS106)。CPU11は、検索キーワードテーブル3TからステップS104で受け付けたキーワードに対応する類似語1〜類似語5を読み出す(ステップS107)。
CPU11 receives goods service ID for evaluating a review, and the keyword which concerns on an emotion expression phrase (step S104). The CPU 11 reads one review related to an unprocessed written document corresponding to the received product service ID from the top of the review table 2T (step S105). The CPU 11 decomposes the part of the read review by morphological analysis (step S106). The CPU 11 reads the
CPU11は、品詞分解したレビューの品詞から、受け付けたキーワード及び読み出した類似語1〜類似語5を検索し、検索に成功したか否かを判定する(ステップS108)。CPU11は、検索に成功しなかったと判定した場合(ステップS108:NO)、ステップS114へ処理を進める。CPU11は、検索に成功したと判定した場合(ステップS108:YES)、検索キーワードテーブル3Tからキーワード又は類似語に対応する点数を抽出する(ステップS109)。CPU11は、調整値算出処理を実行する(ステップS110)。調整値算出処理は、品詞別点数合計を算出するために、キーワードに対応する調整値を算出する処理である。
The CPU 11 searches the received keyword and the read
CPU11は、ステップS110で算出したキーワードに対応する調整値に、ステップS109で抽出したキーワードの類似語に対応する点数を加算して、品詞別点数合計を算出する(ステップS111)。CPU11は、品詞別点数合計、レビュー内総品詞数及び式(1)に基づいて、レビュー別スコアを算出する(ステップS112)。CPU11は、加減調整したレビュー別スコアをレビュー別スコアテーブル5Tのスコア列に書き込む(ステップS113)。 The CPU 11 calculates the total score for each part of speech by adding the score corresponding to the keyword similar word extracted in step S109 to the adjustment value corresponding to the keyword calculated in step S110 (step S111). The CPU 11 calculates a review-specific score based on the total score for each part of speech, the total number of parts of speech within the review, and the formula (1) (step S112). The CPU 11 writes the adjusted score by review in the score column of the review-specific score table 5T (step S113).
CPU11は、レビューテーブル2Tの全レコードを処理したか否かを判定する(ステップS114)。CPU11は、レビューテーブル2Tの全レコードを処理していないと判定した場合(ステップS114:NO)、ステップS105へ処理を戻す。CPU11は、レビューテーブル2Tの全レコードを処理したと判定した場合(ステップS114:YES)、レビュー別スコアテーブル5Tの内容、総レビュー数及び式(2)に基づいて、商品又は役務別スコアを算出する(ステップS115)。 The CPU 11 determines whether or not all the records in the review table 2T have been processed (step S114). If the CPU 11 determines that all the records in the review table 2T have not been processed (step S114: NO), the process returns to step S105. If the CPU 11 determines that all the records in the review table 2T have been processed (step S114: YES), the CPU 11 calculates a product or service-specific score based on the contents of the review-specific score table 5T, the total number of reviews, and formula (2). (Step S115).
CPU11は、算出した商品又は役務別スコアをランキングテーブル6Tの総合スコアの列に書き込む(ステップS116)。CPU11は、ステップS116において、順位以外の列にも該当するデータを書き込む。CPU11は、ランキングテーブル6Tのレコードを総合スコアの降順に並べ替える(ステップS117)。CPU11は、ランキングテーブル6Tにおいて並べ替えたレコードの順位列に総合スコアの降順に対応する数字を書き込み(ステップS118)、処理を終了する。 The CPU 11 writes the calculated product or service-specific score in the total score column of the ranking table 6T (step S116). In step S116, the CPU 11 writes corresponding data in columns other than the rank. The CPU 11 rearranges the records of the ranking table 6T in descending order of the total score (step S117). The CPU 11 writes numbers corresponding to the descending order of the total score in the rank sequence of the records rearranged in the ranking table 6T (step S118), and ends the process.
図12は、調整値算出処理の手順の一例を示すフローチャートである。
CPU11は、品詞分解したレビューの単語同士の組合せ毎に、係り受け関係の強度に応じた重み値を生成する(ステップS201)。CPU11は、生成した組合せ毎の重み値を係り受け関係重み値ファイル1Fとしてハードディスク14に記憶する(ステップS202)。
FIG. 12 is a flowchart illustrating an example of the procedure of the adjustment value calculation process.
CPU11 produces | generates the weight value according to the intensity | strength of dependency relation for every combination of the words of the review which carried out the part-of-speech decomposition (step S201). The CPU 11 stores the generated weight value for each combination in the
CPU11は、つながり語句テーブル4Tを参照して、ステップS104で受け付けたキーワードと、当該キーワードにつながる語句とが品詞分解したレビューの単語に含まれるか否かを判定する(ステップS203)。CPU11は、ステップS104で受け付けたキーワードと、当該キーワードにつながる語句とが、品詞分解したレビューの単語に含まれないと判定した場合(ステップS203:NO)、処理を終了する。CPU11は、ステップS104で受け付けたキーワードと、当該キーワードにつながる語句とが、品詞分解したレビューの単語に含まれると判定した場合(ステップS203:YES)、次の処理を実行する。すなわち、CPU11は、つながり語句テーブル4Tから、ステップS104で受け付けたキーワードと、当該キーワードにつながる語句とに対応する点数を抽出する(ステップS204)。 The CPU 11 refers to the connected phrase table 4T to determine whether or not the keyword accepted in step S104 and the phrase connected to the keyword are included in the review word partly decomposed (step S203). CPU11 complete | finishes a process, when it determines with the keyword received by step S104 and the phrase connected with the said keyword not being included in the word of the review which decomposed | disassembled the part of speech (step S203: NO). If the CPU 11 determines that the keyword received in step S104 and the phrase connected to the keyword are included in the word of review that has undergone part-of-speech decomposition (step S203: YES), the CPU 11 executes the following process. That is, the CPU 11 extracts, from the connected phrase table 4T, the score corresponding to the keyword received in step S104 and the phrase connected to the keyword (step S204).
CPU11は、ステップS104で受け付けたキーワードと、当該キーワードにつながる語句との組合せに対応する重み値を、係り受け関係重み値ファイル1Fから読み出す(ステップS205)。CPU11は、ステップS109で抽出したキーワードに対応する点数と、ステップS204で抽出したキーワード及び当該キーワードにつながる語句に対応する点数と、ステップ205で読み出した重み値との積を算出する(ステップS206)。CPU11は、算出した積を調整値に決定し(ステップS207)、処理を終了する。
The CPU 11 reads the weight value corresponding to the combination of the keyword received in step S104 and the phrase connected to the keyword from the dependency relationship
図13は、評価ランキング変更処理の手順の一例を示すフローチャートである。
CPU11は、商品又は役務について実施された評価アンケートの結果に係る評価ランキングを操作部17又は通信部19から受け付ける(ステップS301)。CPU11は、ステップS118で作成した評価ランキング又はステップS304で変更した評価ランキングと、受け付けたアンケートに係る評価ランキングとの相関係数を算出する(ステップS302)。ステップS302において、CPU11は、最初のループ(ステップS302〜ステップS304)では、ステップS118で作成した評価ランキングと、受け付けたアンケートに係る評価ランキングとの相関係数を算出する。ステップS302において、CPU11は、2回目以降のループ(ステップS302〜ステップS304)では、ステップS304で変更した評価ランキングと、受け付けたアンケートに係る評価ランキングとの相関係数を算出する。
FIG. 13 is a flowchart illustrating an example of the procedure of the evaluation ranking changing process.
CPU11 receives the evaluation ranking which concerns on the result of the evaluation questionnaire implemented about goods or service from the
CPU11は、算出した相関係数が一定値以上か否かを判定する(ステップS303)。CPU11は、算出した相関係数が一定値以上であると判定した場合(ステップS303:YES)、ステップS305へ処理を進める。CPU11は、算出した相関係数が一定値以上でないと判定した場合(ステップS303:NO)、ステップS302で相関係数を算出した対象の一つである、自身が作成した評価ランキングの一部を上位から変更し(ステップS304)、ステップS302へ処理を戻す。 The CPU 11 determines whether or not the calculated correlation coefficient is greater than or equal to a certain value (step S303). CPU11 advances a process to step S305, when it determines with the calculated correlation coefficient being more than a fixed value (step S303: YES). If the CPU 11 determines that the calculated correlation coefficient is not equal to or greater than a certain value (step S303: NO), the CPU 11 selects a part of the evaluation ranking created by itself, which is one of the targets for which the correlation coefficient has been calculated in step S302. Change from the upper level (step S304), and return the process to step S302.
CPU11は、ループ(ステップS302〜ステップS304)を抜け、ステップS303からステップS305へ進んだ評価ランキングを変更後の評価ランキングに決定し(ステップS305)、処理を終了する。 The CPU 11 exits the loop (steps S302 to S304), determines the evaluation ranking that has proceeded from step S303 to step S305 as the changed evaluation ranking (step S305), and ends the process.
ステップS303において、相関係数と比較される値は、一定である。しかし、ステップS303において、相関係数と比較される値は、一定でなくてもよい。例えば、2回目のループで相関係数と比較される値は、1回目のループで相関係数と比較される値より小さくてもよい。また、3回目のループで相関係数と比較される値は、2回目のループで相関係数と比較される値より小さくてもよい。これにより、評価順位作成装置10により変更される評価ランキングの変更程度を小さくすることができ、評価ランキング変更処理の所要時間を短くすることができる。
アンケートに係る評価ランキングと、クラウドから収集したレビューに基づく評価ランキングとは、元となるデータの違いを反映して異なる性質を有している。そのため、クラウドから収集したレビューに基づく評価ランキングを闇雲にアンケートに係る評価ランキングへ近づけるよりも、変更の程度を抑えた方が、クラウドから収集したレビューに基づく評価ランキングの性質を一定範囲内に維持することに資する。
In step S303, the value to be compared with the correlation coefficient is constant. However, the value to be compared with the correlation coefficient in step S303 may not be constant. For example, the value compared with the correlation coefficient in the second loop may be smaller than the value compared with the correlation coefficient in the first loop. The value compared with the correlation coefficient in the third loop may be smaller than the value compared with the correlation coefficient in the second loop. Thereby, the change degree of the evaluation ranking changed by the evaluation
The evaluation ranking according to the questionnaire and the evaluation ranking based on the reviews collected from the cloud have different properties reflecting the difference in the original data. Therefore, rather than bringing the evaluation ranking based on reviews collected from the cloud closer to the evaluation ranking related to the questionnaire to the dark clouds, the nature of the evaluation ranking based on the reviews collected from the cloud is kept within a certain range by suppressing the degree of change. To help.
上述の例では、評価順位作成装置10は、キーワードに対応する点数を調整して、レビュー別スコアを算出した。しかし、評価順位作成装置10は、キーワードに対応する点数を調整しなくてもよい。これにより、調整値を生成する処理がなくなる分だけ、評価順位作成装置10にかかる負荷を低減することができる。
In the above-described example, the evaluation
上述の例では、検索キーワードテーブル3Tの点数×つながり語句テーブル4Tの点数×係り受け関係重み値ファイル1Fの重み値を、キーワードの調整値とした。しかし、検索キーワードテーブル3Tの点数×つながり語句テーブル4Tの点数、又は検索キーワードテーブル3Tの点数×係り受け関係重み値ファイル1Fの重み値を、調整値としてもよい。これにより調整値を生成する処理が軽くなる分だけ、評価順位作成装置10にかかる負荷を低減することができる。
In the above-described example, the score value of the search keyword table 3T × the score of the connected word / phrase table 4T × the weight value of the dependency relationship
上述の例では、評価順位作成装置10は、レビューを品詞分解して、評価ランキングを作成した。しかし、評価順位作成装置10はレビューを句単位で分割してもよい。かかる場合、検索キーワードテーブル3T及びつながり語句テーブル4Tには、句単位で点数を設定する。また、係り受け関係重み値ファイル1Fには、句単位での係り受け関係の強度に応じた重み値を設定する。
In the above-described example, the evaluation
上述の例では、検索キーワードテーブル3Tの点数は、キーワード及び類似語毎に異なる点数が設定されていた。しかし、検索キーワードテーブル3Tの点数は、全て同一点でもよい。かかる場合、キーワードに対応する点数を調整する前の品詞別点数合計は、レビューに含まれるキーワード又は類似語の個数に比例する。 In the above example, the score of the search keyword table 3T is set to a different score for each keyword and similar word. However, the points in the search keyword table 3T may all be the same. In such a case, the total score for each part of speech before adjusting the score corresponding to the keyword is proportional to the number of keywords or similar words included in the review.
評価順位作成装置10は、レビュー内で省略された主語、目的語を補完する照応解析の手段を備えてもよい。省略された語句が、感情表現語句又は感情表現語句につながる語句である場合、省略された語句をレビューに対して補完した後に、評価ランキングを作成することにより、より精度の高い評価ランキングの作成が可能となる。
例えば、日本語では主語、目的語等の省略が頻繁に起こる。評価順位作成装置10が語句の省略を伴うレビューに対して形態素解析を実行した場合、品詞分解された品詞に省略語は含まれない。そこで、評価順位作成装置10は、公知の照応解析により省略された名詞句(ゼロ代名詞)をレビューに対して補完する。
The evaluation
For example, in Japanese, subjects, objects, etc. are frequently omitted. When the evaluation
評価順位作成装置10によれば、商品又は役務に関して信頼性の高い評価ランキングを作成することができる。
評価順位作成装置10はクラウド上から収集した多量のレビューに基づいて商品又は役務に関する評価ランキングを作成するため、作成された評価ランキングは高い統計学的信頼性と客観性とを有している。また、検索キーワードテーブル3Tに登録可能な感情表現語句の数に制限はないため、評価順位作成装置10は多種多様な「気持ち」、「テイスト」と整合する商品又は役務の評価ランキングを提供することができる。
According to the evaluation
Since the evaluation
評価順位作成装置10は、キーワードに対応する点数を、感情表現語句につながる否定語句又は強調語句の係り受け関係を考慮して調整することにより、レビュー別スコアを算出する。これにより、評価順位作成装置10は、商品又は役務に関してよりきめの細かい評価ランキングを作成することができる。
The evaluation
評価順位作成装置10は、商品又は役務に関するアンケートに基づく評価ランキングと、自身が作成した商品又は役務に関する評価ランキングとの相関を確認する。これにより、評価順位作成装置10が作成した評価ランキングの品質が担保される。一方、評価順位作成装置10は、相関が低い場合、自身が作成した商品又は役務に関する評価ランキングを修正することができる。
The evaluation
実施の形態2
実施の形態2は、評価順位作成装置10が作成した商品又は役務に関する評価ランキングをインターネット上で公開する形態に関する。
なお、実施の形態2において、実施の形態1と同様である構成要素には同一の参照番号を付してその詳細な説明を省略する。
The second embodiment relates to a form in which an evaluation ranking related to products or services created by the evaluation ranking creating
In the second embodiment, the same reference numerals are assigned to the same components as those in the first embodiment, and detailed description thereof is omitted.
図14は、商品又は役務に関する評価ランキング検索システム200のハードウェア構成例を示すブロック図である。評価ランキング検索システム200は、評価順位作成装置10、ウェブサーバ210及び端末装置220を含む。
FIG. 14 is a block diagram illustrating a hardware configuration example of the evaluation ranking
評価順位作成装置10は、実施の形態1における評価順位作成装置10と同じである。
ウェブサーバ210は、例えば汎用コンピュータ、ワークステーション、デスクトップ型PC等である。ウェブサーバ210は、評価順位作成装置10と専用回線1nで接続されている。また、ウェブサーバ210は、インターネット1Nと接続されている。
Evaluation
The
端末装置220は、デスクトップ型PC、ノートブック型PC、タブレット型PC、スマートフォン等である。端末装置220は、インターネット1Nと接続されている。図14では、3台の端末装置220が例として描かれているが、端末装置220の数は3台に限るものではなく、4台以上であってもよいことは勿論である。
なお、以下では、商品は映画の光ディスク1dであるものとする。
The
In the following, it is assumed that the product is a movie
端末装置220には、ブラウザがインストールされている。端末装置220は、ウェブサーバ210へキーワードと、ウェブページの情報の送信要求とを送信する。ウェブサーバ210は、端末装置220からキーワードと、ウェブページの情報の送信要求とを受信した場合、受信したキーワードと、商品が映画の光ディスク1dであることを示す情報とを、評価順位作成装置10へ送信する。
A browser is installed in the
評価順位作成装置10は、ウェブサーバ210からキーワードと、商品が映画の光ディスク1dであることを示す情報とを受信した場合、受信したキーワードに基づいて映画の光ディスク1dに関する評価ランキングを作成する。評価順位作成装置10は、作成した評価ランキングをウェブサーバ210へ送信する。ウェブサーバ210は、映画の光ディスク1dに関する評価ランキングを表示するウェブページの情報を生成し、生成したウェブページの情報を端末装置220へ送信する。
When receiving the keyword and the information indicating that the product is the movie
端末装置220は、映画の光ディスク1dに関する評価ランキングに係るウェブページの情報をウェブサーバ220から受信する。端末装置220は、送信した情報に基づいて、映画の光ディスク1dに関する評価ランキングに係るウェブページをブラウザの画面に表示する。
The
図15は、映画ランキング検索画面1fの画面レイアウトの一例を示す説明図である。映画ランキング検索画面1fは、キーワードに「どんでん返し」を指定して端末装置220からウェブサーバ210へ送信要求をした場合に、端末装置220のブラウザの画面に表示されるウェブページの一例である。図15に示す例のように、感情表現語句であるキーワードには、人の感性に訴える物語のストーリー展開と関係する語句が含まれてもよい。
FIG. 15 is an explanatory diagram showing an example of the screen layout of the movie ranking
映画ランキング検索画面1fは、テキストボックス1txt、検索ボタン1btn、評価ランキングリスト1lst、進むボタン2btn及び戻るボタン3btnを含む。
テキストボックス1txtは、感情表現語句に係るキーワードを入力するボタンである。検索ボタン1btnは、テキストボックス1txtに入力されたキーワードをパラメータに設定して、ウェブサーバ210へウェブページの情報の送信要求を送信するボタンである。
The movie ranking
A text box 1txt is a button for inputting a keyword related to an emotion expression phrase. The search button 1btn is a button for setting a keyword input in the text box 1txt as a parameter and transmitting a web page information transmission request to the
評価ランキングリスト1lstは、テキストボックス1txtに入力したキーワードに基づいて検索された映画の光ディスク1dのランキングをリスト表示する画面領域である。評価ランキングリスト1lstには、左から右へ向かって、検索された映画が順位の昇順に従って配列されている。評価ランキングリスト1lstに表示される各映画の情報は、例えば光ディスク1dのパッケージの画像、順位、総合スコア、映画の題名、代表的なレビュアーの名称、代表的なレビュアーのレビューに関するレビュー別スコアである。評価ランキングリスト1lstに表示される各映画の情報は、例えば代表的なレビュアーのレビュー(コメント)の一部、レビュー総数(クチコミ数)等である。
The evaluation ranking list 1lst is a screen area that displays a list of rankings of the
進むボタン2btnは、評価ランキングリスト1lstに、より下位の映画のランキングを表示させるボタンである。戻るボタン3btnは、評価ランキングリスト1lstに、より上位の映画のランキングを表示させるボタンである。 The forward button 2btn is a button for displaying the ranking of lower-order movies in the evaluation ranking list 1lst. The return button 3btn is a button for displaying the ranking of a higher-order movie in the evaluation ranking list 1lst.
上述の例では、評価順位作成装置10は、商品又は役務に関する評価ランキングを作成した。しかし、評価順位作成装置10は、レビュー別スコアを集計して総合スコアを算出するまでの処理を実行し、評価ランキングの作成をしなくてもよい。換言すれば、評価順位作成装置10は、ランキングテーブル6Tの商品役務名、キーワード、総レビュー数及び総合スコアに関するレコードを作成するまでの処理を実行すればよく、ランキングテーブル6Tでのレコードの並べ替えを実行しなくてもよい。また、評価順位作成装置10は、ランキングテーブル6Tへの順位の書き込みをしなくてもよい。
In the above-described example, the evaluation
かかる場合、評価ランキング検索システム200のウェブサーバ210は、端末装置220に対して、評価順位作成装置10が集計した商品又は役務の総合スコアに係るデータをダウンロードさせる。当該データは、例えば表計算ソフトのファイルである。ユーザは、ウェブサーバ210から端末装置220へダウンロードした商品又は役務の総合スコアに係るデータを、端末装置220にインストールされた表計算ソフトに読み込ませる。そして、ユーザは、表計算ソフトのソート機能を用いて、商品又は役務の評価ランキングを端末装置210に作成させる。
In such a case, the
評価順位作成装置10は、レビューテーブル2Tのレコードを一定のルールに従って削除する手段を有していてもよい。
評価順位作成装置10は、クラウド上のウェブサーバを巡回して商品又は役務に関するレビューを収集する。そのために、レビューテーブル2Tのレコード数は、時間の経過に伴い増大するため、ハードディスク14の使用可能な記憶容量の減少及び評価ランキング作成処理の実行時間の増大を招く。そこで、評価順位作成装置10は、一定のルールに従ってレビューテーブル2Tのレコードを削除することにより、上記の弊害を解消する。
ここでの一定のルールは、例えば直近から一定時間より古いレコードの削除である。古いレビューは最新ユーザの嗜好から離反している傾向があり、古いレビューに基づく評価ランキングは必ずしもユーザが要望する評価ランキングとは限らない。評価順位作成装置10は、レコードのタイムスタンプに基づいて、直近から一定時間より古いレコードをレビューテーブル2Tから削除する。
The evaluation
The evaluation
The certain rule here is, for example, deletion of records older than a certain time from the latest. Old reviews tend to depart from the preferences of the latest users, and the evaluation ranking based on old reviews is not necessarily the evaluation ranking desired by the user. Based on the time stamp of the record, the evaluation
評価順位作成装置10は、検索キーワードテーブル3Tのレコードを一定のルールに従って削除する手段を有していてもよい。
ここでの一定のルールは、評価ランキング検索システム200においてユーザが使用したキーワードの頻度が一定回数より少ないキーワードに対応するレコードの削除である。長年の運用にもかかわらず、端末装置220からウェブサーバ210へほとんど又は全く送信されないキーワードは、検索キーワードテーブル3Tから削除され、新たなキーワード及び類似語が検索キーワードテーブル3Tへ追加されるべきである。そのために、評価順位作成装置10のハードディスク14に端末装置220から送信されたキーワードの送信頻度を記憶するテーブル(以下、キーワード履歴テーブルと呼ぶ)を用意する。評価順位作成装置10は、ウェブサーバ210から送信されるキーワードに基づいて、キーワード履歴テーブルにおけるキーワードの送信頻度を更新する。評価順位作成装置10は、一定時間が経過した後、キーワードの送信頻度が一定回数以下であるキーワードを検出した場合、当該キーワードに対応する検索キーワードテーブル3Tのレコードを、検索キーワードテーブル3Tから削除する。
また、評価順位作成装置10は、当該キーワード及び/又は類似語に対応するつながり語句テーブル4Tのレコードを、つながり語句テーブル4Tから削除してもよい。
The evaluation
Here, the certain rule is to delete records corresponding to keywords that the user has used less frequently than a certain number of times in the evaluation ranking
Further, the evaluation
評価ランキング検索システム200によれば、ユーザはウェブサーバ210を介して自身が使用する端末装置220の画面に、評価順位作成装置10が作成した商品又は役務に関する評価ランキングを表示させることができる。
According to the evaluation ranking
開示された実施の形態は、全ての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上述の説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内での全ての変更が含まれることが意図される。 The disclosed embodiments are to be considered in all respects as illustrative and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the description above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.
また、各実施の形態で記載されている技術的特徴(構成要件)はお互いに組合せ可能であり、組み合わせすることにより、新しい技術的特徴を形成することができる。 Further, the technical features (components) described in each embodiment can be combined with each other, and a new technical feature can be formed by combining them.
10 評価順位作成装置
11 CPU(収集部、分割部、集計部、生成部、作成部、変更部)
13 RAM
14 ハードディスク
17 操作部(受付部)
19 通信部(受付部)
3T 検索キーワードテーブル(記憶部)
4T つながり語句テーブル(つながり語句記憶部)
1P プログラム
1F 係り受け関係重み値ファイル
10 evaluation rank creating device 11 CPU (collecting unit, dividing unit, totaling unit, generating unit, creating unit, changing unit)
13 RAM
14
19 Communication Department (Reception Department)
3T search keyword table (storage)
4T connection phrase table (connection phrase storage unit)
Claims (9)
商品又は役務の名称が記載されたウェブページに書き込まれた該商品又は役務の評価に係る文書をウェブサイトから収集する収集部と、
該収集部が収集した文書を語句に分割する分割部と、
感情表現語句に一致及び類似する語句並びに該語句に夫々対応する数値を各対応付けて予め記憶した記憶部と、
該記憶部の内容に基づいて、前記分割部が分割した語句に前記感情表現語句に一致又は類似する語句が含まれる場合、該語句に対応する数値を集計する集計部と
を備える
ことを特徴とする評価集計装置。 An evaluation and aggregation device that aggregates numerical values related to evaluation of goods or services based on documents collected from a website,
A collection unit that collects from the website a document relating to the evaluation of the goods or services written on the web page describing the names of the goods or services;
A dividing unit for dividing the document collected by the collecting unit into words;
A storage unit that pre-stores a word that matches and resembles the emotion expression word and a numerical value corresponding to the word respectively in advance,
A tabulation unit that counts numerical values corresponding to the words when the words divided by the dividing unit include words that match or are similar to the emotion expression words based on the contents of the storage unit, To evaluate and aggregate.
前記集計部は、前記分割部が分割した語句に前記感情表現語句及び該感情表現語句につながる語句が含まれる場合、前記つながり語句記憶部に記憶された感情表現語句及びつながる語句に対応する数値を用いて、前記記憶部に記憶された感情表現語句に対応する数値を調整して、集計するようにしてある
ことを特徴とする請求項1に記載の評価集計装置。 An emotional expression phrase stored in the storage unit, a phrase connected to the emotional expression phrase and a connected phrase storage unit stored in advance in association with numerical values;
The aggregation unit, when the phrase divided by the dividing unit includes the emotion expression phrase and the phrase connected to the emotion expression phrase, numerical values corresponding to the emotion expression phrase and the connected phrase stored in the connection phrase storage unit The evaluation totaling apparatus according to claim 1, wherein numerical values corresponding to emotion expression words and phrases stored in the storage unit are adjusted and totaled.
前記集計部は、前記分割部が分割した語句に前記感情表現語句及び該感情表現語句につながる語句が含まれる場合、前記つながり語句記憶部に記憶された感情表現語句及びつながる語句に対応する数値と、前記感情表現語句及びつながる語句の組合せに対して前記生成部が生成した重み値とを用いて、前記記憶部に記憶された感情表現語句に対応する数値を調整して、集計するようにしてある
ことを特徴とする請求項2に記載の評価集計装置。 For a combination of words divided by the dividing unit, a generation unit that generates a weight value according to the dependency relationship of words related to the combination,
When the words divided by the dividing unit include the emotion expression words and phrases connected to the emotion expression words, the counting unit includes a numerical value corresponding to the emotion expression words and connected words stored in the connection word storage unit; The weight value generated by the generation unit for the combination of the emotion expression phrase and the connected phrase is adjusted, and the numerical value corresponding to the emotion expression phrase stored in the storage unit is adjusted and aggregated. The evaluation tabulation apparatus according to claim 2, wherein
ことを特徴とする請求項2又は請求項3に記載の評価集計装置。 The evaluation totaling apparatus according to claim 2 or 3, wherein a phrase connected to an emotion expression phrase stored in the connection phrase storage unit is a negative phrase or an emphasized phrase for the emotion expression phrase.
該評価集計装置の集計部が集計した数値に基づいて、前記商品又は役務の評価順位を作成する作成部と
を備える
ことを特徴とする評価順位作成装置。 The evaluation tabulation apparatus according to any one of claims 1 to 4,
An evaluation rank creating apparatus comprising: a creation section that creates an evaluation rank of the product or service based on numerical values collected by the counting section of the evaluation aggregation apparatus.
ことを特徴とする請求項5に記載の評価順位作成装置。 6. The evaluation rank creating apparatus according to claim 5, wherein the creation section creates the evaluation rank based on the number of documents collected for each product or service by the collection section.
該受付部が受け付けた評価順位及び前記作成部が作成した評価順位を比較して、該作成部が作成した評価順位を変更する変更部と
を備える
ことを特徴とする請求項5又は請求項6に記載の評価順位作成装置。 A reception unit for receiving evaluation ranks of products or services based on a questionnaire;
The evaluation unit received by the reception unit and the evaluation rank created by the creation unit are compared, and a change unit that changes the evaluation rank created by the creation unit is provided. The evaluation ranking creation device described in 1.
商品又は役務の名称が記載されたウェブページに書き込まれた該商品又は役務の評価に係る文書をウェブサイトから収集し、
収集した前記文書を語句に分割し、
感情表現語句に一致及び類似する語句並びに該語句に夫々対応する数値を各対応付けて予め記憶した記憶部の内容に基づいて、分割した前記語句に前記感情表現語句に一致又は類似する語句が含まれる場合、該語句に対応する数値を集計する
ことを特徴とする評価集計方法。 An evaluation tabulation method for tabulating numerical values related to evaluation of products or services based on documents collected from a website,
Collect from the website documents related to the evaluation of the goods or services written on the web page containing the name of the goods or services;
Divide the collected documents into words,
Based on the contents of the storage unit preliminarily stored in association with numerical values corresponding to the respective phrases that match and are similar to the emotion expression words, the divided phrases include words that match or are similar to the emotion expression words If it is, an evaluation tabulation method characterized in that a numerical value corresponding to the word is tabulated.
商品又は役務の名称が記載されたウェブページに書き込まれた該商品又は役務の評価に係る文書をウェブサイトから収集し、
収集した前記文書を語句に分割し、
感情表現語句に一致及び類似する語句並びに該語句に夫々対応する数値を各対応付けて予め記憶した前記記憶部の内容に基づいて、分割した前記語句に前記感情表現語句に一致又は類似する語句が含まれる場合、該語句に対応する数値を集計する
処理をコンピュータに実行させることを特徴とするプログラム。 A program for causing a computer having a storage unit to execute a process of aggregating numerical values related to evaluation of goods or services based on documents collected from a website,
Collect from the website documents related to the evaluation of the goods or services written on the web page containing the name of the goods or services;
Divide the collected documents into words,
Based on the contents of the storage unit that pre-stores the words that match and are similar to the emotion expression words and the numerical values that respectively correspond to the words, the words that match or are similar to the emotion expression words are included in the divided words If included, a program that causes a computer to execute a process of aggregating numerical values corresponding to the words.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013168707A JP2015036923A (en) | 2013-08-14 | 2013-08-14 | Assessment collection device, assessment ranking preparation device, method for assessment collection and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013168707A JP2015036923A (en) | 2013-08-14 | 2013-08-14 | Assessment collection device, assessment ranking preparation device, method for assessment collection and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015036923A true JP2015036923A (en) | 2015-02-23 |
Family
ID=52687378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013168707A Pending JP2015036923A (en) | 2013-08-14 | 2013-08-14 | Assessment collection device, assessment ranking preparation device, method for assessment collection and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015036923A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017049639A (en) * | 2015-08-31 | 2017-03-09 | 富士通株式会社 | Evaluation program, procedure manual evaluation method, and evaluation device |
JP2018067834A (en) * | 2016-10-20 | 2018-04-26 | 株式会社マクロミル | Investigation system and investigation method |
JP2019211829A (en) * | 2018-05-31 | 2019-12-12 | 富士通株式会社 | Real estate evaluation program, real estate evaluation method and real estate evaluation device |
WO2022181399A1 (en) * | 2021-02-25 | 2022-09-01 | 学校法人東洋大学 | Method for generating emotional expression phrase dictionary, method for analyzing emotion in sentences, emotional expression phrase dictionary, program, and system |
CN115907935A (en) * | 2023-01-09 | 2023-04-04 | 北京长城电子商务有限公司 | Online auxiliary review system |
-
2013
- 2013-08-14 JP JP2013168707A patent/JP2015036923A/en active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017049639A (en) * | 2015-08-31 | 2017-03-09 | 富士通株式会社 | Evaluation program, procedure manual evaluation method, and evaluation device |
JP2018067834A (en) * | 2016-10-20 | 2018-04-26 | 株式会社マクロミル | Investigation system and investigation method |
JP2019211829A (en) * | 2018-05-31 | 2019-12-12 | 富士通株式会社 | Real estate evaluation program, real estate evaluation method and real estate evaluation device |
WO2022181399A1 (en) * | 2021-02-25 | 2022-09-01 | 学校法人東洋大学 | Method for generating emotional expression phrase dictionary, method for analyzing emotion in sentences, emotional expression phrase dictionary, program, and system |
CN115907935A (en) * | 2023-01-09 | 2023-04-04 | 北京长城电子商务有限公司 | Online auxiliary review system |
CN115907935B (en) * | 2023-01-09 | 2023-05-30 | 北京长城电子商务有限公司 | Online auxiliary review system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Riaz et al. | Opinion mining on large scale data using sentiment analysis and k-means clustering | |
US10650059B2 (en) | Enhanced online user-interaction tracking | |
US9880997B2 (en) | Inferring type classifications from natural language text | |
US8352455B2 (en) | Processing a content item with regard to an event and a location | |
Atoum | Computer and Information Sciences | |
US9135350B2 (en) | Computer-generated sentiment-based knowledge base | |
US10558666B2 (en) | Systems and methods for the creation, update and use of models in finding and analyzing content | |
KR101100830B1 (en) | Entity searching and opinion mining system of hybrid-based using internet and method thereof | |
JP6506439B1 (en) | INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND INFORMATION PROCESSING PROGRAM | |
JP5442401B2 (en) | Behavior information extraction system and extraction method | |
JP2015036923A (en) | Assessment collection device, assessment ranking preparation device, method for assessment collection and program | |
Al Qundus et al. | Exploring the impact of short-text complexity and structure on its quality in social media | |
US20140101293A1 (en) | Apparatus and method for providing issue record, and generating issue record | |
US9020962B2 (en) | Interest expansion using a taxonomy | |
EP2613275B1 (en) | Search device, search method, search program, and computer-readable memory medium for recording search program | |
JP6289989B2 (en) | User emotion analysis apparatus and program for product | |
KR101074820B1 (en) | Recommendation searching system using internet and method thereof | |
JP2006318398A (en) | Vector generation method and device, information classifying method and device, and program, and computer readable storage medium with program stored therein | |
KR20120003834A (en) | Entity searching and opinion mining system of hybrid-based using internet and method thereof | |
KR101105798B1 (en) | Apparatus and method refining keyword and contents searching system and method | |
JP2016162357A (en) | Analysis device and program of user's emotion to product | |
JP2019185769A (en) | Information processor, information processing method and information processing program | |
JP2011100191A (en) | Device, method, and program for retrieving document | |
US20140012854A1 (en) | Method or system for semantic categorization | |
CN115048483A (en) | Information management system |