JP2019212083A - Information providing apparatus, information providing method, and program - Google Patents
Information providing apparatus, information providing method, and program Download PDFInfo
- Publication number
- JP2019212083A JP2019212083A JP2018108399A JP2018108399A JP2019212083A JP 2019212083 A JP2019212083 A JP 2019212083A JP 2018108399 A JP2018108399 A JP 2018108399A JP 2018108399 A JP2018108399 A JP 2018108399A JP 2019212083 A JP2019212083 A JP 2019212083A
- Authority
- JP
- Japan
- Prior art keywords
- review
- document
- word
- occurrence
- frequent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 17
- 238000012552 review Methods 0.000 claims abstract description 240
- 238000011156 evaluation Methods 0.000 claims description 79
- 238000003860 storage Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 13
- 230000005611 electricity Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 235000019504 cigarettes Nutrition 0.000 description 6
- 238000004140 cleaning Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 238000009795 derivation Methods 0.000 description 3
- 230000004308 accommodation Effects 0.000 description 2
- 230000003670 easy-to-clean Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、情報提供装置、情報提供方法、およびプログラムに関する。 The present invention relates to an information providing apparatus, an information providing method, and a program.
従来、商品に対するユーザレビューを含む情報を分析して、個々の商品の用途と特性とを抽出し、抽出した用途と特性とを関連付け、ユーザによって用途が選択されると、選択された用途に関連付けた特性に基づいて、選択された用途との関連の深さに応じて商品のランク付けを行い、上位にランク付けされた商品の一覧を出力する技術が知られている(例えば、特許文献1参照)。 Traditionally, information including user reviews on products is analyzed to extract the usage and characteristics of each product, associate the extracted usage with characteristics, and when the usage is selected by the user, it is associated with the selected usage A technology is known that ranks products according to the depth of association with a selected application based on the characteristics and outputs a list of products ranked higher (for example, Patent Document 1). reference).
しかしながら、従来の技術では、ユーザにとって必ずしも有用ではない他のユーザのレビュー文書を閲覧するようにレコメンドする場合があった。 However, in the conventional technique, there is a case where a recommendation is made so as to browse a review document of another user that is not necessarily useful to the user.
本発明は、上記の課題に鑑みてなされたものであり、ユーザにとってより役に立つことが想定されるレビュー文書を提供することができる情報提供装置、情報提供方法、およびプログラムを提供することを目的としている。 The present invention has been made in view of the above problems, and an object thereof is to provide an information providing apparatus, an information providing method, and a program capable of providing a review document that is expected to be more useful to a user. Yes.
本発明の一態様は、レビュー文書と、前記レビュー文書とは異なる参照文書とのうち、少なくとも前記参照文書に基づいて、前記レビュー文書のサマリーを生成する生成部と、前記生成部により生成された前記サマリーを含むコンテンツを端末装置に提供するコンテンツ提供部と、を備える情報提供装置である。 One aspect of the present invention is a generation unit that generates a summary of the review document based on at least the reference document out of a review document and a reference document different from the review document, and the generation unit generates the review document A content providing unit that provides a content including the summary to a terminal device.
本発明の一態様によれば、ユーザにとってより役に立つことが想定されるレビュー文書を提供することができる。 According to one aspect of the present invention, a review document that is expected to be more useful to a user can be provided.
以下、本発明を適用した情報提供装置、情報提供方法、およびプログラムを、図面を参照して説明する。 Hereinafter, an information providing apparatus, an information providing method, and a program to which the present invention is applied will be described with reference to the drawings.
[概要]
情報提供装置は、一以上のプロセッサにより実現される。情報提供装置は、レビュー文書と、レビュー文書とは異なる参照文書とのうち、少なくとも参照文書に基づいて、レビュー文書のサマリーを生成する。
[Overview]
The information providing apparatus is realized by one or more processors. The information providing apparatus generates a summary of the review document based on at least the reference document among the review document and the reference document different from the review document.
レビュー文書とは、ショッピングサイトなどで販売される商品またはサービスや、ホテルなどの宿泊施設、観光地、株を売買可能な企業、アニメや映画などのコンテンツ、祭りや花火大会などのイベント、といった特定の対象に対するユーザの感想や批評、意見、報告などを表した電子文書である。 Review documents are specific items such as products or services sold at shopping sites, accommodation facilities such as hotels, sightseeing spots, companies that can buy and sell stocks, content such as animation and movies, and events such as festivals and fireworks displays. This is an electronic document that expresses the user's impressions, reviews, opinions, reports, etc.
参照文書とは、ユーザの質問に対して回答が提供されるサービスを利用して、ユーザが第3者(例えば検索エンジンや不特定多数のユーザ)に向けて質問したときに、その質問内容を示す単語や語句が含まれる電子文書である。例えば、ユーザが検索サービスを利用した場合、参照文書には、ユーザが入力したクエリが含まれる。また、例えば、ユーザが知識共有サービスを利用した場合、参照文書には、知識共有サービスに対してユーザが投稿した文章が含まれる。知識共有サービスとは、質問と回答とが組み合わされた情報が不特定多数のユーザによって共有可能(閲覧可能)なサービスである。 A reference document is a service that provides an answer to a user's question. This is an electronic document containing the indicated word or phrase. For example, when the user uses a search service, the reference document includes a query input by the user. For example, when the user uses the knowledge sharing service, the reference document includes a sentence posted by the user to the knowledge sharing service. The knowledge sharing service is a service in which information in which a question and an answer are combined can be shared (viewed) by an unspecified number of users.
情報提供装置は、レビュー文書のサマリーを生成すると、そのサマリーを含むコンテンツを、ユーザが利用する端末装置(外部装置)に提供する。サマリーを含むコンテンツは、例えば、ショッピングサイトなどで商品のレビュー文書が掲載されるようなウェブページである。これによって、複数のレビュー文書のうち、ユーザにとってより役に立つことが想定されるレビュー文書を提供することができる。 When the information providing device generates a summary of the review document, the information providing device provides content including the summary to a terminal device (external device) used by the user. The content including the summary is, for example, a web page on which a product review document is posted on a shopping site or the like. This makes it possible to provide a review document that is expected to be more useful to the user among a plurality of review documents.
[第1実施形態]
[全体構成]
以下、第1実施形態について説明する。図1は、第1実施形態における情報提供装置100を含む情報提供システム1の一例を示す図である。第1実施形態における情報提供システム1は、例えば、一以上の端末装置10と、情報提供装置100とを備える。これらの装置は、ネットワークNWを介して接続される。
[First Embodiment]
[overall structure]
The first embodiment will be described below. FIG. 1 is a diagram illustrating an example of an
図1に示す各装置は、ネットワークNWを介して種々の情報を送受信する。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、プロバイダ端末、無線通信網、無線基地局、専用回線などを含む。なお、図1に示す各装置の全ての組み合わせが相互に通信可能である必要はなく、ネットワークNWは、一部にローカルなネットワークを含んでもよい。 Each apparatus shown in FIG. 1 transmits and receives various information via the network NW. The network NW includes, for example, the Internet, a WAN (Wide Area Network), a LAN (Local Area Network), a provider terminal, a wireless communication network, a wireless base station, a dedicated line, and the like. Note that it is not necessary for all combinations of the devices shown in FIG. 1 to be able to communicate with each other, and the network NW may partially include a local network.
端末装置10は、例えば、スマートフォンなどの携帯電話、タブレット端末、各種パーソナルコンピュータなどの、入力装置、表示装置、通信装置、記憶装置、および演算装置を備える端末装置である。通信装置は、NIC(Network Interface Card)などのネットワークカード、無線通信モジュールなどを含む。端末装置10では、ウェブブラウザやアプリケーションプログラムなどのUA(User Agent)が起動し、ユーザの入力操作に応じたリクエストを情報提供装置100に送信する。また、UAが起動された端末装置10は、情報提供装置100から取得した情報に基づいて、表示装置に各種画像を表示させる。
The
[情報提供装置の構成]
図2は、第1実施形態における情報提供装置100の構成の一例を示す図である。図示のように、情報提供装置100は、例えば、通信部102と、制御部110と、記憶部130とを備える。
[Configuration of Information Providing Device]
FIG. 2 is a diagram illustrating an example of the configuration of the
通信部102は、例えば、NIC等の通信インターフェースを含む。通信部102は、ネットワークNWを介して、端末装置10などと通信する。例えば、通信部102は、ウェブブラウザなどのUAが起動した端末装置10と通信し、端末装置10からリクエストを受信する。
The
制御部110は、例えば、コンテンツ提供部112と、辞書生成部114と、サマリー生成部116とを備える。
The
制御部110の構成要素は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等のハードウェアプロセッサ(あるいはプロセッサ回路)が、記憶部130に記憶されたプログラム(ソフトウェア)を実行することにより実現される。また、これらの複数の構成要素のうち一部または全部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)等のハードウェア(回路部:circuitry)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。また、上記のプログラムは、予め記憶部130に格納されていてもよいし、DVDやCD−ROMなどの着脱可能な記憶媒体に格納されており、記憶媒体が情報提供装置100のドライブ装置に装着されることで記憶媒体から記憶部130にインストールされてもよい。
For example, a hardware processor (or processor circuit) such as a CPU (Central Processing Unit) or a GPU (Graphics Processing Unit) executes a program (software) stored in the
記憶部130は、例えば、HDD(Hard Disc Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)などの記憶装置により実現される。記憶部130には、ファームウェアやアプリケーションプログラムなどの各種プログラムの他に、レビュー文書情報132や参照文書情報134などが格納される。レビュー文書情報132は、上述した複数のレビュー文書が含まれる情報であり、参照文書情報134は、上述した参照文書が含まれる情報である。
The
コンテンツ提供部112は、通信部102が端末装置10からリクエストを受信した場合、通信部102を制御して、リクエストに応じた情報を端末装置10に提供する。例えば、通信部102が、ウェブブラウザがUAとして起動された端末装置10からHTTPリクエストを受信した場合、コンテンツ提供部112は、その端末装置10にウェブページを提供してよい。また、例えば、通信部102が、アプリケーションがUAとして起動された端末装置10からAPIリクエストを受信した場合、コンテンツ提供部112は、その端末装置10にコンテンツを提供してよい。
When the
図3は、コンテンツ提供部112により提供されるウェブページの一例を示す図である。図示の例では、インターネット上において商品を販売するショッピングサイトやオークションサイト、フリーマーケットサイト等のウェブサイト(以下、総称して販売サイトと称する)のウェブページを模式的に示している。例えば、販売サイトのウェブページの領域R1には、商品の画像やタイトル、価格、カート投入ボタンなどが表示され、領域R2には、レビュー文書のサマリーが表示され、領域R3には、レビュー文書が一覧形式で表示される。領域R2に示すサマリーは、後述するサマリー生成部116によって生成される。これについては後述する。なお、図3の例では、販売サイトにレビュー文書のサマリーが表示されるものとして説明したがこれに限られず、例えば、宿泊施設の予約サイトや、観光地の情報サイト、株や仮想通貨などのファイナンスに関する情報交換サイトなどのように、ユーザが作成したレビュー文書が一覧として表示されるようなウェブサイトであれば如何なるウェブサイトであってもよい。また、これらのウェブサイトは、携帯電話などにインストールされたアプリケーションプログラムによって実現されてもよい。
FIG. 3 is a diagram illustrating an example of a web page provided by the
[辞書生成部の処理フロー]
辞書生成部114は、サマリー生成部116がサマリーを生成する際に利用する辞書を生成する。以下、辞書生成部114による一連の処理の流れをフローチャートに即して説明する。図4は、辞書生成部114による一連の処理の流れを示すフローチャートである。本フローチャートの処理は、例えば、所定の周期で繰り返し行われてよい。
[Processing flow of dictionary generator]
The
まず、辞書生成部114は、例えば、販売サイトに掲載される商品の分類先の候補となる複数のカテゴリの中から、対象とする一つのカテゴリ(以下、対象カテゴリと称する)を選択する(S100)。
First, for example, the
次に、辞書生成部114は、選択した対象カテゴリに分類される全商品のレビュー文書を、記憶部130に格納されたレビュー文書情報132から取得する(S102)。レビュー文書情報132には、例えば、レビューの対象が販売サイトで販売される商品である場合、ファッションや家電、食品、オーディオ、家具、ゲーム、スポーツといった複数のカテゴリ(商品カテゴリ)の其々に分類されている各商品に対する一つ以上のレビュー文書が含まれる。例えば、辞書生成部114は、「家電」のカテゴリを対象カテゴリとして選択した場合、レビュー文書情報132に含まれる複数のレビュー文書の中から、「家電」に分類される、テレビ、洗濯機、空気清浄機、掃除機、冷蔵庫といった各商品に対するレビュー文書を取得する。
Next, the
次に、辞書生成部114は、取得したレビュー文書を、高評価のレビュー文書を集めた高評価レビュー群と低評価のレビュー文書を集めた低評価レビュー群とに分類する(S104)。
Next, the
図5は、レビュー文書を分類する処理を模式的に示す図である。図示のように、レビュー文書には、レビュー対象に対する評価が高いほど大きく、レビュー対象に対する評価が低いほど小さい評点が対応付けられている。この評点は、例えば、最低点(例えば0.0)から最高点(例えば5.0)の範囲内でユーザによって任意に設定される。そのため、例えば、辞書生成部114は、図示のように、ある第1閾値(例えば4.0)以上の評点が対応付けられたレビュー文書を高評価レビュー群に分類し、第1閾値よりも小さい第2閾値(例えば2.0)以下の評点が対応付けられたレビュー文書を低評価レビュー群に分類してよい。なお、第1閾値と第2閾値とは同じ値であってもよい。また、辞書生成部114は、評点が対応付けられたレビュー文書を3つ以上のレビュー群に分類してもよい。高評価レビュー群に分類するレビュー文書は、「第1レビュー文書」の一例であり、低評価レビュー群に分類するレビュー文書は、「第2レビュー文書」の一例である。
FIG. 5 is a diagram schematically illustrating a process of classifying review documents. As shown in the figure, the review document is associated with a higher score as the evaluation with respect to the review object is higher, and with a lower rating as the evaluation with respect to the review object is lower. This score is arbitrarily set by the user, for example, within a range from the lowest score (for example, 0.0) to the highest score (for example, 5.0). Therefore, for example, as shown in the figure, the
次に、辞書生成部114は、分類した高評価レビュー群と低評価レビュー群との其々から、頻出ワードを抽出する(S106)。頻出ワードとは、レビュー文書において頻出するワード(単語)またはフレーズ(語句)である。例えば、各レビュー群において出現回数が閾値以上のワードやフレーズ、或いは出現回数が多い上位所定数のワードやフレーズを頻出ワードとしてよい。以下、高評価レビュー群から抽出された頻出ワードを「第1頻出ワード」と称し、低評価レビュー群から抽出された頻出ワードを「第2頻出ワード」と称して説明する。
Next, the
図6は、第1頻出ワードおよび第2頻出ワードの一例を示す図である。図示の例では、「家電」というカテゴリの更に下位カテゴリである「空気清浄機」に分類される商品(すなわち対象カテゴリが「空気清浄機」)に対して付与されたレビュー文書から得られた頻出ワードを表している。例えば、高評価レビュー群からは、第1頻出ワードとして、「迅速」や「安い」、「早い」といったワードが抽出されており、低評価レビュー群からは、第2頻出ワードとして、「値段」や「音」、「不良品」といったワードが抽出されている。なお、図示の例のように、「価格」や「対応」といったように、高評価レビュー群と低評価レビュー群との双方で互いに同じワード(あるいはフレーズ)が頻出している場合、第1頻出ワードおよび第2頻出ワードの双方に同じワードが含まれていてよい。 FIG. 6 is a diagram illustrating an example of the first frequent word and the second frequent word. In the illustrated example, frequent occurrences obtained from review documents given to products classified as “air purifiers”, which are lower categories of the category “home appliances” (that is, the target category is “air purifiers”). Represents a word. For example, words such as “rapid”, “cheap”, and “early” are extracted as the first frequent words from the high evaluation review group, and “price” as the second frequent words from the low evaluation review group. And words such as “sound” and “defective product” are extracted. As shown in the example, when the same word (or phrase) appears frequently in both the high evaluation review group and the low evaluation review group such as “price” and “correspondence”, the first frequent appearance The same word may be included in both the word and the second frequent word.
次に、辞書生成部114は、記憶部130に格納された参照文書情報134が示す参照文書から、共起ワードを抽出する(S108)。共起ワードとは、高評価レビュー群と低評価レビュー群との其々から抽出した複数の頻出ワードのうち、参照文書において、対象カテゴリを示すキーワードと共起する頻出ワードである。例えば、対象カテゴリが「空気清浄機」である場合、その対象カテゴリを表す「空気清浄機」が対象カテゴリを示すキーワードとなる。
Next, the
図7は、共起ワードの一例を示す図である。図示の例では、参照文書が検索サイトなどに入力されたクエリのログ(複数のクエリの集合)であることを表している。このように参照文書がクエリのログであり、対象カテゴリを表すキーワードが「空気清浄機」である場合、辞書生成部114は、例えば、「空気清浄機」と共にスペースや句読点などを間に挟んで同時に入力された単語や語句を共起ワードとして抽出する。図示の例では、「掃除」、「タバコ」、「臭い」、「フィルター」といった単語が共起ワードとして抽出される。
FIG. 7 is a diagram illustrating an example of a co-occurrence word. In the illustrated example, the reference document is a log of a query (set of a plurality of queries) input to a search site or the like. As described above, when the reference document is a query log and the keyword representing the target category is “air cleaner”, the
なお、上述した例では、参照文書がクエリのログであるものとして説明したがこれに限られない。例えば、あるユーザが質問すると第3者が回答を投稿するような知識共有サービスが存在する場合、参照文書は、知識共有サービスに対して投稿された質問の内容を表す文章であってもよい。 In the example described above, the reference document is described as a query log, but the present invention is not limited to this. For example, when there is a knowledge sharing service in which a third person posts an answer when a user asks a question, the reference document may be a sentence representing the content of a question posted to the knowledge sharing service.
次に、辞書生成部114は、抽出した頻出ワードおよび共起ワードに基づいて、高評価レビュー用の辞書(以下、高評価用辞書Daと称する)と、低評価レビュー用の辞書(以下、低評価用辞書Dbと称する)とを生成する(S110)。
Next, based on the extracted frequent words and co-occurrence words, the
例えば、辞書生成部114は、高評価レビュー群から抽出した頻出ワードを集めた辞書(以下、高評価頻出ワード辞書)と、低評価レビュー群から抽出した頻出ワードを集めた辞書(以下、低評価頻出ワード辞書)と、参照文書から抽出した共起ワードを集めた辞書(以下、共起ワード辞書)とを生成する。なお、辞書生成部114は、「音も静か」や「音が静か」とのように、頻出ワードや共起ワードをフレーズとして抽出する場合、これらのフレーズが助詞や接頭語などを除けば目的語と述語が本質的に同義語であるため、助詞や接頭語などの違い(文字の揺れ)を無視し、同じフレーズであるものとして辞書に登録してよい。
For example, the
次に、辞書生成部114は、販売サイトに掲載される商品の分類先の候補となる全てのカテゴリについて、高評価頻出ワード辞書、低評価頻出ワード辞書、および共起ワード辞書を生成したか否かを判定し(S112)、全てのカテゴリについて辞書を生成していないと判定した場合、対象カテゴリを他のカテゴリに変更して、上述したS100の処理に戻り、新たに辞書を生成する。
Next, whether or not the
一方、辞書生成部114は、全てのカテゴリについて辞書を生成したと判定した場合、すなわち、商品の分類先の候補となる全てのカテゴリの其々について辞書を生成した場合、本フローチャートの処理を終了する。
On the other hand, if the
[サマリー生成部の処理フロー]
制御部110のサマリー生成部116は、辞書生成部114によって辞書が生成されると、その辞書を利用して、レビュー文書情報132に含まれる複数のレビュー文書の中から、図3に例示するようなウェブページのサマリーを生成する。以下、サマリー生成部116による一連の処理の流れをフローチャートに即して説明する。図8は、サマリー生成部116による一連の処理の流れを示すフローチャートである。本フローチャートの処理は、例えば、レビュー文書情報132の更新周期に合せて繰り返し行われてよい。
[Processing flow of summary generator]
When the
まず、サマリー生成部116は、辞書生成部114によって生成された高評価頻出ワード辞書、低評価頻出ワード辞書、および共起ワード辞書を利用して、レビュー文書情報132に含まれる各レビュー文書について、頻出ワードおよび共起ワードの出現頻度(出現回数)を導出する(S200)。
First, the
例えば、サマリー生成部116は、対象とするレビュー文書においてレビューされている商品のカテゴリと同じ辞書を利用して、頻出ワードおよび共起ワードの出現頻度を導出する。より具体的には、出現頻度の導出対象とするレビュー文書が、「食品」というカテゴリに分類される商品に対するレビュー文書である場合、サマリー生成部116は、辞書生成部114によって生成された複数の辞書の中から、「食品」というカテゴリを対象カテゴリとすることで生成された辞書を選択し、選択した辞書を利用して、出現頻度の導出対象とするレビュー文書から、頻出ワードおよび共起ワードの出現頻度を導出する。
For example, the
図9は、レビュー文書における頻出ワードの出現頻度の結果の一例を示す図である。図示の例では、高評価頻出ワード辞書に登録された複数の第1頻出ワードのうち、「音」という第1頻出ワードについては、高評価レビュー群において、出現回数が74回であり、低評価頻出ワード辞書に登録された複数の第2頻出ワードのうち、「匂い」という第2頻出ワードについては、低評価レビュー群において、出現回数が5回であることを表している。すなわち、高評価のレビュー文書における第1頻出ワードの全出現回数466回のうち、「音」の出現回数が74回であることを表しており、低評価のレビュー文書におけるにおける第2頻出ワードの全出現回数49回のうち、「匂い」の出現回数が5回であることを表している。この場合、例えば、サマリー生成部116は、「音」という第1頻出ワードの出現頻度を、74/466として導出し、「匂い」という第2頻出ワードの出現頻度を、5/49として導出する。
FIG. 9 is a diagram illustrating an example of a result of the appearance frequency of a frequent word in a review document. In the illustrated example, among the plurality of first frequent words registered in the highly evaluated frequent word dictionary, the first frequent word “sound” has an appearance count of 74 times in the highly evaluated review group, and is low rated. Of the plurality of second frequent words registered in the frequent word dictionary, the second frequent word “scent” indicates that the number of appearances is five in the low evaluation review group. That is, it represents that the number of appearances of “sound” is 74 times out of the total number of
図10は、レビュー文書における共起ワードの出現頻度の結果の一例を示す図である。図示の例では、高評価レビュー群において、共起ワード辞書に登録された複数の共起ワードのうち「掃除」という共起ワードについては、出現回数が21451回であり、「タバコ」という共起ワードについては、出現回数が13850回であり、「臭い」という共起ワードについては、出現回数が13186回であることを表している。この場合、サマリー生成部116は、「掃除」という共起ワードの高評価レビュー群における出現頻度を、21451/122879として導出し、「タバコ」という共起ワードの高評価レビュー群における出現頻度を、13850/122879として導出し、「臭い」という共起ワードの高評価レビュー群における出現頻度を、13186/122879として導出する。
FIG. 10 is a diagram illustrating an example of a result of the appearance frequency of co-occurrence words in a review document. In the illustrated example, the co-occurrence word “cleaning” out of a plurality of co-occurrence words registered in the co-occurrence word dictionary in the high evaluation review group has 21451 occurrences, and “co-occurrence” “cigarette”. For the word, the number of appearances is 13850, and for the co-occurrence word “odor”, the number of appearances is 13186. In this case, the
また、図示の例では、低評価レビュー群において、共起ワード辞書に登録された複数の共起ワードのうち「臭い」という共起ワードについては、出現回数が13186回であり、「フィルター」という共起ワードについては、出現回数が12269回であり、「電気代」という共起ワードについては、出現回数が5364回であることを表している。この場合、サマリー生成部116は、「臭い」という共起ワードの低評価レビュー群における出現頻度を、13186/47113として導出し、「フィルター」という共起ワードの低評価レビュー群における出現頻度を、12269/47113として導出し、「電気代」という共起ワードの低評価レビュー群における出現頻度を、5364/47113として導出する。
In the illustrated example, the co-occurrence word “odor” among the plurality of co-occurrence words registered in the co-occurrence word dictionary in the low evaluation review group has an appearance count of 13186 and is referred to as “filter”. For the co-occurrence word, the number of appearances is 12269, and for the co-occurrence word “electricity cost”, the number of appearances is 5364. In this case, the
次に、サマリー生成部116は、導出した頻出ワードの出現頻度および共起ワードの出現頻度に基づいて、各商品のレビュー文書に含まれるワードごとにスコアを導出する(S202)。例えば、サマリー生成部116は、数式(1)に基づいて、頻出ワードの出現回数と、共起ワードの出現回数との重み付き平均をスコア(Score(i,c,kw))として導出する。この場合、頻出ワードとして出現しやすく、且つ共起ワードとしても出現しやすいワードほどスコアが大きくなる。
Next, the
例えば、レビュー文書において、ショッピングサイトなどで販売される商品またはサービスをレビューの対象としている場合、式中のiは、各商品(または各サービス)を表す。また、cは、カテゴリを表しており、kwは、レビュー文書に含まれる頻出ワードまたは共起ワードを表している。また、FrqR(i)は、ある商品iのレビュー数を表し、FrqR(i,kw)は、頻出ワードまたは共起ワードが出現する商品iのレビュー数を表している。また、例えば、参照文書がクエリのログである場合、FrqQ(c)は、参照文書に出現するクエリのうち、カテゴリを表すキーワード(例えば「空気清浄機」といったワード)を含むクエリの総数を表し、FrqQ(c,kw)は、参照文書に出現するクエリのうち、カテゴリを表すキーワードと頻出ワードまたは共起ワードとを含むクエリの数を表している。αは、重みを表す係数であり、例えば、FrqR(i)/FrqQ(c)といった係数であってよい。なお、数式(1)は、重み付き平均をスコアとして導出する導出式であるものとして説明したがこれに限られず、例えば、相乗平均や調和平均、或いはその他の総計的指標値をスコアとして導出するものであってもよい。 For example, in a review document, when a product or service sold on a shopping site or the like is a subject of review, i in the formula represents each product (or each service). Further, c represents a category, and kw represents a frequent word or a co-occurrence word included in the review document. FrqR (i) represents the number of reviews for a certain product i, and FrqR (i, kw) represents the number of reviews for the product i in which a frequent word or co-occurrence word appears. Further, for example, when the reference document is a query log, FrqQ (c) represents the total number of queries including a keyword representing a category (for example, a word such as “air purifier”) among queries appearing in the reference document. , FrqQ (c, kw) represents the number of queries including a keyword representing a category and a frequent word or co-occurrence word among queries appearing in the reference document. α is a coefficient representing a weight, and may be a coefficient such as FrqR (i) / FrqQ (c), for example. In addition, although Formula (1) demonstrated as what is a derivation type | formula which derives | leads-out a weighted average as a score, it is not restricted to this, For example, a geometric average, a harmonic average, or another aggregated index value is derived as a score. It may be a thing.
また、サマリー生成部116は、共起ワードの出現頻度のみに基づいて、各商品のレビュー文書に含まれるワードごとにスコアを導出してもよい。この場合、サマリー生成部116は、例えば、FrqQ(c,kw)/FrqQ(c)をスコアとして導出する。
Further, the
図11は、スコアの導出結果の一例を示す図である。図示の例では、高評価レビュー群において、第1頻出ワードおよび共起ワードの集合に含まれる複数のワードのうち、「コンパクト」というワードが最もスコアが大きく、「音」というワードが2番目にスコアが大きく、「価格」というワードが3番目にスコアが大きいことを表している。また、図示の例では、低評価レビュー群において、第2頻出ワードおよび共起ワードの集合に含まれる複数のワードのうち、「臭い」というワードが最もスコアが大きく、「電気代」というワードが2番目にスコアが大きく、「匂い」というワードが3番目にスコアが大きいことを表している。 FIG. 11 is a diagram illustrating an example of a score derivation result. In the illustrated example, in the high evaluation review group, the word “compact” has the highest score and the word “sound” has the second highest score among the plurality of words included in the set of first frequent words and co-occurrence words. The score is large, and the word “price” represents the third highest score. In the illustrated example, in the low evaluation review group, the word “odor” has the highest score among the plurality of words included in the set of second frequent words and co-occurrence words, and the word “electricity cost” The second largest score, and the word “odor” represents the third largest score.
次に、サマリー生成部116は、スコアが大きい上位所定数のワード(頻出ワードまたは共起ワード)を選択する(S204)。例えば、所定数が3である場合において、図11に例示するスコア結果の場合、サマリー生成部116は、高評価レビュー群については「コンパクト」、「音」、「価格」というワードを選択し、低評価レビュー群については「臭い」、「電気代」、「匂い」というワードを選択する。
Next, the
次に、サマリー生成部116は、選択したワードが頻出ワードや共起ワードとして出現するレビュー文書のサマリーを生成する(S206)。例えば、サマリー生成部116は、高評価レビュー群について、「コンパクト」、「音」、「価格」という3つのワードを選択した場合、高評価レビュー群に含まれる複数のレビュー文書のうち、「コンパクト」が出現するレビュー文書の集合と、「音」が出現するレビュー文書の集合と、「価格」が出現するレビュー文書の集合とを含むサマリーを、高評価レビューについて纏めたサマリー(高評価用サマリーと称する)として生成する。同様に、サマリー生成部116は、低評価レビュー群について、「臭い」、「電気代」、「匂い」という3つのワードを選択した場合、低評価レビュー群に含まれる複数のレビュー文書のうち、「臭い」が出現するレビュー文書の集合と、「電気代」が出現するレビュー文書の集合と、「匂い」が出現するレビュー文書の集合とを含むサマリーを、低評価レビューについて纏めたサマリー(低評価用サマリーと称する)として生成する。これによって本フローチャートの処理が終了する。高評価用サマリーは、「第1サマリー」の一例であり、低評価用サマリーは、「第2サマリー」の一例である。
Next, the
上述したコンテンツ提供部112は、サマリー生成部116によって高評価サマリーおよび低評価サマリーが生成されると、高評価サマリーおよび低評価サマリーが含まれるウェブページ(例えば図3に示すようなウェブページ)を生成する。そして、コンテンツ提供部112は、通信部102によってレビュー文書を掲載するウェブページのリクエストが受信されると、通信部102を制御して、リクエスト元の端末装置10に、生成した高評価サマリーおよび低評価サマリーを含むウェブページをレスポンスとして送信する。例えば、コンテンツ提供部112は、図3の領域R2のレビューサマリーにおいて、高評価用サマリーを「良かったところ」として表示させ、低評価用サマリーを「悪かったところ」として表示させたウェブページを送信してよい。
When the high evaluation summary and the low evaluation summary are generated by the
また、コンテンツ提供部112は、高評価用サマリーおよび低評価用サマリーを表示させる際に、各ワードに対応付けられた複数のレビュー文書の件数と、それら複数のレビュー文書の中で代表的なレビュー文書に出現するワードやフレーズとを表示させてよい。代表的なレビュー文書は、例えば、閲覧数が最も多いレビュー文書であってもよいし、他のユーザからレビューが参考になったと報告された回数が最も多いレビュー文書であってもよい。
Further, when displaying the high evaluation summary and the low evaluation summary, the
例えば、高評価レビュー群から抽出されたスコアが大きい上位所定数のワードの中に「音」というワードが含まれている場合、コンテンツ提供部112は、高評価レビュー群に含まれる複数のレビュー文書のうち、「音」というワードが頻出ワードや共起ワードとして出現するレビュー文書の数を件数として表示し、更に、「音」というワードが出現する複数のレビュー文書の中で代表的なレビュー文書のタイトルや要約文などを表示してよい。図3の例では、「音」というワードが出現するレビュー文書の件数が「74件」であることを表し、「音」というワードが出現する複数のレビュー文書の中で代表的なレビュー文書のタイトルや要約文が「音も静か」ということを表している。
For example, when the word “sound” is included in the top predetermined number of words having a large score extracted from the high evaluation review group, the
また、コンテンツ提供部112は、代表的なレビュー文書のタイトルなどに、各サマリーに含めたレビュー文書を一覧として表示するウェブページのURL(Uniform Resource Locator)をハイパーリンクとして対応付けてもよい。すなわち、コンテンツ提供部112は、各サマリーとして纏められたレビュー文書が閲覧可能なURL等が対応付けられた文字や画像をコンテンツに含め、そのコンテンツを端末装置10に提供する。
Further, the
図12は、ハイパーリンク先のウェブページの一例を示す図である。図示の例では、「良かったところ(高評価用サマリー)」において、「掃除も簡単」という文字列がクリック操作やタップ操作された場合の遷移先のウェブページを表している。このような場合、コンテンツ提供部112は、ハイパーリンク先のウェブページに、高評価レビュー群の中で、「掃除」というワードが頻出ワードまたは共起ワードとして出現するレビュー文書を一覧として掲載してよい。これによって、ユーザは、複数のレビュー文書の中から興味のあるレビュー文書を取捨選択せずとも、サマリーの中のハイパーリンクが対応付けられた各ワードをクリックやタップすることで、興味のあるレビュー文書が個別に集計され、一覧形式で表示されたページにアクセスすることができる。
FIG. 12 is a diagram illustrating an example of a hyperlink destination web page. In the example shown in the drawing, the web page of the transition destination when the character string “easy to clean” is clicked or tapped in “good place (high evaluation summary)” is shown. In such a case, the
以上説明した第1実施形態によれば、レビュー文書と、レビュー文書とは異なる参照文書とのうち、少なくとも参照文書に基づいて、レビュー文書のサマリーを生成し、生成したレビュー文書のサマリーを含むウェブページなどをコンテンツとしてユーザの端末装置10に提供することによって、ユーザにとってより役に立つことが想定されるレビュー文書を提供することができる。
According to the first embodiment described above, a review document and a reference document that is different from the review document are generated based on at least the reference document, and a web including the generated review document summary is generated. By providing a page or the like as content to the
一般的に、ユーザは、購入したい商品などのカタログスペック等に加えて、実際に使用してみて初めわかる使用感について検索サイトや知識共有サイトなどを利用して調べる傾向がある。このような場合、商品の使用感について検索した際にクエリとして入力された単語や語句こそが、実際にユーザが気にしていることを端的に表していると見做すことができる。そのため、本実施形態のように、検索サイトに入力されたクエリのログや、知識共有サイトに投稿された質問文章などを含む参照文書を基にレビュー文書を解析することで、真にユーザが知りたい情報が掲載されたレビュー文書をサマリーとして提供することができる。これによって、レビュー文書を参考にするユーザが増え、実際に購入した商品が想定していたものと違うというようなミスマッチを解消することができ、商品の返品率などを低下させることができる。この結果、商品を販売する店舗側(小売業者側)が負担する、配送料や返品交換にかかる費用などを抑えることができるため、販売サイトに新規出店する事業者や、出店を継続する事業者の数を増加させることができる。 In general, in addition to catalog specifications for products to be purchased, etc., users tend to use a search site, a knowledge sharing site, or the like to find a feeling of use that can be first understood when actually used. In such a case, it can be considered that the words or phrases input as a query when searching for the feeling of use of the product directly represent what the user actually cares about. For this reason, as in this embodiment, the user really knows by analyzing a review document based on a reference document including a query log input to a search site or a question sentence posted on a knowledge sharing site. Review documents with the information you want can be provided as a summary. As a result, the number of users who refer to the review document is increased, and mismatches such that the actually purchased product is different from what is assumed can be eliminated, and the return rate of the product can be reduced. As a result, the store side (retailer side) that sells the product can reduce the delivery fee and the cost of return exchange, etc., so the business operator who opens a new store on the sales site or the business operator who continues to open the store The number of can be increased.
また、上述した第1実施形態によれば、レビュー文書をサマリーとして提供するため、レビュー文書の可読性を向上させることができる。例えば、ユーザがスマートフォンなどの画面のサイズが小さい端末装置10を利用して販売サイトなどを閲覧する場合、端末装置10の画面のサイズによって全てのレビュー文書を表示することが制約されることで、一部のレビュー文書しか表示されない場合がある。このような場合、ユーザのレビュー文書の可読性が低下しやすい。これに対して、本実施形態では、ユーザが使用感などを調べる際に入力されやすいクエリなどを共起ワードとし、その共起ワードの出現頻度に基づいて選択したレビュー文書をサマリーとして提供するため、レビュー文書の可読性を向上させることができる。この結果、ユーザは、参考になるレビュー文書を見つけやすくなり、レビュー文書が一覧形式で表示されるようなウェブサイトの利便性を向上させることができる。
Further, according to the first embodiment described above, since the review document is provided as a summary, the readability of the review document can be improved. For example, when a user browses a sales site or the like using the
<第2実施形態>
以下、第2実施形態について説明する。第2実施形態では、サマリーに含めるレビュー文書を強調表示する点で上述した第1実施形態と相違する。以下、第1実施形態との相違点を中心に説明し、第1実施形態と共通する点については説明を省略する。なお、第2実施形態の説明において、第1実施形態と同じ部分については同一符号を付して説明する。
Second Embodiment
Hereinafter, a second embodiment will be described. The second embodiment is different from the first embodiment described above in that the review document included in the summary is highlighted. Hereinafter, differences from the first embodiment will be mainly described, and description of points common to the first embodiment will be omitted. In the description of the second embodiment, the same parts as those in the first embodiment will be described with the same reference numerals.
第2実施形態におけるサマリー生成部116は、頻出ワードの出現頻度および共起ワードの出現頻度に基づいて、各商品のレビュー文書に含まれるワードごとにスコア(以下、第1スコアと称する)を導出すると共に、頻出ワードの出現頻度に基づいて、各商品のレビュー文書に含まれるワードごとにスコア(以下、第2スコアと称する)を導出する。例えば、サマリー生成部116は、FrqR(i,kw)/FrqR(i)を第2スコアとして導出してよい。すなわち、サマリー生成部116は、各レビュー群において出現頻度が大きいワードほど第2スコアを大きくする。
The
そして、サマリー生成部116は、第1スコアが大きい上位所定数のワードが出現するレビュー文書のサマリーを生成すると共に、第2スコアが大きい上位所定数のワードが出現するレビュー文書のサマリーを生成する。
Then, the
第2実施形態におけるコンテンツ提供部112は、第1スコアを基に選択したレビュー文書のサマリーと、第2スコアを基に選択したレビューのサマリーとを比較し、比較対象の2つのサマリーの一部または全部のレビュー文書が異なる場合、第1スコアに基づくサマリーにおいて、第2スコアに基づくサマリーのレビュー文書と異なるレビュー文書を強調表示する。
In the second embodiment, the
図13は、第2スコアに基づくサマリーの一例を示す図である。また、図14は、第1スコアに基づくサマリーの一例を示す図である。図13に例示したサマリーの「良かったところ(高評価用サマリー)」には、「音」、「コンパクト」、「価格」、「安い」、「小さい」という、高評価レビュー群において出現頻度の大きい上位5つのワードを含むレビュー文書が含められている。これに対して、図14に例示したサマリーの「良かったところ(高評価用サマリー)」には、「音」、「コンパクト」、「価格」という、高評価レビュー群において出現頻度の大きい上位3つのワードを含むレビュー文書に加えて、「安い」や「小さい」といったワードに比べて出現頻度が小さい「タバコ」および「掃除」というワードを含むレビュー文書が含められている。 FIG. 13 is a diagram illustrating an example of a summary based on the second score. FIG. 14 is a diagram illustrating an example of a summary based on the first score. In the “good place (summary for high evaluation)” of the summary illustrated in FIG. 13, the appearance frequency in the high evaluation review group of “sound”, “compact”, “price”, “cheap”, and “small” is displayed. A review document containing the top five large words is included. On the other hand, the “good place (high evaluation summary)” of the summary illustrated in FIG. 14 has the top three appearance frequencies of “sound”, “compact”, and “price” having the highest appearance frequency. In addition to a review document that includes two words, review documents that include the words “cigarette” and “clean” that appear less frequently than words such as “cheap” and “small” are included.
また、図13に例示したサマリーの「悪かったところ(低評価用サマリー)」には、「匂い」、「壊れる」、「ファン」、「異音」、「わからない」という、低評価レビュー群において出現頻度の大きい上位5つのワードを含むレビュー文書が含められている。これに対して、図14に例示したサマリーの「悪かったところ(低評価用サマリー)」には、「匂い」、「壊れる」、「ファン」という、低評価レビュー群において出現頻度の大きいワードを含むレビュー文書に加えて、「臭い」や「電気代」といった必ずしも出現頻度が大きくないワードを含むレビュー文書が含められている。 Further, the “bad place (summary for low evaluation)” of the summary illustrated in FIG. 13 includes “smell”, “break”, “fan”, “abnormal noise”, and “not sure” in the low evaluation review group. A review document including the top five words having the highest appearance frequency is included. On the other hand, in the “bad place (summary for low evaluation)” of the summary illustrated in FIG. 14, words having a high appearance frequency in the low evaluation review group such as “smell”, “break”, and “fan” are included. In addition to the review document including the review document, a review document including a word such as “smell” or “electricity cost” that does not necessarily occur frequently is included.
このような場合、コンテンツ提供部112は、図14に例示したサマリーにおいて、図13に例示したサマリーと異なるレビュー文書を強調表示する。図13および図14の例では、コンテンツ提供部112は、「良かったところ(高評価用サマリー)」では、「タバコ」というワードが出現する代表的なレビュー文書のタイトル「タバコを吸う」を強調表示し、「掃除」というワードが出現する代表的なレビュー文書のタイトル「掃除も簡単」を強調表示する。より具体的には、コンテンツ提供部112は、代表的なレビュー文書のタイトルを示す文字列に下線を付与したり、その文字列の文字を大きくしたり、色を変えたりすることで、強調表示してよい。また、コンテンツ提供部112は、「悪かったところ(低評価用サマリー)」では、「臭い」というワードが出現する代表的なレビュー文書のタイトル「臭い」を強調表示し、「電気代」というワードが出現する代表的なレビュー文書のタイトル「電気代がかかる」を強調表示する。
In such a case, the
以上説明した第2実施形態によれば、レビュー文書間で頻出する頻出ワードの出現頻度を基にレビュー文書のサマリーを生成した場合と比べて、レビュー文書間で頻出する頻出ワードと、参照文書内でカテゴリを示すキーワードと共起する共起ワードとを総合的に考慮してレビュー文書のサマリーを生成した場合とで、サマリー間のレビュー文書が異なる場合、異なるレビュー文書を強調表示することで、件数が少なく他のレビュー文書に埋もれてしまいやすい有用な(役に立つ)レビュー文書であっても、ユーザに閲覧するよう促すことができる。 According to the second embodiment described above, compared to the case where a summary of review documents is generated based on the appearance frequency of frequent words that frequently appear between review documents, the frequent words that appear frequently between review documents and the reference document When review document summaries are generated by comprehensively considering category keywords and co-occurrence words, and if review documents differ between summaries, highlight different review documents, Even a useful (useful) review document that has a small number of cases and is easily buried in another review document can prompt the user to browse.
<ハードウェア構成>
上述した実施形態の情報提供装置100は、例えば、図15に示すようなハードウェア構成により実現される。図15は、実施形態の情報提供装置100のハードウェア構成の一例を示す図である。
<Hardware configuration>
The
情報提供装置100は、NIC100−1、CPU100−2、RAM100−3、ROM100−4、フラッシュメモリやHDDなどの二次記憶装置100−5、およびドライブ装置100−6が、内部バスあるいは専用通信線によって相互に接続された構成となっている。ドライブ装置100−6には、光ディスクなどの可搬型記憶媒体が装着される。二次記憶装置100−5、またはドライブ装置100−6に装着された可搬型記憶媒体に格納されたプログラムがDMAコントローラ(不図示)などによってRAM100−3に展開され、CPU100−2によって実行されることで、制御部110が実現される。制御部110が参照するプログラムは、ネットワークNWを介して他の装置からダウンロードされてもよい。
The
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何ら限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 As mentioned above, although the form for implementing this invention was demonstrated using embodiment, this invention is not limited to such embodiment at all, In the range which does not deviate from the summary of this invention, various deformation | transformation and substitution Can be added.
1…情報提供システム、10…端末装置、100…情報提供装置、102…通信部、110…制御部、112…コンテンツ提供部、114…辞書生成部、116…レビュー生成部、130…記憶部
DESCRIPTION OF
Claims (10)
前記生成部により生成された前記サマリーを含むコンテンツを端末装置に提供するコンテンツ提供部と、
を備える情報提供装置。 A generation unit that generates a summary of the review document based on at least the reference document among the review document and a reference document different from the review document;
A content providing unit that provides the terminal device with content including the summary generated by the generating unit;
An information providing apparatus comprising:
請求項1に記載の情報提供装置。 The reference document includes a question content of a user using a service that provides an answer to the question.
The information providing apparatus according to claim 1.
前記質問内容には、
前記サービスに前記検索サービスが含まれる場合、前記検索サービスに対してユーザが入力したクエリが含まれ、
前記サービスに前記知識共有サービスが含まれる場合、前記知識共有サービスに対してユーザが質問として投稿した文章が含まれる、
請求項2に記載の情報提供装置。 The services include a search service, or a knowledge sharing service that allows a combination of questions and answers to be shared by an unspecified number of users.
The question content includes
If the service includes the search service, a query entered by a user for the search service is included,
When the knowledge sharing service is included in the service, a sentence posted by a user as a question to the knowledge sharing service is included.
The information providing apparatus according to claim 2.
レビュー対象が同じ前記複数のレビュー文書の其々について、前記参照文書において前記レビュー対象を表すキーワードと共起する共起ワードの出現頻度を導出し、
少なくとも前記導出した共起ワードの出現頻度に基づいて、前記サマリーを生成する、
請求項1から3のうちいずれか1項に記載の情報提供装置。 The generator is
For each of the plurality of review documents having the same review target, the frequency of appearance of a co-occurrence word that co-occurs with the keyword representing the review target in the reference document is derived,
Generating the summary based at least on the frequency of occurrence of the derived co-occurrence word;
The information providing device according to any one of claims 1 to 3.
前記複数のレビュー文書間において頻出する頻出ワードを導出し、
レビュー対象が同じ前記複数のレビュー文書の其々について、前記頻出ワードの出現頻度を導出し、
前記頻出ワードの出現頻度と前記共起ワードの出現頻度とに基づいて、前記サマリーを生成する、
請求項4に記載の情報提供装置。 The generation unit further includes:
Deriving frequent words that frequently appear between the plurality of review documents,
Deriving the appearance frequency of the frequent word for each of the plurality of review documents having the same review target,
Generating the summary based on the frequency of appearance of the frequent words and the frequency of occurrence of the co-occurrence words;
The information providing apparatus according to claim 4.
前記頻出ワードには、前記複数のレビュー文書のうち、第1閾値以上の前記評点が対応付けられた第1レビュー文書において頻出する第1頻出ワードと、前記第1閾値よりも小さい第2閾値以下の前記評点が対応付けられた第2レビュー文書において頻出する第2頻出ワードとが含まれ、
前記生成部は、
前記第1レビュー文書から、前記第1頻出ワードの出現頻度と前記共起ワードの出現頻度とを導出すると共に、前記第2レビュー文書から、前記第2頻出ワードの出現頻度と前記共起ワードの出現頻度とを導出し、
前記導出した前記第1頻出ワードの出現頻度と前記共起ワードの出現頻度とに基づいて、前記第1レビュー文書のサマリーを生成し、
前記導出した前記第2頻出ワードの出現頻度と前記共起ワードの出現頻度とに基づいて、前記第2レビュー文書のサマリーを生成する、
請求項5に記載の情報提供装置。 Each of the plurality of review documents is associated with a higher score for a review object and a smaller score for a lower evaluation for the review object,
The frequent word includes a first frequent word that frequently appears in a first review document associated with the score that is equal to or higher than a first threshold among the plurality of review documents, and a second threshold that is smaller than the first threshold. A second frequent word that frequently appears in the second review document associated with the score of
The generator is
The appearance frequency of the first frequent word and the appearance frequency of the co-occurrence word are derived from the first review document, and the appearance frequency of the second frequent word and the occurrence frequency of the co-occurrence word are derived from the second review document. Deriving the appearance frequency,
Generating a summary of the first review document based on the derived appearance frequency of the first frequent word and the appearance frequency of the co-occurrence word;
Generating a summary of the second review document based on the derived appearance frequency of the second frequent word and the appearance frequency of the co-occurrence word;
The information providing apparatus according to claim 5.
前記第2頻出ワードの出現頻度と前記共起ワードの出現頻度との重み付き平均が大きい上位所定数の前記第2レビュー文書を含むサマリーを、前記第2レビュー文書のサマリーとして生成する、
請求項6に記載の情報提供装置。 The generation unit uses, as a summary of the first review document, a summary including the upper predetermined number of the first review documents having a large weighted average of the appearance frequency of the first frequent words and the appearance frequency of the co-occurrence words. Generate
Generating a summary including the second predetermined number of second review documents having a large weighted average of the appearance frequency of the second frequent word and the appearance frequency of the co-occurrence word as a summary of the second review document;
The information providing apparatus according to claim 6.
前記第1レビュー文書のサマリーと前記第2レビュー文書のサマリーとを含む前記コンテンツを、前記端末装置に提供する、
請求項6または7に記載の情報提供装置。 The content providing unit
Providing the content including the summary of the first review document and the summary of the second review document to the terminal device;
The information providing apparatus according to claim 6 or 7.
レビュー文書と、前記レビュー文書とは異なる参照文書とのうち、少なくとも前記参照文書に基づいて、前記レビュー文書のサマリーを生成し、
前記生成した前記サマリーを含むコンテンツを端末装置に提供する、
情報提供方法。 Computer
Generating a summary of the review document based on at least the reference document among the review document and a reference document different from the review document;
Providing a content including the generated summary to a terminal device;
Information provision method.
レビュー文書と、前記レビュー文書とは異なる参照文書とのうち、少なくとも前記参照文書に基づいて、前記レビュー文書のサマリーを生成する処理と、
前記生成した前記サマリーを含むコンテンツを端末装置に提供する処理と、
を実行させるためのプログラム。 On the computer,
A process of generating a summary of the review document based on at least the reference document among the review document and a reference document different from the review document;
A process of providing content including the generated summary to a terminal device;
A program for running
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018108399A JP6982546B2 (en) | 2018-06-06 | 2018-06-06 | Information providing equipment, information providing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018108399A JP6982546B2 (en) | 2018-06-06 | 2018-06-06 | Information providing equipment, information providing method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019212083A true JP2019212083A (en) | 2019-12-12 |
JP6982546B2 JP6982546B2 (en) | 2021-12-17 |
Family
ID=68846817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018108399A Active JP6982546B2 (en) | 2018-06-06 | 2018-06-06 | Information providing equipment, information providing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6982546B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254979A (en) * | 2021-06-26 | 2021-08-13 | 环球数科集团有限公司 | Credible examination system for protecting business privacy and computer storage medium |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011186855A (en) * | 2010-03-09 | 2011-09-22 | Nippon Telegr & Teleph Corp <Ntt> | Question recommending device, method and program |
JP2016503914A (en) * | 2012-12-13 | 2016-02-08 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | Product evaluation analysis |
JP2017134787A (en) * | 2016-01-29 | 2017-08-03 | Kddi株式会社 | Device, program, and method for analyzing topic evaluation in multiple areas |
-
2018
- 2018-06-06 JP JP2018108399A patent/JP6982546B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011186855A (en) * | 2010-03-09 | 2011-09-22 | Nippon Telegr & Teleph Corp <Ntt> | Question recommending device, method and program |
JP2016503914A (en) * | 2012-12-13 | 2016-02-08 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | Product evaluation analysis |
JP2017134787A (en) * | 2016-01-29 | 2017-08-03 | Kddi株式会社 | Device, program, and method for analyzing topic evaluation in multiple areas |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254979A (en) * | 2021-06-26 | 2021-08-13 | 环球数科集团有限公司 | Credible examination system for protecting business privacy and computer storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP6982546B2 (en) | 2021-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20110179009A1 (en) | Internet-based opinion search system and method, and internet-based opinion search and advertising service system and method | |
US8180755B2 (en) | Matching reviews to objects using a language model | |
JP5541049B2 (en) | DATA GENERATION DEVICE, DATA GENERATION METHOD, AND DATA GENERATION PROGRAM | |
JP2009123015A (en) | Brand ranking system and method | |
JP4743766B2 (en) | Impression determination system, advertisement article generation system, impression determination method, advertisement article generation method, impression determination program, and advertisement article generation program | |
JP2011107826A (en) | Action-information extracting system and extraction method | |
JP6479239B1 (en) | Information processing apparatus, information processing system, information processing method, and program | |
Park | Combined Text-Mining/DEA method for measuring level of customer satisfaction from online reviews | |
JP2004126975A (en) | Method and device for extracting similar user with similar preference tendency, program for the same, and recording medium recording the same | |
JP2013033376A (en) | Information processor, information processing method, and program | |
WO2011093358A1 (en) | Information retrieval device, information retrieval method, information retrieval program, and recording medium | |
KR101074820B1 (en) | Recommendation searching system using internet and method thereof | |
Guo et al. | An opinion feature extraction approach based on a multidimensional sentence analysis model | |
JP6501936B1 (en) | INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND PROGRAM | |
KR20110045293A (en) | Service system and service method of providing on-line shoping mall information according to contents of web page | |
JP6982546B2 (en) | Information providing equipment, information providing method, and program | |
JP2004280180A (en) | System for extracting keyword for advertisement, commercial copy delivery system, program for extracting keyword for advertisement, and commercial copy delivery program | |
KR102323153B1 (en) | Decision support server and method for providing decision support reference based on unconsciouness area of customer | |
JP2002014994A (en) | Device and method for management of web page attribute | |
Mangnoesing et al. | An empirical study for determining relevant features for sentiment summarization of online conversational documents | |
KR100851042B1 (en) | Method for recommending extended advertising keyword and system thereof | |
JP7133508B2 (en) | Provision device, provision method and provision program | |
JP6993955B2 (en) | Information processing equipment, information processing methods, and programs | |
JP6894875B2 (en) | Brand dictionary creation device, product evaluation device, brand dictionary creation method and program. | |
JP2003233704A (en) | Marketing information collecting and providing system via data communication network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200313 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210317 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210323 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210520 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211026 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6982546 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |