JP6982546B2 - 情報提供装置、情報提供方法、およびプログラム - Google Patents

情報提供装置、情報提供方法、およびプログラム Download PDF

Info

Publication number
JP6982546B2
JP6982546B2 JP2018108399A JP2018108399A JP6982546B2 JP 6982546 B2 JP6982546 B2 JP 6982546B2 JP 2018108399 A JP2018108399 A JP 2018108399A JP 2018108399 A JP2018108399 A JP 2018108399A JP 6982546 B2 JP6982546 B2 JP 6982546B2
Authority
JP
Japan
Prior art keywords
review
document
frequency
word
appearance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018108399A
Other languages
English (en)
Other versions
JP2019212083A (ja
Inventor
健二 立石
稔 雨澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2018108399A priority Critical patent/JP6982546B2/ja
Publication of JP2019212083A publication Critical patent/JP2019212083A/ja
Application granted granted Critical
Publication of JP6982546B2 publication Critical patent/JP6982546B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報提供装置、情報提供方法、およびプログラムに関する。
従来、商品に対するユーザレビューを含む情報を分析して、個々の商品の用途と特性とを抽出し、抽出した用途と特性とを関連付け、ユーザによって用途が選択されると、選択された用途に関連付けた特性に基づいて、選択された用途との関連の深さに応じて商品のランク付けを行い、上位にランク付けされた商品の一覧を出力する技術が知られている(例えば、特許文献1参照)。
特開2012−168925号公報
しかしながら、従来の技術では、ユーザにとって必ずしも有用ではない他のユーザのレビュー文書を閲覧するようにレコメンドする場合があった。
本発明は、上記の課題に鑑みてなされたものであり、ユーザにとってより役に立つことが想定されるレビュー文書を提供することができる情報提供装置、情報提供方法、およびプログラムを提供することを目的としている。
本発明の一態様は、レビュー文書と、前記レビュー文書とは異なる参照文書とのうち、少なくとも前記参照文書に基づいて、前記レビュー文書のサマリーを生成する生成部と、前記生成部により生成された前記サマリーを含むコンテンツを端末装置に提供するコンテンツ提供部と、を備える情報提供装置である。
本発明の一態様によれば、ユーザにとってより役に立つことが想定されるレビュー文書を提供することができる。
第1実施形態における情報提供装置100を含む情報提供システム1の一例を示す図である。 第1実施形態における情報提供装置100の構成の一例を示す図である。 コンテンツ提供部112により提供されるウェブページの一例を示す図である。 辞書生成部114による一連の処理の流れを示すフローチャートである。 レビュー文書を分類する処理を模式的に示す図である。 第1頻出ワードおよび第2頻出ワードの一例を示す図である。 共起ワードの一例を示す図である。 サマリー生成部116による一連の処理の流れを示すフローチャートである。 レビュー文書における頻出ワードの出現頻度の結果の一例を示す図である。 レビュー文書における共起ワードの出現頻度の結果の一例を示す図である。 スコアの導出結果の一例を示す図である。 ハイパーリンク先のウェブページの一例を示す図である。 第2スコアに基づくサマリーの一例を示す図である。 第1スコアに基づくサマリーの一例を示す図である。 実施形態の情報提供装置100のハードウェア構成の一例を示す図である。
以下、本発明を適用した情報提供装置、情報提供方法、およびプログラムを、図面を参照して説明する。
[概要]
情報提供装置は、一以上のプロセッサにより実現される。情報提供装置は、レビュー文書と、レビュー文書とは異なる参照文書とのうち、少なくとも参照文書に基づいて、レビュー文書のサマリーを生成する。
レビュー文書とは、ショッピングサイトなどで販売される商品またはサービスや、ホテルなどの宿泊施設、観光地、株を売買可能な企業、アニメや映画などのコンテンツ、祭りや花火大会などのイベント、といった特定の対象に対するユーザの感想や批評、意見、報告などを表した電子文書である。
参照文書とは、ユーザの質問に対して回答が提供されるサービスを利用して、ユーザが第3者(例えば検索エンジンや不特定多数のユーザ)に向けて質問したときに、その質問内容を示す単語や語句が含まれる電子文書である。例えば、ユーザが検索サービスを利用した場合、参照文書には、ユーザが入力したクエリが含まれる。また、例えば、ユーザが知識共有サービスを利用した場合、参照文書には、知識共有サービスに対してユーザが投稿した文章が含まれる。知識共有サービスとは、質問と回答とが組み合わされた情報が不特定多数のユーザによって共有可能(閲覧可能)なサービスである。
情報提供装置は、レビュー文書のサマリーを生成すると、そのサマリーを含むコンテンツを、ユーザが利用する端末装置(外部装置)に提供する。サマリーを含むコンテンツは、例えば、ショッピングサイトなどで商品のレビュー文書が掲載されるようなウェブページである。これによって、複数のレビュー文書のうち、ユーザにとってより役に立つことが想定されるレビュー文書を提供することができる。
[第1実施形態]
[全体構成]
以下、第1実施形態について説明する。図1は、第1実施形態における情報提供装置100を含む情報提供システム1の一例を示す図である。第1実施形態における情報提供システム1は、例えば、一以上の端末装置10と、情報提供装置100とを備える。これらの装置は、ネットワークNWを介して接続される。
図1に示す各装置は、ネットワークNWを介して種々の情報を送受信する。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、プロバイダ端末、無線通信網、無線基地局、専用回線などを含む。なお、図1に示す各装置の全ての組み合わせが相互に通信可能である必要はなく、ネットワークNWは、一部にローカルなネットワークを含んでもよい。
端末装置10は、例えば、スマートフォンなどの携帯電話、タブレット端末、各種パーソナルコンピュータなどの、入力装置、表示装置、通信装置、記憶装置、および演算装置を備える端末装置である。通信装置は、NIC(Network Interface Card)などのネットワークカード、無線通信モジュールなどを含む。端末装置10では、ウェブブラウザやアプリケーションプログラムなどのUA(User Agent)が起動し、ユーザの入力操作に応じたリクエストを情報提供装置100に送信する。また、UAが起動された端末装置10は、情報提供装置100から取得した情報に基づいて、表示装置に各種画像を表示させる。
[情報提供装置の構成]
図2は、第1実施形態における情報提供装置100の構成の一例を示す図である。図示のように、情報提供装置100は、例えば、通信部102と、制御部110と、記憶部130とを備える。
通信部102は、例えば、NIC等の通信インターフェースを含む。通信部102は、ネットワークNWを介して、端末装置10などと通信する。例えば、通信部102は、ウェブブラウザなどのUAが起動した端末装置10と通信し、端末装置10からリクエストを受信する。
制御部110は、例えば、コンテンツ提供部112と、辞書生成部114と、サマリー生成部116とを備える。
制御部110の構成要素は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等のハードウェアプロセッサ(あるいはプロセッサ回路)が、記憶部130に記憶されたプログラム(ソフトウェア)を実行することにより実現される。また、これらの複数の構成要素のうち一部または全部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)等のハードウェア(回路部:circuitry)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。また、上記のプログラムは、予め記憶部130に格納されていてもよいし、DVDやCD−ROMなどの着脱可能な記憶媒体に格納されており、記憶媒体が情報提供装置100のドライブ装置に装着されることで記憶媒体から記憶部130にインストールされてもよい。
記憶部130は、例えば、HDD(Hard Disc Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)などの記憶装置により実現される。記憶部130には、ファームウェアやアプリケーションプログラムなどの各種プログラムの他に、レビュー文書情報132や参照文書情報134などが格納される。レビュー文書情報132は、上述した複数のレビュー文書が含まれる情報であり、参照文書情報134は、上述した参照文書が含まれる情報である。
コンテンツ提供部112は、通信部102が端末装置10からリクエストを受信した場合、通信部102を制御して、リクエストに応じた情報を端末装置10に提供する。例えば、通信部102が、ウェブブラウザがUAとして起動された端末装置10からHTTPリクエストを受信した場合、コンテンツ提供部112は、その端末装置10にウェブページを提供してよい。また、例えば、通信部102が、アプリケーションがUAとして起動された端末装置10からAPIリクエストを受信した場合、コンテンツ提供部112は、その端末装置10にコンテンツを提供してよい。
図3は、コンテンツ提供部112により提供されるウェブページの一例を示す図である。図示の例では、インターネット上において商品を販売するショッピングサイトやオークションサイト、フリーマーケットサイト等のウェブサイト(以下、総称して販売サイトと称する)のウェブページを模式的に示している。例えば、販売サイトのウェブページの領域R1には、商品の画像やタイトル、価格、カート投入ボタンなどが表示され、領域R2には、レビュー文書のサマリーが表示され、領域R3には、レビュー文書が一覧形式で表示される。領域R2に示すサマリーは、後述するサマリー生成部116によって生成される。これについては後述する。なお、図3の例では、販売サイトにレビュー文書のサマリーが表示されるものとして説明したがこれに限られず、例えば、宿泊施設の予約サイトや、観光地の情報サイト、株や仮想通貨などのファイナンスに関する情報交換サイトなどのように、ユーザが作成したレビュー文書が一覧として表示されるようなウェブサイトであれば如何なるウェブサイトであってもよい。また、これらのウェブサイトは、携帯電話などにインストールされたアプリケーションプログラムによって実現されてもよい。
[辞書生成部の処理フロー]
辞書生成部114は、サマリー生成部116がサマリーを生成する際に利用する辞書を生成する。以下、辞書生成部114による一連の処理の流れをフローチャートに即して説明する。図4は、辞書生成部114による一連の処理の流れを示すフローチャートである。本フローチャートの処理は、例えば、所定の周期で繰り返し行われてよい。
まず、辞書生成部114は、例えば、販売サイトに掲載される商品の分類先の候補となる複数のカテゴリの中から、対象とする一つのカテゴリ(以下、対象カテゴリと称する)を選択する(S100)。
次に、辞書生成部114は、選択した対象カテゴリに分類される全商品のレビュー文書を、記憶部130に格納されたレビュー文書情報132から取得する(S102)。レビュー文書情報132には、例えば、レビューの対象が販売サイトで販売される商品である場合、ファッションや家電、食品、オーディオ、家具、ゲーム、スポーツといった複数のカテゴリ(商品カテゴリ)の其々に分類されている各商品に対する一つ以上のレビュー文書が含まれる。例えば、辞書生成部114は、「家電」のカテゴリを対象カテゴリとして選択した場合、レビュー文書情報132に含まれる複数のレビュー文書の中から、「家電」に分類される、テレビ、洗濯機、空気清浄機、掃除機、冷蔵庫といった各商品に対するレビュー文書を取得する。
次に、辞書生成部114は、取得したレビュー文書を、高評価のレビュー文書を集めた高評価レビュー群と低評価のレビュー文書を集めた低評価レビュー群とに分類する(S104)。
図5は、レビュー文書を分類する処理を模式的に示す図である。図示のように、レビュー文書には、レビュー対象に対する評価が高いほど大きく、レビュー対象に対する評価が低いほど小さい評点が対応付けられている。この評点は、例えば、最低点(例えば0.0)から最高点(例えば5.0)の範囲内でユーザによって任意に設定される。そのため、例えば、辞書生成部114は、図示のように、ある第1閾値(例えば4.0)以上の評点が対応付けられたレビュー文書を高評価レビュー群に分類し、第1閾値よりも小さい第2閾値(例えば2.0)以下の評点が対応付けられたレビュー文書を低評価レビュー群に分類してよい。なお、第1閾値と第2閾値とは同じ値であってもよい。また、辞書生成部114は、評点が対応付けられたレビュー文書を3つ以上のレビュー群に分類してもよい。高評価レビュー群に分類するレビュー文書は、「第1レビュー文書」の一例であり、低評価レビュー群に分類するレビュー文書は、「第2レビュー文書」の一例である。
次に、辞書生成部114は、分類した高評価レビュー群と低評価レビュー群との其々から、頻出ワードを抽出する(S106)。頻出ワードとは、レビュー文書において頻出するワード(単語)またはフレーズ(語句)である。例えば、各レビュー群において出現回数が閾値以上のワードやフレーズ、或いは出現回数が多い上位所定数のワードやフレーズを頻出ワードとしてよい。以下、高評価レビュー群から抽出された頻出ワードを「第1頻出ワード」と称し、低評価レビュー群から抽出された頻出ワードを「第2頻出ワード」と称して説明する。
図6は、第1頻出ワードおよび第2頻出ワードの一例を示す図である。図示の例では、「家電」というカテゴリの更に下位カテゴリである「空気清浄機」に分類される商品(すなわち対象カテゴリが「空気清浄機」)に対して付与されたレビュー文書から得られた頻出ワードを表している。例えば、高評価レビュー群からは、第1頻出ワードとして、「迅速」や「安い」、「早い」といったワードが抽出されており、低評価レビュー群からは、第2頻出ワードとして、「値段」や「音」、「不良品」といったワードが抽出されている。なお、図示の例のように、「価格」や「対応」といったように、高評価レビュー群と低評価レビュー群との双方で互いに同じワード(あるいはフレーズ)が頻出している場合、第1頻出ワードおよび第2頻出ワードの双方に同じワードが含まれていてよい。
次に、辞書生成部114は、記憶部130に格納された参照文書情報134が示す参照文書から、共起ワードを抽出する(S108)。共起ワードとは、高評価レビュー群と低評価レビュー群との其々から抽出した複数の頻出ワードのうち、参照文書において、対象カテゴリを示すキーワードと共起する頻出ワードである。例えば、対象カテゴリが「空気清浄機」である場合、その対象カテゴリを表す「空気清浄機」が対象カテゴリを示すキーワードとなる。
図7は、共起ワードの一例を示す図である。図示の例では、参照文書が検索サイトなどに入力されたクエリのログ(複数のクエリの集合)であることを表している。このように参照文書がクエリのログであり、対象カテゴリを表すキーワードが「空気清浄機」である場合、辞書生成部114は、例えば、「空気清浄機」と共にスペースや句読点などを間に挟んで同時に入力された単語や語句を共起ワードとして抽出する。図示の例では、「掃除」、「タバコ」、「臭い」、「フィルター」といった単語が共起ワードとして抽出される。
なお、上述した例では、参照文書がクエリのログであるものとして説明したがこれに限られない。例えば、あるユーザが質問すると第3者が回答を投稿するような知識共有サービスが存在する場合、参照文書は、知識共有サービスに対して投稿された質問の内容を表す文章であってもよい。
次に、辞書生成部114は、抽出した頻出ワードおよび共起ワードに基づいて、高評価レビュー用の辞書(以下、高評価用辞書Daと称する)と、低評価レビュー用の辞書(以下、低評価用辞書Dbと称する)とを生成する(S110)。
例えば、辞書生成部114は、高評価レビュー群から抽出した頻出ワードを集めた辞書(以下、高評価頻出ワード辞書)と、低評価レビュー群から抽出した頻出ワードを集めた辞書(以下、低評価頻出ワード辞書)と、参照文書から抽出した共起ワードを集めた辞書(以下、共起ワード辞書)とを生成する。なお、辞書生成部114は、「音も静か」や「音が静か」とのように、頻出ワードや共起ワードをフレーズとして抽出する場合、これらのフレーズが助詞や接頭語などを除けば目的語と述語が本質的に同義語であるため、助詞や接頭語などの違い(文字の揺れ)を無視し、同じフレーズであるものとして辞書に登録してよい。
次に、辞書生成部114は、販売サイトに掲載される商品の分類先の候補となる全てのカテゴリについて、高評価頻出ワード辞書、低評価頻出ワード辞書、および共起ワード辞書を生成したか否かを判定し(S112)、全てのカテゴリについて辞書を生成していないと判定した場合、対象カテゴリを他のカテゴリに変更して、上述したS100の処理に戻り、新たに辞書を生成する。
一方、辞書生成部114は、全てのカテゴリについて辞書を生成したと判定した場合、すなわち、商品の分類先の候補となる全てのカテゴリの其々について辞書を生成した場合、本フローチャートの処理を終了する。
[サマリー生成部の処理フロー]
制御部110のサマリー生成部116は、辞書生成部114によって辞書が生成されると、その辞書を利用して、レビュー文書情報132に含まれる複数のレビュー文書の中から、図3に例示するようなウェブページのサマリーを生成する。以下、サマリー生成部116による一連の処理の流れをフローチャートに即して説明する。図8は、サマリー生成部116による一連の処理の流れを示すフローチャートである。本フローチャートの処理は、例えば、レビュー文書情報132の更新周期に合せて繰り返し行われてよい。
まず、サマリー生成部116は、辞書生成部114によって生成された高評価頻出ワード辞書、低評価頻出ワード辞書、および共起ワード辞書を利用して、レビュー文書情報132に含まれる各レビュー文書について、頻出ワードおよび共起ワードの出現頻度(出現回数)を導出する(S200)。
例えば、サマリー生成部116は、対象とするレビュー文書においてレビューされている商品のカテゴリと同じ辞書を利用して、頻出ワードおよび共起ワードの出現頻度を導出する。より具体的には、出現頻度の導出対象とするレビュー文書が、「食品」というカテゴリに分類される商品に対するレビュー文書である場合、サマリー生成部116は、辞書生成部114によって生成された複数の辞書の中から、「食品」というカテゴリを対象カテゴリとすることで生成された辞書を選択し、選択した辞書を利用して、出現頻度の導出対象とするレビュー文書から、頻出ワードおよび共起ワードの出現頻度を導出する。
図9は、レビュー文書における頻出ワードの出現頻度の結果の一例を示す図である。図示の例では、高評価頻出ワード辞書に登録された複数の第1頻出ワードのうち、「音」という第1頻出ワードについては、高評価レビュー群において、出現回数が74回であり、低評価頻出ワード辞書に登録された複数の第2頻出ワードのうち、「匂い」という第2頻出ワードについては、低評価レビュー群において、出現回数が5回であることを表している。すなわち、高評価のレビュー文書における第1頻出ワードの全出現回数466回のうち、「音」の出現回数が74回であることを表しており、低評価のレビュー文書におけるにおける第2頻出ワードの全出現回数49回のうち、「匂い」の出現回数が5回であることを表している。この場合、例えば、サマリー生成部116は、「音」という第1頻出ワードの出現頻度を、74/466として導出し、「匂い」という第2頻出ワードの出現頻度を、5/49として導出する。
図10は、レビュー文書における共起ワードの出現頻度の結果の一例を示す図である。図示の例では、高評価レビュー群において、共起ワード辞書に登録された複数の共起ワードのうち「掃除」という共起ワードについては、出現回数が21451回であり、「タバコ」という共起ワードについては、出現回数が13850回であり、「臭い」という共起ワードについては、出現回数が13186回であることを表している。この場合、サマリー生成部116は、「掃除」という共起ワードの高評価レビュー群における出現頻度を、21451/122879として導出し、「タバコ」という共起ワードの高評価レビュー群における出現頻度を、13850/122879として導出し、「臭い」という共起ワードの高評価レビュー群における出現頻度を、13186/122879として導出する。
また、図示の例では、低評価レビュー群において、共起ワード辞書に登録された複数の共起ワードのうち「臭い」という共起ワードについては、出現回数が13186回であり、「フィルター」という共起ワードについては、出現回数が12269回であり、「電気代」という共起ワードについては、出現回数が5364回であることを表している。この場合、サマリー生成部116は、「臭い」という共起ワードの低評価レビュー群における出現頻度を、13186/47113として導出し、「フィルター」という共起ワードの低評価レビュー群における出現頻度を、12269/47113として導出し、「電気代」という共起ワードの低評価レビュー群における出現頻度を、5364/47113として導出する。
次に、サマリー生成部116は、導出した頻出ワードの出現頻度および共起ワードの出現頻度に基づいて、各商品のレビュー文書に含まれるワードごとにスコアを導出する(S202)。例えば、サマリー生成部116は、数式(1)に基づいて、頻出ワードの出現回数と、共起ワードの出現回数との重み付き平均をスコア(Score(i,c,kw))として導出する。この場合、頻出ワードとして出現しやすく、且つ共起ワードとしても出現しやすいワードほどスコアが大きくなる。
Figure 0006982546
例えば、レビュー文書において、ショッピングサイトなどで販売される商品またはサービスをレビューの対象としている場合、式中のiは、各商品(または各サービス)を表す。また、cは、カテゴリを表しており、kwは、レビュー文書に含まれる頻出ワードまたは共起ワードを表している。また、FrqR(i)は、ある商品iのレビュー数を表し、FrqR(i,kw)は、頻出ワードまたは共起ワードが出現する商品iのレビュー数を表している。また、例えば、参照文書がクエリのログである場合、FrqQ(c)は、参照文書に出現するクエリのうち、カテゴリを表すキーワード(例えば「空気清浄機」といったワード)を含むクエリの総数を表し、FrqQ(c,kw)は、参照文書に出現するクエリのうち、カテゴリを表すキーワードと頻出ワードまたは共起ワードとを含むクエリの数を表している。αは、重みを表す係数であり、例えば、FrqR(i)/FrqQ(c)といった係数であってよい。なお、数式(1)は、重み付き平均をスコアとして導出する導出式であるものとして説明したがこれに限られず、例えば、相乗平均や調和平均、或いはその他の総計的指標値をスコアとして導出するものであってもよい。
また、サマリー生成部116は、共起ワードの出現頻度のみに基づいて、各商品のレビュー文書に含まれるワードごとにスコアを導出してもよい。この場合、サマリー生成部116は、例えば、FrqQ(c,kw)/FrqQ(c)をスコアとして導出する。
図11は、スコアの導出結果の一例を示す図である。図示の例では、高評価レビュー群において、第1頻出ワードおよび共起ワードの集合に含まれる複数のワードのうち、「コンパクト」というワードが最もスコアが大きく、「音」というワードが2番目にスコアが大きく、「価格」というワードが3番目にスコアが大きいことを表している。また、図示の例では、低評価レビュー群において、第2頻出ワードおよび共起ワードの集合に含まれる複数のワードのうち、「臭い」というワードが最もスコアが大きく、「電気代」というワードが2番目にスコアが大きく、「匂い」というワードが3番目にスコアが大きいことを表している。
次に、サマリー生成部116は、スコアが大きい上位所定数のワード(頻出ワードまたは共起ワード)を選択する(S204)。例えば、所定数が3である場合において、図11に例示するスコア結果の場合、サマリー生成部116は、高評価レビュー群については「コンパクト」、「音」、「価格」というワードを選択し、低評価レビュー群については「臭い」、「電気代」、「匂い」というワードを選択する。
次に、サマリー生成部116は、選択したワードが頻出ワードや共起ワードとして出現するレビュー文書のサマリーを生成する(S206)。例えば、サマリー生成部116は、高評価レビュー群について、「コンパクト」、「音」、「価格」という3つのワードを選択した場合、高評価レビュー群に含まれる複数のレビュー文書のうち、「コンパクト」が出現するレビュー文書の集合と、「音」が出現するレビュー文書の集合と、「価格」が出現するレビュー文書の集合とを含むサマリーを、高評価レビューについて纏めたサマリー(高評価用サマリーと称する)として生成する。同様に、サマリー生成部116は、低評価レビュー群について、「臭い」、「電気代」、「匂い」という3つのワードを選択した場合、低評価レビュー群に含まれる複数のレビュー文書のうち、「臭い」が出現するレビュー文書の集合と、「電気代」が出現するレビュー文書の集合と、「匂い」が出現するレビュー文書の集合とを含むサマリーを、低評価レビューについて纏めたサマリー(低評価用サマリーと称する)として生成する。これによって本フローチャートの処理が終了する。高評価用サマリーは、「第1サマリー」の一例であり、低評価用サマリーは、「第2サマリー」の一例である。
上述したコンテンツ提供部112は、サマリー生成部116によって高評価サマリーおよび低評価サマリーが生成されると、高評価サマリーおよび低評価サマリーが含まれるウェブページ(例えば図3に示すようなウェブページ)を生成する。そして、コンテンツ提供部112は、通信部102によってレビュー文書を掲載するウェブページのリクエストが受信されると、通信部102を制御して、リクエスト元の端末装置10に、生成した高評価サマリーおよび低評価サマリーを含むウェブページをレスポンスとして送信する。例えば、コンテンツ提供部112は、図3の領域R2のレビューサマリーにおいて、高評価用サマリーを「良かったところ」として表示させ、低評価用サマリーを「悪かったところ」として表示させたウェブページを送信してよい。
また、コンテンツ提供部112は、高評価用サマリーおよび低評価用サマリーを表示させる際に、各ワードに対応付けられた複数のレビュー文書の件数と、それら複数のレビュー文書の中で代表的なレビュー文書に出現するワードやフレーズとを表示させてよい。代表的なレビュー文書は、例えば、閲覧数が最も多いレビュー文書であってもよいし、他のユーザからレビューが参考になったと報告された回数が最も多いレビュー文書であってもよい。
例えば、高評価レビュー群から抽出されたスコアが大きい上位所定数のワードの中に「音」というワードが含まれている場合、コンテンツ提供部112は、高評価レビュー群に含まれる複数のレビュー文書のうち、「音」というワードが頻出ワードや共起ワードとして出現するレビュー文書の数を件数として表示し、更に、「音」というワードが出現する複数のレビュー文書の中で代表的なレビュー文書のタイトルや要約文などを表示してよい。図3の例では、「音」というワードが出現するレビュー文書の件数が「74件」であることを表し、「音」というワードが出現する複数のレビュー文書の中で代表的なレビュー文書のタイトルや要約文が「音も静か」ということを表している。
また、コンテンツ提供部112は、代表的なレビュー文書のタイトルなどに、各サマリーに含めたレビュー文書を一覧として表示するウェブページのURL(Uniform Resource Locator)をハイパーリンクとして対応付けてもよい。すなわち、コンテンツ提供部112は、各サマリーとして纏められたレビュー文書が閲覧可能なURL等が対応付けられた文字や画像をコンテンツに含め、そのコンテンツを端末装置10に提供する。
図12は、ハイパーリンク先のウェブページの一例を示す図である。図示の例では、「良かったところ(高評価用サマリー)」において、「掃除も簡単」という文字列がクリック操作やタップ操作された場合の遷移先のウェブページを表している。このような場合、コンテンツ提供部112は、ハイパーリンク先のウェブページに、高評価レビュー群の中で、「掃除」というワードが頻出ワードまたは共起ワードとして出現するレビュー文書を一覧として掲載してよい。これによって、ユーザは、複数のレビュー文書の中から興味のあるレビュー文書を取捨選択せずとも、サマリーの中のハイパーリンクが対応付けられた各ワードをクリックやタップすることで、興味のあるレビュー文書が個別に集計され、一覧形式で表示されたページにアクセスすることができる。
以上説明した第1実施形態によれば、レビュー文書と、レビュー文書とは異なる参照文書とのうち、少なくとも参照文書に基づいて、レビュー文書のサマリーを生成し、生成したレビュー文書のサマリーを含むウェブページなどをコンテンツとしてユーザの端末装置10に提供することによって、ユーザにとってより役に立つことが想定されるレビュー文書を提供することができる。
一般的に、ユーザは、購入したい商品などのカタログスペック等に加えて、実際に使用してみて初めわかる使用感について検索サイトや知識共有サイトなどを利用して調べる傾向がある。このような場合、商品の使用感について検索した際にクエリとして入力された単語や語句こそが、実際にユーザが気にしていることを端的に表していると見做すことができる。そのため、本実施形態のように、検索サイトに入力されたクエリのログや、知識共有サイトに投稿された質問文章などを含む参照文書を基にレビュー文書を解析することで、真にユーザが知りたい情報が掲載されたレビュー文書をサマリーとして提供することができる。これによって、レビュー文書を参考にするユーザが増え、実際に購入した商品が想定していたものと違うというようなミスマッチを解消することができ、商品の返品率などを低下させることができる。この結果、商品を販売する店舗側(小売業者側)が負担する、配送料や返品交換にかかる費用などを抑えることができるため、販売サイトに新規出店する事業者や、出店を継続する事業者の数を増加させることができる。
また、上述した第1実施形態によれば、レビュー文書をサマリーとして提供するため、レビュー文書の可読性を向上させることができる。例えば、ユーザがスマートフォンなどの画面のサイズが小さい端末装置10を利用して販売サイトなどを閲覧する場合、端末装置10の画面のサイズによって全てのレビュー文書を表示することが制約されることで、一部のレビュー文書しか表示されない場合がある。このような場合、ユーザのレビュー文書の可読性が低下しやすい。これに対して、本実施形態では、ユーザが使用感などを調べる際に入力されやすいクエリなどを共起ワードとし、その共起ワードの出現頻度に基づいて選択したレビュー文書をサマリーとして提供するため、レビュー文書の可読性を向上させることができる。この結果、ユーザは、参考になるレビュー文書を見つけやすくなり、レビュー文書が一覧形式で表示されるようなウェブサイトの利便性を向上させることができる。
<第2実施形態>
以下、第2実施形態について説明する。第2実施形態では、サマリーに含めるレビュー文書を強調表示する点で上述した第1実施形態と相違する。以下、第1実施形態との相違点を中心に説明し、第1実施形態と共通する点については説明を省略する。なお、第2実施形態の説明において、第1実施形態と同じ部分については同一符号を付して説明する。
第2実施形態におけるサマリー生成部116は、頻出ワードの出現頻度および共起ワードの出現頻度に基づいて、各商品のレビュー文書に含まれるワードごとにスコア(以下、第1スコアと称する)を導出すると共に、頻出ワードの出現頻度に基づいて、各商品のレビュー文書に含まれるワードごとにスコア(以下、第2スコアと称する)を導出する。例えば、サマリー生成部116は、FrqR(i,kw)/FrqR(i)を第2スコアとして導出してよい。すなわち、サマリー生成部116は、各レビュー群において出現頻度が大きいワードほど第2スコアを大きくする。
そして、サマリー生成部116は、第1スコアが大きい上位所定数のワードが出現するレビュー文書のサマリーを生成すると共に、第2スコアが大きい上位所定数のワードが出現するレビュー文書のサマリーを生成する。
第2実施形態におけるコンテンツ提供部112は、第1スコアを基に選択したレビュー文書のサマリーと、第2スコアを基に選択したレビューのサマリーとを比較し、比較対象の2つのサマリーの一部または全部のレビュー文書が異なる場合、第1スコアに基づくサマリーにおいて、第2スコアに基づくサマリーのレビュー文書と異なるレビュー文書を強調表示する。
図13は、第2スコアに基づくサマリーの一例を示す図である。また、図14は、第1スコアに基づくサマリーの一例を示す図である。図13に例示したサマリーの「良かったところ(高評価用サマリー)」には、「音」、「コンパクト」、「価格」、「安い」、「小さい」という、高評価レビュー群において出現頻度の大きい上位5つのワードを含むレビュー文書が含められている。これに対して、図14に例示したサマリーの「良かったところ(高評価用サマリー)」には、「音」、「コンパクト」、「価格」という、高評価レビュー群において出現頻度の大きい上位3つのワードを含むレビュー文書に加えて、「安い」や「小さい」といったワードに比べて出現頻度が小さい「タバコ」および「掃除」というワードを含むレビュー文書が含められている。
また、図13に例示したサマリーの「悪かったところ(低評価用サマリー)」には、「匂い」、「壊れる」、「ファン」、「異音」、「わからない」という、低評価レビュー群において出現頻度の大きい上位5つのワードを含むレビュー文書が含められている。これに対して、図14に例示したサマリーの「悪かったところ(低評価用サマリー)」には、「匂い」、「壊れる」、「ファン」という、低評価レビュー群において出現頻度の大きいワードを含むレビュー文書に加えて、「臭い」や「電気代」といった必ずしも出現頻度が大きくないワードを含むレビュー文書が含められている。
このような場合、コンテンツ提供部112は、図14に例示したサマリーにおいて、図13に例示したサマリーと異なるレビュー文書を強調表示する。図13および図14の例では、コンテンツ提供部112は、「良かったところ(高評価用サマリー)」では、「タバコ」というワードが出現する代表的なレビュー文書のタイトル「タバコを吸う」を強調表示し、「掃除」というワードが出現する代表的なレビュー文書のタイトル「掃除も簡単」を強調表示する。より具体的には、コンテンツ提供部112は、代表的なレビュー文書のタイトルを示す文字列に下線を付与したり、その文字列の文字を大きくしたり、色を変えたりすることで、強調表示してよい。また、コンテンツ提供部112は、「悪かったところ(低評価用サマリー)」では、「臭い」というワードが出現する代表的なレビュー文書のタイトル「臭い」を強調表示し、「電気代」というワードが出現する代表的なレビュー文書のタイトル「電気代がかかる」を強調表示する。
以上説明した第2実施形態によれば、レビュー文書間で頻出する頻出ワードの出現頻度を基にレビュー文書のサマリーを生成した場合と比べて、レビュー文書間で頻出する頻出ワードと、参照文書内でカテゴリを示すキーワードと共起する共起ワードとを総合的に考慮してレビュー文書のサマリーを生成した場合とで、サマリー間のレビュー文書が異なる場合、異なるレビュー文書を強調表示することで、件数が少なく他のレビュー文書に埋もれてしまいやすい有用な(役に立つ)レビュー文書であっても、ユーザに閲覧するよう促すことができる。
<ハードウェア構成>
上述した実施形態の情報提供装置100は、例えば、図15に示すようなハードウェア構成により実現される。図15は、実施形態の情報提供装置100のハードウェア構成の一例を示す図である。
情報提供装置100は、NIC100−1、CPU100−2、RAM100−3、ROM100−4、フラッシュメモリやHDDなどの二次記憶装置100−5、およびドライブ装置100−6が、内部バスあるいは専用通信線によって相互に接続された構成となっている。ドライブ装置100−6には、光ディスクなどの可搬型記憶媒体が装着される。二次記憶装置100−5、またはドライブ装置100−6に装着された可搬型記憶媒体に格納されたプログラムがDMAコントローラ(不図示)などによってRAM100−3に展開され、CPU100−2によって実行されることで、制御部110が実現される。制御部110が参照するプログラムは、ネットワークNWを介して他の装置からダウンロードされてもよい。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何ら限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1…情報提供システム、10…端末装置、100…情報提供装置、102…通信部、110…制御部、112…コンテンツ提供部、114…辞書生成部、116…レビュー生成部、130…記憶部

Claims (9)

  1. レビュー文書と、前記レビュー文書とは異なる参照文書とのうち、少なくとも前記参照文書に基づいて、前記レビュー文書のサマリーを生成する生成部と、
    前記生成部により生成された前記サマリーを含むコンテンツを端末装置に提供するコンテンツ提供部と、を備え、
    前記生成部は、
    レビュー対象が同じ前記複数のレビュー文書の其々について、前記参照文書において前記レビュー対象を表すキーワードと共起する共起ワードの出現頻度を導出し、
    少なくとも前記導出した共起ワードの出現頻度に基づいて、前記サマリーを生成する、
    報提供装置。
  2. 前記参照文書には、質問に対して回答が提供されるサービスを利用したユーザの質問内容が含まれる、
    請求項1に記載の情報提供装置。
  3. 前記サービスには、検索サービス、または質問と回答とが組み合わされた情報が不特定多数のユーザによって共有可能な知識共有サービスが含まれ、
    前記質問内容には、
    前記サービスに前記検索サービスが含まれる場合、前記検索サービスに対してユーザが入力したクエリが含まれ、
    前記サービスに前記知識共有サービスが含まれる場合、前記知識共有サービスに対してユーザが質問として投稿した文章が含まれる、
    請求項2に記載の情報提供装置。
  4. 前記生成部は、更に、
    前記複数のレビュー文書間において頻出する頻出ワードを導出し、
    レビュー対象が同じ前記複数のレビュー文書の其々について、前記頻出ワードの出現頻度を導出し、
    前記頻出ワードの出現頻度と前記共起ワードの出現頻度とに基づいて、前記サマリーを生成する、
    請求項に記載の情報提供装置。
  5. 前記複数のレビュー文書の其々は、レビュー対象に対する評価が高いほど大きく、レビュー対象に対する評価が低いほど小さい評点が対応付けられており、
    前記頻出ワードには、前記複数のレビュー文書のうち、第1閾値以上の前記評点が対応付けられた第1レビュー文書において頻出する第1頻出ワードと、前記第1閾値よりも小さい第2閾値以下の前記評点が対応付けられた第2レビュー文書において頻出する第2頻出ワードとが含まれ、
    前記生成部は、
    前記第1レビュー文書から、前記第1頻出ワードの出現頻度と前記共起ワードの出現頻度とを導出すると共に、前記第2レビュー文書から、前記第2頻出ワードの出現頻度と前記共起ワードの出現頻度とを導出し、
    前記導出した前記第1頻出ワードの出現頻度と前記共起ワードの出現頻度とに基づいて、前記第1レビュー文書のサマリーを生成し、
    前記導出した前記第2頻出ワードの出現頻度と前記共起ワードの出現頻度とに基づいて、前記第2レビュー文書のサマリーを生成する、
    請求項に記載の情報提供装置。
  6. 前記生成部は、前記第1頻出ワードの出現頻度と前記共起ワードの出現頻度との重み付き平均が大きい上位所定数の前記第1レビュー文書を含むサマリーを、前記第1レビュー文書のサマリーとして生成し、
    前記第2頻出ワードの出現頻度と前記共起ワードの出現頻度との重み付き平均が大きい上位所定数の前記第2レビュー文書を含むサマリーを、前記第2レビュー文書のサマリーとして生成する、
    請求項に記載の情報提供装置。
  7. 前記コンテンツ提供部は、
    前記第1レビュー文書のサマリーと前記第2レビュー文書のサマリーとを含む前記コンテンツを、前記端末装置に提供する、
    請求項またはに記載の情報提供装置。
  8. コンピュータが、
    レビュー文書と、前記レビュー文書とは異なる参照文書とのうち、少なくとも前記参照文書に基づいて、前記レビュー文書のサマリーを生成し、
    前記生成した前記サマリーを含むコンテンツを端末装置に提供
    レビュー対象が同じ前記複数のレビュー文書の其々について、前記参照文書において前記レビュー対象を表すキーワードと共起する共起ワードの出現頻度を導出し、
    少なくとも前記導出した共起ワードの出現頻度に基づいて、前記サマリーを生成する、
    情報提供方法。
  9. コンピュータに、
    レビュー文書と、前記レビュー文書とは異なる参照文書とのうち、少なくとも前記参照文書に基づいて、前記レビュー文書のサマリーを生成する処理と、
    前記生成した前記サマリーを含むコンテンツを端末装置に提供する処理と、
    レビュー対象が同じ前記複数のレビュー文書の其々について、前記参照文書において前記レビュー対象を表すキーワードと共起する共起ワードの出現頻度を導出する処理と、
    少なくとも前記導出した共起ワードの出現頻度に基づいて、前記サマリーを生成する処理と、
    を実行させるためのプログラム。
JP2018108399A 2018-06-06 2018-06-06 情報提供装置、情報提供方法、およびプログラム Active JP6982546B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018108399A JP6982546B2 (ja) 2018-06-06 2018-06-06 情報提供装置、情報提供方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018108399A JP6982546B2 (ja) 2018-06-06 2018-06-06 情報提供装置、情報提供方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2019212083A JP2019212083A (ja) 2019-12-12
JP6982546B2 true JP6982546B2 (ja) 2021-12-17

Family

ID=68846817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018108399A Active JP6982546B2 (ja) 2018-06-06 2018-06-06 情報提供装置、情報提供方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP6982546B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254979B (zh) * 2021-06-26 2021-09-24 环球数科集团有限公司 一种保护业务隐私的可信审查系统及计算机存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5373670B2 (ja) * 2010-03-09 2013-12-18 日本電信電話株式会社 質問推薦装置及び方法及びプログラム
CN103870973B (zh) * 2012-12-13 2017-12-19 阿里巴巴集团控股有限公司 基于电子信息的关键词提取的信息推送、搜索方法及装置
JP6529133B2 (ja) * 2016-01-29 2019-06-12 Kddi株式会社 複数地域でのトピックの評価を分析する装置、プログラム及び方法

Also Published As

Publication number Publication date
JP2019212083A (ja) 2019-12-12

Similar Documents

Publication Publication Date Title
US8321413B2 (en) Identifying and changing personal information
JP2010086343A (ja) ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム
JP5541049B2 (ja) データ生成装置、データの生成方法及びデータ生成プログラム
JP5483269B2 (ja) 情報検索装置、情報検索方法
JP2009123015A (ja) ブランドランク評価システムおよび方法
JP6405343B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5229504B2 (ja) 広告提示方法、広告提示システム及びプログラム
KR101707660B1 (ko) 연관 검색어를 이용한 관심사 카테고리 기반 이커머스 시스템
JP6289989B2 (ja) 商品に対するユーザの感情分析装置及びプログラム
WO2011093358A1 (ja) 情報検索装置、情報検索方法、情報検索プログラム及び記録媒体
JP6479239B1 (ja) 情報処理装置、情報処理システム、情報処理方法、およびプログラム
JP6501936B1 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6982546B2 (ja) 情報提供装置、情報提供方法、およびプログラム
JP6960253B2 (ja) 商品等評価装置、商品等評価方法、およびプログラム
JP6509590B2 (ja) 商品に対するユーザの感情分析装置及びプログラム
JP6960553B2 (ja) ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム
JP6993955B2 (ja) 情報処理装置、情報処理方法、およびプログラム
Mangnoesing et al. An empirical study for determining relevant features for sentiment summarization of online conversational documents
JP5011185B2 (ja) 情報分析装置、情報分析方法、及び情報分析プログラム
JP2021140646A (ja) ターゲットユーザ特徴抽出方法、ターゲットユーザ特徴抽出システム及びターゲットユーザ特徴抽出サーバ
KR20080041899A (ko) 확장 광고 키워드를 추천하는 방법 및 그 시스템
KR101021204B1 (ko) 인터넷을 이용한 의견 검색 및 광고 서비스 방법
JP6246271B1 (ja) 属性評価装置、販売システム、属性評価方法、および属性評価プログラム
JP6506839B2 (ja) 不満情報処理装置及びシステム
JP2019219731A (ja) 情報処理装置、情報処理方法、およびプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200313

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210520

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211026

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211119

R150 Certificate of patent or registration of utility model

Ref document number: 6982546

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250