JP6993955B2 - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP6993955B2
JP6993955B2 JP2018229167A JP2018229167A JP6993955B2 JP 6993955 B2 JP6993955 B2 JP 6993955B2 JP 2018229167 A JP2018229167 A JP 2018229167A JP 2018229167 A JP2018229167 A JP 2018229167A JP 6993955 B2 JP6993955 B2 JP 6993955B2
Authority
JP
Japan
Prior art keywords
review
expression
documents
score
review documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018229167A
Other languages
English (en)
Other versions
JP2020091730A (ja
Inventor
健二 立石
務 杉本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2018229167A priority Critical patent/JP6993955B2/ja
Publication of JP2020091730A publication Critical patent/JP2020091730A/ja
Application granted granted Critical
Publication of JP6993955B2 publication Critical patent/JP6993955B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関する。
ショッピングサイトなどでは、商品やサービスのレビュー文書が掲載されている。これに関連し、異なる大きさの複数の窓を用いて、文書中の各位置における語彙的結束度を計算し、各話題の階層毎に話題境界の候補区間を求め、異なる階層の候補区間を順に統合していくことで、階層毎に話題境界を認定し、要約作成対象の話題のまとまりと、それを含む大きな話題のまとまりとの関係に基づき、重要文を抽出して要約を作成する技術が知られている(例えば、特許文献1参照)。
特開平11-272699号公報
しかしながら、従来の技術では、内容が充実していないレビュー文書がユーザに提供される場合があった。この結果、ユーザの満足度が低下する場合があった。
本発明は、上記の課題に鑑みてなされたものであり、レビューを読むユーザの満足度を向上させることができる情報処理装置、情報処理方法、およびプログラムを提供することを目的としている。
本発明の一態様は、複数のレビュー文書のそれぞれから、評価の観点を表す第1表現と、前記評価の観点の肯定または否定を表す第2表現と、前記第1表現および前記第2表現を組み合わせた第1フレーズと、肯定または否定を表す第3表現および前記第1表現を組み合わせた第2フレーズとのうち、少なくともいずれか一つを抽出する抽出部と、前記抽出部による抽出結果に基づいて、前記複数のレビュー文書の中から、他のレビュー文書に比して、より内容が充実した一以上のレビュー文書を選択する選択部と、を備える情報処理装置である。
本発明の一態様によれば、レビューを読むユーザの満足度を向上させることができる。
実施形態における情報処理装置100を含む情報処理システム1の一例を示す図である。 実施形態における情報処理装置100の構成の一例を示す図である。 コンテンツ提供部112により提供されるウェブページの一例を示す図である。 辞書生成部114による一連の処理の流れを示すフローチャートである。 レビュー文書を分類する処理を模式的に示す図である。 高評価用辞書134の一例を示す図である。 抽出部116、スコア算出部118、およびレビュー選択部120による一連の処理の流れを示すフローチャートである。 抽出条件情報138の一例を示す図である。 抽出条件に従ってレビュー文書から辞書に登録された表現を抽出する方法を説明するための図である。 抽出条件に従ってレビュー文書から辞書に登録された表現を抽出する方法を説明するための図である。 抽出条件に従ってレビュー文書から辞書に登録された表現を抽出する方法を説明するための図である。 表現の種類数の算出結果の一例を示す図である。 レビュー文書を含むコンテンツの一例を示す図である。 レビュー文書を含むコンテンツの他の例を示す図である。 レビュー文書を含むコンテンツの他の例を示す図である。 実施形態の情報処理装置100のハードウェア構成の一例を示す図である。
以下、本発明を適用した情報処理装置、情報処理方法、およびプログラムを、図面を参照して説明する。
[概要]
情報処理装置は、一以上のプロセッサにより実現される。情報処理装置は、(1)「属性」という種類の表現、(2)「属性値」という種類の表現、(3)「属性」および「属性値」のそれぞれの表現を組み合わせたフレーズ、(4)「評価」という種類の表現と「属性」の表現を組み合わせたフレーズのうち、少なくともいずれか一つを、複数のレビュー文書のそれぞれから抽出する。
「属性」とは、評価の観点を表す表現であり、例えば、文章の主体、主語、体言にあたる表現である。種類が「属性」の表現は、「第1表現」の一例である。
「属性値」とは、評価の観点の肯定または否定を表す表現であり、例えば、文章の述語にあたる表現である。種類が「属性値」の表現は、「第2表現」の一例である。
「評価」とは、属性値とは異なり、その表現単独で肯定または否定を表す表現であり、例えば、文章の述語にあたる表現である。種類が「評価」の表現は、「第3表現」の一例である。
例えば、「色がきれいでとても満足です」という一つの文章が存在した場合、この文章の主語にあたる「色」という表現は属性であり、「きれい」という表現は属性値であり、「満足」という表現は評価である。
レビュー文書とは、ショッピングサイトなどで販売される商品またはサービスや、ホテルなどの宿泊施設、観光地、株を売買可能な企業、アニメや映画などのコンテンツ、祭りや花火大会などのイベント、といったレビュー対象に対するユーザの感想や批評、意見、報告などを表した電子文書である。
情報処理装置は、各レビュー文書から、上記(1)から(4)のうち少なくともいずれか一つの表現を抽出すると、その抽出した表現に基づいて、複数のレビュー文書の中から、他のレビュー文書に比して、より内容が充実した一以上のレビュー文書を選択し、選択したレビュー文書を含むコンテンツを、ユーザが利用可能な端末装置(外部装置)に提供する。レビュー文書を含むコンテンツは、例えば、ショッピングサイトなどで商品のレビュー文書が掲載されるようなウェブページであってよい。これによって、より内容が充実したレビューをユーザに提供することができるため、レビューを読むユーザの満足度を向上させることができる。
[全体構成]
以下、実施形態について説明する。図1は、実施形態における情報処理装置100を含む情報処理システム1の一例を示す図である。実施形態における情報処理システム1は、例えば、一以上の端末装置10と、情報処理装置100とを備える。これらの装置は、ネットワークNWを介して接続される。
図1に示す各装置は、ネットワークNWを介して種々の情報を送受信する。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、プロバイダ端末、無線通信網、無線基地局、専用回線などを含む。なお、図1に示す各装置の全ての組み合わせが相互に通信可能である必要はなく、ネットワークNWは、一部にローカルなネットワークを含んでもよい。
端末装置10は、例えば、スマートフォンなどの携帯電話、タブレット端末、各種パーソナルコンピュータなどの、入力装置、表示装置、通信装置、記憶装置、および演算装置を備える端末装置である。通信装置は、NIC(Network Interface Card)などのネットワークカード、無線通信モジュールなどを含む。端末装置10では、ウェブブラウザやアプリケーションプログラムなどのUA(User Agent)が起動し、ユーザの入力操作に応じたリクエストを情報処理装置100に送信する。また、UAが起動された端末装置10は、情報処理装置100から取得した情報に基づいて、表示装置に各種画像を表示させる。
[情報処理装置の構成]
図2は、実施形態における情報処理装置100の構成の一例を示す図である。図示のように、情報処理装置100は、例えば、通信部102と、制御部110と、記憶部130とを備える。
通信部102は、例えば、NIC等の通信インターフェースを含む。通信部102は、ネットワークNWを介して、端末装置10などと通信する。例えば、通信部102は、ウェブブラウザなどのUAが起動した端末装置10と通信し、端末装置10からリクエストを受信する。
制御部110は、例えば、コンテンツ提供部112と、辞書生成部114と、抽出部116と、スコア算出部118と、レビュー選択部120とを備える。
制御部110の構成要素は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等のプロセッサ(あるいはプロセッサ回路)が、記憶部130に記憶されたプログラム(ソフトウェア)を実行することにより実現される。また、これらの複数の構成要素のうち一部または全部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)等のハードウェア(回路部:circuitry)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。また、上記のプログラムは、予め記憶部130に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体に格納されており、記憶媒体が情報処理装置100のドライブ装置に装着されることで記憶媒体から記憶部130にインストールされてもよい。
記憶部130は、例えば、HDD(Hard Disc Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)などの記憶装置により実現される。記憶部130には、ファームウェアやアプリケーションプログラムなどの各種プログラムの他に、レビュー文書情報132や、高評価用辞書134、低評価用辞書136、抽出条件情報138などが格納される。レビュー文書情報132は、上述した複数のレビュー文書が含まれる情報である。その他の情報については後述する。
コンテンツ提供部112は、通信部102が端末装置10からリクエストを受信した場合、通信部102を制御して、リクエストに応じた情報を端末装置10に提供する。例えば、通信部102が、ウェブブラウザがUAとして起動された端末装置10からHTTPリクエストを受信した場合、コンテンツ提供部112は、その端末装置10にウェブページを提供してよい。また、例えば、通信部102が、アプリケーションがUAとして起動された端末装置10からAPIリクエストを受信した場合、コンテンツ提供部112は、その端末装置10にコンテンツを提供してよい。
図3は、コンテンツ提供部112により提供されるウェブページの一例を示す図である。図示の例では、インターネット上において商品を販売するショッピングサイトやオークションサイト、フリーマーケットサイト等のウェブサイト(以下、販売サイトと称する)のウェブページを模式的に示している。例えば、販売サイトのウェブページの表示領域R1には、商品の画像やタイトル、価格、カート投入ボタンなどが表示され、表示領域R2には、レビュー文書が一覧形式で表示される。なお、図3の例では、販売サイトにレビュー文書のサマリーが表示されるものとして説明したがこれに限られず、例えば、宿泊施設の予約サイトや、観光地の情報サイト、株や仮想通貨などのファイナンスに関する情報交換サイトなどのように、ユーザが作成したレビュー文書が一覧として表示されるようなウェブサイトであれば如何なるウェブサイトであってもよい。また、これらのウェブサイトは、携帯電話などにインストールされたアプリケーションプログラムによって実現されてもよい。
[辞書生成部の処理フロー]
辞書生成部114は、抽出部116がレビュー文書から「属性」や「属性値」、「評価」の表現を抽出する際に利用される辞書を生成する。以下、辞書生成部114による一連の処理の流れをフローチャートに即して説明する。図4は、辞書生成部114による一連の処理の流れを示すフローチャートである。本フローチャートの処理は、例えば、所定の周期で繰り返し行われてよい。
まず、辞書生成部114は、レビュー文書情報132として記憶部130に格納された複数のレビュー文書を、高評価のレビュー文書を集めた高評価レビュー群と低評価のレビュー文書を集めた低評価レビュー群とに分類する(S100)。
図5は、レビュー文書を分類する処理を模式的に示す図である。図示のように、各レビュー文書には、レビュー対象に対する評価が高いほど大きく、レビュー対象に対する評価が低いほど小さい評点が対応付けられている。この評点は、例えば、最低点(例えば0.0)から最高点(例えば5.0)の範囲内でユーザによって任意に設定される。そのため、例えば、辞書生成部114は、図示のように、ある第1閾値(例えば4.0)以上の評点が対応付けられたレビュー文書を高評価レビュー群に分類し、第1閾値よりも小さい第2閾値(例えば2.0)以下の評点が対応付けられたレビュー文書を低評価レビュー群に分類してよい。なお、第1閾値と第2閾値とは同じ値であってもよい。また、辞書生成部114は、評点が対応付けられたレビュー文書を3つ以上のレビュー群に分類してもよい。
次に、辞書生成部114は、分類した高評価レビュー群と低評価レビュー群とのそれぞれから、「属性」、「属性値」、および「評価」のそれぞれに該当する表現を抽出する(S102)。
次に、辞書生成部114は、高評価レビュー群から抽出した表現を集めた辞書を生成し、これを高評価用辞書134として記憶部130に記憶させるとともに、低評価レビュー群から抽出した表現を集めた辞書を生成し、これを低評価用辞書136として記憶部130に記憶させる(S104)。これによって本フローチャートの処理が終了する。
図6は、高評価用辞書134の一例を示す図である。図示の例のように、高評価用辞書134は、第1種類に対して、第2種類と、ラベルと、実際にレビュー文書から抽出された表現とが対応付けられたデータであってよい。なお、低評価用辞書136についても、高評価用辞書134と同様に、第1種類に対して、第2種類と、ラベルと、実際にレビュー文書から抽出された表現とが対応付けられたデータであるものとする。
第1種類は、レビュー文書に含まれ得る表現が、上述した「属性」、「属性値」、「評価」のいずれか、またはこれらのいずれでもない「その他」であることを表している。第2種類は、「属性」および「属性値」に該当する表現が、商品またはサービスを評価の観点としているのか、或いはそれら商品またはサービスを販売する店舗を評価の観点としているのかを表している。ラベルは、各表現がどの種類に該当する表現であるのかを識別する識別子である。例えば、第1種類が「属性」であり、第2種類が「商品」である表現には、<k>のラベルが付与され、第1種類が「属性」であり、第2種類が「店舗」である表現には、<ks>のラベルが付与され、第1種類が「属性値」であり、第2種類が「商品」である表現には、<v>のラベルが付与され、第1種類が「属性値」であり、第2種類が「店舗」である表現には、<vs>のラベルが付与され、第1種類が「評価」である表現には、<e>のラベルが付与される。
辞書には、<k>のラベルが付与される表現として、例えば、「価格」、「音」、「コスパ」といった表現が登録され、<ks>のラベルが付与される表現として、例えば、「発送」、「対応」といった表現が登録され、<v>のラベルが付与される表現として、例えば、「安い」、「小さい」、「疲れない」といった表現が登録され、<vs>のラベルが付与される表現として、例えば、「迅速」、「即納」といった表現が登録され、<e>のラベルが付与される表現として、例えば、「良い」、「最高」、「満足」といった表現が登録される。
<v>のラベルや<vs>のラベルが付与される表現、すなわち「属性値」に該当する表現は、その表現の直前などに「属性」に該当する表現(主体)を伴わなくとも、その表現単独である程度主体(評価の観点)を推測することができる。例えば、「小さい」という表現であれば、その「小さい」という表現の主体は、商品のような実体をもつ物であると推測できる。これに対して、<e>のラベルが付与される表現、すなわち「評価」に該当する表現は、その表現の直前などに「属性」に該当する表現(主体)を伴わなければ、その表現単独で主体を推測することが困難である。例えば、「最高」という表現の場合、その表現の主体が、商品やサービスであるのか、商品やサービスを販売する店舗であるのか、或いは別の何かであるのかを区別することができない。そのため、「評価」に該当する表現には、第2種類が対応付けられない。
[抽出部、スコア算出部、およびレビュー選択部の処理フロー]
以下、抽出部116、スコア算出部118、およびレビュー選択部120による一連の処理の流れをフローチャートに即して説明する。図7は、抽出部116、スコア算出部118、およびレビュー選択部120による一連の処理の流れを示すフローチャートである。本フローチャートの処理は、例えば、レビュー文書情報132の更新周期に合せて繰り返し行われてよい。
まず、抽出部116は、レビュー文書情報132に含まれる複数のレビュー文書の中から、所望のレビュー対象(例えば、販売サイトで販売される商品)に関してレビューされた複数のレビュー文書を選択する(S200)。所望のレビュー対象に関する複数のレビュー文書は、同じユーザによってレビューされたものであってもよいし、不特定多数のユーザによってレビューされたものであってもよい。
次に、抽出部116は、抽出条件情報138が示す抽出条件に基づいて、高評価用辞書134と低評価用辞書136とのそれぞれに登録された表現を、選択した複数のレビュー文書のそれぞれから抽出する(S202)。
図8は、抽出条件情報138の一例を示す図である。図示の例のように、抽出条件情報138が示す抽出条件は、最優先事項として、以下の条件を含む。
条件(I):ラベル<k>の表現の後に、格助詞または係助詞を挟んでラベル<v>または<e>の表現が出現する場合、ラベル<k>の表現から、ラベル<v>または<e>の表現までの連続した文字列を一つのフレーズとして抽出すること。なお、ラベル<k>の表現と、ラベル<v>または<e>の表現との間には、助詞に加えて、「とても」や「かなり」といった副詞などが出現してもよい。この場合、条件(I)は、ラベル<k>の表現の後の2つの形態素以内に、ラベル<v>または<e>の表現が出現することであってよい。
条件(II):ラベル<k>の表現の後に、助詞などの他の表現を挟まずにラベル<v>または<e>の表現が出現する場合、それらの表現を出現順に組み合わせた一連の文字列を一つのフレーズとして抽出すること。
条件(III):ラベル<v>または<e>の表現の後に、助詞などの他の表現を挟まずにラベル<k>の表現が出現する場合、それらの表現を出現順に組み合わせた一連の文字列を一つのフレーズとして抽出すること。
また、抽出条件は、最優先事項の次に優先すべき事項として、以下の条件を含む。
条件(IV):ラベル<v>の表現の前後に、ラベル<k>の表現が出現せず、ラベル<v>の表現が単独で出現する場合、ラベル<v>の表現を抽出すること。
条件(V):ラベル<k>の表現の前後に、ラベル<v>または<e>の表現が出現せず、ラベル<k>の表現が単独で出現する場合、ラベル<k>の表現を抽出すること。
ラベル<k>とラベル<v>とを組み合わせた条件(I)、(II)、(III)のいずれかを満たすフレーズは、「第1フレーズ」の一例であり、ラベル<k>とラベル<e>とを組み合わせた条件(I)、(II)、(III)のいずれかを満たすフレーズは、「第2フレーズ」の一例である。
例えば、「音が小さい」という文章を考えた場合、「音」はラベル<k>の表現であり、「小さい」はラベル<v>の表現であり、「が」は格助詞である。この場合、条件(I)に従って、「音」で始まり「小さい」で終わる一連の文字列「音が小さい」が一つのフレーズとして抽出される。
図9から図11は、抽出条件に従ってレビュー文書から辞書に登録された表現を抽出する方法を説明するための図である。図9から図11の例では、レビュー対象がイヤホンである場合のレビュー文書を表している。
例えば、抽出部116が、S200の処理で、図9に例示したレビュー文書1~5を選択したとする。この場合、まず、抽出部116は、図10に示すように、最優先事項(第1優先度)の条件(I)、(II)、(III)に従って、レビュー文書1から表現の組み合わせであるフレーズを抽出する。例えば、「価格が安くて、音も最高でした。」というレビュー文書1では、条件(I)を満たす「価格が安く」という文字列と、「音も最高」という文字列とがフレーズとして抽出される。
抽出部116は、レビュー文書1~5のそれぞれから、最優先事項の条件(I)、(II)、(III)を満たす文字列を抽出し終えると、図11に示すように、次に、レビュー文書1~5のそれぞれから、次の優先事項(第2優先度)の条件(IV)および(V)を満たす文字列を抽出する。例えば、「安いですね。本当に最高です。」というレビュー文書4では、条件(IV)を満たす「安い」という文字列が抽出される。
この際、抽出部116は、最優先事項の条件(I)、(II)、(III)を満たし、一度でも抽出した文字列については、条件(IV)および(V)を満たす文字列であっても抽出しない。言い換えれば、抽出部116は、最優先事項の条件(I)、(II)、(III)を満たす文字列をレビュー文書から除き、そのレビュー文書から、条件(IV)および(V)を満たす文字を抽出する。
例えば、「価格が安くて、音も最高でした。」というレビュー文書1では、「価格が安く」という文字列と、「音も最高」という文字列とが条件(I)を満たしており、更に「安く」という文字列が条件(IV)を満たしている。このような場合、抽出部116は、「価格が安く」という文字列を抽出した後に、「安く」という文字列は抽出しない。
図7のフローチャートの説明に戻り、次に、スコア算出部118は、複数のレビュー文書のそれぞれについて、抽出部116によって抽出された表現(評価の観点をもつラベル<k>とラベル<v>の表現)の種類数を算出する(S204)。例えば、スコア算出部118は、各レビュー文書について、ラベル<k>の表現を含むフレーズの数と、単独で出現するラベル<k>やラベル<v>の表現の数をカウントし、これらのカウントした数の合計値を表現の種類数として算出する。
図12は、表現の種類数の算出結果の一例を示す図である。例えば、図9から図11に例示したレビュー文書の場合、レビュー文書1からは、「価格が安く」、「音も最高」というフレーズが抽出されており、レビュー文書2からは、「音も小さく」というフレーズが抽出されており、レビュー文書3からは、「小さく」、「疲れない」、「装着感も良好」というフレーズが抽出されており、レビュー文書4からは、「安い」というフレーズが抽出されており、レビュー文書5からは、「価格が安い」、「音も最高」というフレーズが抽出されている。従って、スコア算出部118は、レビュー文書1については、表現の種類数を2とし、レビュー文書2については、表現の種類数を1とし、レビュー文書3については、表現の種類数を3とし、レビュー文書4については、表現の種類数を1とし、レビュー文書5については、表現の種類数を2として算出する。
なお、スコア算出部118は、抽出部116によって抽出された複数の表現が互いに同じ種類の表現である場合、それら表現を1種類としてカウントしてよい。
例えば、スコア算出部118は、抽出部116によって最優先事項の条件(I)、(II)、(III)を満たす複数の文字列がフレーズとして抽出された場合、それら複数のフレーズに含まれる「属性」の表現、すなわちラベル<k>の表現同士を比較し、比較した表現同士が互いに同じ表現である場合、ラベル<k>が同じフレーズ同士を同じ種類の表現としてカウントする。具体的には、レビュー文書1から、「音も最高」というフレーズと、「音が素晴らしい」というフレーズとが抽出された場合、両者のフレーズには、ラベル<v>の「音」が共通して含まれているため、これら2つのフレーズは1種類としてカウントされる。
また、スコア算出部118は、抽出部116によって次の優先事項の条件(IV)を満たす複数の文字列が抽出された場合、「属性値」の表現、すなわちラベル<v>の表現同士を比較し、比較した表現同士が互いに同じ表現である場合、それらを同じ種類の表現としてカウントする。同様に、スコア算出部118は、抽出部116によって次の優先事項の条件(V)を満たす複数の文字列が抽出された場合、「属性」の表現、すなわちラベル<k>の表現同士を比較し、比較した表現同士が互いに同じ表現である場合、それらを同じ種類の表現としてカウントする。
次に、スコア算出部118は、算出した表現の種類数に基づいて、表現が抽出された各レビュー文書の内容の充実度を評価したスコア(以下、レビュースコアSと称する)を算出する(S206)。
例えば、スコア算出部118は、数式(1)に基づいて、各レビュー文書のレビュースコアSを算出する。
Figure 0006993955000001
数式(1)におけるmは、表現の種類数を表し、Lは、レビュー文書の文字数(レビュー長)を表し、nは、基準文字数を表している。基準文字数nは、ユーザがレビュー文書を長くもなく、短くもないと感じる程度の文字数であり、例えば、160文字数程度である。
例えば、スコア算出部118は、レビュー文書の文字数Lが基準文字数n以下の場合(L≦n)、表現の種類数mと、レビュー文書の文字数Lを基準文字数nで除算した値(L/n)との積を、レビュースコアSとして算出する。また、スコア算出部118は、レビュー文書の文字数Lが基準文字数nを超える場合(L>n)、表現の種類数mと、基準文字数nをレビュー文書の文字数Lで除算した値(n/L)との積を、レビュースコアSとして算出する。
これによって、例えば、基準文字数nを160文字数とした場合、レビュー文書の文字数Lが160文字数に近いほど、レビュースコアSを大きくし、レビュー文書の文字数Lが160文字よりも多いまたは少ないほど、レビュースコアSを小さくすることができる。また、レビュー文書から抽出された表現の種類数mが多いほど、レビュースコアSを大きくし、レビュー文書から抽出された表現の種類数mが少ないほど、レビュースコアSを小さくすることができる。このように、ユーザが読みやすい長さのレビュー文書であり、そのレビュー文書に観点を含む表現が多いほど、内容が充実したレビュー文書であると評価することができる。
次に、レビュー選択部120は、スコア算出部118によって算出されたレビュースコアSに基づいて、S200の処理で選択された複数のレビュー文書の中から、他のレビュー文書に比して、より内容が充実した一以上のレビュー文書を選択する(S208)。例えば、レビュー選択部120は、複数のレビュー文書のうち、レビュースコアSが大きいレビュー文書ほど、他のレビュー文書に比して、より内容が充実したレビュー文書であるものとして選択してよい。
これを受けて、上述したコンテンツ提供部112は、レビュー選択部120によって選択されたレビュー文書が掲載されたウェブページを生成する。そして、コンテンツ提供部112は、レビュー文書を含むコンテンツのリクエストが通信部102によって受信されると、通信部102を制御して、リクエスト元の端末装置10に、生成したウェブページをレスポンスとして送信する。これによって、本フローチャートの処理が終了する。
図13は、レビュー文書を含むコンテンツの一例を示す図である。例えば、図3に例示したウェブページの表示領域R2に複数のレビュー文書が並べられて表示される場合、コンテンツ提供部112は、これら複数のレビュー文書の並べ方を、レビュースコアSに基づいて決定する。図示の例のように、コンテンツ提供部112は、スコア算出部118によって算出されたレビュースコアSが大きいレビュー文書であるほど、表示領域R2の上側に表示し、レビュースコアSが小さいレビュー文書であるほど、表示領域R2の下側に表示する。言い換えれば、コンテンツ提供部112は、レビュー選択部120によって、より内容が充実しているものとして選択されたレビュー文書ほど、表示領域R2の上側に表示する。このようなレビュー文書の表示配置とすることで、より内容が充実しているレビュー文書ほど優先的にユーザに読ませることができる。
図14は、レビュー文書を含むコンテンツの他の例を示す図である。図示のように、例えば、販売サイトなどで、複数のカテゴリに分類される商品を横断的に検索するために、ユーザが検索窓Wに商品名などのクエリを入力した場合、販売サイトのウェブページには、入力されたクエリを商品名や説明文に含む、各店舗の各商品が一覧として表示される。このような場合、コンテンツ提供部112は、各商品に対応付けられた複数のレビュー文書のうち、最もレビュースコアSが大きいレビュー文書を商品の検索結果に対応付けて表示させてよい。言い換えれば、コンテンツ提供部112は、レビュー選択部120によって、最も内容が充実しているものとして選択されたレビュー文書を商品の検索結果に対応付けて表示させてよい。図示の例では、商品A、B、Cのそれぞれが表示される領域に、最もレビュースコアSの大きいレビュー文書が「最も有用なレビュー」として配置されている。このように、レビュー対象の検索結果の一覧に、レビュースコアSが最も大きい代表的なレビュー文書を掲載することで、商品の画像や価格といった情報に加えて、その商品の使用感などを一目でユーザに理解させることができる。
図15は、レビュー文書を含むコンテンツの他の例を示す図である。図示のように、例えば、コンテンツ提供部112は、レビュー対象の検索結果をランキング形式で表示させる際に、各レビュー対象の検索結果のランクを、レビュースコアSに応じて変動させてよい。例えば、各レビュー対象の検索結果のランクが、直近の売上件数や、レビュー件数、評点の高さ、クリック率、購入率といった種々の指標値で決められる場合、コンテンツ提供部112は、これらの各種指標値をレビュースコアSで重みづけてよい。これによって、例えば、各種指標値をレビュースコアSで重みづける前では、商品A、B、Cの順でランキングされていたものが、レビュースコアSを用いて各種指標値を重みづけることで、商品B、C、Aのような順にランキングし直すことができる。
以上説明した実施形態によれば、レビュー文書から、(1)「属性」という種類の表現(ラベル<k>の表現)、(2)「属性値」という種類の表現(ラベル<v>の表現)、(3)「属性」および「属性値」のそれぞれの表現を組み合わせたフレーズ(ラベル<k>+ラベル<v>のフレーズ)、(4)「評価」という種類の表現と「属性」の表現を組み合わせたフレーズ(ラベル<k>+ラベル<e>のフレーズ)のうち、少なくともいずれか一つを抽出し、抽出した表現の種類数に基づいて、複数のレビュー文書の中から、他のレビュー文書に比して、より内容が充実しているレビュー文書を選択するため、レビューを読むユーザの満足度を向上させることができる。
また、上述した実施形態によれば、各レビュー文書について、ラベル<k>の表現を含むフレーズの数と、単独で出現するラベル<k>やラベル<v>の表現の数をカウントし、これらのカウントした数の合計値を表現の種類数として算出し、算出した表現の種類数mと、レビュー文書の文字数Lとに基づいて、各レビュー文書のレビュースコアSを算出し、その算出したレビュースコアSに基づいて、より内容が充実しているレビュー文書を選択するため、ユーザが読みやすい長さであり、観点を含む表現が多い内容が充実したレビュー文書から優先的にユーザに提供することができる。
例えば、レビュー文書が短くて情報量が少ない場合、その文書は読みやすいものの、ユーザにとって参考になる情報が足りないことが多い。一方で、レビュー文書が長くて情報量が多い場合、ユーザにとって参考になる情報も多く存在している蓋然性が高いものの、ユーザが読むのを億劫に感じ、読み飛ばされてしまう場合があったり、全てを画面に表示し切れない場合があったりする。このように、レビュー文書には適切な長さが存在し得る。また、更に、レビュー文書が長くて情報量が多い場合であっても、同じことを何度も繰り返し言及していたり、一つの観点について掘り下げて説明していたりする場合があり、必ずしもユーザにとって参考になる情報が多いとは限らない。
これに対して、上述した実施形態では、表現の種類の多さという視点から、ユーザが参考になり得る情報量の多さを判断するとともに、レビュー文書の長さという視点から、ユーザが読みやすい文書であるのかを判断しているため、レビュー文書の内容の充実度合を適切に評価することができる。この結果、ユーザの満足度がより向上しやすいレビュー文書をユーザに提供することができる。
<ハードウェア構成>
上述した実施形態の情報処理装置100は、例えば、図16に示すようなハードウェア構成により実現される。図16は、実施形態の情報処理装置100のハードウェア構成の一例を示す図である。
情報処理装置100は、NIC100-1、CPU100-2、RAM100-3、ROM100-4、フラッシュメモリやHDDなどの二次記憶装置100-5、およびドライブ装置100-6が、内部バスあるいは専用通信線によって相互に接続された構成となっている。ドライブ装置100-6には、光ディスクなどの可搬型記憶媒体が装着される。二次記憶装置100-5、またはドライブ装置100-6に装着された可搬型記憶媒体に格納されたプログラムがDMAコントローラ(不図示)などによってRAM100-3に展開され、CPU100-2によって実行されることで、制御部110が実現される。制御部110が参照するプログラムは、ネットワークNWを介して他の装置からダウンロードされてもよい。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何ら限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1…情報処理システム、10…端末装置、100…情報処理装置、102…通信部、110…制御部、112…コンテンツ提供部、114…辞書生成部、116…抽出部、118…スコア算出部、120…レビュー選択部、130…記憶部

Claims (9)

  1. 複数のレビュー文書のそれぞれから、評価の観点を表す第1表現と、前記評価の観点の肯定または否定を表す第2表現と、前記第1表現および前記第2表現を組み合わせた第1フレーズと、肯定または否定を表す第3表現および前記第1表現を組み合わせた第2フレーズとのうち、少なくともいずれか一つを抽出する抽出部と、
    前記抽出部による抽出結果に基づいて、前記複数のレビュー文書の中から、他のレビュー文書に比して、より内容が充実した一以上のレビュー文書を選択する選択部と、を備え、
    前記選択部は、前記抽出部が前記複数のレビュー文書のそれぞれから抽出した表現の種類数に基づいて、前記内容が充実した一以上のレビュー文書を選択し、
    前記複数のレビュー文書のそれぞれについて、前記第1表現の数と、前記第2表現の数と、前記第1フレーズの数と、前記第2フレーズの数との合計を前記表現の種類数として算出し、前記算出した種類数に基づいて、前記複数のレビュー文書のそれぞれについて、内容の充実度を評価したスコアを算出する算出部を更に備え、
    前記選択部は、前記算出部によって算出されたスコアに基づいて、前記内容が充実した一以上のレビュー文書を選択する、
    報処理装置。
  2. 前記算出部は、前記レビュー文書の文字数と、前記算出した種類数とに基づいて、前記スコアを算出する、
    請求項に記載の情報処理装置。
  3. 前記算出部は、
    前記レビュー文書の文字数が基準文字数以下の場合、前記種類数と、前記レビュー文書の文字数を前記基準文字数で除算した値との積を、前記スコアとして算出し、
    前記レビュー文書の文字数が前記基準文字数を超える場合、前記種類数と、前記基準文字数を前記レビュー文書の文字数で除算した値との積を、前記スコアとして算出する、
    請求項に記載の情報処理装置。
  4. 前記選択部は、前記複数のレビュー文書のうち、前記算出部により算出されたスコアが大きい前記レビュー文書ほど、他のレビュー文書に比して、より内容が充実したレビュー文書であるものとして選択する、
    請求項からのうちいずれか一項に記載の情報処理装置。
  5. 前記複数のレビュー文書のうち、前記スコアが大きい前記レビュー文書ほど表示領域の上側に並べ、前記スコアが小さい前記レビュー文書ほど表示領域の下側に並べたコンテンツを、端末装置に提供する提供部を更に備える、
    請求項またはに記載の情報処理装置。
  6. 前記複数のレビュー文書のうち、前記スコアが最も大きい前記レビュー文書を含むコンテンツを、端末装置に提供する提供部を更に備える、
    請求項からのうちいずれか一項に記載の情報処理装置。
  7. 前記選択部により選択された一以上のレビュー文書を含むコンテンツを、端末装置に提供する提供部を更に備える、
    請求項1からのうちいずれか一項に記載の情報処理装置。
  8. コンピュータが、
    複数のレビュー文書のそれぞれから、評価の観点を表す第1表現と、前記評価の観点の肯定または否定を表す第2表現と、前記第1表現および前記第2表現を組み合わせた第1フレーズと、肯定または否定を表す第3表現および前記第1表現を組み合わせた第2フレーズとのうち、少なくともいずれか一つを抽出し、
    前記抽出した結果に基づいて、前記複数のレビュー文書の中から、他のレビュー文書に比して、より内容が充実した一以上のレビュー文書を選択
    前記複数のレビュー文書のそれぞれから抽出した表現の種類数に基づいて、前記内容が充実した一以上のレビュー文書を選択し、
    前記複数のレビュー文書のそれぞれについて、前記第1表現の数と、前記第2表現の数と、前記第1フレーズの数と、前記第2フレーズの数との合計を前記表現の種類数として算出し、前記算出した種類数に基づいて、前記複数のレビュー文書のそれぞれについて、内容の充実度を評価したスコアを算出し、
    前記算出したスコアに基づいて、前記内容が充実した一以上のレビュー文書を選択する、
    情報処理方法。
  9. コンピュータに、
    複数のレビュー文書のそれぞれから、評価の観点を表す第1表現と、前記評価の観点の肯定または否定を表す第2表現と、前記第1表現および前記第2表現を組み合わせた第1フレーズと、肯定または否定を表す第3表現および前記第1表現を組み合わせた第2フレーズとのうち、少なくともいずれか一つを抽出する処理と、
    前記抽出した結果に基づいて、前記複数のレビュー文書の中から、他のレビュー文書に比して、より内容が充実した一以上のレビュー文書を選択する処理と、
    前記複数のレビュー文書のそれぞれから抽出した表現の種類数に基づいて、前記内容が充実した一以上のレビュー文書を選択する処理と、
    前記複数のレビュー文書のそれぞれについて、前記第1表現の数と、前記第2表現の数と、前記第1フレーズの数と、前記第2フレーズの数との合計を前記表現の種類数として算出し、前記算出した種類数に基づいて、前記複数のレビュー文書のそれぞれについて、内容の充実度を評価したスコアを算出する処理と、
    前記算出したスコアに基づいて、前記内容が充実した一以上のレビュー文書を選択する処理と、
    を実行させるためのプログラム。
JP2018229167A 2018-12-06 2018-12-06 情報処理装置、情報処理方法、およびプログラム Active JP6993955B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018229167A JP6993955B2 (ja) 2018-12-06 2018-12-06 情報処理装置、情報処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018229167A JP6993955B2 (ja) 2018-12-06 2018-12-06 情報処理装置、情報処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2020091730A JP2020091730A (ja) 2020-06-11
JP6993955B2 true JP6993955B2 (ja) 2022-01-14

Family

ID=71012924

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018229167A Active JP6993955B2 (ja) 2018-12-06 2018-12-06 情報処理装置、情報処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP6993955B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013161510A1 (ja) 2012-04-25 2013-10-31 インターナショナル・ビジネス・マシーンズ・コーポレーション 評価の極性に基づいた文章の分類方法、コンピュータ・プログラム、コンピュータ

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013161510A1 (ja) 2012-04-25 2013-10-31 インターナショナル・ビジネス・マシーンズ・コーポレーション 評価の極性に基づいた文章の分類方法、コンピュータ・プログラム、コンピュータ

Also Published As

Publication number Publication date
JP2020091730A (ja) 2020-06-11

Similar Documents

Publication Publication Date Title
US9244917B1 (en) Generating a layout
JP5662961B2 (ja) レビュー処理方法およびシステム
US9659067B2 (en) Providing a search results document that includes a user interface for performing an action in connection with a web page identified in the search results document
US20140172642A1 (en) Analyzing commodity evaluations
CN106462613B (zh) 基于用户属性来对建议进行排名
US10977264B2 (en) Selecting supplemental content for inclusion in a network page
US20160253744A1 (en) Information processing system, information processing system control method, information processing device, information processing device control method, program, and information storage medium
JP2013125470A (ja) 広告決定システム、広告決定方法およびプログラム
JP5302614B2 (ja) 施設関連情報の検索データベース形成方法および施設関連情報検索システム
US20140372207A1 (en) Profit index value generation system and profit index value generation method
JP6479239B1 (ja) 情報処理装置、情報処理システム、情報処理方法、およびプログラム
US10394804B1 (en) Method and system for increasing internet traffic to a question and answer customer support system
JP4883644B2 (ja) リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法
JP4269698B2 (ja) 意見分析方法、意見分析装置、および意見分析プログラム
JP5559750B2 (ja) 広告処理装置、情報処理システム及び広告処理方法
JP6993955B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6960553B2 (ja) ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム
JP6994452B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5011185B2 (ja) 情報分析装置、情報分析方法、及び情報分析プログラム
JP6982546B2 (ja) 情報提供装置、情報提供方法、およびプログラム
KR101021204B1 (ko) 인터넷을 이용한 의견 검색 및 광고 서비스 방법
US9390139B1 (en) Presentation of content items in view of commerciality
JP6644492B2 (ja) 装置、方法、および、プログラム
KR101044699B1 (ko) 인터넷을 이용한 의견 검색 및 광고 서비스 시스템
US11880653B2 (en) Providing customized term explanation

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200313

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210614

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211210

R150 Certificate of patent or registration of utility model

Ref document number: 6993955

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350