JP6392042B2 - 情報提供装置、情報を提供する方法およびプログラム - Google Patents

情報提供装置、情報を提供する方法およびプログラム Download PDF

Info

Publication number
JP6392042B2
JP6392042B2 JP2014185605A JP2014185605A JP6392042B2 JP 6392042 B2 JP6392042 B2 JP 6392042B2 JP 2014185605 A JP2014185605 A JP 2014185605A JP 2014185605 A JP2014185605 A JP 2014185605A JP 6392042 B2 JP6392042 B2 JP 6392042B2
Authority
JP
Japan
Prior art keywords
information
database
subjectivity
cause
classifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014185605A
Other languages
English (en)
Other versions
JP2016057989A (ja
Inventor
恭子 小松
恭子 小松
広海 石先
広海 石先
服部 元
元 服部
滝嶋 康弘
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2014185605A priority Critical patent/JP6392042B2/ja
Publication of JP2016057989A publication Critical patent/JP2016057989A/ja
Application granted granted Critical
Publication of JP6392042B2 publication Critical patent/JP6392042B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、商品またはサービスに関する情報を提供する情報提供装置、情報を提供する方法およびプログラムに関する。
従来、ある事象に関連する事象間の因果関係を把握するために、Web文書から要因を抽出することが行なわれている。例えば、非特許文献1は、事象間の因果関係を見つける手がかりとなる表現を基に、Web文書から要因を検索、抽出してさらに因果関係ネットワークを構築する手法を提案している。そのネットワークは因果関係の要因とその結果をノードとして配置し、有効グラフで関係を表現している。
また、非特許文献2は、商品レビューやブログ等のテキスト情報からユーザの要望、疑問の声や困難な話題を分析し、クレーム分析や好評意見を調査した結果を可視化するサービスを開示している。非特許文献2のサービスは、好意的、否定的な意見を色分けし全体的な意見を簡単に把握できる形で示したり、意見をランキング表示させている。また、意見を分類させて、分類別投稿数の時間推移を示す見せ方もしている。
青野壮志、太田学、"要因検索による因果関係ネットワークの構築と因果知識の獲得"、[online]、DEIM Forum 2010 B9-1、[平成26年9月8日検索]、インターネット<URL:http://db-event.jpn.org/deim2010/proceedings/files/B9-1.pdf> 株式会社日立システムズ、"テキストマイニングツール見える化エンジン"、[online]、[平成26年9月8日検索]、インターネット<URL:http://www.hitachi-systems.com/solution/s107/mieruka/>
しかしながら、非特許文献1記載の技術は、検索語に対する要因をWebから検索する際、時間情報を考慮せずに要因関係があるワードを抽出するに過ぎず、顧客の意見や評判を商品開発やサービス改良に活かすことはできない。
また、非特許文献2で開示されるサービスは、対象となるキーワードに関するお客様の評判意見をポジネガやユーザのプロフィール別に分類し可視化しているが、収集した意見の原因を対象としていない。そのため、ユーザの意見を把握して商品開発やサービス改良、システム改修等具体的にマーケティングに活用することが難しい。
本発明は、このような事情に鑑みてなされたものであり、特定の商品またはサービスの提供者は、ユーザの意見を把握して商品開発やサービス改良、システム改修等具体的にマーケティングに活用できる情報提供装置、情報を提供する方法およびプログラムを提供することを目的とする。
(1)上記の目的を達成するため、本発明の情報提供装置は、商品またはサービスに関する情報を提供する情報提供装置であって、特定の商品またはサービスに関するものとして収集されたテキストデータから、前記テキストデータに含まれる主観を抽出し、前記主観を生じさせる原因を推定する分析部と、前記抽出された主観、前記推定された原因およびこれらを分類する項目を用いてデータベースを作成するデータベース作成部と、前記作成されたデータベースに基づいて前記特定の商品またはサービスに関する情報を出力する情報出力部と、を備えることを特徴としている。
これにより、特定の商品またはサービスに関してテキストデータから導かれた情報を提供できる。その結果、例えば特定の商品またはサービスの提供者は、ユーザの意見を把握して商品開発やサービス改良、システム改修など具体的にマーケティングに活用できる。
(2)また、本発明の情報提供装置は、前記分析部は、前記主観を抽出したテキストデータから前記主観に関するキーワードを抽出し、前記データベース作成部は、前記主観または原因を分類する項目として、前記主観を抽出したテキストデータから抽出されたキーワードを用いることを特徴としている。これにより、キーワードにより系統的な情報を提供できるため、特定の商品またはサービスの提供者は、容易に事業の状況を把握できる。
(3)また、本発明の情報提供装置は、前記分析部は、前記主観または原因を分類するカテゴリを特定し、前記データベース作成部は、前記主観または原因を分類する項目として、これらを分類するカテゴリを用いることを特徴としている。これにより、カテゴリにより系統的な情報を提供できるため、特定の商品またはサービスの提供者は、容易に事業の状況を把握できる。
(4)また、本発明の情報提供装置は、前記データベース作成部は、前記主観または原因を分類する項目として、前記主観を抽出したテキストデータの情報源の属性を用いることを特徴としている。これにより、例えば、商品またはサービスの提供を受けた消費者の年齢層や地域等で整理した情報を提供できる。
(5)また、本発明の情報提供装置は、前記データベース作成部は、特定の期間に作成されたテキストデータを対象に、前記主観または原因を分類する項目の各々が出現した出現率を算出することを特徴としている。これにより、特定の期間に出現した項目の出現率を情報として提供することができ、商品またはサービスの提供者は、現在生じている問題の優先順位等を容易に把握できる。
(6)また、本発明の情報提供装置は、前記情報出力部は、前記データベースを用いて、前記主観を分類する項目を上位ノードとし、前記原因を分類する項目を下位ノードとするツリー形式で情報を出力することを特徴としている。これにより、主観を生じさせた原因が分かりやすい形式で情報を提供することができる。
(7)また、本発明の情報提供装置は、前記情報出力部は、前記各ノードに対応する項目の重要度に応じて前記各ノードの形態を変えてツリーを構成することを特徴としている。これにより、例えば、頻度の多い項目を表すノードを大きくしたり、時期の古い項目を表すノードを暗くしたりすることができる。
(8)また、本発明の情報提供装置は、前記分析部は、リアルタイムに収集されたテキストデータを分析し、前記情報出力部は、前記分析結果に応じて前記特定の商品またはサービスに関する情報を出力することを特徴としている。これにより、分析結果に応じてリアルタイムに出力する情報を更新するため、特定の商品またはサービスの提供者は現在進行している状況を把握できる。
(9)また、本発明の情報提供装置は、前記情報出力部は、前記データベースに蓄積された主観または原因を分類する項目の数が、一定時間内に所定の条件を満たしたときに、アラームを出力することを特徴としている。これにより、例えば、項目の数が急激に増加している場合には、商品等に対する不満や要望が殺到している状況を想定できるが、そのような場合に、特定の商品またはサービスの提供者に向けてアラームを出力することができる。
(10)また、本発明の情報提供装置は、前記情報出力部は、前記データベースに蓄積された主観または原因を分類する項目の影響度を参照し、前記影響度が上位の項目については優先的にアラームを出力することを特徴としている。これにより、例えば、多くのテキストデータで言及され、解決可能な原因がある場合に、アラームで早急に対処すべき状況にあることを知ることができる。
(11)また、本発明の方法は、商品またはサービスに関する情報を提供する方法であって、特定の商品またはサービスに関するものとして収集されたテキストデータから、前記テキストデータの作成者による主観を抽出し、前記主観を生じさせる原因を推定するステップと、前記抽出された主観、前記推定された原因およびこれらを分類する項目を用いてデータベースを作成するステップと、前記作成されたデータベースに基づいて前記特定の商品またはサービスに関する情報を出力するステップと、を含むことを特徴としている。これにより、特定の商品またはサービスに関してテキストデータから導かれた情報を提供できる。
(12)また、本発明のプログラムは、商品またはサービスに関する情報を提供するプログラムであって、特定の商品またはサービスに関するものとして収集されたテキストデータから、前記テキストデータの作成者による主観を抽出し、前記主観を生じさせる原因を推定する処理と、前記抽出された主観、前記推定された原因およびこれらを分類する項目を用いてデータベースを作成する処理と、前記作成されたデータベースに基づいて前記特定の商品またはサービスに関する情報を出力する処理と、をコンピュータに実行させることを特徴としている。これにより、特定の商品またはサービスに関してテキストデータから導かれた情報を提供できる。
本発明によれば、特定の商品またはサービスの提供者は、ユーザの意見を把握して商品開発やサービス改良、システム改修など具体的にマーケティングに活用できる。
本発明の情報提供装置の構成を示すブロック図である。 共起語抽出処理の一例を示すフローチャートである。 原因語候補抽出処理の一例を示すフローチャートである。 複数原因の判定処理の一例を示すフローチャートである。 単一原因の判定処理の一例を示すフローチャートである。 商品またはサービスに関する情報の表示例を示す図である。 ツリー構造の表示例を示す図である。 時間軸の表示例を示す図である。 ツリー構造の表示例を示す図である。
以下に、本発明の実施の形態について、図面を参照しながら説明する。
[情報提供装置の構成]
図1は、情報提供装置100の構成を示すブロック図である。情報提供装置100は、サーバまたはPC等の端末であり、収集したデータを分析し、商品またはサービスに関する情報を提供する。情報提供装置100は、データ収集部110、分析部120、データベース作成部130および制御部140を備えている。
(データ収集部)
データ収集部110は、レビュー文、SNSの投稿、そのコメント等、様々なテキストデータを収集する。収集単位は、適宜、エントリ単位、文章単位、句読点単位等にすることができる。なお、収集データには、ブログ等インターネット上の投稿文や一連のメール文章といったコミュニケーション文を使うこともできる。表1に、収集された文節文のテキスト例を示す。
Figure 0006392042
(分析部)
分析部120は、特定の商品またはサービスに関するものとして収集されたテキストデータから、テキストデータに含まれる主観を抽出し、主観を生じさせる原因を推定する。例えば、主観または原因を分類するカテゴリを特定し、主観を抽出したテキストデータからその主観に関するキーワードを抽出することが好ましい。また、分析部120は、リアルタイム収集されたテキストデータを分析することもできる。
具体的には、分析部120は、主観抽出部121および原因抽出部122を備えている。主観抽出部121は、要望や不満という主観の判定を行ない、それらの主観を抽出する。要望判定は、テキスト検索手法やベクトル空間モデルにより文書分類を行ない、要望Dを抽出し、ラベル付けして行なう(表2参照)。
Figure 0006392042
例えば、関連技術1および2を用いて、学習データに含まれる要望データから要望特徴空間および、教師ベクトルを作成する。そして、その要望特徴空間に基づいて入力テキストの特徴ベクトルを作成し、教師ベクトルとの類似度に基づき要望ラベルを付与することができる。また、関連技術3を利用し、学習データに含まれる要望データから要望識別器を作成、利用することもできる。
[関連技術1]Bag-of-words model:http://en.wikipedia.org/wiki/Bag-of-words_model
[関連技術2]Mecab:http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html
[関連技術3]SVMLIGHT:http://svmlight.joachims.org/
不満判定は、情緒的表現を解析することにより不満Fを抽出し、ラベル付けする。情緒的表現の解析には、従来技術にあるように、整備された辞書やポジネガ判定等を用いることで実現する(表3参照)。
Figure 0006392042
原因抽出部122は、共起語抽出、原因語候補抽出および原因判定を行なうことで原因を抽出する。共起語抽出は、要望判定処理により要望とラベル付けされた文章(要望文章)と、不満判定処理により不満とラベル付けされた文章(不満文章)を、対応づけて、共起する単語の組み合わせを抽出する。共起語抽出処理の詳細は後述する。
対応づけは、例えば、抽出された不満文章を起点に、直近の要望文章をペアとすることでできる。例えば表3ではt5のF「暑い」とtnのD「風がほしい」が対応づけられ、これら2つと共起する、室温、湿度、エアコン、我慢等の単語が抽出される。
原因候補抽出は、共起語抽出処理で抽出された共起語に基づいて、テーブル作成処理で作成された確率テーブルを参照して行ない、該当する原因候補をすべて抽出する。例えば、上記ような共起語(室温、湿度、エアコン、我慢)がある場合、表4に示すように、3行目の「エアコンがついていない」、4行目の「エアコンが壊れている」等が抽出される。原因候補抽出処理の詳細は後述する。
Figure 0006392042
Figure 0006392042
Figure 0006392042
参照先は入力元の主観抽出部121の結果に応じて適宜変化させることができる。例えば、主観抽出部121にて要望、不満がとれた場合は表4に示すような3つの要素である要望、不満、原因(D,F,C)を含むテーブルDFCを優先して参照し、他のテーブルは第二、第三候補として参照することができる。このとき、第二候補は、要望、原因(D,C)の要素を含むテーブルDCでも不満、原因(F,C)の要素を含むテーブルFCでも構わない。不満だけしか抽出されていない場合や不満だけに注目する場合は、表6に示すような不満と原因(F,C)の2要素を含むテーブルFCを優先して参照し、要望を無視して、表4に示すような3つの要素を含むテーブルDFCを第二候補として参照することも考えられる(詳細は表7参照)。
Figure 0006392042
原因判定は、原因語候補抽出処理で抽出された原因語候補より、原因を決定する。原因判定の詳細は後述する。決定は、原因語候補のテーブルを参照し、確率値を用いて行なう。例えば、確率値の上位複数を表示することや、事前に設定した閾値より高いものを表示すること等が考えられる。例えば、表8に示すように原因語候補が抽出された場合、確率値を用いて、C1、C2、C3が優先して選ばれる。
Figure 0006392042
Figure 0006392042
同一確率のものが存在する場合の、原因判定における優先順位は、入力された文章Sのうち、要望抽出処理で抽出された要望Dおよび不満抽出処理で抽出された不満Fに対し、一番文節間隔が小さくなるような、原因Cを優先する処理を適用することができる。例えば、表8でC1、C2、C3は同確率であるが、表9よりC1はt3、C2はt7、C3はt50に位置し、対象となるt100のDとt5のFに対して、これらのいずれかに対して文節間隔が小さいC1とC2が優先して選ばれる。
なお、同一間隔のものが存在する場合は、DおよびFより前のCを優先することもできる。これは、文章が一般的に原因から結果の順に書かれる構造が多いことに起因する。例えば、表9のC1とC2の位置関係からは、C1が優先して選ばれる。上記のような処理を行なうことで原因を単一に絞る例については後述する。また、原因語候補として出てきた原因語を含む文章に、原因ラベルを付与することもできる。
(データベース作成部(DB作成部))
データベース作成部130は、抽出された主観、推定された原因およびこれらを分類する項目を用いてデータベースを作成する。主観または原因を分類する項目としては、主観を抽出したテキストデータから抽出されたキーワードを用いてデータベースを作成することが好ましい。これにより、キーワードにより系統的な情報を提供できるため、特定の商品またはサービスの提供者は、容易に事業の状況を把握できる。
主観または原因を分類する項目として、これらを分類するカテゴリを用いてもよい。これにより、カテゴリにより系統的な情報を提供できるため、特定の商品またはサービスの提供者は、容易に事業の状況を把握できる。
また、主観または原因を分類する項目として、主観を抽出したテキストデータの情報源の属性を用いてもよい。これにより、例えば、商品またはサービスの提供を受けた消費者の年齢層や地域等で整理した情報を提供できる。
具体的には、特定の期間に作成されたテキストデータを対象に、主観または原因を分類する項目の各々が出現した出現率を算出してもよい。これにより、特定の期間に出現した項目の出現率を情報として提供することができ、商品またはサービスの提供者は、現在生じている問題の優先順位等を容易に把握できる。
具体的には、データベース作成部130は、情報取得部131、キーワード抽出部132、カテゴリ分類部133、確率計算部134を備えている。データ収集部110で収集したデータのうち、分析部120でラベル付けされたデータを対象にデータベース作成を行なう。表10にデータベースの構成を示す。データベースには、キーワードリスト(KWL)、不満文(F)、不満カテゴリ(Fc)、要望文(D)、要望カテゴリ(Dc)、原因文(C)、原因カテゴリ(Cc)、投稿時間(Time)、出現確率(AR)が格納される。
Figure 0006392042
情報取得部131は、対象データから分析部により不満、要望、原因ラベルが付いた各文章(F列,D列,C列)、投稿時間(Time列)をデータベースに格納する。この際、ユーザの属性情報をデータベースに含めることもできる。属性情報は、年齢、性別、地域、職業等が考えられ、プロフィール推定により情報取得できる。これらの情報をデータベースに含めることにより、属性情報ごとの意見傾向分析等に利用できると考えられる。データベースの作成には、SNS等のネットワークから得られるデータを用いるの好ましいが、それ以外のデータを用いてもよい。
以下に、SNS以外のデータを用いたデータベース例を示す。
(例1)CSの電話対応データを利用する場合(利用者:オペレータ等)
電話応対時にお客様から得られる情報を入力する画面を用意する。得られる情報は例えば、音声により判別できる性別、応対で分かる不満/要望等の意見、お客様の属性情報等が考えられる。オペレータがリアルタイムに情報入力することにより情報を取得し、表10のデータベースを作成、更新することができる。また、入力した情報と同様の事例をリアルタイムに表示させることで、電話越しに頂いた意見に対する解決策を素早く発見する等も利用も考えられる。
(例2)企業が保持する顧客データベースを参照する場合(利用者:支店担当等)
SNS等で取得可能な表10のデータベースと、企業が保持する既存の顧客データベースやショップでの対応履歴により例1と同様に作成、更新したデータベースを参照する。例えば、支店担当者が利用する際、地域別に分析することで、都心で早期に出現した現象に対して、地方で先手の対策を打つ等の利用も考えられる。
キーワード抽出部132は、情報取得部131で格納した不満、要望、原因ラベルが付いた各文章やラベル付け前の元の文章より、トピックをキーワードとして抽出しデータベースのキーワードリスト(KWL列)に格納する。ここでいうトピックとは、商品名やサービス名等が考えられる。トピック分類は、予め各サービスごとに関連ワードを登録した辞書を用いることで実現できる。ただし実現方法は辞書に限らない。
カテゴリ分類部133は、カテゴリ分類処理は、ラベル付けされた不満、要望、原因を、予め用意されたカテゴリに分類して表10内のFc列、Dc列、Cc列に格納する。カテゴリ分類は前記キーワード抽出同様、各カテゴリごとに関連ワードを登録した辞書を用いることで実現できる。ただし実現方法は辞書に限らない。
確率計算部134は、不満カテゴリFcと要望カテゴリDcと原因カテゴリCcの出現確率を計算し格納する。算出は、例えば、不満カテゴリF1に対する要望がD1、D2の2つ、原因がC1−3、C11、C12の5つであった場合、5通りすべての出現率を1としたときの確率を計算する、または、一定期間に対する投稿数(投稿数/一定期間)を計算する、投稿数の増減率を用いる等の方法で行なう。この確率値を事象の影響度と捉えると、閾値以上の割合となる事象が発現した際、システム利用者にアラーム通知する等の機能を付加することも可能である。
(制御部)
制御部140は、入力された情報をもとにデータベースの情報を加工して出力する。入力(検索語)としては、商品名やサービス名等の検索クエリが挙げられる。また、表示させる期間を設定することができる。この他に、属性別表示のプルダウンを用意する等して、グラフに反映させるデータを選択することもできる。制御部140は、情報出力部141を含んでいる。なお、出力は、情報提供装置100に接続されたディスプレイ等の表示部に対して行なってもよいし、ネットワークを介して端末に配信することで行なってもよい。
情報出力部141は、作成されたデータベースに基づいて特定の商品またはサービスに関する情報を出力する。これにより、特定の商品またはサービスに関してテキストデータから導かれた情報を提供できる。その結果、例えば特定の商品またはサービスの提供者は、ユーザの意見を把握して商品開発やサービス改良、システム改修等具体的にマーケティングに活用できる。
情報出力部141は、データベースを用いて、主観を分類する項目を上位ノードとし、原因を分類する項目を下位ノードとするツリー形式で情報を出力することが好ましい。これにより、主観を生じさせた原因が分かりやすい形式で情報を提供することができる。
その際には、各ノードに対応する項目の重要度に応じて各ノードの形態を変えてツリーを構成することが好ましい。これにより、例えば、頻度の多い項目を表すノードを大きくしたり、時期の古い項目を表すノードを暗くしたりすることができる。
また、情報出力部141は、分析結果に応じてリアルタイムに特定の商品またはサービスに関する情報を出力することが好ましい。これにより、分析結果に応じてリアルタイムに出力する情報を更新するため、特定の商品またはサービスの提供者は現在進行している状況を把握できる。
情報出力部141は、データベースに蓄積された主観または原因を分類する項目の数が、一定時間内に所定の条件を満たしたときに、アラームを出力してもよい。これにより、例えば、項目の数が急激に増加している場合には、商品等に対する不満や要望が殺到している状況を想定できるが、そのような場合に、特定の商品またはサービスの提供者に向けてアラームを出力することができる。
その際に、データベースに蓄積された主観または原因を分類する項目の影響度を参照し、影響度が上位の項目については優先的にアラームを出力することが好ましい。これにより、例えば、多くのテキストデータで言及され、解決可能な原因がある場合に、アラームで早急に対処すべき状況にあることを知ることができる。
グラフ構築は、データベース作成部で作成されたデータベースより、入力ワードが前記データベースの本文またはキーワードリストに該当する行を複数抽出し、不満、要望、原因をノードとしてツリー上に並べることで行なうことができる。この際、不満、要望、原因の順序は問わない。
[情報提供装置の動作]
上記のように構成された情報提供装置100の動作を説明する。情報提供装置100は、データ収集し、収集したデータを分析して主観や原因を抽出し、その結果をもとにデータベースを作成し、作成されたデータベースを利用して、ユーザが求める商品またはサービスに関する情報を出力する。このうち、特に、共起語抽出処理、原因語候補抽出処理、複数または単一の原因の判定処理について、以下に詳細を説明する。
図2は、共起語抽出処理の一例を示すフローチャートである。まず、ラベル付けされた文章群を取得し(ステップS101)、要望ラベルまたは不満ラベルの有無を判定する(ステップS102)。ステップS102において、要望ラベルまたは不満ラベルの一方のみが存在した場合は、ステップS104に遷移し、要望ラベルまたは不満ラベルの両方が存在した場合は、要望、不満の対応付けを行なう(ステップS103)。次に、共起語抽出処理を行ない(ステップS104)、共起語を取得する(ステップS105)。
図3は、原因語候補抽出処理の一例を示すフローチャートである。まず、ラベル付けされた文章群および共起語を入力する(ステップS201)。次に、要望ラベルおよび不満ラベルの有無を判断する(ステップS202)。ステップS202において、要望ラベルおよび不満ラベルの両方があった場合は、テーブルDFCを参照し(ステップS203)、第二候補の有無を判断する(ステップS204)。ステップS204において、第二候補が無い場合は、ステップS208に遷移する一方、第二候補がある場合は、テーブルDCを参照し(ステップS205)、第三候補の有無を判断する(ステップS206)。ステップS206において、第三候補が無い場合は、ステップS208に遷移する一方、第三候補がある場合は、テーブルFCを参照し(ステップS207)、原因語候補を抽出する(ステップS208)。
次に、ステップS202において、不満ラベルのみがあった場合は、テーブルFCを参照し(ステップS209)、第二候補の有無を判断する(ステップS210)。第二候補が無い場合は、ステップS208に遷移する一方、第二候補がある場合は、テーブルDFCを参照して(ステップS211)、ステップS208に遷移する。
次に、ステップS202において、要望ラベルのみがあった場合は、テーブルDCを参照し(ステップS212)、第二候補の有無を判断する(ステップS213)。第二候補が無い場合は、ステップS208に遷移する一方、第二候補がある場合は、テーブルDFCを参照して(ステップS214)、ステップS208に遷移する。
図4は、複数原因の判定処理の一例を示すフローチャートである。ここでは、複数の原因を特定する場合について説明する。まず、対象の確率テーブルを取得し(ステップS301)、次に、確率テーブルにおける確率値が閾値以上であるかどうかを判断する(ステップS302)。確率値が閾値以上でない場合は、終了する一方、確率値が閾値以上である場合は、その確率値を有する原因を特定し(ステップS303)、終了する。
図5は、単一原因の判定処理の一例を示すフローチャートである。ここでは、同一確率が存在する場合、原因を一つに絞る例を示す。まず、対象の確率テーブルを取得し(ステップS401)、次に、確率テーブルにおける確率値が閾値以上であるかどうかを判断する(ステップS402)。確率値が閾値以上でない場合は、終了する一方、確率値が閾値以上である場合は、同一確率が存在するかどうかを判断する(ステップS403)。ステップS403において、同一確率が存在しない場合は、確率値を比較して(ステップS405)、大きい方を抽出することによって、その原因を特定し(ステップS406)、終了する。ステップS403において、同一確率が存在する場合は、文章間隔を比較し(ステップS404)、文章間隔が最小である原因を特定して(ステップS406)、終了する。なお、以上の処理は、コンピュータにプログラムを実行させることで行なわれる。
[表示例]
次に、情報出力の一例として表示例を説明する。図6は、商品またはサービスに関する情報の表示例を示す図である。図6の例では、ある年の1月下旬から2月中旬までの期間を対象としてある商品またはサービスに対して、不満F、要望D、原因Cの順でそれぞれの関係をツリーとして表示している。図6の例では、ノードC12をクリックすることで元の文章が表示されている。次に、各表示の具体例を説明する。
図7は、ツリー構造の表示例を示す図である。図7の例では、検索語を「電子マネー」としたときに、「迷惑メール」の不満とそれに対する「改善」、「サポート」の要望が生じており、原因として「登録」、「フィルター」が挙がっている。また、フィルターのノードをクリックすることで、「U11:フィルタのかけ方が分かりません」という投稿された元の文章が表示されている。
図8は、時間軸の表示例を示す図である。図8に示すように、ツリーの表示期間は時間軸で制御できる。時間軸は、年月日や、検索した商品のイベントのフェーズ(報道発表、発売日、改修日等)等時間変化を表す軸を表示し、表示したい時期を選択して表示することができる。時間軸上のバーをスライドさせることで、バーのある期間のグラフを表示することができる。例えば、図8ではtime軸は1月下旬、phase軸では改修後を示している。また、各ノードをクリックすることで、投稿された元の文章を表示させることもできる。
図9は、ツリー構造の表示例を示す図である。各ノードの色や大きさにより、投稿時期やその規模(声の大きさ、影響範囲)を示すこともできる。例えば、投稿時期が新しければ薄い色(例:C1ノード)、投稿時期が古ければ濃い色(例:C3ノード)であったり、規模が小さければノードの大きさを小さく、規模が大きければノードを大きく(例:C2ノード)表示する等が可能である。
100 情報提供装置
110 データ収集部
120 分析部
121 主観抽出部
122 原因抽出部
130 データベース作成部
131 情報取得部
132 キーワード抽出部
133 カテゴリ分類部
134 確率計算部
140 制御部
141 情報出力部

Claims (13)

  1. 商品またはサービスに関する情報を提供する情報提供装置であって、
    特定の商品またはサービスに関するものとして収集されたテキストデータから、前記テキストデータに含まれる主観を抽出し、前記主観を生じさせる原因を推定する分析部と、
    前記抽出された主観、前記推定された原因およびこれらを分類する項目を用いてデータベースを作成するデータベース作成部と、
    前記作成されたデータベースに基づいて前記特定の商品またはサービスに関する情報を出力する情報出力部と、を備え
    前記情報出力部は、前記データベースに蓄積された主観または原因を分類する項目の数が、一定時間内に所定の条件を満たしたときに、アラームを出力することを特徴とする情報提供装置。
  2. 前記情報出力部は、前記データベースに蓄積された主観または原因を分類する項目の影響度を参照し、前記影響度が上位の項目については優先的にアラームを出力することを特徴とする請求項記載の情報提供装置。
  3. 商品またはサービスに関する情報を提供する情報提供装置であって、
    特定の商品またはサービスに関するものとして収集されたテキストデータから、前記テキストデータに含まれる主観および投稿時間を抽出し、前記主観を生じさせる原因を推定する分析部と、
    前記抽出された主観および投稿時間、前記推定された原因並びにこれらを分類する項目を用いてデータベースを作成するデータベース作成部と、
    前記作成されたデータベースに基づいて前記特定の商品またはサービスに関する情報を出力する情報出力部と、を備え
    前記情報出力部は、前記データベースを用いて、前記主観を分類する項目を上位ノードとし、前記原因を分類する項目を下位ノードとしたツリー形式で、前記投稿時間および前記商品またはサービスのイベントのフェーズを含む時間変化を表わす時間軸とともに、情報を出力することを特徴とする情報提供装置。
  4. 前記情報出力部は、前記各ノードに対応する項目の重要度に応じて前記各ノードの形態を変えてツリーを構成することを特徴とする請求項記載の情報提供装置。
  5. 前記分析部は、前記主観を抽出したテキストデータから前記主観に関するキーワードを抽出し、
    前記データベース作成部は、前記主観または原因を分類する項目として、前記主観を抽出したテキストデータから抽出されたキーワードを用いることを特徴とする請求項3または請求項4記載の情報提供装置。
  6. 前記分析部は、前記主観または原因を分類するカテゴリを特定し、
    前記データベース作成部は、前記主観または原因を分類する項目として、これらを分類するカテゴリを用いることを特徴とする請求項3から請求項5のいずれかに記載の情報提供装置。
  7. 前記データベース作成部は、前記主観または原因を分類する項目として、前記主観を抽出したテキストデータの情報源の属性を用いることを特徴とする請求項から請求項のいずれかに記載の情報提供装置。
  8. 前記データベース作成部は、特定の期間に作成されたテキストデータを対象に、前記主観または原因を分類する項目の各々が出現した出現率を算出することを特徴とする請求項から請求項のいずれかに記載の情報提供装置。
  9. 前記分析部は、リアルタイムに収集されたテキストデータを分析し、
    前記情報出力部は、前記分析結果に応じて前記特定の商品またはサービスに関する情報を出力することを特徴とする請求項から請求項のいずれかに記載の情報提供装置。
  10. 前記情報出力部は、前記データベースに蓄積された主観または原因を分類する項目の数が、一定時間内に所定の条件を満たしたときに、アラームを出力することを特徴とする請求項から請求項のいずれかに記載の情報提供装置。
  11. 前記情報出力部は、前記データベースに蓄積された主観または原因を分類する項目の影響度を参照し、前記影響度が上位の項目については優先的にアラームを出力することを特徴とする請求項10記載の情報提供装置
  12. 商品またはサービスに関する情報を提供する方法であって、
    特定の商品またはサービスに関するものとして収集されたテキストデータから、前記テキストデータに含まれる主観を抽出し、前記主観を生じさせる原因を推定するステップと、
    前記抽出された主観、前記推定された原因およびこれらを分類する項目を用いてデータベースを作成するステップと、
    前記作成されたデータベースに基づいて前記特定の商品またはサービスに関する情報を出力するステップと、
    前記データベースに蓄積された主観または原因を分類する項目の数が、一定時間内に所定の条件を満たしたときに、アラームを出力するステップと、を含むことを特徴とする方法。
  13. 商品またはサービスに関する情報を提供するプログラムであって、
    特定の商品またはサービスに関するものとして収集されたテキストデータから、前記テキストデータに含まれる主観を抽出し、前記主観を生じさせる原因を推定する処理と、
    前記抽出された主観、前記推定された原因およびこれらを分類する項目を用いてデータベースを作成する処理と、
    前記作成されたデータベースに基づいて前記特定の商品またはサービスに関する情報を出力する処理と、
    前記データベースに蓄積された主観または原因を分類する項目の数が、一定時間内に所定の条件を満たしたときに、アラームを出力する処理と、をコンピュータに実行させることを特徴とするプログラム。
JP2014185605A 2014-09-11 2014-09-11 情報提供装置、情報を提供する方法およびプログラム Active JP6392042B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014185605A JP6392042B2 (ja) 2014-09-11 2014-09-11 情報提供装置、情報を提供する方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014185605A JP6392042B2 (ja) 2014-09-11 2014-09-11 情報提供装置、情報を提供する方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2016057989A JP2016057989A (ja) 2016-04-21
JP6392042B2 true JP6392042B2 (ja) 2018-09-19

Family

ID=55758669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014185605A Active JP6392042B2 (ja) 2014-09-11 2014-09-11 情報提供装置、情報を提供する方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6392042B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107688594B (zh) * 2017-05-05 2019-07-16 平安科技(深圳)有限公司 基于社交信息的风险事件的识别系统及方法
JP6638056B1 (ja) * 2018-12-28 2020-01-29 株式会社リクルートマネジメントソリューションズ 情報処理装置およびプログラム
CN110069595B (zh) * 2019-03-07 2023-11-07 平安科技(深圳)有限公司 语料标签确定方法、装置、电子设备及存储介质
CN114912935A (zh) * 2021-02-09 2022-08-16 日本电气株式会社 数据处理方法、装置和计算机可读存储介质
JP7318979B2 (ja) * 2021-10-22 2023-08-01 株式会社金星 貸与管理システム、管理サーバ、及び、管理端末
JP7359498B1 (ja) 2023-03-10 2023-10-11 株式会社mov 情報処理システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003157271A (ja) * 2001-11-20 2003-05-30 Mitsubishi Electric Corp テキストマイニング装置および方法
JP4501940B2 (ja) * 2007-01-18 2010-07-14 日本電気株式会社 意見抽出装置、意見抽出方法、意見抽出プログラム
JP5635486B2 (ja) * 2011-12-07 2014-12-03 株式会社オプティム 診断対処サーバ、診断対処方法、及び、診断対処サーバ用プログラム
WO2014017023A1 (ja) * 2012-07-26 2014-01-30 日本電気株式会社 原因表現抽出装置、原因表現抽出方法および原因表現抽出プログラム

Also Published As

Publication number Publication date
JP2016057989A (ja) 2016-04-21

Similar Documents

Publication Publication Date Title
JP6392042B2 (ja) 情報提供装置、情報を提供する方法およびプログラム
US9824321B2 (en) System and method for categorization of social media conversation for response management
US20150261773A1 (en) System and Method for Automatic Generation of Information-Rich Content from Multiple Microblogs, Each Microblog Containing Only Sparse Information
US11061974B2 (en) Facilitating discovery of information items using dynamic knowledge graph
US11080287B2 (en) Methods, systems and techniques for ranking blended content retrieved from multiple disparate content sources
JP2011154668A (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
JP6097126B2 (ja) レコメンド情報生成装置及びレコメンド情報生成方法
US10002187B2 (en) Method and system for performing topic creation for social data
US10949418B2 (en) Method and system for retrieval of data
Magnani et al. Conversation retrieval for microblogging sites
US11232522B2 (en) Methods, systems and techniques for blending online content from multiple disparate content sources including a personal content source or a semi-personal content source
US20110219299A1 (en) Method and system of providing completion suggestion to a partial linguistic element
CN113705250B (zh) 会话内容识别方法、装置、设备及计算机可读介质
JP2017091436A (ja) 特徴語選択装置
US10853820B2 (en) Method and apparatus for recommending topic-cohesive and interactive implicit communities in social customer relationship management
JP6457986B2 (ja) メッセージ分類システム、メッセージ分類方法及びプログラム
CN106503085B (zh) 基于域的可定制搜索系统、方法及技术
US11507593B2 (en) System and method for generating queryeable structured document from an unstructured document using machine learning
CN114780601A (zh) 一种数据查询方法、装置、电子设备和存储介质
KR20220068793A (ko) Rpa 모니터링을 이용한 뉴스 분석 서비스 제공 방법
Čišija et al. Collection and sentiment analysis of twitter data on the political atmosphere
EP3318987B1 (en) Method and system for retrieval of data
Dey Aspect extraction and sentiment classification of mobile apps using app-store reviews
US20220391928A1 (en) System and method for analysing customer experience from unstructured social media data
JP6253530B2 (ja) 原因推定装置、プログラムおよび原因推定方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170410

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180731

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180822

R150 Certificate of patent or registration of utility model

Ref document number: 6392042

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150