以下、図面を参照し、本発明のいくつかの実施形態における評価装置、評価方法、および評価プログラムについて説明する。
図1は、本発明の実施形態における評価装置1の一例を示す機能ブロック図である。評価装置1は、メディアM(情報媒体)から処理の対象となるデータ(以下、「処理対象データ」と称する)を収集して解析することで、評価対象となるブランドに関する評価を行う。メディアMは、例えば、テレビ、新聞、雑誌、ウェブ記事、ウェブログ、短文投稿サービスなどのSNS、株主のレポートを含む。
評価装置1は、ブランドに関する評価指標として、「ミラースコア(第1指標値)」、「サーモスコア(第2指標値)」、「リスク値(第3指標値)」という3つの値を算出する。「ミラースコア」とは、評価対象となるブランドを所有する企業が、同ブランドを世間にどのように見られたいか定義した内容に対して、世間が同ブランドをどのように思っているのかを表す指標である。「ミラースコア」とは、企業が期待する内容を示す用語(第1用語)の出現頻度を示す。このミラースコアを算出することで、企業が期待するブランドのイメージと世間の反応とのギャップを把握することができる。
「サーモスコア」とは、評価対象となるブランドを所有する企業の活動によって世間の感情を高めることができたかを表す指標である。「サーモスコア」とは、世間(需要家)の反応を示す用語(第2用語)の出現頻度を示す。このサーモスコアを算出することで、評価対象となるブランドに対する世間の感情を高めることができたか、世間の支持を得ることができたかを把握することができる。「リスク値」とは、評価対象となるブランドに関して、発生したリスクの程度を示す指標である。「リスク値」は企業または団体のリスクを示す用語(第3用語)の出現頻度およびメディアM(情報媒体)の種類に基づいて算出される。
評価装置1は、例えば、収集部10と、スクリーニング部12(抽出部)と、解析部14と、タグ付け部16と、スコアリング部18(算出部、生成部)と、表示部20と、記憶部22と、辞書DB24とを備える。辞書DB24は、例えば、企業辞書30と、トピック辞書32と、感性辞書34と、ミラー辞書36(第1記憶部)と、サーモ辞書38(第2記憶部)と、リスク辞書40(第3記憶部)とを備える。
収集部10は、メディアMから処理対象データを収集して記憶部22に記憶させる。収集部10は、例えば、インターネットNを介して、処理対象データを収集する。収集部10は、日次、週次などの所定のタイミングで処理対象データを収集する。収集元となるメディアMは、評価装置1のユーザによって予め決定されてよい。また、収集部10が、予め定義された文字列を含むインターネット上の文書などを周期的に収集するクローリング処理を行ってもよい。尚、評価装置1がオペレータPによる入力を受け付ける受付部(図示しない)を備え、収集部10がこの受付部に入力された処理対象データを収集してもよい。
スクリーニング部12は、収集部10によって収集された処理対象データのうち、評価対象となるブランドに関係ない処理対象データを除外する。スクリーニング部12は、メディアM(情報媒体)から収集されたデータの中から、企業または団体により予め設定されたブランドに関連するデータを抽出する。例えば、スクリーニング部12は、企業辞書30に記憶された辞書データを読み出す。この辞書データが、評価対象となるブランドとなる。そして、スクリーニング部12は、このブランドの同音異義語を含む処理対象データを除外する。また、例えば、スクリーニング部12は、予め定義された特定のURLから取得した処理対象データを除外し、予め定義された特定IDのウェブログおよびSNSから取得した処理対象データを除外し、同一のテキストを含むデータが多数存在する場合には異常データとして除外してもよい。
解析部14は、処理対象データに含まれるテキストを単語レベルに分割し、同じ意味のブランドを関連付けする形態素解析処理を行う。例えば、解析部14は、同一のブランドを示すアルファベット表記、漢字表記、カタカナ表記、平仮名表記などを関連付けし、同一のブランドを示すデータとして処理する。また、解析部14は、アルファベット表記に関しては、大文字、小文字、および大文字と小文字の混合文字の違いがある場合であっても、同一のブランドを示すデータとして処理してもよい。また、解析部14は、誤記(漢字変換誤記など)を含むテキストについても、評価対象となるブランドを示すデータとして処理してもよい。これにより、表記のゆれを補正することが可能である。
また、解析部14は、テキストに含まれる単語の係り受け元および係り受け先の関係を把握するとともに、テキストに含まれる単語の表現の強弱、多重否定、肯定疑問、係り受け、比較、方言の解釈を行う構文解析処理を行う。表現の強弱を解釈するとは、例えば、「A製品は極めて良い」という表現における“極めて”と、「A製品は若干良い」という表現における“若干”とでは、前者の“極めて”の方がより強い表現であると解釈することである。また、多重否定を解釈するとは、例えば、「A製品は良くない訳ではない」という二重の否定を含む表現を肯定的な表現として正しく解釈することである。
また、肯定疑問を解釈するとは、例えば、「A製品は良い製品だよね?」という肯定的な意図で表現された疑問文を肯定的な表現として解釈することである。また、係り受けを解釈するとは、例えば、「良いのはA製品だよね?」という表現のように修飾語の位置が前後逆になっている場合であってもその意味を正しく解釈することである。この「良いのはA製品だよね?」は、肯定的な表現として解釈される。
また、比較を解釈するとは、「A製品は以前のモデルのほうが良かった」というA製品の現在のモデルと以前のモデルとを比較する表現に対しては、A製品は悪くなったという意図である判断し、否定的な表現として解釈することである。また、方言を解釈するとは、例えば、「A製品はめんこい製品です」という表現における方言“めんこい”については、標準語“かわいい”の意図であると判断してその意味を正しく解釈することである。この「A製品はめんこい製品です」については、肯定的な表現として解釈される。上記のような構文解析処理を行うことで、意味理解の精度を高めることができる。
タグ付け部16は、企業辞書30と、トピック辞書32と、感性辞書34と、ミラー辞書36と、サーモ辞書38と、リスク辞書40とを参照し、処理対象データの各々に含まれるテキストに対して、「企業タグ」、「トピックタグ」、「感性タグ」、「ミラータグ」、「サーモタグ」、「リスクタグ」のタグ付けを行う。タグ付け処理の詳細については後述する。
スコアリング部18は、タグ付け部16よってタグ付け処理が行われた処理対象データに基づいて、ミラースコア、サーモスコア、およびリスク値を算出するスコアリング処理を行う。例えば、スコアリング部18は、処理対象データ内に「企業タグ」と「トピックタグ」と「ミラータグ」との組み合わせでタグ付けされた文字列を対象に、ミラースコアの算出を行う。また、例えば、スコアリング部18は、処理対象データ内に「企業タグ」と「トピックタグ」と「サーモタグ」との組み合わせでタグ付けされた文字列を対象に、サーモスコアの算出を行う。また、例えば、スコアリング部18は、処理対象データ内に「企業タグ」と「トピックタグ」と「リスクタグ」の組み合わせでタグ付けされた文字列を対象に、リスク値の算出を行う。また、例えば、スコアリング部18は、処理対象データ内に「企業タグ」と「リスクタグ」との組み合わせでタグ付けされた文字列を対象に、リスク値の算出を行う。
収集部10、スクリーニング部12、解析部14、タグ付け部16、およびスコアリング部18のうち一部または全部は、プロセッサ(コンピュータ)がプログラム(ソフトウェア)を実行することにより実現される。また、これらのうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの組み合わせによって実現されてもよい。
表示部20は、スコアリング部18によって算出されたミラースコア、サーモスコア、およびリスク値を表示する。評価装置1のユーザは、表示部20に表示されたミラースコア、サーモスコア、およびリスク値を確認することで、対象となるブランドの評価を行うことができる。表示部20は、例えば、液晶ディスプレイや有機EL(Electroluminescence)表示装置などである。
記憶部22は、収集部10によって収集された処理対象データを記憶する。記憶部22は、例えば、収集元のメディアの種類と、処理対象データとを関連付けして記憶する。
辞書DB24は、スクリーニング部12、解析部14、タグ付け部16、およびスコアリング部18によって行われる各種処理において使用される辞書データを記憶する。記憶部22および辞書DB24は、ROM(Read Only Memory)やRAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリなどで実現される。
企業辞書30は、企業が所有するブランドであって、評価対象となるブランドの辞書データを記憶する。企業辞書30は、例えば、企業名、製品名、サービス名、企業の社長の名前など、その企業を特徴付ける用語を記憶する。
トピック辞書32は、世間で話題となっていることが想定されるトピックの辞書データを記憶する。例えば、評価対象となるブランドに関してニュースリリースなどの情報が世間に発表された場合には、トピック辞書32は、このニュースリリースに記載されたトピックを記憶する。トピック辞書32は、例えば、「新型」、「発売開始」、「発表」、「世界発披露」など、評価対象となるブランドに関連付けされた用語を記憶する。
感性辞書34は、処理対象データの意味解析のために使用される辞書データを記憶する。感性辞書34は、スコアリング部18によって行われる処理対象データのポジティブおよびネガティブ判定処理に必要な辞書データを記憶する。
ミラー辞書36は、企業のブランドが世間においてどのように見られたいのか、どのような言葉でそのブランドを表して欲しいのかを定義した辞書データを記憶する。図2は、本実施形態におけるミラー辞書36に記憶された辞書データの一例を示す図である。ミラー辞書36は、少なくとも1つの大分類を示す用語と、各大分類に関連付けされた少なくとも1つの中分類を示す用語と、各中分類に関連付けされたキーワードとを記憶する。このキーワードが、辞書データとして使用される。
例えば、図2に示す例では、大分類1として「信頼」が記憶され、この大分類1と関連付けされた中分類1−1として「安全」が記憶され、中分類1−2として「高品質」が記憶されている。さらに、中分類1−1と関連付けされたキーワードとして「安全」、「安心」、「信頼」が記憶され、中分類1−2と関連付けされたキーワードとして「高品質」「安全」、「壊れない」が記憶されている。尚、ミラー辞書36は、大分類、中分類、キーワードというデータ構成を有する必要はなく、大分類のみを定義してもよいし、さらに細かな分類を定義してもよいし、分類を定義せずにキーワードのみを記憶してもよい。
サーモ辞書38は、評価対象となるブランドを所有する企業の活動によって世間の感情を高めることができたかを評価するための辞書データを記憶する。図3は、本実施形態におけるサーモ辞書38に記憶された辞書データの一例を示す図である。図3に示す例では、サーモ辞書38は、世間の肯定的な感情を表す用語として、「安心」、「満足」、「好き」、「期待」を記憶している。また、サーモ辞書38は、世間の否定的な感情を表す用語として、「不安」、「不満」、「嫌い」、「失望」という上記の肯定的な感情を表す用語と相対する用語を記憶している。また、サーモ辞書38は、上記の感情を表す用語と関連付けされたキーワードを記憶してもよい。サーモ辞書38は、例えば、「期待」に関連付けされたキーワードとして「是非チェック」、「今後が楽しみ」などを記憶してよい。
リスク辞書40は、評価対象となるブランドに関して、企業が把握すべきリスクを示す辞書データを記憶する。図4Aは、本実施形態におけるリスク辞書40に記憶された辞書データの一例を示す図である。図4Bは、本実施形態におけるリスク辞書40に記憶された辞書データの他の例を示す図である。リスク辞書40は、少なくとも1つの大分類を示す用語と、各大分類に関連付けされた少なくとも1つの中分類を示す用語と、各中分類に関連付けされた少なくとも1つの小分類を示す用語と、各小分類に関連付けされたキーワードとを記憶する。このキーワードが、辞書データとして使用される。
例えば、図4Aおよび図4Bに示す例では、大分類1として「会社起因」が記憶され、この大分類1と関連付けされた中分類1−1として「経営品質」が記憶され、中分類1−2として「製品品質」が記憶されている。さらに、中分類1−1と関連付けされた小分類1−1−1として「業績」が記憶され、小分類1−1−2として「人事」が記憶されている。さらに、小分類1−1−1と関連付けされたキーワードとして「業績悪化」、「株価急落」、「不正」が記憶され、小分類1−1−2と関連付けされたキーワードとして「リストラ」、「激務」、「解雇」が記憶されている。尚、リスク辞書40は、大分類、中分類、小分類、キーワードというデータ構成を有する必要はなく、大分類のみ若しくは大分類および中分類のみを設定してもよいし、さらに細かな分類を定義してもよいし、分類を定義せずにキーワードのみを記憶してもよい。
次に、本実施形態における評価装置1の動作について説明する。図5は、本実施形態における、評価装置1の処理の流れの一例を示すフローチャートである。
まず、収集部10は、メディアMから処理対象データを収集し記憶部22に記憶させる(ステップS101)。収集部10は、例えば、インターネットNを介して、処理対象データを収集する。収集部10は、日次、週次などの所定のタイミングで処理対象データを収集する。また、評価装置1がオペレータPによる入力を受け付ける受付部(図示しない)を備え、収集部10がこの受付部に入力された処理対象データを収集してもよい。
次に、スクリーニング部12は、記憶部22に記憶された処理対象データを読み出し、評価対象となるブランドに関係ないデータを除外するスクリーニング処理を行う(ステップS103)。例えば、スクリーニング部12は、企業辞書30から辞書データ(評価対象となるブランド)を読み出し、このブランドの同音異義語を含むデータを除外する。
次に、解析部14は、処理対象データに含まれるテキストを単語レベルに分割し、同じ意味のブランドを関連付けする形態素解析処理を行う(ステップS105)。例えば、解析部14は、同一のブランドを示すアルファベット表記、漢字表記、カタカナ表記、平仮名表記などを関連付けし、同一のブランドを示すデータとして処理して表記のゆれを補正する。
次に、解析部14は、テキストに含まれる単語の係り受け元および係り受け先の関係を把握するとともに、テキストに含まれる単語の表現の強弱、多重否定、肯定疑問、係り受け、比較、方言の解釈を行う構文解析処理を行う(ステップS107)。
次に、タグ付け部16は、処理対象データの各々に含まれるテキストに対して、「企業タグ」、「トピックタグ」、「感性タグ」、「ミラータグ」、「サーモタグ」、「リスクタグ」のタグ付けを行う(ステップS109)。
図6は、本実施形態における評価装置1のタグ付け処理(ステップS109)の流れの一例を示すフローチャートである。まず、タグ付け部16は、解析部14によって構文解析処理が行われた処理対象データのうち1つのデータを抽出する(ステップS201)。
次に、タグ付け部16は、処理対象データの各々に含まれるテキストに対して、「企業タグ」、「トピックタグ」、「感性タグ」、「ミラータグ」、「サーモタグ」、「リスクタグ」のタグ付けを行う(ステップS203)。タグ付け部16は、企業辞書30に記憶された辞書データの文字列が処理対象データに含まれる場合には、処理対象データ内のその文字列に対して「企業タグ」を付与する。タグ付け部16は、トピック辞書32に記憶された辞書データの文字列が処理対象データに含まれる場合には、処理対象データ内のその文字列に対して「トピックタグ」を付与する。タグ付け部16は、感性辞書34に記憶された辞書データの文字列が処理対象データに含まれる場合には、処理対象データ内のその文字列に対して「感性タグ」を付与する。タグ付け部16は、ミラー辞書36に記憶された辞書データの文字列が処理対象データに含まれる場合には、処理対象データ内のその文字列に対して「ミラータグ」を付与する。タグ付け部16は、サーモ辞書38に記憶された辞書データの文字列が処理対象データに含まれる場合には、処理対象データ内のその文字列に対して「サーモタグ」を付与する。タグ付け部16は、リスク辞書40に記憶された辞書データの文字列が処理対象データに含まれる場合には、処理対象データ内のその文字列に対して「リスクタグ」を付与する。
図7は、本実施形態においてタグ付け処理が行われた処理対象データの一例を示す図である。図7に示す例では、「A社」および「製品A」という文字列に対して「企業タグ」が付与され、「販売開始」という文字列に対して「トピックタグ」が付与され、「独創的」という文字列に対して「ミラータグ」が付与され、「期待」という文字列に対して「サーモタグ」および「感性タグ」が付与され、「故障」という文字列に対して「リスクタグ」が付与されている。
次に、タグ付け部16は、全ての処理対象データに対するタグ付け処理が完了したか否かを判定する(ステップS205)。タグ付け部16は、全ての処理対象データに対するタグ付け処理が完了していないと判定した場合には、タグ付け処理が行われていない処理対象データを抽出してタグ付け処理を行う。一方、タグ付け部16は、全ての処理対象データに対するタグ付け処理が完了したと判定した場合には、タグ付け処理を完了する。
次に、スコアリング部18は、タグ付け部16よってタグ付けが行われた処理対象データに基づいて、ミラースコア、サーモスコア、およびリスク値を算出するスコアリング処理を行う(ステップS111)。
図8は、本実施形態における評価装置1のスコアリング処理(ステップS111)の流れの一例を示すフローチャートである。まず、スコアリング部18は、タグ付け部16によってタグ付け処理が行われた処理対象データのうち1つのデータを抽出する(ステップS301)。
次に、スコアリング部18は、「企業タグ」と「トピックタグ」と「ミラータグ」との組み合わせでタグ付けされた処理対象データを対象に、処理対象データ毎のミラースコア(以下、「個別ミラースコア」と称する)の算出を行う(ステップS303)。例えば、スコアリング部18は、「ミラータグ」の数をカウントし、「ミラータグ」1つを1点として個別ミラースコアの算出を行う。
次に、スコアリング部18は、「企業タグ」と「トピックタグ」と「サーモタグ」との組み合わせでタグ付けされた処理対象データを対象に、処理対象データ毎のサーモスコア(以下、「個別サーモスコア」と称する)の算出を行う(ステップS305)。例えば、スコアリング部18は、「サーモタグ」の数をカウントし、「サーモタグ」1つを1点として個別サーモスコアの算出を行う。
図9は、本実施形態における評価装置1のスコアリング処理の一例を示す図である。図9に示す例おいて、「処理対象データ1」は、「新型」という「トピックタグ」が付与された文字列と、「製品A」という「企業タグ」が付与された文字列と、「かっこよかった」という「ミラータグ(大分類「ヨロコビ」)」が付与された文字列と、「是非チェック」という「サーモタグ(「期待」に関連付けされたキーワード)」が付与された文字列とを含む。この場合、スコアリング部18は、「製品A」と「新型」と「ヨロコビ」との組み合わせで個別ミラースコアを「1.0」と算出する。また、スコアリング部18は、「製品A」と「新型」と「期待」との組み合わせで個別サーモスコアを「1.0」と算出する。
「処理対象データ2」は、「新型」という「トピックタグ」が付与された文字列と、「かっこよかった」という「ミラータグ(大分類「ヨロコビ」)」が付与された文字列と、「是非チェック」という「サーモタグ(「期待」に関連付けされたキーワード)」が付与された文字列とを含む。この場合、「企業タグ」が付与された文字列が存在しないため、スコアリング部18は、個別ミラースコアおよび個別サーモスコアを「0.0」に設定する。
「処理対象データ3」は、「新型」という「トピックタグ」が付与された文字列と、「製品A」および「A社」という「企業タグ」が付与された文字列と、「かっこよかった」という「ミラータグ(大分類「ヨロコビ」)」が付与された文字列と、「是非チェック」という「サーモタグ(「期待」に関連付けされたキーワード)」が付与された文字列とを含む。即ち、「処理対象データ3」は、「企業タグ」が付与された「製品A」および「A社」という2つ文字列を含む。この場合、スコアリング部18は、この2つも文字列のそれぞれについて、個別ミラースコアおよび個別サーモスコアを算出する。
ここで、「処理対象データ3」においては、「展示すごくかっこよかったです」という肯定的な表現を含んでいるが、これは、製品AまたはA社を肯定的に表現していない場合がある。即ち、「展示すごくかっこよかったです」という表現は、「展示」の方法についての肯定的な表現であるとも解釈できる。この場合、スコアリング部18は、製品Aを直接的に肯定的に表現する処理対象データ1よりも、低い個別ミラースコアおよび個別サーモスコアを算出する。例えば、スコアリング部18は、「製品A」と「新型」と「ヨロコビ」との組み合わせで個別ミラースコアを「0.5」と算出し、「A社」と「新型」と「ヨロコビ」との組み合わせで個別ミラースコアを「0.5」と算出する。また、スコアリング部18は、「製品A」と「新型」と「期待」との組み合わせで個別サーモスコアを「0.5」と算出し、「A社」と「新型」と「期待」との組み合わせで個別サーモスコアを「0.5」と算出する。
次に、スコアリング部18は、「企業タグ」と「トピックタグ」と「リスクタグ」との組み合わせでタグ付けされた処理対象データを対象に、処理対象データ毎のリスク値(以下、「個別リスク値」と称する)の算出を行う(ステップS307)。例えば、スコアリング部18は、「リスクタグ」の数をカウントし、「リスクタグ」1つを1点としてスコアリングを行う。
次に、スコアリング部18は、全ての処理対象データに対する個別スコアリング処理が完了したか否かを判定する(ステップS309)。スコアリング部18は、全ての処理対象データに対する個別スコアリング処理が完了していないと判定した場合には、個別スコアリング処理が行われていない処理対象データを抽出して個別スコアリング処理を行う。
一方、スコアリング部18は、全ての処理対象データに対する個別スコアリング処理が完了したと判定した場合には、各処理対象データの収集元の種類に基づいて、重み付け処理を行う(ステップS311)。スコアリング部18は、メディアM(情報媒体)の種類に基づいて、ミラー辞書36に記憶された用語を含むデータとサーモ辞書38に記憶された用語を含むデータとに対して重み付けを行い、後述するミラースコアとサーモスコアの算出を行う。例えば、過去の統計データに基づいて、メディア毎の1日あたりの評価対象となるブランドの平均発言量を算出し、全てのメディアの影響が均一になるように重み付けを行う。例えば、新聞の重みを基準値の「1」とした場合、新聞と比較して発言量が少ないテレビについては、新聞よりも大きな重み「2」を設定する。また、新聞と比較して発言量が多いSNSについては、新聞よりも小さな重み「0.1」を設定する。
次に、スコアリング部18は、処理対象データに付与された「感性タグ」に基づいて、処理対象データの内容が、ポジティブな表現であるのか、ネガティブな表現であるのかを判定する感情判定処理を行う(ステップS313)。スコアリング部18は、処理対象データの各々について、ミラースコアおよびサーモスコア毎に、ポジティブ(肯定的)な内容を示すものであるのか、ネガティブ(否定的)な内容を示すものであるのかを判定する。
例えば、スコアリング部18は、1つの処理対象データの中で、ポジティブな表現を示す箇所の数(ポジティブな表現の感性タグの数)がネガティブな表現を示す箇所の数(ネガティブな表現の感性タグの数)よりも多い場合には、その処理対象データは全体としてポジティブな表現であると判定する。また、スコアリング部18は、1つの処理対象データの中で、ネガティブな表現を示す箇所の数がポジティブな表現を示す箇所の数よりも多い場合には、その処理対象データは全体としてネガティブな表現であると判定する。尚、スコアリング部18は、1つの処理対象データの中で、ポジティブな表現を示す箇所の数とネガティブな表現を示す箇所の数とが同じである場合には、その処理対象データは全体としてニュートラルな表現であると判定する。また、スコアリング部18は、「感性タグ」が付与されていない処理対象データについては、無感情と判定する。
次に、スコアリング部18は、感情判定処理を行った処理対象データに基づいて、最終的なサーモスコアおよびミラースコアを算出する(ステップS315)。例えば、スコアリング部18は、評価対象となるブランド毎に、ポジティブな表現であると判定した処理対象データの個別ミラースコアの合計、およびネガティブな表現であると判定した処理対象データの個別ミラースコアの合計を算出する。また、スコアリング部18は、ポジティブな表現であると判定した処理対象データの個別ミラースコアの合計から、ネガティブな表現であると判定した処理対象データの個別ミラースコアの合計を引いた値を、最終的なミラースコアとして算出する。
また、例えば、スコアリング部18は、評価対象となるブランド毎に、ポジティブな表現であると判定した処理対象データの個別サーモスコアの合計、およびネガティブな表現であると判定した処理対象データの個別サーモスコアの合計を算出する。また、スコアリング部18は、ポジティブな表現であると判定した処理対象データの個別サーモスコアの合計から、ネガティブな表現であると判定した処理対象データの個別サーモスコアの合計を引いた値を、最終的なサーモスコアとして算出する。また、スコアリング部18は、算出したミラースコアおよびサーモスコアを記憶部22に記憶させる。
次に、スコアリング部18は、感情判定処理を行った処理対象データに基づいて、最終的なリスク値を算出し、リスクレベルを判定する(ステップS317)。リスクレベルの判定においては、所定の閾値を基準として、例えば、リスクの「高」、「中」、「低」が判定される。この場合、図4Aおよび図4Bに示すリスク辞書における分類毎に閾値が設定されてよい。例えば、同一のリスク値であっても、小分類1−2−1の「不具合」が、小分類1−1−1の「業績」よりもリスクの発生状況が深刻であると考えられる場合、小分類1−2−1の「不具合」の閾値を、小分類1−1−1の「業績」よりも低く設定する。以上により、スコアリング処理を終了する。
次に、スコアリング部18は、算出したミラースコア、サーモスコア、リスク値などを、表示部20に表示させる評価結果出力処理を行う(ステップS113)。スコアリング部18は、ミラースコアと、サーモスコアと、リスク値とを対比した画像を表示可能とする情報を生成する。図10は、本実施形態におけるブランドAに対するミラースコアおよびサーモスコアの時系列データの一例を示す図である。図11は、本実施形態におけるブランドBに対するミラースコアおよびサーモスコアの時系列データの一例を示す図である。図10に示す例では、2016年7月20日にミラースコアおよびサーモスコアの値が大幅に低下してピークが発生し、2016年11月1日にミラースコアおよびサーモスコアの値が大幅に上昇してピークが発生し、その他の期間はミラースコアおよびサーモスコアの値が0付近であることが分かる。また、図11に示す例では、ミラースコアおよびサーモスコアのピークが頻繁に発生しているが、各ピークの値は、図10に示すブランドAにおけるピークの値よりも小さいことが分かる。
図12は、本実施形態におけるブランドAに対する分類別ミラースコアの一例を示す図である。図12に示す例では、図2に示すミラー辞書に記憶された大分類1(信頼)、大分類2(新しい)、大分類3(チャレンジ)毎に、2016年5月1日から11月1日までの間における、ポジティブな表現であると判定した処理対象データのミラースコアの1日当たりの平均値と、ネガティブな表現であると判定した処理対象データのミラースコアの1日当たりの平均値とを棒グラフで示している。ネガティブな表現であると判定した処理対象データのミラースコアについては、負の値として示している。また、ポジティブな表現であると判定した処理対象データのミラースコアの平均値から、ネガティブな表現であると判定した処理対象データのミラースコアの平均値を引いた値を折れ線グラフで示している。これにより、評価装置1のユーザは、分類別のミラースコアを確認することができる。
図13は、本実施形態におけるブランドAに対する分類別サーモスコアの一例を示す図である。図13に示す例では、図3に示すサーモ辞書に記憶された「安心」、「満足」、「好き」、「期待」毎に、2016年5月1日から11月1日までの間における、ポジティブな表現であると判定した処理対象データのサーモスコアの1日当たりの平均値と、ネガティブな表現であると判定した処理対象データのサーモスコアの1日当たりの平均値とを棒グラフで示している。また、ポジティブな表現であると判定した処理対象データのサーモスコアの平均値から、ネガティブな表現であると判定した処理対象データのサーモスコアの平均値を引いた値を折れ線グラフで示している。これにより、評価装置1のユーザは分類別のサーモスコアを確認することができる。
図14は、本実施形態におけるブランドAに関するサーモスコア、ミラースコア、リスク値、処理対象データの件数の時系列データの一例を示す図である。図14では、ある特定の1日(2016年11月1日)の分類別のサーモスコアの平均値が「71」であり、分類別のミラースコアの平均値が「65」であることが示されている。また、図14では、リスク値のリスクレベルに関して、「高」と判定された件数が「2」であり、「中」と判定された件数が「11」であり、「低」と判定された件数が「34」であることが示されている。また、図14では、ブランドAに関する過去30日間の処理対象データの件数が折れ線グラフで示されている。これにより、評価装置1のユーザは、ブランドAに関するサーモスコア、ミラースコア、リスクレベルを確認することができる。尚、図14では、ある特定の1日のサーモスコア、ミラースコア、およびリスク値を表示する例を示したが、週単位、月単位などの任意の期間のサーモスコア、ミラースコア、およびリスク値を表示してもよい。
図15は、本実施形態における評価装置1のリスクレベル判定処理の他の一例を示す図である。まず、スコアリング部18は、処理対象データの各々に対して付与されたタグの組み合わせの有効性判定を行う(ステップS401)。スコアリング部18は、例えば、処理対象データの各々に「企業タグ」と「リスクタグ」との組み合わせでタグが付与されているか否かを判定する。スコアリング部18は、処理対象データに「企業タグ」と「リスクタグ」との組み合わせでタグが付与されている場合、この処理対象データをリスクレベル判定の対象とする。一方、スコアリング部18は、処理対象データに「企業タグ」と「リスクタグ」との組み合わせでタグが付与されていない場合、この処理対象データをリスクレベル判定の対象から除外する。
尚、スコアリング部18は、処理対象データに「企業タグ」と「リスクタグ」との組み合わせでタグが付与されていても、上記の感情判定処理によりこの処理対象データがポジティブな表現であると判定した場合には、この処理対象データをリスクレベル判定の対象から除外する。
次に、スコアリング部18は、リスクレベル判定の対象とした処理対象データに対して、「企業タグ」と関連付けされた文字列の各々について、メディアM毎にリスク値の集計を行う(ステップS403)。次に、スコアリング部18は、「企業タグ」と関連付けされた文字列の各々について、所定の閾値を基準として、例えば、リスクレベルの「大」、「中」、「小」を判定する(ステップS405)。この閾値は、メディアM毎に、図4Aおよび図4Bに示すリスク辞書における分類毎に設定される。
例えば、図4Aおよび図4Bに示す小分類1−2−1の「不具合」に関して、メディアM毎(例えば、「新聞」、「テレビ」、「ウェブ記事」、「ウェブログ」、「SNS」毎に)に、リスクレベルの「小」と対応する第1閾値、リスクレベルの「中」と対応する第2閾値(第1閾値<第2閾値)、リスクレベルの「大」と対応する第3閾値(第2閾値<第3閾値)が設定される。ここで、「新聞」および「テレビ」と比較して、「ウェブ記事」、「ウェブログ」、および「SNS」は発言量が多いため、「ウェブ記事」、「ウェブログ」、および「SNS」に対しては、「新聞」および「テレビ」よりも高い閾値を設定してよい。スコアリング部18は、例えば、集計したリスク値の値が、第3閾値以上である場合、リスクレベルの「大」と判定し、第2閾値以上かつ第3閾値未満以下である場合、リスクレベルの「中」と判定し、第1閾値以上かつ第2閾値未満である場合、リスクレベルの「小」と判定する。尚、スコアリング部18は、集計したリスク値の値が第1閾値未満である場合、「リスク無し」と判定してよい。
次に、スコアリング部18は、「企業タグ」と関連付けされた文字列の各々について、メディアM毎に判定されたリスクレベルを集計する(ステップS407)。例えば、スコアリング部18は、リスクレベルの「大」、「中」、「小」の各々と関連付けされた数値を用いる。リスクレベルの「大」、「中」、「小」の各々と関連付けされた数値としては、例えば、リスクレベルの「大」、「中」、「小」の順に減少する値が設定される。スコアリング部18は、「企業タグ」と関連付けされた文字列の各々について、メディア毎に判定されたリスクレベルと関連付けされた数値の合計(集計値)を算出する。
スコアリング部18は、上記のようにクロスメディアでリスクレベルの判定結果を集計し、この集計値に基づいて、最終的なリスクレベルを判定する。例えば、スコアリング部18は、「企業タグ」と関連付けされた文字列の各々について、所定の閾値を基準として、最終的なリスクレベルである「高」、「中」、「低」、「安全」を判定する。
尚、スコアリング部18は、スコアリング部18によって判定された最終的なリスクレベルを色で表現したヒートマップを生成してもよい。このヒートマップでは、例えば、列方向に「企業タグ」と関連付けされた文字列(企業辞書30に記憶された辞書データの文字列)が並べられ、行方向にリスク辞書における分類が並べられる。上記のスコアリング部18によって判定された最終的なリスクレベルが、このヒートマップの1マスとなる。
尚、算出したミラースコア、サーモスコア、リスク値を三次元空間にマッピングし、サポートベクターマシーンで評価値を算出するようにしてもよい。
上記の本実施形態の評価装置によれば、企業が期待するブランドのイメージと世間の反応とのギャップを評価し、企業が行った活動によって世間がどのように反応したのかについて適切に評価することができる。また、様々なメディアから収集した処理対象データを総合的かつ平等に評価することができる。また、ブランドのイメージと世間の反応とのギャップを評価する場合、メディアに露出された情報の確からしさも含めて適切に評価し、さらに企業のリスクの程度も評価することができる。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形および置換を加えることができる。