JP6821528B2 - 評価装置、評価方法、ノイズ除去装置、およびプログラム - Google Patents

評価装置、評価方法、ノイズ除去装置、およびプログラム Download PDF

Info

Publication number
JP6821528B2
JP6821528B2 JP2017170216A JP2017170216A JP6821528B2 JP 6821528 B2 JP6821528 B2 JP 6821528B2 JP 2017170216 A JP2017170216 A JP 2017170216A JP 2017170216 A JP2017170216 A JP 2017170216A JP 6821528 B2 JP6821528 B2 JP 6821528B2
Authority
JP
Japan
Prior art keywords
information
unit
data
posted
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017170216A
Other languages
English (en)
Other versions
JP2019046289A (ja
Inventor
大輔 坂本
大輔 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2017170216A priority Critical patent/JP6821528B2/ja
Priority to US16/058,378 priority patent/US11132699B2/en
Priority to CN201810983108.5A priority patent/CN109426987B/zh
Publication of JP2019046289A publication Critical patent/JP2019046289A/ja
Application granted granted Critical
Publication of JP6821528B2 publication Critical patent/JP6821528B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0609Buyer or seller confidence or verification

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Description

本発明は、評価装置、評価方法、ノイズ除去装置、およびプログラムに関する。
従来、企業および団体など(以下、「企業」と称する)が利用するブランドに関して、テレビ、新聞、雑誌、Web記事などの各種メディアに掲載された情報を収集し、世間におけるブランドの露出度、ブランドに対するイメージなどの評価が行われている。このようなブランドの評価を行うことで、企業はブランド戦略の決定などに役立てることができる。
例えば、特許文献1においては、所定のブランドについて、メディアに露出された情報を収集し、ブランドのメディアへの露出度、ブランドに関する世間の興味関心を表すブランド関心度などを算出し、それらを統合して所定の評価指標を算出するブランド評価方法が提案されている。
また、特許文献2においては、インターネット上のテキスト分析を行い、投稿者が希望した希望文とその希望を実行した実行文とを抽出して、投稿者の希望をかなえる有言実行度を求める情報分析を行う。有言実行度を求めるにあたっては、希望文に含まれる希望を示す表現と、実行文に含まれる実行を示す表現と、希望文および実行文の両方に含まれる対象語と、を抽出している。
特開2015−95249号公報 特開2016−71596号公報
特許文献1に記載された情報分析方法を利用し、例えば所定のブランドに関してメディアに露出された情報を取得して評価指標を算出しているが、この評価方法では、例えば、ブランドの所有者である企業が期待するブランドのイメージと、世間の反応とのギャップを評価することが出来なかった。また、メディアに露出された情報が肯定的なものであるのか否定的なものであるのかを適切に評価することが出来なかった。
また、従来のブランド評価方法においては、テレビ、新聞、雑誌などのメディアが重視されていたが、近年は、世間の反応が顕著に表れるソーシャルネットワーキングサービス(SNS)などを含む様々なメディアを総合的かつ平等に評価する必要がある。また、ブランドに関してメディアに露出された情報を取得したとしても、取得した情報に含まれたノイズによって、総合的かつ平等な評価が難しくなることがあった。
本発明は、このような事情を考慮してなされたものであり、取得した情報に含まれたノイズによらず、企業が期待するブランドのイメージと世間(需要家)の反応とのギャップを評価し、企業が行った活動などによって世間がどのように反応したのかについて適切に評価することが可能な評価装置、評価方法、ノイズ除去装置、およびプログラムを提供することを目的の一つとする。
(1):対象事物に関し、メディアを介して需要家に提供された提供情報を取得する提供情報取得部(例えば、収集部10)と、投稿者により投稿された投稿情報を取得する投稿情報取得部(例えば、収集部10)と、前記投稿情報取得部により取得された投稿情報のうち、前記提供情報との合致度合が所定割合以上である投稿情報から、少なくとも前記提供情報に含まれる感性表現をノイズとして除去するノイズ除去部(例えば、ノイズ除去部14)と、前記ノイズ除去部によりノイズが除去された投稿情報に基づいて、前記対象事物の評価を行う評価部(例えば、スコアリング部20)と、を備える評価装置である。
(2)(1)において、前記ノイズ除去部は、前記感性表現が含まれる前記投稿情報における前記提供情報に対応する部分を、前記提供情報から前記感性表現を除去した代替情報に置換するものである。
(3)(1)または(2)において、前記ノイズ除去部は、前記投稿情報および前記提供情報に含まれる単語の性質ごとに重み付けを行うものである。
(4)(1)から(3)のいずれか1つにおいて、前記投稿情報取得部は、前記提供情報に対する感想を含む投稿情報を選択的に取得するものである。
(5)(4)において、前記投稿情報は、所定の発信源から発信された提供情報に対する感想に関する投稿情報であるものである。
(6)(1)から(5)のいずれか1つにおいて、前記投稿情報取得部により取得され、前記ノイズ除去部によってノイズが除去された投稿情報に含まれる文章の構文解析を行う構文解析部(例えば、解析部16)と、前記構文解析部における解析結果をスコアリングするスコアリング部と、を備え、前記スコアリング部は、前記対象事物と前記スコアリングされた解析結果との関連付けを行うものである。
(7)(6)において、前記スコアリング部は、前記構文解析部で解析された解析結果に重み付けを行うものである。
(8):対象事物に関し、メディアを介して需要家に提供された提供情報を取得する提供情報取得部(例えば、収集部10)と、投稿者により投稿された投稿情報を取得する投稿情報取得部(例えば、収集部10)と、前記投稿情報取得部により取得された投稿情報のうち、前記提供情報との合致度合が所定割合以上である投稿情報から、少なくとも前記提供情報に含まれる感性表現をノイズとして除去するノイズ除去部(例えば、ノイズ除去部14)と、を備えるノイズ除去装置である。
(9):コンピュータが、対象事物に関し、メディアを介して需要家に提供された提供情報を取得し、投稿者により投稿された投稿情報を取得し、取得された投稿情報のうち、前記提供情報との合致度合が所定割合以上である投稿情報から、少なくとも前記提供情報に含まれる感性表現をノイズとして除去し、ノイズが除去された投稿情報に基づいて、前記対象事物の評価を行う、評価方法である。
(10):コンピュータに、対象事物に関し、メディアを介して需要家に提供された提供情報を取得させ、投稿者により投稿された投稿情報を取得させ、取得された投稿情報のうち、前記提供情報との合致度合が所定割合以上である投稿情報から、少なくとも前記提供情報に含まれる感性表現をノイズとして除去させ、ノイズが除去された投稿情報に基づいて、前記対象事物の評価を行わせる、プログラムである。
(1)〜(7)、(9)、(10)によれば、取得した情報に含まれたノイズによらず、企業または団体が期待するブランドのイメージと世間(需要家)の反応とのギャップを評価し、企業または団体が行った活動などによって世間がどのように反応したのかについて適切に評価することができる。また、ブランドのイメージと世間の反応とのギャップを評価する場合、メディアに露出された情報の確からしさも含めて適切に評価し、さらに企業のリスクの程度も評価することができる。
(8)によれば、取得した情報に含まれるノイズを精度よく除去することができる。
実施形態における評価装置の一例を示す機能ブロック図である。 実施形態における代替表現辞書に記憶された宣伝データおよび代替表現データの一例を示す図である。 実施形態における評価装置の処理の流れの一例を示すフローチャートである。 実施形態における評価装置のノイズ除去処理の流れの一例を示すフローチャートである。 ノイズ除去の処理パターンの性質を説明する図である。 (A)は、ノイズ除去前の処理対象データを示す図、(B)は、ノイズ除去後の処理対象データを示す図である。 実施形態においてタグ付け処理が行われた処理対象データの一例を示す図である。 実施形態における評価装置のスコアリング処理の一例を示す図である。 ノイズ除去部によるノイズの除去を行った場合と行わなかった場合の結果を説明する図である。
以下、図面を参照し、本発明のいくつかの実施形態における評価装置、評価方法、ノイズ除去装置、およびプログラムについて説明する。
図1は、本発明の実施形態における評価装置1の一例を示す機能ブロック図である。評価装置1は、メディアM(情報媒体)から処理の対象となるデータ(以下、「処理対象データ」と称する)を収集して解析することで、評価対象となるブランドに関する評価を行う。メディアMは、例えば、テレビ、新聞、雑誌、ウェブ記事、ウェブログ、短文投稿サービスなどのSNS、株主のレポートを含む。
評価装置1は、ブランド(対象事物)に関する評価指標として、「ミラースコア」、「サーモスコア」、「リスク値」という3つの値を算出する。「ミラースコア」とは、評価対象となるブランドを所有する企業(発信源)が、同ブランドを世間にどのように見られたいか定義した内容に対して、世間が同ブランドをどのように思っているのかを表す指標である。「ミラースコア」とは、企業が期待する内容を示す用語の出現頻度を示す。このミラースコアを算出することで、企業が期待するブランドのイメージと世間の反応とのギャップを把握することができる。世間の反応は、世間(需要家)がSNS等のメディアMに投稿する処理対象データ(投稿情報)に含まれる感想に表されている。処理対象データに含まれる感想は、感性表現によって分類することができる。
「サーモスコア」とは、評価対象となるブランドを所有する企業の活動によって世間の感情(感性)を高めることができたかを表す指標である。「サーモスコア」とは、世間(需要家)の反応を示す用語の出現頻度を示す。このサーモスコアを算出することで、評価対象となるブランドに対する世間の感情を高めることができたか、世間の支持を得ることができたかを把握することができる。「リスク値」とは、評価対象となるブランドに関して、発生したリスクの程度を示す指標である。「リスク値」は企業または団体のリスクを示す用語の出現頻度およびメディアM(情報媒体)の種類に基づいて算出される。
評価装置1は、例えば、収集部10(提供情報取得部、投稿情報取得部)と、スクリーニング部12と、ノイズ除去部14と、解析部16と、タグ付け部18と、スコアリング部20(評価部)と、表示部22と、記憶部24と、辞書DB26とを備える。辞書DB26は、例えば、企業辞書30と、トピック辞書32と、代替表現辞書34と、感性辞書36と、ミラー辞書38と、サーモ辞書40と、リスク辞書42とを備える。
収集部10は、メディアMから処理対象データを収集して記憶部24に記憶させる。収集部10は、例えば、インターネットNを介して、処理対象データを収集する。処理対象データには、例えば投稿者が投稿するデータや企業または団体により予め設定されたブランドに関連するキャッチフレーズなどのデータが含まれる。このデータは、例えば対象事物に関し、メディアを介して需要家に提供された宣伝データである。収集部10は、日次、週次などの所定のタイミングで処理対象データを収集する。収集部10は、処理対象データのうち、提供情報に対する感想を含む投稿情報を選択的に取得してもよい。また、収集元となるメディアMは、評価装置1のユーザによって予め決定されていてもよい。また、収集部10が、予め定義された文字列を含むインターネット上の文書などを周期的に収集するクローリング処理を行ってもよい。なお、評価装置1がオペレータPによる入力を受け付ける受付部(図示しない)を備え、収集部10がこの受付部に入力された処理対象データを収集してもよい。
スクリーニング部12は、収集部10によって収集された処理対象データのうち、評価対象となるブランドに関係ない処理対象データを除外し、評価対象となるブランドに関する処理対象データを抽出する。スクリーニング部12は、メディアM(情報媒体)から収集されたデータの中から、企業または団体により予め設定されたブランドに関連するデータを識別して抽出する。例えば、スクリーニング部12は、企業辞書30に記憶された辞書データを読み出す。この辞書データが、評価対象となるブランドとなる。そして、スクリーニング部12は、このブランドの同音異義語を含む処理対象データを除外する。また、例えば、スクリーニング部12は、予め定義された特定のURLから取得した処理対象データを除外し、予め定義された特定IDのウェブログおよびSNSから取得した処理対象データを除外し、同一のテキストを含むデータが多数存在する場合には異常データとして除外してもよい。
ノイズ除去部14は、スクリーニング部12でスクリーニングされた処理対象データのテキストから、ノイズを除去する。処理対象データに含まれるノイズは、処理対象データのうち、処理対象データの宣伝データ(提供情報)との合致度合が所定割合以上となる部分(以下「宣伝データ相当部分」という)に含まれる感性表現(特定表現)である。例えば、ノイズ除去部14は、処理対象データに含まれる宣伝データ相当部分に対応する代替表現データ(代替情報)を代替表現辞書34から抽出する。代替表現データは、宣伝データから感性表現が除かれて生成されたデータである。そして、ノイズ除去部14は、処理対象データにおける宣伝データ相当部分に対応するデータを代替表現データに置換する。また、処理対象データのうち、宣伝データに付随するデータであって、感性表現を含まないデータのテキストについては、合わせて削除される。宣伝データに付随するデータであるか否かの判断が難しい場合には、宣伝データに付随するデータは削除されることなくそのまま残る。
ノイズ除去部14で除去される感性表現は、宣伝データに含まれる感性表現である。このため、処理対象データのうち、宣伝データ相当部分に含まれていない感性表現は、ノイズ除去部14によって除外されないことになる。なお、処理対象データの宣伝データとの合致度合とは、処理対象データにおける宣伝データ相当部分と宣伝データとの一致割合をいう。したがって、例えば、処理対象データのうち、宣伝データ相当部分が宣伝データのテキスト全体の90%であるときに、処理対象データの宣伝データとの合致度合が90%となる。ノイズを除去するための宣伝データ相当部分と判断するための所定割合は適宜設定することができ、例えば100%としてもよいし、90%や80%、あるいは50%などとしてもよい。また、所定割合は、評価の程度などの諸条件に応じて適宜設定するようにしてもよい。
解析部16は、処理対象データに含まれるテキストを単語レベルに分割し、同じ意味のブランドを関連付けする形態素解析処理を行って、処理対象データの文章の解析を行う。例えば、解析部16は、同一のブランドを示すアルファベット表記、漢字表記、カタカナ表記、平仮名表記などを関連付けし、同一のブランドを示すデータとして処理する。また、解析部16は、アルファベット表記に関しては、大文字、小文字、および大文字と小文字の混合文字の違いがある場合であっても、同一のブランドを示すデータとして処理してもよい。また、解析部16は、誤記(漢字変換誤記など)を含むテキストについても、評価対象となるブランドを示すデータとして処理してもよい。これにより、表記のゆれを補正することが可能である。
また、解析部16は、テキストに含まれる単語の係り受け元および係り受け先の関係を把握するとともに、テキストに含まれる単語の表現の強弱、多重否定、肯定疑問、係り受け、比較、方言の解釈を行う構文解析処理を行う。表現の強弱を解釈するとは、例えば、「A製品は極めて良い」という表現における“極めて”と、「A製品は若干良い」という表現における“若干”とでは、前者の“極めて”の方がより強い表現であると解釈することである。また、多重否定を解釈するとは、例えば、「A製品は良くない訳ではない」という二重の否定を含む表現を肯定的な表現として正しく解釈することである。
また、肯定疑問を解釈するとは、例えば、「A製品は良い製品だよね?」という肯定的な意図で表現された疑問文を肯定的な表現として解釈することである。また、係り受けを解釈するとは、例えば、「良いのはA製品だよね?」という表現のように修飾語の位置が前後逆になっている場合であってもその意味を正しく解釈することである。この「良いのはA製品だよね?」は、肯定的な表現として解釈される。
また、比較を解釈するとは、「A製品は以前のモデルのほうが良かった」というA製品の現在のモデルと以前のモデルとを比較する表現に対しては、A製品は悪くなったという意図である判断し、否定的な表現として解釈することである。また、方言を解釈するとは、例えば、「A製品はめんこい製品です」という表現における方言“めんこい”については、標準語“かわいい”の意図であると判断してその意味を正しく解釈することである。
この「A製品はめんこい製品です」については、肯定的な表現として解釈される。上記のような構文解析処理を行うことで、意味理解の精度を高めることができる。
タグ付け部18は、企業辞書30と、トピック辞書32と、感性辞書36と、ミラー辞書38と、サーモ辞書40と、リスク辞書42とを参照し、処理対象データの各々に含まれるテキストの解析結果に対して、「企業タグ」、「トピックタグ」、「感性タグ」、「ミラータグ」、「サーモタグ」、「リスクタグ」のタグ付けを行う。タグ付け処理の詳細については後述する。
スコアリング部20は、タグ付け部18よってタグ付け処理が行われた処理対象データに基づいて、ミラースコア、サーモスコア、およびリスク値を算出するスコアリング処理を行う。例えば、スコアリング部20は、処理対象データ内に「企業タグ」と「トピックタグ」と「ミラータグ」との組み合わせでタグ付けされた文字列を対象に、ミラースコアの算出を行う。また、例えば、スコアリング部20は、処理対象データ内に「企業タグ」と「トピックタグ」と「サーモタグ」との組み合わせでタグ付けされた文字列を対象に、サーモスコアの算出を行う。また、例えば、スコアリング部20は、処理対象データ内に「企業タグ」と「トピックタグ」と「リスクタグ」の組み合わせでタグ付けされた文字列を対象に、リスク値の算出を行う。また、例えば、スコアリング部20は、処理対象データ内に「企業タグ」と「リスクタグ」との組み合わせでタグ付けされた文字列を対象に、リスク値の算出を行う。
収集部10、スクリーニング部12、ノイズ除去部14、解析部16、タグ付け部18、およびスコアリング部20のうち一部または全部は、プロセッサ(コンピュータ)がプログラム(ソフトウェア)を実行することにより実現される。また、これらのうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの組み合わせによって実現されてもよい。
表示部22は、スコアリング部20によって算出されたミラースコア、サーモスコア、およびリスク値を表示する。評価装置1のユーザは、表示部22に表示されたミラースコア、サーモスコア、およびリスク値を確認することで、対象となるブランドの評価を行うことができる。表示部22は、例えば、液晶ディスプレイや有機EL(Electroluminescence)表示装置などである。
記憶部24は、収集部10によって収集された処理対象データを記憶する。記憶部24は、例えば、収集元のメディアの種類と、処理対象データとを関連付けして記憶する。
辞書DB26は、スクリーニング部12、ノイズ除去部14、解析部16、タグ付け部18、およびスコアリング部20によって行われる各種処理において使用される辞書データを記憶する。記憶部24および辞書DB26は、ROM(Read Only Memory)やRAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリなどで実現される。
企業辞書30は、企業が所有するブランドであって、評価対象となるブランドの辞書データを記憶する。企業辞書30は、例えば、企業名、製品名、サービス名、企業の社長の名前など、その企業を特徴付ける用語を記憶する。
トピック辞書32は、世間で話題となっていることが想定されるトピックの辞書データを記憶する。例えば、評価対象となるブランドに関してニュースリリースなどの情報が世間に発表された場合には、トピック辞書32は、このニュースリリースに記載されたトピックを記憶する。トピック辞書32は、例えば、「新型」、「発売開始」、「発表」、「世界発披露」など、評価対象となるブランドに関連付けされた用語を記憶する。
代替表現辞書34は、企業または団体のブランドの製品を宣伝するキャッチフレーズとなる宣伝データおよびそのキャッチフレーズから感性表現を除去した代替表現データをテキストで記憶する。図2は、本実施形態における代替表現辞書34に記憶された宣伝データおよび代替表現データの一例を示す図である。代替表現辞書34は、感性表現を含む宣伝データと、この宣伝データを、感性表現を除いて置換する代替表現データを記憶している。このため、代替表現データは、感性表現を含まないデータとなっている。
代替表現辞書34は、例えば、「自立安定制御の機能により、バイクのある日常をより楽しく」という宣伝データNo1を記憶している。宣伝データNo1には「楽しく」という感性表現が含まれている。「楽しく」という表現は、「楽しい」という感性につながることから感性表現と判断される。代替表現辞書34は、宣伝データNo1を置換する「自立バイク」という代替表現データNo1を記憶している。代替表現データNo1は、宣伝データNo1から「楽しく」という感性表現を除き、かつ宣伝データNo1の内容を端的に示すデータとなっている。
代替表現辞書34は、「新たにダイナミックかつ心地良いハンドリングを提供」という宣伝データNo2を記憶している。宣伝データNo2には、「ダイナミック」「心地良い」という感性表現が含まれている。「ダイナミック」「心地良い」は、いずれも「良い」という感性につながることから感性表現と判断される。
代替表現辞書34は、「2014年度から3年連続で新車販売台数第1位を獲得」という宣伝データNo3を記憶している。宣伝データNo3には、「1位を獲得」という感性表現が含まれている。「1位を獲得」は、「うれしい」という感性につながることから感性表現と判断される。
代替表現辞書34は、「燃費性能をさらに向上させ、低燃費と走る楽しさを高次元で両立」という宣伝データNo4を記憶している。宣伝データNo4には、「高次元で両立」という感性表現が含まれている。「高次元で両立」は、「良い」という感性につながることから感性表現と判断される。
代替表現辞書34は、その他に、「好き」「賞賛」「新しい」「嫌い」などの感性表現を含む語およびこれらの感性表現を含む語につながる語を含む宣伝データを記憶している。代替表現辞書34は、さらに、これらの宣伝データに対応する代替表現データも記憶している。代替表現辞書34は、これらの宣伝データに含まれるテキストを単語レベルで記憶している。
感性辞書36は、処理対象データの意味解析のために使用される辞書データを記憶する。感性辞書36は、スコアリング部20によって行われる処理対象データのポジティブおよびネガティブ判定処理に必要な辞書データを記憶する。
ミラー辞書38は、企業のブランドが世間においてどのように見られたいのか、どのような言葉でそのブランドを表して欲しいのかを定義した辞書データを記憶する。ミラー辞書38は、例えば、少なくとも1つの大分類を示す用語と、各大分類に関連付けされた少なくとも1つの中分類を示す用語と、各中分類に関連付けされたキーワードとを記憶する。このキーワードが、辞書データとして使用される。なお、ミラー辞書38は、大分類、中分類、キーワードというデータ構成を有する必要はなく、大分類のみを定義してもよいし、さらに細かな分類を定義してもよいし、分類を定義せずにキーワードのみを記憶してもよい。
サーモ辞書40は、評価対象となるブランドを所有する企業の活動によって世間の感情を高めることができたかを評価するための辞書データを記憶する。サーモ辞書40は、世間の肯定的な感情を表す用語、例えば「安心」、「満足」、「好き」、「期待」を記憶している。また、サーモ辞書40は、世間の否定的な感情を表す用語、例えば「不安」、「不満」、「嫌い」、「失望」という上記の肯定的な感情を表す用語と相対する用語を記憶している。また、サーモ辞書40は、上記の感情を表す用語と関連付けされたキーワードを記憶してもよい。サーモ辞書40は、例えば、「期待」に関連付けされたキーワードとして「是非チェック」、「今後が楽しみ」などを記憶してよい。
リスク辞書42は、評価対象となるブランドに関して、企業が把握すべきリスクを示す辞書データを記憶する。リスク辞書42は、例えば、少なくとも1つの大分類を示す用語と、各大分類に関連付けされた少なくとも1つの中分類を示す用語と、各中分類に関連付けされた少なくとも1つの小分類を示す用語と、各小分類に関連付けされたキーワードとを記憶する。このキーワードが、辞書データとして使用される。なお、リスク辞書42は、大分類、中分類、小分類、キーワードというデータ構成を有する必要はなく、大分類のみ若しくは大分類および中分類のみを設定してもよいし、さらに細かな分類を定義してもよいし、分類を定義せずにキーワードのみを記憶してもよい。
次に、本実施形態における評価装置1の動作について説明する。図3は、本実施形態における評価装置1の処理の流れの一例を示すフローチャートである。
まず、収集部10は、メディアMから処理対象データを収集し記憶部24に記憶させる(ステップS101)。収集部10は、例えば、インターネットNを介して、処理対象データを収集する。収集部10は、日次、週次などの所定のタイミングで処理対象データを収集する。また、評価装置1がオペレータPによる入力を受け付ける受付部(図示しない)を備え、収集部10がこの受付部に入力された処理対象データを収集してもよい。
次に、スクリーニング部12は、記憶部24に記憶された処理対象データを読み出し、評価対象となるブランドに関係ないデータを除外するスクリーニング処理を行う(ステップS103)。例えば、スクリーニング部12は、企業辞書30から辞書データ(評価対象となるブランド)を読み出し、このブランドの同音異義語を含むデータを除外する。
次に、ノイズ除去部14は、スクリーニング部12がスクリーニングした処理対象データにおける感性表現を含む宣伝データを代替表現データに置換して、ノイズとなる感性表現を除去する処理を行う(ステップS105)。
図4は、本実施形態における評価装置1のノイズ除去処理(ステップS105)の流れの一例を示すフローチャートである。まず、ノイズ除去部14は、スクリーニング部12でスクリーニングされた処理対象データと代替表現辞書34に記憶された宣伝データとを比較する。(ステップS201)。
処理対象データと宣伝データとの比較を行うにあたり、ノイズ除去部14は、処理対象データに含まれるテキストを単語レベルに分解し、代替表現辞書34に記憶された単語レベルの宣伝データのテキストとの比較を行う。ノイズ除去部14は、宣伝データのテキストに含まれる単語が、処理対象データにどの程度含まれているかによって、処理対象データと宣伝データとの合致度合を算出する。
処理対象データと宣伝データとの合致度合を算出する際には、例えば、処理対象データの中に同じ単語が複数含まれているときには、ノイズ除去部14は、同じ単語であっても、例えば前後関係から、宣伝データに含まれる単語であるか否かを判断する。例えば、処理対象データが「自立安定制御の機能により、バイクのある日常をより楽しくだってさ。毎日が楽しくなるね。」というテキストである場合、ノイズ除去部14は、「日常をより楽しく」に含まれる「楽しく」を宣伝データ(宣伝データNo1)に含まれる単語と判断し、「毎日が楽しくなるね」に含まれる「楽しく」は、宣伝データ(宣伝データNo1)に含まれない単語と判断する。
以下に、ノイズ除去を行う場合の処理パターンについて説明する。図5は、ノイズ除去の処理パターンの性質を説明する図である。図5に示すように、ノイズ除去を行う際の処理パターンとしては、処理パターンA、処理パターンB、処理パターンCがある。処理パターンAは、代替表現への置換があり、感性情報が残っている処理パターンである。処理パターンBは、代替表現への置換があり、感性情報が残っていない処理パターンである。処理パターンCは、代替表現への置換がない処理パターンである。処理パターンCでは、感性情報の有無は処理対象データの内容に依存している。これらの処理パターンA、処理パターンB、および処理パターンCのいずれもが、評価を行う際の集計の対象となる。
以下、ノイズ除去前の処理対象データとノイズ除去後の処理対象データの例について説明する。図6(A)は、ノイズ除去前の処理対象データを示す図、(B)は、ノイズ除去後の処理対象データを示す図である。図6(B)には、各処理対象データの処理パターンも合わせて示している。
図6(A)に示すように、処理対象データのテキストが『ホンダがなにやら変わったバイクを作っているぞー。』である文1には、図2に示す宣伝データに対応する宣伝データ相当部分が含まれていない。この場合には、図6(B)に示すように、ノイズ除去後の文1のテキストデータは、そのまま『ホンダがなにやら変わったバイクを作っているぞー。』となる。この場合のノイズ除去の処理パターンは処理パターンCである。
処理対象データのテキストが『「今回発表するに至りましたステアバイワイヤを搭載したモデルは、新たにダイナミックかつ心地良いハンドリングを提供することをお約束するものです。」だそうだ。』である文2には、図2に示す宣伝データNo2に対応する宣伝データ相当部分が含まれている。この場合、図6(B)に示すように、ノイズ除去後の文2のテキストデータは、宣伝データNo2のテキストに対応する宣伝データ相当部分を代替表現データNo2に置換し、『「ステアバイワイヤによるハンドリング」だそうだ。』となる。この場合のノイズ除去の処理パターンは処理パターンBである。また、「今回発表に至りました」「を搭載したモデルは、」「することをお約束するものです。」等のテキストは、宣伝データに付随するデータであって、感性表現を含まないデータとして削除される。
処理対象データのテキストが『今回発表に至りましたステアバイワイヤを搭載したモデルは、新たにダイナミックかつ心地良いハンドリングを提供だってさ、凄いね。』である文3には、図2に示す宣伝データNo2に対応する宣伝データ相当部分が含まれている。この場合、図6(B)に示すように、ノイズ除去後の文3のテキストデータは、宣伝データNo2のテキストに対応する宣伝データ相当部分を代替表現データNo2に置換し、『「ステアバイワイヤによるハンドリング」提供だってさ、凄いね。』となる。この場合のノイズ除去の処理パターンは処理パターンAである。この例から分かるように、処理対象データの宣伝データとの合致度合が100%でない場合でも、宣伝データに対応すると判断されるデータを代替表現データと置換する。同様にして、図6(A)に示す文4の処理対象データは、図6(B)に示すデータに置換される。
また、処理対象データと宣伝データとの合致度合を算出するにあたり、処理対象データおよび宣伝データに含まれる部分の性質である単語に重み付けを行うようにしてもよい。例えば、宣伝データに含まれるテキストの単語のうち、動詞や形容詞については重み付けを重くし、接続詞や助詞などの重み付けを軽くするようにしてもよい。
例えば、宣伝データNo2の「新たにダイナミックかつ心地良いハンドリングを提供」については、「新た」「ダイナミック」「心地良い」「ハンドリング」「提供」の重みを「3」とし、「に」「かつ」「を」の重みを「1」として重みづけをするようにしてもよい。なお、重み付けは、「3」「1」の2段階ではなく、さらに多くの段階をもって行うようにしてもよい。
次に、ノイズ除去部14は、ステップS201における比較の結果、処理対象データに宣伝データとの合致度合が所定割合以上である部分があり、処理対象データに宣伝データ相当部分があるか否かを判定する(ステップS203)。ノイズ除去部14は、処理対象データに宣伝データ相当部分があると判定した場合には、宣伝データ相当部分に対応する代替表現データ(図2参照)を代替表現辞書34から選択し、処理対象データに含まれている宣伝データ相当部分と置換する代替表現データを選択する(ステップS205)。それから、ノイズ除去部14は、処理対象データ中の宣伝データ相当部分を代替表現データに置換して、処理対象データに含まれる宣伝データ相当部分中の感性表現を除去する(ステップS207)。こうして、ノイズ除去処理を終了する。また、ステップS203において、処理対象データに宣伝データ相当部分がないと判定した場合には、そのままノイズ除去処理を終了する。
図3に戻り、次に、解析部16は、ノイズ除去部14でノイズ除去された処理対象データに含まれるテキストを単語レベルに分割し、同じ意味のブランドを関連付けする形態素解析処理を行う(ステップS107)。例えば、解析部16は、同一のブランドを示すアルファベット表記、漢字表記、カタカナ表記、平仮名表記などを関連付けし、同一のブランドを示すデータとして処理して表記のゆれを補正する。
次に、解析部16は、テキストに含まれる単語の係り受け元および係り受け先の関係を把握するとともに、テキストに含まれる単語の表現の強弱、多重否定、肯定疑問、係り受け、比較、方言の解釈を行う構文解析処理を行う(ステップS109)。
次に、タグ付け部18は、処理対象データの各々に含まれるテキストに対して、「企業タグ」、「トピックタグ」、「感性タグ」、「ミラータグ」、「サーモタグ」、「リスクタグ」のタグ付けを行う(ステップS111)。
タグ付け部18は、企業辞書30に記憶された辞書データの文字列が処理対象データに含まれる場合には、処理対象データ内のその文字列に対して「企業タグ」を付与する。タグ付け部18は、トピック辞書32に記憶された辞書データの文字列が処理対象データに含まれる場合には、処理対象データ内のその文字列に対して「トピックタグ」を付与する。タグ付け部18は、感性辞書36に記憶された辞書データの文字列が処理対象データに含まれる場合には、処理対象データ内のその文字列に対して「感性タグ」を付与する。タグ付け部18は、ミラー辞書38に記憶された辞書データの文字列が処理対象データに含まれる場合には、処理対象データ内のその文字列に対して「ミラータグ」を付与する。タグ付け部18は、サーモ辞書40に記憶された辞書データの文字列が処理対象データに含まれる場合には、処理対象データ内のその文字列に対して「サーモタグ」を付与する。タグ付け部18は、リスク辞書42に記憶された辞書データの文字列が処理対象データに含まれる場合には、処理対象データ内のその文字列に対して「リスクタグ」を付与する。
図7は、本実施形態においてタグ付け処理が行われた処理対象データの一例を示す図である。図7に示す例では、「A社」および「製品A」という文字列に対して「企業タグ」が付与され、「販売開始」という文字列に対して「トピックタグ」が付与され、「独創的」という文字列に対して「ミラータグ」が付与され、「期待」という文字列に対して「サーモタグ」および「感性タグ」が付与され、「故障」という文字列に対して「リスクタグ」が付与されている。
次に、スコアリング部20は、タグ付け部18よってタグ付けが行われた処理対象データに基づいて、ミラースコア、サーモスコア、およびリスク値を算出するスコアリング処理を行う(ステップS113)。スコアリング部20は、「企業タグ」と「トピックタグ」と「サーモタグ」との組み合わせでタグ付けされた処理対象データを対象に、処理対象データ毎のサーモスコアの算出を行う。スコアリング部20は、付与された「企業タグ」と「トピックタグ」ごとのミラースコアとサーモスコアを用いて、評価値を算出する。
例えば、図8に示すように、「処理対象データ1」は、「新型」という「トピックタグ」が付与された文字列と、「製品A」という「企業タグ」が付与された文字列と、「かっこよかった」という「ミラータグ(大分類「ヨロコビ」)」が付与された文字列と、「是非チェック」という「サーモタグ(「期待」に関連付けされたキーワード)」が付与された文字列とを含む。この場合、スコアリング部20は、「製品A」と「新型」と「ヨロコビ」との組み合わせで個別ミラースコアを「1.0」と算出する。また、スコアリング部20は、「製品A」と「新型」と「期待」との組み合わせで個別サーモスコアを「1.0」と算出する。
また、「処理対象データ2」は、「新型」という「トピックタグ」が付与された文字列と、「かっこよかった」という「ミラータグ(大分類「ヨロコビ」)」が付与された文字列と、「是非チェック」という「サーモタグ(「期待」に関連付けされたキーワード)」が付与された文字列とを含む。この場合、「企業タグ」が付与された文字列が存在しないため、スコアリング部20は、個別ミラースコアおよび個別サーモスコアを「0.0」に設定する。
また、「処理対象データ3」は、「新型」という「トピックタグ」が付与された文字列と、「製品A」および「A社」という「企業タグ」が付与された文字列と、「かっこよかった」という「ミラータグ(大分類「ヨロコビ」)」が付与された文字列と、「是非チェック」という「サーモタグ(「期待」に関連付けされたキーワード)」が付与された文字列とを含む。即ち、「処理対象データ3」は、「企業タグ」が付与された「製品A」および「A社」という2つ文字列を含む。この場合、スコアリング部20は、この2つも文字列のそれぞれについて、個別ミラースコアおよび個別サーモスコアを算出する。
ここで、「処理対象データ3」においては、「展示すごくかっこよかったです」という肯定的な表現を含んでいるが、これは、製品AまたはA社を肯定的に表現していない場合がある。即ち、「展示すごくかっこよかったです」という表現は、「展示」の方法についての肯定的な表現であるとも解釈できる。この場合、スコアリング部20は、製品Aを直接的に肯定的に表現する処理対象データ1よりも、低い個別ミラースコアおよび個別サーモスコアを算出する。例えば、スコアリング部20は、「製品A」と「新型」と「ヨロコビ」との組み合わせで個別ミラースコアを「0.5」と算出し、「A社」と「新型」と「ヨロコビ」との組み合わせで個別ミラースコアを「0.5」と算出する。また、スコアリング部20は、「製品A」と「新型」と「期待」との組み合わせで個別サーモスコアを「0.5」と算出し、「A社」と「新型」と「期待」との組み合わせで個別サーモスコアを「0.5」と算出する。
次に、スコアリング部20は、「企業タグ」と「トピックタグ」と「リスクタグ」との組み合わせでタグ付けされた処理対象データを対象に、処理対象データ毎のリスク値(以下、「個別リスク値」と称する)の算出を行う。例えば、スコアリング部20は、「リスクタグ」の数をカウントし、「リスクタグ」1つを1点としてスコアリングを行う。
次に、スコアリング部20は、全ての処理対象データに対する個別スコアリング処理が完了した後、各処理対象データの収集元の種類に基づいて、重み付け処理を行う。スコアリング部20は、メディアM(情報媒体)の種類に基づいて、ミラー辞書38に記憶された用語を含むデータとサーモ辞書40に記憶された用語を含むデータとに対して重み付けを行い、後述するミラースコアとサーモスコアの算出を行う。例えば、過去の統計データに基づいて、メディア毎の1日あたりの評価対象となるブランドの平均発言量を算出し、全てのメディアの影響が均一になるように重み付けを行う。例えば、新聞の重みを基準値の「1」とした場合、新聞と比較して発言量が少ないテレビについては、新聞よりも大きな重み「2」を設定する。また、新聞と比較して発言量が多いSNSについては、新聞よりも小さな重み「0.1」を設定する。
次に、スコアリング部20は、処理対象データに付与された「感性タグ」に基づいて、処理対象データの内容が、ポジティブな表現であるのか、ネガティブな表現であるのかを判定する感情判定処理を行う。スコアリング部20は、処理対象データの各々について、ミラースコアおよびサーモスコア毎に、ポジティブ(肯定的)な内容を示すものであるのか、ネガティブ(否定的)な内容を示すものであるのかを判定する。
例えば、スコアリング部20は、1つの処理対象データの中で、ポジティブな表現を示す箇所の数(ポジティブな表現の感性タグの数)がネガティブな表現を示す箇所の数(ネガティブな表現の感性タグの数)よりも多い場合には、その処理対象データは全体としてポジティブな表現であると判定する。また、スコアリング部20は、1つの処理対象データの中で、ネガティブな表現を示す箇所の数がポジティブな表現を示す箇所の数よりも多い場合には、その処理対象データは全体としてネガティブな表現であると判定する。なお、スコアリング部20は、1つの処理対象データの中で、ポジティブな表現を示す箇所の数とネガティブな表現を示す箇所の数とが同じである場合には、その処理対象データは全体としてニュートラルな表現であると判定する。また、スコアリング部20は、「感性タグ」が付与されていない処理対象データについては、無感情と判定する。
次に、スコアリング部20は、感情判定処理を行った処理対象データに基づいて、最終的なサーモスコアおよびミラースコアを算出する。例えば、スコアリング部20は、評価対象となるブランド毎に、ポジティブな表現であると判定した処理対象データの個別ミラースコアの合計、およびネガティブな表現であると判定した処理対象データの個別ミラースコアの合計を算出する。また、スコアリング部20は、ポジティブな表現であると判定した処理対象データの個別ミラースコアの合計から、ネガティブな表現であると判定した処理対象データの個別ミラースコアの合計を引いた値を、最終的なミラースコアとして算出する。
また、例えば、スコアリング部20は、評価対象となるブランド毎に、ポジティブな表現であると判定した処理対象データの個別サーモスコアの合計、およびネガティブな表現であると判定した処理対象データの個別サーモスコアの合計を算出する。また、スコアリング部20は、ポジティブな表現であると判定した処理対象データの個別サーモスコアの合計から、ネガティブな表現であると判定した処理対象データの個別サーモスコアの合計を引いた値を、最終的なサーモスコアとして算出する。また、スコアリング部20は、算出したミラースコアおよびサーモスコアを記憶部24に記憶させる。
次に、スコアリング部20は、感情判定処理を行った処理対象データに基づいて、最終的なリスク値を算出し、リスクレベルを判定する。リスクレベルの判定においては、所定の閾値を基準として、例えば、リスクの「高」、「中」、「低」が判定される。以上により、スコアリング処理を終了する。
次に、スコアリング部20は、算出したミラースコア、サーモスコア、リスク値などを、表示部22に表示させる評価結果出力処理を行う。スコアリング部20は、ミラースコアと、サーモスコアと、リスク値とを対比した画像を表示可能とする情報を生成し、表示部22に表示させる。そして、ミラースコアと、サーモスコアと、リスク値を参照して評価値を算出し、評価結果として表示部22に出力する(ステップS115)。
なお、算出したミラースコア、サーモスコア、リスク値を三次元空間にマッピングし、サポートベクターマシーンで評価値を算出するようにしてもよい。
上記の本実施形態の評価装置1によれば、取得した情報に含まれたノイズによらず、企業または団体が期待するブランドのイメージと世間(需要家)の反応とのギャップを評価し、企業または団体が行った活動などによって世間がどのように反応したのかについて適切に評価することができる。また、ブランドのイメージと世間の反応とのギャップを評価する場合、メディアに露出された情報の確からしさも含めて適切に評価し、さらに企業のリスクの程度も評価することができる。
また、例えば、感性タグが付与されたテキストは、スコアリング部20における評価に大きな影響を与えるため、感性タグが付されたテキストがノイズとして残っていると、評価に対する精度を悪化させてしまう。この点、上記の本実施形態の評価装置1によれば、ノイズ除去部14によってノイズ除去処理を行うことにより、処理対象データに含まれる感性表現のうち、宣伝データに含まれる感性表現が除去される。一例として、ノイズ除去部14によるノイズの除去を行った場合と行わなかった場合の例を図9に示す。ノイズ除去を行わなかった場合には、図9(A)に示すように、「楽しい」の語が含まれるテキストが334件であったが、ノイズ除去部14によるノイズ除去を行った場合には、図9(B)に示すように、「楽しい」の語が含まれるテキストが115件であった。このように、処理対象データに含まれるノイズを好適に除去することができる。したがって、タグ付け部18によって「感性タグ」を付与されるテキストから、宣伝データに含まれるテキストが除去される。よって、スコアリング部20における評価の精度の悪化を抑制することができる。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形および置換を加えることができる。
1…評価装置、10…収集部(提供情報取得部、投稿情報取得部)、12…スクリーニング部、14…ノイズ除去部、16…解析部、18…タグ付け部、20…スコアリング部(評価部)、22…表示部、24…記憶部、26…辞書DB、30…企業辞書、32…トピック辞書、34…代替表現辞書、36…感性辞書、38…ミラー辞書、40…サーモ辞書、42…リスク辞書

Claims (10)

  1. 対象事物に関し、メディアを介して需要家に提供された提供情報を取得する提供情報取得部と、
    投稿者により投稿された投稿情報を取得する投稿情報取得部と、
    前記投稿情報取得部により取得された投稿情報のうち、前記提供情報との合致度合が所定割合以上である投稿情報から、少なくとも前記提供情報に含まれる感性表現をノイズとして除去するノイズ除去部と、
    前記ノイズ除去部によりノイズが除去された投稿情報に基づいて、前記対象事物の評価を行う評価部と、
    を備える評価装置。
  2. 前記ノイズ除去部は、前記感性表現が含まれる前記投稿情報における前記提供情報に対応する部分を、前記提供情報から前記感性表現を除去した代替情報に置換する請求項1に記載の評価装置。
  3. 前記ノイズ除去部は、前記投稿情報および前記提供情報に含まれる単語の性質ごとに重み付けを行う請求項1または2に記載の評価装置。
  4. 前記投稿情報取得部は、前記提供情報に対する感想を含む投稿情報を選択的に取得する請求項1から3のうちのいずれか一項に記載の評価装置。
  5. 前記投稿情報は、所定の発信源から発信された提供情報に対する感想に関する投稿情報である請求項4に記載の評価装置。
  6. 前記投稿情報取得部により取得され、前記ノイズ除去部によってノイズが除去された投稿情報に含まれる文章の構文解析を行う構文解析部と、
    前記構文解析部における解析結果をスコアリングするスコアリング部と、を備え、
    前記スコアリング部は、前記対象事物と前記スコアリングされた解析結果との関連付けを行う請求項1から5のうちのいずれか一項に記載の評価装置。
  7. 前記スコアリング部は、前記構文解析部で解析された解析結果に重み付けを行う請求項6に記載の評価装置。
  8. 対象事物に関し、メディアを介して需要家に提供された提供情報を取得する提供情報取得部と、
    投稿者により投稿された投稿情報を取得する投稿情報取得部と、
    前記投稿情報取得部により取得された投稿情報のうち、前記提供情報との合致度合が所定割合以上である投稿情報から、少なくとも前記提供情報に含まれる感性表現をノイズとして除去するノイズ除去部と、
    を備えるノイズ除去装置。
  9. コンピュータが、
    対象事物に関し、メディアを介して需要家に提供された提供情報を取得し、
    投稿者により投稿された投稿情報を取得し、
    取得された投稿情報のうち、前記提供情報との合致度合が所定割合以上である投稿情報から、少なくとも前記提供情報に含まれる感性表現をノイズとして除去し、
    ノイズが除去された投稿情報に基づいて、前記対象事物の評価を行う、
    評価方法。
  10. コンピュータに、
    対象事物に関し、メディアを介して需要家に提供された提供情報を取得させ、
    投稿者により投稿された投稿情報を取得させ、
    取得された投稿情報のうち、前記提供情報との合致度合が所定割合以上である投稿情報から、少なくとも前記提供情報に含まれる感性表現をノイズとして除去させ、
    ノイズが除去された投稿情報に基づいて、前記対象事物の評価を行わせる、
    プログラム。
JP2017170216A 2017-09-05 2017-09-05 評価装置、評価方法、ノイズ除去装置、およびプログラム Active JP6821528B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017170216A JP6821528B2 (ja) 2017-09-05 2017-09-05 評価装置、評価方法、ノイズ除去装置、およびプログラム
US16/058,378 US11132699B2 (en) 2017-09-05 2018-08-08 Apparatuses, method, and computer program for acquiring and evaluating information and noise removal
CN201810983108.5A CN109426987B (zh) 2017-09-05 2018-08-27 评价装置、评价方法、噪声消除装置和程序存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017170216A JP6821528B2 (ja) 2017-09-05 2017-09-05 評価装置、評価方法、ノイズ除去装置、およびプログラム

Publications (2)

Publication Number Publication Date
JP2019046289A JP2019046289A (ja) 2019-03-22
JP6821528B2 true JP6821528B2 (ja) 2021-01-27

Family

ID=65514724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017170216A Active JP6821528B2 (ja) 2017-09-05 2017-09-05 評価装置、評価方法、ノイズ除去装置、およびプログラム

Country Status (3)

Country Link
US (1) US11132699B2 (ja)
JP (1) JP6821528B2 (ja)
CN (1) CN109426987B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11373198B2 (en) * 2016-12-02 2022-06-28 Honda Motor Co., Ltd. Evaluation device, evaluation method, and evaluation program
JP2021039595A (ja) * 2019-09-04 2021-03-11 本田技研工業株式会社 データ処理装置及びデータ処理方法
JP7180921B1 (ja) 2021-12-17 2022-11-30 hackjpn株式会社 プログラム、情報処理装置および情報処理方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3751795B2 (ja) * 1999-11-22 2006-03-01 株式会社東芝 歩行者用道案内文自動作成装置および方法並びに記録媒体
JP2002140252A (ja) * 2000-11-02 2002-05-17 Nec Custommax Ltd 閲覧サービス方法、データ処理方法および装置、ユーザ端末装置、情報記憶媒体
JP2003256449A (ja) * 2002-03-05 2003-09-12 Ricoh Co Ltd 重要情報抽出システムおよび重要情報抽出方法
US20060026054A1 (en) 2004-07-28 2006-02-02 International Business Machines Corporation Method, apparatus, and program for implementing an automation computing evaluation scale to generate recommendations
JP4197019B2 (ja) 2006-08-02 2008-12-17 ソニー株式会社 撮像装置および表情評価装置
US8204684B2 (en) * 2007-06-28 2012-06-19 Apple Inc. Adaptive mobile device navigation
JP2009123015A (ja) * 2007-11-15 2009-06-04 Bbmedia Inc ブランドランク評価システムおよび方法
DE112008003959T5 (de) 2008-07-31 2011-06-01 Hewlett-Packard Development Co., L.P., Houston Wahrnehmungssegmentierung von Bildern
US9189748B2 (en) * 2010-05-24 2015-11-17 Nec Corporation Information extraction system, method, and program
JP2013235507A (ja) 2012-05-10 2013-11-21 Mynd Inc 情報処理方法、装置、コンピュータプログラムならびに記録媒体
CN103455562A (zh) 2013-08-13 2013-12-18 西安建筑科技大学 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器
JP2015095249A (ja) * 2013-11-12 2015-05-18 パラディ有限会社 ブランド診断方法及びそのシステム
CN103853824B (zh) 2014-03-03 2017-05-24 沈之锐 一种基于深度语义挖掘的内文广告发布方法与系统
JP6384242B2 (ja) 2014-09-30 2018-09-05 大日本印刷株式会社 情報分析装置、情報分析方法、及び、プログラム
JP6068587B1 (ja) * 2015-08-28 2017-01-25 Necソリューションイノベータ株式会社 ブランド価値解析装置、ブランド価値解析方法、及びプログラム
CN105183869B (zh) 2015-09-16 2018-11-02 分众(中国)信息技术有限公司 楼宇知识图谱数据库及其构建方法
CN105469282A (zh) 2015-12-01 2016-04-06 成都知数科技有限公司 基于文本评论的线上品牌评估方法
CN106127507A (zh) 2016-06-13 2016-11-16 四川长虹电器股份有限公司 一种基于用户评价信息的商品舆情分析方法及系统
CN106355455A (zh) 2016-11-18 2017-01-25 北京信息科技大学 一种从网购用户评论中抽取产品特征信息的方法

Also Published As

Publication number Publication date
US20190073682A1 (en) 2019-03-07
CN109426987A (zh) 2019-03-05
CN109426987B (zh) 2021-12-28
JP2019046289A (ja) 2019-03-22
US11132699B2 (en) 2021-09-28

Similar Documents

Publication Publication Date Title
US10748164B2 (en) Analyzing sentiment in product reviews
US20110131485A1 (en) Publishing specified content on a webpage
US20140304814A1 (en) System and methods for automatically detecting deceptive content
US10366117B2 (en) Computer-implemented systems and methods for taxonomy development
CN108038725A (zh) 一种基于机器学习的电商产品客户满意度分析方法
US11126783B2 (en) Output apparatus and non-transitory computer readable medium
CN110325986A (zh) 文章处理方法、装置、服务器及存储介质
Wang et al. Customer-driven product design selection using web based user-generated content
US20100125531A1 (en) System and method for the automated filtering of reviews for marketability
JP5442401B2 (ja) 行動情報抽出システム及び抽出方法
JP6821528B2 (ja) 評価装置、評価方法、ノイズ除去装置、およびプログラム
JP4600045B2 (ja) 意見抽出用学習装置及び意見抽出用分類装置
US20210118035A1 (en) Generation device and non-transitory computer readable medium
JPWO2012096388A1 (ja) 意外性判定システム、意外性判定方法およびプログラム
KR101007284B1 (ko) 인터넷을 이용한 의견 검색 시스템 및 그 방법
US20190019094A1 (en) Determining suitability for presentation as a testimonial about an entity
JP5942052B1 (ja) データ分析システム、データ分析方法、およびデータ分析プログラム
US20150235243A1 (en) Engagement tool for a website
JP6718535B2 (ja) 評価装置、評価方法、および評価プログラム
WO2019192122A1 (zh) 文档主题参数提取方法、产品推荐方法、设备及存储介质
KR20090126862A (ko) 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체
US11373198B2 (en) Evaluation device, evaluation method, and evaluation program
US20200142963A1 (en) Apparatus and method for predicting response to an article
Banerjee et al. Distinguishing between authentic and fictitious user-generated hotel reviews
JP2008009623A (ja) 体験強度算出方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200929

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210106

R150 Certificate of patent or registration of utility model

Ref document number: 6821528

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150