JP5905652B1 - データ評価システム、データ評価方法、およびデータ評価プログラム - Google Patents

データ評価システム、データ評価方法、およびデータ評価プログラム Download PDF

Info

Publication number
JP5905652B1
JP5905652B1 JP2015558254A JP2015558254A JP5905652B1 JP 5905652 B1 JP5905652 B1 JP 5905652B1 JP 2015558254 A JP2015558254 A JP 2015558254A JP 2015558254 A JP2015558254 A JP 2015558254A JP 5905652 B1 JP5905652 B1 JP 5905652B1
Authority
JP
Japan
Prior art keywords
data
emotion
evaluation
user
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015558254A
Other languages
English (en)
Other versions
JPWO2016121127A1 (ja
Inventor
守本 正宏
正宏 守本
秀樹 武田
秀樹 武田
ヤコブ ハルスコウ
ヤコブ ハルスコウ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ubic Inc
Original Assignee
Ubic Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ubic Inc filed Critical Ubic Inc
Application granted granted Critical
Publication of JP5905652B1 publication Critical patent/JP5905652B1/ja
Publication of JPWO2016121127A1 publication Critical patent/JPWO2016121127A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/165Evaluating the state of mind, e.g. depression, anxiety

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Psychiatry (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Social Psychology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychology (AREA)
  • Developmental Disabilities (AREA)
  • Child & Adolescent Psychology (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Educational Technology (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

ユーザの感情を表した情報と当該感情を分類する分類情報とを含むデータを、訓練データとして取得する取得部と、前記訓練データに含まれるデータ要素が前記ユーザの感情を反映する度合を、感情評価情報として、前記分類情報に基づいて決定する感情評価部と、前記データ要素と当該データ要素に対して決定された感情評価情報とを対応付けて記憶部に格納する格納部と、新たなデータが未知データとして取得された場合、前記記憶部に格納された感情評価情報に基づいて、当該未知データを作成したユーザの感情を評価する未知データ評価部とを備える。

Description

本発明は、データを分析するデータ評価システム、データ評価方法、およびデータ評価プログラムに関する。
近年、数多の情報が溢れ、各種の情報に触れる機会が多い。特に、ウェブブラウジングにより、各種の情報に触れる場合が多い。そのため、膨大な情報の中から、ユーザにとって有益な情報を探索するのが困難になりつつある。そこで、数多くある情報について、ユーザが一般的にどのような印象を抱くのかを推測できれば、その情報にふれるか否かの指標とすることができる。
このような推測技術としては、特許文献1がある。特許文献1には、テキストデータ中において、「うれしい」、「悲しい」、「怒る」、「喜ぶ」という4つの感情表現と共起する対象語を選定し、選定した対象語の重み値を算出することが開示され、当該対象語の重み値を用いてテキストデータを評価することが開示されている。
特開2007−18234号公報
しかしながら、上記特許文献1に記載の手法では、ユーザが一般的に抱く可能性がある印象とは異なる印象を推論した結果を出力することがあるという問題がある。
そこで、本発明においては、上記問題に鑑みて、ユーザがどのような感想を抱いたのかを推測できるデータ評価システム等を提供することを目的とする。
上記課題を解決するために、本発明の一実施態様は、ユーザの感情を表した情報と当該感情を分類する分類情報とを含むデータを、訓練データとして取得する取得部と、感情評価情報を設定する設定部と、当該感情評価情報は、前記訓練データに含まれるデータ要素前記ユーザの感情を反映する度合前記分類情報に基づいて決定された情報を含み、前記データ要素と当該データ要素に対応する前記感情評価情報とを対応付けて記憶部に格納する格納部と、前記訓練データとは異なる対象データについて、前記記憶部に格納された前記感情評価情報に基づいて、当該対象データを作成したユーザの感情を評価する評価部と、を備えデータ評価システムである。
上記課題を解決するために、本発明の他の実施態様は、コンピュータがデータを評価する方法であって、前記コンピュータが備えるプロセッサは、ユーザの感情を表した情報と当該感情を分類する分類情報とを含むデータを、訓練データとして取得するステップと、感情評価情報を設定するステップと、当該感情評価情報は、前記訓練データに含まれるデータ要素前記ユーザの感情を反映する度合前記分類情報に基づいて決定された情報を含み、前記データ要素と当該データ要素に対応する前記感情評価情報とを対応付けて前記コンピュータのメモリに格納するステップと、前記訓練データとは異なる対象データについて、前記メモリに格納された前記感情評価情報に基づいて、当該対象データを作成したユーザの感情を評価する評価ステップと、実行する
上記課題を解決するために、本発明のさらに他の実施態様は、プロセッサを有するコンピュータに、データを評価させるプログラムであって、前記プロセッサに、ユーザの感情を表した情報と当該感情を分類する分類情報とを含むデータを、訓練データとして取得する機能と、感情評価情報を設定する機能と、当該感情評価情報は、前記訓練データに含まれるデータ要素前記ユーザの感情を反映する度合前記分類情報に基づいて決定された情報を含み、前記データ要素と当該データ要素に対応する前記感情評価情報とを対応付けて前記コンピュータのメモリに格納する機能と、前記訓練データとは異なる対象データについて、前記メモリに格納された前記感情評価情報に基づいて、当該対象データを作成したユーザの感情を評価する評価機能と、を実現させる
本発明の一態様に係るデータ評価システム、データ評価方法、およびデータ評価プログラムは、データを作成したユーザが抱いた感情を推測することができる。
実施の形態に係るデータ評価システムの機能構成を示すブロック図である。 実施の形態に係るデータ評価の際に参照するウェブページの構成の一例を示す図である。 データ分析のための訓練データの作成処理を示すフローチャートである。 未分類データを作成したユーザの感情を評価する処理を示すフローチャートである。
<実施の形態>
本発明に係るデータ評価システムの一実施態様について、図面を参照しながら説明する。
<概要>
本実施の形態に係るデータ評価システムは、ユーザが商品や、映画、番組などに対して与えた批評(訓練データ)に基づいて、未知データ(文書データ(例えば、電子メール、プレゼンテーション資料、表計算資料、打ち合わせ資料、契約書、組織図、事業計画書など、少なくとも一部にテキストを含むデータ)を主に指すが、画像データ、音声データ、映像データなど、任意のデータを広く含む)を作成した、ユーザがどのような感情を抱いたのか(例えば、好印象を抱いたのか、あるいは、悪印象を抱いたのか)を推測する。
一般に、オンライン商品サイトや、レストランガイドなどにおいては、ユーザのコメントとともに、そのユーザの商品に対する評価値が記載されているサイトが多い。
そこで、発明者らは、これらのコメントと評価とに基づいて訓練データ(training data)を作成し、当該訓練データに基づいて、未知データを評価することによって、例えば、ある商品に対して、ユーザが好印象を抱いたのか、あるいは、悪印象を抱いたのかを推測することを思索した。すなわち、高評価のコメントに含まれるデータ要素と、低評価のコメントに含まれるデータ要素とを特定し、それぞれのデータ要素の評価値を定めることで、新たなデータ(未知データ)を評価する際の指標とすることに想到した。
これは、例えば、テキストデータの場合であれば、評価の高い複数のコメントでは共通の単語(例えば、「良かった」、「楽しかった」)が用いられることが多く、評価の低い複数のコメントにおいても異なる共通の単語(例えば、「悪かった」、「つまらなった」)が用いられることが多いという点に気づいた発明者らの思索に基づく。
そして、これらの単語(データ要素)として、感情表現を示す単語(例えば、形容詞、形容動詞、副詞など)を用いることで、ユーザがどのような感情にしたがって新たなデータ(未知データ)を作成したのかを推測しやすいことにも想到した。
以下、本発明に係るデータ評価システムにおいて、評価に用いる語の選出ならびにその評価値の決定手法、および、その評価値を用いて新たなデータを評価する手法を詳細に説明する。
<構成>
図1は、データ評価システム100の機能構成を示すブロック図である。
図1に示すように、データ評価システム100は、通信部110と、入力部120と、制御部130と、記憶部140と、表示部150とを含む。
通信部110は、ネットワークを介して外部の装置と通信を実行する機能を有する。通信部110は、評価と対応するコメント(ウェブサイトに含まれるデータ)が記載されたウェブページにアクセスして当該ウェブページの情報を収集し、記憶部140に格納する機能を有する。また、通信部110は、ユーザ端末との通信が確立できる場合に、制御部130から伝達された結果情報(評価対象のデータが好印象を抱くものかあるいは悪印象を抱くものかを示す情報)を、当該ユーザ端末に送信する機能も有する。
入力部120は、ユーザからの入力を受け付けて、ウェブページに対する評価およびコメントの入力を受け付ける機能を有する。入力部120は、受け付けた入力内容を制御部130に伝達する。
制御部130は、記憶部140に記憶されている各種データを参照しながら、データ評価システム100の各部を制御する機能を有するプロセッサである。制御部130は、データ評価システム100が有する各種機能を統括的に制御する。
制御部130は、データ抽出部131と、評価情報受付部132と、データ分類部133と、要素抽出部134と、感情抽出部135と、感情評価部136と、評価格納部137と、未分類データ評価部138と、提示部139とを含む。
データ抽出部131は、記憶部140に記憶されているウェブページに係る情報群から必要に応じたデータを抽出する機能を有する。データ抽出部131は、記憶部140に記憶されている評価と当該評価に対応するコメントとを含む分類データをデータ分類部133に伝達する。また、データ抽出部131は、評価されていないデータを記憶部140から取得し、未分類データ評価部138に伝達する。
評価情報受付部132は、ユーザのある対象についての評価およびコメントを入力部120から受け付けてデータ分類部133に伝達する機能を有する。ここで、対象は、批評の対象になるものであれば、どのようなものであってもよく、例えば、何らかの商品や食事、番組などであってよい。
データ分類部133は、データ抽出部131から受け付けた分類データを分類する機能を有する。ここでは、データ分類部133は、分類データに含まれる評価に基づいて分類する。具体的には、分類データは、☆の数で5段階に評価されているものとし、☆の数が多いほど高評価、すなわち、ユーザが当該分類データの対象に対して好印象を抱いたものとする。そして、データ分類部133は、☆の数が4または5の分類データを「高評価(好印象)」と分類し、☆の数が1または2の分類データを「低評価(悪印象)」と分類する。データ分類部133は、例えば、分類データに分類を示す分類情報(フラグ情報)をデータに対応付けることで、当該データを分類する。
要素抽出部134は、データ分類部133により分類情報が対応付けられた分類データから、データ要素を抽出する機能を有する。ここで、要素抽出部134は、例えば、(1)データが文書データの場合、当該文書データに含まれるキーワード(いわゆる、形態素)、センテンス、段落などをデータ要素として抽出し、(2)データが音声データの場合、当該音声データに含まれる部分音声をデータ要素として抽出し、(3)データが画像データの場合、当該画像データに含まれる部分画像をデータ要素として抽出し、(4)データが映像データの場合、当該映像データに含まれるフレーム画像(または、複数のフレーム画像の組み合わせ)をデータ要素として抽出することができる。
なお、要素抽出部134は、所定の選定基準に従って抽出するデータ要素を決定する。要素抽出部134は、データが文書データの場合、いわゆる形態素解析を用いてデータ要素を抽出してよい。また、要素抽出部134は、入力部120を介してユーザに指定されたデータ要素を抽出することもできる。要素抽出部134は、抽出したデータ要素を感情抽出部135に伝達する。
感情抽出部135は、伝達されたデータ要素のうち、感情表現を示すデータ要素を抽出する機能を有する。ここでは、感情表現を示すデータ要素としては、形容詞、形容動詞、副詞を用いることとする。なお、これらの品詞以外の品詞を用いてもよい。感情抽出部135は、抽出した感情表現を示すデータ要素を感情評価部136に伝達する。
感情評価部136は、データ要素(例えば、形容詞、形容動詞に該当する形態素)についての感情マーカー(感情評価情報)を生成する。当該感情マーカーは、ユーザが好印象を抱くか、あるいは、悪印象を抱くかの指標となる値である。すなわち、感情マーカーは、データ要素がユーザの感情を反映する度合を示すものと言える。
感情評価部136は、以下のようにして感情マーカーを生成する。
感情評価部136は、まず、データ分類部133により好印象を抱いていると分類された1以上の分類データ(すなわち、☆の数が4または5である分類データ)において、ある感情表現に係るデータ要素(以下データ要素Aとする)が出現する回数Aをカウントする。そして、感情評価部136は、好印象を抱いていると判定された分類データ全てにおいて上記データ要素Aが出現する頻度RFを算出する。
当該頻度RFは、以下の数式(1)により算出することができる。
上記式(1)において、Nは、判定に用いる好印象の1以上の分類データに含まれる全データ要素数である。
次に、感情評価部136は、悪印象を抱いていると判定された1以上の分類データ(すなわち、☆の数が1または2である分類データ)において、上記データ要素Aが出現する回数Aをカウントする。そして、感情評価部136は、悪印象を抱いていると判定された分類データ全てにおいて上記データ要素Aが出現する頻度RFを算出する。
当該頻度は、以下の数式(2)により算出することができる。
上記式(2)において、Nは、判定に用いる悪印象の1以上の分類データに含まれる全データ要素数である。
感情評価部136は、式(1)と式(2)とを用いて算出された頻度を用いてデータ要素Aの感情マーカーを生成する。具体的には、感情評価部136は、感情判定指標値P(A)を以下の数式(3)を用いて算出する。
そして、感情評価部136は、感情判定指標値P(A)が1よりも大きい場合に、データ要素Aを好印象を抱くデータに用いられることが多いデータ要素として、その感情マーカーとして「+1」を指定し、感情判定指標値P(A)が1よりも小さい場合に、データ要素Aを、悪印象を抱くデータに用いられることが多いデータ要素として、その感情マーカーとして「−1」を指定し、評価格納部137に伝達する。
これにより、記憶部140には、好印象の文書に用いられることが多い語には感情マーカーとして「+1」が、悪印象の文書に用いられることが多い語には感情マーカーとして「−1」が、格納される。例えば、「良い」、「きれい」、「おいしい」というような語には「+1」がつきやすく、「悪い」、「汚い」、「まずい」というような語には「−1」がつきやすい。
感情評価部136は、算出した各データ要素の評価値と閾値とを評価格納部137に伝達する。
評価格納部137は、感情評価部136により評価された各データ要素とその評価を対応付けて記憶部140に格納する機能を有する。
未分類データ評価部138は、入力された好印象なのか悪印象なのか不明なデータ(以下、未分類データという)について、好印象であるか悪印象であるかを推定する機能を有する。
未分類データ評価部138は、未分類データから、データ要素を抽出する。そして、抽出したデータ要素のうち、感情表現に係るデータ要素を抽出する。すなわち、未分類データ評価部138は、記憶部140において、感情マーカーが設定されているデータ要素を抽出する。
そして、未分類データ評価部138は、抽出したデータ要素それぞれの感情マーカー値を、記憶部140から取得する。
未分類データ評価部138は、当該データ要素の感情マーカーを取得し、未分類データに出現する回数だけ、その感情マーカー値を加算する。例えば、「良い」というデータ要素に対して設定されている感情マーカーが「+1」で、未分類データに5回出現する場合に、未分類データの「良い」というデータ要素に基づく感情スコアを「5」とする。また、例えば、「悪い」というデータ要素に対して設定されている感情マーカーが「−1」で、未分類データに3回出現する場合に、未分類データの「悪い」というデータ要素に基づく感情スコアを「−3」とする。
このとき、未分類データ評価部138は、否定表現または誇張表現がデータ要素に係っているか否かを判定し、係っている場合には以下の処理を適用した上で感情スコアを算出する。
否定表現とは、データ要素を否定する表現であり、例えば、「良くない」、「おいしくない」というような表現である。このような表現がある場合には、これらは逆の表現として扱い、例えば、「良くない」であれば「悪い」とし、「おいしくない」であれば「まずい」として扱う。なお、ここでは、逆の表現として扱うこととしたが、これは、例えば、「良い」という表現に対して、「+1」の感情マーカーが設定されている場合に、これを負の値にすることとしてもよい。あるいは、感情マーカーとして設定されている値を所定量(例えば、1.5)だけ減少させることとしてもよい。また、更には、否定を否定する、すなわち、二重否定表現があるか否かを検出し、二重否定表現がある場合には、データ要素を肯定的に判定することとしてもよい。
また、誇張表現とは、データ要素をより誇張(強調)する表現であり、例えば、「とても」、「すごく」、「大変」というような表現のことを指す。このような誇張表現がデータ要素にかかっている場合には、その感情マーカー値を所定倍(例えば、2倍)にして感情スコアを算出する。例えば、「とてもおいしい」という表現がある場合であって、「おいしい」の感情マーカー値が「+1」であるときには、この表現に対する感情スコアを「+2」とする(増大させる)。なお、所定倍にするデータ要素は、誇張表現がかかっているデータ要素のみである。
こうして、未分類データ評価部138は、下記数式(4)に示すように、全てのデータ要素に基づく感情スコアを算出し、合算して未分類データのデータスコアSを算出する。
は、i番目のデータ要素の感情マーカーである。
そして、未分類データ評価部138は、そのデータスコアが、0よりも大きい場合に、未分類データを好印象を抱きやすいデータであると推測し、データスコアが0未満である場合に、未分類データを悪印象を抱きやすいデータであると推測する。未分類データ評価部138は、データスコアが0の場合は、どちらでもないと判定する。
未分類データ評価部138は、推測して得られた評価(好印象を抱きやすいのか、悪印象を抱きやすいのかの推測)を提示部139に伝達する。
提示部139は、未分類データ評価部138により未分類データについて好印象を抱きやすいデータであるのか、悪印象を抱きやすいデータであるのかを示す結果情報を提示する機能を有する。提示部139は、結果情報を通信部110を介してユーザ端末に送信するか、または、表示部150に伝達する。
記憶部140は、データ評価システム100が、データ分析のために用いるために必要とするプログラムおよび各種データを記憶する機能を有する記録媒体である。記憶部140は、例えば、HDD(Hard Disc Drive)、SSD(Solid State Drive)、半導体メモリ、フラッシュメモリなどにより実現される。なお、図1では、データ評価システム100が記憶部140を備える構成を示しているが、記憶部140は、データ評価システム100外部のものであって、データ評価システム100と通信可能に接続された記憶装置であってもよい。
表示部150は、制御部130から出力された表示データに基づく画像を表示する機能を有するモニターである。表示部150は、例えば、LCD(Liquid Crystal Display)や、PDP(Plasma Display Panel)、有機EL(Electro Luminescence)ディスプレイなどにより実現されてよい。本実施の形態においては、表示部150は、提示部139から伝達された結果情報を表示する。
<ウェブページ>
ここで、ウェブページについて簡単に説明する。
図2は、ウェブページの構成の一例を示す図であって、複数のユーザが評価およびコメントを付記したページを示している。図2のウェブページ200は、オンラインショッピングサイトのページ例である。
図2に示すウェブページ200は、商品写真A210、商品写真群220、商品情報欄230、コメント241〜244を含む。
商品写真A210は、商品を撮影した外観写真である。
商品写真群220は、商品を別の角度から撮影した外観写真のサムネイルである。当該サムネイルをクリックすると、外観写真A210が表示されている領域に選択した写真が表示される。
商品情報欄230は、商品の値段や寸法などの説明が記載される。
コメント241〜244は、商品を見た、あるいは、商品を使用したユーザが抱いた感想が書き込まれた情報である。
図2に示すように、各コメント241〜244は、書き込んだユーザの名前、そのユーザが商品に対して下した評価、および、感想を含む。ここでは、評価は、☆で表現され、5段階評価されている。☆の数が多いほど高評価(好印象)が対象(商品)に与えられたことを意味する。
これらのコメント一つ一つを、本実施の形態においては分類データとして扱う。
なお、図2に示したウェブページの構成は一例であり、ウェブページには様々な形態の構成のものがあることは言うまでもない。
<動作>
図3は、データ評価システム100が、評価とコメントを含むウェブページの分類データを分析し、感情表現を示すデータ要素の評価を算出する際の動作を示すフローチャートである。
図3に示すように、データ評価システム100のデータ抽出部131は、評価とコメントを含むウェブページを分類データとして記憶部140から収集する(ステップS301)。
次に、データ評価システム100のデータ分類部133は、分類データに含まれる評価に基づいて、当該分類データが好印象なデータであるか否かを分類する(ステップS302)。
要素抽出部134は、分類データからデータ要素を抽出する(ステップS303)。
感情抽出部135は、要素抽出部134が抽出したデータ要素のうち、感情表現を示すデータ要素を抽出する(ステップS304)。
感情評価部136は、感情抽出部135が抽出した感情表現を示すデータ要素各々を評価し、その評価値を評価格納部137に伝達する(ステップS305)。
評価格納部137は、伝達されたデータ要素と、その評価値を対応付けて記憶部140に格納する(ステップS306)。
以上が、データ要素の各評価を決定するまでのデータ評価システム100の動作である。図3に示す処理は、未分類のデータを、好印象を抱きやすいデータであるか、あるいは、悪印象を抱きやすいデータであるかを分類するために、いろいろなユーザがある対象に対して下した評価(分類情報)とコメントとを訓練データとして取得し、当該訓練データに含まれるデータ要素を評価する処理である。図3に示す処理により、ユーザがアクセスしたことがないウェブページの中からユーザにとって興味があると推測されるウェブページを特定するための前処理が完了する。
図4は、好印象のデータであるのか、悪印象のデータであるのかの分類が未分類の未分類データを分類する際のデータ評価システム100の動作を示すフローチャートである。
データ評価システム100の入力部120または通信部110は、好印象か悪印象か未分類のデータを分類対象の新たなデータとして受け付ける(ステップS401)。当該データは、記憶部140に記憶される。
未分類データ評価部138は、記憶部140に記憶された未分類データをデータ抽出部131から受け付けると、当該未分類データからデータ要素を抽出する(ステップS402)。
未分類データ評価部138は、抽出したデータ要素のうち、感情表現を示すデータ要素(ここでは、形容詞、形容動詞、副詞)を抽出する(ステップS403)。
未分類データ評価部138は、抽出した感情表現を示すデータ要素の感情マーカーを記憶部140から取得する。そして、未分類データ評価部138は、取得した感情マーカーに基づいて、各データ要素の登場回数および否定表現、誇張表現を加味した上で、未分類データのスコアを算出する。そして、未分類データ評価部138は、算出したスコアが正の値を示す場合に、当該未分類データは好印象を抱きやすいデータであるとの結果情報を生成し、算出したスコアが負の値を示す場合に、当該未分類データは悪印象を抱きやすいデータであるとの結果情報を生成する(ステップS404)。
生成された結果情報は、提示部139により、通信部110または表示部150に出力されてユーザに提示される。
図4に示す処理を実行することにより、データ評価システム100は、未分類データについて、好印象の(肯定的な)データであるのか、悪印象の(否定的な)データであるのかの推定を行うことができる。
<まとめ>
上述の処理により、データ評価システム100は、入力されたデータが好印象(肯定的)なものであるのか、悪印象(否定的)なものであるのかを評価することができる。したがって、データの内容の詳細を知らずとも、ユーザは、そのデータの内容を想像し得る。また、未分類データを分類するために用いるデータ、すなわち、訓練データとして、すでにウェブページ上においてなされている評価とそのコメントを使用するので、客観的な意見を訓練データとして扱うことができる。したがって、データ評価システム100のオペレータがデータについて肯定的か否定的かの判断を行い、その入力をする煩雑さがなく、また、多くの一般ユーザの意見を用いていることから、普遍的で汎用性の高いモデル(感情マーカー)を作成することができる。
<変形例>
上記実施形態1に本発明に係る発明の一実施態様を説明したが、本発明に係る思想がこれに限られないことは言うまでもない。以下、本発明に係る思想として含まれる各種変形例について説明する。
(1)上記実施の形態においては、感情マーカーは、肯定的なものである場合に「+1」、否定的なものである場合に「−1」とすることとしたが、これはその限りではない。
即ち、データ要素について、感情マーカーの値に軽重をつけることとしてもよい。
例えば、データ要素が分類データに出現する頻度に応じて、軽重をつけてもよい。よく出現するデータ要素については、感情マーカーの値を大きくし(例えば、1.8)、あまり登場しないデータ要素については、感情マーカーの値を小さくする(例えば、0.5)こととしてもよい。
(2)上記実施の形態においては、未分類データ評価部138は、感情表現を示すデータ要素の感情マーカーの値の合算値を算出することにより、未分類データを評価したが、これはその限りではない。
例えば、データ要素についての感情マーカーの値を要素とするベクトルを生成し、未分類データからは感情表現に係るデータ要素について抽出数を示すベクトルを生成し、それらのベクトルの内積を求めて、未分類データのスコアを算出することとしてもよい。
また、あるいは、未分類データ評価部138は、以下の式(5)を用いて、データ要素の出現頻度を重視して、未分類データのスコアSを算出してもよい。
ここで、mjは、j番目のキーワードの出現頻度を表し、wiは、i番目の感情表現に係るデータ要素の感情マーカー値を表す。
(3)上記実施の形態においては、詳細に説明していないが、未分類データ評価部138は、データ要素間の共起に基づくスコアを算出することとしてもよい。その手法の詳細をここに説明する。
例えば、評価対象のウェブページにおいて、感情表現に係るデータ要素として、第1キーワードと第2キーワードとが出現するとする。このとき、未分類データ評価部138は、第1キーワードがウェブページにおいて出現する際に、当該ウェブページにおいて、第2キーワードが出現する頻度(第1キーワードと第2キーワードとの間の相関。共起ともいう)を考慮したスコアリングを実行してもよい。
この場合、未分類データ評価部138は、第1キーワードと第2キーワードとの相関(共起)を表す相関行列(共起行列)Cを用いて、上記式(2)に換えて、以下の式(6)にしたがってスコアを算出することとしてもよい。
なお、上記相関行列Cは、所定のテキストを所定数だけ含む学習用データを用いて、予め最適化されているものとする。また、行列wは、感情マーカーの値を示す行列である。例えば、あるテキストにおいて「楽しい」というキーワードが出現する場合、当該キーワードに対する他のキーワードの出現数を0〜1の間に正規化した値(最尤推定値ともいう)が、上記相関行列Cの要素に格納される。
式(6)を用いることにより、キーワード間の相関関係を考慮したスコアを算出できるため、より高い精度でユーザが興味を示す可能性が高いウェブページを推測することができる。
(4)上記実施の形態においては、感情評価の対象となるデータとして、ウェブページ情報を用いたが、これはその限りではない。分類対象となるデータ群としては、例えば、メールデータ群や、医療カルテデータ群、訴訟関連データ群などであってもよい。
(5)上記実施の形態においては、文書情報(テキスト)を分析する例を説明したが、上述したように、音声や画像、映像に対する分析を行ってもよい。
例えば、音声の場合であれば、音声そのものを分析の対象としてもよいし、音声認識により音声を文書に変換したうえでの分析を実行してもよい。
音声そのものを分析する場合には、音声を所定の長さの部分音声に分割して、部分音声を分析の対象とする。例えば、「この映画が面白い」という音声が得られた場合、データ評価システム100は、「面白い」という部分音声を当該音声から抽出し、当該部分音声を評価した結果に基づいて、その感情マーカーを生成することができる。このような場合、データ評価システム100は、時系列データの分類アルゴリズム(例えば、マルコフモデル、カルマンフィルタなど)を利用して音声を分類できる。
音声をテキストに変換する場合には、上記実施の形態に示した場合と同様に分類すればよい。音声のテキストへの変換には、任意の音声認識アルゴリズム(例えば、隠れマルコフモデルを用いた認識方法など)を用いればよい。
(6)上記実施の形態に示したデータ評価システム100が評価する対象としては、以下にも適用することができる。
例えば、医療応用システム(電子カルテ、看護記録、患者の日記などをデータとして、傷病者の感情推測を行うシステム)に適用できる。この場合、医療応用システムは、分類データ(例えば、電子カルテ、看護記録、患者の日記など)に含まれる感情表現を示すデータ要素を抽出し、当該データが肯定的なものであるか、あるいは、否定的なものであるかに基づいて評価する。このとき、分類データについて、肯定的なデータであるかあるいは否定的なデータであるかの判断をユーザが行って、入力部120から入力する。
そして、未分類データ評価部138は、未分類データ(例えば、電子カルテ、看護記録、患者の日記など)に含まれる感情表現)に基づいて患者の心理状況(例えば、現在の傷病の状態に不安を感じている、あるいは、快方に向かうのか不安に感じているなどの心理)の推測を行うことができる。
また、データ評価システム100は、メール監査システムに適用することもできる。この場合、メール監査システムは、分類データ(例えば、ネットワーク上を日々流通する電子メール)について、ユーザがその内容から、例えば、不満を感じているか否か(あるいは、不正を行う可能性があるか否か)の評価を行う。そして、その評価に基づいて感情表現に係るデータ要素を当該分類データから抽出して、不満を感じているか否かに基づく感情マーカーを生成する。
そして、未分類データ評価部138は、未分類データ(例えば、新たな電子メール)を、当該感情マーカーに基づいて評価する。これによって、例えば、会社内において、メールを作成した社員が、会社に対して不平、不満を感じているか否か(あるいは不正を働きそうか)を推測して、社員による不正行為(例えば、情報漏洩)のリスクを未然に防止することができる。また、その際には、未分類データの作成者が不平、不満を感じていると評価された未分類データが、何に対して不平、不満(例えば、報酬に対する不満、労務環境に対する不満など)を感じているのかについて、クラスタリングすることにより、例えば、「不平・不満を表現していない:92%、報酬に対する不満を表現している:3%、労務環境に対する不満を表現している:2%、その他:3%」というように、不平・不満を表現するメールが占める割合を可視化することができる。
また、更には、電子メールについては、当該電子メールに含まれる感情表現に基づいて、人物相関図の作成にも利用することができる。例えば、ある組織内部において、立場が下位の者から上位の者に対して電子メールを送信する際には、ネガティブな内容を含むメールを送信しにくい一方で、立場が上位の者から下位の者に対して電子メールを送信する際には、比較的送信しやすいことから、感情分析の結果と電子メールの送信者と宛先とから、組織内のメンバーの上下関係を推測することができる。上記データ評価システム100は、そのために当該相関関係を推定する推定部を含んで良い。例えば、推定部は、Aという人物からBという人物に対して送信された所定数の電子メールから、データ要素を抽出して、電子メールを作成したユーザAの感情を肯定的なものが多いか、否定的なものが多いかを検出する。そして、推定部は、肯定的なものが多いと検出された場合にはAという人物はBという人物よりも立場的に下位の人物であると推定し、肯定的なものが多いと検出された場合にはAという人物はBという人物よりも立場的に上位の人物であると推定する。
さらに、データ評価システム100は、実績評価システムにも適用することができる。この場合、当該実績評価システムは、分類データ(例えば、営業部員が会社に提出する日報、コンサルタントが顧客に提出する分析資料、何等かの企画についてのユーザアンケート)について肯定的か否定的かを評価し、分類データに含まれる感情表現を示すデータ要素を評価する。そして、未分類データとして、例えば、店舗におけるユーザアンケートから感情分析を行って、店舗の運営状況(例えば、客が店員の接客態度に対する不満を抱いているか否か、商品の陳列状況に満足しているか否かなど)の判断材料にすることができる。
さらに、データ評価システム100は、知的財産評価システム、マーケティング支援システム、ドライビング支援システムなどにも適用することができる。
さらに、データ評価システム100は、ディスカバリー支援システムにも適用することができる。ディスカバリー支援システムは、例えば、カルテル防止のために、対象(例えば、企業)において、やり取りされる複数のメールに対して感情分析を行って、金銭に対する感情(例えば、安い、高い)をもって作成されたと推測されるメールを特定することが考えられる。
さらに、データ評価システム100は、フォレンジックシステムにも適用することができる。フォレンジックシステムは、例えば、容疑者がやり取りしたメールの感情分析を行って、悪意をもって作成されたと推定されるメールを特定し、不正に及んだ動機、あるいは、不正を行おうとしているかの特定に役立てることができる。
上記データ評価システムは、少なくとも次の3つの構成で実施され得る。すなわち、上記データ評価システムは、(a)クライアント装置(例えば、パーソナルコンピュータ、スマートフォンなどのユーザ端末)において当該データ評価システムを実現させるデータ分析プログラムの一部または全部が実行される構成で実施されてもよいし、(b)サーバ装置(例えば、メインフレーム、クラスタコンピュータ、上記システムによるサービスを外部の機器に提供可能な任意のコンピュータなど)において上記データ分析プログラムの一部または全部が実行され、当該実行された結果が上記クライアント装置に返される構成で実施されてもよいし、(c)上記データ分析プログラムに含まれる処理を、上記クライアント装置およびサーバ装置において任意に分担する構成で実施されてもよい。言い換えれば、少なくとも1つのコンピュータから構成されるシステムとして上記データ評価システムが実現されてさえいればよく、当該データ評価システムに含まれる各機能は、当該システムを構成するコンピュータによって任意に分担して実現され得る。
このように、本発明のデータ評価システムは、種々のシステムにおいて利用される各種のデータに含まれる感情分析を行うことで、目的を達成する任意のシステムに適用することができる。
(7)上記実施の形態に示したデータ評価システムは、分類データとして、SNSやニュースサイトの情報から感情分析を行うことにより、例えば、世間を騒がす事件(例えば、テロなど)に対するユーザの感情(例えば、不安や焦燥など)を抽出して評価し、未分類データとして組織内の電子メールなどを評価する際に、それらの事件による影響を抽出した感情の評価をオフセットすることで、組織内の電子メールの分析精度を向上させることができる。一般的に、世間の社会情勢の影響を受けて記載された電子メールは、通常の心理状態により作成されたものとは異なる可能性が高いため、電子メールの分析の精度を低下させる一因となるが、当該オフセットを適用することにより、分析精度の低下を抑制することができる。
(8)上記実施の形態においては、ユーザの感情を評価するにあたっては、ウェブページにおける評価(☆の数が4、5の場合に「良い」という感情、☆の数が1、2の場合に「悪い」という感情)を用いて、2値の値でデータ要素を評価することとしていたが、これはその限りではない。
例えば、☆が5つの場合に「とても良い」、4つの場合に「良い」、3つの場合に「普通」、「悪い」「とても悪い」というように5つの分類で評価してもよい。
また、分類データとして、「良い」「悪い」ではなく、他の感情、例えば、「面白い」、「つまらない」という感情、あるいは、「嬉しい」、「悲しい」という感情のように、その他の感情で分類してもよい。
また、未分類データ評価部138は、「良い」「悪い」で評価したデータ要素の感情マーカーと、「面白い」「つまらない」で評価したデータ要素の感情マーカーとを組み合わせて、未分類データを作成したユーザの感情を評価することとしてもよい。
(9)上記データ評価システム100の分類データおよび未分類データとしては一例としてウェブページのコメントを利用する例を示したが、これは、その限りではない。分類データや未分類データの対象となるデータとしては、メッセージングサービスにおけるメッセージの内容、ウェブページのブログ、レシピ情報、チャットシステムにおけるチャットの内容、SNSでやり取りされるデータや記事などであってもよい。
例えば、ユーザ間でメッセージをやり取りするサービスにおける当該メッセージや、チャットシステムでやり取りされたユーザの発言などに基づいて、ユーザの感情を評価する感情マーカー作成を行ってもよい。また、作成された感情マーカーを用いて、このようなメッセージや発言に基づいて、未分類データ評価部138は、ユーザの感情を特定し、過激な思想を持っているか否かを特定し、提示部139がそのユーザが危険であるという情報を提示する(インターネットモニタリングシステム)こととしてもよい。
また、あるいは、ブログ記事を解析して、当該ブログ記事を作成したユーザが悪意をもって作成したと未分類データ評価部138が評価した場合に、提示部139は、そのブログの保持者が危険思想の人物であるとの情報を提示することとしてもよい。
また、あるいは、ウェブ記事の内容が肯定的な感情(楽しい、うれしいなど)が多いと未分類データ評価部138が評価した場合に、提示部139は、そのウェブ記事をユーザに対するおすすめ情報として提示することとしてもよい。当該おすすめ情報は、好感情の多いウェブページにおいて紹介されている商品などであってもよい。
データ評価システム100はこのように活用することもできる。
(10)データ評価システム100(情報処理装置)の各機能部は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよい。データ評価システム100の各機能部は、1又は複数の集積回路により実現されても良いし、複数の機能部が1の集積回路により実現されてもよい。
あるいは、データ評価システム100の各機能部により実現される機能は、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。この場合、データ評価システム100は、各機能を実現するソフトウェアであるデータ評価プログラムの命令を実行するCPU、上記ゲームプログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記データ評価プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記データ評価プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記データ評価プログラムは、当該ゲームプログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。本発明は、上記データ評価プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
なお、上記データ評価プログラムは、例えば、ActionScript、JavaScript(登録商標)などのスクリプト言語、Objective-C、Java(登録商標)などのオブジェクト指向プログラミング言語、HTML5などのマークアップ言語などを用いて実装できる。また、上記データ評価プログラムによって実現される各機能を実現する各部を備えた情報処理装置と、上記各機能とは異なる残りの機能を実現する各部を備えたサーバとを含む分散型のデータ評価システムも、本発明の範疇に入る。
(11)本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。例えば、各機能部、各ステップ等に含まれる機能等は再配置可能であり、複数の手段やステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。
(12)上記実施の形態および各種変形例に示す構成を適宜組み合わせることとしてもよい。
<補足>
ここに本発明に係るデータ評価システムの一実施態様とその効果について述べる。
(a)本発明に係るデータ評価システムは、ユーザの感情を表した情報と当該感情を分類する分類情報とを含むデータを、訓練データ(分類データ)として取得する取得部(110または120)と、前記訓練データに含まれるデータ要素が前記ユーザの感情を反映する度合を、感情評価情報(感情マーカー)として、前記分類情報に基づいて決定する感情評価部(136)と、前記データ要素と当該データ要素に対して決定された感情評価情報とを対応付けて記憶部(140)に格納する格納部(137)と、新たなデータが未知データ(未分類データ)として取得された場合、前記記憶部に格納された感情評価情報に基づいて、当該未知データを作成したユーザの感情を評価する未知データ評価部(138)とを備える。
また、本発明に係るデータ評価方法は、ユーザの感情を表した情報と当該感情を分類する分類情報とを含むデータを、訓練データとして取得する取得ステップと、前記訓練データに含まれるデータ要素が前記ユーザの感情を反映する度合を、感情評価情報として、前記分類情報に基づいて決定する感情評価ステップと、前記データ要素と当該データ要素に対して決定された感情評価情報とを対応付けて記憶部に格納する格納ステップと、新たなデータが未知データとして取得された場合、前記記憶部に格納された感情評価情報に基づいて、当該未知データを作成したユーザの感情を評価する未知データ評価ステップとを含む、コンピュータが実行するデータ評価方法である。
また、本発明に係るデータ評価プログラムは、コンピュータに、ユーザの感情を表した情報と当該感情を分類する分類情報とを含むデータを、訓練データとして取得する取得機能と、前記訓練データに含まれるデータ要素が前記ユーザの感情を反映する度合を、感情評価情報として、前記分類情報に基づいて決定する感情評価機能と、前記データ要素と当該データ要素に対して決定された感情評価情報とを対応付けて記憶部に格納する格納機能と、新たなデータが未知データとして取得された場合、前記記憶部に格納された感情評価情報に基づいて、当該未知データを作成したユーザの感情を評価する未知データ評価機能とを実現させる。
これにより、データ評価システムは、感情表現を示すデータ要素を用いて、未知データを作成したユーザの感情を評価することができる。したがって、例えば、未知データとして組織内でやり取りされる電子メールを作成したユーザの感情を評価すれば、組織に対する不満を抱いているか否かを検知することができる。
(b)上記(a)に係るデータ評価システムにおいて、前記感情評価部は、前記データ要素が、所定の感情に分類される訓練データに出現する頻度と、前記所定の感情に分類されない訓練データに出現する頻度とに基づいて、前記度合を、当該データ要素に対する前記感情評価情報として決定することとしてもよい。
これにより、データ評価システムは、データ要素が出現する頻度を基準に、ユーザの感情を反映する度合を決定することができる。頻出するデータ要素は、ユーザの感情に密接に関連し、稀に出現するデータ要素は、ユーザの感情とはあまり関わらないと推定することができる。
(c)上記(a)または(b)に係るデータ評価システムにおいて、前記未知データ評価部は、前記未知データからデータ要素を抽出し、当該データ要素に対応付けられている感情評価情報を前記記憶部から取得し、当該取得した感情評価情報に基づいて前記未知データを作成したユーザの感情を評価することとしてもよい。
これにより、データ評価システムは、未知データを作成したユーザの感情を、当該未知データに含まれるデータ要素に対して予め対応付けられている感情評価情報に基づいて評価することができる。
(d)上記(c)に係るデータ評価システムにおいて、前記未知データ評価部は、さらに、前記未知データに前記データ要素が出現する頻度と、当該データ要素に対応付けられた感情評価情報とに基づいて、当該未知データを作成したユーザの感情を評価することとしてもよい。
感情評価情報が対応付けられたデータ要素が出現すれば出現しただけ、ユーザの感情との関連度合が深いと考えることができる。したがって、未知データにデータ要素が出現する頻度を考慮に入れることで、未知データを作成したユーザの感情をより正確に評価することができる。
(e)上記(c)または(d)に係るデータ評価システムにおいて、前記未知データ評価部は、前記未知データから抽出したデータ要素に誇張表現による修飾がなされている場合に、当該データ要素に対応付けられている感情評価情報として示される度合を増大させて、前記未知データを作成したユーザの感情を評価することとしてもよい。
未知データに誇張表現がデータ要素を修飾していた場合、当該データ要素のユーザの感情との関連度合がより深いと考えることができる。したがって、未知データを作成したユーザの感情を評価する際に、誇張表現による修飾があるか否かを加味することで、未知データを作成したユーザの感情をより正確に評価することができる。
(f)上記(c)〜(e)のいずれかに係るデータ評価システムにおいて、前記未知データ評価部は、前記未知データから抽出したデータ要素に否定表現による修飾がなされている場合に、当該データ要素に対応付けられている感情評価情報として示される度合を減少させて、前記未知データを作成したユーザの感情を評価することとしてもよい。
データ要素に対して否定表現による修飾がされている場合には、そのデータ要素に対する感情とは逆の感情を抱いてユーザが未知データを作成したと考えることができる。したがって、未知データを作成したユーザの感情を評価する際に、否定表現による修飾があるか否かを加味することで、未知データを作成したユーザの感情をより正確に評価することができる。
(g)上記(a)〜(f)のいずれかに係るデータ評価システムにおいて、前記データ評価システムは、さらに、前記未知データ評価部が評価したユーザの感情に関する評価情報を提示する提示部を備えることとしてもよい。
これにより、ユーザは、未知データを作成したユーザの感情を認識することができる。
(h)上記(a)〜(g)のいずれかに係るデータ評価システムにおいて、前記未知データは、電子メールであり、前記未知データ評価部は、前記電子メールが前記未知データとして取得された場合、前記記憶部に格納された感情評価情報に基づいて、当該電子メールを作成したユーザの感情を評価することとしてもよい。
これにより、例えば、組織内でやり取りされる電子メールを未知データとして取得し、各電子メールを作成したユーザの感情を認識することで、組織への不満を検出し、不正が行われる可能性を抑制することができる。
(i)上記(a)〜(g)のいずれかに係るデータ評価システムにおいて、前記未知データは、電子メールであり、前記データ評価システムは、さらに、前記未知データ評価部により評価されたユーザの感情に基づいて、前記電子メールを作成したユーザと当該電子メールの宛先として指定された他のユーザとの間の人間関係を推定する推定部を備えることとしてもよい。
これにより、データ評価システムは、未知データ、すなわち、電子メールに含まれるユーザの感情に基づいてユーザと、その電子メールの宛先となっている人物との間の人物相関関係を推定することができる。したがって、データ評価システムは、例えば、人物相関図を作成する際の支援を行うことができる。
本発明は、パーソナルコンピュータ、サーバ装置、ワークステーション、メインフレームなど、任意のコンピュータに広く適用することができる。
100 データ評価システム
110 通信部
120 入力部
130 制御部
131 データ抽出部
132 評価情報受付部
133 データ分類部
134 要素抽出部
135 感情抽出部
136 感情評価部
137 評価格納部
138 未分類データ評価部(未知データ評価部)
139 提示部
140 記憶部
150 表示部


Claims (12)

  1. ユーザの感情を表した情報と当該感情を分類する分類情報とを含むデータを、訓練データとして取得する取得部と、
    感情評価情報を設定する設定部と、当該感情評価情報は、前記訓練データに含まれるデータ要素前記ユーザの感情を反映する度合前記分類情報に基づいて決定された情報を含み、
    前記データ要素と当該データ要素に対応する前記感情評価情報とを対応付けて記憶部に格納する格納部と、
    前記訓練データとは異なる対象データについて、前記記憶部に格納された前記感情評価情報に基づいて、当該対象データを作成したユーザの感情を評価する評価部と、
    を備えデータ評価システム。
  2. 前記設定部は、前記データ要素が、所定の感情に分類される前記訓練データに出現する頻度と、前記所定の感情に分類されない前記訓練データに出現する頻度とに基づいて、前記度合を、当該データ要素に対する前記感情評価情報として決定する請求項1に記載のデータ評価システム。
  3. 前記評価部は、前記対象データからデータ要素を抽出し、当該データ要素に対応付けられている前記感情評価情報を前記記憶部から取得し、当該取得した感情評価情報に基づいて前記対象データを作成したユーザの感情を評価する請求項1または2に記載のデータ評価システム。
  4. 前記対象データ評価部は、さらに、前記対象データに前記データ要素が出現する頻度と、当該データ要素に対応付けられた前記感情評価情報とに基づいて、当該対象データを作成したユーザの感情を評価する請求項3に記載のデータ評価システム。
  5. 前記評価部は、前記対象データから抽出したデータ要素に誇張表現による修飾がなされている場合に、当該データ要素に対応付けられる前記度合を増大させて、前記対象データを作成したユーザの感情を評価する請求項3または4に記載のデータ評価システム。
  6. 前記対象データ評価部は、前記対象データから抽出したデータ要素に否定表現による修飾がなされている場合に、当該データ要素に対応付けられている感情評価情報として示される度合を減少させて、前記対象データを作成したユーザの感情を評価する請求項3〜5のいずれか一項に記載のデータ評価システム。
  7. 前記データ評価システムは、さらに、前記評価部が評価したユーザの感情に関する評価情報を提示する提示部を備える請求項1〜6のいずれか一項に記載のデータ評価システム。
  8. 前記対象データは、電子メールを含み
    前記評価部は、前記記憶部に格納された感情評価情報に基づいて、当該電子メールを作成したユーザの感情を評価する請求項1〜7のいずれか一項に記載のデータ評価システム。
  9. 前記対象データ電子メールを含み
    前記評価部により評価されたユーザの感情に基づいて、前記電子メールを作成したユーザと当該電子メールの宛先として指定された他のユーザとの間の人間関係を推定する推定部を備える請求項1〜7のいずれか一項に記載のデータ評価システム。
  10. 前記対象データは、ウェブサイトに含まれるデータを有し
    前記評価部は、前記ウェブサイトに含まれるデータ、前記記憶部に格納された感情評価情報に基づいて、当該データを作成したユーザの感情を評価する請求項1〜7のいずれか一項に記載のデータ評価システム。
  11. コンピュータがデータを評価する方法であって、
    前記コンピュータが備えるプロセッサは、
    ユーザの感情を表した情報と当該感情を分類する分類情報とを含むデータを、訓練データとして取得するステップと、
    感情評価情報を設定するステップと、当該感情評価情報は、前記訓練データに含まれるデータ要素前記ユーザの感情を反映する度合前記分類情報に基づいて決定された情報を含み、
    前記データ要素と当該データ要素に対応する前記感情評価情報とを対応付けて前記コンピュータのメモリに格納するステップと、
    前記訓練データとは異なる対象データについて、前記メモリに格納された前記感情評価情報に基づいて、当該対象データを作成したユーザの感情を評価する評価ステップと、
    実行する方法
  12. プロセッサを有するコンピュータに、データを評価させるプログラムであって、
    前記プロセッサに、
    ユーザの感情を表した情報と当該感情を分類する分類情報とを含むデータを、訓練データとして取得する機能と、
    感情評価情報を設定する機能と、当該感情評価情報は、前記訓練データに含まれるデータ要素前記ユーザの感情を反映する度合前記分類情報に基づいて決定された情報を含み、
    前記データ要素と当該データ要素に対応する前記感情評価情報とを対応付けて前記コンピュータのメモリに格納する機能と、
    前記訓練データとは異なる対象データについて、前記メモリに格納された前記感情評価情報に基づいて、当該対象データを作成したユーザの感情を評価する評価機能と、
    を実現させるためのプログラム。
JP2015558254A 2015-01-30 2015-01-30 データ評価システム、データ評価方法、およびデータ評価プログラム Active JP5905652B1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/052777 WO2016121127A1 (ja) 2015-01-30 2015-01-30 データ評価システム、データ評価方法、およびデータ評価プログラム

Publications (2)

Publication Number Publication Date
JP5905652B1 true JP5905652B1 (ja) 2016-04-20
JPWO2016121127A1 JPWO2016121127A1 (ja) 2017-04-27

Family

ID=55755961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015558254A Active JP5905652B1 (ja) 2015-01-30 2015-01-30 データ評価システム、データ評価方法、およびデータ評価プログラム

Country Status (4)

Country Link
US (1) US20170323013A1 (ja)
EP (1) EP3089053A4 (ja)
JP (1) JP5905652B1 (ja)
WO (1) WO2016121127A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111640040A (zh) * 2020-04-07 2020-09-08 国网新疆电力有限公司 基于客户画像技术的供电客户价值评价方法及大数据平台

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7008970B2 (ja) * 2017-01-18 2022-01-25 株式会社I From Japan ゲーム装置、ゲーム遂行方法、およびプログラム
US10410655B2 (en) * 2017-09-18 2019-09-10 Fujitsu Limited Estimating experienced emotions
US11373448B2 (en) * 2018-04-04 2022-06-28 Panasonic Intellectual Property Management Co., Ltd. Emotion inference device, emotion inference method, and recording medium

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004514220A (ja) * 2000-11-15 2004-05-13 株式会社ジャストシステム テキスト内の感情と情緒を分析するための方法および装置
JP2005032167A (ja) * 2003-07-11 2005-02-03 Sony Corp 情報検索装置、情報検索方法、情報検索システム、クライアント装置およびサーバ装置
JP2005339368A (ja) * 2004-05-28 2005-12-08 Ntt Docomo Inc 感情把握システムおよび感情把握方法
US20060200341A1 (en) * 2005-03-01 2006-09-07 Microsoft Corporation Method and apparatus for processing sentiment-bearing text
JP2007018234A (ja) * 2005-07-07 2007-01-25 National Institute Of Information & Communication Technology 感情表現語句辞書自動生成方法及び装置、並びにテキストに対する感情尺度評価値自動付与方法及び装置
WO2011079311A1 (en) * 2009-12-24 2011-06-30 Minh Duong-Van System and method for determining sentiment expressed in documents
JP2011180988A (ja) * 2010-03-03 2011-09-15 Tokyo Institute Of Technology 感情極性推定装置、感情極性推定方法及び感情極性推定処理プログラム
JP2012044562A (ja) * 2010-08-20 2012-03-01 Kyocera Corp 携帯端末装置
JP2013105232A (ja) * 2011-11-11 2013-05-30 Nippon Telegr & Teleph Corp <Ntt> 感情推定装置及び感情推定方法
WO2013179340A1 (ja) * 2012-05-30 2013-12-05 株式会社日立製作所 情報分析システム及び情報分析方法
JP2013246636A (ja) * 2012-05-25 2013-12-09 Nippon Telegr & Teleph Corp <Ntt> 評価表現極性判定装置、方法、及びプログラム
JP2014222397A (ja) * 2013-05-13 2014-11-27 日本電信電話株式会社 感情推定方法、装置及びプログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7249312B2 (en) * 2002-09-11 2007-07-24 Intelligent Results Attribute scoring for unstructured content
US20080249764A1 (en) * 2007-03-01 2008-10-09 Microsoft Corporation Smart Sentiment Classifier for Product Reviews
US7987188B2 (en) * 2007-08-23 2011-07-26 Google Inc. Domain-specific sentiment classification
KR100917784B1 (ko) * 2007-12-24 2009-09-21 한성주 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법 및 시스템
US9105008B2 (en) * 2010-11-29 2015-08-11 Yahoo! Inc. Detecting controversial events
US20130097176A1 (en) * 2011-10-12 2013-04-18 Ensequence, Inc. Method and system for data mining of social media to determine an emotional impact value to media content
US9275041B2 (en) * 2011-10-24 2016-03-01 Hewlett Packard Enterprise Development Lp Performing sentiment analysis on microblogging data, including identifying a new opinion term therein
US9471883B2 (en) * 2013-05-09 2016-10-18 Moodwire, Inc. Hybrid human machine learning system and method
US20140351079A1 (en) * 2013-05-24 2014-11-27 University College Dublin Method for recommending a commodity
WO2015035098A2 (en) * 2013-09-04 2015-03-12 Zero360, Inc. Processing system and method
KR20160065670A (ko) * 2014-12-01 2016-06-09 삼성전자주식회사 컨텐트를 제공하는 방법 및 디바이스
EP3238176B1 (en) * 2014-12-11 2023-11-01 Intel Corporation Avatar selection mechanism

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004514220A (ja) * 2000-11-15 2004-05-13 株式会社ジャストシステム テキスト内の感情と情緒を分析するための方法および装置
JP2005032167A (ja) * 2003-07-11 2005-02-03 Sony Corp 情報検索装置、情報検索方法、情報検索システム、クライアント装置およびサーバ装置
JP2005339368A (ja) * 2004-05-28 2005-12-08 Ntt Docomo Inc 感情把握システムおよび感情把握方法
US20060200341A1 (en) * 2005-03-01 2006-09-07 Microsoft Corporation Method and apparatus for processing sentiment-bearing text
JP2007018234A (ja) * 2005-07-07 2007-01-25 National Institute Of Information & Communication Technology 感情表現語句辞書自動生成方法及び装置、並びにテキストに対する感情尺度評価値自動付与方法及び装置
WO2011079311A1 (en) * 2009-12-24 2011-06-30 Minh Duong-Van System and method for determining sentiment expressed in documents
JP2011180988A (ja) * 2010-03-03 2011-09-15 Tokyo Institute Of Technology 感情極性推定装置、感情極性推定方法及び感情極性推定処理プログラム
JP2012044562A (ja) * 2010-08-20 2012-03-01 Kyocera Corp 携帯端末装置
JP2013105232A (ja) * 2011-11-11 2013-05-30 Nippon Telegr & Teleph Corp <Ntt> 感情推定装置及び感情推定方法
JP2013246636A (ja) * 2012-05-25 2013-12-09 Nippon Telegr & Teleph Corp <Ntt> 評価表現極性判定装置、方法、及びプログラム
WO2013179340A1 (ja) * 2012-05-30 2013-12-05 株式会社日立製作所 情報分析システム及び情報分析方法
JP2014222397A (ja) * 2013-05-13 2014-11-27 日本電信電話株式会社 感情推定方法、装置及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111640040A (zh) * 2020-04-07 2020-09-08 国网新疆电力有限公司 基于客户画像技术的供电客户价值评价方法及大数据平台

Also Published As

Publication number Publication date
EP3089053A1 (en) 2016-11-02
EP3089053A4 (en) 2017-10-11
WO2016121127A1 (ja) 2016-08-04
JPWO2016121127A1 (ja) 2017-04-27
US20170323013A1 (en) 2017-11-09

Similar Documents

Publication Publication Date Title
Wu et al. The influence of emoji meaning multipleness on perceived online review helpfulness: The mediating role of processing fluency
JP6182279B2 (ja) データ分析システム、データ分析方法、データ分析プログラム、および、記録媒体
US9152625B2 (en) Microblog summarization
JP5581408B2 (ja) 情報処理システム、情報処理装置、情報処理方法及びプログラム
US8412650B2 (en) Device and method and program of text analysis based on change points of time-series signals
JP6301966B2 (ja) データ分析システム、データ分析方法、データ分析のためのプログラム、及び、このプログラムの記録媒体
WO2016135905A1 (ja) 情報処理システム及び情報処理方法
JP2016527612A (ja) 検索エンジンによるコメントの順位付け
JP5905652B1 (ja) データ評価システム、データ評価方法、およびデータ評価プログラム
US20190087838A1 (en) Determining brand exclusiveness of users
Greenstein et al. Anger increases susceptibility to misinformation
Suresh et al. Aspect-based opinion mining and recommendationsystem for restaurant reviews
JP5942052B1 (ja) データ分析システム、データ分析方法、およびデータ分析プログラム
KR20100034140A (ko) 인터넷을 이용한 의견 검색 시스템 및 그 방법
JP6356268B2 (ja) 電子メール分析システム、電子メール分析システムの制御方法、及び電子メール分析システムの制御プログラム
WO2016189605A1 (ja) データ分析に係るシステム、制御方法、制御プログラム、および、その記録媒体
Li et al. Cyberbullying detection using parent-child relationship between comments
JP5933863B1 (ja) データ分析システム、制御方法、制御プログラム、および記録媒体
JP6178480B1 (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
Agarwal et al. Detecting Fake Reviews using Machine learning techniques: a survey
JP6043460B2 (ja) データ分析システム、データ分析方法、およびデータ分析プログラム
Thanasopon et al. Mining Social Media Crowd Trends from Thai Text Posts and Comments
Haney Sentiment analysis: Providing categorical insight into unstructured textual data
WO2016132558A1 (ja) 情報処理装置及び方法並びにプログラム
JP2017182363A (ja) 情報処理装置、情報処理方法および情報処理プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160301

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160316

R150 Certificate of patent or registration of utility model

Ref document number: 5905652

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250