JP5929532B2 - Event detection apparatus, event detection method, and event detection program - Google Patents
Event detection apparatus, event detection method, and event detection program Download PDFInfo
- Publication number
- JP5929532B2 JP5929532B2 JP2012132506A JP2012132506A JP5929532B2 JP 5929532 B2 JP5929532 B2 JP 5929532B2 JP 2012132506 A JP2012132506 A JP 2012132506A JP 2012132506 A JP2012132506 A JP 2012132506A JP 5929532 B2 JP5929532 B2 JP 5929532B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- event detection
- segment
- unit
- emotion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、大規模データからのイベント検出装置、イベント検出方法およびイベント検出プログラムに関し、特に様々な属性情報が付随する大規模なテキストデータからのイベント検出装置、イベント検出方法およびイベント検出プログラムに関する。 The present invention relates to an event detection apparatus, event detection method, and event detection program from large-scale data, and more particularly to an event detection apparatus, event detection method, and event detection program from large-scale text data accompanied by various attribute information.
Twitterに代表されるマイクロブログの普及により、使用者がリアルタイムにテキスト情報を、アップロードをすることが可能となり、何らかのイベントが起きた時、その情報についての情報がリアルタイムにアップロードされている。そのため、そのテキスト情報を分析することで、その情報がアップロードされた時間に、何かインパクトの大きいイベントが起きていたことを検出することができる。 With the spread of microblogs represented by Twitter, users can upload text information in real time, and when some event occurs, information about the information is uploaded in real time. Therefore, by analyzing the text information, it is possible to detect that an event having a large impact occurred at the time when the information was uploaded.
イベントを検出する際、何らかのイベントに関係する特定情報の出現頻度を分析することがよく行われる。例えば、非特許文献1には、テキスト情報を分析し、急激に特定の単語が増えた時間セグメントを見つけることで、イベントの検出を行う技術が開示されている。しかし、出現頻度が急増した単語が必ずしもイベントにつながっているとは限らない。
When detecting an event, it is common to analyze the appearance frequency of specific information related to some event. For example, Non-Patent
そこで、例えば非特許文献2には、特にテキスト情報に含まれる感情情報の強さに着目し、感情情報の強さが急増した部分を見つけることで、イベントを検出する試みについて記載されている。つまり、感情的傾向の強さが急増したテキストが集中する時刻付近において、なんらかの社会的にインパクトのあるイベントが起きている可能性が高い、と仮定しイベント検出が行われている。
Thus, for example, Non-Patent
しかし、非特許文献2に記載された技術では、収集した全てのマイクロブログ情報を用いて感情情報の強度の時間推移を参照しているため、時間的に平均化すると微妙な感情強度の変化が平滑化されがちであり、検出精度が低下してしまう。一般にイベントは、時間的、場所的に局在していることが多く、さらには、どのような人がそのイベントに敏感に反応するかなど、イベントに関する情報は様々な要素に依存する。つまり、情報の感情量変化は、様々なパラメータの局所量であり、平滑化によって検出が難しくなる。
However, since the technique described in
つまり、第一の問題点は情報に含まれる感情的傾向の変化が、様々な属性情報に強く依存し、それらの属性情報に関する局所性を考慮しないと精度よくイベントを検出することができないということである。その理由は、何らかのイベントに関する情報は、その情報の属性情報に関して敏感であり、その結果、その感情的傾向の変化は属性情報の局所量となるからである。また、何らかのイベントに関する情報やその感情的傾向は、その情報を発信する発信者や時間、場所などに強く依存するため、検出したいイベントによっては複数の属性情報を考慮する必要があり、時間情報だけでは不十分で様々な属性情報を考慮する必要がある。 In other words, the first problem is that changes in emotional tendencies contained in information strongly depend on various attribute information, and events cannot be detected accurately without considering the locality of those attribute information. It is. The reason is that information about any event is sensitive to the attribute information of the information, and as a result, the change in the emotional tendency becomes a local quantity of the attribute information. In addition, information about an event and its emotional tendency strongly depend on the sender, time, and location of the information, so depending on the event you want to detect, you need to consider multiple attribute information. However, it is not sufficient and it is necessary to consider various attribute information.
また、第二の問題点に単に感情的傾向の急増を検出するだけでは、局所的な変化のトレンドが考慮されないため、単なる急増では情報のアップロードの多い場所の影響などを受けやすく、絶対数が少ない局所的変化の検出が難しくなるからである。 In addition, simply detecting a sudden increase in emotional tendency as the second problem does not consider the trend of local changes, so a simple increase is likely to be affected by places where information is frequently uploaded, and the absolute number is This is because it becomes difficult to detect a small local change.
そこで、本発明は、イベント検出精度を向上させることができるイベント検出装置、イベント検出方法およびイベント検出プログラムを提供することを目的とする。 Accordingly, an object of the present invention is to provide an event detection apparatus, an event detection method, and an event detection program that can improve event detection accuracy.
本発明によるイベント検出装置は、属性情報が付随した情報を入力し、当該情報に基づいて実世界で起きている特徴的事象を検出するイベント検出装置であって、前記情報の属性情報を用いて前記情報を複数のセグメントに分割するセグメント化部と、前記情報に含まれる感情的傾向を分析し、分析結果に基づいて当該情報を分類する感情管理部と、前記セグメントに含まれる前記情報の前記分析結果および前記分類の結果に基づく定量的評価値を算出し、前記セグメントを当該定量的評価値にマッピングする感情強度バランス評価部と、前記定量的評価値に基づいて前記セグメントのうちの一部のセグメントを選出し、当該セグメントの特徴を抽出し、選出された当該セグメント及び当該特徴を出力する情報整形部とを備えたことを特徴とする。 An event detection apparatus according to the present invention is an event detection apparatus that inputs information accompanied by attribute information and detects a characteristic phenomenon occurring in the real world based on the information, using the attribute information of the information A segmentation unit that divides the information into a plurality of segments, an emotion management unit that analyzes emotional tendencies included in the information, and classifies the information based on an analysis result, and the information included in the segments. A quantitative evaluation value based on the analysis result and the classification result, and an emotion intensity balance evaluation unit that maps the segment to the quantitative evaluation value; and a part of the segment based on the quantitative evaluation value And an information shaping unit that extracts the selected segment and outputs the feature. That.
本発明によるイベント検出方法は、属性情報が付随した情報を入力し、当該情報に基づいて実世界で起きている特徴的事象を検出するイベント検出方法であって、セグメント化部が、前記情報の属性情報を用いて前記情報を複数のセグメントに分割し、感情管理部が、前記情報に含まれる感情的傾向を分析し、分析結果に基づいて当該情報を分類し、感情強度バランス評価部が、前記セグメントに含まれる前記情報の前記分析結果および前記分類の結果に基づく定量的評価値を算出し、前記セグメントを当該定量的評価値にマッピングし、情報整形部が、前記定量的評価値に基づいて前記セグメントのうちの一部のセグメントを選出し、当該セグメントの特徴を抽出し、選出された当該セグメント及び当該特徴を出力することを特徴とする。 Event detection method according to the present invention receives the information that the attribute information is associated, a event detecting method for detecting the characteristic events taking place in the real world based on the information, segmenting section, of the information The attribute information is used to divide the information into a plurality of segments, the emotion management unit analyzes the emotional tendency included in the information, classifies the information based on the analysis result, the emotion strength balance evaluation unit, A quantitative evaluation value based on the analysis result and the classification result of the information included in the segment is calculated, the segment is mapped to the quantitative evaluation value, and an information shaping unit is based on the quantitative evaluation value And selecting a part of the segments, extracting the characteristics of the segment, and outputting the selected segment and the characteristic.
本発明によるイベント検出プログラムは、コンピュータに、属性情報が付随した情報を入力し、当該情報に基づいて実世界で起きている特徴的事象を検出する処理を実行させるイベント検出プログラムであって、コンピュータに、前記情報の属性情報を用いて前記情報を複数のセグメントに分割するセグメント化処理と、前記情報に含まれる感情的傾向を分析し、分析結果に基づいて当該情報を分類する感情管理処理と、前記セグメントに含まれる前記情報の前記分析結果および前記分類の結果に基づく定量的評価値を算出し、前記セグメントを当該定量的評価値にマッピングする感情強度バランス評価処理と、前記定量的評価値に基づいて前記セグメントのうちの一部のセグメントを選出し、当該セグメントの特徴を抽出し、選出された当該セグメント及び当該特徴を出力する情報整形処理とを実行させることを特徴とする。 An event detection program according to the present invention is an event detection program for inputting information accompanied by attribute information to a computer and executing a process of detecting a characteristic event occurring in the real world based on the information. A segmentation process for dividing the information into a plurality of segments using the attribute information of the information, an emotion management process for analyzing an emotional tendency included in the information, and classifying the information based on the analysis result; A quantitative evaluation value based on the analysis result and the classification result of the information included in the segment, and an emotion intensity balance evaluation process for mapping the segment to the quantitative evaluation value; and the quantitative evaluation value Based on the above, select some of the segments, extract the characteristics of the segments, Characterized in that to execute the information shaping process of outputting the segments and the feature.
本発明によれば、イベント検出精度を向上させることができる。 According to the present invention, event detection accuracy can be improved.
以下、本発明の実施形態を、図面を参照して詳細に説明する。図1は、本発明によるイベント検出装置の実施形態の構成を示すブロック図である。図1に示すように、本実施形態のイベント検出装置は、情報受信部102と、情報管理部103と、データベース104と、感情分析部105と、感情分類部106と、セグメント化部107と、感情強度バランス評価部108と、情報整形部109とを備える。本実施形態のイベント検出装置は、情報発信者101が発信した情報を管理し、その情報を用いてイベント情報である出力データ110を出力する。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 is a block diagram showing a configuration of an embodiment of an event detection apparatus according to the present invention. As shown in FIG. 1, the event detection apparatus of this embodiment includes an
情報発信者101から発信される情報は、典型的には発信時間、発信場所を属性として含むテキスト情報であるが、発信者に関するプロファイル情報などのより複雑な属性情報を含んでもよいし、テキスト情報に限るものではない。
The information transmitted from the
出力データ110は、情報発信者が送信したデータから、イベント情報に代表される、なんらかの特定事象への人々が興味度合いの高まりに基づいて検出された情報である。出力データ110は、典型的には、あるイベントが特定時間、特定場所で起こった場合に入力されるそのイベントに関するコメントなどのテキスト情報から得られる、そのイベントの詳細に関する情報などが挙げられる。
The
情報受信部102は、ネットワークを経由して情報発信者から発信された情報を収集し、情報管理部103に送信する。
The
情報管理部103は、情報受信部102が収集した情報をデータベース104に保存し、管理する。情報管理部103は、典型的にはリレーショナルデータベースなどで表現されるデータベースシステムであり、データの要求に対して該当するデータを出力し、必要に応じて情報更新などを行うこともできる。
The
感情分析部105は、情報管理部103を通して得られたデータベース104のデータや、必要に応じて学習用の別データを用いて、収集情報の感情成分を分析する。また、感情分析部105は、分析した結果に基づいて、新しい情報を分類する分類器を作成したり、またその分類アルゴリズムを新しく入ってくる情報に基づいて更新したりする。
The
感情分類部106は、データベース104に保存された情報を、感情分析部105から受け取った分類器を用いて、分類する。分類器は、典型的には、「ポジティブ」「ネガティブ」「ニュートラル」などのように、情報をいくつかのクラスに分類する。
The
セグメント化部107は、情報受信部102が収集した情報の属性情報の全空間をセグメント化し、入力した個々の情報をそのセグメント化されたどこかの領域にマッピングする。セグメント化部107は、典型的には、例えば入力したテキスト情報の属性情報に発信時間と発信場所とが含まれる場合、時間的、場所的にセグメント化し、どの時間スロットにどこの小領域から発信されたテキスト情報であるかをマッピングする。
The segmenting
セグメント化部107による属性情報空間のセグメント化は、イベント情報を検出する上で、後述する感情強度バランス変化の特徴をとらえるのに必要なセグメント化を施すことが目的である。そのため、属性情報空間は、本実施形態では説明を簡単にするため時間と場所のみに限るが、例えば、発信者の性別、年齢、趣向情報など様々な詳細情報を含んだ複雑な空間であってもよい。イベントに関する情報やその感情的傾向の推移は、その場所や時間だけでなく上記の詳細情報に強く依存するため、属性情報空間に上記の詳細情報を含むことでイベント検出精度をより向上させることができる。
The segmentation of the attribute information space by the
感情強度バランス評価部108は、各セグメントに属するテキスト情報の感情分類を用いて、テキスト情報の強度バランスを評価し、テキスト情報を序列化可能な評価値に定量化する。
The emotion strength
情報整形部109は、その定量化された感情強度バランス評価値を用いて、あらかじめ決められたルール(例えば適当な正の整数Qを用いて上位Q個を選別する)に基づいて出力する情報を選択し、選別された情報の中からイベント情報を抽出、加工し、出力データ110を作成する。
The
次に、本実施形態の動作を説明する。図2は、本発明によるイベント検出装置の実施形態の動作を示すフローチャートである。情報発信者101は、スマートフォン、携帯電話に代表される計算端末より、適当なアプリケーションを用いて、テキスト情報をアップロードする(ステップS1)。テキスト情報には、例えば、アップロードした時間やGPSなどによって取得された位置情報、または必要に応じてその他の属性情報も含まれる。なお、情報発信者101による情報発信は常に行われ、情報受信部102は、常にポートを開いて、情報を受信可能な状態になっている。また、情報管理部103は、受信した情報をデータベース104に保存する。
Next, the operation of this embodiment will be described. FIG. 2 is a flowchart showing the operation of the embodiment of the event detection apparatus according to the present invention. The information sender 101 uploads text information from a calculation terminal represented by a smartphone or a mobile phone using an appropriate application (step S1). The text information includes, for example, uploaded time, position information acquired by GPS, or other attribute information as necessary. Information transmission by the
感情分析部105は、テキスト情報に対して、あらかじめ管理者によって設定された出力クラスおよび強度情報を出力するための分類器を作成する(ステップS2)。強度情報とは、分類されたクラスに属することの確からしさを定量的に表す情報である。本実施形態では、出力クラスを感情がポジティブ、ネガティブ、それ以外の三種類であるとし、分類器は、例えば入力したテキストのクラスをポジティブと判定すると、そのテキストをポジティブとマークし、テキストの強度情報も合わせて記録する。
The
この分類器の作成方法は、様々な手法が考えられるが、感情的傾向およびその強度を算出可能であればよく、以下に説明する例に限定されるものではない。非常に単純な方法としては、辞書をあらかじめ用意し、ポジティブ用語の辞書、ネガティブ用語の辞書を参照して、テキスト内のそれらの辞書に登録された単語の含蓄量からテキスト全体の感情量を推定する手法が用いられる。テキスト内にポジティブ用語、およびネガティブ用語の両方が含まれている場合は、例えば、ポジティブ単語の方が多ければ、そのテキストのクラスをポジティブにする、というようなルールを決めておく。 There are various methods for creating this classifier, but it is not limited to the example described below as long as it can calculate the emotional tendency and its intensity. A very simple method is to prepare a dictionary in advance, refer to the dictionary of positive terms and the dictionary of negative terms, and estimate the emotional amount of the entire text from the word content registered in those dictionaries in the text Is used. When both positive and negative terms are included in the text, for example, if there are more positive words, a rule is set such that the class of the text is positive.
もう少し複雑で適応的な手法として、代表的には機械学習を用いる方法がある。機械学習の学習方法として、教師なし、教師ありがあるが、ここでは教師あり学習を行うことにし、まず答えのデータセット(テストデータ)を用意する。つまり、感情分析部105は、適当なテキストとそのテキストの判定結果(分類クラス)が明記されたデータの集合を用意し、そのデータ集合を元にデフォルト分類器を作成する。感情分析部105は、例えばナイーブベイズを使って分類器を作成してもよいし、サポートベクターマシーンに代表される非線形分類手法などを用いて分類器を作成してもよい。
A more complicated and adaptive method is typically a method using machine learning. There are unsupervised and supervised learning methods for machine learning. Here, supervised learning is performed. First, an answer data set (test data) is prepared. That is, the
ナイーブベイズを用いる場合の分類器の作成方法例を説明する。まず、特定キーワードfが含まれていた場合の各クラスcに分類される確率p(f|c)を計算する。もし、分類対象テキストtがf1、・・・、fkのK個のキーワードを含んでおり独立性があると仮定した場合、それらのキーワードが含まれていた場合にそのテキストtがクラスcに分類される確率p(c|t)をp(c)×p(f1|c)×・・・×p(fk|c)とする。p(c)は、テキストtがクラスcに分類される事前確率である。p(c)は、例えば、全てのクラスに同じ確率を用いてもよく、テストデータの中のクラスの分布に基づいて決められてもよい。このようにp(c|t)を算出する機能と、p(c|t)のなかで一番大きな値(最大事後確率)を持つクラスcを出力する機能が作成されることで分類器が作成される。 An example of a method for creating a classifier when using naive Bayes will be described. First, the probability p (f | c) classified into each class c when the specific keyword f is included is calculated. If it is assumed that the classification target text t includes K keywords of f1,..., Fk and is independent, the text t is classified into class c if these keywords are included. The probability p (c | t) to be assumed is p (c) × p (f1 | c) ×... × p (fk | c). p (c) is a prior probability that the text t is classified into the class c. For example, p (c) may use the same probability for all classes, or may be determined based on the distribution of classes in the test data. In this way, the classifier is created by creating a function for calculating p (c | t) and a function for outputting a class c having the largest value (maximum posterior probability) in p (c | t). Created.
ここで、特定キーワードの選択手法には様々な手法が用いられる。非常に簡単な手法としては、例えば、辞書を予め用意しておく方法や、テキストの中で単語の頻出数順にソートし、上位の適当な数の単語を用いる方法などがある。また、特定キーワードの選択手法の他の方法として、例えば以下に説明するような情報量利得をつかう方法がある。 Here, various methods are used for selecting a specific keyword. As a very simple method, there are, for example, a method of preparing a dictionary in advance, a method of sorting in order of the number of words frequently used in a text, and using an appropriate number of words at the top. As another method for selecting a specific keyword, for example, there is a method using an information amount gain as described below.
情報量利得を用いる場合、まずテストデータセットの全てのテキストに含まれる単語を、形態素分析などによって抽出する。そして、各単語wを含むか含まないかによりテストデータすべてを分割した場合の、分割前後のクラス分類に関する情報量の変化量に応じて単語を選ぶ。例えば、あるデータ集合D={(t、c)}が与えられたとき、その情報量IDを以下の式(1)のように定義する。 When the information gain is used, first, words included in all texts of the test data set are extracted by morphological analysis or the like. Then, when all the test data is divided depending on whether or not each word w is included, words are selected according to the amount of change in the information amount related to the class classification before and after the division. For example, when a certain data set D = {(t, c)} is given, the information amount ID is defined as in the following formula (1).
ただし、Cはクラスの総数(この例ではポジティブ、ネガティブ、それ以外の3)であり、gcはDの中でクラスcであるテキストの数、GはDに含まれるテキスト総数である。すると、ある単語wの分割によって、D0→(D1、D2)となったとすると、分割前の情報量I0から分割後の情報量I1を引いた量ΔIは、以下の式(2)で表される。 Here, C is the total number of classes (in this example, positive, negative, and other 3), gc is the number of texts that are class c in D, and G is the total number of texts included in D. Then, if D 0 → (D 1 , D 2 ) is obtained by dividing a certain word w, an amount ΔI obtained by subtracting the information amount I 1 after the division from the information amount I 0 before the division is represented by the following formula ( 2).
ただし、G1およびG2は、D1およびD2に含まれるテキストの総数であり、G=G1+G2である。例えば、ある単語wを使って分類したD1にはあるクラスcのみのテキストが含まれ、D2には他の全てのテキストが含まれる場合、ID1は0となるため、ΔIは大きくなる。全ての単語に対してこのΔIを計算し、適当な正の整数Qを定め、ΔIの大きなものからQ個選出することで、特徴的なキーワードを選出することができる。 Here, G 1 and G 2 are the total number of texts included in D 1 and D 2 , and G = G 1 + G 2 . For example, when D 1 classified using a certain word w includes text of only a certain class c, and D 2 includes all other texts, I D1 is 0, so ΔI increases. . A characteristic keyword can be selected by calculating ΔI for all words, determining an appropriate positive integer Q, and selecting Q words having a large ΔI.
感情分析部105は、サポートベクターマシーンを使う場合、分類する対象テキストを、同様に選出された特徴キーワードの含有情報によって多次元ベクトル空間上の一点にマップし、その空間をもっともよく分けるサポートベクターを選出する。多次元ベクトル空間へのマッピングの例として、選出された特徴キーワードの数をNとするとN次元ベクトル空間を定義し、そのうち、各キーワードのテキスト内の含有数を成分とするベクトルとしてテキストを表現する方法が用いられる。また、例えば、各キーワードを含む場合を1と表現し、含まない場合を0と表現する方法を用いてもよい。なお、多次元ベクトル空間へのマッピングの表現方法は他にもあり上記の例に限るものではない。
When using the support vector machine, the
このように準備されたデフォルト分類器は、感情分類部106にセットされる。情報受信部102は、新しい情報を受信する度に、情報管理部103に情報の保管処理を依頼し、情報管理部103はデータベース104を更新する。
The default classifier prepared in this way is set in the
セグメント化部107は、情報管理部103からデータを取得し、各情報の属性情報を使って、テキストデータ集合をセグメント化する(ステップS3)。セグメント化の方法は、様々な方法があるが、イベントに対するテキスト情報の感情的傾向の強度分布の局所性がとらえられ、特定のセグメントに感情的傾向が強いテキスト情報が属するようにセグメント化されることが望ましい。セグメント化の方法の非常に単純な手法の一つとして、例えば、固定的に領域分割を行い、セグメント化に用いる属性情報も固定的に何を使うかを決めておく方法があり、以下その方法を用いた例を説明する。
The
セグメント化部107は、属性情報として発信時間と発信場所を用い、あらかじめ定められた適当な時間間隔や適当な空間間隔で区切られたセグメントを定義する。また、セグメント化部107は、入力情報が所属するセグメント(S_iとする)を特定し、セグメント毎にテキスト情報を分類し直したテーブルTを作成する。
The
さらに、セグメント化部107は、各セグメントS_iに属する各テキストデータに対して、感情分類部106を用いて各テキストデータのクラス分類情報を計算することで、各セグメントS_iのクラス数の分布Φ_i(c)を得る。セグメント化部107は、この分布Φ_i(c)から、感情強度バランス評価部108を用いて、セグメントS_iに対する評価値Xiを得る。セグメント化部107は、全てのセグメントに対して同様の処理を行い、テーブルTにおいて、各セグメントの評価値情報を付与し、このテーブルを情報整形部109に送信する。
Further, the
感情強度バランス評価部108は、クラス数の分布を実数にマッピングする関数を用いて、クラス数の分布から感情強度バランス評価値を算出する(ステップS4)。あるセグメントのポジティブテキストの数をP、ネガティブテキストの数をN、それ以外のテキストの数をLとすると、以下の式(3)が得られる。
The emotion strength
式(3)は、評価値Xを計算する評価値計算関数の一例である。式(3)において、αは適当な実数として管理者が事前に設定するパラメータ値である。これは、イベントがおきているときは、感情的テキスト数のバランスが、ポジティブ側であってもネガティブ側であっても崩れる、ということを仮定している。また、式(3)において、P+Nが分母にある理由は、場所や時間によって情報のアップロード数が大きく変わるため、例えば都心や日中は、郊外や深夜より絶対数が多いことが予測され、その効果を打ち消すためである。 Expression (3) is an example of an evaluation value calculation function for calculating the evaluation value X. In Expression (3), α is a parameter value set in advance by the administrator as an appropriate real number. This assumes that when an event is taking place, the balance of the number of emotional texts is disrupted, both on the positive side and on the negative side. In addition, in Equation (3), the reason why P + N is in the denominator is that the number of uploaded information varies greatly depending on the location and time. This is to negate the effect.
また、式(3)において、同じ場所かつ同じ時間であるが、日付(もしくは曜日や月、年など様々な周期的単位をもちいてもよい)の異なるセグメント全てに対して、その平均値Ave(P+N)を計算し、その計算された値をP+Nの代わりに使ってもよい。さらに、イベントが起きているときは感情的なテキスト量(P+N)とそれ以外のテキスト数Lの割合が変わることを仮定すると、以下の式(4)が得られる。 Further, in the equation (3), the average value Ave (for all segments having the same place and the same time but different dates (or various periodic units such as day of the week, month, year) may be used. P + N) may be calculated and the calculated value may be used instead of P + N. Further, assuming that the ratio of the emotional text amount (P + N) and the other text number L changes when an event occurs, the following equation (4) is obtained.
式(4)に示すように、変数yに対する適当な増加関数h(y)を使って、式(3)を補正することも可能である。この増加関数は、単純にはh(y)=yであるが、これに限るものではない。また、例えば、y=(P+N)/(P+N+L)の代わりに、上記と同様に、同じ場所かつ同じ時間で日付の異なるセグメントに対する平均値Ave(P+N+L)を使って、y=(P+N)/Ave(P+N+L)としてもよい。ここで、平均値を算出する方法として、セグメント化する属性情報のうち時間情報を基準に行う例を示したが、場合によっては、例えば、場所を基準にしてある特定の施設を含むセグメント間で行ってもよく、さらに情報発信者のその他の属性(たとえば年齢や性別など)を用いてもよい。この方法は、管理者の考える長期トレンドをとらえることができる方法であれば何でもよい。このように、感情強度バランス評価部108により、記強度情報で重みを付けた前記分類情報におけるクラス間でのバランスの偏り、つまり統計的傾向からのずれが定量化される。
As shown in equation (4), equation (3) can be corrected using an appropriate increase function h (y) for variable y. This increase function is simply h (y) = y, but is not limited thereto. In addition, for example, instead of y = (P + N) / (P + N + L), y = (P + N) / Ave is obtained by using the average value Ave (P + N + L) for the segments having the same location and the same time and different dates as described above. It is good also as (P + N + L). Here, as an example of a method for calculating the average value, an example is shown in which time information is used as a reference among segmented attribute information. However, in some cases, for example, between segments including a specific facility based on a location. Further, other attributes (for example, age and sex) of the information sender may be used. This method may be anything as long as it can capture the long-term trend that the administrator thinks. As described above, the emotion intensity
情報整形部109は、テーブルTを受け取ったら、この評価値を用いて各セグメントを降順に序列化し上位Q個(Qは適当な正の整数)を選択し、出力データ110として出力する(ステップS5)。このQはあらかじめ定義されてもよいし、評価値が大きく変化する(減少する)ところまでをとってもよい。情報整形部109はこの選択したQ個のテキスト情報をそのまま出力データ110として出力してもよいが、例えば、各セグメントが共通に含むキーワード、キーフレーズを抽出するなどして、イベントに関係の深いキーワード、キーフレーズを推測し、その情報を付加して出力してもよい。
When receiving the table T, the
感情分析部105は、上記の分類器を、教師なしの強化学習によって動的に作成してもよい。また、感情分析部105は、上記の分類器の作成において、例えば適当な初期状態から開始し、その判定結果に対する評価結果をフィードバックすることでより精度の高い判定結果が得られるよう漸近的に内部状態を更新してもよい。感情分析部105は、特に内部状態の更新には例えば遺伝的アルゴリズムを用いてもよい。
The
また、感情分析部105は、上記の分類器を作成するうえで用いられる特定キーワードを、新たなデータが入力される度に、更新していくことで、より分類精度の高いキーワードを動的に選択していくことも可能である。
In addition, the
さらに、セグメント化部107によるセグメント化の方法は、上記ではあらかじめ定められた固定的な分割を行ったが、これを適応的に行うことも可能である。セグメント化部107は、例えば、テキスト情報の分布をまず分析してから、それを適当な観点に従って分類するような方法で分割してもよい。例えば、全てのセグメントに同数程度のテキスト情報が所属するようにするには、B−treeやその派生形などを用いてもよいし、kd−treeやその派生形を使ってもよい。また主成分分析を行い、分割効率の良い方向順に分割していく方法も可能であるし、さらに、ランダム分割をおこなうことも可能である。
Furthermore, the segmentation method performed by the
また、分割自体は一度で終了する必要はなく、例えば、情報整形部109によって序列化した際に、序列化度合いや情報整形部109の出力結果等に応じて、再度セグメント化方法を変更してもよい。例えば、情報整形部109が各セグメントの評価値で序列化し降順に並べた際に、大きく評価値が減少する特徴的なポイントがなく、行ったセグメント化が必ずしも特徴的なイベント情報を捉えられていないと判断した時には、セグメント化の条件(例えば考慮する属性情報、分割パラメータ、手法等)を変更しながら、所望の評価値の序列化が得られるまでセグメント化を繰り返してもよい。
Further, the division itself does not need to be completed once. For example, when the
例えば、セグメント化部107は、適当な属性情報を用いてランダム分割を行い、各セグメントの評価値の分布を観測し、その分布が所望の検出品質に達しているか判断する。例えば、セグメントの順位が下がる毎に線形に近い傾きでその評価値も下がっていき、高評価値のセグメントと低評価値のセグメントを明確に分離できないような場合には、所望の検出品質に達していないと判断される。そのような場合には、セグメント化部107は、新たなランダム分割によるセグメント化を行ったり、考慮する属性情報を変更したりして、それに対して同じように評価値分布を観測する、というプロセスを所望の条件が満たされるまで繰り返してもよい。特に、ランダム分割に代表されるランダム性を利用したトライ・アンド・エラー的プロセスは、使用者がセグメント化における属性選択や分割パラメータの事前知識に乏しい場合に有効である。
For example, the
上記の説明において、クラスは、ポジティブ、ネガティブ、それ以外の三種類に分けられていたが、ポジティブ、ネガティブの二種類に分けられてもよいし、ポジティブ、ネガティブ、ニュートラル、それ以外の4種類に分けられてもよい。クラスを2種類に分ける方法は、使用者が、必ずしも感情的とは言えないテキスト情報に関しても必ずどちらかに分類したい場合に用いる。また、クラスを4種類に分ける方法は、使用者が、感情的に中立なテキスト情報と、そもそも感情とは無関係と思われる情報を明確に区別する場合に用いられる。どちら方法も、その後段で行う感情強度バランス評価部108における関数において活用され、例えば4種類に分けられた場合、感情とは無関係のテキスト情報を考慮から除くよう定義することが可能となる。
In the above description, classes were divided into three types, positive, negative, and other. However, classes may be divided into two types, positive and negative, or positive, negative, neutral, and other four types. It may be divided. The method of dividing the class into two types is used when the user always wants to classify text information that is not necessarily emotional. Further, the method of classifying into four types is used when the user clearly distinguishes emotionally neutral text information from information that seems to be irrelevant in the first place. Both methods are used in the function in the emotion intensity
以下、本実施形態のイベント検出装置の動作を、実施例を用いて詳細に説明する。上述したように、情報発信者101は、発信場所の座標と発信時間が付随したテキスト情報をアップロードする。感情分類部106は、そのテキスト情報をポジティブ(P)、ネガティブ(N)またはそれ以外(L)の3種類のクラスのどれかに分類する。さらに[0:1]の範囲の実数でその強度情報も同時に計算されているとする。例えば、あるテキストがポジティブクラスに0.8の確率で属すると判定された場合、P0.8と表記される。本実施例では、簡単に表記するために、属性情報のうち場所情報を[0:2]×[0:2]の範囲の2次元空間上の一点とし、時間情報を、0から48まで間隔[0:48]の中の実数で表現するとする(24時間を一日として全2日間)。
Hereinafter, the operation of the event detection device according to the present exemplary embodiment will be described in detail using examples. As described above, the
図3は、実施例における属性情報のセグメント化の方法を示した模式図である。セグメント化部107は、空間情報を図3に示すように領域R1、R2、R3、R4の4領域(それぞれR1:[0:1]×[0:1]、R2:[1:2]×[0:1]、R3:[0:1]×[1:2]、R4:[1:2]×[1:2])に分割する。また、セグメント化部107は、時間情報を、T1:[0:12]、T2:[12:24]、T3:[24:36]、T4:[36:48]の4領域に分割する。つまり、テキスト情報は、全部で4×4=16個の領域に分割され、例えば、場所(0.5、1.4)、時刻35.3のテキスト情報は、領域R3T3に属する。
FIG. 3 is a schematic diagram illustrating a method of segmenting attribute information in the embodiment. As shown in FIG. 3, the segmenting
図4は、実施例におけるセグメント毎に分類されたテキスト情報およびその感情強度の一例をまとめたテーブルである。図5は、実施例におけるセグメントに分布するテキスト情報の一例の模式図である。セグメント化部107は、時間情報に関して、テキスト情報の発信時刻tに対して24で割った余りに応じて、どの領域に属するかを判定し、セグメント化を行う。図5における記号の○はポジティブ、□はネガティブ、△はそれ以外である。ここで、セグメントRYTZ(YとZとは領域番号でそれぞれ1〜4の整数値)の評価値XRYTZは、以下の式(5)のように表わされる。
FIG. 4 is a table that summarizes an example of text information classified for each segment and its emotional intensity in the embodiment. FIG. 5 is a schematic diagram of an example of text information distributed in segments in the embodiment. The segmenting
式(5)において、xiは、各セグメントに属するテキスト情報iの強度を示し、Pの場合は正の値となり、Nの場合は負の値となり、Lの場合は強度にかかわらず0となる。例えば、P0.8は+0.8、N0.3は−0.3、L0.9は0と表される。また、式(5)のΣsegmentはセグメントRYTZに属する全てのテキスト情報の和を示す。また、Avemod24は、セグメントRYTZの時刻領域番号Zが1または3の時はRYT1およびRYT3の全てのテキスト情報に対する平均を算出することを表し、時刻領域番号Zが2か4の時はRYT2とRYT4の全てのテキスト情報に対する平均を算出することを表す。つまり、時刻情報を原点からの経過時間とした場合、同じ場所領域に属する異なる日付のAM([0:12])またはPM([12:24])の平均をとることを意味する。この例では2日間だけであるが、実際はもっと長い期間で計算してもよいし、また一日単位ではなく、週単位で計算し曜日毎に平均をとってもよい。 In Expression (5), x i indicates the strength of the text information i belonging to each segment. In the case of P, x i is a positive value, N is a negative value, and L is 0 regardless of the strength. Become. For example, P0.8 is represented as +0.8, N0.3 is represented as -0.3, and L0.9 is represented as 0. In addition, Σsegment in Expression (5) indicates the sum of all text information belonging to the segment RYTZ. Ave mod 24 indicates that when the time region number Z of the segment RYTZ is 1 or 3, an average is calculated for all text information of RYT1 and RYT3, and when the time region number Z is 2 or 4, RYT2 This represents calculating an average for all text information of RYT4. That is, when the time information is the elapsed time from the origin, it means that the average of AM ([0:12]) or PM ([12:24]) of different dates belonging to the same place area is taken. In this example, it is only two days, but in actuality, it may be calculated over a longer period, or may be calculated on a weekly basis instead of on a daily basis and averaged for each day of the week.
図6は、実施例における各セグメントの評価値の分布を示す説明図である。本実施例では、図6のうち、上位2個(R1T2およびR4T1)を、感情的傾向が強まった特徴的なセグメントとして選択する。そして、このセグメントに含まれるテキスト情報の共通キーワードもしくはキーフレーズを抽出し、場所情報と時刻情報を付与して出力する。 FIG. 6 is an explanatory diagram showing a distribution of evaluation values of each segment in the example. In this embodiment, the top two (R1T2 and R4T1) in FIG. 6 are selected as characteristic segments with a strong emotional tendency. Then, a common keyword or key phrase of text information included in this segment is extracted, and location information and time information are added and output.
本発明によるイベント検出装置によれば、より高い精度でイベントを検出できる。その理由は、本発明によるイベント検出装置は、様々な属性情報を用いてセグメント化し、そのセグメント毎に感情的傾向の特徴的変化を抽出するからである。 According to the event detection device of the present invention, an event can be detected with higher accuracy. The reason is that the event detection apparatus according to the present invention performs segmentation using various attribute information and extracts a characteristic change in emotional tendency for each segment.
また、本発明によるイベント検出装置によれば、テキスト情報の絶対数の少ない場所に局在したイベントも高い精度で検出できる。その理由は、本発明によるイベント検出装置は、セグメント毎に、そのテキスト情報の感情強度分布を長期トレンドと比較し、ポジティブ感情とネガティブ感情のバランスが大きく変化したところを検出するからである。 Further, according to the event detection apparatus of the present invention, an event localized in a place where the absolute number of text information is small can be detected with high accuracy. The reason is that the event detection apparatus according to the present invention compares the emotion intensity distribution of the text information with the long-term trend for each segment and detects a place where the balance between the positive emotion and the negative emotion has changed greatly.
図7は、本発明によるイベント検出装置の主要部の構成を示すブロック図である。図7に示すように、本発明によるイベント検出装置は、属性情報が付随した情報を入力し、当該情報に基づいて実世界で起きている特徴的事象を検出するイベント検出装置であって、主要な構成として、情報の属性情報を用いて情報を複数のセグメントに分割するセグメント化部107と、情報に含まれる感情的傾向を分析し、分析結果に基づいて当該情報を分類する感情管理部111と、セグメントに含まれる情報の分析結果および分類の結果に基づく定量的評価値を算出し、セグメントを当該定量的評価値にマッピングする感情強度バランス評価部108と、定量的評価値に基づいてセグメントのうちの一部のセグメントを選出し、当該セグメントの特徴を抽出し、選出された当該セグメント及び当該特徴を出力する情報整形部109とを備える。
FIG. 7 is a block diagram showing the configuration of the main part of the event detection apparatus according to the present invention. As shown in FIG. 7, the event detection apparatus according to the present invention is an event detection apparatus that inputs information accompanied by attribute information and detects a characteristic phenomenon occurring in the real world based on the information. As a simple configuration, a
また、上記の実施形態では、以下の(1)〜(8)に示すようなイベント検出装置も開示されている。 Moreover, in said embodiment, the event detection apparatus as shown to the following (1)-(8) is also disclosed.
(1)イベント検出装置は、属性情報が付随した情報を入力し、当該情報に基づいて実世界で起きている特徴的事象を検出するイベント検出装置であって、情報の属性情報を用いて情報を複数のセグメントに分割するセグメント化部(例えば、セグメント化部107)と、情報に含まれる感情的傾向を分析し、分析結果に基づいて当該情報を分類する感情管理部(例えば、感情分析部105および感情分類部106)と、セグメントに含まれる情報の分析結果および分類の結果に基づく定量的評価値を算出し、セグメントを当該定量的評価値にマッピングする感情強度バランス評価部(例えば、感情強度バランス評価部108)と、定量的評価値に基づいてセグメントのうちの一部のセグメントを選出し、当該セグメントの特徴を抽出し、選出された当該セグメント及び当該特徴を出力する情報整形部(例えば、情報整形部109)とを備える。
(1) An event detection apparatus is an event detection apparatus that inputs information accompanied by attribute information and detects a characteristic phenomenon occurring in the real world based on the information, and uses information attribute information to A segmentation unit (e.g., segmentation unit 107) that divides the information into a plurality of segments, and an emotion management unit (e.g., emotion analysis unit) that analyzes emotional tendencies included in information and classifies the information based on the
(2)イベント検出装置は、属性情報が、少なくとも発信時間情報、発信場所情報、および発信者の詳細情報を含むように構成されていてもよい。このようなイベント検出装置によれば、様々な属性情報を用いて情報をセグメント化するので、イベント検出精度を向上させることができる。 (2) The event detection apparatus may be configured such that the attribute information includes at least transmission time information, transmission location information, and detailed information of the caller. According to such an event detection apparatus, since information is segmented using various attribute information, event detection accuracy can be improved.
(3)イベント検出装置は、セグメント化部が、属性情報を用いて、全ての情報の集合を複数の部分集合へと分割するように構成されていてもよい。 (3) The event detection apparatus may be configured such that the segmentation unit divides a set of all information into a plurality of subsets using attribute information.
(4)イベント検出装置は、感情管理部が、機械学習によって作成された分類器を用いて、情報を感情的傾向に基づいて分けられた複数のクラスに分類するとともに、当該情報に、分類されたクラスに属することの確からしさを定量的に表す強度情報を付加するように構成されていてもよい。 (4) In the event detection device, the emotion management unit uses a classifier created by machine learning to classify information into a plurality of classes divided based on emotional tendencies, and is classified into the information. It may be configured to add intensity information that quantitatively represents the certainty of belonging to another class.
(5)イベント検出装置は、感情管理部が、情報が含む感情が肯定的傾向か否定的傾向かを判定することにより当該情報を複数のクラスに分類し、複数のクラスは、肯定的、および否定的の二つのクラス、肯定的、否定的およびそれ以外の三つのクラス、または肯定的、否定的、中立的およびそれ以外の4つのクラスのいずれかであり、分類されたクラスに属することの確からしさを定量的に表す強度情報を算出するように構成されていてもよい。このようなイベント検出装置によれば、使用者の意図によりクラス分類方法を変更することができる。 (5) In the event detection device, the emotion management unit classifies the information into a plurality of classes by determining whether the emotion included in the information is a positive tendency or a negative tendency, and the plurality of classes are positive, and One of the two classes negative, positive, negative and three other classes, or four positive, negative, neutral and other classes that belong to the classified class It may be configured to calculate intensity information that quantitatively represents the certainty. According to such an event detection device, the classification method can be changed according to the user's intention.
(6)イベント検出装置は、感情強度バランス評価部が、セグメントに属する情報の集合に対して、分類されたクラスに属することの確からしさを定量的に表す強度情報および情報の分類に関する情報である分類情報の集合に基づいて、強度情報で重みを付けた分類情報におけるクラス間でのバランスの偏りを定量化するように構成されていてもよい。 (6) The event detection device is information regarding intensity information and information classification that quantitatively represents the probability that the emotion intensity balance evaluation unit belongs to a classified class with respect to a set of information belonging to a segment. Based on the set of classification information, it may be configured to quantify the balance deviation between classes in the classification information weighted with the intensity information.
(7)イベント検出装置は、情報整形部による動作の結果が予め定めた所望の結果ではない場合、セグメント化部によるセグメント化の方法を変更し、セグメント化部によるセグメント化と、感情強度バランス評価部による定量的評価値の算出およびセグメントのマッピングを繰り返し行うように構成されていてもよい。このようなイベント検出装置によれば、使用者が結果を参照しながらセグメント化の方法を変更できるので、より精度良くイベントを検出することができる。 (7) When the result of the operation by the information shaping unit is not a predetermined desired result, the event detection device changes the segmentation method by the segmentation unit, and performs segmentation by the segmentation unit and emotion intensity balance evaluation The calculation of the quantitative evaluation value by the unit and the segment mapping may be repeatedly performed. According to such an event detection apparatus, the user can change the segmentation method while referring to the result, so that the event can be detected with higher accuracy.
(8)イベント検出装置は、セグメント化部によるセグメント化の方法の変更が、セグメント化部が考慮する属性情報の変更、またはセグメント化に用いるパラメータの変更であるように構成されていてもよい。 (8) The event detection apparatus may be configured such that the change of the segmentation method by the segmentation unit is a change of attribute information considered by the segmentation unit or a parameter used for segmentation.
(付記)イベント検出装置は、情報整形部が、そのセグメントに属する、セグメントの特徴として、感情強度の強い情報が共通して有する情報を抽出し、当該情報がテキスト情報である場合は、共通的に含まれるキーワードおよびキーフレーズの特徴的情報と代表的属性情報とを出力するように構成されていてもよい。 (Appendix) The event detection device extracts information that the information shaping unit belongs to the segment, and has information with strong emotion strength as a segment characteristic. If the information is text information, May be configured to output characteristic information and representative attribute information of keywords and key phrases included in the.
本発明は、Twitter等のテキスト情報からのイベント検出に適用される。 The present invention is applied to event detection from text information such as Twitter.
101 情報発信者
102 情報受信部
103 情報管理部
104 データベース
105 感情分析部
106 感情分類部
107 セグメント化部
108 感情強度バランス評価部
109 情報整形部
110 出力データ
111 感情管理部
DESCRIPTION OF
Claims (10)
前記情報の属性情報を用いて前記情報を複数のセグメントに分割するセグメント化部と、
前記情報に含まれる感情的傾向を分析し、分析結果に基づいて当該情報を分類する感情管理部と、
前記セグメントに含まれる前記情報の前記分析結果および前記分類の結果に基づく定量的評価値を算出し、前記セグメントを当該定量的評価値にマッピングする感情強度バランス評価部と、
前記定量的評価値に基づいて前記セグメントのうちの一部のセグメントを選出し、当該セグメントの特徴を抽出し、選出された当該セグメント及び当該特徴を出力する情報整形部とを備えた
ことを特徴とするイベント検出装置。 An event detection device that inputs information accompanied by attribute information and detects a characteristic phenomenon occurring in the real world based on the information,
A segmentation unit that divides the information into a plurality of segments using the attribute information of the information;
Analyzing an emotional tendency included in the information, and classifying the information based on the analysis result;
A quantitative evaluation value based on the analysis result and the classification result of the information included in the segment, and an emotion intensity balance evaluation unit that maps the segment to the quantitative evaluation value;
An information shaping unit that selects a part of the segments based on the quantitative evaluation value, extracts a feature of the segment, and outputs the selected segment and the feature; An event detection device.
請求項1記載のイベント検出装置。 The event detection device according to claim 1, wherein the attribute information includes at least transmission time information, transmission location information, and detailed information of a caller.
請求項1または請求項2記載のイベント検出装置。 The event detection apparatus according to claim 1, wherein the segmentation unit divides a set of all information into a plurality of subsets using attribute information.
機械学習によって作成された分類器を用いて、情報を感情的傾向に基づいて分けられた複数のクラスに分類するとともに、当該情報に、分類された前記クラスに属することの確からしさを定量的に表す強度情報を付加する
請求項1から請求項3のうちのいずれか1項に記載のイベント検出装置。 The emotion management department
Using a classifier created by machine learning, the information is classified into a plurality of classes divided based on emotional trends, and the probability of belonging to the classified class is quantitatively included in the information. The event detection apparatus according to claim 1, wherein intensity information to be expressed is added.
情報が含む感情が肯定的傾向か否定的傾向かを判定することにより当該情報を複数のクラスに分類し、
前記複数のクラスは、肯定的、および否定的の二つのクラス、肯定的、否定的およびそれ以外の三つのクラス、または肯定的、否定的、中立的およびそれ以外の4つのクラスのいずれかであり、
分類された前記クラスに属することの確からしさを定量的に表す強度情報を算出する
請求項1から請求項4のうちのいずれか1項に記載のイベント検出装置。 The emotion management department
By classifying the information into multiple classes by determining whether the emotion contained in the information is positive or negative,
The plurality of classes is one of two classes, positive and negative, three classes positive, negative and other, or four classes positive, negative, neutral and other Yes,
The event detection device according to any one of claims 1 to 4, wherein intensity information that quantitatively represents a probability of belonging to the classified class is calculated.
セグメントに属する情報の集合に対して、分類されたクラスに属することの確からしさを定量的に表す強度情報および情報の分類に関する分類情報の集合に基づいて、前記強度情報で重みを付けた前記分類情報におけるクラス間でのバランスの偏りを定量化する
請求項1から請求項5のうちのいずれか1項に記載のイベント検出装置。 The Emotion Strength Balance Evaluation Department
The classification weighted with the intensity information based on the intensity information that quantitatively represents the certainty of belonging to the classified class and the classification information related to the classification of the information with respect to the set of information belonging to the segment The event detection device according to any one of claims 1 to 5, wherein the balance deviation between classes in information is quantified.
請求項1から請求項6のうちのいずれか1項に記載のイベント検出装置。 If the result of the operation by the information shaping unit is not a predetermined desired result, the segmentation method by the segmentation unit is changed, and the segmentation by the segmentation unit and the quantitative evaluation value by the emotion intensity balance evaluation unit are changed. The event detection apparatus according to claim 1, wherein the calculation and the segment mapping are repeatedly performed.
請求項7記載のイベント検出装置。 The event detection apparatus according to claim 7, wherein the change of the segmentation method by the segmentation unit is a change of attribute information considered by the segmentation unit or a parameter used for segmentation.
セグメント化部が、前記情報の属性情報を用いて前記情報を複数のセグメントに分割し、
感情管理部が、前記情報に含まれる感情的傾向を分析し、分析結果に基づいて当該情報を分類し、
感情強度バランス評価部が、前記セグメントに含まれる前記情報の前記分析結果および前記分類の結果に基づく定量的評価値を算出し、前記セグメントを当該定量的評価値にマッピングし、
情報整形部が、前記定量的評価値に基づいて前記セグメントのうちの一部のセグメントを選出し、当該セグメントの特徴を抽出し、選出された当該セグメント及び当該特徴を出力する
ことを特徴とするイベント検出方法。 An event detection method that inputs information accompanied by attribute information and detects a characteristic phenomenon occurring in the real world based on the information,
A segmentation unit divides the information into a plurality of segments using the attribute information of the information,
The emotion management unit analyzes emotional tendencies included in the information, classifies the information based on the analysis results,
An emotion intensity balance evaluation unit calculates a quantitative evaluation value based on the analysis result and the classification result of the information included in the segment, and maps the segment to the quantitative evaluation value;
The information shaping unit selects a part of the segments based on the quantitative evaluation value, extracts a feature of the segment, and outputs the selected segment and the feature. Event detection method.
属性情報が付随した情報を入力し、当該情報に基づいて実世界で起きている特徴的事象を検出する処理を実行させるイベント検出プログラムであって、
コンピュータに、
前記情報の属性情報を用いて前記情報を複数のセグメントに分割するセグメント化処理と、
前記情報に含まれる感情的傾向を分析し、分析結果に基づいて当該情報を分類する感情管理処理と、
前記セグメントに含まれる前記情報の前記分析結果および前記分類の結果に基づく定量的評価値を算出し、前記セグメントを当該定量的評価値にマッピングする感情強度バランス評価処理と、
前記定量的評価値に基づいて前記セグメントのうちの一部のセグメントを選出し、当該セグメントの特徴を抽出し、選出された当該セグメント及び当該特徴を出力する情報整形処理と
を実行させるイベント検出プログラム。 On the computer,
An event detection program for inputting information accompanied by attribute information and executing processing for detecting characteristic events occurring in the real world based on the information,
On the computer,
Segmentation processing for dividing the information into a plurality of segments using attribute information of the information;
Analyzing emotional tendencies contained in the information and classifying the information based on the analysis results,
A quantitative evaluation value based on the analysis result and the classification result of the information included in the segment, and an emotion strength balance evaluation process for mapping the segment to the quantitative evaluation value;
An event detection program that selects a part of the segments based on the quantitative evaluation value, extracts features of the segment, and executes the selected segment and information shaping processing that outputs the feature .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012132506A JP5929532B2 (en) | 2012-06-12 | 2012-06-12 | Event detection apparatus, event detection method, and event detection program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012132506A JP5929532B2 (en) | 2012-06-12 | 2012-06-12 | Event detection apparatus, event detection method, and event detection program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013257677A JP2013257677A (en) | 2013-12-26 |
JP5929532B2 true JP5929532B2 (en) | 2016-06-08 |
Family
ID=49954082
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012132506A Active JP5929532B2 (en) | 2012-06-12 | 2012-06-12 | Event detection apparatus, event detection method, and event detection program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5929532B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095183A (en) * | 2014-05-22 | 2015-11-25 | 株式会社日立制作所 | Text emotional tendency determination method and system |
CN106202032B (en) * | 2016-06-24 | 2018-08-28 | 广州数说故事信息科技有限公司 | A kind of sentiment analysis method and its system towards microblogging short text |
CN108268439B (en) * | 2016-12-30 | 2021-09-07 | 北京国双科技有限公司 | Text emotion processing method and device |
JP7186080B2 (en) * | 2018-12-18 | 2022-12-08 | 日本放送協会 | Text information judgment device and its program |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010146031A (en) * | 2007-10-19 | 2010-07-01 | Nec Corp | Information analysis device, information analysis method and information analyzing program |
DE112009002394T5 (en) * | 2008-10-04 | 2012-01-19 | Atmel Corporation | Capacitive matrix touch sensor |
WO2011065211A1 (en) * | 2009-11-25 | 2011-06-03 | 日本電気株式会社 | Document analysis device, document analysis method, and computer-readable recording medium |
-
2012
- 2012-06-12 JP JP2012132506A patent/JP5929532B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013257677A (en) | 2013-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11074434B2 (en) | Detection of near-duplicate images in profiles for detection of fake-profile accounts | |
JP6764488B2 (en) | Subject classifier training methods, equipment and computer readable storage media | |
CN110956224B (en) | Evaluation model generation and evaluation data processing method, device, equipment and medium | |
WO2017097231A1 (en) | Topic processing method and device | |
US10482146B2 (en) | Systems and methods for automatic customization of content filtering | |
JP2012118977A (en) | Method and system for machine-learning based optimization and customization of document similarity calculation | |
Ismi et al. | K-means clustering based filter feature selection on high dimensional data | |
CN109508374B (en) | Text data semi-supervised clustering method based on genetic algorithm | |
KR102334236B1 (en) | Method and application of meaningful keyword extraction from speech-converted text data | |
JP5929532B2 (en) | Event detection apparatus, event detection method, and event detection program | |
CN110858217A (en) | Method and device for detecting microblog sensitive topics and readable storage medium | |
KR20190128246A (en) | Searching methods and apparatus and non-transitory computer-readable storage media | |
KR101450453B1 (en) | Method and apparatus for recommending contents | |
CN106610977B (en) | Data clustering method and device | |
WO2017095439A1 (en) | Incremental clustering of a data stream via an orthogonal transform based indexing | |
CA3179311A1 (en) | Identifying claim complexity by integrating supervised and unsupervised learning | |
TW201243627A (en) | Multi-label text categorization based on fuzzy similarity and k nearest neighbors | |
US10181102B2 (en) | Computer implemented classification system and method | |
CN113535939A (en) | Text processing method and device, electronic equipment and computer readable storage medium | |
WO2020147259A1 (en) | User portait method and apparatus, readable storage medium, and terminal device | |
Homsi et al. | Detecting Twitter Fake Accounts using Machine Learning and Data Reduction Techniques. | |
CN111125486B (en) | Microblog user attribute analysis method based on multiple features | |
CN114187232A (en) | Random forest based breast cancer prediction | |
Liu et al. | An online activity recommendation approach based on the dynamic adjustment of recommendation lists | |
US20190050413A1 (en) | Method and apparatus for providing search recommendation information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150513 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160301 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160418 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5929532 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |