JP5890385B2 - Data processing apparatus and data processing method - Google Patents
Data processing apparatus and data processing method Download PDFInfo
- Publication number
- JP5890385B2 JP5890385B2 JP2013264058A JP2013264058A JP5890385B2 JP 5890385 B2 JP5890385 B2 JP 5890385B2 JP 2013264058 A JP2013264058 A JP 2013264058A JP 2013264058 A JP2013264058 A JP 2013264058A JP 5890385 B2 JP5890385 B2 JP 5890385B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- emotion
- content
- quantification
- data processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 51
- 238000003672 processing method Methods 0.000 title claims description 7
- 230000008451 emotion Effects 0.000 claims description 175
- 238000011156 evaluation Methods 0.000 claims description 77
- 238000011002 quantification Methods 0.000 claims description 74
- 238000000034 method Methods 0.000 claims description 29
- 238000003860 storage Methods 0.000 claims description 27
- 238000004458 analytical method Methods 0.000 claims description 11
- 230000000877 morphologic effect Effects 0.000 claims description 8
- 238000009826 distribution Methods 0.000 claims description 7
- 238000013500 data storage Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 description 20
- 238000012552 review Methods 0.000 description 13
- 239000000284 extract Substances 0.000 description 12
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 238000007405 data analysis Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000002996 emotional effect Effects 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、対象物を感情パラメータに基づいて定量化するデータ処理装置、及びデータ処理方法に関する。 The present invention relates to a data processing apparatus and a data processing method for quantifying an object based on emotion parameters.
従来、ユーザにコンテンツを配信するコンテンツ配信装置が知られている(例えば、特許文献1参照)。
特許文献1に記載の装置は、ユーザの端末において作者名やタイトル名、カテゴリ等の検索条件が入力され、コンテンツ配信装置に送信する。コンテンツ配信装置は、コンテンツの作者名、タイトル名、カテゴリ等を関連付けたデータベースを有し、入力された作者名やタイトル、カテゴリに合致するコンテンツを抽出してユーザの端末に送信して表示させる。
Conventionally, a content distribution apparatus that distributes content to a user is known (for example, see Patent Document 1).
In the device described in Patent Document 1, search conditions such as an author name, a title name, and a category are input at a user terminal and transmitted to a content distribution device. The content distribution apparatus has a database that associates the author name, title name, category, and the like of the content, extracts content that matches the input author name, title, category, and transmits it to the user's terminal for display.
ところで、上記特許文献1のようなコンテンツ配信装置では、作者名やタイトル名、カテゴリ等によるコンテンツの検索は実施できるが、作者名やタイトル名、カテゴリが分かっていなければ目的のコンテンツを検索できない。つまり、例えばあるコンテンツと雰囲気が似ている等、所定のコンテンツに対して人が感じる感情が近いコンテンツを調べたい場合、上記のようなデータベースでは、検索を実施できないという課題がある。
このように、人が感じる感情が似ているコンテンツを検索する場合等、人の感情を軸としたデータ処理が可能な装置が望まれている。
By the way, in the content distribution apparatus like the above-mentioned patent document 1, although the content can be searched by the author name, title name, category, etc., the target content cannot be searched unless the author name, title name, category is known. In other words, for example, when it is desired to examine content that is similar to an emotion that a person feels with respect to a predetermined content, such as when the atmosphere is similar to a certain content, there is a problem that a search cannot be performed with the above database.
Thus, there is a demand for an apparatus that can perform data processing around human emotions, such as when searching for content that has similar emotions that humans feel.
本発明は、人の感情を軸としたデータ処理を実施可能なデータ処理装置、及びデータ処理方法を提供することを目的とする。 An object of the present invention is to provide a data processing device and a data processing method capable of performing data processing around human emotion.
本発明のデータ処理装置は、複数の語句が感情単位で分類された感情分類辞書を取得する辞書取得手段と、前記感情分類辞書を用い、対象物に対する人の感情を定量化した定量化データを生成するコンテンツ定量化手段と、を備え、前記辞書取得手段は、複数の対象物に対するテキストベースの評価データに基づいて前記感情分類辞書を生成する辞書生成手段を備え、前記辞書生成手段は、前記評価データから、前記対象物における主要要素と、当該主要要素に対して出現頻度が高くかつ前記評価データにおける前記主要要素の記載位置を中心とした所定範囲内にある複数の前記第一語句と、を形態素解析によって抽出し、前記複数の第一語句のうち、前記主要要素に対する共起度合が前記所定値以上となる前記第一語句を前記第二語句として抽出し、当該第二語句を感情毎に分類することを特徴とする。 The data processing apparatus of the present invention uses a dictionary acquisition means for acquiring an emotion classification dictionary in which a plurality of words are classified in emotion units, and quantified data obtained by quantifying human emotions with respect to an object using the emotion classification dictionary. comprising a content quantification means for generating, wherein the dictionary acquisition means includes a dictionary generating means for generating said emotion classification dictionary based on text-based evaluation data for a plurality of objects, said dictionary generating unit, wherein From the evaluation data, the first element in the object, a plurality of the first phrases that have a high appearance frequency with respect to the main element and are within a predetermined range centered on a description position of the main element in the evaluation data, Is extracted by morphological analysis, and the first phrase that has a co-occurrence degree with respect to the main element equal to or greater than the predetermined value among the plurality of first phrases is defined as the second phrase. Extracted, characterized by classifying said second word for each emotion.
本発明では、上述のような感情分類辞書を用いて、対象物に対する定量化データを生成している。このため、このような人の感情を軸とした定量化データを用いることで、感情を軸として各種データ処理を実施でき、例えば、作者名やコンテンツ名が不明な場合でも、あるコンテンツと、同じ風潮のコンテンツを探す検索処理や、所定のコンテンツに対して人の感じ方をレビューとして表示させる表示処理等の処理を実施できる。 In the present invention, quantification data for an object is generated using the emotion classification dictionary as described above. For this reason, by using quantified data centered on the emotions of such people, various data processing can be performed centering on emotions. For example, even if the author name or content name is unknown, it is the same as a certain content It is possible to perform processing such as search processing for searching for trendy content and display processing for displaying how a person feels as a review for a predetermined content.
[第一実施形態]
以下、本発明に係る第一実施形態について、図面に基づいて説明する。
[全体構成]
図1は、第一実施形態のデータ処理システムの概略構成を示すブロック図である。
図1に示すように、本実施形態のデータ処理システム1は、ユーザ端末10と、本発明のデータ処理装置として機能するサーバ装置20と、を備え、これらのユーザ端末10及びサーバ装置20がネットワーク(例えばインターネット等のWAN(Wide Area Network))を介して通信可能に接続されている。
このデータ処理システム1では、サーバ装置20は、ユーザ端末10から受信した検索クエリに基づき、所定のコンテンツ(本実施形態では、対象物として書籍等のコンテンツを例示する)の雰囲気と類似するコンテンツを検索し、当該検索結果をユーザ端末10に返す。また、データ処理システム1では、サーバ装置20は、ユーザ端末10から、所定のコンテンツの紹介要求を受信した際に、当該コンテンツに対して複数のユーザが感じた感情を定量化したレビューデータを返し、ユーザ端末10から出力(表示)させる。
以下、上記のようなサービスを提供するための具体的な構成及び方法を説明する。
[First embodiment]
Hereinafter, a first embodiment according to the present invention will be described with reference to the drawings.
[overall structure]
FIG. 1 is a block diagram showing a schematic configuration of a data processing system according to the first embodiment.
As shown in FIG. 1, the data processing system 1 of this embodiment includes a
In this data processing system 1, the
Hereinafter, a specific configuration and method for providing the above service will be described.
[ユーザ端末の構成]
ユーザ端末10は、コンピュータであり、図1に示すように、端末通信部11、入力操作部12、端末記憶部13、端末制御部14、及びディスプレイ15を備えている。
[User terminal configuration]
The
端末通信部11は、例えばLAN等を介してネットワークに接続されており、ネットワーク上の他の機器と通信する。
入力操作部12は、ユーザ操作による操作信号を端末制御部14に出力する。入力操作部としては、例えば、ディスプレイ15と一体に設けられたタッチパネルや、キーボード、マウス等の入力装置等を例示できる。
The
The
端末記憶部13は、例えばメモリ、ハードディスク等のデータ記録装置により構成されている。端末記憶部13には、ユーザ端末10を制御するための各種プログラム等が記憶される。
端末制御部14は、CPU(Central Processing Unit)等の演算回路、RAM(Random Access Memory)等の記憶回路により構成され、ユーザ端末10の各部を制御する。端末制御部14は、端末記憶部13等に記憶されているプログラムの中から所定のアプリケーション等のプログラム(ソフトウェア)をRAMに展開し、RAMに展開されたプログラムとの協働で、各種処理を実行する。これにより、端末制御部14は、サーバ装置20に対してネットワークを介して通信可能になり、例えば、サーバ装置20が提供する各種サービスの利用や各種データの閲覧が可能となる。
また、端末制御部14は、ユーザの入力操作部12の操作により、検索クエリに基づいた検索要求やコンテンツの紹介要求を生成してサーバ装置20に送信する。これらの検索クエリや紹介要求には、例えば、コンテンツのタイトル名等、コンテンツを特定するコンテンツ特定データが含まれる。
さらに、端末制御部14は、サーバ装置20から送信された各種データをディスプレイ15に表示(出力)させる処理をする。
The
The
In addition, the
Furthermore, the
[サーバ装置の構成]
図2は、本実施形態のサーバ装置20を示すブロック図である。
本実施形態のサーバ装置20は、コンピュータであり、通信部21と、記憶部22(記憶手段)と、制御部23と、等を含んで構成されている。
通信部21は、例えばLAN等を介してネットワークに接続されており、ネットワーク上の他の機器と通信する。
[Configuration of server device]
FIG. 2 is a block diagram showing the
The
The
記憶部22は、例えばメモリ、ハードディスク等により構成されたデータ記録装置であり、本発明におけるデータ蓄積手段を構成する。
この記憶部22は、検索装置を制御するための各種プログラムや各種データを記憶する。また、記憶部22には、感情分類辞書、及びコンテンツを感情分類辞書に基づいて定量化した定量化データ等が記録される。
なお、本実施形態では、サーバ装置20の記憶部22がデータ蓄積手段として機能する例を示すが、例えば、ネットワーク上の他の装置にデータ蓄積手段が設けられ、上記定量化データが蓄積されていてもよい。感情分類辞書においても同様であり、ネットワーク上の所定の装置に感情分類辞書が記録されていてもよい。
また、記憶部22には、登場人物辞書が記録されている。この登場人物辞書は、コンテンツと、当該コンテンツに登場する登場人物とを関連付けた辞書である。
The
The
In the present embodiment, an example is shown in which the
In addition, a character dictionary is recorded in the
[記憶部に記憶される感情分類辞書]
感情分類辞書は、コンテンツに対する評価データに基づいて生成される辞書である。表1に、本実施形態の感情分類辞書の一例を示す。
[Emotion classification dictionary stored in memory]
The emotion classification dictionary is a dictionary generated based on evaluation data for content. Table 1 shows an example of the emotion classification dictionary of this embodiment.
表1に示すように、感情分類辞書には、人の感情を示す感情トピックと、当該感情トピックに関連する語句とが関連付けられた辞書である。ここで、語句は、形容詞や形容動詞等の他、感情を示す名詞や動詞等、人の感情を表す感情表現語句であることが好ましい。
なお、上述のような感情分類辞書の詳細な生成方法は後述する。
As shown in Table 1, the emotion classification dictionary is a dictionary in which emotion topics indicating human emotions and words and phrases related to the emotion topics are associated with each other. Here, the phrase is preferably an emotion expression phrase representing human emotion, such as an adjective or adjective verb, as well as a noun or verb representing emotion.
A detailed method for generating the emotion classification dictionary as described above will be described later.
[定量化データ]
定量化データは、各コンテンツに対して人が感じる感情を、上記感情分類辞書を用いて定量化したデータであり、表2に示すような定量化データベースに各コンテンツに対する定量化データが記録される。
[Quantification data]
The quantification data is data obtained by quantifying emotions felt by humans for each content using the emotion classification dictionary, and the quantification data for each content is recorded in a quantification database as shown in Table 2. .
表2において、コンテンツIDは、コンテンツを識別してコンテンツを特定するためのデータである。本実施形態では、コンテンツIDを例示するが、その他、コンテンツを特定するためのデータとして、例えばコンテンツのタイトル名等が用いられてもよい。
感情値は、上記感情トピックに対してそれぞれ設定され、各感情トピックの感情を定量化した値となる。なお、定量化データの詳細な生成方法については後述する。
In Table 2, the content ID is data for identifying the content and specifying the content. In the present embodiment, the content ID is exemplified, but, in addition, for example, the title name of the content may be used as data for specifying the content.
The emotion value is set for each of the emotion topics, and is a value obtained by quantifying the emotion of each emotion topic. A detailed method for generating quantified data will be described later.
制御部23は、CPU等の演算回路、RAM等の記憶回路により構成され、記憶部22等に記憶されているプログラム(ソフトウェア)をRAMに展開し、RAMに展開されたプログラムとの協働で、各種処理を実行する。そして、制御部23は、上記各種処理を実行することで、図2に示すように、評価データ取得手段231、データ解析手段232、辞書取得手段233、定量化手段234、要求取得手段235、検索手段236、及び定量化データ出力手段237等として機能する。
The
評価データ取得手段231は、評価データを取得する。具体的には、評価データ取得手段231は、ネットワークを介して他の装置、例えばSNS(Social Networking Service)を提供する装置や、コンテンツのレビューサイトやブログサイトを公開する装置、Twitter(登録商標)等のリアルタイムでネット上にユーザの発言データを公開する装置等から取得する。つまり、ネットワーク上で閲覧可能な個人のブログやレビュー記事、ユーザの発言(つぶやき)等のテキストベースのデータを取得する。
データ解析手段232は、取得した評価データを形態素解析し、評価データに含まれる語句(第一語句)を抽出する。
The evaluation
The
辞書取得手段233は、評価データから抽出された語句(第一語句)を用いて、表1に示したような感情分類辞書を生成する。
具体的には、辞書取得手段233は、本発明の辞書生成手段として機能する共起判定手段233A及び分類手段233Bを含む。共起判定手段233Aは、抽出された語句(第一語句)同士の共起度合を判定し、共起度合に基づいて共起語句(第二語句)を抽出する。分類手段233Bは、第二語句を感情トピック毎に分類(クラスタリング)する。
The
Specifically, the dictionary acquisition means 233 includes co-occurrence determination means 233A and classification means 233B that function as dictionary generation means of the present invention. The
定量化手段234は、本発明のコンテンツ定量化手段として機能する。この定量化手段234は、記憶部22から感情分類辞書を取得し(読み込み)、コンテンツに対して人が感じる感情や雰囲気を定量化し、定量化データを生成する。
要求取得手段235は、クエリ取得手段として機能し、ユーザ端末10から送信された各種要求を取得する。本実施形態では、一例として、検索クエリを含む検索要求、所定のコンテンツに対する定量化データの出力を要求する出力要求等を例示する。なお、検索クエリとしては、所定のコンテンツを特定するデータ、例えばコンテンツ名等が指定される。
The
The
検索手段236は、検索要求を受信した際に、検索クエリに指定されたコンテンツと、定量化データの傾向が類似するコンテンツを検索する。
定量化データ出力手段237は、出力要求を受信した際に、指定されたコンテンツの定量化データを読み出し、ユーザ端末10にて表示可能に送信する。
なお、各機能構成の詳細な処理については後述する。
When the
When receiving the output request, the quantified
Detailed processing of each functional configuration will be described later.
[データ処理方法]
次に、上述のようなデータ処理システム1におけるデータ処理方法について、図面に基づいて説明する。
[Data processing method]
Next, a data processing method in the data processing system 1 as described above will be described with reference to the drawings.
(辞書生成処理)
図3は、サーバ装置20における感情分類辞書の生成処理を示すフローチャートである。
サーバ装置20は、コンテンツに対する人の感情を定量化した定量化データを生成するために、まず、感情分類辞書を生成する。
(Dictionary generation process)
FIG. 3 is a flowchart showing the emotion classification dictionary generation processing in the
The
これには、サーバ装置20の評価データ取得手段231は、ネットワーク上から複数のコンテンツに対する評価データを取得する(ステップS11)。
このステップS11では、傾向が異なる複数のコンテンツに対する評価データを取得することが好ましい。例えば、コンテンツとして映画を対象にする場合、公開日、監督名、カテゴリ(例えば、恋愛映画、歴史映画、SF映画、アクション映画等)が異なる複数のコンテンツを対象とする。これらのコンテンツは、サーバ装置20の管理者が適宜設定してもよく、例えばコンテンツの紹介サイト等を参照し、新たなコンテンツに関するデータが公開される毎に当該コンテンツ名を取得して評価データの取得対象としてもよい。
For this, the evaluation data acquisition means 231 of the
In this step S11, it is preferable to obtain evaluation data for a plurality of contents having different tendencies. For example, when movies are targeted as contents, a plurality of contents having different release dates, director names, and categories (for example, romance movies, historical movies, SF movies, action movies, etc.) are targeted. These contents may be appropriately set by the administrator of the
また、評価データ取得手段231は、評価データの取得として、上記取得対象とされたコンテンツのコンテンツ名をクエリとして、インターネット上から評価データが記載されたレビュー記事やブログ、ユーザの発言等のWebデータを検索する。図4は、評価データが掲載されたレビュー記事の一例を示す図である。
評価データ取得手段231は、図4に示すように検索されたレビュー記事等のWebデータ40を解析し、テキストデータで記載された評価データ41を取得する。Webデータ40から評価データ41の取得方法としては、周知の解析方法を用いることができ、例えば、html(HyperText Markup Language)等のマークアップ言語を解析して、テキスト記載部分を抽出する。
なお、評価データ取得手段231は、各コンテンツに対して複数の評価データを取得することが好ましい。
Further, the evaluation
The evaluation
The evaluation
次に、データ解析手段232は、ステップS11において取得した評価データに対して形態素解析を実施し、語句を抽出する(ステップS12)。
この後、辞書取得手段233の共起判定手段233Aは、記憶部22から登場人物辞書を読み出し、ステップS12により抽出された第一語句のうち、コンテンツに登場する登場人物に対して出現頻度が高い感情を表す感情表現語句を抽出する(ステップS13)。このような登場人物は、本発明における主要要素となり、主要要素に対して出現頻度が高い感情表現語句を抽出することは、評価データを生成した作成者の登場人物に対する強い感情を示す語句となる。
具体的には、ステップS13において、共起判定手段233Aは、記憶部22に記憶された登場人物辞書から、コンテンツに対応する登場人物を読み出す。そして、評価データにおける登場人物の記載された記載位置を特定し、当該記載位置と近い位置に出現する感情表現語句を抽出する。例えば、登場人物が記載された一文を特定し、特定された文や、その前後の文から、感情表現語句を抽出する。なお、感情表現語句としては、例えば、形容詞や形容動詞、人の感情を示す名詞や動詞等を例示できるが、特に、特定が容易な形容詞、形容動詞が好ましい。
Next, the data analysis means 232 performs a morphological analysis on the evaluation data acquired in step S11, and extracts a phrase (step S12).
Thereafter, the
Specifically, in step S <b> 13, the
そして、共起判定手段233Aは、抽出された登場人物と、その登場人物に対する感情表現語句との共起度合を算出する(ステップS14)。
このステップS14において、共起判定手段233Aは、登場人物に対する各語句の共起度合として、例えば登場人物に対する語句の共起回数(出現回数)を用いる。なお、共起度合として、登場人物及び語句のJaccard係数を共起度合としてもよい。
なお、ステップS14において、共起判定手段233Aは、図5に示すような共起ネットワーク50を構築してもよい。図5は、共起ネットワーク50の一例を示す図である。
図5において、51は、登場人物であり、52は、登場人物に対して抽出された感情表現語句(第一語句)であり、各語句を結ぶラインにより共起関係を示している。ここで、図5において、ラインの線幅が太いほど共起度合が高いことを意味する。
本実施形態では、複数の評価データに基づいて、上記のような共起度合を判定することで、より精度の高い共起度合を算出することができる。
Then, the
In step S14, the
In step S14, the
In FIG. 5, 51 is a character, 52 is an emotion expression word (first word) extracted for the character, and indicates a co-occurrence relationship by lines connecting the words. Here, in FIG. 5, the thicker the line width, the higher the co-occurrence degree.
In the present embodiment, it is possible to calculate the co-occurrence degree with higher accuracy by determining the co-occurrence degree as described above based on a plurality of evaluation data.
この後、共起判定手段233Aは、登場人物に対する感情表現語句(第一語句)のうち、共起度合が所定値以上となる感情表現語句を第二語句として抽出する(ステップS15)。
図5に示すような共起ネットワーク50を構築する場合では、ラインの線幅が所定値以上となる語句を第二語句として抽出する。
Thereafter, the
When a
次に、辞書取得手段233の分類手段233Bは、ステップS15により抽出された第二語句を感情トピック(クラスタ)毎に分類(クラスタリング)し、各感情トピックに対応する語句を関連付けた感情分類辞書を作成する(ステップS16)。
ここで、分類手段233Bは、抽出された第二語句の分類方法として、LDA(Latent Dirichlet Allocation;潜在的ディリクレ配分法)を用いる。これにより、抽出された第二語句に基づいて、最適な数の感情トピックが算出され、各感情トピックと第二語句との類似度(感情トピックに第二語句が関連する確率)が算出される。したがって、各感情トピックに対して、所定の類似度以上の第二語句を関連付けることで、表1に示すような感情分類辞書を作成できる。
なお、本実施形態では、LDAにより感情トピックやその数を自動的に生成する例を示したが、これに限定されず、感情トピックや、設定する感情トピックの数が予め設定されていてもよい。
Next, the
Here, the classification means 233B uses LDA (Latent Dirichlet Allocation) as a classification method of the extracted second word / phrase. As a result, an optimal number of emotion topics are calculated based on the extracted second phrase, and the similarity between each emotion topic and the second phrase (probability that the second phrase is related to the emotion topic) is calculated. . Therefore, an emotion classification dictionary as shown in Table 1 can be created by associating each emotion topic with a second phrase having a predetermined similarity or higher.
In the present embodiment, an example of automatically generating emotion topics and the number thereof by LDA has been shown. However, the present invention is not limited to this, and the number of emotion topics or emotion topics to be set may be set in advance. .
上述した辞書生成処理の実施タイミングとしては、例えば、サーバ装置20の管理者が指定したタイミングであってもよく、例えば一か月に一回等、周期的に自動で実施されることで、感情分類辞書が随時更新されてもよい。
また、インターネット上の所定のWebデータ(例えばコンテンツレビューサイト等)を監視し、新たなコンテンツに関するデータが公開される毎に感情分類辞書を作成して更新してもよい。
The implementation timing of the dictionary generation process described above may be, for example, a timing designated by the administrator of the
Alternatively, predetermined Web data (such as a content review site) on the Internet may be monitored, and an emotion classification dictionary may be created and updated each time data relating to new content is released.
(コンテンツ定量化処理)
次に、コンテンツの定量化処理について図面に基づいて説明する。
図6は、サーバ装置20におけるコンテンツ定量化処理を示すフローチャートである。
サーバ装置20は、上記のように生成した感情分類辞書を用いて、コンテンツに対する人の感情を定量化した定量化データを生成する。
(Content quantification process)
Next, content quantification processing will be described with reference to the drawings.
FIG. 6 is a flowchart showing content quantification processing in the
The
これには、サーバ装置20の定量化手段234は、定量化データの生成対象であるコンテンツを特定する(ステップS21)。
このステップS21では、コンテンツの特定は、例えばインターネット上の所定のWebデータ(例えばコンテンツレビューサイト等)を監視し、新たなコンテンツに関するデータが公開される毎に当該コンテンツ名を取得してもよく、定期的にWebデータの更新状況を取得し、更新により、新たなコンテンツに関するデータが公開される毎に当該コンテンツ名を取得してもよい。なお、例えばサーバ装置20の管理者が指定したタイミングで、サーバ管理者がコンテンツ名等のコンテンツを特定するデータを入力することで当該コンテンツを特定してもよい。
For this purpose, the quantification means 234 of the
In step S21, the content may be specified by monitoring predetermined Web data (for example, a content review site) on the Internet, for example, and acquiring the content name every time data related to new content is released. The update status of the Web data may be periodically acquired, and the content name may be acquired every time data related to new content is released through the update. For example, the server administrator may specify the content by inputting data specifying the content such as a content name at a timing specified by the administrator of the
この後、評価データ取得手段231は、ステップS21にて特定したコンテンツに対する評価データを、ネットワーク上から取得する(ステップS22)。
このステップS22では、評価データ取得手段231は、評価データの取得として、上記特定されたコンテンツのコンテンツ名をクエリとして、インターネット上から評価データが記載されたWebデータ(例えばレビュー記事やブログ、ユーザの発言等)を検索する。
そして、評価データ取得手段231は、これらのレビュー記事やブログ、ユーザの発言等を解析し、テキストデータの評価データを取得する。なお、ステップS12と同様、評価データ取得手段231は、コンテンツに対して、複数の評価データを取得することが好ましい。
Thereafter, the evaluation
In this step S22, the evaluation data acquisition means 231 acquires the evaluation data by using the content name of the identified content as a query and Web data (for example, review articles, blogs, user's Search).
Then, the evaluation data acquisition means 231 analyzes these review articles, blogs, user comments, etc., and acquires evaluation data of text data. As in step S12, the evaluation
次に、データ解析手段232は、ステップS22において取得した評価データに対して形態素解析を実施し、評価データに含まれる語句を抽出する(ステップS23)。
この後、定量化手段234は、上記辞書生成処理により生成され、記憶部22に記憶された感情分類辞書を読み出し、コンテンツの各感情トピックに対する感情値を取得する(ステップS24)。
具体的には、定量化手段234は、感情分類辞書の各感情トピックに含まれる、ステップS23で抽出された語句の数を感情値として取得する。つまり、感情トピックに含まれる語句ののべ数を感情値とする。例えば、ステップS23において抽出された語句が、「ドキドキ」「ドキドキ」「迫力」であり、上述した表1の感情分類辞書を用いる場合、定量化手段234は、「覚醒(ドキドキ)」との感情トピックに対して、2つの「ドキドキ」、1つの「迫力」との語句が含まれるので、感情トピック「覚醒(ドキドキ)」に対する感情値を「3」とする。
そして、定量化手段234は、ステップS24により、各感情トピックに対する感情値がそれぞれ設定されると、これらの感情トピックに対する感情値、及びコンテンツを特定するコンテンツ特定データ(例えばコンテンツIDやコンテンツ名)を関連付けた定量化データを生成し、記憶部22に記憶する(ステップS25)。
Next, the data analysis means 232 performs morphological analysis on the evaluation data acquired in step S22, and extracts words included in the evaluation data (step S23).
Thereafter, the quantification means 234 reads the emotion classification dictionary generated by the dictionary generation process and stored in the
Specifically, the quantifying means 234 acquires the number of phrases extracted in step S23 included in each emotion topic of the emotion classification dictionary as an emotion value. That is, the total number of words included in the emotion topic is used as the emotion value. For example, when the phrase extracted in step S23 is “pounding”, “pounding”, “power”, and using the emotion classification dictionary of Table 1 described above, the quantifying means 234 determines that the emotion is “awakening (pounding)”. Since the words “pounding” and “powerful” are included for the topic, the emotion value for the emotional topic “awakening” is set to “3”.
When the emotion value for each emotion topic is set in step S24, the quantification means 234 obtains the emotion value for each emotion topic and content specifying data (for example, content ID or content name) for specifying the content. The associated quantification data is generated and stored in the storage unit 22 (step S25).
(コンテンツ検索処理)
次に、上記のような定量化データを利用したサービスの一例として、コンテンツ検索処理を、図面に基づいて説明する。
図7は、本実施形態におけるコンテンツ検索処理を示すフローチャートである。
ユーザ端末10において、ユーザにより入力操作部12が操作され、検索クエリが入力されると、ユーザ端末10の端末制御部14は、検索クエリを含む検索要求を生成する(ステップS31)。ここで検索クエリとしては、コンテンツを特定するコンテンツ特定データ(例えばコンテンツ名やコンテンツID等)が指定される。また、ユーザ端末10は、検索要求とともに、ユーザ端末10を識別するためのユーザIDを送信する(ステップS32)。
(Content search process)
Next, content search processing will be described with reference to the drawings as an example of a service using quantified data as described above.
FIG. 7 is a flowchart showing content search processing in the present embodiment.
In the
サーバ装置20は、要求取得手段235によりユーザ端末10から送信された検索要求を受信すると(ステップS41)、検索手段236によりコンテンツ検索処理を実施させる。
コンテンツ検索処理では、まず、検索手段236は、検索要求に含まれた検索クエリで指定されたコンテンツ(以降、クエリコンテンツと称する場合がある)に対応する定量化データがあるか否かを判定する(ステップS42)。
ステップS42において、「No」と判定された場合、検索手段236は、ユーザ端末10に対して、ディスプレイ15にてクエリコンテンツが見つからない旨を出力させる非該当出力指示を出力する(ステップS43)。
When receiving the search request transmitted from the
In the content search process, first, the
When it is determined as “No” in step S42, the
ステップS42において、「Yes」と判定された場合、検索手段236は、クエリコンテンツの定量化データを取得する(ステップS44)。
そして、検索手段236は、ステップS44で取得した定量化データと傾向が類似する定量化データを定量化データベースから検索し、そのコンテンツのコンテンツ名及び当該コンテンツの定量化データを取得する(ステップS45)。
この後、検索手段236は、ステップS45にて取得したコンテンツ名及び定量化データをユーザ端末10に返す(ステップS46)。
When it is determined as “Yes” in step S42, the
Then, the search means 236 searches the quantification database for quantification data whose tendency is similar to the quantification data acquired in step S44, and acquires the content name of the content and the quantification data of the content (step S45). .
Thereafter, the
ユーザ端末10の端末制御部14は、サーバ装置20から非該当出力指示を受信したか、検索結果を受信したかを判定する(ステップS33)。ステップS33において、非該当出力指示を受信した場合は、ディスプレイ15に、対応するコンテンツが見つからない旨を表示させる(ステップS34)。
また、ステップS33にて検索結果を受信した場合、検索されたコンテンツ名、及びそのコンテンツの定量化データをディスプレイ15に検索結果として表示させる(ステップS35)。
図8は、クエリコンテンツ、及び検索されたコンテンツにおける定量化データを比較した一例を示す図である。図8の実線は、検索されたコンテンツ、破線はクエリコンテンツを示している。図8に示すように、上記のような検索処理により、クエリコンテンツと各感情値の傾向が類似するコンテンツが検索されることになる。
The
If the search result is received in step S33, the searched content name and the quantified data of the content are displayed on the
FIG. 8 is a diagram illustrating an example in which the quantified data in the query content and the searched content is compared. The solid line in FIG. 8 indicates the searched content, and the broken line indicates the query content. As shown in FIG. 8, content similar in tendency to the query content and each emotion value is searched by the above search processing.
(コンテンツ定量化データ出力処理)
次に、上記のような定量化データを利用したサービスの他の例としてコンテンツ定量化データ出力処理を図面に基づいて説明する。
図9は、本実施形態におけるコンテンツ定量化データ出力処理を示すフローチャートである。
ユーザ端末10において、ユーザにより入力操作部12が操作され、所定のコンテンツに対する定量化データを出力要求が入力されると、端末制御部14は、当該出力要求とユーザIDとをサーバ装置20に送信する(ステップS51)。
(Content quantification data output processing)
Next, content quantification data output processing will be described with reference to the drawings as another example of the service using the quantification data as described above.
FIG. 9 is a flowchart showing content quantification data output processing in the present embodiment.
In the
サーバ装置20は、要求取得手段235によりユーザ端末10から送信された検索要求を受信すると(ステップS61)、定量化データ出力手段237によりコンテンツ定量化データ出力処理を実施させる。
コンテンツ定量化データ出力処理では、まず、定量化データ出力手段237は、出力要求にて指定されたコンテンツに対応する定量化データがあるか否かを判定する(ステップS62)。
ステップS62において、「No」と判定された場合、ステップS43と同様、ユーザ端末10に対して、非該当出力指示を出力する。
ステップS62において、「Yes」と判定され場合、定量化データ出力手段237は、指定されたコンテンツの定量化データを取得し(ステップS63)、ユーザ端末10に返す(ステップS64)。
When receiving the search request transmitted from the
In the content quantification data output process, first, the quantification data output means 237 determines whether or not there is quantification data corresponding to the content specified in the output request (step S62).
If it is determined as “No” in step S62, a non-corresponding output instruction is output to the
When it is determined as “Yes” in step S62, the quantified
ユーザ端末10の端末制御部14は、サーバ装置20から非該当出力指示を受信したか、定量化データを受信したかを判定する(ステップS52)。ステップS52において、非該当出力指示を受信した場合は、ステップS34と同様、ディスプレイ15に、対応するコンテンツが見つからない旨を表示させる。
また、ステップS52において、指定したコンテンツに対する定量化データを受信した場合、その定量化データをディスプレイ15に表示させる(ステップS53)。
The
In step S52, when quantification data for the designated content is received, the quantification data is displayed on the display 15 (step S53).
[第一実施形態の作用効果]
本実施形態のサーバ装置20の定量化手段234は、複数の語句が感情トピック単位で分類された感情分類辞書を記憶部22から取得し、この感情分類辞書を用いて、コンテンツに対する人の感情を定量化した定量化データを生成する。
すなわち、感情分類辞書には、人の感情を示す語句に対する感情トピックが関連付けられているため、このような辞書を用いることで、コンテンツに対して人がどのような印象を持っているかを解析及び定量化することができる。このような定量化データを用いることで、例えば、上述した検索処理やコンテンツ定量化データ出力処理等、人の感情を軸とした各種情報処理を実施することができる。
[Operational effects of the first embodiment]
The
In other words, since the emotion classification dictionary is associated with emotion topics for words indicating human emotions, using such a dictionary, it is possible to analyze and express what impression a person has with respect to content. Can be quantified. By using such quantified data, for example, various types of information processing based on human emotions such as the above-described search processing and content quantified data output processing can be performed.
本実施形態では、辞書取得手段233は、ネットワーク(インターネット)上に公開されている複数のユーザ(評価者)のコンテンツに対する評価データに基づいて、感情分類辞書を生成する。つまり、辞書取得手段233は、コンテンツに対して個々のユーザが感じた感情に基づいて、感情分類辞書を生成する。このように、人の感情を軸として感情分類辞書を生成することで、例えば機械的に語句を分類する場合よりも、人の感情に即した定量化データを生成でき、検索処理等の各種処理における処理精度を向上させることができる。
In the present embodiment, the
本実施形態では、データ解析手段232が評価データから形態素解析により複数の第一語句を抽出し、辞書取得手段233の共起判定手段233Aは、抽出した第一語句のうち共起度合が所定値以上となる第一語句を第二語句として抽出する。
評価データにおいて、共起度合が高い語句は、評価データを作成した人がコンテンツに対して強い感情を有する語句であり、かつ同じ感情で関連付けられていることが多い。したがって、このような共起度合が高い語句同士を抽出することで、感情トピックに対して適切な語句を関連付けた精度の高い感情分類辞書を生成することができる。
In the present embodiment, the
In the evaluation data, a phrase with a high degree of co-occurrence is a phrase in which the person who created the evaluation data has a strong feeling for the content, and is often associated with the same feeling. Therefore, by extracting words having a high degree of co-occurrence, it is possible to generate a highly accurate emotion classification dictionary in which appropriate phrases are associated with emotion topics.
本実施形態では、共起判定手段233Aは、評価データにおける主要要素である登場人物と、その登場人物に対する語句を抽出する。このような語句は、評価データを生成した評価者が登場人物に対して強く抱いている感情を示す語句であり、コンテンツに対して評価者が抱くイメージを強く反映した語句である可能性が高い。したがって、これらの語句に基づいて感情分類辞書を作成することで、感情トピックに対して適切な語句を関連付けた精度の高い感情分類辞書を生成することができる。
In the present embodiment, the
また、この際、共起判定手段233Aは、評価データにおける登場人物が記載された文を特定し、特定された文や、その前後の文から、感情表現語句を抽出する。つまり、登場人物を中心として所定範囲内に記載された語句を抽出している。これにより、登場人物に対する感情を示す語句をより精度よく抽出できる。
At this time, the
本実施形態では、評価データから例えば形容詞や形容動詞等の感情表現語句を抽出する。
これにより、感情分類辞書における各感情トピックに対して最適な語句を関連付けさせることができる。
In the present embodiment, emotion expression phrases such as adjectives and adjective verbs are extracted from the evaluation data.
Thereby, an optimal phrase can be associated with each emotion topic in the emotion classification dictionary.
本実施形態では、分類手段233Bは、LDAを用いて、抽出された語句を感情トピック毎に分類する。LDAを用いることで、共起判定手段233Aにより抽出された第二語句を自動で最適な感情トピックを最適なクラスタ数で分類することができる。
これにより、辞書生成処理における処理の簡略化及び迅速化を図れ、かつ感情分類辞書の精度向上をも図れる。
In the present embodiment, the classifying
As a result, the process in the dictionary generation process can be simplified and speeded up, and the accuracy of the emotion classification dictionary can be improved.
本実施形態では、定量化手段234は、評価データ取得手段231により取得されたコンテンツに対する評価データと、感情分類辞書とに基づいてコンテンツを定量化する。
つまり、複数のユーザ(評価者)のコンテンツに対する評価データに基づき、コンテンツに対して個々のユーザが感じた感情に基づいて、当該コンテンツの定量化データを生成する。このため、例えば、コンテンツの内容(例えばあらすじ等)に基づいて定量化データを生成するよりも、人の感情評価に基づいた、感情を軸とした適正な定量化データを生成することができる。
In the present embodiment, the
In other words, based on the evaluation data for the content of a plurality of users (evaluators), the quantification data of the content is generated based on the emotion felt by each user for the content. For this reason, for example, rather than generating quantification data based on the content (for example, synopsis), appropriate quantification data based on emotions can be generated based on human emotion evaluation.
本実施形態では、定量化手段234により生成された定量化データは記憶部22に蓄積されている。このため、この定量化データを読み出すことで容易に各種処理を実施できる。
In the present embodiment, the quantification data generated by the
本実施形態では、コンテンツ(クエリコンテンツ)が指定された検索クエリを含む検索要求を要求取得手段235が受けた際に、検索手段236は、クエリコンテンツの定量化データと類似する定量化データを有するコンテンツを定量化データベースから検索して、ユーザ端末10に返す。
従来、あるクエリコンテンツに対して同じような雰囲気のコンテンツ(人が受ける印象や感情が同じであるコンテンツ)を探す際に、そのコンテンツと同じ作者のコンテンツを検索して表示させたり、コンテンツを購入した他者が他にどのようなコンテンツを購入しているかを検索して表示させたりするサービスは知られている。しかしながらこのような検索サービスでは、検索されたコンテンツが、クエリコンテンツと同じ雰囲気を有しているとは限らない。これに対して、本実施形態では、感情分類辞書に基づいて各コンテンツに対する人の感情を定量化した定量化データを用いるため、クエリコンテンツと雰囲気が似たコンテンツ(クエリコンテンツと同じ感情を抱くことができるコンテンツ)を好適に検索することができる。
In the present embodiment, when the
Conventionally, when searching for content with the same atmosphere (content with the same impression and emotion received by people) for a certain query content, the content of the same author as that content is searched and displayed, or the content is purchased There are known services for searching and displaying what kind of content other people have purchased. However, in such a search service, the searched content does not always have the same atmosphere as the query content. On the other hand, in this embodiment, since quantified data obtained by quantifying human emotions for each content based on the emotion classification dictionary is used, content similar to the query content (the same emotion as the query content is held). Can be suitably searched.
本実施形態では、コンテンツに対する出力要求を要求取得手段235により取得した際に、定量化データ出力手段237は、そのコンテンツに対する定量化データを取得して、ユーザ端末10に返す。これにより、ユーザ端末10には、コンテンツに対する感情の定量化データが表示される。このように、コンテンツに対して複数の評価者が感じた感情を例えば図8に示すようなレーダーチャート等によって表示させることで、ユーザはコンテンツに対する評価を容易に理解することができる。
In this embodiment, when the output request for the content is acquired by the
[第二実施形態]
上述した第一実施形態では、定量化手段234は、1つのコンテンツに対して、複数の評価者からの評価データに基づいた定量化データを生成する。この場合、人によっては、コンテンツに対する感じ方が異なるため、例えば1つのコンテンツに対して「怖い」と感じる評価者のグループ(感情グループ)や、「面白い」と感じる評価者の感情グループとが混在する可能性がある。このように、複数の感情グループが混在する場合、感情トピックを定量化すると、コンテンツの特徴が見えにくく、若しくは、各感情グループの特徴と異なる特徴を示した定量化データになることがある。
[Second Embodiment]
In the first embodiment described above, the
これに対して、第二実施形態では、上記のような問題を解消するために、定量化手段234は、各コンテンツに対して、感情トピック同士の共起関係を感情値に関連付けた定量化データを生成する。具体的には、定量化手段234は、例えば、クロス集計や、相関分析、多次元分析等の手法を用いて、感情トピック同士の共起関係を求める。
On the other hand, in the second embodiment, in order to solve the above-described problem, the
このように、定量化データとして、各感情トピックの感情値に加え、感情トピック間の共起関係が関連付けられた定量化データを用いることで、コンテンツに対して複数の感情グループがある場合でも(人によってコンテンツに対する感じ方が異なる場合でも)、コンテンツの特徴が見えやすくなり、かつ、各感情グループのそれぞれの特徴も把握しやすくなる。
例えば、コンテンツに対して「怖い」との感情トピックと、「面白い」との感情トピックとが共起関係である場合、そのコンテンツの定量化データを見ることで、「怖い」と感じる人、「面白い」と感じる人がいることを把握できる。この場合、コンテンツに対して「怖い」「面白い」の双方を同時に感じる場合とは区別することができ、各コンテンツの特徴がより分かりやすい定量化データを提供できる。
As described above, even when there are a plurality of emotion groups for the content by using the quantification data in which the co-occurrence relationship between the emotion topics is associated in addition to the emotion value of each emotion topic as the quantification data ( Even if the feeling of content differs among people), it becomes easier to see the characteristics of the content and also to understand the characteristics of each emotion group.
For example, if the emotional topic of “Scared” and the emotional topic of “Interesting” are co-occurring with respect to the content, by looking at the quantification data of the content, You can see that there are people who feel “interesting”. In this case, it can be distinguished from the case where the user feels both “scary” and “interesting” at the same time, and can provide quantified data that makes the characteristics of each content easier to understand.
[変形例]
なお、本発明は、上述した実施形態に限定されるものではなく、本発明の目的を達成できる範囲で、以下に示される変形をも含むものである。
[変形例1]
上記実施形態では、ステップS42にて「No」と判定された場合、サーバ装置20は、非該当出力指示をユーザ端末10に返す例を示したが、これに限定されない。例えば、検索クエリにて指定されたコンテンツに対して、上述したコンテンツ定量化処理を実施してもよい。この場合、ステップS21において特定されるコンテンツを、検索クエリにて指定されたコンテンツとし、ネットワーク上から評価データを取得し、その評価データに基づいてコンテンツを定量化する。
[Modification]
In addition, this invention is not limited to embodiment mentioned above, In the range which can achieve the objective of this invention, the deformation | transformation shown below is also included.
[Modification 1]
In the above-described embodiment, the
[変形例2]
上記実施形態では、ユーザ端末10からの出力要求に基づいてコンテンツの定量化データを表示させる例を示すが、これに限定されない。例えば、コンテンツを紹介する紹介サイト等において、コンテンツに対する定量化データをサーバ装置20から取得して掲載する等、定量化データを利用した様々なサービスに本発明を適用できる。
[Modification 2]
In the above embodiment, an example is shown in which content quantification data is displayed based on an output request from the
[変形例3]
上記実施形態において、本発明の対象物として、書籍や映画等のコンテンツを例示したが、これに限定されない。対象物としては、ユーザ(評価者)によって評価可能な対象であれば、いかなる対象物であってもよい。例えば、飲食店等の店舗に適用する場合では、店の雰囲気、味の傾向等のグルメレポート記事に基づいて感情分類辞書及び各店舗の定量化データを生成することもできる。この場合、所定店舗名を検索クエリとして入力した場合、同様の雰囲気の店舗を検索することもできる。また、飲食店のレビューサイト等において、これらの定量化データを活用することで、各店舗の傾向を直感的に理解できるサイトを構築することができる等、利用の拡大を図れる。
[Modification 3]
In the said embodiment, although content, such as a book and a movie, was illustrated as a target object of this invention, it is not limited to this. The target object may be any target as long as it can be evaluated by the user (evaluator). For example, when applied to restaurants such as restaurants, emotion classification dictionaries and quantified data of each store can be generated based on gourmet report articles such as store atmosphere and taste trends. In this case, when a predetermined store name is input as a search query, a store having a similar atmosphere can be searched. In addition, by using these quantified data at a review site of a restaurant, etc., it is possible to expand the use, for example, by building a site that can intuitively understand the tendency of each store.
[変形例4]
上記実施形態において、辞書取得手段233は、評価データ取得手段231により取得されたネットワーク上のWebデータから評価データを抽出し、当該評価データに基づいて感情分類辞書を生成したが、これに限定されない。例えば、アンケート等により集計された評価データをサーバ装置20に対して入力することで、入力された評価データに基づいて感情分類辞書を生成してもよい。定量化手段234においても同様であり、評価データの取得先としては、ネットワーク上に公開されている評価データに限定されない。
[Modification 4]
In the above embodiment, the
[変形例5]
辞書取得手段233の共起判定手段233Aは、共起度合として、共起回数に基づいて、第二語句として抽出したが、例えば、上述したように、Jaccard係数等に基づいて第二語句を抽出してもよい。
また、精度は低下するが、共起度合に限らず、感情分類辞書を第二語句として抽出してもよい。
[Modification 5]
The
In addition, although the accuracy is lowered, the emotion classification dictionary may be extracted as the second phrase without being limited to the co-occurrence degree.
[変形例6]
上記実施形態において、辞書取得手段233は、登場人物に対して出現頻度が高い語句を抽出する例を示したが、これに限定されない。例えば、コンテンツの作品全体に対する人の感情等を抽出するために、コンテンツ名やコンテンツ制作者等を主要要素とし、これらの主要要素に対する語句を抽出してもよい。
また、主要要素に限らず、感情表現語句を抽出してもよい。例えば、対象物として店舗や商品等、飲食者や商品使用者の評価データを解析する場合では、評価者自身(例えば私等の一人称主語)を主要要素として感情表現語句を抽出してもよい。
[Modification 6]
In the above embodiment, the
Moreover, you may extract not only a main element but an emotion expression phrase. For example, when analyzing evaluation data of a restaurant or a product user such as a store or a product as an object, an emotion expression phrase may be extracted with the evaluator itself (for example, my first person subject) as a main element.
[変形例7]
分類手段233Bは、LDAにより抽出された第二語句を分類したが、これに限定されない。例えば、語句に対する感情トピックが関連付けられた分類表を予め生成しておき、当該分類表に基づいた分類を実施してもよい。
[Modification 7]
The
[変形例8]
上記実施形態では、サーバ装置20に評価データ取得手段231、データ解析手段232、辞書取得手段233、定量化手段234が設けられる例を示したが、これに限定されない。例えば、ユーザ端末10の端末制御部14が、端末記憶部13に記憶されたプログラムを読み出し実行することで、上記評価データ取得手段231、データ解析手段232、辞書取得手段233、定量化手段234として機能する構成としてもよい。この場合、ユーザ端末10にインストールされているアプリケーションの定量化データを表示させることもできる。また、インストールされているアプリケーションの定量化データを集計したユーザの嗜好データを判定することも可能となる。このような嗜好データをアプリケーション提供装置や広告配信装置に送信することで、ユーザにとって有益な広告やアプリケーションの紹介を配信することも可能となる。
[Modification 8]
In the above embodiment, an example in which the evaluation
[変形例9]
上記実施形態において、定量化手段234は、各感情トピックに分類された語句の数そのものを感情値として取得したが、これに限定されず、分類結果に基づいたその他の感情値の設定方法を用いてもよい。
例えば、ステップS23で抽出された全語句数に対する、各感情トピックに対して分類された語句数の割合(全体に対する各感情トピックの占有率)や分布度を感情値としてもよい。
また、例えば所定周期毎に、各感情トピックに対して分類された語句数を検出することで、各感情トピックに分類された語句数の推移(変化率)を算出して感情値としてもよい。
[Modification 9]
In the above embodiment, the
For example, the ratio of the number of phrases classified with respect to each emotion topic with respect to the total number of phrases extracted in step S23 (occupation ratio of each emotion topic with respect to the whole) and the distribution may be used as the emotion value.
In addition, for example, by detecting the number of phrases classified for each emotion topic every predetermined period, the transition (change rate) of the number of phrases classified for each emotion topic may be calculated and used as an emotion value.
[変形例10]
辞書取得手段233は、共起判定手段233A及び分類手段233Bを含み、辞書取得手段として機能する例を示したが、これに限定されない。例えば、辞書取得手段233は、ネットワーク上の他の装置から、感情分類辞書を取得してもよい。
[Modification 10]
Although the
その他、本発明の実施の際の具体的な構造および手順は、本発明の目的を達成できる範囲で他の構造などに適宜変更できる。 In addition, the specific structure and procedure for carrying out the present invention can be appropriately changed to other structures and the like within a range in which the object of the present invention can be achieved.
1…データ処理システム、10…ユーザ端末、20…サーバ装置(データ処理装置)、21…通信部、22…記憶部(記憶手段)、23…制御部、41…評価データ、50…共起ネットワーク、231…評価データ取得手段、232…データ解析手段、233…辞書取得手段233、A…共起判定手段、233B…分類手段、234…定量化手段、235…要求取得手段、236…検索手段、237…定量化データ出力手段。
DESCRIPTION OF SYMBOLS 1 ... Data processing system, 10 ... User terminal, 20 ... Server apparatus (data processing apparatus), 21 ... Communication part, 22 ... Memory | storage part (memory | storage means), 23 ... Control part, 41 ... Evaluation data, 50 ...
Claims (10)
前記感情分類辞書を用い、対象物に対する人の感情を定量化した定量化データを生成するコンテンツ定量化手段と、を備え、
前記辞書取得手段は、複数の対象物に対するテキストベースの評価データに基づいて前記感情分類辞書を生成する辞書生成手段を備え、
前記辞書生成手段は、前記評価データから、前記対象物における主要要素と、当該主要要素に対して出現頻度が高くかつ前記評価データにおける前記主要要素の記載位置を中心とした所定範囲内にある複数の前記第一語句と、を形態素解析によって抽出し、前記複数の第一語句のうち、前記主要要素に対する共起度合が前記所定値以上となる前記第一語句を前記第二語句として抽出し、当該第二語句を感情毎に分類する
ことを特徴とするデータ処理装置。 A dictionary acquisition means for acquiring an emotion classification dictionary in which a plurality of words are classified by emotion unit;
Using the emotion classification dictionary, content quantification means for generating quantification data quantifying human emotions on the object,
The dictionary acquisition means includes dictionary generation means for generating the emotion classification dictionary based on text-based evaluation data for a plurality of objects ,
The dictionary generation means includes, from the evaluation data, a plurality of elements that are within a predetermined range centered on a main element in the target object, a frequency of appearance of the main element, and a description position of the main element in the evaluation data. And the first word / phrase by morphological analysis, and the first word / phrase having a co-occurrence degree with respect to the main element equal to or greater than the predetermined value is extracted as the second word / phrase among the plurality of first words / phrases. A data processing device that classifies the second phrase for each emotion .
前記形態素解析により抽出された前記第一語句は、人の感情を示す感情表現語句である
ことを特徴とするデータ処理装置。 The data processing apparatus according to claim 1 ,
The data processing apparatus, wherein the first word / phrase extracted by the morphological analysis is an emotion expression word / phrase indicating a human emotion.
前記辞書生成手段は、潜在的ディリクレ配分法を用いて、抽出された前記第二語句を感情毎に分類する
ことを特徴とするデータ処理装置。 In the data processing device according to claim 1 or 2 ,
The dictionary generation means classifies the extracted second word / phrase for each emotion using a potential Dirichlet distribution method.
前記対象物に対するテキストベースの評価データを取得する評価データ取得手段を備え、
前記コンテンツ定量化手段は、前記対象物に対する評価データ、及び前記感情分類辞書に基づいて前記定量化データを生成する
ことを特徴とするデータ処理装置。 The data processing device according to any one of claims 1 to 3 ,
Comprising evaluation data acquisition means for acquiring text-based evaluation data for the object;
The content quantifying means generates the quantified data based on evaluation data for the object and the emotion classification dictionary.
前記コンテンツ定量化手段は、前記対象物に対する前記評価データを形態素解析して抽出された語句を、前記感情分類辞書を用いて感情毎に分類し、分類結果に基づく感情値を前記対象物に関連付けた前記定量化データを生成する
ことを特徴とするデータ処理装置。 The data processing apparatus according to claim 4 , wherein
The content quantifying means classifies a phrase extracted by morphological analysis of the evaluation data for the target object for each emotion using the emotion classification dictionary, and associates an emotion value based on a classification result with the target object. A data processing device characterized by generating the quantification data.
前記コンテンツ定量化手段は、前記感情同士の共起関係を前記感情値に関連付けた定量化データを生成する
ことを特徴とするデータ処理装置。 The data processing apparatus according to claim 5 , wherein
The content quantifying means generates quantified data in which a co-occurrence relationship between the emotions is associated with the emotion value.
前記コンテンツ定量化手段により生成された前記定量化データを蓄積するデータ蓄積手段を備える
ことを特徴とするデータ処理装置。 The data processing apparatus according to any one of claims 1 to 6 ,
A data processing apparatus comprising data storage means for storing the quantification data generated by the content quantification means.
所定の対象物を検索クエリとして取得するクエリ取得手段と、
前記検索クエリとして指定された対象物に対する前記定量化データと類似する定量化データを前記データ蓄積手段から検索し、前記検索された定量化データに対応した対象物を検索結果として返す検索手段と、
を備えることを特徴とするデータ処理装置。 The data processing apparatus according to claim 7 , wherein
Query acquisition means for acquiring a predetermined object as a search query;
Search means for searching quantification data similar to the quantification data for the object specified as the search query from the data storage means, and returning an object corresponding to the searched quantification data as a search result;
A data processing apparatus comprising:
所定の対象物に対する前記定量化データの出力要求を取得する要求取得手段と、
前記出力要求として指定された対象物に対する前記定量化データを前記データ蓄積手段から取得して出力する定量化データ出力手段と、
を備えることを特徴とするデータ処理装置。 In the data processing device according to claim 7 or 8 ,
Request acquisition means for acquiring an output request for the quantification data for a predetermined object;
Quantified data output means for acquiring and outputting the quantified data for the object specified as the output request from the data storage means;
A data processing apparatus comprising:
前記コンピュータは、
複数の対象物に対するテキストベースの評価データに基づいて、複数の語句が感情単位で分類された感情分類辞書を生成して記憶手段に記憶する工程と、
前記感情分類辞書を前記記憶手段から取得する工程と、
前記感情分類辞書を用いて、前記対象物に対する前記定量化データを生成する工程と、を実施し、
前記感情分類辞書を生成して記憶手段に記憶する工程において、前記評価データから、前記対象物における主要要素と、当該主要要素に対して出現頻度が高くかつ前記評価データにおける前記主要要素の記載位置を中心とした所定範囲内にある複数の前記第一語句と、を形態素解析によって抽出し、前記複数の第一語句のうち、前記主要要素に対する共起度合が前記所定値以上となる前記第一語句を前記第二語句として抽出し、当該第二語句を感情毎に分類する
ことを特徴とするデータ処理方法。 A data processing method for generating quantified data by quantifying emotions felt by a person with respect to an object,
The computer
Generating an emotion classification dictionary in which a plurality of phrases are classified by emotion unit based on text-based evaluation data for a plurality of objects, and storing it in a storage means ;
Obtaining the emotion classification dictionary from the storage means ;
Using the emotion classification dictionary to generate the quantification data for the object ,
In the step of generating the emotion classification dictionary and storing it in the storage means, from the evaluation data, the main element in the object, the frequency of appearance with respect to the main element, and the description position of the main element in the evaluation data A plurality of the first words and phrases within a predetermined range centered on the morpheme analysis, and among the plurality of first words and phrases, the co-occurrence degree with respect to the main element is equal to or greater than the predetermined value. A data processing method characterized by extracting a phrase as the second phrase and classifying the second phrase for each emotion .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013264058A JP5890385B2 (en) | 2013-12-20 | 2013-12-20 | Data processing apparatus and data processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013264058A JP5890385B2 (en) | 2013-12-20 | 2013-12-20 | Data processing apparatus and data processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015121858A JP2015121858A (en) | 2015-07-02 |
JP5890385B2 true JP5890385B2 (en) | 2016-03-22 |
Family
ID=53533437
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013264058A Active JP5890385B2 (en) | 2013-12-20 | 2013-12-20 | Data processing apparatus and data processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5890385B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930503A (en) * | 2016-05-09 | 2016-09-07 | 清华大学 | Combination feature vector and deep learning based sentiment classification method and device |
JP7305312B2 (en) * | 2018-06-14 | 2023-07-10 | ヤフー株式会社 | Extraction device, extraction method and extraction program |
CN111125324B (en) * | 2019-11-22 | 2023-09-26 | 泰康保险集团股份有限公司 | Text data processing method, device, electronic equipment and computer readable medium |
WO2022269892A1 (en) * | 2021-06-25 | 2022-12-29 | 富士通株式会社 | Determination program, determination method, and information processing device |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4524640B2 (en) * | 2005-03-31 | 2010-08-18 | ソニー株式会社 | Information processing apparatus and method, and program |
JP2007018234A (en) * | 2005-07-07 | 2007-01-25 | National Institute Of Information & Communication Technology | Automatic feeling-expression word and phrase dictionary generating method and device, and automatic feeling-level evaluation value giving method and device |
JP4943909B2 (en) * | 2007-03-27 | 2012-05-30 | オリンパス株式会社 | Data processing apparatus, data processing method, and program |
JP5541049B2 (en) * | 2010-09-29 | 2014-07-09 | 大日本印刷株式会社 | DATA GENERATION DEVICE, DATA GENERATION METHOD, AND DATA GENERATION PROGRAM |
-
2013
- 2013-12-20 JP JP2013264058A patent/JP5890385B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015121858A (en) | 2015-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kim et al. | Associative feature information extraction using text mining from health big data | |
Warriner et al. | Affective biases in English are bi-dimensional | |
JP5541049B2 (en) | DATA GENERATION DEVICE, DATA GENERATION METHOD, AND DATA GENERATION PROGRAM | |
US20110231448A1 (en) | Device and method for generating opinion pairs having sentiment orientation based impact relations | |
JP6529133B2 (en) | Apparatus, program and method for analyzing the evaluation of topics in multiple regions | |
KR20200042767A (en) | System and Method for Extracting Keyword and Generating Abstract | |
Silva et al. | Evaluating topic models in Portuguese political comments about bills from brazil’s chamber of deputies | |
JP5890385B2 (en) | Data processing apparatus and data processing method | |
Strzelecki et al. | Direct answers in Google search results | |
JP2011107826A (en) | Action-information extracting system and extraction method | |
De Nies et al. | Bringing Newsworthiness into the 21st Century. | |
KR101851891B1 (en) | System for user emotion prediction using web contents and method thereof | |
Iksan et al. | Sentiment analysis of public reaction to COVID19 in twitter media using naïve Bayes classifier | |
Shafaee et al. | Aspect-based sentiment analysis of amazon reviews for fitness tracking devices | |
Raça et al. | Real-time monitoring and assessing open government data: A case study of the western Balkan countries | |
JP5697164B2 (en) | Tagging program, apparatus, method, and server for providing a category tag that cannot be directly derived from the target sentence | |
Cherichi et al. | Big data analysis for event detection in microblogs | |
JP2011180901A (en) | Device, method and program for evaluating reusability of experience information | |
Cherichi et al. | Using big data values to enhance social event detection pattern | |
JP2005352817A (en) | Information processing system and method and computer program | |
Chaabene et al. | Semantic annotation for the “on demand graphical representation” of variable data in Web documents | |
Terakawa et al. | A Study of Project Description Inference Using Method Name Elements for Software Upcycling | |
Zgurovsky et al. | Technological Principles of Using Media Content for Evaluating Social Opinion | |
JP5843235B2 (en) | WEB information processing apparatus, WEB information processing method, and program | |
JP7008102B2 (en) | Information processing equipment, information processing methods, and information processing programs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150623 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150807 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151202 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20151209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5890385 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |