JP2015121846A - 意見種別推定装置及びそのプログラム - Google Patents
意見種別推定装置及びそのプログラム Download PDFInfo
- Publication number
- JP2015121846A JP2015121846A JP2013263994A JP2013263994A JP2015121846A JP 2015121846 A JP2015121846 A JP 2015121846A JP 2013263994 A JP2013263994 A JP 2013263994A JP 2013263994 A JP2013263994 A JP 2013263994A JP 2015121846 A JP2015121846 A JP 2015121846A
- Authority
- JP
- Japan
- Prior art keywords
- opinion
- distribution model
- opinion type
- type
- mixed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009826 distribution Methods 0.000 claims abstract description 132
- 238000005457 optimization Methods 0.000 claims abstract description 31
- 239000000203 mixture Substances 0.000 claims abstract description 20
- 238000000034 method Methods 0.000 claims description 29
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 238000003058 natural language processing Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002945 steepest descent method Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】意見種別推定装置2は、解析対象とする発言データを選別する解析対象選別手段21と、選別された発言データに意見種別を付加する意見種別付加手段22と、発言データと、意見種別毎のガウシアン分布モデルを混合した混合分布モデルとを記憶、管理する混合分布モデル管理手段23と、混合分布モデルに発言データを適用し、数値最適化手法を用いて、最適なパラメータを推定するパラメータ最適化手段24と、最適なパラメータが推定された混合分布モデルを用いて、意見種別の割合を推定する意見種別推定手段25とを備える。
【選択図】図1
Description
意見種別とは、発言データの意見内容を予め設定した種別に分類したものである。例えば、意見種別として、意見の賛否を表す「賛成」や「反対」といったラベルをあげることができる。
意見種別毎の混合比は、混合分布モデルにおける各意見種別の割合を表すことになる。例えば、意見種別毎の混合比は、「賛成」の割合と、「反対」の割合とを表す。
混合分布モデルとは、意見種別毎の分布モデルを混合した確率モデルのことである。例えば、混合分布モデルとして、「賛成」の分布モデルと、「反対」の分布モデルとの2混合分布モデルをあげることができる。
ネットワーク上での発言の増加の原因は、拡散による発言者の増加や、同一人物による繰り返し発言の増加が考えられる。この2つの原因は混在しているが、同一人物の発言を1回しか参照しないことによって、同一人物による繰り返し発言の影響を除去することが可能である。この場合、発言の増加が拡散を表す。
本願発明によれば、意見の形成過程を表す混合分布モデルのパラメータを最適化して、意見種別に関する統計情報を推定するので、その推定精度を向上させることができる。これによって、本願発明によれば、ネットワーク上の意見に意見種別を自動的に付加できるので、手動で意見種別を付加する労力を削減することができる。
図1のように、本願発明の実施形態に係る発言解析装置1は、ネットワーク上に存在する発言を解析するものであり、意見種別推定装置2と、発言解析手段30とを備える。
発言解析装置1は、ネットワーク上に存在する発言データが入力される。この発言データは、例えば、ホームページ、ブログ又は掲示板に書き込まれた意見である。ここで、発言データは、発言時刻(意見が書き込まれた時刻)が付加され、発言時刻で集計(ソート)された時系列データであることとする。そして、発言解析装置1は、発言の解析(自然言語処理)の前段として、意見種別の割合を推定するため、発言データを意見種別推定装置2に出力する。
なお、解析対象選別手段21は、キーワードが含まれる発言データを選別する処理に、設定されたキーワードの表記ゆれや類義語を同一語とみなす処理を組み合わせてもよい。
参考文献1:大塚裕子、幹孝司、奥村学、“意見分析エンジン”、コロナ社、2007年
図3を参照し、混合分布モデルについて、説明する(適宜図1参照)
混合分布モデルとは、意見種別毎に設定された分布モデルを混合したものである。本実施形態では、混合分布モデルは、図3のように、「賛成」の分布モデル90と、「反対」の分布モデル91とを混合した2混合分布モデルである。
パラメータ最適化手段24は、混合分布モデル管理手段23に記憶された混合分布モデルに発言データを適用し、数値最適化手法を用いて、最適なパラメータを推定するものである。ここで、パラメータ最適化手段24は、意見種別付加手段22からパラメータ最適化指令が入力されたら、パラメータの最適化を開始する。また、パラメータ最適化手段24は、数値最適化手法として、最急降下法、BFGS(準ニュートン法)等の最尤推定法、又は、ベイズ推定法を利用することができる。
発言解析手段30は、意見種別推定手段25から入力された推定結果を用いて、発言データを解析するものである。ここで、発言解析手段30は、従来の自然言語処理を用いて、「賛成」及び「反対」が付加された発言データを解析することができる。そして、発言解析手段30は、発言データの解析結果を外部に出力する。
図4を参照し、発言解析装置1の動作について、説明する(適宜図1参照)。
解析対象選別手段21は、全ての発言データのうち、解析対象とする発言データを選別する(ステップS1)。
パラメータ最適化手段24は、ステップS2で意見種別が付加された発言データを混合分布モデルに適用し、数値最適化手法を用いて、最適なパラメータを推定する(ステップS3)。
発言解析手段30は、ステップS4の推定結果を用いて、発言データを解析する(ステップS5)。
本願発明に係る意見種別推定装置は、前記した実施形態に限定されず、その趣旨を逸脱しない範囲で変形を加えることができる。
前記した実施形態では、図3のように、「賛成」の分布モデル90が1つのピークt1を有することとしたが、これに限定されない。つまり、「賛成」の分布モデル90は、ある事案に関する発言が一度盛りあがったら、収束することを表している。だが実際には、ある事案に関する発言が収束した後、再び盛り上がることも考えられる。
また、「賛成」の分布モデル90aにおいて、t12がガウシアン分布モデルp12(t)でのピーク時刻を表し、α12がガウシアン分布モデルp12(t)での盛り上がりの急速さを表す。
また、「反対」の分布モデル91aにおいて、t22がガウシアン分布モデルp22(t)でのピーク時刻を表し、α22がガウシアン分布モデルp22(t)での盛り上がりの急速さを表す。ここでい、
例えば、意見種別は、「賛成」、「中立」又は「反対」の3種別としてもよい。この場合、混合分布モデル管理手段は、3混合分布モデルを記憶、管理する。
また、意見種別は、4種別以上であってもよい。この場合、混合分布モデル管理手段は、4種別以上の混合分布モデルを記憶、管理する。
つまり、意見種別がn種別であれば、混合分布モデル管理手段は、n混合分布モデルを記憶、管理する(nは2以上の整数)。
2 意見種別推定装置
21 解析対象選別手段
22 意見種別付加手段
23 混合分布モデル管理手段(混合分布モデル記憶手段)
24 パラメータ最適化手段
25 意見種別推定手段
30 発言解析手段
Claims (6)
- 意見の内容を表した発言データに意見種別が予め設定され、前記発言データの意見種別に関する統計情報を推定する意見種別推定装置であって、
前記意見種別毎の混合比とピーク時刻と盛り上がりの急速さとをパラメータとした、発言時刻に依存した意見の形成過程を表す混合分布モデルを予め記憶すると共に、前記発言時刻が付加された前記発言データを前記意見種別毎に記憶する混合分布モデル記憶手段と、
前記混合分布モデル記憶手段の混合分布モデルに発言データを適用し、数値最適化手法によって前記パラメータを推定するパラメータ最適化手段と、
前記パラメータ最適化手段でパラメータが推定された混合分布モデルを用いて、前記意見種別に関する統計情報を推定する意見種別推定手段と、
を備えることを特徴とする意見種別推定装置。 - 前記混合分布モデル記憶手段は、下記式(5)のように、前記意見種別が2種別であり、第1の意見種別で2つのガウシアン分布p11(t),p12(t)を重ね合わせた分布モデルと、第2の意見種別で2つのガウシアン分布p21(t),p22(t)を重ね合わせた分布モデルとの2混合分布モデルp(t)を予め記憶し、
前記第1の意見種別及び前記第2の意見種別の混合比βと、
ガウシアン分布モデルp11(t),p12(t)の比率k1(0<k1<1)と、
ガウシアン分布モデルp11(t)でのピーク時刻t11,盛り上がりの急速さα11と、
ガウシアン分布モデルp12(t)でのピーク時刻t12,盛り上がりの急速さα12と、
ガウシアン分布モデルp21(t),p22(t)の比率k2(0<k2<1)と、
ガウシアン分布モデルp21(t)でのピーク時刻t21,盛り上がりの急速さα21と、
ガウシアン分布モデルp22(t)でのピーク時刻t22,盛り上がりの急速さα22と、
を推定することを特徴とする請求項2に記載の意見種別推定装置。 - コンピュータを、請求項1に記載の意見種別推定装置として機能させるための意見種別推定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013263994A JP6192166B2 (ja) | 2013-12-20 | 2013-12-20 | 意見種別推定装置及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013263994A JP6192166B2 (ja) | 2013-12-20 | 2013-12-20 | 意見種別推定装置及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015121846A true JP2015121846A (ja) | 2015-07-02 |
JP6192166B2 JP6192166B2 (ja) | 2017-09-06 |
Family
ID=53533427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013263994A Active JP6192166B2 (ja) | 2013-12-20 | 2013-12-20 | 意見種別推定装置及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6192166B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106162163A (zh) * | 2016-08-02 | 2016-11-23 | 浙江科技学院 | 一种高效视觉质量客观评价方法 |
CN106791822A (zh) * | 2017-01-13 | 2017-05-31 | 浙江科技学院 | 一种基于单双目特征学习的无参考立体图像质量评价方法 |
JP2019036087A (ja) * | 2017-08-14 | 2019-03-07 | ヤフー株式会社 | 生成装置、生成方法、生成プログラム、学習データ、及びモデル |
JP2022016628A (ja) * | 2017-08-14 | 2022-01-21 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004227343A (ja) * | 2003-01-23 | 2004-08-12 | Fujitsu Ltd | 意見分析方法、意見分析装置、および意見分析プログラム |
JP2012256283A (ja) * | 2011-06-10 | 2012-12-27 | Nomura Research Institute Ltd | 感性分析システム及びプログラム |
WO2013179340A1 (ja) * | 2012-05-30 | 2013-12-05 | 株式会社日立製作所 | 情報分析システム及び情報分析方法 |
-
2013
- 2013-12-20 JP JP2013263994A patent/JP6192166B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004227343A (ja) * | 2003-01-23 | 2004-08-12 | Fujitsu Ltd | 意見分析方法、意見分析装置、および意見分析プログラム |
JP2012256283A (ja) * | 2011-06-10 | 2012-12-27 | Nomura Research Institute Ltd | 感性分析システム及びプログラム |
WO2013179340A1 (ja) * | 2012-05-30 | 2013-12-05 | 株式会社日立製作所 | 情報分析システム及び情報分析方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106162163A (zh) * | 2016-08-02 | 2016-11-23 | 浙江科技学院 | 一种高效视觉质量客观评价方法 |
CN106791822A (zh) * | 2017-01-13 | 2017-05-31 | 浙江科技学院 | 一种基于单双目特征学习的无参考立体图像质量评价方法 |
JP2019036087A (ja) * | 2017-08-14 | 2019-03-07 | ヤフー株式会社 | 生成装置、生成方法、生成プログラム、学習データ、及びモデル |
JP2022016628A (ja) * | 2017-08-14 | 2022-01-21 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
JP7198900B2 (ja) | 2017-08-14 | 2023-01-04 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6192166B2 (ja) | 2017-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4532863B2 (ja) | 2言語コーパスを整列させるための方法および装置 | |
JP6087899B2 (ja) | 会話ダイアログ学習および会話ダイアログ訂正 | |
JP5901001B1 (ja) | 音響言語モデルトレーニングのための方法およびデバイス | |
US10346485B1 (en) | Semi structured question answering system | |
US10360925B2 (en) | Computerized tool for creating variable length presentations | |
JP5125307B2 (ja) | 工数見積プログラム、該プログラムを記録した記録媒体、工数見積装置、および工数見積方法 | |
US11809832B2 (en) | Natural language text generation using semantic objects | |
JP6192166B2 (ja) | 意見種別推定装置及びそのプログラム | |
US10579835B1 (en) | Semantic pre-processing of natural language input in a virtual personal assistant | |
US11082369B1 (en) | Domain-specific chatbot utterance collection | |
US8359364B2 (en) | System and method for optimizing response handling time and customer satisfaction scores | |
JPWO2007138875A1 (ja) | 音声認識用単語辞書・言語モデル作成システム、方法、プログラムおよび音声認識システム | |
US9218411B2 (en) | Incremental dynamic document index generation | |
Shen et al. | Estimation of Gap Between Current Language Models and Human Performance. | |
JP7093292B2 (ja) | 対話セッションテキストをセグメンテーションするシステム及び方法 | |
JPWO2011145272A1 (ja) | パープレキシティ算出装置 | |
US8352909B2 (en) | Business process diagram (BPD) component analysis | |
US20130110491A1 (en) | Discriminative learning of feature functions of generative type in speech translation | |
US20220284280A1 (en) | Data labeling for synthetic data generation | |
US9996795B2 (en) | Generating a non-deterministic model of a process for a goal | |
JP6907703B2 (ja) | 解析装置、解析方法、および解析プログラム | |
KR102019752B1 (ko) | 컴퓨터 수행 가능한 ui/ux 전략제공방법 및 이를 수행하는 ui/ux 전략제공장치 | |
JP2010170252A (ja) | 言語モデル作成方法、言語モデル作成装置および言語モデル作成プログラム | |
JP2020071523A (ja) | 見積方法、課金方法、コンピュータ、及びプログラム | |
JP6425732B2 (ja) | 文章検索システム、極性判定ルール修正システム、文章検索方法及び極性判定ルール修正方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170711 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170804 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6192166 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |