JP2015121846A - 意見種別推定装置及びそのプログラム - Google Patents

意見種別推定装置及びそのプログラム Download PDF

Info

Publication number
JP2015121846A
JP2015121846A JP2013263994A JP2013263994A JP2015121846A JP 2015121846 A JP2015121846 A JP 2015121846A JP 2013263994 A JP2013263994 A JP 2013263994A JP 2013263994 A JP2013263994 A JP 2013263994A JP 2015121846 A JP2015121846 A JP 2015121846A
Authority
JP
Japan
Prior art keywords
opinion
distribution model
opinion type
type
mixed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013263994A
Other languages
English (en)
Other versions
JP6192166B2 (ja
Inventor
小早川 健
Takeshi Kobayakawa
健 小早川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2013263994A priority Critical patent/JP6192166B2/ja
Publication of JP2015121846A publication Critical patent/JP2015121846A/ja
Application granted granted Critical
Publication of JP6192166B2 publication Critical patent/JP6192166B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】本願発明は、発言データの意見種別に関する統計情報の推定精度を向上させる意見種別推定装置を提供する。
【解決手段】意見種別推定装置2は、解析対象とする発言データを選別する解析対象選別手段21と、選別された発言データに意見種別を付加する意見種別付加手段22と、発言データと、意見種別毎のガウシアン分布モデルを混合した混合分布モデルとを記憶、管理する混合分布モデル管理手段23と、混合分布モデルに発言データを適用し、数値最適化手法を用いて、最適なパラメータを推定するパラメータ最適化手段24と、最適なパラメータが推定された混合分布モデルを用いて、意見種別の割合を推定する意見種別推定手段25とを備える。
【選択図】図1

Description

本願発明は、意見の内容を表した発言データから意見種別に関する統計情報を推定する意見種別推定装置及びそのプログラムに関する。
従来から、人間の手による書き込みを解析するために、自然言語処理が必要とされている。自然言語処理の前段では、意見種別を推定する技術が必要となる(特許文献1〜5及び非特許文献1,2)。この意見種別推定技術は、意見種別毎にラベルを付与するアルゴリズムであり、賛否を表す意見種別の場合、「賛成」または「反対」というラベルを意見に付与するものである。
特許第5224532号公報 特許第5254888号公報 特許第5278327号公報 特許第5286298号公報 特許第5221751号公報
Jorge Nocedal,Stephen J.Wright,"Numerical Optimization",Springer,2006年 大塚裕子、幹孝司、奥村学、"意見分析エンジン"、コロナ社、2007年
しかし、従来の意見種別推定技術には、不適切なラベルを意見に付与するといった、ある程度の誤りが含まれてしまう。このため、従来の意見種別推定技術は、この技術を単独で用いた場合、賛否の数や割合といった意見種別に関する統計情報を求めるときに、その推定精度が向上しないという問題がある。
ここで、意見種別推定技術に誤りが含まれる原因を検討する。各個人の意見形成過程では、他人の意見を参考にしながら自分の意見(賛否)を決めることが多い。にもかかわらず、従来の意見種別推定技術では、実際の意見形成過程が反映されておらず、誤りの原因になると考えられる。
そこで、本願発明は、前記した問題を解決し、意見種別に関する統計情報の推定精度を向上させる意見種別推定装置及びそのプログラムを提供することを課題とする。
前記した課題に鑑みて、本願発明に係る意見種別推定装置は、意見の内容を表した発言データに意見種別が予め設定され、発言データの意見種別に関する統計情報を推定する意見種別推定装置であって、混合分布モデル記憶手段と、パラメータ最適化手段と、意見種別推定手段と、を備えることを特徴とする。
かかる構成によれば、意見種別推定装置は、混合分布モデル記憶手段によって、意見種別毎の混合比とピーク時刻と盛り上がりの急速さとをパラメータとした、発言時刻に依存した意見の形成過程を表す混合分布モデルを予め記憶すると共に、発言時刻が付加された前記発言データを前記意見種別毎に記憶する。また、意見種別推定装置は、パラメータ最適化手段によって、混合分布モデル記憶手段の混合分布モデルに発言データを適用し、数値最適化手法によってパラメータを推定する。
そして、意見種別推定装置は、意見種別推定手段によって、意見の形成過程を表す混合分布モデルでパラメータが最適化されているので、この混合分布モデルを用いて、意見種別に関する統計情報を推定する。例えば、意見種別に関する統計情報は、全ての発言データに含まれる意見種別の発言の割合、又は、意見種別毎の発言数である。
発言データとは、政治、経済等の分野における特定の事案について、ネットワーク上で不特定多数者が発言した意見の内容を表したテキストデータのことである。
意見種別とは、発言データの意見内容を予め設定した種別に分類したものである。例えば、意見種別として、意見の賛否を表す「賛成」や「反対」といったラベルをあげることができる。
意見種別毎の混合比は、混合分布モデルにおける各意見種別の割合を表すことになる。例えば、意見種別毎の混合比は、「賛成」の割合と、「反対」の割合とを表す。
意見種別毎の分布モデルは、発言時刻に依存し、1以上のピークを有する分布モデルのことである(例えば、ガウシアン分布モデル)。つまり、意見種別毎の分布モデルは、発言時刻に依存することから、意見の形成過程が反映されていると言える。
混合分布モデルとは、意見種別毎の分布モデルを混合した確率モデルのことである。例えば、混合分布モデルとして、「賛成」の分布モデルと、「反対」の分布モデルとの2混合分布モデルをあげることができる。
盛り上がりとは、ネットワーク上で発言が増加する速さのことである。例えば、ネットワーク上で特定の事案に関する発言が急速に増えている場合、盛り上がっていると言う。また、例えば、ネットワーク上で特定の事案に関する発言が少ない状態が継続する場合、盛り上がっていないと言う。
ネットワーク上での発言の増加の原因は、拡散による発言者の増加や、同一人物による繰り返し発言の増加が考えられる。この2つの原因は混在しているが、同一人物の発言を1回しか参照しないことによって、同一人物による繰り返し発言の影響を除去することが可能である。この場合、発言の増加が拡散を表す。
本願発明に係る意見種別推定装置は、コンピュータが備えるCPU、メモリ、ハードディスク等のハードウェア資源を、前記した各手段として協調動作させる意見種別推定プログラムで実現することもできる。このプログラムは、通信回線を介して配布してもよく、CD−ROMやフラッシュメモリ等の記録媒体に書き込んで配布してもよい。
本願発明によれば、以下のような優れた効果を奏する。
本願発明によれば、意見の形成過程を表す混合分布モデルのパラメータを最適化して、意見種別に関する統計情報を推定するので、その推定精度を向上させることができる。これによって、本願発明によれば、ネットワーク上の意見に意見種別を自動的に付加できるので、手動で意見種別を付加する労力を削減することができる。
本願発明の実施形態に係る発言解析装置の構成を示すブロック図である。 図1の意見種別付加手段が出力した発言データのデータ構造を説明する説明図である。 図1の混合分布モデル管理手段に記憶された混合分布モデルを説明する説明図である。 図1の発言解析装置の動作を示すブロック図である。 本願発明の変形例において、分布モデルを説明する説明図である。
図1を参照し、本願発明の実施形態について、適宜図面を参照しながら詳細に説明する。
図1のように、本願発明の実施形態に係る発言解析装置1は、ネットワーク上に存在する発言を解析するものであり、意見種別推定装置2と、発言解析手段30とを備える。
[発言解析装置の構成]
発言解析装置1は、ネットワーク上に存在する発言データが入力される。この発言データは、例えば、ホームページ、ブログ又は掲示板に書き込まれた意見である。ここで、発言データは、発言時刻(意見が書き込まれた時刻)が付加され、発言時刻で集計(ソート)された時系列データであることとする。そして、発言解析装置1は、発言の解析(自然言語処理)の前段として、意見種別の割合を推定するため、発言データを意見種別推定装置2に出力する。
意見種別推定装置2は、意見種別に関する統計情報として、発言解析装置1より入力された発言データから意見種別の割合を推定するものである。このため、意見種別推定装置2は、解析対象選別手段21と、意見種別付加手段22と、混合分布モデル管理手段(混合分布モデル記憶手段)23と、パラメータ最適化手段24と、意見種別推定手段25とを備える。
解析対象選別手段21は、発言解析装置1から入力された全ての発言データのうち、解析対象とする発言データを選別するものである。例えば、解析対象選別手段21は、消費増税という政策の意見を解析したい場合、全ての発言データから、消費増税に関する発言データに絞り込む。より具体的には、解析対象選別手段21は、解析対象となる事案で特徴的なキーワード(例えば、‘消費増税’)を手動で設定し、このキーワードが含まれる発言データを選別する処理を行う。そして、解析対象選別手段21は、選別された発言データを、意見種別付加手段22に出力する。
なお、解析対象選別手段21は、キーワードが含まれる発言データを選別する処理に、設定されたキーワードの表記ゆれや類義語を同一語とみなす処理を組み合わせてもよい。
意見種別付加手段22は、解析対象選別手段21から入力された発言データに意見種別を付加するものである。本実施形態では、意見種別付加手段22は、「賛成」又は「反対」という賛否を意見種別として、発言データに付加することとする。このとき、意見種別付加手段22は、従来の意見種別推定技術を用いて、意見種別を発言データに付加する。より具体的には、意見種別付加手段22は、参考文献1の4.2節「意見を含む文の自動抽出」及び4.3「評価分析の要素技術」に記載の手法を用いて、意見種別を発言データに付加できる。
参考文献1:大塚裕子、幹孝司、奥村学、“意見分析エンジン”、コロナ社、2007年
ここで、発言データには、混合分布モデルに最適化手法を適用する際に意見種別が必要となるため、意見種別を発言データに付加する。当然、従来の意見種別推定技術を用いるため、発言データに付加された意見種別には、誤りが含まれている。
また、発言データは、意見種別推定装置2に入力された時点で、発言時刻が付加されている。従って、図2のように、発言データは、発言時刻と、発言内容と、意見種別とが含まれている。図2には、経済政策に関する発言データを図示した。例えば、最初の意見は、2013年9月19日の10時34分に書き込まれ、「景気対策をやってほしい」という意見であり、経済政策に「賛成」であることを示す。また、2番目の意見は、2013年9月19日の10時35分に書き込まれ、「首相の経済対策をやめてほしい」という意見であり、経済政策に「反対」であることを示す。
その後、意見種別付加手段22は、意見種別が付加された発言データを、発言種別毎に混合分布モデル管理手段23に出力する。このとき、意見種別付加手段22は、混合分布モデル管理手段23を介して、パラメータ最適化手段24にパラメータの最適化を指令する(パラメータ最適化指令)。
混合分布モデル管理手段23は、意見種別付加手段22から入力された発言データと、混合分布モデルとを記憶、管理するものである。
<混合分布モデル>
図3を参照し、混合分布モデルについて、説明する(適宜図1参照)
混合分布モデルとは、意見種別毎に設定された分布モデルを混合したものである。本実施形態では、混合分布モデルは、図3のように、「賛成」の分布モデル90と、「反対」の分布モデル91とを混合した2混合分布モデルである。
本実施形態では、分布モデル90,91は、発言時刻に依存し、1以上のピークを有するガウシアン分布モデルである。ガウシアン分布モデルは、下記式(1)で表される。式(1)では、tが意見種別毎に意見がピークとなる時刻(ピーク時刻)であり、αが意見の盛り上がりの急速さを表す。
Figure 2015121846
従って、各分布モデル90,91は、下記式(1)´で表すことができる。式(1)´では、nが意見種別の数を表す(但し、nは自然数)。また、式(1)´では、意見種別nのピーク時刻tと、意見種別nの盛り上がりの急速さαとを表す。本実施形態では、n=1,2となり、n=1のとき「賛成」の分布モデル90を表し、n=2のとき「反対」の分布モデル91を表す。
Figure 2015121846
発言解析装置1が「賛成」と「反対」とが混在している発言データの解析を目的とすることから、「賛成」と「反対」の分布モデル90,91の2混合を行う(分布モデルの混合は混合分布モデルと呼ばれる)。この2混合分布モデルは、下記式(2)で表すことができる。この式(2)には、「賛成」のピーク時刻t、及び、「反対」のピーク時刻tが含まれることから、発言時刻に依存し、意見の形成過程が反映されていると言える。
Figure 2015121846
この式(2)では、「賛成」の盛り上がりの急速さαを表し、「反対」の盛り上がりの急速さαを表す。また、式(2)では、「賛成」と「反対」との混合比βを表す(但し、0<β<1)。つまり、式(2)では、「賛成」の割合βを表し、「反対」の割合(1−β)を表す。また、式(2)の引数に含まれるセミコロン「;」は、その後に含まれる変数が式(1)´のパラメータ(引数)であることを表す。
ここで、式(2)の第1項における収束条件を検討する。式(2)のパラメータt,αを式(1)´に代入してαを前に出すと、下記の式(1)´´となる。この場合、式(1)´´の積分が1となる収束条件が必要となる(つまり、式(1)´´の累積が1となる)。この収束条件については、パラメータαも同様である。
Figure 2015121846
図1に戻り、意見種別推定装置2について、説明を続ける。
パラメータ最適化手段24は、混合分布モデル管理手段23に記憶された混合分布モデルに発言データを適用し、数値最適化手法を用いて、最適なパラメータを推定するものである。ここで、パラメータ最適化手段24は、意見種別付加手段22からパラメータ最適化指令が入力されたら、パラメータの最適化を開始する。また、パラメータ最適化手段24は、数値最適化手法として、最急降下法、BFGS(準ニュートン法)等の最尤推定法、又は、ベイズ推定法を利用することができる。
例えば、最急降下法を用いる場合、混合分布モデル管理手段23には、パラメータt,t,α,α,βの初期値を予め設定しておく。そして、パラメータ最適化手段24は、最適な混合分布モデルが得られるまで(つまり、パラメータが収束するまで)、混合分布モデル管理手段23のパラメータt,t,α,α,βを繰り返し更新する。そして、パラメータ最適化手段24は、パラメータt,t,α,α,βの更新を終了したら、混合分布モデル管理手段23を介して、意見種別推定手段25に意見種別の割合の推定を指令する(意見種別推定指令)。
意見種別推定手段25は、パラメータ最適化手段24でパラメータが推定された混合分布モデルを用いて、意見種別の割合を推定するものである。例えば、意見種別推定手段25は、パラメータ最適化手段24から意見種別推定指令が入力されたら、意見種別の割合を推定する。
ここで、意見種別推定手段25は、パラメータt,t,α,α,βが推定された式(2)を用いることで、発言時刻及びその近傍で、意見種別の割合を推定することが可能となる。つまり、意見種別推定手段25は、式(2)から、発言データ全体に含まれる「賛成」の割合βと、「反対」の割合(1−β)とを推定することができる。
また、意見種別推定手段25は、下記式(3)のように、ある時刻τにおける「賛成」の割合と、「反対」の割合とを推定することができる。
Figure 2015121846
さらに、意見種別推定手段25は、前記式(3)を一般化した式(4)を用いて、時刻区間(τ,τ)における「賛成」の割合と、「反対」の割合とを推定することができる。ここで、時刻区間(τ,τ)は、時刻τから時刻τまで間を表す。
Figure 2015121846
その後、意見種別推定手段25は、「賛成」の割合、及び、「反対」の割合を推定結果として、発言解析手段30に出力する。このとき、意見種別推定手段25は、推定結果と共に、混合分布モデル管理手段23から発言データを読み出して、発言解析手段30に出力する。
なお、意見種別推定手段25は、前記式(2)から式(4)の何れを用いて意見種別の割合を算出するか、予め設定される。例えば、発言解析装置1の利用者が、前記式(2)から式(4)の何れを用いるか設定してもよい。
以下、発言解析装置1の発言解析手段30について、説明する。
発言解析手段30は、意見種別推定手段25から入力された推定結果を用いて、発言データを解析するものである。ここで、発言解析手段30は、従来の自然言語処理を用いて、「賛成」及び「反対」が付加された発言データを解析することができる。そして、発言解析手段30は、発言データの解析結果を外部に出力する。
[発言解析装置の動作]
図4を参照し、発言解析装置1の動作について、説明する(適宜図1参照)。
解析対象選別手段21は、全ての発言データのうち、解析対象とする発言データを選別する(ステップS1)。
意見種別付加手段22は、ステップS1で選別された発言データに意見種別を付加する(ステップS2)。
パラメータ最適化手段24は、ステップS2で意見種別が付加された発言データを混合分布モデルに適用し、数値最適化手法を用いて、最適なパラメータを推定する(ステップS3)。
意見種別推定手段25は、ステップS3で最適なパラメータが推定された混合分布モデルを用いて、意見種別の割合を推定する(ステップS4)。
発言解析手段30は、ステップS4の推定結果を用いて、発言データを解析する(ステップS5)。
本願発明の実施形態に係る意見種別推定装置2は、意見の形成過程を表す混合分布モデルのパラメータを最適化して、意見種別の割合を推定するので、推定結果の推定精度を向上させることができる。これによって、意見種別推定装置2は、ネットワーク上の意見に意見種別を自動的に付加できるので、手動で意見種別を付加する労力を削減することができる。さらに、発言解析装置1は、高い精度の推定結果を用いるので、発言データの良好な解析結果を得ることができる。
(変形例)
本願発明に係る意見種別推定装置は、前記した実施形態に限定されず、その趣旨を逸脱しない範囲で変形を加えることができる。
前記した実施形態では、図3のように、「賛成」の分布モデル90が1つのピークtを有することとしたが、これに限定されない。つまり、「賛成」の分布モデル90は、ある事案に関する発言が一度盛りあがったら、収束することを表している。だが実際には、ある事案に関する発言が収束した後、再び盛り上がることも考えられる。
これを表すため、図5に示すように、「賛成」の分布モデル90aは、2つのガウシアン分布モデルを重ね合わせて、2つのピークt11,t12を有するように設定してもよい。また、「反対」の分布モデル91aは、2つのガウシアン分布モデルを重ね合わせて、2つのピークt21,t22を有するように設定してもよい。すなわち、図5の2混合分布モデルは、下記式(5)で表すことができる。この式(5)では、前記した式(1)´´と同様の拘束条件が必要となる。
Figure 2015121846
この式(5)では、「賛成」の分布モデル90aにおいて、t11がガウシアン分布モデルp11(t)でのピーク時刻を表し、α11がガウシアン分布モデルp11(t)での盛り上がりの急速さを表し、kがガウシアン分布モデルp11(t),p12(t)の比率を表す(但し、0<k<1)。
また、「賛成」の分布モデル90aにおいて、t12がガウシアン分布モデルp12(t)でのピーク時刻を表し、α12がガウシアン分布モデルp12(t)での盛り上がりの急速さを表す。
また、「反対」の分布モデル91aにおいて、t21がガウシアン分布モデルp21(t)でのピーク時刻を表し、α21がガウシアン分布モデルp21(t)での盛り上がりの急速さを表し、kがガウシアン分布モデルp21(t),p22(t)の比率を表す(但し、0<k<1)。
また、「反対」の分布モデル91aにおいて、t22がガウシアン分布モデルp22(t)でのピーク時刻を表し、α22がガウシアン分布モデルp22(t)での盛り上がりの急速さを表す。ここでい、
この場合、混合分布モデル管理手段23は、図5の2混合分布モデルを記憶、管理する。そして、パラメータ最適化手段24は、式(5)のパラメータt11,t12,t21,t22,α11,α12,α21,α22,k,k,βを推定する。さらに、意見種別推定手段25は、最適なパラメータが推定された式(5)を用いて、意見種別の割合を推定する。
なお、図3において、「賛成」の分布モデル90及び「反対」の分布モデル91は、3つ以上のピークを含んでもよい。また、「反対」の分布モデル91のピーク時刻tが「賛成」の分布モデル90のピーク時刻tよりも先であってもよい。また、2混合分布モデルは、図3及び図5の例に限定されない。
前記した実施形態では、意見種別が「賛成」又は「反対」の2種別としたが、これに限定されない。
例えば、意見種別は、「賛成」、「中立」又は「反対」の3種別としてもよい。この場合、混合分布モデル管理手段は、3混合分布モデルを記憶、管理する。
また、意見種別は、4種別以上であってもよい。この場合、混合分布モデル管理手段は、4種別以上の混合分布モデルを記憶、管理する。
つまり、意見種別がn種別であれば、混合分布モデル管理手段は、n混合分布モデルを記憶、管理する(nは2以上の整数)。
前記した実施形態では、意見種別毎の分布モデルをガウシアン分布モデルとして説明したが、これに限定されない。例えば、パラメータ最適化手段は、意見種別毎の分布モデルとして、下記式(6)の一般化双曲型分布モデルgh(x)を利用することができる。一般化双曲型分布モデルでは、ピークに達する前とピークに達した後との時間推移に対称性がない場合でも、意見の形成過程を反映した分布モデルとして扱うことができる。
Figure 2015121846
この式(6)では、μがピーク時刻を表し、δがスケール(縦、横)を表し、λが第3種変形ベッセル関数Kλ(x)の次数を表す。ここで、α,γは分布の形状を決めるパラメータであり、αは尖度に、γは歪度(非対称性)に影響する。
前記した実施形態では、意見種別推定装置を独立したハードウェアとして説明したが、本願発明は、これに限定されない。例えば、意見種別推定装置は、コンピュータが備えるCPU、メモリ、ハードディスク等のハードウェア資源を、解析対象選別手段と、意見種別付加手段と、混合分布モデル管理手段と、パラメータ最適化手段と、意見種別推定手段として協調動作させる意見種別推定プログラムで実現することもできる。
本願発明に係る意見種別推定装置は、例えば、政策が問われる政治家又は行政機関、作品の評価が問われる芸術家、及び、商品の評判が問われる事業者が、ネットワーク上の発言を解析するのに利用することができる。
1 発言解析装置
2 意見種別推定装置
21 解析対象選別手段
22 意見種別付加手段
23 混合分布モデル管理手段(混合分布モデル記憶手段)
24 パラメータ最適化手段
25 意見種別推定手段
30 発言解析手段

Claims (6)

  1. 意見の内容を表した発言データに意見種別が予め設定され、前記発言データの意見種別に関する統計情報を推定する意見種別推定装置であって、
    前記意見種別毎の混合比とピーク時刻と盛り上がりの急速さとをパラメータとした、発言時刻に依存した意見の形成過程を表す混合分布モデルを予め記憶すると共に、前記発言時刻が付加された前記発言データを前記意見種別毎に記憶する混合分布モデル記憶手段と、
    前記混合分布モデル記憶手段の混合分布モデルに発言データを適用し、数値最適化手法によって前記パラメータを推定するパラメータ最適化手段と、
    前記パラメータ最適化手段でパラメータが推定された混合分布モデルを用いて、前記意見種別に関する統計情報を推定する意見種別推定手段と、
    を備えることを特徴とする意見種別推定装置。
  2. 前記混合分布モデル記憶手段は、n種別目の前記意見種別のピーク時刻tと、前記n種別目の意見種別の盛り上がりの急速さαとを含んだ下記式(1)´のガウシアン分布p(t)が混合された混合分布モデルを、予め記憶することを特徴とする請求項1に記載の意見種別推定装置(但し、nは自然数)。
    Figure 2015121846
  3. 前記混合分布モデル記憶手段は、前記意見種別が2種別であり、第1の前記意見種別のピーク時刻tと、前記第1の意見種別の盛り上がりの急速さαと、第2の前記意見種別のピーク時刻tと、前記第2の意見種別の盛り上がりの急速さαとを前記式(1)´の引数として、前記第1の意見種別及び前記第2の意見種別の混合比β(0<β<1)とが含まれる下記式(2)の2混合分布モデルp(t)を予め記憶し、
    Figure 2015121846
    前記パラメータ最適化手段は、前記パラメータt,t,α,α,βを推定することを特徴とする請求項2に記載の意見種別推定装置(但し、‘;’は後に含まれる変数が式(1)´の引数であることを示す)。
  4. 前記混合分布モデル記憶手段は、下記式(5)のように、前記意見種別が2種別であり、第1の意見種別で2つのガウシアン分布p11(t),p12(t)を重ね合わせた分布モデルと、第2の意見種別で2つのガウシアン分布p21(t),p22(t)を重ね合わせた分布モデルとの2混合分布モデルp(t)を予め記憶し、
    Figure 2015121846
    前記パラメータ最適化手段は、前記パラメータとして、
    前記第1の意見種別及び前記第2の意見種別の混合比βと、
    ガウシアン分布モデルp11(t),p12(t)の比率k(0<k<1)と、
    ガウシアン分布モデルp11(t)でのピーク時刻t11,盛り上がりの急速さα11と、
    ガウシアン分布モデルp12(t)でのピーク時刻t12,盛り上がりの急速さα12と、
    ガウシアン分布モデルp21(t),p22(t)の比率k(0<k<1)と、
    ガウシアン分布モデルp21(t)でのピーク時刻t21,盛り上がりの急速さα21と、
    ガウシアン分布モデルp22(t)でのピーク時刻t22,盛り上がりの急速さα22と、
    を推定することを特徴とする請求項2に記載の意見種別推定装置。
  5. 前記混合分布モデル記憶手段は、前記ピーク時刻μと、スケールδと、第3種変形ベッセル関数Kλ(x)の次数λと、尖度αと、歪度γとを含んだ下記式(6)の一般化双曲型分布モデルgh(x)が2以上混合された混合分布モデルを、予め記憶することを特徴とする請求項1に記載の意見種別推定装置(但し、‘;’は後に含まれる変数が式(6)の引数であることを示す)。
    Figure 2015121846
  6. コンピュータを、請求項1に記載の意見種別推定装置として機能させるための意見種別推定プログラム。
JP2013263994A 2013-12-20 2013-12-20 意見種別推定装置及びそのプログラム Active JP6192166B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013263994A JP6192166B2 (ja) 2013-12-20 2013-12-20 意見種別推定装置及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013263994A JP6192166B2 (ja) 2013-12-20 2013-12-20 意見種別推定装置及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2015121846A true JP2015121846A (ja) 2015-07-02
JP6192166B2 JP6192166B2 (ja) 2017-09-06

Family

ID=53533427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013263994A Active JP6192166B2 (ja) 2013-12-20 2013-12-20 意見種別推定装置及びそのプログラム

Country Status (1)

Country Link
JP (1) JP6192166B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106162163A (zh) * 2016-08-02 2016-11-23 浙江科技学院 一种高效视觉质量客观评价方法
CN106791822A (zh) * 2017-01-13 2017-05-31 浙江科技学院 一种基于单双目特征学习的无参考立体图像质量评价方法
JP2019036087A (ja) * 2017-08-14 2019-03-07 ヤフー株式会社 生成装置、生成方法、生成プログラム、学習データ、及びモデル
JP2022016628A (ja) * 2017-08-14 2022-01-21 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004227343A (ja) * 2003-01-23 2004-08-12 Fujitsu Ltd 意見分析方法、意見分析装置、および意見分析プログラム
JP2012256283A (ja) * 2011-06-10 2012-12-27 Nomura Research Institute Ltd 感性分析システム及びプログラム
WO2013179340A1 (ja) * 2012-05-30 2013-12-05 株式会社日立製作所 情報分析システム及び情報分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004227343A (ja) * 2003-01-23 2004-08-12 Fujitsu Ltd 意見分析方法、意見分析装置、および意見分析プログラム
JP2012256283A (ja) * 2011-06-10 2012-12-27 Nomura Research Institute Ltd 感性分析システム及びプログラム
WO2013179340A1 (ja) * 2012-05-30 2013-12-05 株式会社日立製作所 情報分析システム及び情報分析方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106162163A (zh) * 2016-08-02 2016-11-23 浙江科技学院 一种高效视觉质量客观评价方法
CN106791822A (zh) * 2017-01-13 2017-05-31 浙江科技学院 一种基于单双目特征学习的无参考立体图像质量评价方法
JP2019036087A (ja) * 2017-08-14 2019-03-07 ヤフー株式会社 生成装置、生成方法、生成プログラム、学習データ、及びモデル
JP2022016628A (ja) * 2017-08-14 2022-01-21 ヤフー株式会社 生成装置、生成方法、及び生成プログラム
JP7198900B2 (ja) 2017-08-14 2023-01-04 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Also Published As

Publication number Publication date
JP6192166B2 (ja) 2017-09-06

Similar Documents

Publication Publication Date Title
JP4532863B2 (ja) 2言語コーパスを整列させるための方法および装置
JP6087899B2 (ja) 会話ダイアログ学習および会話ダイアログ訂正
JP5901001B1 (ja) 音響言語モデルトレーニングのための方法およびデバイス
US10346485B1 (en) Semi structured question answering system
US10360925B2 (en) Computerized tool for creating variable length presentations
JP5125307B2 (ja) 工数見積プログラム、該プログラムを記録した記録媒体、工数見積装置、および工数見積方法
US11809832B2 (en) Natural language text generation using semantic objects
JP6192166B2 (ja) 意見種別推定装置及びそのプログラム
US10579835B1 (en) Semantic pre-processing of natural language input in a virtual personal assistant
US11082369B1 (en) Domain-specific chatbot utterance collection
US8359364B2 (en) System and method for optimizing response handling time and customer satisfaction scores
JPWO2007138875A1 (ja) 音声認識用単語辞書・言語モデル作成システム、方法、プログラムおよび音声認識システム
US9218411B2 (en) Incremental dynamic document index generation
Shen et al. Estimation of Gap Between Current Language Models and Human Performance.
JP7093292B2 (ja) 対話セッションテキストをセグメンテーションするシステム及び方法
JPWO2011145272A1 (ja) パープレキシティ算出装置
US8352909B2 (en) Business process diagram (BPD) component analysis
US20130110491A1 (en) Discriminative learning of feature functions of generative type in speech translation
US20220284280A1 (en) Data labeling for synthetic data generation
US9996795B2 (en) Generating a non-deterministic model of a process for a goal
JP6907703B2 (ja) 解析装置、解析方法、および解析プログラム
KR102019752B1 (ko) 컴퓨터 수행 가능한 ui/ux 전략제공방법 및 이를 수행하는 ui/ux 전략제공장치
JP2010170252A (ja) 言語モデル作成方法、言語モデル作成装置および言語モデル作成プログラム
JP2020071523A (ja) 見積方法、課金方法、コンピュータ、及びプログラム
JP6425732B2 (ja) 文章検索システム、極性判定ルール修正システム、文章検索方法及び極性判定ルール修正方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170804

R150 Certificate of patent or registration of utility model

Ref document number: 6192166

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250