JP2015121846A

JP2015121846A - 意見種別推定装置及びそのプログラム

Info

Publication number: JP2015121846A
Application number: JP2013263994A
Authority: JP
Inventors: 小早川　健; Takeshi Kobayakawa; 健小早川
Original assignee: Nippon Hoso Kyokai NHK; Japan Broadcasting Corp
Current assignee: Japan Broadcasting Corp
Priority date: 2013-12-20
Filing date: 2013-12-20
Publication date: 2015-07-02
Anticipated expiration: 2033-12-20
Also published as: JP6192166B2

Abstract

【課題】本願発明は、発言データの意見種別に関する統計情報の推定精度を向上させる意見種別推定装置を提供する。
【解決手段】意見種別推定装置２は、解析対象とする発言データを選別する解析対象選別手段２１と、選別された発言データに意見種別を付加する意見種別付加手段２２と、発言データと、意見種別毎のガウシアン分布モデルを混合した混合分布モデルとを記憶、管理する混合分布モデル管理手段２３と、混合分布モデルに発言データを適用し、数値最適化手法を用いて、最適なパラメータを推定するパラメータ最適化手段２４と、最適なパラメータが推定された混合分布モデルを用いて、意見種別の割合を推定する意見種別推定手段２５とを備える。
【選択図】図１

Description

本願発明は、意見の内容を表した発言データから意見種別に関する統計情報を推定する意見種別推定装置及びそのプログラムに関する。

従来から、人間の手による書き込みを解析するために、自然言語処理が必要とされている。自然言語処理の前段では、意見種別を推定する技術が必要となる（特許文献１〜５及び非特許文献１，２）。この意見種別推定技術は、意見種別毎にラベルを付与するアルゴリズムであり、賛否を表す意見種別の場合、「賛成」または「反対」というラベルを意見に付与するものである。

特許第５２２４５３２号公報特許第５２５４８８８号公報特許第５２７８３２７号公報特許第５２８６２９８号公報特許第５２２１７５１号公報

Jorge Nocedal,Stephen J.Wright,"Numerical Optimization",Springer,2006年大塚裕子、幹孝司、奥村学、"意見分析エンジン"、コロナ社、２００７年

しかし、従来の意見種別推定技術には、不適切なラベルを意見に付与するといった、ある程度の誤りが含まれてしまう。このため、従来の意見種別推定技術は、この技術を単独で用いた場合、賛否の数や割合といった意見種別に関する統計情報を求めるときに、その推定精度が向上しないという問題がある。

ここで、意見種別推定技術に誤りが含まれる原因を検討する。各個人の意見形成過程では、他人の意見を参考にしながら自分の意見（賛否）を決めることが多い。にもかかわらず、従来の意見種別推定技術では、実際の意見形成過程が反映されておらず、誤りの原因になると考えられる。

そこで、本願発明は、前記した問題を解決し、意見種別に関する統計情報の推定精度を向上させる意見種別推定装置及びそのプログラムを提供することを課題とする。

前記した課題に鑑みて、本願発明に係る意見種別推定装置は、意見の内容を表した発言データに意見種別が予め設定され、発言データの意見種別に関する統計情報を推定する意見種別推定装置であって、混合分布モデル記憶手段と、パラメータ最適化手段と、意見種別推定手段と、を備えることを特徴とする。

かかる構成によれば、意見種別推定装置は、混合分布モデル記憶手段によって、意見種別毎の混合比とピーク時刻と盛り上がりの急速さとをパラメータとした、発言時刻に依存した意見の形成過程を表す混合分布モデルを予め記憶すると共に、発言時刻が付加された前記発言データを前記意見種別毎に記憶する。また、意見種別推定装置は、パラメータ最適化手段によって、混合分布モデル記憶手段の混合分布モデルに発言データを適用し、数値最適化手法によってパラメータを推定する。

そして、意見種別推定装置は、意見種別推定手段によって、意見の形成過程を表す混合分布モデルでパラメータが最適化されているので、この混合分布モデルを用いて、意見種別に関する統計情報を推定する。例えば、意見種別に関する統計情報は、全ての発言データに含まれる意見種別の発言の割合、又は、意見種別毎の発言数である。

発言データとは、政治、経済等の分野における特定の事案について、ネットワーク上で不特定多数者が発言した意見の内容を表したテキストデータのことである。
意見種別とは、発言データの意見内容を予め設定した種別に分類したものである。例えば、意見種別として、意見の賛否を表す「賛成」や「反対」といったラベルをあげることができる。
意見種別毎の混合比は、混合分布モデルにおける各意見種別の割合を表すことになる。例えば、意見種別毎の混合比は、「賛成」の割合と、「反対」の割合とを表す。

意見種別毎の分布モデルは、発言時刻に依存し、１以上のピークを有する分布モデルのことである（例えば、ガウシアン分布モデル）。つまり、意見種別毎の分布モデルは、発言時刻に依存することから、意見の形成過程が反映されていると言える。
混合分布モデルとは、意見種別毎の分布モデルを混合した確率モデルのことである。例えば、混合分布モデルとして、「賛成」の分布モデルと、「反対」の分布モデルとの２混合分布モデルをあげることができる。

盛り上がりとは、ネットワーク上で発言が増加する速さのことである。例えば、ネットワーク上で特定の事案に関する発言が急速に増えている場合、盛り上がっていると言う。また、例えば、ネットワーク上で特定の事案に関する発言が少ない状態が継続する場合、盛り上がっていないと言う。
ネットワーク上での発言の増加の原因は、拡散による発言者の増加や、同一人物による繰り返し発言の増加が考えられる。この２つの原因は混在しているが、同一人物の発言を１回しか参照しないことによって、同一人物による繰り返し発言の影響を除去することが可能である。この場合、発言の増加が拡散を表す。

本願発明に係る意見種別推定装置は、コンピュータが備えるＣＰＵ、メモリ、ハードディスク等のハードウェア資源を、前記した各手段として協調動作させる意見種別推定プログラムで実現することもできる。このプログラムは、通信回線を介して配布してもよく、ＣＤ−ＲＯＭやフラッシュメモリ等の記録媒体に書き込んで配布してもよい。

本願発明によれば、以下のような優れた効果を奏する。
本願発明によれば、意見の形成過程を表す混合分布モデルのパラメータを最適化して、意見種別に関する統計情報を推定するので、その推定精度を向上させることができる。これによって、本願発明によれば、ネットワーク上の意見に意見種別を自動的に付加できるので、手動で意見種別を付加する労力を削減することができる。

本願発明の実施形態に係る発言解析装置の構成を示すブロック図である。図１の意見種別付加手段が出力した発言データのデータ構造を説明する説明図である。図１の混合分布モデル管理手段に記憶された混合分布モデルを説明する説明図である。図１の発言解析装置の動作を示すブロック図である。本願発明の変形例において、分布モデルを説明する説明図である。

図１を参照し、本願発明の実施形態について、適宜図面を参照しながら詳細に説明する。
図１のように、本願発明の実施形態に係る発言解析装置１は、ネットワーク上に存在する発言を解析するものであり、意見種別推定装置２と、発言解析手段３０とを備える。

[発言解析装置の構成]
発言解析装置１は、ネットワーク上に存在する発言データが入力される。この発言データは、例えば、ホームページ、ブログ又は掲示板に書き込まれた意見である。ここで、発言データは、発言時刻（意見が書き込まれた時刻）が付加され、発言時刻で集計（ソート）された時系列データであることとする。そして、発言解析装置１は、発言の解析（自然言語処理）の前段として、意見種別の割合を推定するため、発言データを意見種別推定装置２に出力する。

意見種別推定装置２は、意見種別に関する統計情報として、発言解析装置１より入力された発言データから意見種別の割合を推定するものである。このため、意見種別推定装置２は、解析対象選別手段２１と、意見種別付加手段２２と、混合分布モデル管理手段（混合分布モデル記憶手段）２３と、パラメータ最適化手段２４と、意見種別推定手段２５とを備える。

解析対象選別手段２１は、発言解析装置１から入力された全ての発言データのうち、解析対象とする発言データを選別するものである。例えば、解析対象選別手段２１は、消費増税という政策の意見を解析したい場合、全ての発言データから、消費増税に関する発言データに絞り込む。より具体的には、解析対象選別手段２１は、解析対象となる事案で特徴的なキーワード（例えば、‘消費増税’）を手動で設定し、このキーワードが含まれる発言データを選別する処理を行う。そして、解析対象選別手段２１は、選別された発言データを、意見種別付加手段２２に出力する。
なお、解析対象選別手段２１は、キーワードが含まれる発言データを選別する処理に、設定されたキーワードの表記ゆれや類義語を同一語とみなす処理を組み合わせてもよい。

意見種別付加手段２２は、解析対象選別手段２１から入力された発言データに意見種別を付加するものである。本実施形態では、意見種別付加手段２２は、「賛成」又は「反対」という賛否を意見種別として、発言データに付加することとする。このとき、意見種別付加手段２２は、従来の意見種別推定技術を用いて、意見種別を発言データに付加する。より具体的には、意見種別付加手段２２は、参考文献１の４．２節「意見を含む文の自動抽出」及び４．３「評価分析の要素技術」に記載の手法を用いて、意見種別を発言データに付加できる。
参考文献１：大塚裕子、幹孝司、奥村学、“意見分析エンジン”、コロナ社、２００７年

ここで、発言データには、混合分布モデルに最適化手法を適用する際に意見種別が必要となるため、意見種別を発言データに付加する。当然、従来の意見種別推定技術を用いるため、発言データに付加された意見種別には、誤りが含まれている。

また、発言データは、意見種別推定装置２に入力された時点で、発言時刻が付加されている。従って、図２のように、発言データは、発言時刻と、発言内容と、意見種別とが含まれている。図２には、経済政策に関する発言データを図示した。例えば、最初の意見は、２０１３年９月１９日の１０時３４分に書き込まれ、「景気対策をやってほしい」という意見であり、経済政策に「賛成」であることを示す。また、２番目の意見は、２０１３年９月１９日の１０時３５分に書き込まれ、「首相の経済対策をやめてほしい」という意見であり、経済政策に「反対」であることを示す。

その後、意見種別付加手段２２は、意見種別が付加された発言データを、発言種別毎に混合分布モデル管理手段２３に出力する。このとき、意見種別付加手段２２は、混合分布モデル管理手段２３を介して、パラメータ最適化手段２４にパラメータの最適化を指令する（パラメータ最適化指令）。

混合分布モデル管理手段２３は、意見種別付加手段２２から入力された発言データと、混合分布モデルとを記憶、管理するものである。

＜混合分布モデル＞
図３を参照し、混合分布モデルについて、説明する（適宜図１参照）
混合分布モデルとは、意見種別毎に設定された分布モデルを混合したものである。本実施形態では、混合分布モデルは、図３のように、「賛成」の分布モデル９０と、「反対」の分布モデル９１とを混合した２混合分布モデルである。

本実施形態では、分布モデル９０，９１は、発言時刻に依存し、１以上のピークを有するガウシアン分布モデルである。ガウシアン分布モデルは、下記式（１）で表される。式（１）では、ｔ_０が意見種別毎に意見がピークとなる時刻（ピーク時刻）であり、α_０が意見の盛り上がりの急速さを表す。

従って、各分布モデル９０，９１は、下記式（１）´で表すことができる。式（１）´では、ｎが意見種別の数を表す（但し、ｎは自然数）。また、式（１）´では、意見種別ｎのピーク時刻ｔ_ｎと、意見種別ｎの盛り上がりの急速さα_ｎとを表す。本実施形態では、ｎ＝１，２となり、ｎ＝１のとき「賛成」の分布モデル９０を表し、ｎ＝２のとき「反対」の分布モデル９１を表す。

発言解析装置１が「賛成」と「反対」とが混在している発言データの解析を目的とすることから、「賛成」と「反対」の分布モデル９０，９１の２混合を行う（分布モデルの混合は混合分布モデルと呼ばれる）。この２混合分布モデルは、下記式（２）で表すことができる。この式（２）には、「賛成」のピーク時刻ｔ_１、及び、「反対」のピーク時刻ｔ_２が含まれることから、発言時刻に依存し、意見の形成過程が反映されていると言える。

この式（２）では、「賛成」の盛り上がりの急速さα_１を表し、「反対」の盛り上がりの急速さα_２を表す。また、式（２）では、「賛成」と「反対」との混合比βを表す（但し、０＜β＜１）。つまり、式（２）では、「賛成」の割合βを表し、「反対」の割合（１−β）を表す。また、式（２）の引数に含まれるセミコロン「；」は、その後に含まれる変数が式（１）´のパラメータ（引数）であることを表す。

ここで、式（２）の第１項における収束条件を検討する。式（２）のパラメータｔ_１，α_１を式（１）´に代入してα_１を前に出すと、下記の式（１）´´となる。この場合、式（１）´´の積分が１となる収束条件が必要となる（つまり、式（１）´´の累積が１となる）。この収束条件については、パラメータα_２も同様である。

図１に戻り、意見種別推定装置２について、説明を続ける。
パラメータ最適化手段２４は、混合分布モデル管理手段２３に記憶された混合分布モデルに発言データを適用し、数値最適化手法を用いて、最適なパラメータを推定するものである。ここで、パラメータ最適化手段２４は、意見種別付加手段２２からパラメータ最適化指令が入力されたら、パラメータの最適化を開始する。また、パラメータ最適化手段２４は、数値最適化手法として、最急降下法、ＢＦＧＳ（準ニュートン法）等の最尤推定法、又は、ベイズ推定法を利用することができる。

例えば、最急降下法を用いる場合、混合分布モデル管理手段２３には、パラメータｔ_１，ｔ_２，α_１，α_２，βの初期値を予め設定しておく。そして、パラメータ最適化手段２４は、最適な混合分布モデルが得られるまで（つまり、パラメータが収束するまで）、混合分布モデル管理手段２３のパラメータｔ_１，ｔ_２，α_１，α_２，βを繰り返し更新する。そして、パラメータ最適化手段２４は、パラメータｔ_１，ｔ_２，α_１，α_２，βの更新を終了したら、混合分布モデル管理手段２３を介して、意見種別推定手段２５に意見種別の割合の推定を指令する（意見種別推定指令）。

意見種別推定手段２５は、パラメータ最適化手段２４でパラメータが推定された混合分布モデルを用いて、意見種別の割合を推定するものである。例えば、意見種別推定手段２５は、パラメータ最適化手段２４から意見種別推定指令が入力されたら、意見種別の割合を推定する。

ここで、意見種別推定手段２５は、パラメータｔ_１，ｔ_２，α_１，α_２，βが推定された式（２）を用いることで、発言時刻及びその近傍で、意見種別の割合を推定することが可能となる。つまり、意見種別推定手段２５は、式（２）から、発言データ全体に含まれる「賛成」の割合βと、「反対」の割合（１−β）とを推定することができる。

また、意見種別推定手段２５は、下記式（３）のように、ある時刻τにおける「賛成」の割合と、「反対」の割合とを推定することができる。

さらに、意見種別推定手段２５は、前記式（３）を一般化した式（４）を用いて、時刻区間（τ_１，τ_２）における「賛成」の割合と、「反対」の割合とを推定することができる。ここで、時刻区間（τ_１，τ_２）は、時刻τ_１から時刻τ_２まで間を表す。

その後、意見種別推定手段２５は、「賛成」の割合、及び、「反対」の割合を推定結果として、発言解析手段３０に出力する。このとき、意見種別推定手段２５は、推定結果と共に、混合分布モデル管理手段２３から発言データを読み出して、発言解析手段３０に出力する。

なお、意見種別推定手段２５は、前記式（２）から式（４）の何れを用いて意見種別の割合を算出するか、予め設定される。例えば、発言解析装置１の利用者が、前記式（２）から式（４）の何れを用いるか設定してもよい。

以下、発言解析装置１の発言解析手段３０について、説明する。
発言解析手段３０は、意見種別推定手段２５から入力された推定結果を用いて、発言データを解析するものである。ここで、発言解析手段３０は、従来の自然言語処理を用いて、「賛成」及び「反対」が付加された発言データを解析することができる。そして、発言解析手段３０は、発言データの解析結果を外部に出力する。

[発言解析装置の動作]
図４を参照し、発言解析装置１の動作について、説明する（適宜図１参照）。
解析対象選別手段２１は、全ての発言データのうち、解析対象とする発言データを選別する（ステップＳ１）。

意見種別付加手段２２は、ステップＳ１で選別された発言データに意見種別を付加する（ステップＳ２）。
パラメータ最適化手段２４は、ステップＳ２で意見種別が付加された発言データを混合分布モデルに適用し、数値最適化手法を用いて、最適なパラメータを推定する（ステップＳ３）。

意見種別推定手段２５は、ステップＳ３で最適なパラメータが推定された混合分布モデルを用いて、意見種別の割合を推定する（ステップＳ４）。
発言解析手段３０は、ステップＳ４の推定結果を用いて、発言データを解析する（ステップＳ５）。

本願発明の実施形態に係る意見種別推定装置２は、意見の形成過程を表す混合分布モデルのパラメータを最適化して、意見種別の割合を推定するので、推定結果の推定精度を向上させることができる。これによって、意見種別推定装置２は、ネットワーク上の意見に意見種別を自動的に付加できるので、手動で意見種別を付加する労力を削減することができる。さらに、発言解析装置１は、高い精度の推定結果を用いるので、発言データの良好な解析結果を得ることができる。

（変形例）
本願発明に係る意見種別推定装置は、前記した実施形態に限定されず、その趣旨を逸脱しない範囲で変形を加えることができる。
前記した実施形態では、図３のように、「賛成」の分布モデル９０が１つのピークｔ_１を有することとしたが、これに限定されない。つまり、「賛成」の分布モデル９０は、ある事案に関する発言が一度盛りあがったら、収束することを表している。だが実際には、ある事案に関する発言が収束した後、再び盛り上がることも考えられる。

これを表すため、図５に示すように、「賛成」の分布モデル９０ａは、２つのガウシアン分布モデルを重ね合わせて、２つのピークｔ_１１，ｔ_１２を有するように設定してもよい。また、「反対」の分布モデル９１aは、２つのガウシアン分布モデルを重ね合わせて、２つのピークｔ_２１，ｔ_２２を有するように設定してもよい。すなわち、図５の２混合分布モデルは、下記式（５）で表すことができる。この式（５）では、前記した式（１）´´と同様の拘束条件が必要となる。

この式（５）では、「賛成」の分布モデル９０ａにおいて、ｔ_１１がガウシアン分布モデルｐ_１１（ｔ）でのピーク時刻を表し、α_１１がガウシアン分布モデルｐ_１１（ｔ）での盛り上がりの急速さを表し、ｋ_１がガウシアン分布モデルｐ_１１（ｔ），ｐ_１２（ｔ）の比率を表す（但し、０＜ｋ_１＜１）。
また、「賛成」の分布モデル９０ａにおいて、ｔ_１２がガウシアン分布モデルｐ_１２（ｔ）でのピーク時刻を表し、α_１２がガウシアン分布モデルｐ_１２（ｔ）での盛り上がりの急速さを表す。

また、「反対」の分布モデル９１aにおいて、ｔ_２１がガウシアン分布モデルｐ_２１（ｔ）でのピーク時刻を表し、α_２１がガウシアン分布モデルｐ_２１（ｔ）での盛り上がりの急速さを表し、ｋ_２がガウシアン分布モデルｐ_２１（ｔ），ｐ_２２（ｔ）の比率を表す（但し、０＜ｋ_２＜１）。
また、「反対」の分布モデル９１aにおいて、ｔ_２２がガウシアン分布モデルｐ_２２（ｔ）でのピーク時刻を表し、α_２２がガウシアン分布モデルｐ_２２（ｔ）での盛り上がりの急速さを表す。ここでい、

この場合、混合分布モデル管理手段２３は、図５の２混合分布モデルを記憶、管理する。そして、パラメータ最適化手段２４は、式（５）のパラメータｔ_１１，ｔ_１２，ｔ_２１，ｔ_２２，α_１１，α_１２，α_２１，α_２２，ｋ_１，ｋ_２，βを推定する。さらに、意見種別推定手段２５は、最適なパラメータが推定された式（５）を用いて、意見種別の割合を推定する。

なお、図３において、「賛成」の分布モデル９０及び「反対」の分布モデル９１は、３つ以上のピークを含んでもよい。また、「反対」の分布モデル９１のピーク時刻ｔ_２が「賛成」の分布モデル９０のピーク時刻ｔ_１よりも先であってもよい。また、２混合分布モデルは、図３及び図５の例に限定されない。

前記した実施形態では、意見種別が「賛成」又は「反対」の２種別としたが、これに限定されない。
例えば、意見種別は、「賛成」、「中立」又は「反対」の３種別としてもよい。この場合、混合分布モデル管理手段は、３混合分布モデルを記憶、管理する。
また、意見種別は、４種別以上であってもよい。この場合、混合分布モデル管理手段は、４種別以上の混合分布モデルを記憶、管理する。
つまり、意見種別がｎ種別であれば、混合分布モデル管理手段は、ｎ混合分布モデルを記憶、管理する（ｎは２以上の整数）。

前記した実施形態では、意見種別毎の分布モデルをガウシアン分布モデルとして説明したが、これに限定されない。例えば、パラメータ最適化手段は、意見種別毎の分布モデルとして、下記式（６）の一般化双曲型分布モデルｇｈ（ｘ）を利用することができる。一般化双曲型分布モデルでは、ピークに達する前とピークに達した後との時間推移に対称性がない場合でも、意見の形成過程を反映した分布モデルとして扱うことができる。

この式（６）では、μがピーク時刻を表し、δがスケール（縦、横）を表し、λが第３種変形ベッセル関数Ｋ_λ（ｘ）の次数を表す。ここで、α，γは分布の形状を決めるパラメータであり、αは尖度に、γは歪度（非対称性）に影響する。

前記した実施形態では、意見種別推定装置を独立したハードウェアとして説明したが、本願発明は、これに限定されない。例えば、意見種別推定装置は、コンピュータが備えるＣＰＵ、メモリ、ハードディスク等のハードウェア資源を、解析対象選別手段と、意見種別付加手段と、混合分布モデル管理手段と、パラメータ最適化手段と、意見種別推定手段として協調動作させる意見種別推定プログラムで実現することもできる。

本願発明に係る意見種別推定装置は、例えば、政策が問われる政治家又は行政機関、作品の評価が問われる芸術家、及び、商品の評判が問われる事業者が、ネットワーク上の発言を解析するのに利用することができる。

１発言解析装置
２意見種別推定装置
２１解析対象選別手段
２２意見種別付加手段
２３混合分布モデル管理手段（混合分布モデル記憶手段）
２４パラメータ最適化手段
２５意見種別推定手段
３０発言解析手段

Claims

意見の内容を表した発言データに意見種別が予め設定され、前記発言データの意見種別に関する統計情報を推定する意見種別推定装置であって、
前記意見種別毎の混合比とピーク時刻と盛り上がりの急速さとをパラメータとした、発言時刻に依存した意見の形成過程を表す混合分布モデルを予め記憶すると共に、前記発言時刻が付加された前記発言データを前記意見種別毎に記憶する混合分布モデル記憶手段と、
前記混合分布モデル記憶手段の混合分布モデルに発言データを適用し、数値最適化手法によって前記パラメータを推定するパラメータ最適化手段と、
前記パラメータ最適化手段でパラメータが推定された混合分布モデルを用いて、前記意見種別に関する統計情報を推定する意見種別推定手段と、
を備えることを特徴とする意見種別推定装置。
前記混合分布モデル記憶手段は、ｎ種別目の前記意見種別のピーク時刻ｔ_ｎと、前記ｎ種別目の意見種別の盛り上がりの急速さα_ｎとを含んだ下記式（１）´のガウシアン分布ｐ_ｎ（ｔ）が混合された混合分布モデルを、予め記憶することを特徴とする請求項１に記載の意見種別推定装置（但し、ｎは自然数）。
前記混合分布モデル記憶手段は、前記意見種別が２種別であり、第１の前記意見種別のピーク時刻ｔ_１と、前記第１の意見種別の盛り上がりの急速さα_１と、第２の前記意見種別のピーク時刻ｔ_２と、前記第２の意見種別の盛り上がりの急速さα_２とを前記式（１）´の引数として、前記第１の意見種別及び前記第２の意見種別の混合比β（０＜β＜１）とが含まれる下記式（２）の２混合分布モデルｐ（ｔ）を予め記憶し、

前記パラメータ最適化手段は、前記パラメータｔ_１，ｔ_２，α_１，α_２，βを推定することを特徴とする請求項２に記載の意見種別推定装置（但し、‘；’は後に含まれる変数が式（１）´の引数であることを示す）。
前記混合分布モデル記憶手段は、下記式（５）のように、前記意見種別が２種別であり、第１の意見種別で２つのガウシアン分布ｐ_１１（ｔ），ｐ_１２（ｔ）を重ね合わせた分布モデルと、第２の意見種別で２つのガウシアン分布ｐ_２１（ｔ），ｐ_２２（ｔ）を重ね合わせた分布モデルとの２混合分布モデルｐ（ｔ）を予め記憶し、

前記パラメータ最適化手段は、前記パラメータとして、
前記第１の意見種別及び前記第２の意見種別の混合比βと、
ガウシアン分布モデルｐ_１１（ｔ），ｐ_１２（ｔ）の比率ｋ_１（０＜ｋ_１＜１）と、
ガウシアン分布モデルｐ_１１（ｔ）でのピーク時刻ｔ_１１，盛り上がりの急速さα_１１と、
ガウシアン分布モデルｐ_１２（ｔ）でのピーク時刻ｔ_１２，盛り上がりの急速さα_１２と、
ガウシアン分布モデルｐ_２１（ｔ），ｐ_２２（ｔ）の比率ｋ_２（０＜ｋ_２＜１）と、
ガウシアン分布モデルｐ_２１（ｔ）でのピーク時刻ｔ_２１，盛り上がりの急速さα_２１と、
ガウシアン分布モデルｐ_２２（ｔ）でのピーク時刻ｔ_２２，盛り上がりの急速さα_２２と、
を推定することを特徴とする請求項２に記載の意見種別推定装置。
前記混合分布モデル記憶手段は、前記ピーク時刻μと、スケールδと、第３種変形ベッセル関数Ｋ_λ（ｘ）の次数λと、尖度αと、歪度γとを含んだ下記式（６）の一般化双曲型分布モデルｇｈ（ｘ）が２以上混合された混合分布モデルを、予め記憶することを特徴とする請求項１に記載の意見種別推定装置（但し、‘；’は後に含まれる変数が式（６）の引数であることを示す）。
コンピュータを、請求項１に記載の意見種別推定装置として機能させるための意見種別推定プログラム。