JP7279928B2 - 議論分析装置及び議論分析方法 - Google Patents

議論分析装置及び議論分析方法 Download PDF

Info

Publication number
JP7279928B2
JP7279928B2 JP2019046990A JP2019046990A JP7279928B2 JP 7279928 B2 JP7279928 B2 JP 7279928B2 JP 2019046990 A JP2019046990 A JP 2019046990A JP 2019046990 A JP2019046990 A JP 2019046990A JP 7279928 B2 JP7279928 B2 JP 7279928B2
Authority
JP
Japan
Prior art keywords
participants
discussion
transition
unit
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019046990A
Other languages
English (en)
Other versions
JP2020148931A (ja
Inventor
武志 水本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hylable Inc
Original Assignee
Hylable Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hylable Inc filed Critical Hylable Inc
Priority to JP2019046990A priority Critical patent/JP7279928B2/ja
Publication of JP2020148931A publication Critical patent/JP2020148931A/ja
Priority to JP2023075775A priority patent/JP7453714B2/ja
Application granted granted Critical
Publication of JP7279928B2 publication Critical patent/JP7279928B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、複数の参加者による議論を分析するための議論分析装置及び議論分析方法に関する。
グループ学習や会議における議論を分析する方法として、ハークネス法(ハークネスメソッドともいう)が知られている(例えば、非特許文献1参照)。ハークネス法では、議論において発言を行った参加者(話者)の遷移を線で記録する。これにより、各参加者の議論への貢献や、他者との関係性を分析することができる。ハークネス法は、学生が主体的に学習を行うアクティブ・ラーニングにも効果的に適用できる。
Paul Sevigny、「Extreme Discussion Circles : Preparing ESL Students for "The Harkness Method"」、Polyglossia、立命館アジア太平洋大学言語教育センター、平成24年10月、第23号、p. 181-191
ハークネス法では記録者が常に議論を記録する必要があるため、記録者の負担が大きい。そこで集音装置によって参加者が発した音声を取得し、コンピュータによって音声を分析することによって、自動的に話者の遷移を検出することが考えられる。しかしながら、コンピュータは、参加者が話している際に発生した物体の衝突音や他の参加者の相槌等の不規則な音を参加者の発言として検出してしまい、話者の遷移を正しく検出できない場合がある。
本発明はこれらの点に鑑みてなされたものであり、議論における話者の遷移の検出精度を向上させることを目的とする。
本発明の第1の態様の議論分析装置は、複数の参加者が参加する議論における、前記複数の参加者それぞれの発話量を取得する情報取得部と、前記議論において、第1の時間範囲ごとに前記複数の参加者のうち前記発話量が最大である最大発話者を特定する最大発話者特定部と、前記第1の時間範囲ごとの前記最大発話者の変化に基づいて、前記複数の参加者の間で発生した話者の遷移を示す遷移情報を出力する出力部と、を有する。
前記出力部は、1つの時間範囲における前記最大発話者である第1の参加者と、前記1つの時間範囲に続く時間範囲における前記最大発話者である第2の参加者とが異なる場合に、前記第1の参加者から前記第2の参加者への前記遷移を示す前記遷移情報を出力してもよい。
前記議論分析装置は、前記遷移情報の時系列の類似性に基づいて、前記議論を1つ以上のフェーズに分割するフェーズ分割部をさらに有してもよい。
前記出力部は、前記第1の時間範囲よりも長い第2の時間範囲ごとに前記遷移の回数を示す前記遷移情報を出力し、前記フェーズ分割部は、前記遷移情報の時系列の類似性に基づいて前記第2の時間範囲ごとの前記遷移情報をクラスタリングし、生成した複数のクラスタに含まれている前記遷移情報に対応する前記第2の時間範囲の前記議論中の時刻に基づいて、前記議論を構成する前記1つ以上のフェーズを決定してもよい。
前記議論分析装置は、前記複数の参加者の各組み合わせにおける前記遷移の有無を示す複数のパターンを生成し、前記複数のパターンのうち、前記遷移情報との類似度が所定の条件を満たすパターンを選択するパターン選択部をさらに有してもよい。
前記パターン選択部は、選択した前記パターンの一部を変更した複数のサブパターンをさらに生成し、前記複数のサブパターンのうち、前記遷移情報との類似度が所定の条件を満たすサブパターンを選択してもよい。
前記出力部は、前記パターン選択部が選択した前記パターンに基づいて前記複数の参加者の役割を判定し、前記複数の参加者それぞれと前記複数の参加者それぞれの役割とを関連付けて出力してもよい。
前記出力部は、前記パターン選択部が選択した前記パターンに基づいて、前記複数の参加者の行動を文章として出力してもよい。
前記出力部は、前記複数の参加者のうち1人の参加者が参加した複数の前記議論のうち、所定の条件を満たす前記議論における前記1人の参加者の発話量に関する情報を、前記1人の参加者に関連付けて出力してもよい。
前記出力部は、所定のグループに属する前記複数の参加者が参加した複数の前記議論における前記複数の参加者の発話量に関する情報を、前記グループに関連付けて出力してもよい。
前記出力部は、第1の議論における前記グループに属する前記複数の参加者の発話量の順位と、前記第1の議論とは異なる第2の議論における前記グループに属する前記複数の参加者の発話量の順位とを関連付けて出力してもよい。
本発明の第2の態様の議論分析方法は、プロセッサが実行する、複数の参加者が参加する議論における、前記複数の参加者それぞれの発話量を取得するステップと、前記議論において、第1の時間範囲ごとに前記複数の参加者のうち前記発話量が最大である最大発話者を特定するステップと、前記第1の時間範囲ごとの前記最大発話者の変化に基づいて、前記複数の参加者の間で発生した話者の遷移を示す遷移情報を出力するステップと、を有する。
本発明によれば、議論における話者の遷移の検出精度が向上するという効果を奏する。
実施形態に係る議論分析システムの模式図である。 実施形態に係る議論分析システムのブロック図である。 議論分析装置が議論における話者の遷移を検出する方法の模式図である。 議論分析装置が議論を1つ以上のフェーズに分割する方法の模式図である。 議論分析装置が遷移情報に類似するパターンを選択する方法の模式図である。 議論分析装置が遷移情報に類似するパターンを選択する方法の模式図である。 ディスカッションレポート画面を表示している表示部の前面図である。 個人レポート画面を表示している表示部の前面図である。 コースレポート画面を表示している表示部の前面図である。 議論分析装置が行う議論分析方法のフローチャートを示す図である。
[議論分析システムSSの概要]
図1は、本実施形態に係る議論分析システムSSの模式図である。議論分析システムSSは、議論分析装置1と、通信端末2と、集音装置3とを含む。議論分析システムSSが含む通信端末2及び集音装置3の数は限定されない。議論分析システムSSは、その他のサーバ、端末等の機器を含んでもよい。
集音装置3は、異なる向きに配置された複数の集音部(マイクロフォン)を含むマイクロフォンアレイを備える。例えばマイクロフォンアレイは、地面に対する水平面において、同一円周上に等間隔で配置された8個のマイクロフォンを含む。このようなマイクロフォンアレイを用いることによって、議論分析装置1は、集音装置3を取り囲んでいる複数の参加者Uが発した音声に基づいて、いずれの参加者Uが話者(音源)であるかを特定することができる。集音装置3は、マイクロフォンアレイを用いて取得した音声をデータとして議論分析装置1へ送信する。
通信端末2は、通信を行うことが可能なコンピュータである。通信端末2は、例えばパーソナルコンピュータ等のコンピュータ端末、又はスマートフォン等の携帯端末である。通信端末2は、議論分析装置1に対して分析条件を設定し、また議論分析装置1から受信した情報を表示する。
議論分析装置1は、集音装置3によって取得された音声を用いて議論を分析するコンピュータである。議論分析装置1は、例えば単一のコンピュータ、又はコンピュータ資源の集合であるクラウドによって構成される。
議論分析装置1は、ローカルエリアネットワーク、インターネット等のネットワークNを介して、通信端末2及び集音装置3に有線又は無線で接続される。議論分析装置1は、通信端末2及び集音装置3のうち少なくとも一方に、ネットワークNを介さず直接接続されてもよい。
議論分析装置1が実行する処理の概要を以下に説明する。まず議論分析装置1は、複数の参加者Uが参加する議論における音声を、集音装置3から取得する。議論分析装置1は、取得した音声を用いて、議論における複数の参加者Uそれぞれの発話量を取得する。議論分析装置1は、所定の時間範囲ごとに、発話量が最大の参加者U(すなわち最大発話者)を特定する。そして議論分析装置1は、所定の時間範囲ごとの最大発話者の時系列の変化に基づいて、複数の参加者Uの間で発生した話者の遷移を示す遷移情報を出力する。
本実施形態に係る議論分析システムSSによれば、議論分析装置1は、発話量が最大の参加者Uの変化に基づいて話者の遷移を検出するため、物体の衝突音や参加者Uの相槌等の発言ではない音によって話者の遷移を検出することを抑えることができ、議論における話者の遷移の検出精度を向上できる。
[議論分析システムSSの構成]
図2は、本実施形態に係る議論分析システムSSのブロック図である。図2において、矢印は主なデータの流れを示しており、図2に示していないデータの流れがあってよい。図2において、各ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図2に示すブロックは単一の装置内に実装されてよく、あるいは複数の装置内に分かれて実装されてよい。ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてよい。
議論分析装置1は、制御部11と、記憶部12とを有する。制御部11は、情報取得部111と、最大発話者特定部112と、遷移検出部113と、フェーズ分割部114と、パターン選択部115と、出力部116とを有する。記憶部12は、議論情報記憶部121と、参加者情報記憶部122とを有する。
記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスクドライブ等を含む記憶媒体である。記憶部12は、制御部11が実行するプログラムを予め記憶している。記憶部12は、議論分析装置1の外部に設けられてもよく、その場合にネットワークを介して制御部11との間でデータの授受を行ってもよい。
議論情報記憶部121は、議論に関する情報を示す議論情報を記憶する。参加者情報記憶部122は、議論に参加する参加者に関する情報を示す参加者情報を記憶する。議論情報記憶部121及び参加者情報記憶部122は、それぞれ記憶部12上の記憶領域であってもよく、あるいは記憶部12上で構成されたデータベースであってもよい。
制御部11は、例えばCPU(Central Processing Unit)等のプロセッサであり、記憶部12に記憶されたプログラムを実行することにより、情報取得部111、最大発話者特定部112、遷移検出部113、フェーズ分割部114、パターン選択部115及び出力部116として機能する。制御部11の機能の少なくとも一部は、電気回路によって実行されてもよい。また、制御部11の機能の少なくとも一部は、ネットワーク経由で実行されるプログラムによって実行されてもよい。
通信端末2は、制御部21と、記憶部22と、表示部23とを有する。制御部21は、受信部211を有する。表示部23は、液晶ディスプレイ等、情報を表示可能な表示装置を含む。表示部23として人間による接触の位置を検出可能なタッチスクリーンを用いてもよい。
記憶部22は、ROM、RAM、ハードディスクドライブ等を含む記憶媒体である。記憶部22は、制御部21が実行するプログラムを予め記憶している。記憶部22は、通信端末2の外部に設けられてもよく、その場合にネットワークを介して制御部21との間でデータの授受を行ってもよい。
制御部21は、例えばCPU等のプロセッサであり、記憶部22に記憶されたプログラムを実行することにより、受信部211として機能する。制御部21の機能の少なくとも一部は、電気回路によって実行されてもよい。また、制御部21の機能の少なくとも一部は、ネットワーク経由で実行されるプログラムによって実行されてもよい。
本実施形態に係る議論分析装置1及び通信端末2は、図2に示す具体的な構成に限定されない。議論分析装置1及び通信端末2は、それぞれ1つの装置に限られず、2つ以上の物理的に分離した装置が有線又は無線で接続されることにより構成されてもよい。
[議論分析方法の説明]
本実施形態に係る議論分析装置1が行う議論分析方法を以下に説明する。複数の参加者は、議論を行う際に、1つの集音装置3を取り囲んで着席する。議論の参加者又は議論を分析する分析者は、通信端末2を操作することによって、分析条件の設定を行う。例えば分析条件は、分析対象とする議論の参加者の人数と、集音装置3を基準とした複数の参加者それぞれが位置する向き(すなわち、相対的な位置)とを示す情報である。議論分析装置1において、情報取得部111は、設定された分析条件を通信端末2から受信し、議論を識別するための識別情報(例えば議論ID)と関連付けて議論情報記憶部121に記憶させる。議論IDは、自動的に議論に割り振られてもよく、あるいは参加者又は分析者によって入力されてもよい。
次に参加者又は分析者は、議論を開始する際に、通信端末2を操作することによって、議論の開始を指示する。議論分析装置1において、情報取得部111は、議論の開始を指示する信号を通信端末2から受信すると、音声の取得を指示する信号を集音装置3へ送信する。集音装置3は、議論分析装置1から音声の取得を指示する信号を受信した場合に、音声の取得を開始する。
集音装置3は、複数の集音部においてそれぞれ音声を取得し、各集音部に対応する各チャネルの音声として内部に記録する。そして集音装置3は、取得した複数のチャネルの音声を、議論分析装置1へ送信する。集音装置3は、取得した音声を逐次送信してもよく、あるいは所定量又は所定時間の音声を送信してもよい。また、集音装置3は、取得の開始から終了までの音声をまとめて送信してもよい。議論分析装置1において、情報取得部111は、集音装置3から音声を受信し、議論IDと関連付けて議論情報記憶部121に記憶させる。
参加者又は分析者は、議論を終了する際に、通信端末2を操作することによって、議論の終了を指示する。議論分析装置1において、情報取得部111は、議論の終了を指示す信号を通信端末2から受信すると、音声の取得の終了を指示する信号を集音装置3へ送信する。集音装置3は、議論分析装置1から音声の取得の終了を指示する信号を受信した場合に、音声の取得を終了する。
以降の処理は、音声の取得が終了したことを契機として、又は分析者が通信端末2に対して所定の指示を行ったことを契機として行われる。また、以降の処理は、音声の取得が開始されたことを契機として逐次処理で行われてもよい。情報取得部111は、集音装置3から受信した複数チャネルの音声に基づいて音源定位を行う。音源定位は、情報取得部111が取得した音声に含まれる音源の向きを、時間ごと(例えば10ミリ秒~100ミリ秒ごと)に推定する処理である。情報取得部111は、時間ごとに推定した音源の向きを、議論情報記憶部121に記憶された分析条件が示す複数の参加者それぞれの向きと関連付ける。
情報取得部111は、取得した音声に基づいて音源の向きを特定可能であれば、MUSIC(Multiple Signal Classification)法、ビームフォーミング法等、既知の音源定位方法を用いることができる。
次に情報取得部111は、取得した音声及び推定した音源の向きに基づいて、議論において、所定の時間ごと(例えば10ミリ秒~100ミリ秒ごと)に、いずれの参加者が発話(発言)したかを判別する。情報取得部111は、1人の参加者が発話を開始してから終了するまでの連続した期間を発話期間として特定する。同じ時間に複数の参加者が発話を行った場合には、複数の参加者の発話期間の少なくとも一部同士が重複する。情報取得部111は、議論において特定した発話期間を、議論IDと関連付けて議論情報記憶部121に記憶させる。
情報取得部111は、議論の中で、特定の時間範囲を除外して、発話期間を特定してもよい。この場合に、参加者又は分析者は、議論の中で除外対象の時間範囲において、通信端末2又は集音装置3に対して所定の操作を行う。参加者又は分析者は、除外対象の時間範囲中にボタン操作等の操作を継続してもよく、あるいは除外対象の時間範囲の開始時及び終了時にそれぞれボタン操作等の操作を行ってもよい。通信端末2又は集音装置3は、除外対象の時間範囲を示す情報を、議論分析装置1へ送信する。
情報取得部111は、除外対象の時間範囲を示す情報を受信した場合に、取得した音声から該時間範囲を除外した音声を議論情報記憶部121に記憶させ、取得した音声から該時間範囲を除外した音声を用いて発話期間の特定を行う。これにより、参加者又は分析者は、機密事項等を話す時間範囲を、分析対象としないように設定できる。
本実施形態において、情報取得部111は、集音装置3が取得した音声に基づいて発話期間を特定しているが、その他の方法によって発話期間を特定してもよい。例えば情報取得部111は、音声通話又はビデオ通話(ビデオ会議、ビデオチャットともいう)において参加者が発した音声に基づいて、参加者の発話期間を特定してもよい。また、例えば情報取得部111は、記憶部12に予め記憶された発話期間を読み出して取得してもよい。
また、例えば情報取得部111は、議論における参加者の顔を含む画像に基づいて、参加者の発話期間を特定してもよい。この場合には、議論を行う複数の参加者の近傍に、集音装置3に代えて又は加えて撮像装置を配置する。情報取得部111は、議論の最中に撮像装置が撮像した複数の参加者の顔を含む時系列の画像を取得する。また、情報取得部111は、ビデオ通話において通信端末間で送受信される複数の参加者の顔を含む時系列の画像を取得してもよい。情報取得部111は、取得した画像に対して既知の顔認識処理を適用することによって、人間の顔の状態(例えば口が開いているか否か)に基づいて、複数の参加者それぞれが発話中か否かを判定し、複数の参加者それぞれの発話期間を特定する。
次に、議論分析装置1が議論における話者の遷移を検出する方法を説明する。図3は、議論分析装置1が議論における話者の遷移を検出する方法の模式図である。情報取得部111は、特定した発話期間に基づいて、議論における複数の参加者それぞれの時系列の発話量(発言量ともいう)を取得する。
具体的には、情報取得部111は、議論を所定の窓幅w1(例えば30秒)の第1フレーム(すなわち第1の時間範囲)に分割する。第1フレームは窓幅w1より短い所定のシフト幅s1(例えば10秒)ずつずらされており、隣接する第1フレーム同士の一部同士が時系列で互いに重複している。
そして情報取得部111は、第1フレームにおける参加者の発話期間の長さ(合計発話時間)を窓幅w1で割った値を、第1フレームごとの発話量として算出する。情報取得部111は、複数の参加者それぞれについて、議論の開始時刻から終了時刻までの第1フレームごとの発話量を算出する。情報取得部111は、議論における複数の参加者それぞれの第1フレームごとの発話量を示す情報を、議論IDと関連付けて議論情報記憶部121に記憶させる。
図3の上段の図は、複数の参加者の時系列の発話量のグラフGを示している。グラフGは、複数の参加者の発話量を積み上げグラフとして表している。グラフGの横軸は時間、縦軸は発話量である。グラフGの領域には、複数の参加者それぞれに応じて異なる模様が表されている。
さらに情報取得部111は、取得した発話期間及び発話量に基づいて、複数の参加者それぞれの割り込み量及び盛り上げ量を算出する。具体的には、情報取得部111は、2人の参加者の発話期間が時系列で互いに重複している場合に、発話期間が重複している部分の長さを、該2人の参加者のうち発話期間の開始時刻が遅い方の参加者の割り込み量として算出する。情報取得部111は、議論の開始から終了までの複数の参加者それぞれの割り込み量を算出する。
また、情報取得部111は、1人の参加者の1つの発話期間の前及び後それぞれの所定時間(例えば20秒間)における複数の参加者全員の発話量を合計し、該発話期間の後の合計発話量から該発話期間の前の合計発話量を減算した量(すなわち、該発話期間の前から後の合計発話量の増分)を、盛り上げ量として算出する。情報取得部111は、議論の開始から終了まで複数の参加者それぞれの盛り上げ量を算出する。情報取得部111は、1人の参加者の全ての発話期間の数のうち、盛り上げ量が0より大きい発話期間の回数を、盛り上げ回数として算出してもよい。情報取得部111は、複数の参加者それぞれの割り込み量及び盛り上げ量(又は盛り上げ回数)を、議論IDと関連付けて議論情報記憶部121に記憶させる。
最大発話者特定部112は、情報取得部111が取得した発話量に基づいて、第1フレームごとに複数の参加者のうち発話量が最大である最大発話者を特定する。最大発話者特定部112は、議論の最初の第1フレームから最後の第1フレームまでの最大発話者の配列を出力する。
図3の中段の図は、時系列の最大発話者を帯Sとして示している。時系列の最大発話者の帯Sは、時系列の発話量のグラフGに基づいて生成されており、横軸はグラフGの時間に対応している。最大発話者の帯Sには、複数の参加者それぞれに応じて異なる模様が表されており、グラフGの領域の模様に対応している。
遷移検出部113は、最大発話者特定部112が特定した第1フレームごとの最大発話者の変化に基づいて、複数の参加者の間で発生した話者の遷移を検出する。具体的には、議論を所定の窓幅w2の第2フレーム(すなわち第2の時間範囲)に分割する。第2フレームの窓幅w2は、第1フレームの窓幅w1よりも長い。すなわち、第2フレームは、複数の第1フレームを含む。窓幅w2は、窓幅w1の所定の倍数(例えば窓幅w1の100倍)として定義されてもよく、あるいは所定の時間(例えば3000秒)として定義されてもよい。
第2フレームは窓幅w2より短い所定のシフト幅s2ずつずらされており、隣接する2つの第2フレームの一部同士が時系列で互いに重複している。シフト幅s2は、窓幅w1の所定の倍数(例えば窓幅w1の5倍)として定義されてもよく、あるいは所定の時間(例えば150秒)として定義されてもよい。
そして遷移検出部113は、1つの第1フレームにおける最大発話者である第1の参加者と、該第1フレームに続く第1フレームにおける最大発話者である第2の参加者とが異なる場合に、該第1の参加者から該第2の参加者への遷移を検出する。遷移検出部113は、1つの第2フレームについて、該第2フレームの最初の第1フレームから最後の第1フレームまで、遷移の検出を繰り返し、参加者の組み合わせ(すなわち第1の参加者及び第2の参加者の組み合わせ)ごとに検出した遷移の回数を示す遷移行列を生成する。複数の参加者の数をDとすると、遷移行列はD×Dの行列となる。
さらに遷移検出部113は、議論の最初の第2フレームから最後の第2フレームまで、遷移行列の生成を繰り返す。第2フレームの数をNとすると、遷移検出部113は、N個の遷移行列を生成する。遷移検出部113は、第2フレームごとに生成した遷移行列を示す情報を、遷移情報として議論情報記憶部121に記憶させる。
図3の下段の図は、例示的な遷移行列Mを示している。図3の例では、参加者はU1、U2及びU3の3人であり、時系列の最大発話者の帯Sに基づいて複数の遷移行列Mが生成されている。遷移行列Mの行は遷移元の参加者を示しており、列は遷移先の参加者を示している。このように、議論分析装置1は、最大発話者の変化に基づいて話者の遷移を検出するため、物体の衝突音や参加者の相槌等の発言ではない音によって話者の遷移を検出することを抑えることができ、議論における話者の遷移の検出精度を向上できる。
次に、議論分析装置1が議論を1つ以上のフェーズに分割する方法を説明する。図4は、議論分析装置1が議論を1つ以上のフェーズに分割する方法の模式図である。フェーズ分割部114は、第2フレームごとに生成された遷移情報(遷移行列)の時系列の類似性に基づいて、議論を1つ以上のフェーズに分割する。ここでフェーズ分割部114は、1つのフェーズの中で遷移情報が類似するように、すなわち1つのフェーズに含まれる2つの第2フレームの遷移情報間の類似性が、異なる2つのフェーズに含まれる2つの第2フレームの遷移情報間の類似性よりも高くなるように、議論を1つ又は複数のフェーズに分割する。フェーズ分割部114は、遷移情報の時系列の類似性に基づいて議論を1つ以上のフェーズに分割することが可能な既知の方法を用いる。
例えばフェーズ分割部114は、以下に説明するポアソン混合モデルを用いたクラスタリングを行うことによって、議論を1つ以上のフェーズに分割する。まずフェーズ分割部114は、遷移検出部113が生成した遷移行列を取得する。ここで、計算のために、フェーズ分割部114は、第2フレームごとの遷移行列の要素を縦一列に並べることによって、参加者の組み合わせごとの遷移の回数を要素とするD×1の縦ベクトルに変換するする。これにより、フェーズ分割部114は、D次元の非負ベクトルが時系列でN個並んだD×Nの行列を得る。
各参加者の組み合わせは異なる遷移の傾向を有するため、遷移行列を変換したD×Nの行列は、式(1)に示すポアソン分布の混合分布となる。
Figure 0007279928000001
ここで、Poiはポアソン分布の関数を表し、xは参加者の組み合わせごとの遷移が起こった回数(すなわち遷移行列の各要素)を表し、λは参加者の組み合わせごとの遷移が起こる平均回数を表し、dは縦ベクトルの次元(1~D)を表す。
議論をK個(Kは2以上の所定の数)のクラスタに分けることを考えると、上述のλの値のセットがK個できる。これにより、フェーズ分割部114は、式(2)のようなK個のポアソン分布の混合分布を生成する。
Figure 0007279928000002
ここで、フェーズ分割部114は、N個の遷移行列のうち、第n番目の遷移行列がいずれのクラスタに所属するかを示す行列である隠れ変数znk(znkは0又は1)を定義する。隠れ変数znkは、第n番目の遷移行列が第kクラスタに所属するときのみ1となり、それ以外のとき0となる。
これにより、フェーズ分割部114は、式(2)の分布を式(3)に示す1つの分布にまとめる。
Figure 0007279928000003
フェーズ分割部114は、式(3)のモデルを用いてベイズ推定を行うことによって、xとなる確率が所定の条件(例えば、xとなる確率が最大値であること)を満たすパラメータλ及びzを算出する。これにより、フェーズ分割部114は、N個の遷移行列それぞれがK個のクラスタのうちいずれに割り当てられるかを判定する。
このとき、フェーズ分割部114は、K個のクラスタのうち、割り当てられた遷移行列の数が所定の閾値以下のクラスタを削除してもよい。この場合に、削除されたクラスタに割り当てられた遷移行列は、該クラスタの前又は後のクラスタに割り当てられる。その結果、最終的に生成されるクラスタの数は、K個以下となる。これにより、フェーズ分割部114は、割り当てられた遷移行列が多い、クラスタだけを残して議論を1つ以上のフェーズに分割できる。
本実施形態において、フェーズ分割部114は、時系列を考慮せずに複数の遷移行列を複数のクラスタに割り当てているため、理論的には複数の遷移行列の時系列とクラスタの時系列とが一致しない可能性がある。しかしながら、遷移検出部113は、第2フレームを時系列で重複させながらシフトさせているため、検出された遷移の回数は時系列の移動平均となっている。そのため、時間的に近い複数の遷移行列は、互いに類似する。これにより、通常の状況では、複数の遷移行列の時系列と、フェーズ分割部114が生成した複数のクラスタの時系列とは一致する。
フェーズ分割部114は、複数のクラスタを生成した場合に、複数のクラスタそれぞれに含まれている遷移行列に対応する第2フレームの議論中の時刻に基づいて、議論を複数のフェーズに分割する。具体的には、フェーズ分割部114は、1つのクラスタに含まれている遷移行列に対応する第2フレームのうち最後の第2フレームの終了時刻を、フェーズの終了時刻として特定することによって、議論を構成する複数のフェーズを決定する。
また、フェーズ分割部114は、1つのクラスタを生成した場合に、議論の全体を1つのフェーズとして決定する。フェーズ分割部114は、決定した議論のフェーズを示す情報を、議論の識別情報と関連付けて議論情報記憶部121に記憶させる。
単純に議論を時間によって前半、中盤、後半のようなフェーズに分割すると、議論の内容が考慮されないため、議論が分割される位置は実態に即さない。それに対して本実施形態に係る議論分析装置1は、遷移情報の時系列の類似性に基づいて議論を1つ以上のフェーズに分割するため、議論を実態に即した単位で分割できる。
図4の下段の図は、例示的なフェーズ分割部が決定した議論のフェーズを示している。図4の例では、議論はフェーズPH1、PH2及びPH3の3つに分割されている。フェーズPH1、PH2及びPH3それぞれにおいて話者の遷移の傾向が類似している。議論は3つ以外のフェーズに分割されてもよい。
次に、議論分析装置1が遷移情報に類似するパターンを選択する方法を説明する。図5、図6は、議論分析装置1が遷移情報に類似するパターンを選択する方法の模式図である。まずパターン選択部115は、フェーズ分割部114が決定した議論のフェーズごとに、遷移検出部113が生成した遷移行列M(遷移情報)を取得する。フェーズごとの遷移行列Mは、例えばフェーズに含まれる遷移行列Mの統計値(平均値、中央値等)であってもよく、あるいはフェーズに含まれる所定の位置(最初、中央又は最後等)の遷移行列Mであってもよい。
パターン選択部115は、複数の参加者の各組み合わせにおける遷移の有無を示す複数のパターンを生成する。ここでは、2人の参加者の組み合わせにおいて遷移が有る又は相対的に多い場合を該2人の参加者が「接続されている」と表現し、遷移が無い又は相対的に少ない場合を該2人の参加者が「接続されていない」と表現する。パターン選択部115は、複数の参加者の数をDとすると、中心となる1人がその他の全員と接続されているパターンと、i人(i=2~D)が相互に接続されているパターンとからなるD種類のパターンを生成する。
図5の例では、パターン選択部115が生成するパターンは、中心となる1人がその他の全員と接続されているパターンP1と、2人が相互に接続されているパターンP2と、3人が相互に接続されているパターンP3とからなる。図5に図示していないが、パターンP1は中心となる1人をU1、U2及びU3に変えたパターンを含み、パターンP2は相互に接続される2人をU1、U2及びU3のうち2人の全ての組み合わせに変えたパターンを含む。
パターン選択部115は、生成した複数のパターンそれぞれの行列を生成する。パターンの行列は、接続されている参加者の組み合わせの要素を1とし、接続されていない参加者の組み合わせの要素を0とした遷移行列である。また、パターン選択部115は、フェーズごとの遷移行列の各要素を、0~1の範囲に正規化する。
そしてパターン選択部115は、生成した複数のパターンそれぞれの行列と、正規化したフェーズごとの遷移行列との間の類似度を算出する。類似度は、例えば行列間距離であるが、その他の値を用いてもよい。そしてパターン選択部115は、複数のパターンのうち、算出した類似度が所定の条件(例えば行列間距離が最小)を満たすパターンを選択する。パターン選択部115は、フェーズ分割部114が決定した1つ以上のフェーズそれぞれについて、パターンを選択する。
さらにパターン選択部115は、フェーズごとに選択したパターンに変更を加えた複数のサブパターンを生成する。具体的には、パターン選択部115は、選択したパターンそのものに加えて、選択したパターンに含まれているいずれか1つの接続を削除したパターン、及び選択したパターンに含まれていない1つの接続を追加したパターンを、サブパターンとして生成する。パターン選択部115は、選択したパターンにその他の変更を加えたサブパターンを生成してもよい。
図6は、図5においてパターンP1が選択された場合の例示的なサブパターンを示している。この場合に、パターン選択部115が生成するサブパターンは、パターンP1そのものであるサブパターンSP1と、パターンP1に含まれている1つの接続を削除したサブパターンSP2と、パターンP1に含まれていない1つの接続を追加したサブパターンSP3とからなる。図6において、削除された接続は破線で表されており、追加された接続は一点鎖線で表されている。サブパターンSP2は別の接続を削除したパターンを含み、サブパターンSP3は別の接続を追加したパターンを含む。
パターン選択部115は、生成した複数のサブパターンそれぞれの行列を生成する。サブパターンの行列は、接続されている参加者の組み合わせの要素を1とし、接続されていない参加者の組み合わせの要素を0とした遷移行列である。また、パターン選択部115は、フェーズごとの遷移行列の各要素を、0~1の範囲に正規化する。
そしてパターン選択部115は、生成した複数のサブパターンそれぞれの行列と、正規化したフェーズごとの遷移行列との間の類似度を算出する。類似度は、例えば行列間距離であるが、その他の値を用いてもよい。そしてパターン選択部115は、複数のサブパターンのうち、算出した類似度が所定の条件(例えば行列間距離が最小)を満たすサブパターンを選択する。パターン選択部115は、フェーズ分割部114が決定した1つ以上のフェーズそれぞれについて、サブパターンを選択する。
パターン選択部115は、選択したパターン及びサブパターンを示す情報を、議論の識別情報と関連付けて議論情報記憶部121に記憶させる。パターン選択部115は、サブパターンの選択を行わず、パターンのみを選択して議論情報記憶部121に記憶させてもよい。
議論における話者の遷移をグラフ等でそのまま表示するのみでは、遷移の傾向の解釈は分析者に任されるため、分析者によって解釈が異なってしまう場合がある。それに対して本実施形態に係る議論分析装置1は、遷移情報をパターン及びサブパターンと比較して選択することによって、複数の参加者を遷移の傾向によって自動的に分類することができ、また複数の参加者の関係性を自動的に文章として出力することが可能になる。
出力部116は、情報取得部111、遷移検出部113、フェーズ分割部114及びパターン選択部115が議論情報記憶部121に記憶させた情報に基づいて、議論に関する情報を出力する。例えば出力部116は、図7、図8及び図9に示す画面を通信端末2の表示部23に表示させることによって議論に関する情報を出力する。
出力部116は、情報取得部111、遷移検出部113、フェーズ分割部114及びパターン選択部115の処理が終了したことを契機として、又は分析者が通信端末2に対して所定の指示を行ったことを契機として、議論情報記憶部121に記憶されている情報に基づいて議論に関する情報を表示するための表示情報を生成し、通信端末2へ送信する。通信端末2の受信部211は、議論分析装置1から受信した表示情報に基づいて、図7、図8及び図9に示す画面を表示部23上に表示する。
図7は、ディスカッションレポート画面Aを表示している表示部23の前面図である。ディスカッションレポート画面Aは、1つの議論に関する情報を表示する画面である。ディスカッションレポート画面Aは、サマリー情報A1と、参加者情報A2と、フェーズ情報A3と、総合評価情報A4とを含む。サマリー情報A1は、議論における時系列の発話量の概要とともに、分析条件として設定された複数の参加者の配置を示す情報である。発話量の概要は、例えば複数の参加者の合計発話量が最大のフェーズの時間範囲を表す文字列である。
参加者情報A2は、所定の条件を満たす参加者を示す情報である。例えば参加者情報A2は、複数の参加者のうち、発話量が最大の参加者、割り込み量が最大の参加者、及び盛り上げ量(盛り上げ回数でもよい)が最大の参加者を表す。さらに、参加者情報A2は、パターン選択部115が選択されたパターンにおいて接続されている参加者を、議論の中心になった人物として表す。
フェーズ情報A3は、議論におけるフェーズの時間範囲A31と、フェーズごとの参加者の役割A32とを含む。フェーズの時間範囲A31は、議論における複数の参加者の発話量の積み上げグラフ上に重畳された矢印によって、各フェーズの時間範囲を示す情報である。
参加者の役割A32は、パターン選択部115が選択したパターンに基づいて判定された複数の参加者それぞれの役割を示す情報である。役割は、議論における参加者の行動の傾向であり、例えばリーダー又はフォロワーである。
具体的には、参加者の役割A32を表示する場合に、出力部116は、パターン選択部115が選択したパターンに基づいて、議論のフェーズごとに複数の参加者それぞれの役割を判定する。例えば出力部116は、パターン選択部115が選択したパターンにおいて互いに接続されている複数の参加者のうち、発話量が最大の参加者を「リーダー」の役割と判定し、その他の参加者を「フォロワー」の役割と判定する。また、出力部116は、パターン選択部115が選択したパターンにおいて接続されていない参加者を「役割なし」と判定する。出力部116は、パターン選択部115が選択したパターンに基づいて、その他の役割を判定してもよい。
そして出力部116は、フェーズごとの複数の参加者それぞれの役割を示す情報を、通信端末2へ送信する。通信端末2の受信部211は、議論分析装置1から受信したフェーズごとの複数の参加者それぞれの役割を、フェーズの時間範囲A31の近傍に参加者の役割A32として表示させる。図7の例では、フェーズの時間範囲A31の下方において、リーダーと判定された参加者に関連付けて実線が表示され、フォロワーと判定された参加者に関連付けて破線が表示されている。参加者の役割A32は、その他の方法によって参加者の役割を表してもよい。これにより、分析者は、議論分析装置1が遷移の傾向のパターンに基づいて自動的に判定した複数の参加者それぞれの役割を知ることができる。
総合評価情報A4は、パターン選択部115が選択したパターンに基づいて生成された、議論のフェーズごとの参加者の行動を文章として表す情報である。具体的には、総合評価情報A4を表示する場合に、出力部116は、パターン選択部115が選択したパターンを取得する。そして出力部116は、所定の規則に基づいて、パターンに対応する文章を生成する。所定の規則は、記憶部12に予め定義された、パターンに対応するテンプレートである。
例えばパターン選択部115が選択したパターンにおいて、参加者U1及び参加者U2が互いに接続されており、参加者U1の発話量が参加者U2の発話量よりも大きい場合に、出力部116は、「U1を中心に、U2も参加して議論が行われました。」という文章を生成する。記憶部12は、パターン選択部115が生成し得る各パターンに対応するテンプレートを予め記憶している。ここに示したパターンに基づいて文章を生成する方法は一例であり、出力部116は、パターン選択部115が生成し得る各パターンに基づいて文章を生成可能な既知の方法を用いることができる。
これにより、分析者は、議論分析装置1が遷移の傾向のパターンに基づいて自動的に生成した複数の参加者の関係性を文章として知ることができ、該関係性の理解が容易になる。
さらに出力部116は、パターン選択部115が選択したパターンに加えてサブパターンに基づいて、文章を生成してもよい。例えばパターン選択部115が選択したパターンにおいて参加者U1、参加者U2及び参加者U3が互いに接続されており、パターン選択部115が選択したサブパターンにおいて、参加者U3と参加者U1との間の接続が削除された場合には、「すべてのメンバーが議論に参加しました。発言のやり取りは主にU1とU2を中心に行われました。」という文章を生成する。
これにより、分析者は、議論分析装置1が遷移の傾向のパターンをさらに細分化したサブパターンに基づいて自動的に生成した複数の参加者の関係性を文章として知ることができる。
図8は、個人レポート画面Bを表示している表示部23の前面図である。個人レポート画面Bは、1人の表示対象の参加者が過去に参加した複数の議論に関する情報を表示する画面である。個人レポート画面Bは、参加者の傾向情報B1と、参加者の経過情報B2と、議論情報B3とを含む。
参加者の傾向情報B1は、表示対象の参加者の特性と、表示対象の参加者の議論における行動とに基づいて生成された文章として、表示対象の参加者の傾向を表す情報である。具体的には、参加者情報記憶部122は、参加者の特性を示す情報を予め記憶している。参加者の特性を示す情報は、例えば参加者に対して行われた心理テストの結果である。
参加者の傾向情報B1を表示する場合に、出力部116は、参加者の特性を示す情報と、参加者が過去に参加した複数の議論についてパターン選択部115が選択したパターンとを取得する。出力部116は、パターン選択部115が選択したパターンに基づいて、上述の方法により、複数の議論それぞれにおける参加者の役割(すなわち行動の傾向)を判定する。出力部116は、判定した役割のうち1つの役割(例えば最も頻度が高い役割)を選択する。そして出力部116は、所定の規則に基づいて、参加者の特性と、選択した参加者の役割とに対応する文章を生成する。所定の規則は、記憶部12に予め定義された、参加者の特性及び参加者の役割に対応するテンプレートである。
例えば参加者の特性が高い独自性を示しており、選択した参加者が「役割なし」である場合に、出力部116は、「自分の独自性を出すのが得意な一方で、人に冷たく接しがちなところがあります。」という文章を生成する。記憶部12は、様々な参加者の特性及び参加者の役割に対応するテンプレートを予め記憶している。ここに示した参加者の特性及び参加者の役割に基づいて文章を生成する方法は一例であり、出力部116は、参加者の特性及び参加者の役割に基づいて文章を生成可能な既知の方法を用いることができる。
これにより、分析者は、予め収集された参加者の特性と、参加者の議論における行動の傾向とを対比させて認識することができる。
参加者の経過情報B2は、表示対象の参加者が過去に参加した複数の議論における、表示対象の参加者の発話量、割り込み量、盛り上げ量及び役割を示す情報である。図8の例では、参加者の経過情報B2は、議論ごとの参加者の発話量を棒グラフとして表し、該議論の全ての参加者の平均発話量を該棒グラフの上に重畳して表している。また、参加者の経過情報B2は、参加者が所定の役割(例えばリーダー又はフォロワー)となった議論の回次を表している。また、参加者の経過情報B2は、参加者の発話量、割り込み量及び盛り上げ量がそれぞれ所定の条件を満たした議論の回次を表している。
また、参加者の経過情報B2は、発話量が所定の条件を満たした議論のフェーズ(例えば参加者の平均発話量が最も高いフェーズ)を表している。また、参加者の経過情報B2は、表示対象の参加者が特定の他の参加者と同じ議論に参加している際に表示対象の参加者の発話量が増加した場合の、該他の参加者を表している。また、参加者の経過情報B2は、第1の議論(例えば最初の議論)における発話量と比較して、第1の議論とは異なる第2の議論(例えば最後の議論)における発話量が増加しているか否かを表している。
これにより、分析者は、1人の参加者について、過去に参加した議論における行動の傾向を一覧で見ることができる。ここに示した参加者の経過情報B2は一例であり、参加者が過去に参加した複数の議論における、参加者の発話量、割り込み量、盛り上げ量及び役割に基づいてその他の情報を表してもよい。
議論情報B3は、表示対象の参加者が過去に参加した複数の議論のうち、所定の条件を満たす議論における表示対象の参加者の発話量を示す情報である。図8の例では、議論情報B3は、所定の条件を満たす議論それぞれについての発話量のグラフを含む。議論情報B3のグラフは、斜線の領域によって1つの議論における表示対象の参加者の発話量の時系列の変化を表しており、白抜きの領域によって該議論における全ての参加者の合計発話量の時系列の変化を表している。
図8の例において、議論情報B3に表示する議論は、時間順(回次順)に複数の議論である。これにより、分析者は、参加者の発話量の傾向が時間順でどのように変わったかを一覧で見ることができる。
また、議論情報B3に表示する議論は、互いに類似する複数の議論又は互いに類似しない複数の議論であってもよい。この場合に、出力部116は表示対象の参加者が参加した複数の議論の複数の遷移行列の間の行列間距離を算出し、行列間距離が所定値よりも小さい複数の議論を互いに類似する複数の議論として特定し、又は行列間距離が所定値よりも大きい複数の議論を互いに類似しない複数の議論として特定する。これにより、分析者は、参加者が参加している議論のうち、話者の遷移の傾向が似ている又は似ていない議論における参加者の発話量の傾向を一覧で見ることができる。
図9は、コースレポート画面Cを表示している表示部23の前面図である。コースレポート画面Cは、表示対象のグループに属する複数の参加者が過去に参加した複数の議論に関する情報を表示する画面である。例えばグループは、同一のコースを受講している複数の参加者、同一の講師による指導を受けている複数の参加者等である。コースレポート画面Cは、参加者の分布情報C1と、コースの経過情報C2と、コースの統計情報C3と、順位情報C4とを含む。
参加者の分布情報C1は、表示対象のグループに属する複数の参加者の発話量及び割り込み量の分布を示す情報である。図9の例では、分布情報C1は、横軸を発話量とし、縦軸を割り込み量として、表示対象のグループに属する複数の参加者の発話量及び割り込み量の組み合わせをプロットとして表している。
これにより、分析者は、表示対象のグループに属する複数の参加者の傾向を知ることができる。例えば分布情報C1の右上の領域にプロットされた参加者は、発話量及び割り込み量がともに大きいため、議論をリードする傾向がある。分布情報C1の左上の領域にプロットされた参加者は、割り込み量が大きいが発話量が小さいため、議論において他人に同調する傾向がある。分布情報C1の右下の領域にプロットされた参加者は、発話量が大きいが割り込み量が小さいため、議論において行儀が良い傾向がある。分布情報C1の左下の領域にプロットされた参加者は、発話量及び割り込み量がともに小さいため、議論への参加に消極的である傾向がある。
コースの経過情報C2は、表示対象のグループに属する複数の参加者が過去に参加した複数の議論における発話量、割り込み量及び盛り上げ量の経過を示す情報である。図9の例では、コースの経過情報C2は、表示対象のグループに属する複数の参加者が過去に参加した複数の議論のうち、前期、中期及び後期それぞれにおける発話量、割り込み量及び盛り上げ量を積み上げた棒グラフを表している。例えば出力部116は、複数の議論を最初の議論から最後の議論まで順に1/3ずつを前期、中期及び後期に分類し、各分類において合計又は平均の発話量、割り込み量及び盛り上げ量を算出して出力する。これにより、分析者は、表示対象のグループにおける議論の傾向の変化を知ることができる。
コースの統計情報C3は、表示対象のグループに属する複数の参加者の発話量、割り込み量、盛り上げ量及びそれらの合計量(総合活動量)の統計値を示す情報である。図9の例では、コースの統計情報C3は、横軸を発話量、割り込み量、盛り上げ量及び総合活動量とし、縦軸を参加者の人数として棒グラフを表している。さらにコースの統計情報C3は、発話量、割り込み量、盛り上げ量及び総合活動量それぞれの平均値に該当する棒グラフの表示態様(例えば色)を、他の棒グラフの表示態様とは異なるように表している。これにより、分析者は、表示対象のグループに属する複数の参加者について、発話量、割り込み量、盛り上げ量及び総合活動量ごとの人数の分布と、発話量、割り込み量、盛り上げ量及び総合活動量の統計値とを知ることができる。
順位情報C4は、表示対象のグループに属する複数の参加者の発話量の順位を示す情報である。図9の例では、順位情報C4は、第1の議論(例えば最初の議論)における複数の参加者の一覧を該複数の参加者の発話量に応じて順位付けして(例えば順位の昇順で)表すとともに、第1の議論とは異なる第2の議論(例えば最後の議論)における複数の参加者の一覧を該複数の参加者の発話量に応じて順位付けして(例えば順位の昇順で)表す。
また、順位情報C4は、第1の議論においてある参加者に対応する位置と、第2の議論において該参加者に対応する位置とを結ぶ線を表してもよい。さらに順位情報C4は、第1の議論と比較した第2の議論の参加者の順位の変動を、変動の量を示す数値及び変動の向き(上又は下)を示す矢印によって表してもよい。これにより分析者は、複数の参加者それぞれの発話量が2つの議論の間でどのように変わったかを知ることができる。
図7~図9に示したディスカッションレポート画面A、個人レポート画面B及びコースレポート画面Cは一例であり、情報の内容、外観及び配置は変更されてもよい。また、図7~図9に示したディスカッションレポート画面A、個人レポート画面B及びコースレポート画面Cのうち少なくとも一部は、1つの画面に統合されてもよく、さらに複数の画面に分割されてもよい。
出力部116は、画面の表示に限らず、プリンタを用いて紙に印刷すること、記憶媒体にデータとして記憶させること、又は通信回線を介して外部へ送信することによって、議論に関する情報を出力してもよい。
出力部116は、分析者(閲覧者)ごとに内容を切り替えて、議論に関する情報を出力してもよい。この場合に、議論分析装置1は、分析者ごとに出力内容の設定を予め受け付け、分析者に関連付けて設定情報として記憶部12に記憶させる。出力内容の設定は、例えば出力内容を示すプラグインの選択によって行われる。図7の例では、サマリー情報A1、参加者情報A2、フェーズ情報A3及び総合評価情報A4の4つのプラグインが定義されている。分析者又は議論分析装置1の管理者は、分析者に対して出力させるプラグインを選択することによって、出力内容を設定する。
議論分析装置1において、出力部116は、議論に関する情報を出力する際に、出力対象の分析者を特定し、該分析者に関連付けられた設定情報を取得する。そして出力部116は、議論情報記憶部121に記憶された情報に基づいて、設定情報(プラグイン)が示す内容を出力する。これにより、議論分析装置1は、分析者ごとに異なる種類の情報を出力することができる。
[議論分析方法のフロー]
図10は、議論分析装置1が行う議論分析方法のフローチャートを示す図である。議論分析装置1において、情報取得部111は、議論における複数の参加者それぞれの時系列の発話量を取得する(S11)。情報取得部111は、議論における複数の参加者それぞれの第1フレームごとの発話量を示す情報を、議論IDと関連付けて議論情報記憶部121に記憶させる。
このとき、情報取得部111は、集音装置3が取得した議論の音声に対して、音源定位を行い、複数の参加者それぞれの発話期間を特定することによって、発話量を取得する。別の方法として、情報取得部111は、記憶部12に予め記憶された発話期間を読み出して取得することによって、発話量を取得してもよい。あるいは情報取得部111は、議論における参加者の顔を含む画像に基づいて、参加者の発話期間を特定することによって、発話量を取得してもよい。
最大発話者特定部112は、情報取得部111が取得した発話量に基づいて、第1フレームごとに複数の参加者のうち発話量が最大である最大発話者を特定する(S12)。遷移検出部113は、最大発話者特定部112が特定した第1フレームごとの最大発話者の変化に基づいて、複数の参加者の間で発生した話者の遷移を検出する(S13)。遷移検出部113は、第2フレームごとに生成した遷移行列を示す情報を、遷移情報として議論情報記憶部121に記憶させる。
フェーズ分割部114は、遷移検出部113が検出した遷移を示す遷移情報の時系列の類似性に基づいて、議論を1つ以上のフェーズに分割する(S14)。フェーズ分割部114は、決定した議論のフェーズを示す情報を、議論の識別情報と関連付けて議論情報記憶部121に記憶させる。
パターン選択部115は、複数の参加者の各組み合わせにおける遷移の有無を示す複数のパターンを生成する。パターン選択部115は、生成した複数のパターンそれぞれの行列と、正規化したフェーズごとの遷移行列(遷移情報)との間の類似度を算出する。そしてパターン選択部115は、複数のパターンのうち、フェーズ分割部114が決定した1つ以上のフェーズそれぞれについて、算出した類似度が所定の条件を満たすパターンを選択する(S15)。
さらにパターン選択部115は、フェーズごとに選択したパターンに変更を加えたサブパターンを選択してもよい。パターン選択部115は、選択したパターン及びサブパターンを示す情報を、議論の識別情報と関連付けて議論情報記憶部121に記憶させる。
出力部116は、情報取得部111、遷移検出部113、フェーズ分割部114及びパターン選択部115が議論情報記憶部121に記憶させた情報に基づいて、議論に関する情報を出力する(S16)。例えば出力部116は、図7、図8及び図9に示す画面を通信端末2の表示部23に表示させることによって議論に関する情報を出力する。
[本実施形態の効果]
単純に音が発生した向きに基づいて自動的に話者の遷移を検出すると、参加者が話している際に発生した発言ではない音を参加者の発言として検出してしまい、話者の遷移を正しく検出できない場合がある。すなわち、議論の音声の中に物体の衝突音や他の参加者の相槌等の短い音が含まれている場合に、短い音を分析に必要な音か否かを判別するのは困難である。例えば隣接するグループの声が背景雑音として多く混ざる状況で、参加者がペンで机を叩くなどの音を出した場合、分離音には背景雑音が混ざる。この場合に、ペンの音を「音声ではないから不要」と判別するのは難しい。また、音の長さによって短い音を除外しようとしても、「うーん」や「ほー」等の長い相槌を除外することができず、逆に「違う」や「確かに」等の重要な意味のある発言を除外してしまうおそれがある。
それに対して、本実施形態に係る議論分析装置1は、発話量が最大の参加者Uの変化に基づいて話者の遷移を検出する。そのため、議論分析装置1は、発言ではない音によって話者の遷移を検出することを抑えることができ、議論における話者の遷移の検出精度を向上できる。
本実施形態に係る議論分析システムSSは、学生が行うアクティブ・ラーニングの分析や、組織における会議の分析に、好適に用いられる。また、議論分析システムSSは、組織における採用活動において、候補者同士で行われるグループディスカッションの分析にも好適に用いられる。従来、これらの議論には多数の参加者がいるため、議論の分析のために非常に大きな時間及び費用のコストが掛かっていた。それに対して、議論分析装置1は、これらの議論を自動的にかつ高い精度で分析できるため、分析のためのコストを大幅に削減できる。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
議論分析装置1のプロセッサは、図10に示す議論分析方法に含まれる各ステップ(工程)の主体となる。すなわち、議論分析装置1のプロセッサは、図10に示す議論分析方法を実行するためのプログラムを記憶部から読み出し、該プログラムを実行して議論分析装置1の各部を制御することによって、図10に示す議論分析方法を実行する。図10に示す議論分析方法に含まれるステップは一部省略されてもよく、ステップ間の順番が変更されてもよく、複数のステップが並行して行われてもよい。
SS 議論分析システム
1 議論分析装置
11 制御部
111 情報取得部
112 最大発話者特定部
113 遷移検出部
114 フェーズ分割部
115 パターン選択部
116 出力部

Claims (12)

  1. 複数の参加者が参加する議論における、前記複数の参加者それぞれの発話量を取得する情報取得部と、
    前記議論において、第1の時間範囲ごとに前記複数の参加者のうち前記発話量が最大である最大発話者を特定する最大発話者特定部と、
    前記第1の時間範囲ごとの前記最大発話者の変化に基づいて、前記複数の参加者の間で発生した話者の遷移を示す遷移情報を生成する遷移検出部と、
    前記遷移情報の時系列の類似性に基づいて、前記議論を1つ以上のフェーズに分割するフェーズ分割部と、
    前記フェーズ分割部が前記議論を分割することにより生成された前記フェーズを示す情報を出力する出力部と、
    を有する、議論分析装置。
  2. 複数の参加者が参加する議論における、前記複数の参加者それぞれの発話量を取得する情報取得部と、
    前記議論において、第1の時間範囲ごとに前記複数の参加者のうち前記発話量が最大である最大発話者を特定する最大発話者特定部と、
    前記第1の時間範囲ごとの前記最大発話者の変化に基づいて、前記複数の参加者の間で発生した話者の遷移を示す遷移情報を生成する遷移検出部と、
    前記複数の参加者の各組み合わせにおける前記遷移の有無を示す複数のパターンを生成し、前記複数のパターンのうち、前記遷移情報との類似度が所定の条件を満たすパターンを選択するパターン選択部と、
    前記パターン選択部が選択した前記パターンに基づいて生成された情報を出力する出力部と、
    を有する、議論分析装置。
  3. 複数の参加者が参加する議論における、前記複数の参加者それぞれの発話量を取得する情報取得部と、
    前記議論において、第1の時間範囲ごとに前記複数の参加者のうち前記発話量が最大である最大発話者を特定する最大発話者特定部と、
    前記第1の時間範囲ごとの前記最大発話者の変化に基づいて、前記複数の参加者の間で発生した話者の遷移を示す遷移情報を出力するとともに、第1の議論における所定のグループに属する前記複数の参加者の前記発話量の順位と、前記第1の議論とは異なる第2の議論における前記グループに属する前記複数の参加者の前記発話量の順位とを関連付けて出力する出力部と、
    を有する、議論分析装置。
  4. 前記遷移検出部は、1つの時間範囲における前記最大発話者である第1の参加者と、前記1つの時間範囲に続く時間範囲における前記最大発話者である第2の参加者とが異なる場合に、前記第1の参加者から前記第2の参加者への前記遷移を示す前記遷移情報を生成する、請求項1又は2に記載の議論分析装置。
  5. 前記遷移検出部は、前記第1の時間範囲よりも長い第2の時間範囲ごとに前記遷移の回数を示す前記遷移情報を生成し、
    前記フェーズ分割部は、前記遷移情報の時系列の類似性に基づいて前記第2の時間範囲ごとの前記遷移情報をクラスタリングし、生成した複数のクラスタに含まれている前記遷移情報に対応する前記第2の時間範囲の前記議論中の時刻に基づいて、前記議論を構成する前記1つ以上のフェーズを決定する、請求項に記載の議論分析装置。
  6. 前記パターン選択部は、選択した前記パターンの一部を変更した複数のサブパターンをさらに生成し、前記複数のサブパターンのうち、前記遷移情報との類似度が所定の条件を満たすサブパターンを選択する、請求項に記載の議論分析装置。
  7. 前記出力部は、前記パターン選択部が選択した前記パターンに基づいて前記複数の参加者の役割を判定し、前記複数の参加者それぞれと前記複数の参加者それぞれの役割とを関連付けて出力する、請求項又は6に記載の議論分析装置。
  8. 前記出力部は、前記パターン選択部が選択した前記パターンに基づいて、前記複数の参加者の行動を文章として出力する、請求項2、6又は7のいずれか一項に記載の議論分析装置。
  9. 前記出力部は、前記複数の参加者のうち1人の参加者が参加した複数の前記議論のうち、所定の条件を満たす前記議論における前記1人の参加者の発話量に関する情報を、前記1人の参加者に関連付けて出力する、請求項1から8のいずれか一項に記載の議論分析装置。
  10. プロセッサが実行する、
    複数の参加者が参加する議論における、前記複数の参加者それぞれの発話量を取得するステップと、
    前記議論において、第1の時間範囲ごとに前記複数の参加者のうち前記発話量が最大である最大発話者を特定するステップと、
    前記第1の時間範囲ごとの前記最大発話者の変化に基づいて、前記複数の参加者の間で発生した話者の遷移を示す遷移情報を生成するステップと、
    前記遷移情報の時系列の類似性に基づいて、前記議論を1つ以上のフェーズに分割するステップと、
    前記分割するステップにおいて前記議論を分割することにより生成された前記フェーズを示す情報を出力するステップと、
    を有する、議論分析方法。
  11. プロセッサが実行する、
    複数の参加者が参加する議論における、前記複数の参加者それぞれの発話量を取得するステップと、
    前記議論において、第1の時間範囲ごとに前記複数の参加者のうち前記発話量が最大である最大発話者を特定するステップと、
    前記第1の時間範囲ごとの前記最大発話者の変化に基づいて、前記複数の参加者の間で発生した話者の遷移を示す遷移情報を生成するステップと、
    前記複数の参加者の各組み合わせにおける前記遷移の有無を示す複数のパターンを生成するステップと、
    前記複数のパターンのうち、前記遷移情報との類似度が所定の条件を満たすパターンを選択するステップと、
    前記選択するステップにおいて選択された前記パターンに基づいて生成された情報を出力するステップと、
    を有する、議論分析方法。
  12. プロセッサが実行する、
    複数の参加者が参加する議論における、前記複数の参加者それぞれの発話量を取得するステップと、
    前記議論において、第1の時間範囲ごとに前記複数の参加者のうち前記発話量が最大である最大発話者を特定するステップと、
    前記第1の時間範囲ごとの前記最大発話者の変化に基づいて、前記複数の参加者の間で発生した話者の遷移を示す遷移情報を出力するステップと、
    第1の議論における所定のグループに属する前記複数の参加者の前記発話量の順位と、前記第1の議論とは異なる第2の議論における前記グループに属する前記複数の参加者の前記発話量の順位とを関連付けて出力するステップと、
    を有する、議論分析方法。
JP2019046990A 2019-03-14 2019-03-14 議論分析装置及び議論分析方法 Active JP7279928B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019046990A JP7279928B2 (ja) 2019-03-14 2019-03-14 議論分析装置及び議論分析方法
JP2023075775A JP7453714B2 (ja) 2019-03-14 2023-05-01 議論分析装置及び議論分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019046990A JP7279928B2 (ja) 2019-03-14 2019-03-14 議論分析装置及び議論分析方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023075775A Division JP7453714B2 (ja) 2019-03-14 2023-05-01 議論分析装置及び議論分析方法

Publications (2)

Publication Number Publication Date
JP2020148931A JP2020148931A (ja) 2020-09-17
JP7279928B2 true JP7279928B2 (ja) 2023-05-23

Family

ID=72429634

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019046990A Active JP7279928B2 (ja) 2019-03-14 2019-03-14 議論分析装置及び議論分析方法
JP2023075775A Active JP7453714B2 (ja) 2019-03-14 2023-05-01 議論分析装置及び議論分析方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023075775A Active JP7453714B2 (ja) 2019-03-14 2023-05-01 議論分析装置及び議論分析方法

Country Status (1)

Country Link
JP (2) JP7279928B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7121436B1 (ja) 2021-03-22 2022-08-18 株式会社I’mbesideyou 動画像分析プログラム
WO2022201273A1 (ja) * 2021-03-22 2022-09-29 株式会社I’mbesideyou 動画像分析プログラム
WO2022230156A1 (ja) * 2021-04-29 2022-11-03 株式会社I’mbesideyou 動画像分析システム
JP7449577B2 (ja) 2021-05-17 2024-03-14 株式会社シンギュレイト 情報処理装置、情報処理方法、およびプログラム
JP7197955B1 (ja) * 2021-10-14 2022-12-28 株式会社I’mbesideyou ビデオミーティング評価端末

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005275536A (ja) 2004-03-23 2005-10-06 Advanced Telecommunication Research Institute International 会話先導者判別装置および会話先導者判別方法
US20160163331A1 (en) 2014-12-04 2016-06-09 Kabushiki Kaisha Toshiba Electronic device and method for visualizing audio data
JP2017135642A (ja) 2016-01-29 2017-08-03 株式会社日立システムズ 電話音声モニタリング評価システム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3879786B2 (ja) * 1997-08-05 2007-02-14 富士ゼロックス株式会社 会議情報記録再生装置および会議情報記録再生方法
JP5302505B2 (ja) 2006-12-04 2013-10-02 日本電気株式会社 対話状況区切り推定方法、対話状況推定方法、対話状況推定システムおよび対話状況推定プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005275536A (ja) 2004-03-23 2005-10-06 Advanced Telecommunication Research Institute International 会話先導者判別装置および会話先導者判別方法
US20160163331A1 (en) 2014-12-04 2016-06-09 Kabushiki Kaisha Toshiba Electronic device and method for visualizing audio data
JP2017135642A (ja) 2016-01-29 2017-08-03 株式会社日立システムズ 電話音声モニタリング評価システム

Also Published As

Publication number Publication date
JP2020148931A (ja) 2020-09-17
JP7453714B2 (ja) 2024-03-21
JP2023109786A (ja) 2023-08-08

Similar Documents

Publication Publication Date Title
JP7279928B2 (ja) 議論分析装置及び議論分析方法
Kell et al. A task-optimized neural network replicates human auditory behavior, predicts brain responses, and reveals a cortical processing hierarchy
US9552535B2 (en) Data acquisition for machine perception systems
US10347250B2 (en) Utterance presentation device, utterance presentation method, and computer program product
US20230177835A1 (en) Relationship modeling and key feature detection based on video data
US11602287B2 (en) Automatically aiding individuals with developing auditory attention abilities
US20220051670A1 (en) Learning support device, learning support method, and recording medium
CN113409822B (zh) 对象状态的确定方法、装置、存储介质及电子装置
Jayagopi Computational modeling of face-to-face social interaction using nonverbal behavioral cues
JP2020173415A (ja) 教材提示システム及び教材提示方法
JP6589040B1 (ja) 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム
US20140095402A1 (en) System and Method of Scoring Candidate Audio Responses for a Hiring Decision
JP7465012B2 (ja) ビデオミーティング評価端末、ビデオミーティング評価システム及びビデオミーティング評価プログラム
JP7465013B2 (ja) ビデオミーティング評価端末、ビデオミーティング評価システム及びビデオミーティング評価プログラム
JP7152825B1 (ja) ビデオセッション評価端末、ビデオセッション評価システム及びビデオセッション評価プログラム
JP7471683B2 (ja) 反応通知システム
JP6589041B1 (ja) 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム
WO2022180853A1 (ja) ビデオセッション評価端末、ビデオセッション評価システム及びビデオセッション評価プログラム
WO2022180862A1 (ja) ビデオセッション評価端末、ビデオセッション評価システム及びビデオセッション評価プログラム
JP6975755B2 (ja) 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム
JP7449577B2 (ja) 情報処理装置、情報処理方法、およびプログラム
WO2022145038A1 (ja) ビデオミーティング評価端末、ビデオミーティング評価システム及びビデオミーティング評価プログラム
JP7400832B2 (ja) 情報処理装置、制御方法及びプログラム
WO2022145039A1 (ja) ビデオミーティング評価端末、ビデオミーティング評価システム及びビデオミーティング評価プログラム
WO2022180859A1 (ja) ビデオセッション評価端末、ビデオセッション評価システム及びビデオセッション評価プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230411

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230501

R150 Certificate of patent or registration of utility model

Ref document number: 7279928

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150