JP2019060990A

JP2019060990A - 議論が活発でないグループの発話音声を逐次優先的に分析する発話分析装置、システム及びプログラム

Info

Publication number: JP2019060990A
Application number: JP2017184207A
Authority: JP
Inventors: 河合　直樹; Naoki Kawai; 直樹河合
Original assignee: KDDI Corp
Current assignee: KDDI Corp
Priority date: 2017-09-25
Filing date: 2017-09-25
Publication date: 2019-04-18
Anticipated expiration: 2037-09-25
Also published as: JP6737754B2

Abstract

【課題】議論が活発でないグループの発話音声を逐次優先的に分析する装置等を提供する。【解決手段】発話分析装置は、連続する所定の音声区間毎にユーザの発話音声を収録する各ユーザ端末へ発話音声要求を送信し、発話音声データを受信する１つ以上のユーザ端末を含む１つ以上グループの発話音声受信順序を記憶し、発話音声データを発話分析する発話分析手段と、時刻t+1の音声区間で可能な限り、前記発話音声受信順序に応じて各ユーザ端末へ発話音声要求を送信し、各ユーザ端末から時刻tの音声区間の発話音声データを受信し、当該発話音声データを前記発話分析手段に発話分析させる発話音声受信制御手段と、時刻t+1の音声区間に発話分析が完了した時刻tの音声区間の発話音声データの発話分析結果に基づいて、時刻t+2の音声区間におけるグループの発話音声受信順序を更新する発話音声受信順序更新手段とを有する。【選択図】図４

Description

本発明は、グループワークにおけるユーザの発話分析の技術に関する。

近年、教育やビジネスの分野における２１世紀型スキルとして、批評的思考力や課題解決力の養成が重要となってきている。そのために、知識を一方的に提供するセミナ形式ではなく、アクティブ・ラーニングに基づくグループワーク形式が注目されている。
グループワーク形式は、例えば３〜４人で１つのグループを構成し、知識を交換し合いながら、課題の解決に向かって創造的に議論を続ける協働学習に基づくものである。ここで、グループワークを管理する教師は、議論が活発でないグループに対しては、有効なアドバイスを提案する必要がある。

一方で、グループワーク形式の場合、１人の教師が、全てのグループの学習状況を観察することはできない。そのために、ＩＣＴ(Information and Communication Technology)を用いて、複数のグループの学習状況を同時に把握する技術が求められる。
例えば、発話分析装置が、全てのグループにおける各ユーザの発話音声を収集し、その発話音声を音声認識処理によってテキスト化し、発話分析処理によってその分析結果を教師へ提供する技術がある（例えば特許文献１参照）。教師は、グループ毎の分析結果を見ながら、学習状況を観察することができる。

図１は、グループワークにおけるシステム構成図である。

図１によれば、３〜４人のユーザで議論するグループが、複数構成されている。図１のシステムによれば、発話分析装置１と、複数のユーザ端末２及び管理者端末３とが、アクセスポイント４を介して接続されている。

発話分析装置１は、ユーザ端末２から発話音声を受信し、その発話音声に対して音声認識によってテキスト化し、グループ毎に発話内容を分析する。
ユーザ端末２は、各ユーザによって保持又は装着されるマイク装置であって、具体的には、当該ユーザの発話音声を収録するスマートフォンのようなものである。
管理者端末３は、発話分析装置１からグループ毎の分析結果を取得し、教師へ明示する。
アクセスポイント４は、一方をＷＡＮ(Wide Area Network)に接続し、他方をＬＡＮ(Local Area Network)に接続し、そのＬＡＮを介して複数のユーザ端末２を収容する。アクセスポイント４とユーザ端末２との間のネットワークは、無線／有線ＬＡＮであってもよいし、Bluetooth（登録商標）や事業者アクセスネットワークであってもよい。

発話分析装置１は、発話音声に対する発話分析処理（音声認識処理を含む）に、一定時間を要する。そのために、ユーザ端末２が、発話音声をランダムに発話分析装置１へアップロードした場合、音声認識処理の処理増大による遅延や、全てのグループ毎の発話音声が揃わないことによる発話分析処理の処理待ちによる遅延が生じることなる。

一般に、ユーザ端末２が発話音声をアップロードするタイミングは、制御されていない。そのために、多数のユーザ端末２から同時に発話音声が送信された場合、トラヒック増加によるネットワーク輻輳や、音声認識処理の処理増大又は発話分析処理の待ち遅延による輻輳を生じ、コネクションが遮断されることもある。
特に、同じ室内で同時に多数のユーザによるグループワークが実施された場合、アクセスポイント４の配下に多数のユーザ端末２が接続されることとなる。この場合、無線ＬＡＮの伝送容量が不足すると共に、ユーザ端末２から発話分析装置１への発話音声のデータがアクセスポイント４に集中し、その結果、輻輳が生じやすくなる。
そのために、発話分析装置１は、ユーザ端末２から発話音声を受信する順序を決定しておくことが好ましい。ユーザ端末２は、グループ単位で、発話音声をアクセスポイント４を介して発話分析装置１へアップロードすることによって、ＬＡＮ内で輻輳が生じることもない。

図２は、従来技術におけるシーケンス図である。

各ユーザ端末２は、いずれか１つのグループに属しており、グループワーク時間の中で連続する所定の音声区間毎に、グループ内のユーザの発話音声を収録する。
発話分析装置１は、グループ単位で、複数のユーザ端末２へ発話音声要求を送信する。

図２によれば、発話分析装置１は、最初に、グループ１に属する複数のユーザ端末２へ、発話音声要求を送信している。
これに対し、発話音声要求を受信したグループ１の各ユーザ端末２は、発話音声を、発話分析装置１へ送信する。
そして、発話分析装置１は、発話音声を受信したグループ１について、発話分析処理によって発話を分析する。その間、発話分析装置１は、次のグループ２の複数のユーザ端末２へ、発話音声要求を送信する。
このように、発話分析装置１は、各ユーザ端末２が収録した音声区間の発話音声を、発話音声受信順序に応じたグループ単位の順番で、アップロードさせる。
そして、発話分析装置１は、全てのグループにおける発話音声の発話分析に基づいて、議論の活性度が低い順にグループを順序付けることができる。

特開２０１７−２７５３６号公報

益川, 河崎他, "建設的相互作用経験の蓄積が協調的問題書行ける能力の育成につながるか"認知科学, Vol. 23, No. 3, Sept. 2016.

グループワークを管理する教師は、グループ毎の分析結果を見ながら、議論が活発でないグループを見出すように観察する。教師としては、できる限り、議論が活発でないグループから順に、その分析結果に応じて指導・助言（アドバイス）を提供したいと考える。
しかしながら、発話分析装置１は、全てのグループにおける多数のユーザの発話音声を収集し、それを音声認識によってテキスト化して発話分析をするために、一定の処理時間を要する。教師に対して発話分析結果を早期に提供されないために、教師も、グループワークの時間内で、議論の活性度の低いグループを優先的に早期に指導・助言をすることができないという課題があった。

図３は、従来技術における発話分析の音声区間を表すシーケンスである。

図３によれば、例えば３０分間のグループワーク時間が、例えば５分間の音声区間に区分されている。ユーザ端末２は、グループワークが開始されると、発話音声を収録し始め、音声区間毎に発話音声の収録の開始と終了とを繰り返す。尚、以下では、「音声区間ｔ」と「時刻ｔの音声区間」とは同意であり、これらは時刻ｔから始まる音声区間を意味することとする。

ユーザ端末２によれば、音声区間tにおける各グループの発話音声は、音声区間t+1以降にしか送信することができない。また、発話分析装置１が、音声区間tにおける全てのグループの発話音声を順次受信しようとした場合、音声区間t+1を超える場合もある。それら発話音声に対する発話分析処理には、更に処理時間がかかり、音声区間t+2を超える場合もある。発話音声の受信処理と発話分析処理とをパイプラインで処理することができるが、発話時間の長さによって、それら処理時間も増減する。
図３によれば、例えば音声区間の2.5倍程度の処理時間を要している。また、その後、次の音声区間t+1の発話音声の受信を開始するために、更に遅延が大きくなる。
結果的に、教師が、各グループへ指導・助言を検討する時間も遅延し、指導するタイミングを逸するという課題もある。

そこで、本発明は、議論が活発でないグループの発話音声を逐次優先的に分析する発話分析装置、システム及びプログラムを提供することを目的とする。

本発明によれば、連続する所定の音声区間毎にユーザの発話音声を収録する各ユーザ端末へ、発話音声要求を送信し、発話音声データを受信する発話分析装置において、
１つ以上のユーザ端末を含む１つ以上のグループを構成すると共に、グループの発話音声受信順序を記憶しており、
発話音声データを発話分析する発話分析手段と、
時刻t+1の音声区間で可能な限り、グループの発話音声受信順序に応じて、各ユーザ端末へ発話音声要求を送信し、各ユーザ端末から時刻tの音声区間の発話音声データを受信し、当該発話音声データを発話分析手段に発話分析させる発話音声受信制御手段と、
時刻t+1の音声区間に発話分析が完了した時刻tの音声区間の発話音声データの発話分析結果に基づいて、時刻t+2の音声区間におけるグループの発話音声受信順序を更新する発話音声受信順序更新手段と
を有することを特徴とする。

本発明の発話分析装置における他の実施形態によれば、
発話音声受信順序更新手段は、各グループの発話音声データから変換されたテキストに基づいて、議論の活性度が低い順にグループの発話音声受信順序を更新する
ことも好ましい。

本発明の発話分析装置における他の実施形態によれば、
発話音声受信順序更新手段は、
予め記憶した理解状態キーワード群及び不理解状態キーワード群を参照して、
テキストに含まれる時系列の各キーワードに対して理解状態か不理解状態かを決定し、両状態の行き来数が少ないグループほど活性度が低いと判定し、その活性度が低い順にグループの発話音声受信順序を更新する
ことも好ましい。

本発明の発話分析装置における他の実施形態によれば、
発話音声受信順序更新手段は、
予め記憶した理解レベル毎のレベルキーワード群を参照して、
テキストに含まれるキーワードを、理解レベルの低いレベルキーワードの一致数の割合が多いグループほど活性度が低いと判定し、その活性度が低い順にグループの発話音声受信順序を更新することも好ましい。

本発明の発話分析装置における他の実施形態によれば、
発話音声受信制御手段について、時刻t+1の音声区間に発話分析が完了したグループの発話音声受信順序に応じて発話分析するグループ数は、発話音声データサイズ及び発話分析処理時間に応じて変化することも好ましい。

本発明の発話分析装置における他の実施形態によれば、
発話音声受信制御手段は、時刻t+1の音声区間に発話分析が完了したグループの発話音声受信順序に応じて発話分析するグループ数が、第１の所定期間変化しない場合、時刻t+1の音声区間を越えても、全てのグループの各ユーザ端末へ発話音声要求を送信し、各ユーザ端末から時刻tの音声区間の発話音声データを受信し、当該発話音声データを発話分析する
ことも好ましい。

本発明の発話分析装置における他の実施形態によれば、
発話音声受信制御手段は、時刻t+1の音声区間に発話分析が完了したグループの発話音声受信順序に応じて発話分析するグループ数が、第２の所定期間変化しない場合、時刻t+1の音声区間を越えても、受信すべきグループ数を所定数増分して、各ユーザ端末へ発話音声要求を送信し、各ユーザ端末から時刻tの音声区間の発話音声データを受信し、当該発話音声データを発話分析することも好ましい。

本発明の発話分析装置における他の実施形態によれば、
発話音声受信順序更新手段は、時刻t+2の音声区間におけるグループの発話音声受信順序の中で、所定条件に基づくグループを下位に移行し、当該グループの各ユーザ端末から発話音声データを受信する頻度を少なくすることも好ましい。

本発明の発話分析装置における他の実施形態によれば、
発話音声受信順序更新手段における所定条件とは、既に指導済みのグループであって、オペレータ操作によって指示されたグループであることも好ましい。

本発明の発話分析装置における他の実施形態によれば、
発話音声受信順序更新手段における所定条件とは、グループの発話音声受信順序の中で最も活性度が高い（末尾の順序の）グループであることも好ましい。

本発明の発話分析装置における他の実施形態によれば、
発話音声受信順序更新手段は、グループの発話音声受信順序の中で、第３の所定期間以上、発話分析がされていないグループを、グループの発話音声受信順序の上位に移行し、当該グループの各ユーザ端末から発話音声データを受信する頻度を多くすることも好ましい。

本発明の発話分析装置における他の実施形態によれば、
発話音声受信順序更新手段は、時刻tよりも過去の複数の音声区間の累積した発話音声データの発話分析結果に基づいて、時刻t+2におけるグループの発話音声受信順序を更新することも好ましい。

本発明によれば、
前述した発話分析装置と、
ユーザの発話音声を収録する複数のユーザ端末と、
複数のグループを管理する管理者端末と、
複数のユーザ端末へ発話音声要求を送信する通知サーバと
を有するシステムであって、
発話分析装置は、発話音声受信順序を管理者端末へ送信し、
管理者端末は、管理者の操作に応じて、発話音声受信順序に基づくグループ識別子を、通知サーバへ送信し、
通知サーバは、管理者端末から受信したグループ識別子に属する複数のユーザ端末へ発話音声要求を送信し、
発話音声要求を受信した各ユーザ端末は、発話音声を発話分析装置へ送信する
ことを特徴とする。

本発明によれば、連続する所定の音声区間毎にユーザの発話音声を収録する各ユーザ端末へ、発話音声要求を送信し、発話音声データを受信するサーバに搭載されたコンピュータを機能させる発話分析プログラムにおいて、
１つ以上のユーザ端末を含む１つ以上のグループを構成すると共に、グループの発話音声受信順序を記憶しており、
発話音声データを発話分析する発話分析手段と、
時刻t+1の音声区間で可能な限り、グループの発話音声受信順序に応じて、各ユーザ端末へ発話音声要求を送信し、各ユーザ端末から時刻tの音声区間の発話音声データを受信し、当該発話音声データを発話分析手段に発話分析させる発話音声受信制御手段と、
時刻t+1の音声区間に発話分析が完了した時刻tの音声区間の発話音声データの発話分析結果に基づいて、時刻t+2の音声区間におけるグループの発話音声受信順序を更新する発話音声受信順序更新手段と
してコンピュータを機能させることを特徴とする。

本発明によれば、連続する所定の音声区間毎にユーザの発話音声を収録する各ユーザ端末へ、発話音声要求を送信し、発話音声データを受信するサーバの発話分析方法において、
サーバは、
１つ以上のユーザ端末を含む１つ以上のグループを構成すると共に、グループの発話音声受信順序を記憶しており、
時刻t+1の音声区間で可能な限り、グループの発話音声受信順序に応じて、各ユーザ端末へ発話音声要求を送信し、各ユーザ端末から時刻tの音声区間の発話音声データを受信し、当該発話音声データを発話分析する第１のステップと、
時刻t+1の音声区間に発話分析が完了した時刻tの音声区間の発話音声データの発話分析結果に基づいて、時刻t+2の音声区間におけるグループの発話音声受信順序を更新する第２のステップと
を実行することを特徴とする。

本発明の発話分析装置、システム及びプログラムによれば、議論が活発でないグループの発話音声を逐次優先的に分析することができる。これによって、教師は、グループワークの中で、議論の活性度が低いグループを優先的に認識することでき、早期に指導・助言をすることができる。

グループワークにおけるシステム構成図である。従来技術におけるシーケンス図である。従来技術における発話分析の音声区間を表すシーケンスである。本発明における発話分析の音声区間を表すシーケンスである。本発明における発話分析装置の機能構成図である。本発明における発話分析されたグループ数の変化を表すシーケンスである。理解状態と不理解状態との行き来を表す説明図である。理解レベル毎のレベルキーワードを表す説明図である。本発明における発話音声受信順序の入れ替えを表すシーケンスである。本発明における通知サーバを含むシステム構成図である。図１０のシステムに基づくシーケンス図である。

以下では、本発明の実施形態について、図面を用いて詳細に説明する。

図４は、本発明における発話分析の音声区間を表すシーケンスである。

本発明によれば、１つ以上のユーザ端末を含む１つ以上のグループを構成すると共に、グループの「発話音声受信順序」が設定されている。発話音声受信順序は、グループ内の議論の活性化の判定指標に基づくものである。図４によれば、図３と比較して、以下のように各音声区間が進行する。

（時刻tの音声区間）
各ユーザ端末２は、ユーザの発話音声を収録する。

（時刻t+1の音声区間）
発話分析装置１は、時刻t+1の音声区間で可能な限り、グループの発話音声受信順序に応じて、各ユーザ端末２へ発話音声要求を送信し、各ユーザ端末２から時刻tの音声区間の発話音声データを受信し、当該発話音声データを発話分析する。そして、発話分析装置１は、時刻t+1の音声区間に発話分析が完了した時刻tの音声区間の発話音声データの発話分析結果に基づいて、時刻t+2の音声区間におけるグループの発話音声受信順序を更新する。
また、ユーザ端末２は、ユーザの発話音声の収録を継続している。

（時刻t+2の音声区間）
発話分析装置１は、時刻t+2の音声区間で可能な限り、グループの発話音声受信順序に応じて、各ユーザ端末２へ発話音声要求を送信し、各ユーザ端末２から時刻t+1の音声区間の発話音声データを受信し、当該発話音声データを発話分析する。そして、発話分析装置１は、時刻t+2の音声区間に発話分析が完了した時刻t+1の音声区間の発話音声データの発話分析結果に基づいて、時刻t+3の音声区間におけるグループの発話音声受信順序を更新する。
また、ユーザ端末２は、ユーザの発話音声の収録を継続している。

このように、時刻t+3以降の音声区間でも、前述した処理を繰り返す。
ここで、同じ音声区間であっても、グループの発話音声受信順序に応じて、発話音声を受信し且つ発話分析するグループ数は、発話音声データサイズ及び発話分析処理時間に応じて変化する。

これによって、発話分析装置１は、全てのグループの発話音声データを無秩序に収集して分析するのではなく、時刻tの音声区間における発話音声の分析に基づく、議論の活性度が低いグループの発話音声受信順序を、時刻t+2の音声区間の開始時刻に、教師へ明示することができる。教師は、議論の活性度が低いグループを認識し、指導することができる。

図５は、本発明における発話分析装置の機能構成図である。

各ユーザ端末２は、発話音声蓄積部と、発話音声送信部とを有する。
発話音声蓄積部は、連続する所定の音声区間毎に、ユーザによって発話された発話音声を収録する。
発話音声送信部は、発話分析装置１から発話音声要求を受信した際に、その直前の音声区間の発話音声データを送信する。また、発話音声要求と共に、要求された音声区間の開始時刻を受信した場合には、同時刻から始まる音声区間の発話音声データを送信するようにしてもよい。

発話分析装置１は、１つ以上のユーザ端末を含む１つ以上のグループを構成すると共に、グループの発話音声受信順序（議論の活性度が低い順）を記憶している。
そして、発話分析装置１は、発話音声受信順序の上位（議論の活性度が低い）のグループに属するユーザ端末２から順に、その発話音声データをアップロードさせる。「発話音声データ」は、デジタル信号に変換された音声信号そのものであってもよいし、ユーザ端末２が音声認識処理したテキストであってもよい。
発話分析装置１は、グループ毎に発話音声データに対する発話分析処理を実行し、その分析結果となる発話音声受信順序を更新する。

図５によれば、発話分析装置１は、発話分析部１０と、発話音声受信順序制御部１１と、発話音声受信順序更新部１２とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、これら機能構成部の処理の流れは、装置の発話分析方法としても理解できる。

［発話分析部１０］
発話分析部１０は、発話音声データを発話分析する。尚、ユーザ端末２からの発話音声データが音声信号そのものであった場合には、発話分析処理の前に、音声認識処理によりテキストに変換してもよい。

［発話音声受信制御部１１］
発話音声受信制御部１１は、時刻t+1の音声区間で可能な限り、グループの発話音声受信順序に応じて、各ユーザ端末へ発話音声要求を送信し、各ユーザ端末から時刻tの音声区間の発話音声データを受信し、当該発話音声データを発話分析部１０に発話分析させる。

図６は、本発明における発話分析されたグループ数の変化を表すシーケンスである。
図６（ａ）は、＜発話分析されるグループ数の変化＞を表す。
図６（ｂ）は、＜グループ数が変化しない場合における発話音声受信順序のリセット＞を表す。
図６（ｃ）は、＜グループ数が変化しない場合における発話分析されるグループ数の増分＞を表す。

＜発話分析されるグループ数の変化：図６（ａ）＞
時刻t+1の音声区間に発話分析が完了したグループの発話音声受信順序に応じて発話分析するグループ数は、発話音声データサイズ及び発話分析処理時間に応じて変化する。

（音声区間t終了時の発話音声受信順序）
グループＡ、Ｂ、Ｃ、Ｄ、Ｅ、Ｆ、Ｇ、Ｈ、Ｉ、Ｊの順であったとする。
（音声区間t+1終了時の発話音声受信順序）
音声区間t+1内で、上位５つのグループ（Ａ、Ｂ、Ｃ、Ｄ、Ｅ）の発話音声データを受信できたとする。このとき、これら５つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、音声区間t+2における発話音声受信順序としてグループＢ、Ｃ、Ｄ、Ｅ、Ａの順に更新されている。
（音声区間t+2終了時の発話音声受信順序）
音声区間t+2内で、上位３つのグループ（Ｂ、Ｃ、Ｄ）の発話音声データを受信できたとする。このとき、これら３つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、音声区間t+3における発話音声受信順序としてグループＤ、Ｂ、Ｃの順に更新されている。
（音声区間t+3終了時の発話音声受信順序）
音声区間t+3内で、上位７つのグループ（Ｄ、Ｂ、Ｃ、Ｅ、Ａ、Ｆ、Ｇ）の発話音声データを受信できたとする。このとき、これら７つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、音声区間t+4における発話音声受信順序としてグループＤ、Ｂ、Ｇ、Ｃ、Ｅ、Ａ、Ｆの順に更新されている。
（音声区間t+4終了時の発話音声受信順序）
音声区間t+4内で、上位５つのグループ（Ｄ、Ｂ、Ｇ、Ｃ、Ｅ）の発話音声データを受信できたとする。このとき、これら５つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、音声区間t+5における発話音声受信順序としてグループＢ、Ｄ、Ｃ、Ｅ、Ｇの順に更新されている。
このように、音声区間毎に発話音声データを収集し且つ発話分析を繰り返すことによって、議論の活性度が低いグループの順番は変動する。

＜グループ数が変化しない場合における発話音声受信順序のリセット：図６（ｂ）＞
時刻t+1の音声区間に発話分析が完了したグループの発話音声受信順序に応じて発話分析するグループ数が、第１の所定期間変化しない場合、時刻t+1の音声区間を越えても、「全て」のグループの各ユーザ端末へ発話音声要求を送信し、各ユーザ端末から時刻tの音声区間の発話音声データを受信し、当該発話音声データを発話分析する。

前述した図６（ａ）によれば、発話音声受信順序の上位のグループのみについてその順序が更新され、下位のグループについてはその順番が更新されないという不都合が生じる。例えば、議論の活性度が高いグループであっても、その後、その活性度が低下する場合もある。
そこで、図６（ｂ）によれば、発話分析するグループ数が、第１の所定期間（例えば２０分間）変化しない場合、発話音声受信順序を強制的にリセットする。但し、その場合、発話分析装置１は、全てのグループの発話音声データを受信するために、発話音声受信順序の提供は、一時的に遅れることになる。

ここでは、第１の所定期間を２０分間（４個の音声区間）とする。
（音声区間t終了時の発話音声受信順序）
グループＡ、Ｂ、Ｃ、Ｄ、Ｅ、Ｆ、Ｇ、Ｈ、Ｉ、Ｊの順であったとする。
（音声区間t+1終了時の発話音声受信順序）
音声区間t+1内で、上位５つのグループ（Ａ、Ｂ、Ｃ、Ｄ、Ｅ）の発話音声データを受信できたとする。このとき、これら５つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、グループＢ、Ｃ、Ｄ、Ｅ、Ａの順に更新されている。
（音声区間t+2終了時の発話音声受信順序）
音声区間t+2内で、上位５つのグループ（Ｂ、Ｃ、Ｄ、Ｅ、Ａ）の発話音声データを受信できたとする。このとき、これら５つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、グループＢ、Ｄ、Ｃ、Ｅ、Ａの順に更新されている。
（音声区間t+3終了時の発話音声受信順序）
音声区間t+3内で、上位５つのグループ（Ｂ、Ｄ、Ｃ、Ｅ、Ａ）の発話音声データを受信できたとする。このとき、これら５つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、グループＢ、Ｃ、Ｄ、Ｅ、Ａの順に更新されている。
（音声区間t+4終了時の発話音声受信順序）
音声区間t+4内で、上位５つのグループ（Ｂ、Ｃ、Ｄ、Ｅ、Ａ）の発話音声データを受信できたとする。発話分析するグループ数（５）が、２０分間、変化がなかったために、発話音声受信順序をリセットする。
発話分析装置１は、全てのグループの発話音声データを受信し、ここでは、グループＢ、Ｄ、Ｃ、Ｅ、Ｊ、Ｇ、Ｆ、Ｉ、Ａ、Ｈの順に更新されている。発話音声受信順序の更新処理には、音声区間t+4を超える場合もある。

＜グループ数が変化しない場合における発話分析されるグループ数の増分：図６（ｃ）＞
時刻t+1の音声区間に発話分析が完了したグループの発話音声受信順序に応じて発話分析するグループ数が、第２の所定期間変化しない場合、時刻t+1の音声区間を越えても、受信すべきグループ数を所定数増分して、各ユーザ端末へ発話音声要求を送信し、各ユーザ端末から時刻tの音声区間の発話音声データを受信し、当該発話音声データを発話分析する。

ここでは、第２の所定期間を２０分間（４個の音声区間）とする。
また、音声区間t〜t+3終了時の発話音声受信順序は、前述した図６（ｂ）と全く同様である。

（音声区間t+4終了時の発話音声受信順序）
音声区間t+4内で、上位５つのグループ（Ｂ、Ｃ、Ｄ、Ｅ、Ａ）の発話音声データを受信できたとする。発話分析するグループ数（５）が、２０分間、変化がなかったために、受信すべきグループ数を２グループ（所定数）増分する。
発話分析装置１は、上位７つのグループの発話音声データを受信し、ここでは、グループＢ、Ｄ、Ｃ、Ｅ、Ｇ、Ｆ、Ａの順に更新されている。発話音声受信順序の更新処理には、音声区間t+4を超える場合もある。

［発話音声受信順序更新部１２］
発話音声受信順序更新部１２は、時刻t+1の音声区間に発話分析が完了した時刻tの音声区間の発話音声データの発話分析結果に基づいて、時刻t+2の音声区間におけるグループの発話音声受信順序を更新する。
発話音声受信順序更新部１２は、各グループの発話音声データから変換されたテキストに基づいて、議論の活性度が低い順にグループの発話音声受信順序を更新する。

議論の活性度に基づく発話音声受信順序は、例えば以下の２つの方法で算出することができる。
＜理解状態と不理解状態との行き来数の活性度に基づく発話音声受信順序の算出＞
＜理解レベルのレベルキーワードの活性度に基づく発話音声受信順序の算出＞
＜その他の発話音声受信順序の算出＞

＜理解状態と不理解状態との行き来数の活性度に基づく発話音声受信順序の算出：図７＞
発話音声受信順序更新部１２は、予め記憶した理解状態キーワード群及び不理解状態キーワード群を参照する。

図７は、理解状態と不理解状態との行き来を表す説明図である。

図７によれば、理解状態キーワード群及び不理解状態キーワード群が登録されている。そして、発話音声受信順序更新部１２は、テキストに含まれる時系列の各キーワードに対して理解状態か不理解状態かを決定し、両状態の行き来数が少ないグループほど活性度が低いと判定し、その活性度が低い順に、グループの発話音声受信順序を更新する
理解状態と不理解状態との間の行き来数によってグループの活性度を算出する技術の有効性については、学習科学理論の論文にも開示されている（例えば非特許文献１参照）。

＜理解レベルのレベルキーワードの活性度に基づく発話音声受信順序の算出：図８＞
発話音声受信順序更新部１２は、予め記憶した理解レベル毎のレベルキーワード群を参照する。

図８は、理解レベル毎のレベルキーワードを表す説明図である。

図８によれば、学習科目「理科」の「雲はどのようにしてできるのか」について、発話音声に含まれるであろう理解レベル毎のレベルキーワードが表されている。
レベル１：実験に関するキーワード
レベル２：実験結果の検討に関するキーワード
レベル３：雲のでき方の考察として重要なキーワード

発話音声受信順序更新部１２は、テキストに含まれるキーワードを、理解レベルの低いレベルキーワードの一致数の割合が多いグループほど活性度が低いと判定し、グループの発話音声受信順序を更新する。

勿論、議論の活性度を算出するために、単純に、理解レベルのキーワード数を用いたものであってもよい。
また、レベルキーワードのテーブルを参照して、ユーザの発話音声に含まれるキーワードを抽出し、そのキーワードのレベルに応じて重み付け積算したものであってもよい。
活性度＝ΣＫn・Leveln
Ｋn：発話テキストからのキーワードnの抽出数
Leveln：キーワードnのレベル（重要度）

＜その他の発話音声受信順序の算出＞
発話音声受信順序更新部１２は、音声区間に含まれる複数の発話区間における所定条件に基づいて、グループの発話音声受信順序を決定する。他の実施形態として、例えば以下のようなものを想定することができる。
（発話音声のテキストの合計文字数に基づく発話音声受信順序の算出）
（発話音声のテキストの平均文字数に基づく発話音声受信順序の算出）
（発話音声のテキストの長文文字数に基づく発話音声受信順序の算出）
（発話音声のテキストの長文文字数の割合に基づく発話音声受信順序の算出）

（発話音声のテキストの合計文字数に基づく発話音声受信順序の算出）
発話音声受信順序は、各グループにおける複数のユーザの発話音声のテキストの合計文字数が少ない順である。これは、グループ内の議論が活発でないために、発話音声のテキストの合計文字数が少ないことを意味する。

（発話音声のテキストの平均文字数に基づく発話音声受信順序の算出）
発話音声受信順序は、各グループにおける複数のユーザの発話音声のテキストの平均文字数が少ない順である。
平均文字数＝音声区間の合計文字数／発話回数
平均文字数が短いほど、相づち（うん）、つなぎ言葉（それで）、賛成（はい）、質問・否定（なんで）など、自分の意見を話していない場合が多い。一方で、平均文字数が長いほど、自分の意見、説明、内容のある話をしている場合が多い。
グループ内の議論が活発でないために、平均文字数が短いことを意味する。

（発話音声のテキストの長文文字数に基づく発話音声受信順序の算出）
発話音声受信順序は、各グループにおける複数のユーザの発話音声のテキストについて、所定文字数以上となる「長文文字数」が少ない順である。
長文文字数が少ないほど、相づち、つなぎ言葉、賛成、質問・否定など、自分の意見を話していない場合が多い。一方で、長文文字数が多いほど、自分の意見、説明、内容のある話をしている場合が多い。
グループ内の議論が活発でないために、長文文字数が少ないことを意味する。

（発話音声のテキストの長文文字数の割合に基づく発話音声受信順序の算出）
発話音声受信順序は、各グループにおける複数のユーザの発話音声のテキストについて、所定文字数よりも短い「短文文字数」に対する、所定閾値文字数以上となる「長文文字数」の割合が小さい順である。
割合＝長文文字数／短文文字数
この割合が小さいほど、相づち、つなぎ言葉、賛成、質問・否定など、自分の意見を話していない場合が多い。一方で、この割合が大きいほど、自分の意見、説明、内容のある話をしている場合が多い。
グループ内の議論が活発でないために、この割合が小さいことを意味する。

図９は、本発明における発話音声受信順序の入れ替えを表すシーケンスである。
図９（ａ）は、指導済みのグループを下位へ移行させるシーケンスである。
図９（ｂ）は、活性度が高いグループを下位へ移行させるシーケンスである。

他の実施形態として、例えば以下の３つの方法もある。
＜発話音声受信順序の上位順のグループを下位へ移行させる順序の更新＞
｛指導済みのグループを下位へ移行させる実施形態：図９（ａ）｝
｛活性度が高いグループを下位へ移行させる実施形態：図９（ｂ）｝
｛長期間、発話分析されていないグループを上位へ移行させる実施形態｝
＜過去複数の音声区間の累積した発話分析＞
＜ユーザに基づく発話音声受信順序の決定＞

＜発話音声受信順序の上位順のグループを下位へ移行させる順序の更新＞
発話音声受信順序更新部１２は、時刻t+2の音声区間におけるグループの発話音声受信順序の中で、所定条件に基づくグループを下位に移行し、当該グループの各ユーザ端末から発話音声データを受信する頻度を少なくする。これによって、発話音声受信順序をあえて変更するものである。

｛指導済みのグループを下位へ移行させる実施形態：図９（ａ）｝
発話音声受信順序更新部１２における「所定条件」とは、既に指導済みのグループであって、オペレータ操作によって指示されたグループであってもよい。
教師としては、既に指導したグループでなく、まだ指導しておらず且つ議論の活性度が低いグループに対して、指導したい考える場合がある。その場合、指導済みのグループを、教師の入力によって発話分析装置１に登録する。発話分析装置１は、発話音声受信順序の中で、指導済みのグループを下位へ移行させる。

（音声区間t終了時の発話音声受信順序）
グループＡ、Ｂ、Ｃ、Ｄ、Ｅ、Ｆ、Ｇ、Ｈ、Ｉ、Ｊの順であったとする。
（音声区間t+1終了時の発話音声受信順序）
音声区間t+1内で、音声区間tの上位５つのグループ（Ａ、Ｂ、Ｃ、Ｄ、Ｅ）の発話音声データを受信できたとする。このとき、これら５つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、音声区間t+2における発話音声受信順序としてグループＢ、Ｃ、Ｄ、Ｅ、Ａの順に更新されている。
ここで、教師は、グループＢに対して、指導をしたとする。その場合、グループＢを、発話音声受信順序の末尾へ移行させる。結果的に、音声区間t+2における発話音声受信順序としてグループＣ、Ｄ、Ｅ、Ａ、Ｆの順に更新されている。
（音声区間t+2終了時の発話音声受信順序）
音声区間t+2内で、音声区間t+1の上位３つのグループ（Ｃ、Ｄ、Ｅ）の発話音声データを受信できたとする。このとき、これら３つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、音声区間t+3における発話音声受信順序としてグループＤ、Ｃ、Ｅの順に更新されている。
ここで、教師は、グループＤに対して、指導をしたとする。その場合、グループＤを、発話音声受信順序の末尾へ移行させる。結果的に、音声区間t+3における発話音声受信順序としてグループＣ、Ｅ、Ａの順に更新されている。
（音声区間t+3終了時の発話音声受信順序）
音声区間t+3内で、音声区間t+2の上位７つのグループ（Ｃ、Ｅ、Ａ、Ｆ、Ｈ、Ｇ、Ｉ）の発話音声データを受信できたとする。このとき、これら７つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、音声区間t+4における発話音声受信順序としてグループＥ、Ｃ、Ａ、Ｆ、Ｈ、Ｇ、Ｉの順に更新されている。
ここで、教師は、グループＥに対して、指導をしたとする。その場合、グループＥを、発話音声受信順序の末尾へ移行させる。結果的に、音声区間t+4における発話音声受信順序としてグループＣ、Ａ、Ｆ、Ｈ、Ｇ、Ｉ、Ｊの順に更新されている。
（音声区間t+4終了時の発話音声受信順序）
音声区間t+4内で、音声区間t+3の上位５つのグループ（Ｃ、Ａ、Ｆ、Ｈ、Ｇ）の発話音声データを受信できたとする。このとき、これら５つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、音声区間t+5における発話音声受信順序としてグループＣ、Ｆ、Ａ、Ｈ、Ｇの順に更新されている。

｛活性度が高いグループを下位へ移行させる実施形態：図９（ｂ）｝
発話音声受信順序更新部１２における「所定条件」とは、グループの発話音声受信順序の中で最も活性度が高い（末尾の順序の）グループである。発話音声受信順序の末尾のグループは、発話音声がアップロードされる頻度が最も少ないためである。

（音声区間t終了時の発話音声受信順序）
グループＡ、Ｂ、Ｃ、Ｄ、Ｅ、Ｆ、Ｇ、Ｈ、Ｉ、Ｊの順であったとする。
（音声区間t+1終了時の発話音声受信順序）
音声区間t+1内で、上位５つのグループ（Ａ、Ｂ、Ｃ、Ｄ、Ｅ）の発話音声データを受信できたとする。このとき、これら５つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、音声区間t+2における発話音声受信順序としてグループＢ、Ｃ、Ｄ、Ｅ、Ａの順に更新されている。
ここで、発話音声受信順序について、グループＡを末尾へ移行させ、グループＪと入れ替える。結果的に、音声区間t+2における発話音声受信順序としてグループＢ、Ｃ、Ｄ、Ｅ、Ａの順に更新されている。
（音声区間t+2終了時の発話音声受信順序）
音声区間t+2内で、上位３つのグループ（Ｂ、Ｃ、Ｄ）の発話音声データを受信できたとする。このとき、これら３つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、音声区間t+3における発話音声受信順序としてグループＤ、Ｂ、Ｃの順に更新されている。
ここで、発話音声受信順序について、グループＣを末尾へ移行させ、グループＩと入れ替える。結果的に、音声区間t+3における発話音声受信順序としてグループＤ、Ｂ、Ｉの順に更新されている。
（音声区間t+3終了時の発話音声受信順序）
音声区間t+3内で、上位７つのグループ（Ｄ、Ｂ、Ｉ、Ｅ、Ｊ、Ｆ、Ｇ）の発話音声データを受信できたとする。このとき、これら７つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、音声区間t+4における発話音声受信順序としてグループＤ、Ｂ、Ｅ、Ｇ、Ｉ、Ｊ、Ｆの順に更新されている。
ここで、発話音声受信順序について、グループＦを末尾へ移行させ、グループＨと入れ替える。結果的に、音声区間t+4における発話音声受信順序としてグループＤ、Ｂ、Ｅ、Ｇ、Ｉ、Ｊ、Ｈの順に更新されている。
（音声区間t+4終了時の発話音声受信順序）
音声区間t+4内で、上位５つのグループ（Ｄ、Ｂ、Ｅ、Ｇ、Ｉ）の発話音声データを受信できたとする。このとき、これら５つのグループのみで、議論の活性度に基づいて発話音声受信順序の上位を更新する。ここでは、音声区間t+5における発話音声受信順序としてグループＢ、Ｄ、Ｅ、Ｇ、Ｉの順に更新されている。

｛長期間、発話分析されていないグループを上位へ移行させる実施形態｝
発話音声受信順序更新部１２は、グループの発話音声受信順序の中で、第３の所定期間（例えば２５分）以上、発話分析がされていないグループを、グループの発話音声受信順序の上位に移行し、当該グループの各ユーザ端末から発話音声データを受信する頻度を多くする。

＜過去複数の音声区間の累積した発話分析＞
発話音声受信順序更新部１２は、時刻tよりも過去複数の音声区間の累積した発話音声データの発話分析結果に基づいて、時刻t+2におけるグループの発話音声受信順序を更新する。

前述の実施形態によれば、発話分析は、時刻tだけ過去の音声区間における発話音声に基づいて発話分析される。しかしながら、グループワークは一時的ではなく、議論の時間は継続しており、その変化を加味して議論の活性度を把握することが好ましい。
そのために、過去複数の音声区間の発話音声データの平均活性度を用いる。
Ｒ_A＝1/n Σ_i ⁿＲ_A,i
n：過去の音声区間の数
i：過去の音声区間
Ｒ_A,i：音声区間iの発話音声データの平均活性度
Ｒ_A：過去複数の音声区間の発話音声データの活性度
これよって、議論の活性度の一時的な変動を吸収し、大きな議論の流れの中で、発話音声データを分析することができる。

＜ユーザに基づく発話音声受信順序の決定＞
前述した実施形態では、グループ単位のユーザ端末に対して指導・助言を行う場合につて説明した。勿論、ユーザ端末単位であってもよい。即ち、１つユーザ端末を含む１つのグループを構成することによって、前述した実施形態を実現することができる。これによって、発話音声受信順序は、各ユーザの議論の活性度が低い順に並ぶこととなる。
１つのグループの中でも、議論の活性度が低いユーザの発話音声が早期にアップロードされ、そのユーザに対して教師は、指導・助言をすることができる。

図１０は、本発明における通知サーバを含むシステム構成図である。

図１０によれば、図５と比較して、管理者端末３と、通知サーバ５とを更に有する。
発話分析装置１の発話音声受信順序更新部１２は、更新した発話音声受信順序を、管理者端末３へ送信する。
管理者端末３は、グループワークの教師によって操作されるものであり、複数のグループを管理する。管理者端末３は、発話分析装置１から発話受信順序を受信し、その発話受信順序を管理者（教師）へ明示する。そして、管理者の操作に応じて、発話音声受信順序に基づくグループＩＤ、及び、そのグループＩＤに含まれるユーザ端末ＩＤを、通知サーバ５及び発話分析装置１へ送信する。尚、この際に、管理者の操作に応じて、指導済みのグループＩＤを同時に送信してもよい。
通知サーバ５は、管理者端末３から受信したグループＩＤに属する複数のユーザ端末２へ、複数のユーザ端末へ発話区間に対応した発話音声要求を、プッシュ的に送信する。

図１１は、図１０のシステムに基づくシーケンス図である。

（Ｓ１）発話分析装置１は、グループ毎に複数のユーザ端末から複数の発話音声データを受信する。そして、時刻t+1の音声区間に発話分析が完了した時刻tの音声区間の発話音声データの発話分析結果に基づいて、時刻t+2の音声区間におけるグループの発話音声受信順序を更新する。
（Ｓ２）発話分析装置１は、当該発話音声受信順序を管理者端末３へ送信する。
（Ｓ３）管理者端末３は、管理者の操作に応じて、発話音声受信順序に基づくグループ識別子を、通知サーバ５及び発話分析装置１へ送信する。
（Ｓ４）通知サーバ５が、管理者端末から受信したグループ識別子に属する複数のユーザ端末へ発話区間に対応した発話音声要求を送信する。
これに対し、発話音声要求を受信した各ユーザ端末は、発話音声を発話分析装置へ送信する。

前述した図２のシーケンスによれば、発話分析装置１が、ユーザ端末２へ発話音声要求を送信している。しかしながら、例えばＨＴＴＰ(HyperText Transfer Protocol)の場合、クライアント（ユーザ端末にインストールされたブラウザアプリケーション）がサーバ（発話分析装置）へリクエストを送信し、当該サーバからクライアントへレスポンスを返信する要求応答型のPull方式となる。そのために、発話分析装置１が、例えばスマートフォンのようなユーザ端末２へ、プッシュ的に送信することが難しい。
これに対し、図１１のシーケンスによれば、図２のシーケンスと比較して、ユーザ端末２から発話音声を受信し且つ分析する発話分析装置１と、ユーザ端末２へ発話音声要求を送信する通知サーバ５とに分担して実現している。

通知サーバ５におけるプッシュ的な情報送信機能として、例えば、JavaScript（登録商標）のWeb Notification APIや、Google（登録商標）のFirebase Notification（登録商標）、Apple（登録商標）のPush Notificationなどがある。これらのＡＰＩ(Application Programming Interface)に対応したアプリケーションを、ユーザ端末２にインストールしておくことによって、サーバプッシュを実現することができる。

＜通知サーバ５による他の実施形態＞
図１０及び図１１のシステムによれば、管理者端末３からの指示によって、通知サーバ５を用いて、ユーザ端末２に対する様々な制御を実行することができる。
ここで、ユーザ端末２は、専用の発話収録アプリケーションをインストールしており、管理者端末３も、専用の教師制御アプリケーションをインストールしている。
ユーザ端末２の発話収録アプリケーションは、初期設定として固有の端末ＩＤを生成し、その端末ＩＤ及びグループＩＤを発話分析装置１へ予め登録する。そして、発話収録アプリケーションは、通知サーバ５から受信する指示情報を解読し、それに応じて機能を発動することができる。
管理者端末３の教師制御アプリケーションは、発話分析装置１から受信したグループＩＤ及び端末ＩＤを、ディスプレイによって管理者へ明示する。そして、教師制御アプリケーションは、グループＩＤ毎又は端末ＩＤ毎に、ユーザ端末２に対して通知サーバ２を介して指示情報を送信することができる。

具体的には、以下のような他の実施形態を実現することもできる。
［第１の他の実施形態：ユーザ端末２に対する発話収録の開始／終了の制御］
管理者端末３からの指示情報によって、通知サーバ５は、ユーザ端末２の音声区間の開始／終了を同期させる。グループワークを時系列で正確に発話分析するためには、複数のユーザ端末２における音声区間を同期させることが必要となる。
管理者端末３は、管理者における発話収録の開始／終了のボタン操作によって、全てのユーザ端末ＩＤを含む音声区間同期要求（開始／終了）が、通知サーバ５へ送信される。
これに対して、通知サーバ５は、複数のユーザ端末２へ同報的に、音声区間同期要求（開始／終了）を送信する。
音声区間同期要求（開始／終了）を受信したユーザ端末２は、グループワーク時間における発話音声の収録を開始し又は終了する。
これによって、グループワーク時間及び音声区間を、全てのユーザ端末２について同期させることでき、収録の時間差が無くなり、時系列に正確な発話分析をすることができる。

［第２の他の実施形態：ユーザ端末２の音声区間の時間幅／区切りタイミングの制御］
管理者端末３からの指示情報によって、通知サーバ５は、ユーザ端末２の音声区間の時間幅／区切りタイミングを制御する。これによって、固定的な音声区間ではなく、グループワークの内容に応じて音声区間を可変制御することができる。
制御可能なものとしては、音声区間の時間幅（例えば5分間->10分間）、又は、区切りタイミング（例えば11:05、11:15、11:20など）がある。
例えば最初は、音声区間の時間幅を長くしてグループワークの発話状況を分析し、その後、音声区間の時間幅を短くしてグループワークの発話状況を分析する。これによって、教師の必要に応じて、発話音声の分析結果に応じてアドバイスを提供することができる。

［第３の他の実施形態：ユーザ端末２の起動状態の認識］
管理者端末３からの指示情報によって、通知サーバ５は、ユーザ端末２の電源ＯＮ／ＯＦＦを確認する。
管理者端末３は、管理者における起動確認のボタン操作によって、全てのユーザ端末ＩＤを含む起動確認要求が、通知サーバ５へ送信される。
これに対して、通知サーバ５は、複数のユーザ端末２へ同報的に、起動確認要求を送信する。
起動確認要求を受信したユーザ端末２は、起動応答を発話分析装置１へ送信する。
発話分析装置１は、起動応答を受信した端末ＩＤのリストを、管理者端末３へ送信する。
これによって、管理者端末３は、端末ＩＤのリストを管理者へ明示し、管理者は起動中の端末ＩＤを認識することができる。これは、欠席者の確認にも利用できる。

前述で詳細に説明したように、本発明の発話分析装置、システム及びプログラムによれば、議論が活発でないグループの発話音声を逐次優先的に分析することができる。これによって、教師は、グループワークの中で、議論の活性度が低いグループを優先的に認識することでき、早期に指導・助言をすることができる。

以上に述べた本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。

１発話分析装置
１０発話分析部
１１発話音声受信順序制御部
１２発話音声受信順序更新部
２ユーザ端末
３管理者端末
４アクセスポイント
５通知サーバ

Claims

連続する所定の音声区間毎にユーザの発話音声を収録する各ユーザ端末へ、発話音声要求を送信し、発話音声データを受信する発話分析装置において、
１つ以上のユーザ端末を含む１つ以上のグループを構成すると共に、グループの発話音声受信順序を記憶しており、
前記発話音声データを発話分析する発話分析手段と、
時刻t+1の音声区間で可能な限り、グループの発話音声受信順序に応じて、各ユーザ端末へ発話音声要求を送信し、各ユーザ端末から時刻tの音声区間の発話音声データを受信し、当該発話音声データを前記発話分析手段に発話分析させる発話音声受信制御手段と、
時刻t+1の音声区間に発話分析が完了した時刻tの音声区間の発話音声データの発話分析結果に基づいて、時刻t+2の音声区間におけるグループの発話音声受信順序を更新する発話音声受信順序更新手段と
を有することを特徴とする発話分析装置。
前記発話音声受信順序更新手段は、各グループの発話音声データから変換されたテキストに基づいて、議論の活性度が低い順にグループの発話音声受信順序を更新する
ことを特徴とする請求項１に記載の発話分析装置。
前記発話音声受信順序更新手段は、
予め記憶した理解状態キーワード群及び不理解状態キーワード群を参照して、
前記テキストに含まれる時系列の各キーワードに対して理解状態か不理解状態かを決定し、両状態の行き来数が少ないグループほど活性度が低いと判定し、その活性度が低い順にグループの発話音声受信順序を更新する
ことを特徴とする請求項２に記載の発話分析装置。
前記発話音声受信順序更新手段は、
予め記憶した理解レベル毎のレベルキーワード群を参照して、
前記テキストに含まれるキーワードを、理解レベルの低いレベルキーワードの一致数の割合が多いグループほど活性度が低いと判定し、その活性度が低い順にグループの発話音声受信順序を更新する
ことを特徴とする請求項２に記載の発話分析装置。
前記発話音声受信制御手段について、時刻t+1の音声区間に発話分析が完了したグループの発話音声受信順序に応じて発話分析するグループ数は、発話音声データサイズ及び発話分析処理時間に応じて変化する
ことを特徴とする請求項１から４のいずれか１項に記載の発話分析装置。
前記発話音声受信制御手段は、時刻t+1の音声区間に発話分析が完了したグループの発話音声受信順序に応じて発話分析するグループ数が、第１の所定期間変化しない場合、時刻t+1の音声区間を越えても、全てのグループの各ユーザ端末へ発話音声要求を送信し、各ユーザ端末から時刻tの音声区間の発話音声データを受信し、当該発話音声データを発話分析する
ことを特徴とする請求項５に記載の発話分析装置。
前記発話音声受信制御手段は、時刻t+1の音声区間に発話分析が完了したグループの発話音声受信順序に応じて発話分析するグループ数が、第２の所定期間変化しない場合、時刻t+1の音声区間を越えても、受信すべきグループ数を所定数増分して、各ユーザ端末へ発話音声要求を送信し、各ユーザ端末から時刻tの音声区間の発話音声データを受信し、当該発話音声データを発話分析する
ことを特徴とする請求項５に記載の発話分析装置。
前記発話音声受信順序更新手段は、時刻t+2の音声区間におけるグループの発話音声受信順序の中で、所定条件に基づくグループを下位に移行し、当該グループの各ユーザ端末から発話音声データを受信する頻度を少なくする
ことを特徴とする請求項１から６のいずれか１項に記載の発話分析装置。
前記発話音声受信順序更新手段における前記所定条件とは、既に指導済みのグループであって、オペレータ操作によって指示されたグループである
ことを特徴とする請求項８に記載の発話分析装置。
前記発話音声受信順序更新手段における前記所定条件とは、グループの発話音声受信順序の中で最も活性度が高い（末尾の順序の）グループである
ことを特徴とする請求項８に記載の発話分析装置。
前記発話音声受信順序更新手段は、グループの発話音声受信順序の中で、第３の所定期間以上、発話分析がされていないグループを、グループの発話音声受信順序の上位に移行し、当該グループの各ユーザ端末から発話音声データを受信する頻度を多くする
ことを特徴とする請求項８から１０のいずれか１項に記載の発話分析装置。
前記発話音声受信順序更新手段は、時刻tよりも過去の複数の音声区間の累積した発話音声データの発話分析結果に基づいて、時刻t+2におけるグループの発話音声受信順序を更新する
ことを特徴とする請求項１から１１のいずれか１項に記載の発話分析装置。
請求項１から１２のいずれか１項に記載の発話分析装置と、
ユーザの発話音声を収録する複数のユーザ端末と、
複数のグループを管理する管理者端末と、
複数のユーザ端末へ発話音声要求を送信する通知サーバと
を有するシステムであって、
前記発話分析装置は、前記発話音声受信順序を前記管理者端末へ送信し、
前記管理者端末は、管理者の操作に応じて、前記発話音声受信順序に基づくグループ識別子を、前記通知サーバへ送信し、
前記通知サーバは、前記管理者端末から受信した前記グループ識別子に属する複数のユーザ端末へ前記発話音声要求を送信し、
前記発話音声要求を受信した各ユーザ端末は、発話音声を前記発話分析装置へ送信する
ことを特徴とするシステム。
連続する所定の音声区間毎にユーザの発話音声を収録する各ユーザ端末へ、発話音声要求を送信し、発話音声データを受信するサーバに搭載されたコンピュータを機能させる発話分析プログラムにおいて、
１つ以上のユーザ端末を含む１つ以上のグループを構成すると共に、グループの発話音声受信順序を記憶しており、
前記発話音声データを発話分析する発話分析手段と、
時刻t+1の音声区間で可能な限り、グループの発話音声受信順序に応じて、各ユーザ端末へ発話音声要求を送信し、各ユーザ端末から時刻tの音声区間の発話音声データを受信し、当該発話音声データを前記発話分析手段に発話分析させる発話音声受信制御手段と、
時刻t+1の音声区間に発話分析が完了した時刻tの音声区間の発話音声データの発話分析結果に基づいて、時刻t+2の音声区間におけるグループの発話音声受信順序を更新する発話音声受信順序更新手段と
してコンピュータを機能させることを特徴とする発話分析プログラム。
連続する所定の音声区間毎にユーザの発話音声を収録する各ユーザ端末へ、発話音声要求を送信し、発話音声データを受信するサーバの発話分析方法において、
前記サーバは、
１つ以上のユーザ端末を含む１つ以上のグループを構成すると共に、グループの発話音声受信順序を記憶しており、
時刻t+1の音声区間で可能な限り、グループの発話音声受信順序に応じて、各ユーザ端末へ発話音声要求を送信し、各ユーザ端末から時刻tの音声区間の発話音声データを受信し、当該発話音声データを発話分析する第１のステップと、
時刻t+1の音声区間に発話分析が完了した時刻tの音声区間の発話音声データの発話分析結果に基づいて、時刻t+2の音声区間におけるグループの発話音声受信順序を更新する第２のステップと
を実行することを特徴とするサーバの発話分析方法。