JP6187112B2

JP6187112B2 - 音声解析装置、表示装置、音声解析システムおよびプログラム

Info

Publication number: JP6187112B2
Application number: JP2013208559A
Authority: JP
Inventors: 靖飯田; 啓一根本; 晃雅小村
Original assignee: Fuji Xerox Co Ltd; Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2013-10-03
Filing date: 2013-10-03
Publication date: 2017-08-30
Anticipated expiration: 2033-10-03
Also published as: JP2015072635A

Description

本発明は、音声解析装置、表示装置、音声解析システム、および音声解析プログラムに関する。

特許文献１には、各参加者の発言時間を１発言毎に各参加者に関連付けて取得する手段と、１発言毎に、発言時間を用いて得点を計算して参加者に関連付けて取得する得点計算手段と、各参加者の得点を累積加算して各参加者の累積得点を取得する手段と、各参加者の累積得点の平均値を計算する手段と、各参加者の累積得点から最小累積得点を特定し、最小累積得点と平均値との差を計算する手段と、差が予め設定した閾値を超えるか否かを判定し、超えている時に「発言を促す」ことを決定する手段と、「発言を促す」ことが決定された時に、最小累積得点に関連する参加者に対して発言を促す出力を行う手段と、を備えている会話支援装置が開示されている。
また非特許文献１には、参加者を表すアイコンと円形のアイコンが表示され、音声量に応じて円形のアイコンが近づく表示を行なう表示装置が開示されている。

特開２０１２−１９８７２６号公報

Meeting mediator:enhancing group collaboration using sociometric feedback Proceedings of the 2008 ACM conference on Computer supported cooperative work Pages 457-466

発話者同士の発話状態の遷移を、視覚的に把握することが望まれている。

請求項１に記載の発明は、音声を取得する音声取得手段により取得された複数の発話者の音声の、当該音声に関する情報を取得する音声情報取得部と、複数の発話者のそれぞれの発話状態を表す第１のアイコン、および当該第１のアイコンの軌跡を表示する表示部と、前記音声取得手段により取得された前記音声に関する情報を基に、前記第１のアイコンの表示位置および前記軌跡の表示を決定するとともに予め定められた領域において当該第１のアイコンが通過した方向を示す表示を行なうように前記表示部を制御する表示決定部と、を備えたことを特徴とする音声解析装置である。
請求項２に記載の発明は、前記表示部は、前記複数の発話者のそれぞれを表す第２のアイコンをさらに表示し、前記第１のアイコンと当該第２のアイコンとの位置関係により前記発話状態を表すことを特徴とする請求項１に記載の音声解析装置である。
請求項３に記載の発明は、前記表示決定部は、前記複数の発話者のうち何れかの発話者の発話があったときに、前記第１のアイコンの表示位置を、発話を行なった発話者に対応する前記第２のアイコンに向けて距離が近くなるように決定するとともに、当該第１のアイコンの表示位置を、当該第１のアイコンと当該第２のアイコンとの距離が近くなるに従い当該第１のアイコンの移動距離を前回の移動距離よりも小さくするように決定することを特徴とする請求項２に記載の音声解析装置である。
請求項４に記載の発明は、前記表示決定部は、予め定められた領域において前記第１のアイコンが通過した頻度に応じて、当該領域における前記軌跡の表示を変更するように前記表示部を制御する、ことを特徴とする請求項１乃至３の何れか１項に記載の音声解析装置である。
請求項５に記載の発明は、前記表示決定部は、発話者の発話状態に応じた点数をさらに決定し、前記表示部は、前記点数を表示することを特徴とする請求項１乃至４の何れか１項に記載の音声解析装置である。
請求項６に記載の発明は、音声を取得する音声取得手段により取得された複数の発話者の音声の、当該音声に関する情報を取得する音声情報取得部と、複数の発話者のそれぞれの発話状態を表す第１のアイコン、複数の発話者のそれぞれを表す第２のアイコンおよび当該第１のアイコンの軌跡を表示する表示部と、前記音声取得手段により取得された前記音声に関する情報を基に、前記第１のアイコンの表示位置および前記軌跡の表示を決定する表示決定部と、を備え、前記表示決定部は、複数の発話者のうち何れかの発話者の発話があったときに、前記第１のアイコンの表示位置を、発話を行なった発話者に対応する前記第２のアイコンに向けて移動させ、当該発話を行なった発話者の発話が停止した場合は、当該第１のアイコンの移動を停止し、別の発話者が発話を始めると、当該第１のアイコンの表示位置を、停止した位置から発話を行なった当該別の発話者に対応する当該第２のアイコンに向けて移動させる表示を行なうように前記表示部を制御することを特徴とする音声解析装置である。
請求項７に記載の発明は、音声を取得する音声取得手段により取得された複数の発話者の音声の、当該音声に関する情報を取得する音声情報取得部と、複数の発話者のそれぞれの発話状態を表す第１のアイコン、当該第１のアイコンの軌跡および当該第１のアイコンの位置を把握しやすくするための補助線を表示する表示部と、前記音声取得手段により取得された前記音声に関する情報を基に、前記第１のアイコンの表示位置および前記軌跡の表示を決定する表示決定部と、を備え、前記表示決定部は、前記第１のアイコンと前記補助線との位置関係により前記軌跡の表示を変更することを特徴とする音声解析装置である。
請求項８に記載の発明は、音声に関する情報である音声情報を蓄積する蓄積部と、前記蓄積部に蓄積された前記音声情報に基づいて、複数の発話者の発話状態を表す第１のアイコンの表示位置及び当該第１のアイコンの軌跡の表示を決定するとともに予め定められた領域において当該第１のアイコンが通過した方向を示す表示を行なう表示決定部と、を有する音声解析装置である。
請求項９に記載の発明は、複数の発話者のそれぞれの発話状態を表す第１のアイコンと、前記第１のアイコンの軌跡と、予め定められた領域において前記第１のアイコンが通過した方向と、を表示し、前記第１のアイコンの表示位置、前記軌跡および前記方向の表示は、音声を取得する音声取得手段により取得された複数の発話者の音声の、当該音声に関する情報を基に決定されたものであることを特徴とする表示装置である。
請求項１０に記載の発明は、発話者の音声を取得する音声取得部と、前記音声取得部により取得された複数の発話者の音声の、当該音声に関する情報を基に、発話者又は当該発話者が装着している当該音声取得部を識別する識別部と、複数の発話者のそれぞれの発話状態を表す第１のアイコン、および当該第１のアイコンの軌跡を表示する表示部と、前記識別部により識別された発話者又は当該発話者が装着している前記音声取得部の情報を基に、前記第１のアイコンの表示位置および前記軌跡の表示を決定するとともに予め定められた領域において当該第１のアイコンが通過した方向を示す表示を行なうように前記表示部を制御する表示決定部と、を備えたことを特徴とする音声解析システムである。
請求項１１に記載の発明は、コンピュータに、音声を取得する音声取得手段により取得された発話者の音声の、当該音声に関する情報を取得する機能と、取得された前記音声に関する情報を基に、複数の発話者のそれぞれの発話状態を表す第１のアイコンの表示部における表示位置および当該第１のアイコンの軌跡の表示を決定するとともに予め定められた領域において当該第１のアイコンが通過した方向を示す表示を行なうように前記表示部を制御する機能と、を実現させるプログラムである。

請求項１の発明によれば、発話者同士の発話状態の遷移を、視覚的に把握することができる。また本構成を採用しない場合に比較して、発話者の会話関係をさらに明確に把握することができる。
請求項２の発明によれば、本構成を採用しない場合に比較して、発話者の発話量を、より容易に把握することができる。
請求項３の発明によれば、本構成を採用しない場合に比較して、第１のアイコンの移動を、より明確に把握することができる。
請求項４の発明によれば、本構成を採用しない場合に比較して、発話者の会話関係を、より容易に把握することができる。
請求項５の発明によれば、発話者の発話状態を点数によって把握することができる。
請求項８の発明によれば、発話者同士の発話状態の遷移を、視覚的に把握することができる。また本構成を採用しない場合に比較して、発話者の会話関係をさらに明確に把握することができる。
請求項９の発明によれば、発話者同士の発話状態の遷移を、視覚的に把握できる態様で表示することができる。また本構成を採用しない場合に比較して、発話者の会話関係をさらに明確に把握することができる。
請求項１０の発明によれば、本構成を採用しない場合に比較して、発話者同士の発話状態の遷移を、視覚的に把握することができる。また本構成を採用しない場合に比較して、発話者の会話関係をさらに明確に把握することができる。
請求項１１の発明によれば、発話者同士の発話状態の遷移を、視覚的に把握することができるとともに本構成を採用しない場合に比較して、発話者の会話関係をさらに明確に把握することができる機能をコンピュータにより実現できる。

本実施形態における音声解析システムの構成例を示す図である。本実施形態における端末装置の構成例を示す図である。装着者および他者の口（発声部位）と、マイクロフォンとの位置の関係を示す図である。マイクロフォンと音源との間の距離と音圧（入力音量）との関係を示す図である。装着者自身の発話音声と他者の発話音声の識別方法を示す図である。本実施形態における端末装置の動作を示すフローチャートである。出力部で表示される画像の一例を説明した図である。予め定められた規則により移動する発話状態アイコンについて示した図である。予め定められた領域の一部と何れの領域を塗りつぶすかを決定する方法について示した図である。（ａ）は、図９で示す８行×８列の正方形の各領域において発話状態アイコンが通過した頻度として、通過した回数を示した図である。（ｂ）は、この頻度に応じて各領域を塗りつぶす色の濃度を変更する場合を示した図である。（ａ）〜（ｄ）は、発話状態アイコンが通過した方向を示す表示について説明した図である。データ解析部の機能構成例について説明した図である。本実施形態におけるホスト装置の動作を示すフローチャートである。

＜システム構成例＞
図１は、本実施形態における音声解析システムの構成例を示す図である。
図１に示すように、本実施形態の音声解析システム１は、音声取得部の一例としての端末装置１０と、音声解析装置の一例であるホスト装置２０とを備えて構成される。端末装置１０とホスト装置２０とは、無線通信回線を介して接続されている。無線通信回線の種類としては、Ｗｉ−Ｆｉ（Wireless Fidelity）、Bluetooth（登録商標）、ZigBee、ＵＷＢ（Ultra Wideband）等の既存の方式による回線を用いて良い。また、図示の例では、端末装置１０が１台のみ記載されているが、詳しくは後述するように、端末装置１０は、使用する者のそれぞれが装着して使用するものであり、実際には使用する者の数分の端末装置１０が用意される。なお以下、端末装置１０を装着する者を装着者と呼ぶ。また装着者のうち会話等を行なうために音声を発した者を発話者と呼ぶ。

端末装置１０は、音声を取得する音声取得手段としての複数のマイクロフォン（第１マイクロフォン１１および第２マイクロフォン１２）と、増幅器（第１増幅器１３および第２増幅器１４）とを備える。また、端末装置１０は、取得した音声を解析する音声解析部１５と、解析結果を音声に関する情報としてホスト装置２０に送信するためのデータ送信部１６とを備え、さらに電源部１７とを備える。

第１マイクロフォン１１と第２マイクロフォン１２は、装着者の口（発声部位）からの距離が異なる位置に配される。ここでは、第１マイクロフォン１１は装着者の口（発声部位）から遠い位置（例えば、３５ｃｍ程度）に配置され、第２マイクロフォン１２は装着者の口（発声部位）に近い位置（例えば、１０ｃｍ程度）に配置されるものとする。本実施形態の第１マイクロフォン１１および第２マイクロフォン１２として用いられるマイクロフォンの種類としては、ダイナミック型、コンデンサ型等、既存の種々のものを用いて良い。とくに無指向性のＭＥＭＳ（Micro Electro Mechanical Systems）型マイクロフォンが好ましい。

第１増幅器１３および第２増幅器１４は、それぞれ第１マイクロフォン１１および第２マイクロフォン１２が取得した音声に応じて出力する電気信号（音声信号）を増幅する。本実施形態の第１増幅器１３および第２増幅器１４として用いられる増幅器としては、既存のオペアンプ等を用いて良い。

音声解析部１５は、第１増幅器１３および第２増幅器１４から出力された音声信号を解析し、端末装置１０を装着した装着者自身が発話した音声か、他者の発話による音声かを識別する。よって音声解析部１５は、第１マイクロフォン１１および第２マイクロフォン１２により取得された複数の発話者の音声の、音声に関する情報を基に、発話者を識別する識別部として機能する。音声識別の具体的な処理の内容については後述する。

データ送信部１６は、音声解析部１５による解析結果を含む取得データと端末ＩＤを、上記の無線通信回線を介してホスト装置２０へ送信する。ホスト装置２０へ送信する情報としては、ホスト装置２０において行われる処理の内容に応じて、上記の解析結果の他、例えば、第１マイクロフォン１１および第２マイクロフォン１２による音声の取得時刻、取得音声の音圧等の情報を含めて良い。また端末装置１０に音声解析部１５による解析結果を蓄積するデータ蓄積部を設け、一定期間の保存データを一括送信しても良い。なお有線回線で送信しても良い。

電源部１７は、上記の第１マイクロフォン１１、第２マイクロフォン１２、第１増幅器１３、第２増幅器１４、音声解析部１５およびデータ送信部１６に電力を供給する。電源としては、例えば乾電池や充電池等の既存の電源が用いられる。また、電源部１７は、必要に応じて、電圧変換回路および充電制御回路等の周知の回路を含む。

ホスト装置２０は、端末装置１０から送信されたデータを受信するデータ受信部２１と、受信したデータを蓄積するデータ蓄積部２２と、蓄積したデータを解析するデータ解析部２３と、解析結果を出力する出力部２４とを備える。このホスト装置２０は、例えばパーソナルコンピュータ等の情報処理装置により実現される。また、上記のように本実施形態では複数台の端末装置１０が使用され、ホスト装置２０は、その複数台の端末装置１０の各々からデータを受信する。

データ受信部２１は、第１マイクロフォン１１、第２マイクロフォン１２より取得された複数の発話者の音声の、この音声に関する情報を取得する音声情報取得部として機能する。データ受信部２１は、上記の無線回線に対応しており、各端末装置１０からデータを受信してデータ蓄積部２２へ送る。データ蓄積部２２は、例えばパーソナルコンピュータの磁気ディスク装置等の記憶装置により実現され、データ受信部２１から取得した受信データを発話者別に蓄積する。ここで、発話者の識別は、端末装置１０から送信される端末ＩＤと、あらかじめホスト装置２０に登録されている発話者名と端末ＩＤの照合により行う。また、端末装置１０から端末ＩＤのかわりに装着者状態を送信するようにしてもよい。データ蓄積部２２は、音声に関する情報である音声情報を蓄積する蓄積部として機能する。

データ解析部２３は、例えばパーソナルコンピュータのプログラム制御されたＣＰＵにより実現され、データ蓄積部２２に蓄積されたデータを解析する。具体的な解析内容および解析手法は、本実施形態のシステムの利用目的や利用態様に応じて種々の内容および手法を取り得る。例えば、端末装置１０の装着者どうしの対話頻度や各装着者の対話相手の傾向を分析したり、対話における個々の発話の長さや音圧の情報から対話者の関係を類推したりすることが行われる。さらに本実施形態では、詳しくは後述するが、データ解析部２３は、第１マイクロフォン１１、第２マイクロフォン１２により取得された音声の、音声に関する情報を基に、複数の発話者のそれぞれの発話状態を表す発話状態アイコン２４１（図７参照）の表示位置および軌跡２４３（図７参照）の表示を決定する表示決定部として機能する。またデータ解析部２３は、データ蓄積部２２に蓄積された音声情報に基づいて、複数の発話者の発話状態を表す発話状態アイコン２４１の表示位置及び発話状態アイコン２４１の軌跡２４３の表示を決定する表示決定部として機能する。

出力部２４は、データ解析部２３による解析結果を出力したり、解析結果に基づく出力を行ったりする。この解析結果等を出力する手段は、システムの利用目的や利用態様、解析結果の内容や形式等に応じて、ディスプレイ表示、プリンタによる印刷出力、音声出力等、種々の手段を取り得るが、本実施形態では、ディスプレイ表示で行なう。本実施形態では、詳しくは後述するが、出力部２４は、発話状態アイコン２４１、およびこの発話状態アイコン２４１の軌跡２４３を表示する表示部（表示装置）として機能する。

＜端末装置の構成例＞
図２は、本実施形態における端末装置１０の構成例を示す図である。
上記のように、端末装置１０は、各装着者に装着されて使用される。装着者が装着可能とするため、本実施形態の端末装置１０は、図２に示すように、装置本体３０と、装置本体３０に接続された提げ紐４０とを備えた構成とする。図示の構成において、装着者は、提げ紐４０に首を通し、装置本体３０を首から提げて装着する。

装置本体３０は、金属や樹脂等で形成された薄い直方体のケース３１に、少なくとも第１増幅器１３、第２増幅器１４、音声解析部１５、データ送信部１６および電源部１７を実現する回路と電源部１７の電源（電池）とを収納して構成される。ケース３１には、装着者の氏名や所属等のＩＤ情報を表示したＩＤカード等を挿入するポケットを設けても良い。また、ケース３１自体の表面にそのようなＩＤ情報等を印刷したり、ＩＤ情報等を記載したシールを貼り付けたりしても良い。

提げ紐４０には、第１マイクロフォン１１および第２マイクロフォン１２が設けられる（以下、第１マイクロフォン１１と第２マイクロフォン１２とを区別しない場合には、マイクロフォン１１、１２と記載）。マイクロフォン１１、１２は、提げ紐４０の内部を通るケーブル（電線等）により、装置本体３０に収納された第１増幅器１３、第２増幅器１４に接続される。提げ紐４０の材質としては、革、合成皮革、木綿その他の天然繊維や樹脂等による合成繊維、金属等、既存の種々の材質を用いて良い。また、シリコン樹脂やフッ素樹脂等を用いたコーティング処理が施されていても良い。

この提げ紐４０は、筒状の構造を有し、提げ紐４０の内部にマイクロフォン１１、１２を収納している。マイクロフォン１１、１２を提げ紐４０の内部に設けることにより、マイクロフォン１１、１２の損傷や汚れを防ぎ、対話者がマイクロフォン１１、１２の存在を意識することが抑制される。なお、装着者の口（発声部位）から遠い位置に配置される第１マイクロフォン１１は、装置本体３０に設けても良い。本実施形態では、第１マイクロフォン１１が提げ紐４０に設けられる場合を例として説明する。

図２を参照すると、第１マイクロフォン１１は、提げ紐４０の装置本体３０に接続される端部（例えば、接続部位から１０ｃｍ以内の位置）に設けられている。これにより、装着者が提げ紐４０を首に掛けて装置本体３０を下げた状態で、第１マイクロフォン１１は、装着者の口（発声部位）から約３０ｃｍから４０ｃｍ程度離れた位置に配置される。なお、第１マイクロフォン１１が装置本体３０に設けられた場合も、装着者の口（発声部位）から第１マイクロフォン１１までの距離は同程度である。

第２マイクロフォン１２は、提げ紐４０の装置本体３０に接続される端部から離れた位置（例えば、接続部位から２０ｃｍ〜３０ｃｍ程度の位置）に設けられている。これにより、装着者が提げ紐４０を首に掛けて装置本体３０を下げた状態で、第２マイクロフォン１２は、装着者の首元（例えば鎖骨に当たる位置）に位置し、装着者の口（発声部位）から約１０ｃｍから２０ｃｍ程度離れた位置に配置される。

なお、本実施形態の端末装置１０は、図２に示す構成に限定されるものではない。例えば、マイクロフォン１１、１２は、第１マイクロフォン１１から装着者の口（発声部位）までの音波到達経路の距離が第２マイクロフォン１２から装着者の口（発声部位）までの音波到達経路の距離の数倍程度となるように、第１マイクロフォン１１と第２マイクロフォン１２の位置関係が特定されれば良い。したがって、第１マイクロフォン１１を首の後ろ側の提げ紐４０に設けても良い。また、マイクロフォン１１、１２は、上記のように提げ紐４０に設ける構成に限らず、種々の方法で装着者に装着して良い。例えば、第１マイクロフォン１１と第２マイクロフォン１２の各々を、個別にピン等を用いて衣服に固定するように構成しても良い。また、第１マイクロフォン１１と第２マイクロフォン１２の位置関係が所望の位置で固定されるようにデザインされた専用の装着具を用意して装着しても良い。

また、装置本体３０は、図２に示したように、提げ紐４０に接続されて装着者の首から提げられる構成に限らず、携帯することが容易な装置として構成されていれば良い。例えば、本実施形態のような提げ紐ではなく、クリップやベルトにより衣服や体に装着するように構成しても良いし、単にポケット等に納めて携帯するような構成としても良い。また、携帯電話その他の既存の携帯型電子情報端末に、マイクロフォン１１、１２からの音声信号を受け付けて増幅し、解析する機能を実現させても良い。

さらにまた、マイクロフォン１１、１２と装置本体３０（あるいは音声解析部１５）を有線で接続するのではなく、無線通信により接続しても良い。第１増幅器１３、第２増幅器１４、音声解析部１５、データ送信部１６および電源部１７は、上記の構成例では単一のケース３１に収納されることとしたが、複数の個体として構成しても良い。例えば、電源部１７をケース３１に収納せず、外部電源に接続して使用する構成としても良い。

＜取得音声の非言語情報に基づく発話者（自他）の識別＞
本実施形態のシステムは、端末装置１０に設けられた２つのマイクロフォン１１、１２により取得された音声の情報を用いて、端末装置１０の装着者自身の発話音声（自己の発話音声）と他者の発話音声とを識別する。言い換えれば、本実施形態では、取得音声の発話者に関して自他の別を識別する。また、本実施形態では、取得音声の情報のうち、形態素解析や辞書情報を用いて得られる言語情報ではなく、音圧（マイクロフォン１１、１２への入力音量）等の非言語情報に基づいて発話者を識別する。言い換えれば、言語情報により特定される発話内容ではなく、非言語情報により特定される発話状況から音声の発話者を識別する。

図１および図２を参照して説明したように、本実施形態において、端末装置１０の第１マイクロフォン１１は装着者の口（発声部位）から遠い位置に配置され、第２マイクロフォン１２は装着者の口（発声部位）に近い位置に配置される。すなわち、装着者の口（発声部位）を音源とすると、第１マイクロフォン１１と音源との間の距離と、第２マイクロフォン１２と音源との間の距離が大きく異なる。具体的には、第１マイクロフォン１１と音源との間の距離は、第２マイクロフォン１２と音源との間の距離の１．５〜４倍程度である。ここで、マイクロフォン１１、１２における取得音声の音圧は、マイクロフォン１１、１２と音源との間の距離が大きくなるにしたがって減衰する。したがって、装着者の発話音声に関して、第１マイクロフォン１１における取得音声の音圧と第２マイクロフォン１２における取得音声の音圧とは大きく異なる。

一方、装着者以外の者（他者）の口（発声部位）を音源とした場合を考えると、その他者が装着者から離れているため、第１マイクロフォン１１と音源との間の距離と、第２マイクロフォン１２と音源との間の距離は、大きく変わらない。装着者に対する他者の位置によっては、両距離の差は生じ得るが、装着者の口（発声部位）を音源とした場合のように、第１マイクロフォン１１と音源との間の距離が第２マイクロフォン１２と音源との間の距離の数倍となることはない。したがって、他者の発話音声に関して、第１マイクロフォン１１における取得音声の音圧と第２マイクロフォン１２における取得音声の音圧とは、装着者の発話音声の場合のように大きく異なることはない。

図３は、装着者および他者の口（発声部位）と、マイクロフォン１１、１２との位置の関係を示す図である。
図３に示す関係において、装着者の口（発声部位）である音源ａと第１マイクロフォン１１との間の距離をＬａ１、音源ａと第２マイクロフォン１２との間の距離をＬａ２とする。また、他者の口（発声部位）である音源ｂと第１マイクロフォン１１との間の距離をＬｂ１、音源ｂと第２マイクロフォン１２との間の距離をＬｂ２とする。この場合、次の関係が成り立つ。
Ｌａ１＞Ｌａ２（Ｌａ１≒１．５×Ｌａ２〜４×Ｌａ２）
Ｌｂ１≒Ｌｂ２

図４は、マイクロフォン１１、１２と音源との間の距離と音圧（入力音量）との関係を示す図である。
上述したように、音圧は、マイクロフォン１１、１２と音源との間の距離に応じて減衰する。図４において、距離Ｌａ１の場合の音圧Ｇａ１と距離Ｌａ２の場合の音圧Ｇａ２とを比較すると、音圧Ｇａ２は、音圧Ｇａ１の４倍程度となっている。一方、距離Ｌｂ１と距離Ｌｂ２とが近似するため、距離Ｌｂ１の場合の音圧Ｇｂ１と距離Ｌｂ２の場合の音圧Ｇｂ２とは、ほぼ等しい。そこで、本実施形態では、この音圧比の差を用いて、取得音声における装着者自身の発話音声と他者の発話音声とを識別する。なお、図４に示した例では、距離Ｌｂ１、Ｌｂ２を６０ｃｍとしたが、ここでは音圧Ｇｂ１と音圧Ｇｂ２とがほぼ等しくなることに意味があり、距離Ｌｂ１、Ｌｂ２は図示の値に限定されない。

図５は、装着者自身の発話音声と他者の発話音声の識別方法を示す図である。
図４を参照して説明したように、装着者自身の発話音声に関して、第２マイクロフォン１２の音圧Ｇａ２は、第１マイクロフォン１１の音圧Ｇａ１の数倍（例えば４倍程度）である。また、他者の発話音声に関して、第２マイクロフォン１２の音圧Ｇａ２は、第１マイクロフォン１１の音圧Ｇａ１とほぼ等しい（１倍程度）。そこで、本実施形態では、第２マイクロフォン１２の音圧Ｇａ２と第１マイクロフォン１１の音圧Ｇａ１との比に閾値を設定する。そして、音圧比が閾値よりも大きい音声は装着者自身の発話音声と判断し、音圧比が閾値よりも小さい音声は他者の発話音声と判断する。図５に示す例では、閾値を２とし、音圧比Ｇａ２／Ｇａ１は閾値２を超えるので装着者自身の発話音声と判断され、音圧比Ｇｂ２／Ｇｂ１は閾値２よりも小さいので他者の発話音声と判断されている。

＜端末装置の動作例＞
図６は、本実施形態における端末装置１０の動作を示すフローチャートである。
図６に示すように、端末装置１０のマイクロフォン１１、１２が音声を取得すると、各マイクロフォン１１、１２から取得音声に応じた電気信号（音声信号）が第１増幅器１３および第２増幅器１４へ送られる（ステップ１０１）。第１増幅器１３および第２増幅器１４は、マイクロフォン１１、１２からの音声信号を取得すると、信号を増幅して音声解析部１５へ送る（ステップ１０２）。

音声解析部１５は、音声信号を取得した後、第１増幅器１３および第２増幅器１４で増幅された信号に対してフィルタリング処理を行う（ステップ１０３）。これにより信号から環境音等の雑音（ノイズ）の成分を除去する。次に、音声解析部１５は、雑音成分が除かれた信号に対し、一定の時間単位（例えば、数十分の一秒〜数百分の一秒）毎に、各マイクロフォン１１、１２の取得音声における平均音圧を求める（ステップ１０４）。そして、平均音圧がある閾値より大きいか否かを判断する（ステップ１０５）。
また、前述の実施の形態の説明において、予め定められた値との比較において、「以上」、「以下」、「より大きい」、「より小さい（未満）」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい（未満）」、「以上」、「以下」としてもよい。

音声解析部１５は、ステップ１０５で求めた各マイクロフォン１１、１２における平均音圧が閾値より大きい場合（ステップ１０５でＹｅｓ）、発話音声がある（発話が行われた）と判断する。

そして音声解析部１５は、第１マイクロフォン１１における平均音圧と第２マイクロフォン１２における平均音圧との比（音圧比）を求める（ステップ１０６）。ステップ１０６で求めた音圧比が閾値よりも大きい場合（ステップ１０７でＹｅｓ）、音声解析部１５は、発話音声は装着者自身の発話による音声であると判断する（ステップ１０８）。また、ステップ１０６で求めた音圧比が閾値よりも小さい場合（ステップ１０７でＮｏ）、音声解析部１５は、発話音声は他者の発話による音声であると判断する（ステップ１０９）。一方、ステップ１０４で求めた各マイクロフォン１１、１２における平均音圧の利得が無い場合（ステップ１０５でＮｏ）、音声解析部１５は、発話音声が無い（発話が行われていない）と判断する（ステップ１１０）。

この後、音声解析部１５は、データ送信部１６を介して、ステップ１０４〜ステップ１１０の処理で得られた解析結果を音声に関する情報としてホスト装置２０へ送信する（ステップ１１１）。この解析結果としては、例えば、発話の有無、装着者の情報（端末ＩＤ）、マイクロフォン１１、１２により取得された音声が装着者の発話音声であるか装着者以外の他者の発話音声であるかを識別した情報である自他識別情報等である。またこのとき、発話者毎（装着者自身または他者）の発話時間の長さや平均音圧の利得の値、その他の付加情報を解析結果と共にホスト装置２０へ送信させてもよい。

＜出力部で表示される画像についての説明＞
次にホスト装置２０の出力部２４で表示される画像について説明を行なう。
図７は、出力部２４で表示される画像の一例を説明した図である。
図示するように出力部２４では、複数の発話者のそれぞれの発話状態を表す第１のアイコンの一例である発話状態アイコン２４１と、複数の発話者のそれぞれを表す第２のアイコンの一例であるユーザアイコン２４２とを表示する。またさらに出力部２４では、発話状態アイコン２４１の軌跡２４３と、発話状態アイコン２４１やユーザアイコン２４２の位置を把握しやすくするための補助線２４４と、装着者の発話状態に応じて決定される点数の一例である得点２４５とを表示する。

発話状態アイコン２４１は、発話者の発話状態を予め定められた表示状態にて表すアイコンである。発話状態アイコン２４１は、予め定められた図形にて出力部２４に表示される。本実施の形態では、図７に示すように円形の図形により発話状態アイコン２４１を表している。ただし円形に限られるものではなく、多角形等の他の図形であってもよい。
発話状態アイコン２４１は、最初は中央位置Ｃを表示位置とする。そして端末装置１０の装着者のうち何れかが発話を行なうと、予め定められた規則に従い移動する。

ユーザアイコン２４２は、発話者を表すアイコンである。ユーザアイコン２４２は、本実施形態では、円環状の補助線２４４ａを等しく区切ったそれぞれの箇所に配置される。この場合、円環を６等分し、それぞれに６つのユーザアイコン２４２であるユーザアイコン２４２ａ、２４２ｂ、２４２ｃ、２４２ｄ、２４２ｅ、２４２ｆが配置される。これにより６人までの発話者に対応して表示を行なうことができる。またユーザアイコン２４２は、発話状態アイコン２４１とは異なり、移動を行なうことはなく固定された位置に表示される。
なお、ユーザアイコン２４２は、小さな絵や記号で表現したものに限らない。たとえば、明示的に表示せずとも円環の６頂点を結んだ６角形の各頂点を表す点（ドット）も含むものとする。

発話状態アイコン２４１は、その表示位置によって、発話者のそれぞれの発話状態を示す。
より具体的には、発話状態アイコン２４１は、現在発話を行なっている発話者を表すユーザアイコン２４２に向けて移動する。発話状態アイコン２４１の移動は、発話者の発話が続く限り連続して行なわれる。また発話者の発話が停止すると、発話状態アイコン２４１の移動は、停止する。また別の装着者が発話を始めると、同様にしてこの発話者を表すユーザアイコンに向けてその表示位置を移動させる。そして以降この動作を繰り返す。

このような規則により発話状態アイコン２４１を移動させると、発話者の発話量が多いほど、その発話者に対応するユーザアイコン２４２に発話状態アイコン２４１が近づくことになる。即ち、発話状態アイコン２４１からの距離がより近いユーザアイコン２４２に対応する発話者は、発話量が他の発話者より多いことになり、発話状態アイコン２４１からの距離がより遠いユーザアイコン２４２に対応する発話者は、発話量が他の発話者より少ないことになる。これにより発話者の発話状態を視覚的に判断することができる。これは、本実施形態では、発話状態アイコン２４１とユーザアイコン２４２との位置関係により発話状態を表す、と言い換えることもできる。

また本実施形態では、発話状態アイコン２４１は、さらに以下の規則によって移動する。
図８は、この規則により移動する発話状態アイコン２４１について示した図である。
（１回目の移動）
発話者が発話を始めると、上述の通り、この発話者に対応するユーザアイコン２４２に向けて発話状態アイコン２４１が移動を開始する。この場合、発話状態アイコン２４１は、ユーザアイコン２４２ｆに向けて移動を開始したとする。このとき発話状態アイコン２４１とユーザアイコン２４２ｆとの距離ｄ０の半分の距離である距離ｄ１の分だけ、発話状態アイコン２４１は、まず移動する。

（２回目の移動）
そして発話者の発話が予め定められた時間以上続いた場合、発話状態アイコン２４１は、２回目の移動を行なう。この移動量は、距離ｄ１のさらに半分の距離である距離ｄ２となる。

（３回目以降の移動）
以後、発話者の発話が予め定められた時間以上さらに続いた場合、同様に前回移動した距離の半分の距離を移動しつつ、発話状態アイコン２４１は、ユーザアイコン２４２ｆに近づいていく。

このようにすることで、最初の段階における発話状態アイコン２４１の移動がより明確に視認される。また発話状態アイコン２４１の移動量は徐々に小さくなるため、発話状態アイコン２４１がユーザアイコン２４２ｆにまで到達し、移動が停止することもない。

また本実施形態の出力部２４では、これに加えさらに発話状態アイコン２４１の軌跡２４３を表示する。これにより発話状態アイコン２４１の現在までの履歴を表示させることができる。
軌跡２４３は、本実施形態では、発話状態アイコン２４１が通過した箇所に対応する予め定められた領域を塗りつぶすことで表示される。
この領域は、例えば、出力部２４を１０ピクセル×１０ピクセルの大きさで格子状に区切ることで定められる領域である。

図９は、この領域の一部と何れの領域を塗りつぶすかを決定する方法について示した図である。
図９では、出力部２４の一部として８行×８列の正方形の各領域を図示している。このとき発話状態アイコン２４１が、Ｐ０で示す位置からＰ１に示す位置に移動したとする。
この場合、Ｐ０の位置の発話状態アイコン２４１の中心とＰ１の位置の発話状態アイコン２４１の中心を直線で結び、その直線をＰ０の位置からＰ１の位置に向けて距離ｘで区切っていく。そして区切り点（図９では、ｐ１、ｐ２、ｐ３、ｐ４、ｐ５、ｐ６、ｐ７、ｐ８、ｐ９で図示）が含まれる領域を塗りつぶす。図９では、塗りつぶした領域を領域Ａ１、Ａ２、Ａ３、Ａ４、Ａ５として表示している。そしてこの塗りつぶした領域Ａ１、Ａ２、Ａ３、Ａ４、Ａ５を出力部２４にて軌跡２４３として表示する。

また本実施形態では、この領域において発話状態アイコン２４１が通過した頻度に応じて、この領域における発話状態アイコン２４１の軌跡２４３の表示を変更する。
図１０（ａ）は、図９で示す８行×８列の正方形の各領域において発話状態アイコン２４１が通過した頻度として、通過した回数を示している。
そして図１０（ｂ）は、この頻度に応じて各領域を塗りつぶす色の濃度を変更する場合を示している。この場合、例えば、１行２列に位置する領域は、発話状態アイコン２４１が通過した回数が１２回である。また例えば、１行７列、１行８列に位置する領域は、発話状態アイコン２４１が通過した回数が、それぞれ１０回、３回である。
図１０（ｂ）の例では、発話状態アイコン２４１が通過した回数が多いほど、この領域の色の濃度を高くしている。
これにより例えば、２人の発話者が会話したような場合は、この発話者に対応する２つのユーザアイコン２４２を結ぶ直線上により濃度が高い色の軌跡２４３が表示されることになり、この２人の発話者が会話を行なっていたことがわかる。

なお、発話状態アイコン２４１の軌跡２４３の表示の変更には、色の濃度を変更する方法に限られるものではない。他に例えば、発話状態アイコン２４１が通過した回数に応じて、色を変化させるような方法でもよい。例えば、発話状態アイコン２４１が通過した回数が少ない場合は、青色とし、回数が多くなるに従い、青色から緑色、さらに緑色から赤色にその色を変更する。

また長時間発話者による発話が継続し、発話状態アイコン２４１が移動したときは、軌跡２４３により上記領域がほとんど塗りつぶされ、軌跡２４３が視認しにくくなるような場合も生じる。そのため予め定められた時間以前の（例えば、１ｈより前の）軌跡２４３を薄く表示させるようにしたり、あるいは消去するようにしたりしてもよい。

なお図９の場合、領域Ａ１、Ａ２、Ａ３、Ａ４のそれぞれには、ｐ１とｐ２、ｐ３とｐ４、ｐ５とｐ６、ｐ７とｐ８の各２個ずつの区切り点が含まれる。この場合、領域Ａ１、Ａ２、Ａ３、Ａ４を発話状態アイコン２４１が通過した回数は、通常１回としてカウントされるが、２回としてもよい。また発話状態アイコン２４１の移動速度に応じて、１回にするか２回にするかを変更してもよい。即ち、発話状態アイコン２４１の移動速度が比較的速い場合は、１回とし、比較的遅い場合は、２回とする。

また図７の場合、ユーザアイコン２４２が配される円環状の補助線２４４ａの内側に円環状の補助線２４４ｂが表示される。発話状態アイコン２４１の表示位置が、補助線２４４ａと補助線２４４ｂの間であるときは、何れかの発話者が、一方的に発話し、他は発話していない状態であることを意味する。詳しくは後述するが、このような状態は一般的には好ましくないため、発話状態アイコン２４１の表示位置が、補助線２４４ａと補助線２４４ｂの間だった場合は、軌跡２４３の表示を別途変更するようにしてもよい。例えば、この場合、軌跡２４３の色を灰色や茶色とする。対して発話状態アイコン２４１の表示位置が補助線２４４ｂの内側だった場合は、軌跡２４３の色を上述した青色、緑色、または赤色とする。

またそれぞれの領域において発話状態アイコン２４１が通過した方向を示す表示を行なってもよい。
図１１（ａ）〜（ｄ）は、発話状態アイコン２４１が通過した方向を示す表示について説明した図である。

図１１（ａ）は、「＞」の形状の図形を使用して発話状態アイコン２４１が通過した方向を示す表示を行なう場合を示している。この場合、領域の中心部に対し、「＞」の図形の頂部Ｑ１が向く方向に発話状態アイコン２４１が通過したことを示している。

また図１１（ｂ）は、矢印を使用して発話状態アイコン２４１が通過した方向を示す表示を行なう場合を示している。この場合、領域の中心部から矢印の向く方向に発話状態アイコン２４１が通過したことを示している。

さらに図１１（ｃ）は、三角形の図形を使用して発話状態アイコン２４１が通過した方向を示す表示を行なう場合を示している。この場合、領域の中心部に対し、三角形の頂点Ｑ２が向く方向に発話状態アイコン２４１が通過したことを示している。

またさらに図１１（ｄ）は、領域を塗りつぶす色の濃度の変化により発話状態アイコン２４１が通過した方向を示す表示を行なう場合を示している。この場合、濃度が濃い部分から薄い部分の方向に発話状態アイコン２４１が通過したことを示している。

なお２回以上発話状態アイコン２４１が通過した場合は、通過した方向を表す通過ベクトルを考え、それぞれの通過ベクトルを合成した合成通過ベクトルにより発話状態アイコン２４１が通過した方向を定めることができる。

得点２４５は、発話者の発話状態に応じて表示される点数であれば、特に限定されるものではない。例えば、補助線２４４ｂで規定される円環内を軌跡２４３によりどの程度塗りつぶしたかで点数を決めることができる。また得点２４５は、発話が行なわれる度に加算されて決められる点数であってもよく、また予め定められた時間内における発話の頻度に応じて決められる点数であってもよい。

＜データ解析部の詳細な説明＞
次にホスト装置２０のデータ解析部２３についてさらに詳しく説明を行なう。
上述の通り、データ解析部２３は、発話状態アイコン２４１の表示位置および軌跡２４３の表示を決定する。
図１２は、データ解析部２３の機能構成例について説明した図である。なお図１２では、データ解析部２３が有する種々の機能部のうち上述した出力部２４における表示に関するものを選択して図示している。
図示するようにデータ解析部２３は、出力部２４における発話状態アイコン２４１の表示位置を決定する表示位置決定部２３１と、発話状態アイコン２４１の軌跡２４３の表示を決定する軌跡決定部２３２と、上述した各領域において発話状態アイコン２４１が通過した回数を記憶する通過回数記憶部２３３と、得点２４５の点数を決定する点数決定部２３４とを備える。

表示位置決定部２３１は、例えば、図７〜図８で説明した方法で、発話状態アイコン２４１の表示位置を決定する。これは、表示位置決定部２３１は、複数の発話者のうち何れかの発話者の発話があったときに、発話状態アイコン２４１の表示位置を、発話を行なった発話者に対応するユーザアイコン２４２に向けて距離が近くなるように決定するとともに、発話状態アイコン２４１の表示位置を、発話状態アイコン２４１とユーザアイコン２４２との距離が近くなるに従い発話状態アイコン２４１の移動距離を小さくするように決定する、と言い換えることもできる。

このとき表示位置決定部２３１は、データ受信部２１で取得した音声に関する情報を基にして発話状態アイコン２４１の表示位置を決定する。つまり発話者が装着する端末装置１０は、取得した音声が装着者自身の発話音声であると判定することができるため、この情報から何れのユーザアイコン２４２に向けて発話状態アイコン２４１を移動させればよいかがわかる。またこの情報は、例えば、データ受信部２１から１００ｍｓ毎に送られてくる。そしてその情報を取得する度毎に、発話者の発話の有無を判定し、発話状態アイコン２４１の表示位置を決定する。

軌跡決定部２３２は、例えば、図９〜図１１で説明した方法で、発話状態アイコン２４１の軌跡２４３の表示を決定する。ここで発話状態アイコン２４１が各領域を通過した回数は、通過回数記憶部２３３において、図１０（ａ）で示したようなテーブル形式で記憶されている。よって軌跡決定部２３２は、発話状態アイコン２４１の移動の状態や通過回数記憶部２３３で記憶されている各領域における通過回数を参照し、各領域を塗りつぶすか否か、あるいは、塗りつぶす色を変更するなど各領域の表示の変更を行なう。

点数決定部２３４は、例えば、図７で説明したような得点２４５の点数を決定する。この点数は、上述したように例えば、補助線２４４ｂで規定される円環内を軌跡２４３により、どの程度塗りつぶしたかで点数を決める。この場合、補助線２４４ｂで規定される円環内の面積に対する軌跡２４３が占める面積の比率により点数を決めることができる。

＜ホスト装置２０の動作例＞
図１３は、本実施形態におけるホスト装置２０の動作を示すフローチャートである。
以下、図１２、図１３を使用してホスト装置２０の動作を説明する。

まずデータ受信部２１が、複数の端末装置１０のデータ送信部１６から音声に関する情報を受信データとして取得する（ステップ２０１）。
取得した受信データは、データ蓄積部２２が発話者別に蓄積する（ステップ２０２）。

次にデータ解析部２３の表示位置決定部２３１が、受信データに含まれる音声に関する情報を基に、発話の有無を判定する（ステップ２０３）。そして発話がない場合（ステップ２０３でＮｏ）、ステップ２０１に戻る。

また発話がある場合（ステップ２０３でＹｅｓ）、発話状態が予め定められた時間以上継続しているか否かを判定する（ステップ２０４）。つまり端末装置１０で取得される音としては、発話による音声のみならず、服のこすれ音などのノイズも含まれる。また発話があったとしても単なる相槌である場合がある。そしてこれらの音を発話者による音声として扱うと、発話状態アイコン２４１が頻繁に動きすぎ、正確な発話状態を把握することが困難となる。よって発話状態が予め定められた時間以上（例えば、１ｓ以上）継続した場合に発話者による発話があったとする方が、正確な発話状態を把握する観点からは好ましい。

そして発話状態が予め定められた時間未満だった場合（ステップ２０４でＮｏ）、ステップ２０１に戻る。

一方、発話状態が予め定められた時間以上だった場合（ステップ２０４でＹｅｓ）、表示位置決定部２３１は、例えば、図８で説明した方法で発話状態アイコン２４１の表示位置を決定する（ステップ２０５）。
この表示位置は、通過回数記憶部２３３に送られ、通過回数記憶部２３３は、領域毎に発話状態アイコン２４１の通過回数を記憶する（ステップ２０６）。

次にデータ解析部２３の軌跡決定部２３２が、通過回数記憶部２３３に記憶されている領域毎の通過回数を基にして軌跡２４３の表示を決定する（ステップ２０７）。
さらにデータ解析部２３の点数決定部２３４が、得点２４５の点数を決定する（ステップ２０８）。

そして発話状態アイコン２４１の表示位置の情報、軌跡２４３の表示の情報、および得点２４５の点数の情報は、出力部２４に送られ、出力部２４では、発話状態アイコン２４１、ユーザアイコン２４２、軌跡２４３、補助線２４４、および得点２４５が表示される（ステップ２０９）。

次に上記一連の処理を終了するか否かを決定する（ステップ２１０）。そして終了する場合（ステップ２１０でＹｅｓ）、一連の処理を停止させる。また終了しない場合（ステップ２１０でＮｏ）、ステップ２０１に戻る。

以上詳述した音声解析システム１によれば、発話状態アイコン２４１、軌跡２４３、得点２４５を見ることにより、発話者の発話状態等を視覚的に把握することができる。

具体的には、発話状態アイコン２４１とユーザアイコン２４２との位置関係により、直近の時間帯における発話者の発話状態を把握することができる。つまり発話状態アイコン２４１は、発話者のユーザアイコン２４２に向けて移動するため、発話状態アイコン２４１は、直近の時間帯における発話状態を示している。よってこの時間帯において装着者のうち誰がより多くの発話を行なっているかがわかる。

また軌跡２４３を見ることで、発話者の過去の発話状態の経過を把握することができる。つまり軌跡２４３は、過去の発話状態アイコン２４１の動きを示しているため、ホスト装置２０が動作を開始してから現在までの発話者の発話状態がわかることになる。本実施形態では、軌跡２４３は、発話状態アイコン２４１が、各領域を通過した回数に応じて表示が変更される。そのため発話者同士に会話関係があった場合、この発話者に対応するユーザアイコン２４２を結ぶ直線部分の通過回数がより多くなり、表示が他の領域と異なることになる。よって、軌跡２４３により発話者同士の会話関係も把握することができる。さらに図１１に示した発話状態アイコン２４１が通過した方向を示す表示を行なうことで、発話者同士の会話関係の把握がさらに容易になる。

また得点２４５の点数を、補助線２４４ｂで規定される円環内を軌跡２４３によりどの程度塗りつぶしたかで決めた場合、この点数により発話者の発話がより均等に行なわれたかどうかがわかる。つまり発話がより均等に行なわれた場合、発話状態アイコン２４１は、補助線２４４ｂで規定される円環内をまんべんなく動き回ることになる。そのため得点２４５の点数は高くなりやすい。一方、発話者の発話が均等でないと、発話状態アイコン２４１は、より多くの発話をした発話者のユーザアイコン２４２付近により多くの時間位置することになるため、軌跡２４３もその箇所に集中的に表示されることになり、得点２４５の点数は高くなりにくい。なお発話者の発話がより均等に行なわれたかどうかは、軌跡２４３の分布を見ることでも把握することができる。

本実施形態の音声解析システム１を利用して、例えば、会議を行なうような場合、より活発な議論が行なわれることが期待できる。つまり会議の出席者が、それぞれ端末装置１０を装着し、ホスト装置２０の出力部２４に表示される例えば、図７で示される画像を見つつ、議論を行なう。このとき装着者は、上述したような発話状態を把握することで、例えば、発話が多すぎる、または少なすぎる等を把握することができる。そのため発話が多すぎる装着者は、自主的に発話を控え、また発話が少なすぎる装着者に対しては、他の者が質問等を行ない、発話を促す。これにより発話がより均等に行なわれ、議論が活発になりやすくなる。

なおこの場合、発話者の発話が多すぎる、または少なすぎる場合に、その旨のメッセージ等を出力部２４に表示する場合も考えられる。ただし本実施の音声解析システム１の場合は、このような表示は極力行なわず、装着者の自主的な行動にまかせる方がより好ましい。

またここでは、会議の出席者が出力部２４に表示される画像を見る場合を例示したが、これに限られるものではなく、例えば、会議の出席者は、これを見ずに会議を行ない、会議の出席者以外の第三者が会議の内容を評価することに使用してもよい。

さらに以上詳述した例では、発話者の発話が行なわれなかった場合は、発話状態アイコン２４１は停止し、動かなくなる。しかし発話が行なわれない時間が、予め定められた以上継続した場合は、発話状態アイコン２４１を中央部に戻してもよい。なおこの際、軌跡２４３は、表示しないことが好ましい。

また以上詳述した例では、ユーザアイコン２４２を円環状の補助線２４４ａ上に配置していたが、これに限られるものではなく、多角形の頂点部に配置してもよい。また直線上に配置し、発話状態アイコン２４１をこの直線上で動かすようにしてもよい。
なおユーザアイコン２４２の配置は、実際の発話者の配置を擬似的に再現してもよいが、再現しなくてもかまわない。
さらにユーザアイコン２４２は、必ずしも表示させる必要はない。例えば、端末装置１０からの端末ＩＤを基に、端末装置１０を識別し、ユーザアイコン２４２のかわりにこの端末ＩＤを表示するようにしてもよい。このとき端末ＩＤを識別するのは、例えば、データ解析部２３が行なう。この場合、データ解析部２３は、音声に関する情報を基に、端末装置１０を識別する識別部として機能する。

また以上詳述した例では、端末装置１０を使用し、端末装置１０を装着することで音声を取得していたが、これに限られるものではない。例えば、装着者は、それぞれ１つのマイクロフォンを装着し、このマイクロフォンにより取得された音声が、予め定められた音圧以上であった場合に、装着者の音声であると判定し、この音圧未満であった場合に、装着者以外の音声であると判定してもよい。さらにマイクロフォンを装着せず、例えば、マイクロフォンを音声の取得を行なう部屋に複数配置し、これらのマイクロフォンで取得された音声の音圧や方向を比較することで、発話者の特定を行なってもよい。

さらに以上詳述した例では、端末装置１０で発話者（自他）の識別を行なっていたが、ホスト装置２０の方で行なってもよい。この場合、この処理は、例えば、データ解析部２３で行なうことができる。この場合、データ解析部２３が識別部として機能する。

＜プログラムの説明＞
なお以上説明したホスト装置２０が行なう処理は、ソフトウェアとハードウェア資源とが協働することにより実現される。即ち、ホスト装置２０に設けられた制御用コンピュータ内部の図示しないＣＰＵが、ホスト装置２０の各機能を実現するプログラムを実行し、これらの各機能を実現させる。

よってホスト装置２０が行なう処理は、コンピュータに、音声を取得するマイクロフォンにより取得された発話者の音声の、音声に関する情報を取得する機能と、取得された音声に関する情報を基に、複数の発話者のそれぞれの発話状態を表す発話状態アイコン２４１の出力部２４における表示位置および発話状態アイコン２４１の軌跡２４３の表示を決定する機能と、を実現させるプログラムとして捉えることもできる。

なお、本実施形態を実現するプログラムは、通信手段により提供することはもちろん、ＣＤ−ＲＯＭ等の記録媒体に格納して提供することも可能である。

以上、本実施形態について説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、種々の変更または改良を加えたものも、本発明の技術的範囲に含まれることは、特許請求の範囲の記載から明らかである。

１…音声解析システム、１０…端末装置、２０…ホスト装置、２１…データ受信部、２３…データ解析部、２４…出力部、２３１…表示位置決定部、２３２…軌跡決定部、２３３…通過回数記憶部、２３４…点数決定部、２４１…発話状態アイコン、２４２…ユーザアイコン、２４３…軌跡、２４４…補助線、２４５…得点

Claims

音声を取得する音声取得手段により取得された複数の発話者の音声の、当該音声に関する情報を取得する音声情報取得部と、
複数の発話者のそれぞれの発話状態を表す第１のアイコン、および当該第１のアイコンの軌跡を表示する表示部と、
前記音声取得手段により取得された前記音声に関する情報を基に、前記第１のアイコンの表示位置および前記軌跡の表示を決定するとともに予め定められた領域において当該第１のアイコンが通過した方向を示す表示を行なうように前記表示部を制御する表示決定部と、
を備えたことを特徴とする音声解析装置。
前記表示部は、前記複数の発話者のそれぞれを表す第２のアイコンをさらに表示し、前記第１のアイコンと当該第２のアイコンとの位置関係により前記発話状態を表すことを特徴とする請求項１に記載の音声解析装置。
前記表示決定部は、前記複数の発話者のうち何れかの発話者の発話があったときに、前記第１のアイコンの表示位置を、発話を行なった発話者に対応する前記第２のアイコンに向けて距離が近くなるように決定するとともに、当該第１のアイコンの表示位置を、当該第１のアイコンと当該第２のアイコンとの距離が近くなるに従い当該第１のアイコンの移動距離を前回の移動距離よりも小さくするように決定することを特徴とする請求項２に記載の音声解析装置。
前記表示決定部は、予め定められた領域において前記第１のアイコンが通過した頻度に応じて、当該領域における前記軌跡の表示を変更するように前記表示部を制御する、ことを特徴とする請求項１乃至３の何れか１項に記載の音声解析装置。
前記表示決定部は、発話者の発話状態に応じた点数をさらに決定し、
前記表示部は、前記点数を表示することを特徴とする請求項１乃至４の何れか１項に記載の音声解析装置。
音声を取得する音声取得手段により取得された複数の発話者の音声の、当該音声に関する情報を取得する音声情報取得部と、
複数の発話者のそれぞれの発話状態を表す第１のアイコン、複数の発話者のそれぞれを表す第２のアイコンおよび当該第１のアイコンの軌跡を表示する表示部と、
前記音声取得手段により取得された前記音声に関する情報を基に、前記第１のアイコンの表示位置および前記軌跡の表示を決定する表示決定部と、
を備え、
前記表示決定部は、複数の発話者のうち何れかの発話者の発話があったときに、前記第１のアイコンの表示位置を、発話を行なった発話者に対応する前記第２のアイコンに向けて移動させ、当該発話を行なった発話者の発話が停止した場合は、当該第１のアイコンの移動を停止し、別の発話者が発話を始めると、当該第１のアイコンの表示位置を、停止した位置から発話を行なった当該別の発話者に対応する当該第２のアイコンに向けて移動させる表示を行なうように前記表示部を制御することを特徴とする音声解析装置。
音声を取得する音声取得手段により取得された複数の発話者の音声の、当該音声に関する情報を取得する音声情報取得部と、
複数の発話者のそれぞれの発話状態を表す第１のアイコン、当該第１のアイコンの軌跡および当該第１のアイコンの位置を把握しやすくするための補助線を表示する表示部と、
前記音声取得手段により取得された前記音声に関する情報を基に、前記第１のアイコンの表示位置および前記軌跡の表示を決定する表示決定部と、
を備え、
前記表示決定部は、前記第１のアイコンと前記補助線との位置関係により前記軌跡の表示を変更するように前記表示部を制御することを特徴とする音声解析装置。
音声に関する情報である音声情報を蓄積する蓄積部と、
前記蓄積部に蓄積された前記音声情報に基づいて、複数の発話者の発話状態を表す第１のアイコンの表示位置及び当該第１のアイコンの軌跡の表示を決定するとともに予め定められた領域において当該第１のアイコンが通過した方向を示す表示を行なう表示決定部と、
を有する音声解析装置。
複数の発話者のそれぞれの発話状態を表す第１のアイコンと、
前記第１のアイコンの軌跡と、
予め定められた領域において前記第１のアイコンが通過した方向と、
を表示し、
前記第１のアイコンの表示位置、前記軌跡および前記方向の表示は、音声を取得する音声取得手段により取得された複数の発話者の音声の、当該音声に関する情報を基に決定されたものであることを特徴とする表示装置。
発話者の音声を取得する音声取得部と、
前記音声取得部により取得された複数の発話者の音声の、当該音声に関する情報を基に、発話者又は当該発話者が装着している当該音声取得部を識別する識別部と、
複数の発話者のそれぞれの発話状態を表す第１のアイコン、および当該第１のアイコンの軌跡を表示する表示部と、
前記識別部により識別された発話者又は当該発話者が装着している前記音声取得部の情報を基に、前記第１のアイコンの表示位置および前記軌跡の表示を決定するとともに予め定められた領域において当該第１のアイコンが通過した方向を示す表示を行なうように前記表示部を制御する表示決定部と、
を備えたことを特徴とする音声解析システム。
コンピュータに、
音声を取得する音声取得手段により取得された発話者の音声の、当該音声に関する情報を取得する機能と、
取得された前記音声に関する情報を基に、複数の発話者のそれぞれの発話状態を表す第１のアイコンの表示部における表示位置および当該第１のアイコンの軌跡の表示を決定するとともに予め定められた領域において当該第１のアイコンが通過した方向を示す表示を行なうように前記表示部を制御する機能と、
を実現させるプログラム。