JP7091745B2

JP7091745B2 - 表示端末、プログラム、情報処理システム及び方法

Info

Publication number: JP7091745B2
Application number: JP2018051276A
Authority: JP
Inventors: 恵介塚田
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2018-03-19
Filing date: 2018-03-19
Publication date: 2022-06-28
Anticipated expiration: 2038-03-19
Also published as: JP2019164232A; US20190287531A1

Description

本発明は、表示端末、プログラム、情報処理システム及び方法に関する。

従来から、電子黒板を音声認識装置と連携させて、電子黒板を音声により操作したり、電子黒板によって集音された音声データをテキストデータに変換して保持したりする技術が知られている。

この技術の一例として、例えば、従来では、音声入力手段により入力された会話音声を認識して文字データに変換し、文字データから所定の条件を満たすキーワードを抽出し、抽出したキーワードに応じた画像を検索して表示させる技術が知られている。

しかしながら、従来の技術では、例えば、電子黒板の利用者が発話した内容と、集音された音声データから変換されたテキストデータの内容とが異なる場合がある。

開示の技術は、上記事情に鑑みてこれを解決すべく成されたものであり、利用者の話し方を案内する指標を提供することを目的としている。

開示の技術は、集音装置が集音した音を音声データとして取得する集音部と、前記音声データをテキストデータへ変換する音声認識部と、前記音声認識部により変換されたテキストデータを取得するテキスト取得部と、前記音声認識部によってテキストデータに変換するための最適値に関する情報を記憶する記憶部と、前記音声データに基づき生成された前記音の音量を示す情報と、前記音声データに基づき算出された音声の速度を示す情報と、前記音声データに基づき生成された前記音の音量を示す、前記音声認識部によってテキストデータに変換するための最適値に関する情報と、前記音声データに基づき算出された音声の速度を示す、前記音声認識部によってテキストデータに変換するための最適値に関する情報と、を含む指標を表示部に表示させる表示制御部と、備え、前記表示制御部は、前記音声認識部により変換したテキストデータと前記指標と共に表示する。

利用者の話し方を案内する指標を提供することができる。

第一の実施形態の電子黒板の表示例を示す図である。第一の実施形態の情報処理システムの一例を示す図である。第一の実施形態の電子黒板のハードウェア構成の一例を示す図である。第一の実施形態のスマートスピーカのハードウェア構成の一例を示す図である。第一の実施形態のサーバ装置のハードウェア構成の一例を示す図である。第一の実施形態の情報処理システムの有する各装置の機能を説明する図である。第一の実施形態の最適値テーブルの一例を示す図である。第一の実施形態の電子黒板の動作を説明するフローチャートである。第一の実施形態の電子黒板による処理を説明する図である。第一の実施形態の電子黒板の他の表示例を示す図である。第二の実施形態の電子黒板の表示例を示す図である。第二の実施形態の情報処理システムの有する各装置の機能を説明する図である。第二の実施形態の閾値テーブルの一例を示す図である。第二の実施形態の電子黒板の動作を説明するフローチャートである。第二の実施形態の電子黒板の他の表示例を示す図である。第三の実施形態の情報処理システムの有する各装置の機能を説明する図である。第三の実施形態の情報処理システムの動作を説明するシーケンス図である。第四の実施形態の情報処理システムを説明する図である。

（第一の実施形態）
以下に図面を参照して第一の実施形態について説明する。図１は、第一の実施形態の電子黒板の表示例を示す図である。

音声データ（発話データ）をテキストデータへ変換する場合、音声データの内容とテキストデータの内容との一致の度合いは、音声データの入力環境に大きく依存する。

本実施形態では、この点に着目し、音声データを取得する際に、電子黒板２００に話し方の指標を表示させる。また、本実施形態では、話し方の指標と共に、音声データに基づき生成されたテキストデータを電子黒板２００に表示させる。

尚、音声データの入力環境とは、主に、発話した人（発話者）とマイク等の集音装置との距離、話す速度等が挙げられる。また、入力環境には、前述した距離と速度以外にも、発話者が話す方向等が含まれても良い。

また、本実施形態における発話者の話し方の指標とは、入力される音声データの音量のと、話す速度とを、音声データをテキストデータに変換する際の最適な値として設定された最適値と比較した結果を示す情報である。

図１に示す電子黒板２００では、ディスプレイに、発話者Ｐの話し方の指標２１が表示されている。また、電子黒板２００は、入力された音声データに基づき生成されテキストデータＴｅが表示されている。テキストデータＴｅの取得の仕方の詳細は後述する。

図１の例では、指標２１として、入力された音声データの音量と音声スピードのそれぞれを、最適値と比較した結果を示す情報が表示されている。言い換えれば、図１の例では、電子黒板２００は、発話者Ｐの声の大きさ（音量）と、話す速度（音声スピード）とを、最適値と比較した結果を示す情報を指標２１として表示している。

本実施形態の最適値は、例えば、音声データをテキストデータに変換する場合において、最も好ましいと思われる音声データの音量を示す値と、音声スピードを示す値と、を含む。本実施形態の最適値は、電子黒板２００に予め設定された値であって良い。最適値の詳細については、後述する。

本実施形態の電子黒板２００は、例えば、発話者Ｐが発話を開始し、音声データの入力が開始されると、指標２１を表示させても良い。

また、電子黒板２００は、指標２１として、音量の最適値及び音声スピードの最適値を、固定されたライン２１ａとして表示させる。また、電子黒板２００は、指標２１として、入力された音声データから生成された音量を示すグラフ２１ｂの長さと、入力された音声データから算出された音声スピードを示すグラフ２１ｃの長さとを、それぞれの最適値と比較した結果に応じて変動させる。

本実施形態では、指標２１をこのように表示させることで、発話者Ｐの声の大きさ（音量）や話す速度（音声スピード）が最適値に近づいているか否かを、発話者Ｐに提示できる。つまり、本実施形態では、発話者Ｐの話し方の指標と、音声データから変換されたテキストデータとを表示させることで、発話者Ｐに対して、自身が発話した音声データが、テキストデータへの変換に適した音量と速度であるか否かを把握させることができる。

このため、本実施形態では、発話者Ｐに対し、指標２１を参照して、電子黒板２００との距離の調整や、話す速度の調整を促すことができ、音声データからテキストデータへ変換する際の精度を向上させることができる。つまり、本実施形態では、発話者Ｐに対して話し方の指標を提供することができる。

尚、電子黒板２００のディスプレイにおいて、指標２１を表示させる位置は、任意の位置であってよく、指標２１の表示位置を発話者Ｐに設定させても良い。

以下に、本実施形態の電子黒板２００について、さらに説明する。図２は、第一の実施形態の情報処理システムの一例を示す図である。

本実施形態の電子黒板２００は、情報処理システム１００に含まれる。本実施形態の情報処理システム１００は、電子黒板２００とサーバ装置３００とを含む。電子黒板２００とサーバ装置３００とは、ネットワークを介して通信を行う。

本実施形態の情報処理システム１００において、電子黒板２００は、手書き入力された文字や画像等を示すストローク情報、電子黒板２００の画面をキャプチャした画像データ等を、サーバ装置３００に送信する。また、本実施形態の電子黒板２００は、マイク等の集音装置を有しており、集音装置によって集音された音声データを、サーバ装置３００に送信する。

尚、本実施形態の音声データは、集音装置が集音した全ての音を示す波形をデジタル化したデータである。したがって、本実施形態では、電子黒板２００の周辺で発話した人の声を示す発話データは、音声データの一部である。

本実施形態の電子黒板２００は、例えば、集音装置が集音した音声データのうち、人が発話した発話データを検出し、発話データが入力されたとき、指標２１を表示させても良い。

本実施形態のサーバ装置３００は、受信したストローク情報や画像データ、音声データ等を格納する。また、本実施形態のサーバ装置３００は、音声データから変換されたテキストデータを、音声データと対応付けて格納する。

尚、サーバ装置３００は、例えば、ある会議において電子黒板２００が使用された場合、会議名と、会議中に取得したスクロール情報と、画像データと、音声データと、音声データから変換されたテキストデータとが対応付けられて格納されても良い。言い換えれば、サーバ装置３００では、電子黒板２００から取得した各種の情報が、会議毎に格納されても良い。

以下の説明では、電子黒板２００からサーバ装置３００に送信される各種のデータをコンテンツデータと呼ぶ。したがって、本実施形態のコンテンツデータは、音声データ、画像データ、動画データ、ストローク情報等を含む。

次に、図３を参照して、本実施形態の電子黒板２００のハードウェア構成について説明する。図３は、第一の実施形態の電子黒板のハードウェア構成の一例を示す図である。

図３に示されているように、電子黒板２００は、ＣＰＵ(Central Processing Unit)２０１、ＲＯＭ(Read Only Memory)２０２、ＲＡＭ(Random Access Memory)２０３、ＳＳＤ(Solid State Drive)２０４、ネットワークＩ／Ｆ(Interface)２０５、外部機器接続Ｉ／Ｆ２０６、及び、無線ＬＡＮ（Local Area Network）モジュール２０７を備えた共有端末である。尚、共有端末とは、複数の人が共有して利用することが可能な電子機器であれば良く、電子黒板２００以外の電子機器であっても良い。

これらのうち、ＣＰＵ２０１は、電子黒板２００全体の動作を制御する。尚、ＣＰＵ２０１は、例えば、複数のＣＰＵを含んでいても良い。

ＲＯＭ２０２は、ＣＰＵ２０１やＩＰＬ(Initial Program Loader)等のＣＰＵ２０１の駆動に用いられるプログラムを記憶する。ＲＡＭ２０３は、ＣＰＵ２０１のワークエリアとして使用される。ＳＳＤ２０４は、電子黒板用のプログラム等の各種データを記憶する。ネットワークＩ／Ｆ２０５は、通信ネットワークとの通信を制御する。外部機器接続Ｉ／Ｆ２０６は、ＵＳＢ(Universal Serial Bus)メモリ２６００、外付け機器（カメラ２４００、スピーカ２３００、スマートスピーカ２２００）との通信を制御する。無線ＬＡＮモジュール２０７は、電子黒板２００を無線ＬＡＮにてネットワークに接続させる。

また、電子黒板２００は、キャプチャデバイス２１１、ＧＰＵ２１２、ディスプレイコントローラ２１３、接触センサ２１４、センサコントローラ２１５、電子ペンコントローラ２１６、近距離通信回路２１９、近距離通信回路２１９のアンテナ２１９ａ、及び電源スイッチ２２２を備えている。

これらのうち、キャプチャデバイス２１１は、ＰＣ４１０－１のディスプレイに対して映像情報を静止画または動画として表示させる。ＧＰＵ(Graphics Processing Unit)２１２は、グラフィクスを専門に扱う半導体チップである。ディスプレイコントローラ２１３は、ＧＰＵ２１２からの入力画像をディスプレイ２２６（表示部）等へ出力するために画面表示の制御及び管理を行う。接触センサ２１４は、ディスプレイ２２６上に電子ペン２５００や利用者の手Ｈ等が接触したことを検知する。

センサコントローラ２１５は、接触センサ２１４の処理を制御する。接触センサ２１４は、赤外線遮断方式による座標の入力及び座標の検出を行う。この座標の入力及び座標の検出する方法は、ディスプレイ２２６の上側両端部に設置された２つ受発光装置が、ディスプレイ２２６に平行して複数の赤外線を放射し、ディスプレイ２２６の周囲に設けられた反射部材によって反射されて、受光素子が放射した光の光路と同一の光路上を戻って来る光を受光する方法である。接触センサ２１４は、物体によって遮断された２つの受発光装置が放射した赤外線のＩＤをセンサコントローラ２１５に出力し、センサコントローラ２１５が、物体の接触位置である座標位置を特定する。

電子ペンコントローラ２１６は、電子ペン２５００と通信することで、ディスプレイ２２６へのペン先のタッチやペン尻のタッチの有無を判断する。近距離通信回路２１９は、ＮＦＣ、Ｂｌｕｅｔｏｏｔｈ（登録商標）等の通信回路である。

電源スイッチ２２２は、電子黒板２００の電源のＯＮ／ＯＦＦを切り換えるためのスイッチである。

また、電子黒板２００は、バスラインＢを備えている。バスラインＢは、図２に示されているＣＰＵ２０１等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。

更に、電子黒板２００は、ＲＳ－２３２Ｃポート２２３、変換コネクタ２２４、Ｂｌｕｅｔｏｏｔｈコントローラ２２５を有する。

ＲＳ－２３２Ｃポート２２３は、バスラインＢと接続されており、ＰＣ４１０－２等をＣＰＵ２０１等に接続する。変換コネクタ２２４は、ＰＣ４１０－２のＵＳＢ（Universal Serial Bus）ポートに電子黒板２００を接続するためのコネクタである。

Ｂｌｕｅｔｏｏｔｈコントローラ２２５は、例えば、ＰＣ４１０－１等と、Ｂｌｕｅｔｏｏｔｈによる通信を行うためのコントローラである。

尚、接触センサ２１４は、赤外線遮断方式に限らず、静電容量の変化を検知することにより接触位置を特定する静電容量方式のタッチパネル、対向する２つの抵抗膜の電圧変化によって接触位置を特定する抵抗膜方式のタッチパネル、接触物体が表示部に接触することによって生じる電磁誘導を検知して接触位置を特定する電磁誘導方式のタッチパネルなどの種々の検出手段を用いてもよい。また、電子ペンコントローラ２１６が、電子ペン２５００のペン先及びペン尻だけでなく、電子ペン２５００の利用者が握る部分や、その他の電子ペンの部分のタッチの有無を判断するようにしてもよい。

本実施形態の電子黒板２００は、図３に示すハードウェア構成を有することにより、後述するような各種処理を実現できる。

また、本実施形態のスマートスピーカ２２００は、例えば、ネットワークへの接続機能や、マイクを有しており、集音装置の１つである。また、本実施形態のスマートスピーカ２２００は、例えば、人工知能を搭載しており、Wi-Fi、Bluetooth等の規格に準じた通信を行うことで音声データの収集や、音声データの再生の他の様々な用途に使用される。

本実施形態では、例えば、スマートスピーカ２２００により収集された音声データから、電子黒板２００に対するコマンドが取得されても良い。また、図３の例では、集音装置をスマートスピーカ２２００としているが、これに限定されない。電子黒板２００は、スマートスピーカ２２００の代わりに、通常のマイクを有していても良い。

また、電子黒板２００は、無線ＬＡＮモジュール２０７と、スマートスピーカ２２００の有するネットワークの接続機能とにより、無線にて接続されていても良い。以下に、本実施形態のスマートスピーカ２２００のハードウェア構成について説明する。

図４は、第一の実施形態のスマートスピーカのハードウェア構成の一例を示す図である。

スマートスピーカ２２００は、ＣＰＵ２２０１、ＲＯＭ２２０２、ＲＡＭ２２０３、ＳＳＤ２２０４、ネットワークＩ／Ｆ２２０５、外部機器接続Ｉ／Ｆ２２０６、及び、無線ＬＡＮモジュール２２０７を備えた情報端末である。

ＣＰＵ２２０１は、スマートスピーカ２２００全体の動作を制御する。尚、ＣＰＵ２２０１は、例えば、複数のＣＰＵを含んでいても良い。

ＲＯＭ２２０２は、ＣＰＵ２２０１やＩＰＬ等のＣＰＵ２２０１の駆動に用いられるプログラムを記憶する。ＲＡＭ２２０３は、ＣＰＵ２２０１のワークエリアとして使用される。ＳＳＤ２２０４は、スマートスピーカ用のプログラム等の各種データを記憶する。ネットワークＩ／Ｆ２２０５は、通信ネットワークとの通信を制御する。外部機器接続Ｉ／Ｆ２２０６は、ＵＳＢメモリ２６０１、外付け機器（カメラ２４０１、スピーカ２３０１、マイク２７００）との通信を制御する。無線ＬＡＮモジュール２２０７は、スマートスピーカ２２００を無線ＬＡＮにてネットワークに接続させる。

また、スマートスピーカ２２００は、キャプチャデバイス２２１１、ＧＰＵ２２１２、ディスプレイコントローラ２２１３、接触センサ２２１４、センサコントローラ２２１５、電子ペンコントローラ２２１６、近距離通信回路２２１９、近距離通信回路２２１９のアンテナ２２１９ａ、及び電源スイッチ２２２２を備えている。

これらのうち、キャプチャデバイス２２１１は、ＰＣ４１１－１のディスプレイに対して映像情報を静止画または動画として表示させる。ＧＰＵ(Graphics Processing Unit)２２１２は、グラフィクスを専門に扱う半導体チップである。ディスプレイコントローラ２２１３は、ＧＰＵ２２１２からの入力画像をディスプレイ２２２６（表示装置）等へ出力するために画面表示の制御及び管理を行う。接触センサ２２１４は、ディスプレイ２２２６上に電子ペン２５０１や利用者の手Ｈ等が接触したことを検知する。

センサコントローラ２２１５は、接触センサ２２１４の処理を制御する。接触センサ２２１４は、赤外線遮断方式による座標の入力及び座標の検出を行う。この座標の入力及び座標の検出する方法は、ディスプレイ２２２６の上側両端部に設置された２つ受発光装置が、ディスプレイ２２２６に平行して複数の赤外線を放射し、ディスプレイ２２２６の周囲に設けられた反射部材によって反射されて、受光素子が放射した光の光路と同一の光路上を戻って来る光を受光する方法である。接触センサ２２１４は、物体によって遮断された２つの受発光装置が放射した赤外線のＩＤをセンサコントローラ２２１５に出力し、センサコントローラ２２１５が、物体の接触位置である座標位置を特定する。

電子ペンコントローラ２２１６は、電子ペン２５０１と通信することで、ディスプレイ２２２６へのペン先のタッチやペン尻のタッチの有無を判断する。近距離通信回路２２１９は、ＮＦＣ、Ｂｌｕｅｔｏｏｔｈ（登録商標）等の通信回路である。

電源スイッチ２２２２は、スマートスピーカ２２００の電源のＯＮ／ＯＦＦを切り換えるためのスイッチである。

また、スマートスピーカ２２００は、バスラインＢ１を備えている。バスラインＢ１は、図４に示されているＣＰＵ２２０１等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。

Ｂｌｕｅｔｏｏｔｈコントローラ２２２５は、例えば、ＰＣ４１１－１等と、Ｂｌｕｅｔｏｏｔｈによる通信を行うためのコントローラである。

次に、図５を参照して、本実施形態のサーバ装置３００のハードウェア構成について説明する。図５は、第一の実施形態のサーバ装置のハードウェア構成の一例を示す図である。

本実施形態のサーバ装置３００は、一般のコンピュータ（外部装置）であり、それぞれバスＢ２で相互に接続されている入力装置３１、出力装置３２、ドライブ装置３３、補助記憶装置３４、メモリ装置３５、演算処理装置３６及びインターフェース装置３７を有する。

入力装置３１は、例えばマウスやキーボードであり、各種の情報を入力するために用いられる。出力装置３２は、例えばディスプレイ等であり、各種信号の表示（出力）に用いられる。インターフェース装置３７は、モデム，ＬＡＮカード等を含み、ネットワークに接続する為に用いられる。

情報処理プログラムは、サーバ装置３００を制御する各種プログラムの少なくとも一部である。情報処理プログラムは例えば記録媒体３８の配布やネットワークからのダウンロードなどによって提供される。情報処理プログラムを記録した記録媒体３８は、ＣＤ－ＲＯＭ、フレキシブルディスク、光磁気ディスク等の様に情報を光学的，電気的或いは磁気的に記録する記録媒体、ＲＯＭ、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。

また、情報処理プログラムを記録した記録媒体３８がドライブ装置３３にセットされると、情報処理プログラムは記録媒体３８からドライブ装置３３を介して補助記憶装置３４にインストールされる。ネットワークからダウンロードされた通信プログラムは、インターフェース装置３７を介して補助記憶装置３４にインストールされる。

補助記憶装置３４は、インストールされた情報処理プログラムを格納すると共に、必要なファイル、データ等を格納する。メモリ装置３５は、コンピュータの起動時に補助記憶装置３４から情報処理プログラムを読み出して格納する。そして、演算処理装置３６はメモリ装置３５に格納された各プログラムに従って、後述するような各種処理を実現している。

次に、図６を参照して、情報処理システム１００の有する各装置の機能について説明する。図６は、第一の実施形態の情報処理システムの有する各装置の機能を説明する図である。

始めに、電子黒板２００の機能について説明する。以下に説明する電子黒板２００の機能は、ＣＰＵ２０１がＲＡＭ２０３等に格納されたプログラムを読み出して実行することで実現される。

本実施形態の電子黒板２００は、集音部２１０、入力部２２０、コンテンツ変換部２３０、送受信部２４０、音量検出部２５０、音声スピード算出部２６０、テキスト取得部２６５、音声認識部２７０、表示制御部２８０を有する。ここで上述した各部は、ＣＰＵ２０１がＲＯＭ２０２等からプログラムを読み出して実行することで実現される。

また、本実施形態の電子黒板２００は、記憶部２９０を有する。記憶部２９０には、最適値テーブル２９５が格納されている。記憶部２９０は、例えば、電子黒板２００のＲＯＭ２０２やＨＤＤ２０４等の記憶装置に設けられていても良い。

集音部２１０は、スマートスピーカ２２００に入力された音声を音声データとして取得する。入力部２２０は、電子黒板２００の有するディスプレイ２２６に対して手書き入力された文字や画像を示すストローク情報や、ディスプレイ２２６に表示された画像の画像データ等を取得する。尚、本実施形態のストローク情報とは、タッチパネルに対して手書き入力が行われた場合の、利用者による一画毎の軌跡を示す点群の座標報である。また、入力部２２０は、撮像装置３０により撮影された動画データ等を取得する。

コンテンツ変換部２３０は、音声データ、画像データ、動画データを、サーバ装置３００に保存できる形式に変換する。具体的には、コンテンツ変換部２３０は、音声データをＡＡＣ（Advanced Audio Coding）形式等とし、画像データや動画データをＪＰＥＧ形式等とする。本実施形態のコンテンツ変換部２３０は、このように、各種のデータを圧縮することで、ネットワークＮを介して送受信しやすく、且つ、サーバ装置３００のメモリ容量を圧迫しないようにしている。また、本実施形態では、動画データは、画像データに含まれるものである。

送受信部２４０は、集音部２１０により取得された音声データをサーバ装置３００と音声認識装置４００とに送信する。このとき、電子黒板２００は、情報処理システム１００に含まれない外部端末に音声データを送信しても良い。この外部端末は、例えば、音声認識機能を有する音声認識装置であっても良い。

また、送受信部２４０は、入力部２２０により取得された画像データ、動画データ等をサーバ装置３００に送信する。

本実施形態の音量検出部２５０は、集音部２１０が取得した音声データの音量を検出する。

本実施形態の音声スピード算出部２６０は、集音部２１０が取得した音声データが発話データであった場合に、発話者が話す速度を算出する。

以下に、音声スピード算出部２６０による、発話者が話す速度の算出について説明する。本実施形態の音声スピード算出部２６０は、集音部２１０により取得された音声データである波形から、単位時間当たりの音素の個数を求め、その個数を話す速度としても良い。尚、音素とは、時間の流れに沿って切った音韻論の最小単位である。言い換えれば、音素とは、語と語の意味を区別する機能を有する音声の最小単位である。具体的には、例えば、音素とは、「あ」、「い」等である。また、本実施形態の単位時間は、予め事前に設定されていても良い。

このように、本実施形態の音声スピード算出部２６０は、音声データから単位時間当たりの音素の個数を求め、その個数を話す速度とする音声速度算出部の役割を果たす。

テキスト取得部２６５は、集音部２１０により取得された音声データに基づき生成されたテキストデータを取得する。具体的には、テキスト取得部２６５は、集音部２１０が音声データを取得すると、送受信部２４０を介して、外部の音声認識機能を有するサーバ装置（音声認識サーバ）へ音声データを送信する。そして、テキスト取得部２６５は、音声認識装置に音声データから変換されたテキストデータを、送受信部２４０を介して取得する。尚、本実施形態の音声認識装置は、例えば、サーバ装置３００が兼ねていても良いし、サーバ装置３００とは別の装置であっても良い。

尚、テキスト取得部２６５は、音声データが音声認識部２７０によってテキストデータに変換された場合には、音声認識部２７０からテキストデータを取得すれば良い。

音声認識部２７０は、集音部２１０が取得した音声データをテキストデータに変換する音声認識機能を実現する。

表示制御部２８０は、記憶部２９０に格納された最適値テーブル２９５を参照し、音量検出部２５０が検出した音量と、音声スピード算出部２６０が算出した速度とを、最適値と共に電子黒板２００に表示させる。最適値テーブル２９５の詳細は後述する。

次に、サーバ装置３００の機能について説明する。本実施形態のサーバ装置３００は、コンテンツデータベース３１０を有する。また、本実施形態のサーバ装置３００は、送受信部３２０、コンテンツ格納部３３０を有する。本実施形態のサーバ装置３００の有する各部は、演算処理装置３６がメモリ装置３５から情報処理プログラムを読み出して実行することで実現される。

本実施形態のコンテンツデータベース３１０は、例えば、サーバ装置３００の補助記憶装置３４等に設けられていても良い。

コンテンツデータベース３１０は、電子黒板２００から受信した各種のデータ（コンテンツ）が格納される。本実施形態のコンテンツとは、音声データ、画像データ、動画データ、ストローク情報を含む。

本実施形態の送受信部３２０は、電子黒板２００と間の情報の送受信と、音声認識装置４００からの情報の受信を行う。

コンテンツ格納部３３０は、電子黒板２００から受信したコンテンツをコンテンツデータベース３１０へ格納する。

次に、図７を参照して、最適値テーブル２９５について説明する。図７は、第一の実施形態の最適値テーブルの一例を示す図である。

本実施形態の最適値テーブル２９５には、音量の最適値と、発話者が話す速度の最適値とが格納されている。

音量の最適値とは、例えば、音声認識機能に対して、様々な音量の音声データを入力し、音声認識を行った結果であるテキストデータが示す内容と、音声データが示す内容との一致度が最も近くなる音量であってもよい。音量の最適値は、このような方法で予め求められ、最適値テーブル２９５に格納されていても良い。

話す速度の最適値とは、例えば、音声認識機能に対して、様々な速度で話した音声データを入力し、音声認識を行った結果であるテキストデータが示す内容と、音声データが示す内容との一致度が最も近くなる速度であってもよい。話す速度の最適値は、このような方法で予め求められ、最適値テーブル２９５に格納されていても良い。本実施形態の単位時間とは、例えば、数秒であっても良い。

次に、図８を参照して、本実施形態の電子黒板２００の動作について説明する。図８は、第一の実施形態の電子黒板の動作を説明するフローチャートである。

本実施形態の電子黒板２００において、音量検出部２５０は、音声データの入力が開始されたか否かを判定する（ステップＳ８０１）。言い換えれば、音量検出部２５０は、集音部２１０が音声データを取得したか否かを判定している。

ステップＳ８０１において、音声データが入力されない場合、音量検出部２５０は、音声データが入力されるまで待機する。

ステップＳ８０１において、音声データが入力されると、音量検出部２５０は、音声データの音量を検出する（ステップＳ８０２）。続いて、電子黒板２００は、音声スピード算出部２６０により、単位時間が経過したか否かを判定する（ステップＳ８０３）。

ステップＳ８０３において、単位時間が経過していない場合、音声スピード算出部２６０は、待機する。

ステップＳ８０３において、単位時間が経過した場合、音声スピード算出部２６０は、単位時間辺りの音声スピード（話し方の速度）を算出する（ステップＳ８０４）。

続いて、表示制御部２８０は、音量検出部２５０が検出した音量と、音声スピード算出部２６０が算出した速度とを、最適値テーブル２９５を参照して、音量の最適値と速度の最適値とを取得する（ステップＳ８０５）。

続いて、表示制御部２８０は、音量検出部２５０が検出した音量と音量の最適値、音声スピード算出部２６０が算出した速度と速度の最適値、とを対応付けた指標２１（図１参照）を電子黒板２００に表示させる（ステップＳ８０６）。

続いて、電子黒板２００は、音声データの入力が終了したか否かを判定する（ステップＳ８０７）。言い換えれば、集音部２１０が音声データを取得しなくなったか否かを判定する。

ステップＳ８０７において、音声データの入力が終了していない場合、つまり、音声データの入力が続いている場合、電子黒板２００は、ステップＳ８０２へ戻る。

ステップＳ８０７において、音声データの入力が終了した場合、電子黒板２００は、テキスト取得部２６５により、入力された音声データを音声認識サーバへ送信する（ステップＳ８０８）。続いて、テキスト取得部２６５は、音声認識サーバから、テキストデータを取得し、表示制御部２８０により、指標２１と共にテキストデータを表示させて（ステップＳ８０９）、処理を終了する。

尚、図８の例では、音声データの入力が終了してから、音声データを音声認識サーバへ送信するものとしたが、これに限定されない。本実施形態では、音声データが入力されると、音声データの入力の終了を待たずに、任意のタイミングで音声データを音声認識サーバへ送信しても良い。

また、本実施形態では、入力された音声データをテキストデータに変換する処理を、外部の音声認識サーバで行うか、又は、音声認識部２７０で行うかが、電子黒板２００に設定されていても良い。その場合、テキスト取得部２６５は、設定に基づき、テキストデータを取得すれば良い。

以下に、図９を参照して、図８に示す処理をさらに説明する。図９は、第一の実施形態の電子黒板による処理を説明する図である。

図９の例では、タイミングｔ１において、集音部２１０が音声データの取得を開始した場合の音量検出部２５０、音声スピード算出部２６０、表示制御部２８０の処理のタイミングを示している。

タイミングｔ１において、音声データの入力が開始されると、集音部２１０は、例えば、タイミングｔ１からタイミングｔ２までの期間Ｋ１分の音声データを取得する。

次に、音量検出部２５０は、タイミングｔ２において、期間Ｋ１の音声データが取得された直後のタイミングｔ２１から、期間Ｋ１の間に集音部２１０が取得した音声データの音量を検出する処理を開始し、音量を検出する。

また、音声スピード算出部２６０は、音量検出部２５０が期間Ｋ１の音声データの音量を検出する処理を開始した直後のタイミングｔ２２から、期間Ｋ１の音声データの音声スピードを算出する処理を開始する。

表示制御部２８０は、期間Ｋ１に取得した音声データの音量の検出と音声スピードの算出が完了したタイミングｔ２３において、この音量と音声スピードとをそれぞれの最適値と共に電子黒板２００に表示させる。

また、音量検出部２５０は、タイミングｔ２からタイミングｔ３までの期間Ｋ２において取得された音声データについて、タイミングｔ３の直後のタイミングｔ３１から、期間Ｋ２の音声データの音量を検出する処理を開始する。

また、音声スピード算出部２６０は、音量検出部２５０が期間Ｋ２音声データの音量を検出する処理を開始した直後のタイミングｔ３２から、期間Ｋ２の音声データの音声スピードを算出する処理を開始する。

表示制御部２８０は、期間Ｋ２に取得した音声データの音量の検出と音声スピードの算出が完了したタイミングｔ３３において、この音量と音声スピードとをそれぞれの最適値と共に電子黒板２００に表示させる。

このように、本実施形態では、音声データが入力されている間は、音声データの音量の検出と音声スピードの算出とを継続して行うため、発話者Ｐの話し方に対応した指標を表示させることができる。

尚、図９の例では、期間Ｋ１、Ｋ２、・・・、Ｋｎのそれぞれは、音声スピードを算出する際の単位時間であっても良い。

また、図８、図９の例では、音量検出部２５０による音量の検出と、音声スピード算出部２６０による速度の算出とを連続した処理としているが、これに限定されない。音量検出部２５０による音量の検出と、音声スピード算出部２６０による速度の算出とは、それぞれが独立した処理として実行されても良い。

その場合、表示制御部２８０は、音量検出部２５０と音声スピード算出部２６０のそれぞれから、個別に音量と速度とを取得し、最適値テーブル２９５から取得した最適値と共に指標２１を表示させれば良い。

また、本実施形態では、音声データが入力されると、音量と音声スピードとそれぞれの最適値とを指標として表示させるものとしたが、これに限定されない。

図１０は、第一の実施形態の電子黒板の他の表示例を示す図である。図１０の例では、指標２１の代わりに、指標２１の表示させるためのアイコン２２が表示されている。

図１０の例では、アイコン２２を選択する操作が行われると、表示制御部２８０により、アイコン２２の近傍の領域２３に、図１に示す指標２１を表示させても良い。また、この場合、表示制御部２８０は、指標２１が表示された状態で、再度アイコン２２を選択する操作が行われると、指標２１を非表示に切り替えても良い。

つまり、本実施形態の電子黒板２００では、音声データの音量と音声スピードとそれぞれの最適値とを含む指標の表示／非表示を切り替えることができる。したがって、本実施形態によれば、が任意のタイミングで発話者に指標２１を表示させ、発話者の音量と音声スピードと、それぞれの最適値とを提示することができ、音声データからテキストデータへ変換する際の精度を向上させることができる。

尚、指標２１の表示の仕方は、図１に示す例に限定されない。指標２１は、音量とその最適値と、音声スピードとその最適値とを全て数値で表示させても良い。指標２１では、音量検出部２５０により検出された音量と、音量の最適値とを比較した結果と、音声スピード算出部２６０により算出された音声スピードと、音声スピードの最適値とを比較した結果と、が示されれば、どのような表示態様であっても良い。

（第二の実施形態）
以下に図面を参照して、第二の実施形態について説明する。第二の実施形態では、電子黒板と外部装置の通信の状態等を示す指標を表示させる点が第一の実施形態と相違する。よって、以下の第二の実施形態の説明では、第一の実施形態との相違点についてのみ説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態で用いた符号と同様の符号を付与し、その説明を省略する。

図１１は、第二の実施形態の電子黒板の表示例を示す図である。本実施形態の電子黒板２００Ａでは、指標２１と指標２５を表示させる。

指標２５は、電子黒板２００Ａと外部装置との通信の状態を示す情報と、電子黒板２００Ａの状態を示す情報とを含む。

通信の状態を示す情報とは、例えば、電子黒板２００Ａとサーバ装置３００とを接続するネットワークの帯域の状態と、電子黒板２００Ａとサーバ装置３００との通信にかかる遅延の状態とを含む。尚、以下の説明では、通信にかかる時間を通信遅延時間と呼ぶ。本実施形態では、通信遅延時間が長いほど、通信にかかる遅延の状態が悪く、通信遅延時間が短いほど、通信にかかる遅延の状態が良くなる。

また、電子黒板２００Ａの状態を示す情報とは、例えば、電子黒板２００ＡのＣＰＵ使用率とメモリ使用率によって示される情報である。

本実施形態の指標２５では、ネットワークの帯域の状態を示すアイコン２５ａと、通信にかかる遅延の状態を示すアイコン２５ｂと、電子黒板２００Ａの状態を示すアイコン２５ｃと、が表示される。アイコン２５ａ、２５ｂ、２５ｃの色は、各アイコンと対応する状態に応じて変化する。

本実施形態では、このように、各アイコンの色を、状態に応じて変化させるため、発話者Ｐに対して、そのときの通信の状態と、電子黒板２００Ａの状態とを提示することができる。

また、指標２５には、アイコンの色と、色が示す状態とを対応付けを示す情報２６がア含まれる。情報２６では、３色の色と、３つの状態「良好」、「やや悪い」、「悪い」とが対応付けられている。

本実施形態では、指標２５において、情報２６をアイコンと共に表示させることで、発話者Ｐや電子黒板２００Ａの利用者に対し、通信の状態と電子黒板２００Ａの状態とを容易に把握させることができる。

尚、通信の状態を示す情報と電子黒板２００Ａの状態を示す情報の表示の仕方は、アイコンにより表示に限定されない。各状態を示す情報は、例えば、「良好」、「やや悪い」、「悪い」という文字で示されても良い。

また、図１１の例では、指標２５は、電子黒板２００Ａのディスプレイにおいて、指標２１と対角線上となる位置に表示されるものとしたが、これに限定されない。指標２５の表示位置は、任意の位置であって良く、発話者Ｐや電子黒板２００Ａの利用者によって設定されても良い。

また、図１１の例では、指標２５には、電子黒板２００Ａの状態を示す情報が含まれるものとしたが、これに限定されない。指標２５は、電子黒板２００Ａと外部装置との通信の状態を示す情報のみが含まれていても良い。具体的には、指標２５に含まれるアイコンは、アイコン２５ａ、２５ｂのみであっても良い。

次に、図１２を参照して、本実施形態の情報処理システム１００Ａの有する各装置の機能について説明する。図１２は、第二の実施形態の情報処理システムの有する各装置の機能を説明する図である。

本実施形態の電子黒板２００Ａは、集音部２１０、入力部２２０、コンテンツ変換部２３０、送受信部２４０、音量検出部２５０、音声スピード算出部２６０、音声認識部２７０、表示制御部２８０、通信状態取得部２８５、通信状態判定部２８６、装置状態判定部２８７を有する。

また、本実施形態の電子黒板２００Ａは、記憶部２９０Ａを有する。記憶部２９０Ａには、最適値テーブル２９５と、閾値テーブル２９６とが格納されている。

本実施形態の通信状態取得部２８５は、電子黒板２００Ａと外部装置との通信に用いられるネットワークの帯域と通信遅延時間を取得する。

具体的には、通信状態取得部２８５は、電子黒板２００Ａからサーバ装置３００に対してデータを送信した送信時刻から、このデータに対する応答を受信した受信時刻までを通信遅延時間とする。尚、本実施形態の通信状態取得部２８５は、電子黒板２００Ａからサーバ装置３００以外の装置へデータを送信してから、その応答を受信するまでの時間を計測し、通信遅延時間としても良い。

また、通信状態取得部２８５は、送信時刻から受信時刻までの間に伝送さたれたデータ量をネットワークの帯域として取得する。尚、本実施形態におけるネットワークの帯域とは、ネットワークの伝送路容量（ビットレート：ｂｐｓ）、つまりネットワークのデータ伝送能力（単位時間あたりにどれだけのデータ量を伝送できるか）を意味する。

本実施形態の通信状態判定部２８６は、閾値テーブル２９６を参照し、通信状態取得部２８５により取得された通信遅延時間又はネットワークの帯域に基づき、電子黒板２００Ａと外部装置（サーバ装置３００）との通信の状態を判定する。

尚、本実施形態の通信状態判定部２８６は、通信遅延時間又はネットワークの帯域の何れか一方と、閾値テーブル２９６とに基づき通信の状態を判定するものとしたが、これに限定されない。通信状態判定部２８６は、通信遅延時間とネットワークの帯域の両方と、閾値テーブルとに基づき、通信の状態を判定しても良い。閾値テーブル２９６の詳細は後述する。

装置状態判定部２８７は、電子黒板２００ＡのＣＰＵ使用率とメモリ使用率とを取得し、閾値テーブル２９６を参照して電子黒板２００Ａの状態を判定する。電子黒板２００Ａの状態とは、言い換えれば、電子黒板２００Ａにかかる処理負荷の大きさである。

また、装置状態判定部２８７により取得されるＣＰＵ使用率は、例えば、電子黒板２００Ａの有する全てのＣＰＵのＣＰＵ使用率であっても良いし、全てのＣＰＵ使用率の平均値等であっても良いし、特定のＣＰＵのＣＰＵ使用率であっても良い。また、装置状態判定部２８７により取得されるメモリ使用率は、例えば、電子黒板２００Ａの有する全てのメモリのメモリ使用率であっても良いし、全てのメモリ使用率の平均値等であっても良いし、特定のメモリのメモリ使用率であっても良い。以下の説明では、ＣＰＵ使用率とメモリ使用率とを、装置情報と呼ぶ。

次に、図１３を参照して、本実施形態の閾値テーブル２９６について説明する。図１３は、第二の実施形態の閾値テーブルの一例を示す図である。

本実施形態の閾値テーブル２９６は、情報の項目として、状態、帯域、通信遅延時間、装置情報を有する。閾値テーブル２９６において、項目「状態」と、その他の項目とは対応付けられている。

項目「状態」の値は、電子黒板２００Ａと外部装置の通信の状態や、電子黒板２００Ａの状態を示す値である。具体的には、項目「状態」の値は、「良好」、「やや悪い」、「悪い」がある。

項目「帯域」の値は、通信状態取得部２８５が取得する帯域を示す。項目「通信遅延時間」の値は、通信状態取得部２８５が取得した通信遅延時間を示す。項目「装置状態」の値は、装置状態判定部２８７が取得した電子黒板２００ＡのＣＰＵ使用率とメモリ使用率を示す。

本実施形態の通信状態判定部２８６は、最適値テーブル２９５を参照することで、電子黒板２００Ａと外部装置との通信の状態や、電子黒板２００Ａの状態が、「良好」、「やや悪い」、「悪い」に該当するかを判定することができる。

次に、図１４を参照して、本実施形態の電子黒板２００Ａの動作について説明する。尚、指標２１を表示させる動作は、第一の実施形態と同様であるから説明を省略する。

図１４は、第二の実施形態の電子黒板の動作を説明するフローチャートである。図１４では、指標２５を表示させる処理を示している。

本実施形態の電子黒板２００Ａは、通信状態取得部２８５により、外部装置へデータを送信し（ステップＳ１４０１）、このデータに対する応答を受信する（ステップＳ１４０２）。続いて、電子黒板２００Ａは、通信状態取得部２８５により、データを送信した送信時刻と応答を受信した受信時刻と、伝送されたデータ量とから、ネットワークの帯域と通信遅延時間を取得する（ステップＳ１４０３）。

続いて、通信状態判定部２８６は、閾値テーブル２９６を参照し、ネットワークの帯域と対応する状態と、通信遅延時間と対応する状態とを判定する（ステップＳ１４０４）。

具体的には、例えば、通信状態判定部２８６は、ステップＳ１４０３で取得した帯域の値が、閾値テーブル２９６の状態「良好」と対応する範囲に含まれる場合には、帯域の状態を「良好」と判定する。また、例えば、通信状態判定部２８６は、ステップＳ１４０３で取得した通信遅延時間が、閾値テーブル２９６の状態「やや悪い」と対応する範囲に含まれる場合には、通信にかかる遅延の状態を「やや悪い」と判定する。

続いて、電子黒板２００Ａは、装置状態判定部２８７により、電子黒板２００ＡのＣＰＵ使用率とメモリ使用率とを取得する（ステップＳ１４０５）。言い換えれば、装置状態判定部２８７は、電子黒板２００Ａの装置情報を取得する。

続いて、装置状態判定部２８７は、閾値テーブル２９６を参照し、電子黒板２００Ａの状態を判定する（ステップＳ１４０６）。

具体的には、例えば、装置状態判定部２８７は、ステップＳ１４０５で取得した装置情報（ＣＰＵ使用率とメモリ使用率）が、閾値テーブル２９６の状態「良好」と対応する範囲内であれば、電子黒板２００Ａの状態を良好と判定する。

続いて、電子黒板２００は、表示制御部２８０により、通信状態判定部２８６と装置状態判定部２８７の判定結果に応じて、指標２５を表示させる（ステップＳ１４０８）。

続いて、電子黒板２００Ａは、外部装置との通信が終了したか否かを判定する（ステップＳ１４０９）。ステップＳ１４０９において、通信が終了していない場合、電子黒板２００Ａは、ステップＳ１４０１へ戻る。ステップＳ１４０９において、通信が終了した場合、電子黒板２００Ａは処理を終了する。

尚、本実施形態では、指標２５は、指標２１と同様に、非表示とすることができる。図１５は、第二の実施形態の電子黒板の他の表示例を示す図である。本実施形態の電子黒板２００Ａでは、指標２１と指標２５を非表示とし、代わりにアイコン２２とアイコン２８が表示されている。

図１５の状態で、アイコン２８を選択する操作が行われると、アイコン２８の近傍の領域２９に指標２５が表示されても良い。

このように、本実施形態では、指標２５の表示と非表示とを切り替えることができる。したがって、本実施形態では、例えば、音声データを外部の音声認識装置等に送信して音声認識を行う際に、外部装置との通信の状態を発話者Ｐや電子黒板２００Ａの利用者に提示することができる。

（第三の実施形態）
以下に図面を参照して、第三の実施形態について説明する。第三の実施形態では、音量の検出と音声スピードの算出をサーバ装置で行う点が第一の実施形態と相違する。よって、以下の第三の実施形態の説明では、第一の実施形態との相違点についてのみ説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態で用いた符号と同様の符号を付与し、その説明を省略する。

図１６は、第三の実施形態の情報処理システムの有する各装置の機能を説明する図である。

本実施形態の情報処理システム１００Ｂは、電子黒板２００Ｂとサーバ装置３００Ａとを有する。

本実施形態の電子黒板２００Ｂは、集音部２１０、入力部２２０、コンテンツ変換部２３０、送受信部２４０、表示制御部２８０、通信状態取得部２８５、通信状態判定部２８６、装置状態判定部２８７、記憶部２９０Ａを有する。

本実施形態のサーバ装置３００Ａは、コンテンツデータベース３１０、送受信部３２０、コンテンツ格納部３３０、音量検出部２５０、音声スピード算出部２６０、音声認識部２７０を有する。

以下に図１７を参照して、本実施形態の情報処理システム１００Ｂの動作について説明する。図１７は、第三の実施形態の情報処理システムの動作を説明するシーケンス図である。

情報処理システム１００Ｂにおいて、電子黒板２００Ｂは、集音部２１０により音声データを取得し（ステップＳ１７０１）、送受信部２４０によりサーバ装置３００Ａへ送信する（ステップＳ１７０２）。

サーバ装置３００Ａは、音声データを受信すると、音量検出部２５０により音声データの音量を検出し、音声スピード算出部２６０により音声スピードを算出する（ステップＳ１７０３）。ステップＳ１７０３におけるサーバ装置３００Ａの処理は、図８のステップＳ８０１からステップＳ８０４までの処理と同様であるから、説明を省略する。

続いて、サーバ装置３００Ａは、送受信部３２０により、音声データの音量と音声スピードとを電子黒板２００Ｂに送信する（ステップＳ１７０４）。

電子黒板２００Ｂは、音声データの音量と音声スピードとを受信すると、表示制御部２８０により、最適値テーブル２９５を参照して指標２１を表示させる（ステップＳ１７０５）。

このように、本実施形態では、音声データの音量の検出と音声スピードの算出をサーバ装置３００Ａで行うため、電子黒板２００Ｂにおける処理負荷を軽減することができる。

尚、図１７の例では、サーバ装置３００Ａが音声認識部２７０を有する構成としているため、サーバ装置３００Ａで音声認識を行っても良い。また、音声認識部２７０は、電子黒板２００Ｂが有していても良い。

（第四の実施形態）
以下に図面を参照して、第四の実施形態について説明する。第四の実施形態は、情報処理システムにおいて、電子黒板の代わりに、画像投影装置を用いた点が、第一の実施形態と相違する。よって、以下の第四の実施形態の説明では、第一の実施形態との相違点についてのみ説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。

図１８は、第四の実施形態の情報処理システムを説明する図である。図１８に示す情報処理システム１００Ｃは、画像投影装置（プロジェクタ）７００とサーバ装置３００とを有する。

画像投影装置７００は、例えば、画像投影装置７００と接続された端末装置から入力された画像データを、スクリーン８００に投影する。スクリーン８００は、例えば、ホワイトボードや壁面等が代用されても良く、ディスプレイ２２６に相当するものとなる。

また、画像投影装置７００は、電子ペンや利用者の手等の動作を検出することで、スクリーン８００に対する手書き入力を検出し、スクリーン８００にストローク画像を投影させる。

本実施形態の画像投影装置７００は、第一乃至第三の実施形態と同様に、集音装置を有し、音声データが入力されると、音声データの音量と音声スピードとを取得して指標２１をスクリーン８００に投影させる。

また、画像投影装置７００は、例えば、保存ボタン７０１が操作された場合に、サーバ装置３００に画像データや音声データを送信する以外に、例えば、ＵＳＢメモリ等の可搬型の記録媒体に画像データや音声データを出力し、保存させても良い。

以上のように、本実施形態では、画像投影装置７００とサーバ装置３００のシステムにおいても、発話者に対して、音声認識の精度を向上させるための指標を提示することができる。

尚、上述した各実施形態における情報処理システムでは、サーバは複数台でも良く、どのサーバに機能を備えさせても良い。尚、各実施形態で説明する端末（電子黒板２００）と、サーバ装置３００とが接続されたシステム構成は一例であり、用途や目的に応じて様々なシステム構成例があることは言うまでもない。

また、上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたＡＳＩＣ (Application Specific Integrated Circuit)、ＤＳＰ（digital signal processor）、ＦＰＧＡ（field programmable gate array）、ＳＯＣ(System on a chip)、ＧＰＵ（Graphics Processing Unit）や従来の回路モジュール等のデバイスを含むものとする。

以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。

１００、１００Ａ～１００Ｃ情報処理システム
２００、２００Ａ、２００Ｂ電子黒板
２１０集音部
２２０入力部
２３０コンテンツ変換部
２４０送受信部
２５０音量検出部
２６０音声スピード算出部
２６５テキスト取得部
２７０音声認識部
２８０表示制御部
２８５通信状態取得部
２８６通信状態判定部
２８７装置状態判定部
２９０、２９０Ａ記憶部
２９５最適値テーブル
２９６閾値テーブル
３００、３００Ａサーバ装置

特開２０１７－１６２９６号公報

Claims

集音装置が集音した音を音声データとして取得する集音部と、
前記音声データをテキストデータへ変換する音声認識部と、
前記音声認識部により変換されたテキストデータを取得するテキスト取得部と、
前記音声認識部によってテキストデータに変換するための最適値に関する情報を記憶する記憶部と、
前記音声データに基づき生成された前記音の音量を示す情報と、前記音声データに基づき算出された音声の速度を示す情報と、前記音声データに基づき生成された前記音の音量を示す、前記音声認識部によってテキストデータに変換するための最適値に関する情報と、前記音声データに基づき算出された音声の速度を示す、前記音声認識部によってテキストデータに変換するための最適値に関する情報と、を含む指標を表示部に表示させる表示制御部と、備え、
前記表示制御部は、前記音声認識部により変換したテキストデータと前記指標と共に表示する、表示端末。
前記音の音量を示す情報は、前記音声データに基づき生成された第１の音の音量を示す情報と当該情報の比較に用いるための第２の音の音量を示す情報とに基づいて比較した結果を示す情報である、請求項１記載の表示端末。
前記音声の速度を示す情報は、前記音声データに基づき算出された第１の音声の速度を示す情報と当該情報の比較に用いるための第２の音声の速度を示す情報とに基づいて比較した結果を示す情報である、請求項２記載の表示端末。
前記第２の音の音量を示す情報は、前記音声データをテキストデータに変換するための音声データの音量を示す最適値である、請求項２記載の表示端末。
前記第２の音声の速度を示す情報は、前記音声データをテキストデータに変換するための音声の速度を示す最適値である、請求項３記載の表示端末。
前記テキスト取得部は、
前記表示端末とネットワークを介して通信可能な音声変換サーバへ前記音声データを送信し、その応答として、該ネットワークを介して前記テキストデータを取得する、請求項１乃至５の何れか一項に記載の表示端末。
前記音声データから、単位時間当たりの音素の個数を求め、前記個数を前記音声の速度とする音声速度算出部を有する、請求項１乃至６の何れか一項に記載の表示端末。
外部装置との通信に用いられるネットワークの帯域を示す情報と、前記外部装置との通信遅延時間とを取得する通信状態取得部と、
前記通信状態取得部が取得した前記帯域を示す情報又は前記通信遅延時間とに基づき、前記外部装置との通信の状態を判定する通信状態判定部と、を有し、
前記表示制御部は、
前記通信状態判定部による判定結果を前記外部装置との通信の状態を示す指標として表示部に表示させる、請求項１乃至７の何れか一項に記載の表示端末。
前記ネットワークの帯域を示す情報と、前記通信遅延時間のそれぞれについて設定された閾値と、前記通信の状態とが対応付けられた閾値テーブルが格納された記憶部を有し、
前記通信状態判定部は、前記閾値テーブルを参照して、前記通信の状態を判定する、請求項８記載の表示端末。
前記閾値テーブルにおいて、
前記表示端末に有する演算処理装置の使用率及び前記表示端末の有するメモリ装置の使用率のそれぞれについて設定された閾値と、前記表示端末の状態とが対応付けられており、
前記表示端末に有する演算処理装置の使用率及び前記表示端末の有するメモリ装置の使用率を取得して、前記閾値テーブルを参照して前記表示端末の状態を判定する装置状態判定部を有し、
前記表示制御部は、
前記通信の状態を示す指標に、前記装置状態判定部により判定結果を含める、請求項９記載の表示端末。
コンピュータによる方法であって、前記コンピュータが、
集音装置が集音した音を音声データとして取得する手順と、
前記音声データをテキストデータへ変換する手順と、
前記音声データから変換されたテキストデータを取得する手順と、
前記音声データを前記テキストデータに変換するための最適値に関する情報を記憶部に記憶する手順と、
前記音声データに基づき生成された前記音の音量を示す情報と、前記音声データに基づき算出された音声の速度を示す情報と、前記音声データに基づき生成された前記音の音量を示す、前記音声データをテキストデータに変換するための最適値に関する情報と、前記音声データに基づき算出された音声の速度を示す、前記音声データをテキストデータに変換するための最適値に関する情報と、を含む指標を表示部に表示させる手順と、備え、
前記表示させる手順において、前記音声データにより変換したテキストデータと前記指標と共に表示する、方法。
集音装置が集音した音を音声データとして取得する処理と、
前記音声データをテキストデータへ変換する処理と、
前記音声データから変換されたテキストデータを取得する処理と、
前記音声データを前記テキストデータに変換するための最適値に関する情報を記憶部に記憶する処理と、
前記音声データに基づき生成された前記音の音量を示す情報と、前記音声データに基づき算出された音声の速度を示す情報と、前記音声データに基づき生成された前記音の音量を示す、前記音声データをテキストデータに変換するための最適値に関する情報と、前記音声データに基づき算出された音声の速度を示す、前記音声データをテキストデータに変換するための最適値に関する情報と、を含む指標を表示部に表示させる処理と、コンピュータに実行させ、
前記表示させる処理において、前記音声データにより変換したテキストデータと前記指標と共に表示する、プログラム。
表示端末と、前記表示端末と通信を行う情報処理装置と、を含む情報処理システムであって、
集音装置が集音した音を音声データとして取得する集音部と、
前記音声データをテキストデータへ変換する音声認識部と、
前記音声認識部により変換されたテキストデータを取得するテキスト取得部と、
前記音声認識部によってテキストデータに変換するための最適値に関する情報を記憶する記憶部と、
前記音声データに基づき生成された前記音の音量を示す情報と、前記音声データに基づき算出された音声の速度を示す情報と、前記音声データに基づき生成された前記音の音量を示す、前記音声認識部によってテキストデータに変換するための最適値に関する情報と、前記音声データに基づき算出された音声の速度を示す、前記音声認識部によってテキストデータに変換するための最適値に関する情報と、を含む指標を表示部に表示させる表示制御部と、備え、
前記表示制御部は、前記音声認識部により変換したテキストデータと前記指標と共に表示する、情報処理システム。
表示端末と、前記表示端末と通信を行う情報処理装置と、を含む情報処理システムによる方法であって、
前記表示端末が、
集音装置が集音した音を音声データとして取得する手順と、
前記音声データをテキストデータへ変換する手順と、
前記音声データから変換されたテキストデータを取得する手順と、
前記音声データを前記テキストデータに変換するための最適値に関する情報を記憶部に記憶する手順と、
前記音声データに基づき生成された前記音の音量を示す情報と、前記音声データに基づき算出された音声の速度を示す情報と、前記音声データに基づき生成された前記音の音量を示す、前記音声データをテキストデータに変換するための最適値に関する情報と、前記音声データに基づき算出された音声の速度を示す、前記音声データをテキストデータに変換するための最適値に関する情報と、を含む指標を表示部に表示させる手順と、備え、
前記表示させる手順において、前記音声データにより変換したテキストデータと前記指標と共に表示する、方法。