JP2023047178A

JP2023047178A - 情報処理装置及び情報処理プログラム

Info

Publication number: JP2023047178A
Application number: JP2021156130A
Authority: JP
Inventors: 佑樹清水; Yuki Shimizu
Original assignee: Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2021-09-24
Filing date: 2021-09-24
Publication date: 2023-04-05
Also published as: US20230098333A1

Abstract

【課題】受話者側における発話者による音声の品質を考慮しない場合に比較して、より的確に発話者による音声を改善させることができる情報処理装置及び情報処理プログラムを得る。【解決手段】情報処理装置１０は、受話者側における発話者による音声の品質を示す品質情報を即時的に取得する取得部１１Ａと、取得した品質情報が示す品質が予め定められた条件を満足しない場合、当該品質を改善するための改善情報を当該発話者に即時的に提示する提示部１１Ｂと、を備える。【選択図】図２

Description

本発明は、情報処理装置及び情報処理プログラムに関する。

特許文献１には、実際の会議にはない音声会議ならではの会議を行ない得ることを目的とした音声受信装置が開示されている。

この音声受信装置は、受信音声信号から得られる音質、音響、音質と音響との両方、のいずれかを音声会議の参加者別に制御するための制御信号として生成する制御手段を備えている。また、この音声受信装置は、上記制御信号に基づき参加者別に受信音声信号から得られる音質、音響、音質と音響との両方、のいずれかを変える変換手段を備えている。

また、特許文献２には、聞き手の受聴環境において自身の音声がどのように届いているかを、伝送遅延を引き起こさずに、聴覚的に理解することができるようにすることを目的とした音声通信装置が開示されている。

この音声通信装置は、音声信号が入力される音声信号入力部と、音声信号を出力する音声信号出力部と、他の音声通信装置から前記音声出力部に出力する音声信号を受信する音声信号受信部と、を備えている。また、この音声通信装置は、所定の空間における環境音響特性を測定する測定部と、前記測定部により測定された前記環境音響特性に関する情報を前記他の音声通信装置に送信する特性情報送信部と、を備えている。

特開平０８－１２５７６１号公報特開２０１２－０９４９４５号公報

本発明は、受話者側における発話者による音声の品質を考慮しない場合に比較して、より的確に発話者による音声を改善させることができる情報処理装置及び情報処理プログラムを提供することを目的とする。

上記目的を達成するために、第１態様に係る情報処理装置は、プロセッサを備え、前記プロセッサは、受話者側における発話者による音声の品質を示す品質情報を即時的に取得し、取得した品質情報が示す品質が予め定められた条件を満足しない場合、当該品質を改善するための改善情報を当該発話者に即時的に提示する。

また、第２態様に係る情報処理装置は、第１態様に係る情報処理装置において、前記プロセッサが、前記品質情報を、前記受話者による評価結果から取得するものである。

また、第３態様に係る情報処理装置は、第２態様に係る情報処理装置において、前記プロセッサが、前記品質情報を、複数の前記受話者による評価結果から取得するものである。

また、第４態様に係る情報処理装置は、第３態様に係る情報処理装置において、前記プロセッサが、複数の前記評価結果に応じて、前記改善情報の提示内容を決定するものである。

また、第５態様に係る情報処理装置は、第２態様～第４態様の何れか１態様に係る情報処理装置において、前記評価が、前記発話者による発話中における表示画面を用いて行われるものである。

また、第６態様に係る情報処理装置は、第１態様～第５態様の何れか１態様に係る情報処理装置において、前記プロセッサが、前記品質が前記予め定められた条件を満足しない場合、当該品質を改善するための制御を更に行うものである。

また、第７態様に係る情報処理装置は、第６態様に係る情報処理装置において、前記プロセッサが、前記品質を改善するための制御を、発話者が用いる端末装置と、受話者が用いる端末装置と、の少なくとも一方に対して行うものである。

また、第８態様に係る情報処理装置は、第７態様に係る情報処理装置において、前記プロセッサが、前記受話者が複数存在する場合で、かつ、当該複数の受話者における、予め定められた数以上の受話者について、前記品質が前記条件を満足しない場合、前記発話者が用いる端末装置に対して前記制御を行うものである。

また、第９態様に係る情報処理装置は、第７態様に係る情報処理装置において、前記プロセッサが、前記受話者が複数存在する場合で、かつ、当該複数の受話者における、予め定められた数未満の受話者について、前記品質が前記条件を満足しない場合、前記受話者が用いる端末装置に対して前記制御を行うものである。

また、第１０態様に係る情報処理装置は、第１態様～第９態様の何れか１態様に係る情報処理装置において、前記音声の品質が、前記音声の大きさ及び前記音声の明瞭度の少なくとも一方の品質であるものである。

更に、上記目的を達成するために、第１１態様に係る情報処理プログラムは、受話者側における発話者による音声の品質を示す品質情報を即時的に取得し、取得した品質情報が示す品質が予め定められた条件を満足しない場合、当該品質を改善するための改善情報を当該発話者に即時的に提示する、処理をコンピュータに実行させる。

第１態様及び第１１態様によれば、受話者側における発話者による音声の品質を考慮しない場合に比較して、より的確に発話者による音声を改善させることができる。

第２態様によれば、受話者による感じ方を含めた品質とすることができる結果、受話者による評価結果を考慮しない場合に比較して、より的確に発話者による音声を改善させることができる。

第３態様によれば、単一の受話者による評価結果のみを用いる場合に比較して、より的確に発話者による音声を改善させることができる。

第４態様によれば、改善情報の提示内容を画一的なものとする場合に比較して、より効果的に発話者による音声を改善させることができる。

第５態様によれば、評価を音声により行う場合に比較して、他の受話者に対する評価結果の漏洩を防止することができる。

第６態様によれば、上記制御を行わない場合に比較して、より簡易に発話者による音声の品質を向上させることができる。

第７態様によれば、制御を発話者が用いる端末装置に対して行う場合は、一括して音声の品質の改善を行うことができ、制御を受話者が用いる端末装置に対して行う場合は、受話者別に音声の品質を改善することができる。

第８態様によれば、一括して音声の品質の改善を行うことができる。

第９態様によれば、受話者別に音声の品質を改善することができる。

第１０態様によれば、音声の大きさ及び明瞭度の少なくとも一方の品質に関して、発話者による音声を改善させることができる。

実施形態に係る情報処理システムのハードウェア構成の一例を示すブロック図である。実施形態に係る情報処理システムの機能的な構成の一例を示すブロック図である。実施形態に係る組み合わせ通知情報データベースの構成の一例を示す模式図である。実施形態に係るネット会合表示画面の一例を示す正面図である。実施形態に係るネット会合表示画面の他の一例を示す正面図である。実施形態に係る情報処理の一例を示すフローチャートである。実施形態に係る音量調整処理の一例を示すフローチャートである。実施形態に係る組み合わせ評価処理の一例を示すフローチャートである。

以下、図面を参照して、本発明を実施するための形態例を詳細に説明する。なお、本実施形態では、本発明を、ネットワークを介して行われる会合（以下、「ネット会合」という。）の参加者が各々個別に利用する複数の端末装置と、当該ネット会合を統括的に管理する情報処理装置と、を含む情報処理システムに適用した場合について説明する。また、ここでいう「会合」とは、企業内や企業間等で行われる会議のみならず、研修会、講演会、飲酒を伴わない懇親会、飲酒を伴う懇親会（所謂飲み会）等の複数人で行う、あらゆる会話を伴う会を意味する。

まず、図１及び図２を参照して、本実施形態に係る情報処理システム９０の構成を説明する。図１は、本実施形態に係る情報処理システム９０のハードウェア構成の一例を示すブロック図である。また、図２は、本実施形態に係る情報処理システム９０の機能的な構成の一例を示すブロック図である。

図１に示すように、本実施形態に係る情報処理システム９０は、ネットワーク８０に各々アクセス可能とされた、情報処理装置１０と、複数の端末装置３０と、を含む。なお、情報処理装置１０の例としては、パーソナルコンピュータ及びサーバコンピュータ等の各種コンピュータが挙げられる。また、端末装置３０の例としても、当該各種コンピュータの他、スマートフォン、タブレット端末、ＰＤＡ（Personal Digital Assistant、携帯情報端末）等の携帯型の装置が挙げられる。本実施形態では、端末装置３０として、携帯型の装置を適用する場合について説明する。

本実施形態に係る端末装置３０は、情報処理システム９０が管理するネット会合の参加者（以下、単に「参加者」という。）が各々所有する端末である。端末装置３０は、ＣＰＵ（Central Processing Unit）３１、一時記憶領域としてのメモリ３２、不揮発性の記憶部３３、タッチパネル等の入力部３４、液晶ディスプレイ等の表示部３５、及び媒体読み書き装置（Ｒ／Ｗ）３６を備えている。また、端末装置３０は、撮影部３８、マイクロフォン（以下、「マイク」という。）３９、スピーカ４０、ノイズフィルタ４１、及び無線通信部４２を備えている。ＣＰＵ３１、メモリ３２、記憶部３３、入力部３４、表示部３５、媒体読み書き装置３６、撮影部３８、マイク３９、スピーカ４０、ノイズフィルタ４１、及び無線通信部４２はバスＢ１を介して互いに接続されている。媒体読み書き装置３６は、記録媒体３７に書き込まれている情報の読み出し及び記録媒体３７への情報の書き込みを行う。

記憶部３３は、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、フラッシュメモリ等によって実現される。記憶媒体としての記憶部３３には、ネット会合参加プログラム３３Ａが記憶されている。ネット会合参加プログラム３３Ａは、当該プログラム３３Ａが書き込まれた記録媒体３７が媒体読み書き装置３６にセットされ、媒体読み書き装置３６が記録媒体３７からの当該プログラム３３Ａの読み出しを行うことで、記憶部３３へ記憶（インストール）される。ＣＰＵ３１は、ネット会合参加プログラム３３Ａを記憶部３３から読み出してメモリ３２に展開し、ネット会合参加プログラム３３Ａが有するプロセスを順次実行する。

また、本実施形態に係る撮影部３８は、参加者に対する動画像を撮影するものであり、当該撮影によって得られた画像情報を出力する。また、本実施形態に係るマイク３９は、参加者が発した音声を収集し、音声情報を出力する。また、本実施形態に係るスピーカ４０は、音声情報により示される音声を再生するものである。

更に、本実施形態に係るノイズフィルタ４１は、マイク３９によって収集された音声におけるノイズを除去する機能、及びスピーカ４０により再生される音声におけるノイズを除去する機能を有する。

なお、本実施形態では、ノイズフィルタ４１として、人の音声の周波数帯域の信号のみを通過させるバンドパスフィルタを用いているが、これに限るものではない。例えば、人の音声の周波数帯域を含む信号を通過させるローパスフィルタや、ハイパスフィルタをノイズフィルタ４１として適用する形態としてもよいし、特定のノイズ成分のみを除去するノイズ除去フィルタをノイズフィルタ４１として適用する形態としてもよい。また、本実施形態では、音声におけるノイズを除去するために、ハードウェアとして構成されたノイズフィルタ４１を適用しているが、この形態に限るものではない。例えば、ソフトウェアにより構成されたノイズフィルタを適用する形態としてもよいし、ソフトウェアとハードウェアとの組み合わせにより構成されたノイズフィルタを適用する形態としてもよい。

一方、情報処理装置１０は、情報処理システム９０において中心的な役割を有する装置であり、情報処理システム９０が管理するネット会合（以下、単に「ネット会合」という。）を統括的に管理する装置であることは前述した通りである。情報処理装置１０は、ＣＰＵ１１、一時記憶領域としてのメモリ１２、不揮発性の記憶部１３、キーボードとマウス等の入力部１４、液晶ディスプレイ等の表示部１５、媒体読み書き装置１６、及び通信インタフェース（Ｉ／Ｆ）部１８を備えている。ＣＰＵ１１、メモリ１２、記憶部１３、入力部１４、表示部１５、媒体読み書き装置１６、及び通信Ｉ／Ｆ部１８はバスＢ２を介して互いに接続されている。媒体読み書き装置１６は、記録媒体１７に書き込まれている情報の読み出し及び記録媒体１７への情報の書き込みを行う。

記憶部１３はＨＤＤ、ＳＳＤ、フラッシュメモリ等によって実現される。記憶媒体としての記憶部１３には、情報処理プログラム１３Ａ等の各種プログラムが記憶されている。

情報処理プログラム１３Ａ等の各種プログラムは、当該各種プログラムが書き込まれた記録媒体１７が媒体読み書き装置１６にセットされ、媒体読み書き装置１６が記録媒体１７からの当該各種プログラムの読み出しを行うことで、記憶部１３へ記憶（インストール）される。ＣＰＵ１１は、上記各種プログラムを記憶部１３から読み出してメモリ１２に展開し、当該各種プログラムが有するプロセスを順次実行する。

また、記憶部１３には、組み合わせ通知情報データベース１３Ｂが記憶される。組み合わせ通知情報データベース１３Ｂについては、詳細を後述する。

なお、本実施形態では、ネットワーク８０として、インターネット、電話回線網等の公共の通信回線を適用しているが、この形態に限定されるものではない。例えば、ネットワーク８０として、ＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）等の企業内の通信回線を適用してもよく、これらの企業内の通信回線及び公共の通信回線を組み合わせて適用してもよい。

次に、図２を参照して、本実施形態に係る情報処理装置１０及び端末装置３０の機能的な構成について説明する。

図２に示すように、本実施形態に係る端末装置３０は、制御部３１Ａを含む。端末装置３０のＣＰＵ３１がネット会合参加プログラム３３Ａを実行することで、制御部３１Ａとして機能する。

本実施形態に係る制御部３１Ａは、撮影部３８による参加者の撮影の制御、及びマイク３９による参加者が発した音声の集音の制御を行う。また、本実施形態に係る制御部３１Ａは、スピーカ４０による音声の再生の制御、表示部３５による各種情報の表示の制御、及び無線通信部４２による情報処理装置１０との通信の制御を行う。また、本実施形態に係る制御部３１Ａは、ノイズフィルタ４１による音声におけるノイズの除去の制御を行う。その他、本実施形態に係る制御部３１Ａは、ネット会合を行うための各種制御を行う。

一方、図２に示すように、本実施形態に係る情報処理装置１０は、取得部１１Ａ、提示部１１Ｂ、及び制御部１１Ｃを含む。情報処理装置１０のＣＰＵ１１が情報処理プログラム１３Ａを実行することで、取得部１１Ａ、提示部１１Ｂ、及び制御部１１Ｃとして機能する。

本実施形態に係る取得部１１Ａは、ネット会合を実施している際の受話者側における発話者による音声の品質を示す品質情報（以下、単に「品質情報」という。）を即時的に取得する。

ここで、本実施形態に係る取得部１１Ａは、品質情報を、受話者による評価結果から取得する。特に、本実施形態に係る取得部１１Ａは、品質情報を、複数の受話者による評価結果から取得する。

このように、本実施形態では、取得部１１Ａが、受話者による評価結果から品質情報を取得しているが、この形態に限るものではない。例えば、発話者が用いる端末装置３０のマイク３９によって得られた音声情報から、当該音声情報が示す音声の品質を判定することで、品質情報を自動的に取得する形態としてもよい。また、受話者が用いる端末装置３０のスピーカ４０によって再生される、発話者が発した音声を示す音声情報から、当該音声情報が示す音声の品質を判定することで、品質情報を自動的に取得する形態としてもよい。

また、本実施形態に係る提示部１１Ｂは、取得部１１Ａによって取得された品質情報が示す品質が予め定められた条件を満足しない場合、当該品質を改善するための改善情報を当該発話者に即時的に提示する。なお、本実施形態では、当該改善情報の提示を、表示画面を用いた表示により行っているが、この形態に限るものではない。例えば、スピーカ４０を用いた音声により、改善情報の提示を行う形態としてもよい。

ここで、本実施形態に係る提示部１１Ｂは、複数の評価結果に応じて、改善情報の提示内容を決定する。なお、本実施形態では、上記評価を、発話者による発話中における表示画面を用いて行っているが、この形態に限るものではない。例えば、上記評価を、マイク３９を用いた音声の入力により行う形態としてもよい。

一方、本実施形態に係る制御部１１Ｃは、上記品質が上記予め定められた条件を満足しない場合、当該品質を改善するための制御を行う。

ここで、本実施形態に係る制御部１１Ｃは、上記品質を改善するための制御を、発話者が用いる端末装置３０と、受話者が用いる端末装置３０と、の双方に対して行うが、この形態に限るものではない。例えば、上記品質を改善するための制御を、発話者が用いる端末装置３０と、受話者が用いる端末装置３０と、の何れか一方のみに行う形態としてもよい。

また、本実施形態に係る制御部１１Ｃは、受話者が複数存在する場合で、かつ、当該複数の受話者における、予め定められた数以上の受話者について、上記品質が上記条件を満足しない場合、発話者が用いる端末装置３０に対して上記制御を行う。

これに対し、本実施形態に係る制御部１１Ｃは、受話者が複数存在する場合で、かつ、当該複数の受話者における、予め定められた数未満の受話者について、上記品質が上記条件を満足しない場合、受話者が用いる端末装置３０に対して上記制御を行う。

更に、本実施形態では、上記音声の品質が、音声の大きさ及び音声の明瞭度の双方の品質とされているが、この形態に限るものではない。例えば、音声の大きさ及び音声の明瞭度の何れか一方の品質を上記音声の品質として適用する形態としてもよい。また、本実施形態では、当該音声の明瞭度の対象として、ノイズの有無、音声の途切れの有無、及び音声のこもりの有無を適用しているが、この形態に限るものではない。例えば、ノイズの量、音声の途切れの頻度、及び音声のこもりの度合いを、上記音声の明瞭度の対象として適用する形態としてもよい。また、何れの形態についても、ノイズ、音声の途切れ、及び音声のこもりの３種類が必須とは限らず、これらの３種類のうちの何れか１種類、又は２種類の組み合わせを適用する形態としてもよい。

次に、図３を参照して、本実施形態に係る組み合わせ通知情報データベース１３Ｂについて説明する。図３は、本実施形態に係る組み合わせ通知情報データベース１３Ｂの構成の一例を示す模式図である。

本実施形態に係る組み合わせ通知情報データベース１３Ｂは、上述した音声の大きさの評価結果と、音声の明瞭度の評価結果と、の組み合わせに応じて発話者に提示する情報が登録されたデータベースである。図３に示すように、本実施形態に係る組み合わせ通知情報データベース１３Ｂは、第１評価結果、第２評価結果、及び通知内容の各情報が関連付けられて記憶されている。

上記第１評価結果は、上述した音声の大きさに関する評価結果を示す情報であり、上記第２評価結果は、上述した音声の明瞭度に関する評価結果を示す情報である。そして、上記通知情報は、対応する第１評価結果と第２評価結果との組み合わせに対応して発話者に提示する内容を示す情報である。

図３に示す例では、例えば、音声の大きさに関する評価結果が「音声が小さい」であり、かつ、音声の明瞭度に関する評価結果が「ノイズあり」である場合に提示する内容が、「周辺が騒がしい可能性があります。場所を移動することをお勧めします。」であることが登録されている。

次に、図４及び図５を参照して、本実施形態に係る情報処理システム９０における、ネット会合に参加している最中に発話者に対して音声に関する評価を行う場合の評価方法について説明する。図４は、本実施形態に係るネット会合表示画面の一例を示す正面図である。また、図５は、本実施形態に係るネット会合表示画面の他の一例を示す正面図である。

本実施形態に係る情報処理システム９０では、ネット会合を実施する場合に、当該ネット会合の参加者が所有する端末装置３０において、ＣＰＵ３１によりネット会合参加プログラム３３Ａを実行する。このネット会合参加プログラム３３Ａの実行により、各参加者が所有する端末装置３０の表示部３５には、一例として図４に示すネット会合表示画面が表示される。

図４に示すように、本実施形態に係るネット会合表示画面では、端末装置３０の撮影部３８によって撮影されている各参加者の撮影画像５０Ａ～５０Ｈがリアルタイムで表示される。また、このネット会合表示画面では、各撮影画像の表示領域内に、当該表示領域に表示されている参加者に対して、音声に関する評価を行う場合に指定される評価ボタン５２Ａ～５２Ｈが表示される。

そこで、ネット会合の参加者（受話者）は、他の参加者（発話者）が発している音声の品質に関して評価を行う場合は、当該発話者が表示されている領域の評価ボタンを、入力部３４を介して指定する。

この指定に応じて、ネット会合表示画面では、一例として図５に示すように、「音声の大きさ」、「ノイズ」、「音声の途切れ」、及び「音声のこもり」の４種類の項目が、評価結果の選択肢も含めた選択画面５４として、指定した評価ボタンに対して表示される。例えば、「音声の大きさ」に関する評価結果の選択肢としては、「問題なし」、「全く聞こえない」、「小さい」、及び「大きい」の４種類が表示される。また、例えば、「ノイズ」に関する評価結果の選択肢としては、「なし」及び「あり」の２種類が表示される。但し、この形態に限るものではなく、例えば、図５における「問題なし」及び「なし」を除くことで、問題がある場合のみの評価結果を指定させる形態としてもよい。

そこで、受話者は、表示された各項目から、自身が感じた評価結果に対応する選択肢を、入力部３４を介して指定する。この選択肢の指定に応じて、受話者が使用している端末装置３０から情報処理装置１０へ、指定された選択肢を示す情報が、無線通信部４２を介して送信される。

次に、図６～図８を参照して、本実施形態に係る情報処理システム９０の作用として、情報処理装置１０の作用を説明する。図６は、本実施形態に係る情報処理の一例を示すフローチャートである。また、図７は、本実施形態に係る音量調整処理の一例を示すフローチャートである。更に、図８は、本実施形態に係る組み合わせ評価処理の一例を示すフローチャートである。なお、錯綜を回避するために、ここでは、ネット会合の実施中における音声の評価に関する処理のみについて説明し、ネット会合そのものに関する処理についての説明は省略する。また、錯綜を回避するために、ここでは、音声の明瞭度に関する評価項目として「ノイズ」及び「音声のこもり」の２種類を適用する場合について説明する。更に、錯綜を回避するために、ここでは、組み合わせ通知情報データベース１３Ｂが構築済みである場合について説明する。

本実施形態に係る情報処理装置１０は、情報処理システム９０が管理しているネット会合のうちの何れかのネット会合（以下、「対象会合」という。）が開始されるタイミングでＣＰＵ１１が情報処理プログラム１３Ａを実行することで、図６に示す情報処理が実行される。

図６のステップ１００で、ＣＰＵ１１は、対象会合に参加している何れかの参加者からネット会合表示画面における何れかの評価ボタン５２が指定され、当該指定に応じて表示された選択画面５４において何れかの評価結果が指定されるまで待機する。

ステップ１０２で、ＣＰＵ１１は、指定された評価結果を示す情報（以下、「評価結果情報」という。）を記憶部１３に記憶する。ステップ１０４で、ＣＰＵ１１は、対象会合において評価結果情報が複数回得られたか否かを判定し、否定判定となった場合はステップ１２８に移行する一方、肯定判定となった場合はステップ１０６に移行する。

ステップ１０６で、ＣＰＵ１１は、それまでに記憶部１３に記憶した評価結果情報を読み出し、当該評価結果情報を用いて、この時点から遡って予め定められた期間（本実施形態では、３０秒間）の評価結果（以下、「対象評価結果」という。）に問題があるか否かを判定する。そして、この判定の結果、否定判定となった場合はステップ１２８に移行する一方、肯定判定となった場合はステップ１０８に移行する。

なお、本実施形態に係る情報処理では、対象評価結果に問題があるか否かの判定を、対象評価結果に含まれる評価結果に１以上の否定的な評価結果が含まれるか否かを判定することにより行っている。ここで否定的な評価結果とは、音声の大きさについては、「問題なし」以外の評価結果であり、音声の明瞭度については、「あり」の評価結果である。

このように、本実施形態では、対象評価結果に問題があるか否かの判定を、対象評価結果に含まれる評価結果に１以上の否定的な評価結果が含まれるか否かを判定することで行う形態としているが、これに限るものではない。例えば、対象評価結果に含まれる評価結果に複数の否定的な評価結果が含まれるか否かを判定することにより、対象評価結果に問題があるか否かの判定を行う形態としてもよい。

ステップ１０８で、ＣＰＵ１１は、対象評価結果における否定的な評価結果の評価対象が、音声の大きさ及び音声の明瞭度の何れか一方のみであるか否かを判定し、肯定判定となった場合はステップ１１０に移行する。

ステップ１１０で、ＣＰＵ１１は、対象評価結果における否定的な評価結果の評価対象に音声の大きさが含まれるか否かを判定し、否定判定となった場合はステップ１１４に移行する一方、肯定判定となった場合はステップ１１２に移行する。

ステップ１１２で、ＣＰＵ１１は、一例として図７に示す音量調整処理を実行する。

音量調整処理のステップ１５０で、ＣＰＵ１１は、対象評価結果における、音声の大きさに関する否定的な評価結果が、共通の発話者に対する、予め定められた人数以上の受話者の同一の評価結果であるか否かを判定し、肯定判定となった場合はステップ１５２に移行する。以下では、この処理において肯定判定の対象となった発話者を「音量調整対象発話者」という。なお、本実施形態では、上記予め定められた人数として、対象会合の参加者の人数に対する予め定められた割合（本実施形態では、２分の１）の人数を適用しているが、これに限るものではない。例えば、対象会合の参加者の人数から発話者を除く人数、即ち、発話者を除いた全ての参加者の人数を上記予め定められた人数として適用する形態としてもよい。

ステップ１５２で、ＣＰＵ１１は、音量調整対象発話者が用いている端末装置３０のマイク３９（以下、「対象マイク」という。）の感度が調整可能か否かを判定し、肯定判定となった場合はステップ１５４に移行する。本実施形態では、否定的な評価結果が、音声が「全く聞こえない」、又は「小さい」との評価結果だった場合は、対象マイクの感度が調整可能レンジの最大値となっている場合に調整ができないと判定する。また、本実施形態では、否定的な評価結果が、音声が「大きい」との評価結果だった場合は、対象マイクの感度が調整可能レンジの最小値となっている場合に調整ができないと判定する。

ステップ１５４で、ＣＰＵ１１は、対象マイクの感度を調整し、その後に本音量調整処理を終了する。本実施形態では、否定的な評価結果が、音声が「全く聞こえない」、又は「小さい」との評価結果だった場合は、対象マイクの感度を、上記最大値を上限として、予め定められた度合だけ増加させる。また、本実施形態では、否定的な評価結果が、音声が「大きい」との評価結果だった場合は、対象マイクの感度を、上記最小値を下限として、予め定められた度合だけ低下させる。なお、本実施形態では、上記予め定められた度合として、上記調整可能レンジの１０分の１の度合を適用しているが、この形態に限るものでないことは言うまでもない。

一方、ステップ１５２において否定判定となった場合はステップ１５６に移行し、ＣＰＵ１１は、音量調整対象発話者が用いている端末装置３０に対して、予め定められた通知情報を送信し、その後に本音量調整処理を終了する。この通知情報の送信により、音量調整対象発話者の端末装置３０の表示部３５には、当該通知情報の内容が表示される。なお、本実施形態では、上記通知情報として、音声が大きいとの評価結果である場合は、発声の音量を小さくする旨を指示する情報を適用し、音声が小さいか、又は音声が全く聞こえないとの評価結果である場合は、発声の音量を大きくする旨を指示する情報を適用する。

一方、ステップ１５０において否定判定となった場合は、対象評価結果における、否定的な評価結果が、共通の発話者に対する、上記予め定められた人数未満の受話者（以下、「音量調整対象受話者」という。）の同一の評価結果であったと見なしてステップ１５８に移行する。

ステップ１５８で、ＣＰＵ１１は、音量調整対象受話者が用いている端末装置３０のスピーカ４０（以下、「対象スピーカ」という。）による再生音量を調整し、その後に本音量調整処理を終了する。本実施形態では、否定的な評価結果が、音声が「全く聞こえない」、又は「小さい」との評価結果だった場合は、対象スピーカの再生音量を、最大音量を上限として、予め定められた量だけ増加させる。また、本実施形態では、否定的な評価結果が、音声が「大きい」との評価結果だった場合は、対象スピーカの再生音量を、最低音量を下限として、予め定められた量だけ低下させる。なお、本実施形態では、上記予め定められた量として、対象スピーカの調整可能レンジの１０分の１の量を適用しているが、この形態に限るものでないことは言うまでもない。
また、本実施形態における再生音量の調整は、音量調整対象受話者の対象スピーカから出力される全ての音に対して適用されるものとしているが、これに限るものではない。音量調整対象受話者が否定的な評価を行った発話者から発せられる音声を音量調整対象受話者が用いる端末装置３０が特定し、否定的な評価を行った発話者から発せられる音声の再生音量のみを調整する形態としてもよい。

音量調整処理が終了すると、図６に示す情報処理のステップ１１４に移行する。

ステップ１１４で、ＣＰＵ１１は、対象評価結果における否定的な評価結果の評価対象に音声のこもりが含まれるか否かを判定する。この判定において否定判定となった場合はステップ１１８に移行する一方、肯定判定となった場合はステップ１１６に移行する。以下では、この処理において否定的な評価結果の対象となった発話者を「音声こもり調整対象発話者」という。

ステップ１１６で、ＣＰＵ１１は、音声こもり調整対象発話者が用いている端末装置３０に対して、予め定められた通知情報を送信し、その後にステップ１１８に移行する。この通知情報の送信により、音声こもり調整対象発話者の端末装置３０の表示部３５には、当該通知情報の内容が表示される。なお、本実施形態では、上記通知情報として、受話者側では音声がこもって聞こえているため、より明瞭に話すことを指示する旨を示す情報を適用している。

ステップ１１８で、ＣＰＵ１１は、対象評価結果における否定的な評価結果の評価対象にノイズが含まれるか否かを判定する。この判定において否定判定となった場合はステップ１２８に移行する一方、肯定判定となった場合はステップ１２０に移行する。

ステップ１２０で、ＣＰＵ１１は、対象評価結果における、ノイズに関する否定的な評価結果が、共通の発話者に対する、上述した予め定められた人数以上の受話者の同一の評価結果であるか否かを判定し、肯定判定となった場合はステップ１２２に移行する。以下では、この処理において否定的な評価結果の対象となった発話者を「ノイズ調整対象発話者」という。

ステップ１２２で、ＣＰＵ１１は、ノイズ調整対象発話者が用いている端末装置３０に対して、予め定められた通知情報を送信し、その後にステップ１２８に移行する。この通知情報の送信により、ノイズ調整対象発話者の端末装置３０の表示部３５には、当該通知情報の内容が表示される。なお、本実施形態では、上記通知情報として、受話者側では音声にノイズが含まれているため、ノイズの原因を解消するか、又は、より大きな声で話すことを指示する旨を示す情報を適用している。

一方、ステップ１２０において否定判定となった場合は、対象評価結果における、ノイズに関する否定的な評価結果が、共通の発話者に対する、上述した予め定められた人数未満の受話者（以下、「ノイズ調整対象受話者」という。）の同一の評価結果であったと見なしてステップ１２４に移行する。

ステップ１２４で、ＣＰＵ１１は、ノイズ調整対象受話者が用いている端末装置３０に対し、ノイズフィルタ４１によりスピーカ４０から再生される音声におけるノイズをカットするように制御し、その後にステップ１２８に移行する。

一方、ステップ１０８において否定判定となった場合、対象評価結果における否定的な評価結果の評価対象が音声の大きさ及び音声の明瞭度の双方であったと見なしてステップ１２６に移行し、ＣＰＵ１１は、一例として図８に示す組み合わせ評価処理を実行する。

組み合わせ評価処理のステップ１８０で、ＣＰＵ１１は、音声の大きさ及び音声の明瞭度の双方の否定的な評価結果の組み合わせの対象となる発話者（以下、「組み合わせ対応発話者」という。）が存在するか否かを判定する。そして、この判定において、否定判定となった場合は本組み合わせ評価処理を終了する一方、肯定判定となった場合はステップ１８２に移行する。

ステップ１８２で、ＣＰＵ１１は、対象評価結果における、音声の大きさ及び音声の明瞭度の双方の否定的な評価結果の組み合わせに対応する通知内容を組み合わせ通知情報データベース１３Ｂから読み出す。ステップ１８４で、ＣＰＵ１１は、読み出した通知内容を示す情報を、組み合わせ対応発話者が用いる端末装置３０に送信し、その後に本組み合わせ評価処理を終了する。この通知内容を示す情報の送信により、組み合わせ対応発話者が用いる端末装置３０には、当該通知内容が表示される。例えば、組み合わせ通知情報データベース１３Ｂが図３に示すもので、音声の大きさに関する評価結果が「音声が小さい」で、かつ、音声の明瞭度に関する評価結果が「ノイズあり」である場合、組み合わせ対応発話者が用いる端末装置３０の表示部３５には、「周辺が騒がしい可能性があります。場所を移動することをお勧めします。」との表示が行われる。

組み合わせ評価処理が終了すると、図６に示す情報処理のステップ１２８に移行する。

ステップ１２８で、ＣＰＵ１１は、対象会合が終了したか否かを判定し、否定判定となった場合はステップ１００に戻る一方、肯定判定となった場合は本情報処理を終了する。なお、本実施形態では、対象会合が終了したか否かの判定を、この時点が、対象会合に対応する終了日時を示す時刻となったか否かを判定することにより行っているが、この形態に限るものではない。例えば、対象会合の参加者の各々の端末装置３０において実行されているネット会合参加プログラム３３Ａが全て終了されたか否かを判定することにより、対象会合が終了したか否かを判定する形態としてもよい。

なお、上記実施形態では、情報処理において対象とした音声の明瞭度に関する項目が「ノイズ」及び「音声のこもり」である場合について説明したが、これに限るものではない。例えば、情報処理が対象とする音声の明瞭度の項目として、「音声の途切れ」を含める形態としてもよい。更に、これらの「ノイズ」、「音声のこもり」、及び「音声の途切れ」の何れか１つ、及び２つの組み合わせを、情報処理が対象とする音声の明瞭度の項目として適用する形態としてもよい。

また、上記実施形態で適用した組み合わせ通知情報データベース１３Ｂは図３に示したものに限るものではなく、発生している音声の品質上の問題を解決するために適用することのできる内容であれば、他の通知内容としてもよいことは言うまでもない。

また、上記実施形態では言及しなかったが、音声の品質上の問題を解決するために、マイク３９等に対する調整や、ノイズフィルタ４１によるノイズの除去を行った後にも評価が変わらない場合には、発話者に対して実施形態と同様の通知を行うようにしてもよい。この場合、例えば、ノイズに関する評価が変わらない場合は、ノイズの種類を特定し、特定したノイズの種類に応じた原因（周辺の機器による騒音、周囲の人の発声等）を列挙して発話者に通知する形態としてもよい。

以上、実施形態を説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。発明の要旨を逸脱しない範囲で上記実施形態に多様な変更又は改良を加えることができ、該変更又は改良を加えた形態も本発明の技術的範囲に含まれる。

また、上記実施形態は、クレーム（請求項）にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。前述した実施形態には種々の段階の発明が含まれており、開示される複数の構成要件の組み合わせにより種々の発明が抽出される。実施の形態に示される全構成要件から幾つかの構成要件が削除されても、効果が得られる限りにおいて、この幾つかの構成要件が削除された構成が発明として抽出され得る。

また、上記実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ（例えば、ＣＰＵ等）や、専用のプロセッサ（例えば、ＧＰＵ： Graphics Processing Unit、ＡＳＩＣ： Application Specific Integrated Circuit、ＦＰＧＡ： Field Programmable Gate Array、プログラマブル論理デバイス、等）を含むものである。

更に、上記実施形態では、情報処理を、プログラムを実行することにより、コンピュータを利用してソフトウェア構成により実現する場合について説明したが、本発明はこれに限定されるものではない。例えば、情報処理を、ハードウェア構成や、ハードウェア構成とソフトウェア構成の組み合わせによって実現する形態としてもよい。

その他、上記実施形態で説明した情報処理装置１０の構成は一例であり、本発明の主旨を逸脱しない範囲内において不要な部分を削除したり、新たな部分を追加したりしてもよいことは言うまでもない。

また、上記実施形態で説明した情報処理の流れも一例であり、本発明の主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよいことは言うまでもない。

１０情報処理装置
１１ＣＰＵ
１１Ａ取得部
１１Ｂ提示部
１１Ｃ制御部
１２メモリ
１３記憶部
１３Ａ情報処理プログラム
１３Ｂ組み合わせ通知情報データベース
１４入力部
１５表示部
１６媒体読み書き装置
１７記録媒体
１８通信Ｉ／Ｆ部
３０端末装置
３１ＣＰＵ
３１Ａ制御部
３２メモリ
３３記憶部
３３Ａネット会合参加プログラム
３４入力部
３５表示部
３６媒体読み書き装置
３７記録媒体
３８撮影部
３９マイク
４０スピーカ
４１ノイズフィルタ
４２無線通信部
８０ネットワーク
９０情報処理システム

Claims

プロセッサを備え、
前記プロセッサは、
受話者側における発話者による音声の品質を示す品質情報を即時的に取得し、
取得した品質情報が示す品質が予め定められた条件を満足しない場合、当該品質を改善するための改善情報を当該発話者に即時的に提示する、
情報処理装置。
前記プロセッサは、
前記品質情報を、前記受話者による評価結果から取得する、
請求項１に記載の情報処理装置。
前記プロセッサは、
前記品質情報を、複数の前記受話者による評価結果から取得する、
請求項２に記載の情報処理装置。
前記プロセッサは、
複数の前記評価結果に応じて、前記改善情報の提示内容を決定する、
請求項３に記載の情報処理装置。
前記評価は、前記発話者による発話中における表示画面を用いて行われる、
請求項２～請求項４の何れか１項に記載の情報処理装置。
前記プロセッサは、
前記品質が前記予め定められた条件を満足しない場合、当該品質を改善するための制御を更に行う、
請求項１～請求項５の何れか１項に記載の情報処理装置。
前記プロセッサは、
前記品質を改善するための制御を、発話者が用いる端末装置と、受話者が用いる端末装置と、の少なくとも一方に対して行う、
請求項６に記載の情報処理装置。
前記プロセッサは、
前記受話者が複数存在する場合で、かつ、当該複数の受話者における、予め定められた数以上の受話者について、前記品質が前記条件を満足しない場合、前記発話者が用いる端末装置に対して前記制御を行う、
請求項７に記載の情報処理装置。
前記プロセッサは、
前記受話者が複数存在する場合で、かつ、当該複数の受話者における、予め定められた数未満の受話者について、前記品質が前記条件を満足しない場合、前記受話者が用いる端末装置に対して前記制御を行う、
請求項７に記載の情報処理装置。
前記音声の品質は、前記音声の大きさ及び前記音声の明瞭度の少なくとも一方の品質である、
請求項１～請求項９の何れか１項に記載の情報処理装置。
受話者側における発話者による音声の品質を示す品質情報を即時的に取得し、
取得した品質情報が示す品質が予め定められた条件を満足しない場合、当該品質を改善するための改善情報を当該発話者に即時的に提示する、
処理をコンピュータに実行させるための情報処理プログラム。