JP6168451B2

JP6168451B2 - 音量調整装置、音量調整方法及び音量調整システム

Info

Publication number: JP6168451B2
Application number: JP2013145491A
Authority: JP
Inventors: 亮太藤井
Original assignee: Panasonic Intellectual Property Management Co Ltd
Current assignee: Panasonic Intellectual Property Management Co Ltd
Priority date: 2013-07-11
Filing date: 2013-07-11
Publication date: 2017-07-26
Anticipated expiration: 2033-07-11
Also published as: JP2015019262A

Description

本発明は、入力した音声信号の音量レベルを調整する音量調整装置、音量調整方法及び音量調整システムに関する。

従来から、例えば店舗駐車場に設置されたオーダーポスト端末と店舗内の店員が用いるヘッドセットとの間で、オーダーポスト端末に近づいた来店客と店員との間の無線通話によって商品の注文が行われる注文システムが知られている。このような注文システムでは、来店客と店員との両方にとって音声の聞き取り易さは重要な要素であるが、例えば店舗駐車場内の自動車のアイドリング音、オーダーポスト端末の周囲の騒音によって、来店客と店員との会話が妨げられることがある。

このような騒音への対策として、例えばノイズリダクション処理や、オーダーポスト端末のスピーカから出力される音声の音量自動調整処理が知られている。音量自動調整処理とは、例えばオーダーポスト端末のマイクが収音した騒音レベルに応じて、オーダーポスト端末のスピーカから出力される音声の音量レベルが自動的に調整される機能である。これにより、来店客は、店員が話した内容を明瞭に聴きとることができる。

ここで、マイクが収音した騒音レベルに応じて、スピーカから出力される音声の音量レベルを調整する先行技術として、例えば特許文献１に示す拡声通話装置が知られている。拡声通話装置は、例えば集合住宅の共用玄関に設置されるインターホン子機として用いられ、集合住宅の各住戸に設置されているインターホン親機との間で双方向の拡声通話（ハンズフリー通話）を行う。

具体的には、特許文献１に示す拡声通話装置は、マイク及びスピーカを有し、マイクが収音した送話信号に含まれる近端側の周囲騒音レベルを推定し、スピーカへ入力する受話信号レベルを増減することでスピーカが鳴動する音声の音量レベルを補正する。また、拡声通話装置は、補正前の受話信号が音声成分を含む音声区間を検出し、音声区間の検出期間中に推定された周囲騒音レベルに応じて、音量レベルの補正量を調整する。これにより、拡声通話装置は、周囲騒音レベルに応じて、適切な音量で拡声通話を行わせることができる。

特許第４６５０１６３号公報

しかし、屋外に設置されたオーダーポスト端末のマイクが収音する騒音の騒音源は様々であり（図８参照）、特許文献１を含む従来技術のように、騒音レベルを基にした拡声通話の音量レベルの調整では、音声のマスキング効果によって音声の聞き取り易さが十分に得られない場合があるという課題があった。この課題について、図８を参照して説明する。図８は、ノイズレベルの測定結果の波形の一例を示すグラフである。図８では、点線は人混みの騒音（ノイズ）レベルの測定結果の波形を示し、実線は道路付近の騒音（ノイズ）レベルの測定結果の波形を示す。

騒音（ノイズ）の音源としては、例えば自動車が走行する音、人混みの音、雨音、風音などが考えられる。図８では、説明を分かり易くするために、音量レベルの変動特性が異なる道路付近の音（環境音）と人混みの騒音とが示されている。図８に示すように、道路付近の音と人混みの騒音とは、音量レベルはともに０．６付近でほぼ同じであるが、音量レベルの変動特性が異なるので、実際には人混みの騒音が大きく聞こえる。また、ある一定の音量レベルでスピーカから人の音声が出力されると、サウンドマスキングの効果によって人混みの騒音の中ではスピーカからの人の音声が聞きとれないことがある。

このように、騒音（ノイズ）の種類によって音量レベルの変動特性が異なるので、同じ音量レベルでスピーカから出力されても、通話相手に聞こえる場合と聞こえない場合とがあり、騒音レベルを基にした音量レベルの調整では、相手に対する音声の聞き取り易さが十分に得られない場合がある。

本発明は、上述した従来の課題を解決するために、様々な騒音環境下においても、騒音の種類に応じて、スピーカから拡声される音声の音量レベルを適応的に調整する音量調整装置、音量調整方法及び音量調整システムを提供することを目的とする。

本発明は、ネットワークを介して接続された相手端末と通信する音量調整装置であって、前記音量調整装置の周囲音を収音する収音部と、前記収音部により収音された前記音量調整装置の周囲音に含まれるノイズ信号の信号レベルを推定するノイズ推定部と、前記収音部により収音された前記音量調整装置の周囲音に含まれる音声信号と前記ノイズ推定部により推定された前記ノイズ信号との偏差を推定する偏差推定部と、前記偏差推定部により推定された前記偏差を基に、前記音声信号の音量レベルを調整する音量調整係数を導出する音量調整係数導出部と、前記音量調整係数導出部により導出された前記音量調整係数に応じて、前記音声信号の音量レベルを増幅する音量レベル増幅部と、を備える音量調整装置である。

また、本発明は、周囲音を収音する収音部と、前記収音部により収音された前記音量調整装置の周囲音に含まれるノイズ信号を推定するノイズ推定部と、所定の出力音声信号と前記ノイズ推定部により推定された前記ノイズ信号との偏差を推定する偏差推定部と、前記偏差推定部により推定された前記偏差を基に、前記出力音声信号の音量レベルを調整する音量調整係数を導出する音量調整係数導出部と、前記音量調整係数導出部により導出された前記音量調整係数に応じて、前記出力音声信号の音量レベルを増幅する音量レベル増幅部と、前記音量レベル増幅部により増幅された前記出力音声信号を出力する音声出力部と、を備える音量調整装置である。

また、本発明は、ネットワークを介して接続された相手端末と通信する音量調整装置における音量調整方法であって、前記音量調整装置の周囲音を収音するステップと、収音された前記音量調整装置の周囲音に含まれるノイズ信号の信号レベルを推定するステップと、収音された前記音量調整装置の周囲音に含まれる音声信号と推定された前記ノイズ信号との偏差を推定するステップと、推定された前記偏差を基に、前記音声信号の音量レベルを調整する音量調整係数を導出するステップと、導出された前記音量調整係数に応じて、前記音声信号の音量レベルを増幅するステップと、を有する音量調整方法である。

更に、本発明は、ネットワークを介して接続された相手端末と、前記相手端末と通信する音量調整装置とを含む音量調整システムであって、前記音量調整装置は、前記音量調整装置の周囲音を収音する収音部と、前記収音部により収音された前記音量調整装置の周囲音に含まれるノイズ信号の信号レベルを推定するノイズ推定部と、前記収音部により収音された前記音量調整装置の周囲音に含まれる音声信号と前記ノイズ推定部により推定された前記ノイズ信号との偏差を推定する偏差推定部と、前記偏差推定部により推定された前記偏差を基に、前記音声信号の音量レベルを調整する音量調整係数を導出する音量調整係数導出部と、前記音量調整係数導出部により導出された前記音量調整係数に応じて、前記音声信号の音量レベルを増幅する音量レベル増幅部と、前記音量レベル増幅部により増幅された前記音声信号を前記相手端末に送信する無線通信部と、を備え、前記相手端末は、前記音量調整装置から送信された、前記音量レベル増幅部により増幅された前記音声信号を出力する音声出力部と、を備える音量調整システムである。

本発明によれば、様々な騒音環境下においても、騒音の種類に応じて、スピーカから拡声される音声の音量レベルを適応的に調整することができる。

本実施形態の音量調整システムのシステム構成を示すブロック図本実施形態の音量調整装置の一例としてのオーダーポスト端末の音量調整部の内部構成を詳細に示すブロック図（Ａ）定常状態におけるノイズレベルに対応する推定ノイズベースの波形の一例を示すグラフ、（Ｂ）人混み状態におけるノイズレベルに対応する推定ノイズベースの波形の一例を示すグラフ（Ａ）推定されたノイズベースと、入力信号と推定されたノイズベースとの偏差との一例を示すグラフ、（Ｂ）音量調整事前係数ｇ_ｐｒｅ（ｔ）と音量調整係数ｇ（ｔ）との関係の一例を示すグラフ（Ａ）定常状態において本実施形態により得られた音量調整係数ｇ（ｔ）と従来技術により得られた音量調整係数との比較図、（Ｂ）人混み状態において本実施形態により得られた音量調整係数ｇ（ｔ）と従来技術により得られた音量調整係数との比較図本実施形態の音量調整装置の一例としてのオーダーポスト端末の音量調整部における動作手順を説明するフローチャート音量調整装置の他の一例としてのオーディオプレイヤー端末の内部構成を詳細に示すブロック図ノイズレベルの測定結果の波形の一例を示すグラフ

以下、本発明に係る音量調整装置、音量調整方法及び音量調整システムの実施形態（以下、「本実施形態」という）について、図面を参照して説明する。

本実施形態では、本発明に係る音量調整システムの使用形態の一例として、例えば店舗駐車場、即ち屋外に設置された音量調整装置の一例としてのオーダーポスト端末と、店内にいる店員が用いる相手端末の一例としてのヘッドセットとを用いた商品（例えば飲食物）の注文システム（例えばドライブスルーサービス）のシチュエーションを説明する。但し、本発明に係る音量調整システムの使用形態は、ドライブスルーサービスのシチュエーションに限定されない。

なお、本発明は、音量調整装置が行う各動作（ステップ）を有する音量調整方法として表現することも可能である。更に、本発明は、コンピュータとしての音量調整装置が行う各動作（ステップ）を、音量調整装置に内蔵されるプロセッサ（例えばＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、ＤＳＰ（Digital Signal Processor））に実行させるためのプログラムとして表現しても良い。

（本実施形態の音量調整システムの各部の説明）
図１は、本実施形態の音量調整システム１００のシステム構成を示すブロック図である。図１に示す音量調整システム１００は、例えば店舗駐車場、即ち屋外に設置されたオーダーポスト端末１０と、店内にいる店員が用いるヘッドセット５０とを含む構成である。オーダーポスト端末１０と、ヘッドセット５０とは、ネットワークＮＷを介して接続され、相互に通信可能である。ネットワークＮＷは、有線ネットワークでも無線ネットワークでも良い。

本実施形態では、例えば商品の注文のために来店した来店客がオーダーポスト端末１０の周囲に近づき、口頭にて商品（例えば飲食物）を注文する場合に、オーダーポスト端末１０は、オーダーポスト端末１０の周囲音（例えば来店客注文音ＨＶ、周囲のノイズ音ＮＳ）を収音する。オーダーポスト端末１０は、収音された周囲音に含まれるノイズ信号（以下、「ノイズベース」という）の信号レベルを推定し、ノイズの種類によってノイズベースの信号波形が異なることを考慮して、周囲音に含まれる音声信号（例えば来店客注文音ＨＶ）と推定されたノイズベースとの間の偏差を推定する。

更に、オーダーポスト端末１０は、推定された偏差を基に、周囲音に含まれる音声信号の音量レベルを調整するための音量調整係数を算出し、算出された音量調整係数を用いて音声信号の音量レベルを増幅してヘッドセット５０に送信する。これにより、音量調整システム１００では、オーダーポスト端末１０は、オーダーポスト端末１０の周辺環境のノイズの種類に応じて、来店客が注文したときの来店客注文音ＨＶの音量レベルを増幅できるので、ヘッドセット５０を用いる店員にとって来店客注文音ＨＶの聞き取り易さを向上できる。

次に、本実施形態の音量調整システム１００の各部の構成及び動作について、図１及び図２を参照して説明する。図２は、本実施形態の音量調整装置の一例としてのオーダーポスト端末１０の音量調整部１５の内部構成を詳細に示すブロック図である。オーダーポスト端末１０は、マイク１１と、ＡＤ変換部１３と、音量調整部１５と、エコーキャンセル処理部１７と、ノイズリダクション処理部１９と、エンコーダ２１と、無線通信部２３と、デコーダ２５と、ＤＡ変換部２７と、スピーカ２９とを含む。ヘッドセット５０は、ヘッドセット動作処理部５１と、マイク５３と、スピーカ５５とを含む。

収音部の一例としてのマイク１１は、オーダーポスト端末１０の周囲音（例えば来店客注文音ＨＶ、ノイズ音ＮＳ）を収音する。収音された周囲音は、マイク１１によって電気信号（周囲音信号）に変換されてＡＤ変換部１３に入力される。

ＡＤ変換部１３は、所定のサンプリング周波数（例えば８ｋＨｚ）で、マイク１１により収音されたアナログの周囲音信号をデジタルの周囲音信号にＡＤ変換し、デジタルの周囲音信号のサンプル値を音量調整部１５及びエコーキャンセル処理部１７に出力する。

音量調整部１５は、ＡＤ変換部１３から出力された周囲音信号（のサンプル値）を用いて、周囲音信号に含まれる音声信号（例えば来店客注文音ＨＶの音声信号）の音量レベルを調整する。音量調整部１５の詳細な動作については、図２を参照して後述する。

エコーキャンセル処理部１７は、例えばプロセッサ（例えばＣＰＵ、ＭＰＵ又はＤＳＰ）を用いて構成され、ＡＤ変換部１３から出力された周囲音信号（のサンプル値）又は音量調整部１５から出力された周囲音信号（のサンプル値）を用いて、エコー成分、即ちスピーカ２９から出力された音声がマイク１１により回り込んで収音された音声信号の成分をキャンセルする。エコーキャンセル処理部１７の動作内容は公知技術であるので、詳細な説明は割愛する。エコーキャンセル処理部１７は、エコー成分がキャンセルされた周囲音信号をノイズリダクション処理部１９に出力する。

ノイズリダクション処理部１９は、例えばプロセッサ（例えばＣＰＵ、ＭＰＵ又はＤＳＰ）を用いて構成され、エコーキャンセル処理部１７から出力された周囲音信号に含まれるノイズ成分を抑圧する。ノイズリダクション処理部１９の動作内容は公知技術であるので、詳細な説明は割愛する。ノイズリダクション処理部１９は、ノイズ成分が抑圧された周囲音信号、即ち音声信号をエンコーダ２１に出力する。

エンコーダ２１は、例えばプロセッサ（例えばＣＰＵ、ＭＰＵ又はＤＳＰ）を用いて構成され、ノイズリダクション処理部１９から出力された音声信号を符号化処理し、符号化処理後の音声信号を無線通信部２３に出力する。なお、エンコーダ２１における符号化処理の方式及びその内容は、オーダーポスト端末１０及びヘッドセット５０において既知である。

無線通信部２３は、エンコーダ２１から出力された符号化処理後の音声信号を例えば無線通信用の所定周波数帯の信号に変換してヘッドセット５０に送信する。また、無線通信部２３は、ヘッドセット５０から送信された所定周波数帯の信号を受信し、受信された所定周波数帯の信号を検波及び復調して音声信号をデコーダ２５に出力する。

デコーダ２５は、無線通信部２３から出力された音声信号を復号処理し、復号処理後の音声信号を音量調整部１５に出力する。なお、デコーダ２５における復号処理の方式及びその内容は、オーダーポスト端末１０及びヘッドセット５０において既知である。

ＤＡ変換部２７は、音量調整部１５から出力されたデジタルの音声信号をアナログの音声信号にＤＡ変換し、アナログの音声信号をスピーカ２９に出力する。

音声出力部の一例としてのスピーカ２９は、ＤＡ変換部２７から出力された音声信号が入力され、例えばヘッドセット５０を用いる店員が話した音声を出力する。

ヘッドセット動作処理部５１は、ヘッドセット５０の動作（例えば音声信号処理、無線通信、音声出力）を統括して制御する。

マイク５３は、ヘッドセット５０を用いる店員が話した音声を収音する。収音された音声は、マイク５３によって電気信号（周囲音信号）に変換されてヘッドセット動作処理部５１に入力される。

スピーカ５５は、オーダーポスト端末１０から送信された来店客の音声信号、即ち来店客注文音ＨＶを出力する。

ここで、図２を参照して、音量調整部１５の内部構成を詳細に説明する。図２に示す音量調整部１５は、ＦＦＴ（Fast Fourier Transform）処理部３１と、ノイズ区間検出部３３と、ノイズベース推定部３５と、偏差推定部３７と、音量調整係数算出部３９と、ＶＧＡ（Variable Gain Amplifier）４１とを含む。音量調整部１５の各部は、ＶＧＡ４１以外は、例えばプロセッサ（ＣＰＵ、ＭＰＵ、又はＤＳＰ）を用いて構成される。

ＦＦＴ処理部３１は、ＡＤ変換部１３又はデコーダ２５から出力された周囲音信号（周囲音の時間軸信号）又は音声信号（音声の時間軸信号）に対して所定ポイント数によるフーリエ変換（例えば高速フーリエ変換又は離散フーリエ変換）を行い、周囲音信号（周囲音の周波数軸信号）又は音声信号（音声の周波数軸信号）を得る。以下、図２に示す音量調整部１５の説明を分かり易くするために、「ＡＤ変換部１３又はデコーダ２５から出力された周囲音信号（周囲音の時間軸信号）又は音声信号（音声の時間軸信号）」を、単に「入力信号」という。ＦＦＴ処理部３１は、フーリエ変換処理後の周囲音信号（周囲音の周波数軸信号）又は音声信号（音声の周波数軸信号）をノイズベース推定部３５及び偏差推定部３７に出力する。

なお、所定ポイント数は、例えば音量調整部１５における調整対象の音声の周波数範囲が０〜３２［ｋＨｚ］である場合には、１［ｋＨｚ］毎の３２である。又は、所定ポイント数は、例えば音量調整部１５における調整対象の音声の周波数範囲が５〜１０［ｋＨｚ］である場合には、０．３１２５［ｋＨｚ］毎の１６である。但し、所定ポイント数は、上述した一例に限らず、周波数間隔に応じて適宜定められても良い。

ノイズ区間判定部の一例としてのノイズ区間検出部３３は、入力信号の信号レベル（入力信号レベル）が所定の判定周期間にわたって所定閾値未満であるか否かを、所定の判定周期毎に判定する。つまり、ノイズ区間検出部３３は、所定の判定周期毎に、所定の判定周期間の入力信号レベルが所定閾値未満であるか、即ち入力信号としてノイズ信号、又はノイズ信号及び音声信号（例えば来店客注文音ＨＶ）が含まれた信号を検出する。

ノイズ区間検出部３３は、所定の判定周期間の入力信号レベルが所定閾値未満であると判定した場合に、入力信号としてノイズ信号を検出し、所定の判定周期間の入力信号レベルが所定閾値以上であると判定した場合に、入力信号としてノイズ信号及び音声信号が含まれた信号を検出する。ノイズ区間検出部３３は、入力信号としてノイズ信号を検出した場合に、検出結果（判定結果）としてのノイズフラグ（noise flag）「１」をノイズベース推定部３５に出力し、入力信号としてノイズ信号及び音声信号が含まれた信号を検出した場合に、検出結果（判定結果）としてのノイズフラグ「０」をノイズベース推定部３５に出力する。

具体的には、ノイズ区間検出部３３は、数式（１）に従って入力信号ｘ（ｔ）の長時間平均ｘ＿ｌ（ｔ）を算出し、更に、数式（２）に従って入力信号の短時間平均ｘ＿ｓ（ｔ）を算出する。数式（１）において、α_ｌは長時間平均の更新量を定めるための時定数であり、例えばα_ｌ＝２０［秒］である。また、数式（２）において、α_ｓは短時間平均の更新量を定めるための時定数であり、例えばα_ｓ＝５０［ミリ秒］である。

ノイズ区間検出部３３は、数式（３）に示す条件が成立する場合には、検出結果（判定結果）として、ノイズフラグ「１」をノイズベース推定部３５に出力する。一方、ノイズ区間検出部３３は、数式（４）に示す条件が成立する場合には、検出結果（判定結果）として、ノイズフラグ「０」をノイズベース推定部３５に出力する。数式（３）及び数式（４）において、ｋは感度を示す定数であり、例えば１０である。

ノイズ推定部の一例としてのノイズベース推定部３５は、ＦＦＴ処理部３１から出力されたフーリエ変換処理後の入力信号の振幅スペクトルＸ（ｔ，ｆ）と、ノイズ区間検出部３３から出力されたノイズフラグとを用いて、数式（５）及び数式（６）に従って、ノイズベースＮ（ｔ，ｆ）の推定値を算出する。ノイズベース推定部３５は、算出されたノイズベースＮ（ｔ，ｆ）の推定値を偏差推定部３７及び音量調整係数算出部３９に出力する。数式（５）において、α_ｎはノイズベースの更新量を定めるための時定数であり、例えば１０［秒］である。

図３（Ａ）は、定常状態におけるノイズレベルに対応する推定ノイズベースの波形の一例を示すグラフである。図３（Ｂ）は、人混み状態におけるノイズレベルに対応する推定ノイズベースの波形の一例を示すグラフである。図３（Ａ）及び図３（Ｂ）では、細い実線が短時間平均により表された入力信号レベルの波形であり、太い実線がノイズベース推定部３５により推定されたノイズベースの波形である。

図３（Ａ）のように、定常状態、即ち特定の発生音源が無いような環境音だけが存在する状態では、ノイズ音の信号レベルは、時間的な変動が小さい。一方、図３（Ｂ）に示すように、人混みの中で聞こえるノイズ音の信号レベルは、時間的な変動が大きい。本実施形態では、音量調整部１５は、ある一定期間において推定されたノイズベースの信号レベルと入力信号レベルとのばらつきを偏差とみなし、推定されたノイズベースと偏差とを用いて、後述する音量調整係数を算出する。

偏差推定部３７は、ＦＦＴ処理部３１から出力された入力信号の振幅スペクトルＸ（ｔ，ｆ）と、ノイズベース推定部３５から出力されたノイズベースＮ（ｔ，ｆ）の推定値との間の偏差（ノイズ偏差）を算出する。

ここで、偏差（ノイズ偏差）は数式（７）により示されるが、時間軸方向のばらつきが大きくなるので、偏差推定部３７は、数式（８）に従って、周波数方向においてノイズベースＮ（ｔ，ｆ）を平均化し、数式（９）に従って、周波数方向において偏差Ｎσ（ｔ，ｆ）を平均化する。数式（８）の算出結果はノイズベース平均値を表し、数式（９）の算出結果は偏差平均値を表す。

数式（８）及び数式（９）において、Ｋｓは測定対象音の周波数領域の下限値であり、Ｋｅは測定対象音の周波数領域の上限値である。例えば、一般に人が話した音声が含まれる１００［Ｈｚ］〜３［ｋＨｚ］あたりが好ましい。

ここで、数式（９）の算出結果である偏差平均値は、各周波数のばらつきが蓄積されてしまい、図４（Ａ）の細い実線に示すように、一定のオフセット値が加算された波形となる。従って、オフセット値の加算の影響を取り除くため、偏差推定部３７は、数式（１０）及び数式（１１）に従って、数式（９）により示される偏差平均値の長時間平均Ｓ（ｔ）及びミニマムホールドＳ_ｍｉｎ（ｔ）を算出する。図４（Ａ）は、推定されたノイズベースＮ（ｔ，ｆ）と、入力信号と推定されたノイズベースとの偏差との一例を示すグラフである。図４（Ａ）では、細い実線により示される偏差の波形が一定のオフセット値が加算され、太い実線は推定されたノイズベースの波形を示し、細い実線は偏差の波形を示す。

β，γは平滑化時定数である。例えば１秒程度で平滑化させるためには、ノイズ区間検出部３３の判定周期が２０［ミリ秒］であれば、β，γは０．０５となる。なお、ミニマムホールドＳ_ｍｉｎ（ｔ）は、数式（１１）に示す第１項が常に０（ゼロ）とならないように、所定の初期値が定められている。また、数式（１１）において、ＭＩＮ（Ａ，Ｂ）は、Ａ又はＢのうち値が小さい方を選択する演算子である。

更に、偏差推定部３７は、数式（１０）の算出結果である偏差平均値の長時間平均Ｓ（ｔ）から、数式（１１）の算出結果であるミニマムホールドＳ_ｍｉｎ（ｔ）を減算し、音量レベルの調整に用いられるノイズ偏差Ｓ_ｄ（ｔ）を数式（１２）に従って算出する。偏差推定部３７は、数式（１２）の算出結果であるノイズ偏差Ｓ_ｄ（ｔ）を音量調整係数算出部３９に出力する。

音量調整係数導出部の一例としての音量調整係数算出部３９は、ノイズベース推定部３５から出力されたノイズベースＮ（ｔ，ｆ）と、偏差推定部３７から出力されたノイズ偏差Ｓ_ｄ（ｔ）とを用いて、音量調整事前係数ｇ_ｐｒｅ（ｔ）を数式（１３）に従って算出する。数式（１３）において、μはノイズ偏差Ｓ_ｄ（ｔ）の影響を緩和するために定められた定数である。

ここで、スピーカ２９から出力される音の音量レベルには上限値が定められ、且つ、静かな環境下でもある程度の音量レベルの音が出力されないと聞こえないので下限値も定められる。従って、図４（Ｂ）に示すように、数式（１３）の算出結果である音量調整事前係数ｇ_ｐｒｅ（ｔ）と、スピーカ２９から出力される音の音量レベルを増幅するための音量調整係数ｇ（ｔ）との間には、数式（１４）〜数式（１６）に示す関係が成り立つ。図４（Ｂ）は、音量調整事前係数ｇ_ｐｒｅ（ｔ）と音量調整係数ｇ（ｔ）との関係の一例を示すグラフである。

即ち、音量調整係数算出部３９は、数式（１３）の算出結果である音量調整事前係数ｇ_ｐｒｅ（ｔ）に応じて、入力信号に含まれる音声信号（例えば来店客注文音ＨＶ）の音量レベルを増幅するための音量調整係数ｇ（ｔ）を導出（算出）する。

数式（１５）において、ａ，ｂは、音量調整事前係数ｇ_ｐｒｅ（ｔ）がＮ１〜Ｎ２である場合に、音量調整係数ｇ（ｔ）と音量調整事前係数ｇ_ｐｒｅ（ｔ）との関係（例えば図４（Ｂ）では一次関数）を定めるための定数である。Ｇ_ｍｉｎは音量調整係数ｇ（ｔ）の最小値であり、Ｇ_ｍａｘは音量調整係数ｇ（ｔ）の最大値である。Ｎ１は、音量調整事前係数ｇ_ｐｒｅ（ｔ）が小さくなり過ぎても音量調整係数ｇ（ｔ）が音量Ｇ_ｍｉｎとなるように設けられた音量調整事前係数ｇ_ｐｒｅ（ｔ）の所定値である。Ｎ２は、音量調整事前係数ｇ_ｐｒｅ（ｔ）が大きくなり過ぎても音量調整係数ｇ（ｔ）が音量Ｇ_ｍａｘとなるように設けられた音量調整事前係数ｇ_ｐｒｅ（ｔ）の所定値である。

音量レベル増幅部の一例としてのＶＧＡ４１は、音量調整係数算出部３９により算出された音量調整係数ｇ（ｔ）に応じて、入力信号の音量レベルを増幅する。音量レベルが増幅された入力信号は、エコーキャンセル処理部１７又はＤＡ変換部２７に入力される。

図５（Ａ）は、定常状態において本実施形態により得られた音量調整係数ｇ（ｔ）と従来技術により得られた音量調整係数との比較図である。図５（Ｂ）は、人混み状態において本実施形態により得られた音量調整係数ｇ（ｔ）と従来技術により得られた音量調整係数との比較図である。

図５（Ａ）及び図５（Ｂ）では、およそ５〜１５［秒］の区間において入力信号と推定されたノイズベースとの間の偏差の変動が大きいのは、例えばマイク１１が来店客注文音ＨＶを収音したためと考えられる。図５（Ａ）及び図５（Ｂ）の太い実線に示す推定ノイズは従来技術により得られた音量調整係数であり、図５（Ａ）及び図５（Ｂ）の点線に示す音量調整係数ｇ（ｔ）は本実施形態により得られた音量調整係数である。また、図５（Ａ）及び図５（Ｂ）では、細い実線は入力信号と推定されたノイズベースとの間の偏差の波形を示す。

これにより、オーダーポスト端末１０の音量調整部１５は、図５（Ａ）に示す定常状態、即ち特定の発生音源が無いような環境音だけが存在する状態でも、図５（Ｂ）に示す人混みの中の状態でも、入力信号と推定されたノイズベースとの間の偏差に応じて、入力信号の音量レベルを調整するための音量調整係数を適応的に算出することができる。従って、音量調整部１５は、図５（Ａ）に示す定常状態に比べて、図５（Ｂ）に示す人混みの中の状態では、より大きな音量調整係数を算出することができ、相手（例えばヘッドセット５０を用いる店員）に対する音の聞き取り易さを向上することができる。

（オーダーポスト端末１０の音量調整部１５の動作手順）
次に、本実施形態のオーダーポスト端末１０の音量調整部１５における動作手順について、図６を参照して説明する。図６は、本実施形態の音量調整装置の一例としてのオーダーポスト端末１０の音量調整部１５における動作手順を説明するフローチャートである。図６では、例えばオーダーポスト端末１０の周囲に近づいた来店客が商品（例えば飲食物）を注文している間の音量調整部１５の動作手順を想定して説明する。

図６において、来店客が商品（例えば飲食物）を口頭にて注文し始めると、音量調整部１５には、マイク１１により収音された周囲音信号のＡＤ変換出力が入力される（Ｓ１１）。ＦＦＴ処理部３１は、入力信号に対して所定ポイント数によるフーリエ変換（例えば高速フーリエ変換又は離散フーリエ変換）を行い、周囲音信号（周囲音の周波数軸信号）又は音声信号（音声の周波数軸信号）を得て、ノイズベース推定部３５及び偏差推定部３７に出力する。

ノイズ区間検出部３３は、入力信号レベルが所定の判定周期間にわたって所定閾値未満であるか否かを、所定の判定周期毎に判定する。つまり、ノイズ区間検出部３３は、所定の判定周期毎に、所定の判定周期間の入力信号レベルが所定閾値未満であるか、即ち入力信号としてノイズ信号又はノイズ信号及び音声信号（例えば来店客注文音ＨＶ）が含まれた信号を検出する（Ｓ１２）。ノイズ区間検出部３３は、入力信号としてノイズ信号を検出した場合に、検出結果（判定結果）としてのノイズフラグ（noise flag）「１」をノイズベース推定部３５に出力し、入力信号としてノイズ信号及び音声信号が含まれた信号を検出した場合に、検出結果（判定結果）としてのノイズフラグ「０」をノイズベース推定部３５に出力する。

ノイズベース推定部３５は、ＦＦＴ処理部３１から出力されたフーリエ変換処理後の入力信号の振幅スペクトルＸ（ｔ，ｆ）と、ノイズ区間検出部３３から出力されたノイズフラグとを用いて、ノイズベースＮ（ｔ，ｆ）の推定値を算出する（Ｓ１３）。ノイズベース推定部３５は、算出されたノイズベースＮ（ｔ，ｆ）の推定値を偏差推定部３７及び音量調整係数算出部３９に出力する。

偏差推定部３７は、ＦＦＴ処理部３１から出力された入力信号の振幅スペクトルＸ（ｔ，ｆ）と、ノイズベース推定部３５から出力されたノイズベースＮ（ｔ，ｆ）の推定値との間の偏差（ノイズ偏差）Ｓ_ｄ（ｔ）を、数式（１２）に従って算出する（Ｓ１４）。偏差推定部３７は、数式（１２）の算出結果であるノイズ偏差Ｓ_ｄ（ｔ）を音量調整係数算出部３９に出力する。

音量調整係数算出部３９は、ノイズベース推定部３５から出力されたノイズベースＮ（ｔ，ｆ）と、偏差推定部３７から出力されたノイズ偏差Ｓ_ｄ（ｔ）とを用いて、音量調整事前係数ｇ_ｐｒｅ（ｔ）を、数式（１３）に従って算出する（Ｓ１５）。更に、音量調整係数算出部３９は、数式（１３）の算出結果である音量調整事前係数ｇ_ｐｒｅ（ｔ）に応じて、入力信号に含まれる音声信号（例えば来店客注文音ＨＶ）の音量レベルを増幅するための音量調整係数ｇ（ｔ）を導出（算出）する（Ｓ１５）。

ＶＧＡ４１は、音量調整係数算出部３９により算出された音量調整係数ｇ（ｔ）に応じて、入力信号の音量レベルを増幅する（Ｓ１６）。音量レベルが増幅された入力信号は、エコーキャンセル処理部１７に入力される。ステップＳ１６の後、来店客の注文が終了すると図６に示す動作手順は終了し（Ｓ１７、ＹＥＳ）、来店客の注文が終了しない限り、ステップＳ１１〜ステップＳ１６の各動作が繰り返される。

以上により、本実施形態の音量調整システム１００では、オーダーポスト端末１０は、オーダーポスト端末１０の周囲音（例えば来店客注文音ＨＶ、ノイズ音ＮＳ）をマイク１１において収音し、オーダーポスト端末１０の周囲音に含まれるノイズ信号Ｎ（ｔ，ｆ）の信号レベルをノイズベース推定部３５において推定する。オーダーポスト端末１０は、オーダーポスト端末１０の周囲音に含まれる入力信号の振幅スペクトルＸ（ｔ，ｆ）とノイズ信号の信号レベルＮ（ｔ，ｆ）との間のノイズ偏差Ｓ_ｄ（ｔ）を偏差推定部３７において推定し、ノイズ偏差Ｓ_ｄ（ｔ）を基にして、入力信号の音量レベルを調整するための音量調整係数ｇ（ｔ）を音量調整係数算出部３９において算出する。オーダーポスト端末１０は、算出された音量調整係数ｇ（ｔ）を用いて、音声信号の音量レベルをＶＧＡ４１において増幅する。

これにより、例えば店舗駐車場に設置されたオーダーポスト端末１０は、様々な種類の騒音（ノイズ）が存在する環境下においても、ノイズの種類（例えば特定の音源が無いような環境音、又は人混みの中で聞こえるノイズ）に応じて、入力音声信号とノイズ信号との間の偏差を基にして、入力信号の音量レベルを増幅させるための音量調整係数を算出することができる。従って、オーダーポスト端末１０は、ノイズの種類が環境音でも人混み中のノイズでも、スピーカから拡声される音声として、例えば通話相手（例えばドライブスルーサービスを提供する店内の店員）が用いるヘッドセット５０のスピーカ５５から拡声（出力）される音声、又は通話相手が話してスピーカ２９から拡声（出力）される音声の音量レベルを適応的に調整することができ、来店客と店員との通話時の聞き取り易さを向上させることができる。

また、本実施形態では、オーダーポスト端末１０は、オーダーポスト端末１０の周囲音に含まれる信号の信号レベルが所定の判定周期にわたって所定閾値未満であるか否かを、所定の判定周期毎に判定し、この判定結果に応じて、ノイズ信号の信号レベルの推定値を算出する。

これにより、オーダーポスト端末１０は、マイク１１により収音された周囲音にノイズ音ＮＳ以外の音（例えば来店客注文音ＨＶ）が含まれているか否かに応じて、ノイズ信号の信号レベルの推定値を算出するので、ノイズベースの推定精度を向上することができる。

なお、上述した本実施形態の音量調整システム１００では、音量調整装置の一例としてのオーダーポスト端末１０は、入力信号（例えば、来店客注文音ＨＶの音声信号、又はヘッドセット５０から送信された店員の音声の音声信号）と、ノイズベース推定部３５により推定されたノイズベースとの間の偏差に応じて、入力信号を増幅するための音量調整係数を算出した。

また、本発明に係る音量調整装置は、上述した本実施形態の音量調整システム１００におけるオーダーポスト端末１０の構成、即ち音量調整装置の外部から入力された音声信号（例えば来店客注文音ＨＶ、又はヘッドセット５０から送信された店員の音声）とマイクにより収音された周囲音を基にして推定されたノイズベースとの間の偏差に応じて音量調整係数を算出する構成に限定されない。例えば、図７に示すオーディオプレイヤー端末１０Ａに適用しても良い。図７は、音量調整装置の他の一例としてのオーディオプレイヤー端末１０Ａの内部構成を詳細に示すブロック図である。

図７に示すオーディオプレイヤー端末１０Ａは、マイク１１と、ＡＤ変換部１３と、エコーキャンセル処理部１７と、ノイズリダクション処理部１９と、音量調整部１５Ａと、ＤＡ変換部２７と、スピーカ２９と、メモリ４３と、操作部４５と、再生処理部４７とを含む。音量調整部１５Ａの内部構成は図２に示す構成と同一である。図７に示すオーディオプレイヤー端末１０Ａでは、図１に示すオーダーポスト端末１０の各部と同一の動作を行うものには同一の符号を付与して説明を省略又は簡略化し、異なる内容について説明する。

メモリ４３は、例えばハードディスク又はフラッシュメモリを用いて構成され、オーディオプレイヤー端末１０Ａを用いるユーザの保存操作の対象となった音楽ファイルを記憶している。

操作部４５は、オーディオプレイヤー端末１０Ａを操作するユーザの入力操作を受け付け、入力操作によって入力されたデータ又は操作信号を音量調整部１５Ａ又は再生処理部４７に出力する。操作部４５は、例えばオーディオプレイヤー端末１０Ａに対応して配置されたタッチパネルを用いて構成される。また、操作部４５は、タッチパネルに限らず、マウス、キーボード、テンキー等の入力媒体を用いて構成されても良い。操作部４５は、例えばユーザが音楽ファイルの再生時の音量レベルを調整するための入力操作に応じて、音量レベルを増加又は減少するための入力操作信号を音量調整部１５Ａに出力する。

再生処理部４７は、例えばユーザの再生操作に応じて、操作部４５からの再生操作信号に対応する音楽ファイルをメモリ４３から読み出して音量調整部１５Ａに出力する。

音量調整部１５Ａには、操作部４５から出力された入力操作信号と、ノイズリダクション処理部１９から出力された抑圧処理後のノイズ信号とが入力される。音量調整部１５Ａは、ノイズベース推定部３５において、ノイズリダクション処理部１９から出力されたノイズ信号に対応するノイズベースを、上述した実施形態と同様の方法によって推定する。

音量調整部１５Ａは、操作部４５から出力された入力操作信号に対応する音量レベルの範囲において、再生処理部４７から出力された音楽ファイルの音声信号のレベルと、音量調整部１５Ａのノイズベース推定部３５により推定されたノイズベースとの間の偏差の推定値を算出する。入力操作信号に対応する音量レベルの範囲は、例えば音量レベルが０〜１０で規定されている場合、「ＨＩＧＨ」（例えば音量レベルが７〜１０）、「ＭＩＤＤＬＥ」（例えば音量レベルが４〜６）及び「ＬＯＷ」（例えば音量レベルが０〜３）のうち、いずれかである。音量調整部１５Ａにおける偏差の算出方法は、上述した本実施形態の音量調整部１５における偏差の算出方法と同一であるため、説明を省略する。音量調整部１５Ａは、算出された偏差の推定値を基に、入力信号を増幅するための音量調整係数を算出する。

なお、音量調整部１５Ａは、操作部４５から出力された入力操作信号に対応する音量レベルの範囲に拘わらず、再生処理部４７から出力された音楽ファイルの音声信号のレベルと、音量調整部１５Ａのノイズベース推定部３５により推定されたノイズベースとの間の偏差の推定値を算出しても良い。

以上により、図７に示すオーディオプレイヤー端末１０Ａは、オーディオプレイヤー端末１０Ａの周囲音（例えばノイズ音ＮＳ）をマイク１１において収音し、オーディオプレイヤー端末１０Ａの周囲音に含まれるノイズ信号Ｎ（ｔ，ｆ）の信号レベルをノイズベース推定部３５において推定する。オーディオプレイヤー端末１０Ａは、所定の出力音声信号（例えばオーディオプレイヤー端末１０Ａにおいて再生される音楽ファイルの音声信号）の振幅スペクトルＸ（ｔ，ｆ）とノイズ信号（例えばノイズ音ＮＳ）の信号レベルＮ（ｔ，ｆ）との偏差Ｓ_ｄ（ｔ）を偏差推定部３７において推定し、偏差Ｓ_ｄ（ｔ）を基にして、出力音声信号の音量レベルを調整するための音量調整係数ｇ（ｔ）を音量調整係数算出部３９において算出する。オーディオプレイヤー端末１０Ａは、算出された音量調整係数ｇ（ｔ）を用いて、出力音声信号の音量レベルをＶＧＡ４１において増幅する。

これにより、例えばユーザが用いるオーディオプレイヤー端末１０Ａは、様々な種類の騒音（ノイズ）が存在する環境下においても、ノイズの種類（例えば特定の音源が無いような環境音、又は人混みの中で聞こえるノイズ）に応じて、出力音声信号（例えばオーディオプレイヤー端末１０Ａにおいて再生される音楽ファイルの音声信号）とノイズ信号との間の偏差を基にして、出力音声信号の音量レベルを増幅させるための音量調整係数を算出することができる。従って、オーディオプレイヤー端末１０Ａは、ノイズの種類が環境音でも人混み中のノイズでも、音楽ファイルの音声信号の音量レベルを適応的に調整することができ、音楽ファイルの音声をユーザにとって快適に再生することができる。

以下、上述した本発明に係る音量調整装置、音量調整方法及び音量調整システムの構成、作用及び効果を説明する。

本発明の一実施形態は、ネットワークを介して接続された相手端末と通信する音量調整装置であって、前記音量調整装置の周囲音を収音する収音部と、前記収音部により収音された前記音量調整装置の周囲音に含まれるノイズ信号の信号レベルを推定するノイズ推定部と、前記収音部により収音された前記音量調整装置の周囲音に含まれる音声信号と前記ノイズ推定部により推定された前記ノイズ信号との偏差を推定する偏差推定部と、前記偏差推定部により推定された前記偏差を基に、前記音声信号の音量レベルを調整する音量調整係数を導出する音量調整係数導出部と、前記音量調整係数導出部により導出された前記音量調整係数に応じて、前記音声信号の音量レベルを増幅する音量レベル増幅部と、を備える音量調整装置である。

上述した構成では、音量調整装置の一例としてのオーダーポスト端末１０は、オーダーポスト端末１０の周囲音（例えば来店客注文音ＨＶ、ノイズ音ＮＳ）をマイク１１において収音し、オーダーポスト端末１０の周囲音に含まれるノイズ信号Ｎ（ｔ，ｆ）の信号レベルをノイズベース推定部３５において推定する。オーダーポスト端末１０は、オーダーポスト端末１０の周囲音に含まれる入力信号の振幅スペクトルＸ（ｔ，ｆ）とノイズ信号の信号レベルＮ（ｔ，ｆ）とのノイズ偏差Ｓ_ｄ（ｔ）を偏差推定部３７において推定し、ノイズ偏差Ｓ_ｄ（ｔ）を基にして、入力信号の音量レベルを調整するための音量調整係数ｇ（ｔ）を音量調整係数算出部３９において算出する。オーダーポスト端末１０は、算出された音量調整係数ｇ（ｔ）を用いて、音声信号の音量レベルをＶＧＡ４１において増幅する。

これにより、例えば店舗駐車場に設置されたオーダーポスト端末１０は、様々な種類の騒音（ノイズ）が存在する環境下においても、ノイズの種類（例えば特定の音源が無いような環境音、又は人混みの中で聞こえるノイズ）に応じて、入力音声信号とノイズ信号との間の偏差を基にして、入力信号の音量レベルを増幅させるための音量調整係数を算出することができる。従って、オーダーポスト端末１０は、ノイズの種類が環境音でも人混み中のノイズでも、通話相手（例えばドライブスルーサービスを提供する店内の店員）が用いるヘッドセット５０との間の通話音声の音量レベルを適応的に調整することができ、来店客と店員との通話時の聞き取り易さを向上させることができる。

また、本発明の一実施形態は、前記収音部により収音された前記音量調整装置の周囲音に含まれる信号の信号レベルが所定の判定周期にわたって所定閾値未満であるか否かを、前記所定の判定周期毎に判定するノイズ区間判定部と、を更に備え、前記ノイズ推定部は、前記ノイズ区間判定部の判定結果に応じて、前記ノイズ信号の信号レベルの推定値を導出する音量調整装置である。

上述した構成では、オーダーポスト端末１０は、オーダーポスト端末１０の周囲音に含まれる信号の信号レベルが所定の判定周期にわたって所定閾値未満であるか否かを、所定の判定周期毎に判定し、この判定結果に応じて、ノイズ信号の信号レベルの推定値を算出する。

また、本発明の一実施形態は、前記音量レベル増幅部により増幅された前記音声信号を前記相手端末に送信する無線通信部と、を更に備える音量調整装置である。

上述した構成では、オーダーポスト端末１０は、ＶＧＡ４１により増幅された音声信号を、相手端末（例えばドライブスルーサービスを提供する店内の店員が用いるヘッドセット５０）に送信するので、ＶＧＡ４１により音声信号の音量レベルが増幅される前に比べて、来店客と店員との通話時の聞き取り易さを向上させることができる。

また、本発明の一実施形態は、周囲音を収音する収音部と、前記収音部により収音された前記周囲音に含まれるノイズ信号を推定するノイズ推定部と、所定の出力音声信号と前記ノイズ推定部により推定された前記ノイズ信号との偏差を推定する偏差推定部と、前記偏差推定部により推定された前記偏差を基に、前記出力音声信号の音量レベルを調整する音量調整係数を導出する音量調整係数導出部と、前記音量調整係数導出部により導出された前記音量調整係数を用いて、前記出力音声信号の音量レベルを増幅する音量レベル増幅部と、前記音量レベル増幅部により増幅された前記出力音声信号を出力する音声出力部と、を備える音量調整装置である。

上述した構成では、音量調整装置の一例としてのオーディオプレイヤー端末１０Ａは、オーディオプレイヤー端末１０Ａの周囲音（例えばノイズ音ＮＳ）をマイク１１において収音し、オーディオプレイヤー端末１０Ａの周囲音に含まれるノイズ信号Ｎ（ｔ，ｆ）の信号レベルをノイズベース推定部３５において推定する。オーディオプレイヤー端末１０Ａは、所定の出力音声信号（例えばオーディオプレイヤー端末１０Ａにおいて再生される音楽ファイルの音声信号）の振幅スペクトルＸ（ｔ，ｆ）とノイズ信号（例えばノイズ音ＮＳ）の信号レベルＮ（ｔ，ｆ）との偏差Ｓ_ｄ（ｔ）を偏差推定部３７において推定し、偏差Ｓ_ｄ（ｔ）を基にして、出力音声信号の音量レベルを調整するための音量調整係数ｇ（ｔ）を音量調整係数算出部３９において算出する。オーディオプレイヤー端末１０Ａは、算出された音量調整係数ｇ（ｔ）を用いて、出力音声信号の音量レベルをＶＧＡ４１において増幅する。

また、本発明の一実施形態は、ネットワークを介して接続された相手端末と通信する音量調整装置における音量調整方法であって、前記音量調整装置の周囲音を収音するステップと、収音された前記音量調整装置の周囲音に含まれるノイズ信号の信号レベルを推定するステップと、収音された前記音量調整装置の周囲音に含まれる音声信号と推定された前記ノイズ信号との偏差を推定するステップと、推定された前記偏差を基に、前記音声信号の音量レベルを調整する音量調整係数を導出するステップと、導出された前記音量調整係数に応じて、前記音声信号の音量レベルを増幅するステップと、を有する音量調整方法である。

上述した方法では、音量調整装置の一例としてのオーダーポスト端末１０は、オーダーポスト端末１０の周囲音（例えば来店客注文音ＨＶ、ノイズ音ＮＳ）をマイク１１において収音し、オーダーポスト端末１０の周囲音に含まれるノイズ信号Ｎ（ｔ，ｆ）の信号レベルをノイズベース推定部３５において推定する。オーダーポスト端末１０は、オーダーポスト端末１０の周囲音に含まれる入力音声信号の振幅スペクトルＸ（ｔ，ｆ）とノイズ信号の信号レベルＮ（ｔ，ｆ）との偏差Ｓ_ｄ（ｔ）を偏差推定部３７において推定し、偏差Ｓ_ｄ（ｔ）を基にして、入力音声信号の音量レベルを調整するための音量調整係数ｇ（ｔ）を音量調整係数算出部３９において算出する。オーダーポスト端末１０は、算出された音量調整係数ｇ（ｔ）を用いて、音声信号の音量レベルをＶＧＡ４１において増幅する。

これにより、例えば店舗駐車場に設置されたオーダーポスト端末１０は、様々な種類の騒音（ノイズ）が存在する環境下においても、ノイズの種類（例えば特定の音源が無いような環境音、又は人混みの中で聞こえるノイズ）に応じて、入力音声信号とノイズ信号との間の偏差を基にして、入力音声信号の音量レベルを増幅させるための音量調整係数を算出することができる。従って、オーダーポスト端末１０は、ノイズの種類が環境音でも人混み中のノイズでも、通話相手（例えばドライブスルーサービスを提供する店内の店員）が用いるヘッドセット５０との間の通話音声の音量レベルを適応的に調整することができ、来店客と店員との通話時の聞き取り易さを向上させることができる。

また、本発明の一実施形態は、ネットワークを介して接続された相手端末と、前記相手端末と通信する音量調整装置とを含む音量調整システムであって、前記音量調整装置は、前記音量調整装置の周囲音を収音する収音部と、前記収音部により収音された前記音量調整装置の周囲音に含まれるノイズ信号の信号レベルを推定するノイズ推定部と、前記収音部により収音された前記音量調整装置の周囲音に含まれる音声信号と前記ノイズ推定部により推定された前記ノイズ信号との偏差を推定する偏差推定部と、前記偏差推定部により推定された前記偏差を基に、前記音声信号の音量レベルを調整する音量調整係数を導出する音量調整係数導出部と、前記音量調整係数導出部により導出された前記音量調整係数に応じて、前記音声信号の音量レベルを増幅する音量レベル増幅部と、前記音量レベル増幅部により増幅された前記音声信号を前記相手端末に送信する無線通信部と、を備え、前記相手端末は、前記音量調整装置から送信された、前記音量レベル増幅部により増幅された前記音声信号を出力する音声出力部と、を備える音量調整システムである。

上述したシステムでは、音量調整装置の一例としてのオーダーポスト端末１０は、オーダーポスト端末１０の周囲音（例えば来店客注文音ＨＶ、ノイズ音ＮＳ）をマイク１１において収音し、オーダーポスト端末１０の周囲音に含まれるノイズ信号Ｎ（ｔ，ｆ）の信号レベルをノイズベース推定部３５において推定する。オーダーポスト端末１０は、オーダーポスト端末１０の周囲音に含まれる入力音声信号の振幅スペクトルＸ（ｔ，ｆ）とノイズ信号の信号レベルＮ（ｔ，ｆ）との偏差Ｓ_ｄ（ｔ）を偏差推定部３７において推定し、偏差Ｓ_ｄ（ｔ）を基にして、入力音声信号の音量レベルを調整するための音量調整係数ｇ（ｔ）を音量調整係数算出部３９において算出する。オーダーポスト端末１０は、算出された音量調整係数ｇ（ｔ）を用いて、音声信号の音量レベルをＶＧＡ４１において増幅し、増幅された音声信号を相手端末の一例としてのヘッドセット５０に送信する。更に、ヘッドセット５０は、オーダーポスト端末１０から送信された増幅後の音声信号を出力する。

これにより、音量調整システム１００では、例えば店舗駐車場に設置されたオーダーポスト端末１０は、様々な種類の騒音（ノイズ）が存在する環境下においても、ノイズの種類（例えば特定の音源が無いような環境音、又は人混みの中で聞こえるノイズ）に応じて、入力音声信号とノイズ信号との間の偏差を基にして、入力音声信号の音量レベルを増幅させるための音量調整係数を算出することができる。従って、オーダーポスト端末１０は、ノイズの種類が環境音でも人混み中のノイズでも、通話相手（例えばドライブスルーサービスを提供する店内の店員）が用いるヘッドセット５０との間の通話音声の音量レベルを適応的に調整することができ、来店客と店員との通話時の聞き取り易さを向上させることができる。

以上、図面を参照しながら各種の実施形態について説明したが、本発明はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。

なお、本発明に係る音量調整装置、音量調整方法又は音量調整システムは、例えば集合住宅の共用玄関に設置されるインターホン子機（ヘッドセット５０に対応）と住戸内に設置されるインターホン親機（オーダーポスト端末１０に対応）との組み合わせに適用しても良いし、更に、例えば企業内又は家屋内において用いられる電話の子機（ヘッドセット５０に対応）と親機（オーダーポスト端末１０）との組み合わせに適用しても良い。

本発明は、様々な騒音環境下においても、騒音の種類に応じて、スピーカから拡声される音声の音量レベルを適応的に調整する音量調整装置、音量調整方法及び音量調整システムとして有用である。

１０オーダーポスト端末
１１、５３マイク
１３ＡＤ変換部
１５音量調整部
１７エコーキャンセル処理部
１９ノイズリダクション処理部
２１エンコーダ
２３無線通信部
２５デコーダ
２７ＤＡ変換部
２９、５５スピーカ
４１ＶＧＡ
５０ヘッドセット
５１ヘッドセット動作処理部
１００音量調整システム
ＨＶ来店客注文音
ＮＳノイズ音
ＳＰスピーカ出力音

Claims

ネットワークを介して接続された相手端末と通信する音量調整装置であって、
前記音量調整装置の周囲音を収音する収音部と、
前記収音部により収音された前記音量調整装置の周囲音に含まれるノイズ信号の信号レベルを推定するノイズ推定部と、
前記収音部により収音された前記音量調整装置の周囲音に含まれる音声信号と前記ノイズ推定部により推定された前記ノイズ信号との偏差を推定する偏差推定部と、
前記偏差推定部により推定された前記偏差を基に、前記音声信号の音量レベルを調整する音量調整係数を導出する音量調整係数導出部と、
前記音量調整係数導出部により導出された前記音量調整係数に応じて、前記音声信号の音量レベルを増幅する音量レベル増幅部と、を備える、
音量調整装置。
請求項１に記載の音量調整装置であって、
前記収音部により収音された前記音量調整装置の周囲音に含まれる信号の信号レベルが所定の判定周期にわたって所定閾値未満であるか否かを、前記所定の判定周期毎に判定するノイズ区間判定部と、を更に備え、
前記ノイズ推定部は、前記ノイズ区間判定部の判定結果に応じて、前記ノイズ信号の信号レベルの推定値を導出する、
音量調整装置。
請求項１に記載の音量調整装置であって、
前記音量レベル増幅部により増幅された前記音声信号を前記相手端末に送信する無線通信部と、を更に備える、
音量調整装置。
周囲音を収音する収音部と、
前記収音部により収音された前記周囲音に含まれるノイズ信号を推定するノイズ推定部と、
所定の出力音声信号と前記ノイズ推定部により推定された前記ノイズ信号との偏差を推定する偏差推定部と、
前記偏差推定部により推定された前記偏差を基に、前記出力音声信号の音量レベルを調整する音量調整係数を導出する音量調整係数導出部と、
前記音量調整係数導出部により導出された前記音量調整係数を用いて、前記出力音声信号の音量レベルを増幅する音量レベル増幅部と、
前記音量レベル増幅部により増幅された前記出力音声信号を出力する音声出力部と、を備える、
音量調整装置。
ネットワークを介して接続された相手端末と通信する音量調整装置における音量調整方法であって、
前記音量調整装置の周囲音を収音するステップと、
収音された前記音量調整装置の周囲音に含まれるノイズ信号の信号レベルを推定するステップと、
収音された前記音量調整装置の周囲音に含まれる音声信号と推定された前記ノイズ信号との偏差を推定するステップと、
推定された前記偏差を基に、前記音声信号の音量レベルを調整する音量調整係数を導出するステップと、
導出された前記音量調整係数に応じて、前記音声信号の音量レベルを増幅するステップと、を有する、
音量調整方法。
ネットワークを介して接続された相手端末と、前記相手端末と通信する音量調整装置とを含む音量調整システムであって、
前記音量調整装置は、
前記音量調整装置の周囲音を収音する収音部と、
前記収音部により収音された前記音量調整装置の周囲音に含まれるノイズ信号の信号レベルを推定するノイズ推定部と、
前記収音部により収音された前記音量調整装置の周囲音に含まれる音声信号と前記ノイズ推定部により推定された前記ノイズ信号との偏差を推定する偏差推定部と、
前記偏差推定部により推定された前記偏差を基に、前記音声信号の音量レベルを調整する音量調整係数を導出する音量調整係数導出部と、
前記音量調整係数導出部により導出された前記音量調整係数に応じて、前記音声信号の音量レベルを増幅する音量レベル増幅部と、
前記音量レベル増幅部により増幅された前記音声信号を前記相手端末に送信する無線通信部と、を備え、
前記相手端末は、
前記音量調整装置から送信された、前記音量レベル増幅部により増幅された前記音声信号を出力する音声出力部と、を備える、
音量調整システム。