以下、本発明に係る音量調整装置、音量調整方法及び音量調整システムの実施形態(以下、「本実施形態」という)について、図面を参照して説明する。
本実施形態では、本発明に係る音量調整システムの使用形態の一例として、例えば店舗駐車場、即ち屋外に設置された音量調整装置の一例としてのオーダーポスト端末と、店内にいる店員が用いる相手端末の一例としてのヘッドセットとを用いた商品(例えば飲食物)の注文システム(例えばドライブスルーサービス)のシチュエーションを説明する。但し、本発明に係る音量調整システムの使用形態は、ドライブスルーサービスのシチュエーションに限定されない。
なお、本発明は、音量調整装置が行う各動作(ステップ)を有する音量調整方法として表現することも可能である。更に、本発明は、コンピュータとしての音量調整装置が行う各動作(ステップ)を、音量調整装置に内蔵されるプロセッサ(例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)、DSP(Digital Signal Processor))に実行させるためのプログラムとして表現しても良い。
(本実施形態の音量調整システムの各部の説明)
図1は、本実施形態の音量調整システム100のシステム構成を示すブロック図である。図1に示す音量調整システム100は、例えば店舗駐車場、即ち屋外に設置されたオーダーポスト端末10と、店内にいる店員が用いるヘッドセット50とを含む構成である。オーダーポスト端末10と、ヘッドセット50とは、ネットワークNWを介して接続され、相互に通信可能である。ネットワークNWは、有線ネットワークでも無線ネットワークでも良い。
本実施形態では、例えば商品の注文のために来店した来店客がオーダーポスト端末10の周囲に近づき、口頭にて商品(例えば飲食物)を注文する場合に、オーダーポスト端末10は、オーダーポスト端末10の周囲音(例えば来店客注文音HV、周囲のノイズ音NS)を収音する。オーダーポスト端末10は、収音された周囲音に含まれるノイズ信号(以下、「ノイズベース」という)の信号レベルを推定し、ノイズの種類によってノイズベースの信号波形が異なることを考慮して、周囲音に含まれる音声信号(例えば来店客注文音HV)と推定されたノイズベースとの間の偏差を推定する。
更に、オーダーポスト端末10は、推定された偏差を基に、周囲音に含まれる音声信号の音量レベルを調整するための音量調整係数を算出し、算出された音量調整係数を用いて音声信号の音量レベルを増幅してヘッドセット50に送信する。これにより、音量調整システム100では、オーダーポスト端末10は、オーダーポスト端末10の周辺環境のノイズの種類に応じて、来店客が注文したときの来店客注文音HVの音量レベルを増幅できるので、ヘッドセット50を用いる店員にとって来店客注文音HVの聞き取り易さを向上できる。
次に、本実施形態の音量調整システム100の各部の構成及び動作について、図1及び図2を参照して説明する。図2は、本実施形態の音量調整装置の一例としてのオーダーポスト端末10の音量調整部15の内部構成を詳細に示すブロック図である。オーダーポスト端末10は、マイク11と、AD変換部13と、音量調整部15と、エコーキャンセル処理部17と、ノイズリダクション処理部19と、エンコーダ21と、無線通信部23と、デコーダ25と、DA変換部27と、スピーカ29とを含む。ヘッドセット50は、ヘッドセット動作処理部51と、マイク53と、スピーカ55とを含む。
収音部の一例としてのマイク11は、オーダーポスト端末10の周囲音(例えば来店客注文音HV、ノイズ音NS)を収音する。収音された周囲音は、マイク11によって電気信号(周囲音信号)に変換されてAD変換部13に入力される。
AD変換部13は、所定のサンプリング周波数(例えば8kHz)で、マイク11により収音されたアナログの周囲音信号をデジタルの周囲音信号にAD変換し、デジタルの周囲音信号のサンプル値を音量調整部15及びエコーキャンセル処理部17に出力する。
音量調整部15は、AD変換部13から出力された周囲音信号(のサンプル値)を用いて、周囲音信号に含まれる音声信号(例えば来店客注文音HVの音声信号)の音量レベルを調整する。音量調整部15の詳細な動作については、図2を参照して後述する。
エコーキャンセル処理部17は、例えばプロセッサ(例えばCPU、MPU又はDSP)を用いて構成され、AD変換部13から出力された周囲音信号(のサンプル値)又は音量調整部15から出力された周囲音信号(のサンプル値)を用いて、エコー成分、即ちスピーカ29から出力された音声がマイク11により回り込んで収音された音声信号の成分をキャンセルする。エコーキャンセル処理部17の動作内容は公知技術であるので、詳細な説明は割愛する。エコーキャンセル処理部17は、エコー成分がキャンセルされた周囲音信号をノイズリダクション処理部19に出力する。
ノイズリダクション処理部19は、例えばプロセッサ(例えばCPU、MPU又はDSP)を用いて構成され、エコーキャンセル処理部17から出力された周囲音信号に含まれるノイズ成分を抑圧する。ノイズリダクション処理部19の動作内容は公知技術であるので、詳細な説明は割愛する。ノイズリダクション処理部19は、ノイズ成分が抑圧された周囲音信号、即ち音声信号をエンコーダ21に出力する。
エンコーダ21は、例えばプロセッサ(例えばCPU、MPU又はDSP)を用いて構成され、ノイズリダクション処理部19から出力された音声信号を符号化処理し、符号化処理後の音声信号を無線通信部23に出力する。なお、エンコーダ21における符号化処理の方式及びその内容は、オーダーポスト端末10及びヘッドセット50において既知である。
無線通信部23は、エンコーダ21から出力された符号化処理後の音声信号を例えば無線通信用の所定周波数帯の信号に変換してヘッドセット50に送信する。また、無線通信部23は、ヘッドセット50から送信された所定周波数帯の信号を受信し、受信された所定周波数帯の信号を検波及び復調して音声信号をデコーダ25に出力する。
デコーダ25は、無線通信部23から出力された音声信号を復号処理し、復号処理後の音声信号を音量調整部15に出力する。なお、デコーダ25における復号処理の方式及びその内容は、オーダーポスト端末10及びヘッドセット50において既知である。
DA変換部27は、音量調整部15から出力されたデジタルの音声信号をアナログの音声信号にDA変換し、アナログの音声信号をスピーカ29に出力する。
音声出力部の一例としてのスピーカ29は、DA変換部27から出力された音声信号が入力され、例えばヘッドセット50を用いる店員が話した音声を出力する。
ヘッドセット動作処理部51は、ヘッドセット50の動作(例えば音声信号処理、無線通信、音声出力)を統括して制御する。
マイク53は、ヘッドセット50を用いる店員が話した音声を収音する。収音された音声は、マイク53によって電気信号(周囲音信号)に変換されてヘッドセット動作処理部51に入力される。
スピーカ55は、オーダーポスト端末10から送信された来店客の音声信号、即ち来店客注文音HVを出力する。
ここで、図2を参照して、音量調整部15の内部構成を詳細に説明する。図2に示す音量調整部15は、FFT(Fast Fourier Transform)処理部31と、ノイズ区間検出部33と、ノイズベース推定部35と、偏差推定部37と、音量調整係数算出部39と、VGA(Variable Gain Amplifier)41とを含む。音量調整部15の各部は、VGA41以外は、例えばプロセッサ(CPU、MPU、又はDSP)を用いて構成される。
FFT処理部31は、AD変換部13又はデコーダ25から出力された周囲音信号(周囲音の時間軸信号)又は音声信号(音声の時間軸信号)に対して所定ポイント数によるフーリエ変換(例えば高速フーリエ変換又は離散フーリエ変換)を行い、周囲音信号(周囲音の周波数軸信号)又は音声信号(音声の周波数軸信号)を得る。以下、図2に示す音量調整部15の説明を分かり易くするために、「AD変換部13又はデコーダ25から出力された周囲音信号(周囲音の時間軸信号)又は音声信号(音声の時間軸信号)」を、単に「入力信号」という。FFT処理部31は、フーリエ変換処理後の周囲音信号(周囲音の周波数軸信号)又は音声信号(音声の周波数軸信号)をノイズベース推定部35及び偏差推定部37に出力する。
なお、所定ポイント数は、例えば音量調整部15における調整対象の音声の周波数範囲が0〜32[kHz]である場合には、1[kHz]毎の32である。又は、所定ポイント数は、例えば音量調整部15における調整対象の音声の周波数範囲が5〜10[kHz]である場合には、0.3125[kHz]毎の16である。但し、所定ポイント数は、上述した一例に限らず、周波数間隔に応じて適宜定められても良い。
ノイズ区間判定部の一例としてのノイズ区間検出部33は、入力信号の信号レベル(入力信号レベル)が所定の判定周期間にわたって所定閾値未満であるか否かを、所定の判定周期毎に判定する。つまり、ノイズ区間検出部33は、所定の判定周期毎に、所定の判定周期間の入力信号レベルが所定閾値未満であるか、即ち入力信号としてノイズ信号、又はノイズ信号及び音声信号(例えば来店客注文音HV)が含まれた信号を検出する。
ノイズ区間検出部33は、所定の判定周期間の入力信号レベルが所定閾値未満であると判定した場合に、入力信号としてノイズ信号を検出し、所定の判定周期間の入力信号レベルが所定閾値以上であると判定した場合に、入力信号としてノイズ信号及び音声信号が含まれた信号を検出する。ノイズ区間検出部33は、入力信号としてノイズ信号を検出した場合に、検出結果(判定結果)としてのノイズフラグ(noise flag)「1」をノイズベース推定部35に出力し、入力信号としてノイズ信号及び音声信号が含まれた信号を検出した場合に、検出結果(判定結果)としてのノイズフラグ「0」をノイズベース推定部35に出力する。
具体的には、ノイズ区間検出部33は、数式(1)に従って入力信号x(t)の長時間平均x_l(t)を算出し、更に、数式(2)に従って入力信号の短時間平均x_s(t)を算出する。数式(1)において、αlは長時間平均の更新量を定めるための時定数であり、例えばαl=20[秒]である。また、数式(2)において、αsは短時間平均の更新量を定めるための時定数であり、例えばαs=50[ミリ秒]である。
ノイズ区間検出部33は、数式(3)に示す条件が成立する場合には、検出結果(判定結果)として、ノイズフラグ「1」をノイズベース推定部35に出力する。一方、ノイズ区間検出部33は、数式(4)に示す条件が成立する場合には、検出結果(判定結果)として、ノイズフラグ「0」をノイズベース推定部35に出力する。数式(3)及び数式(4)において、kは感度を示す定数であり、例えば10である。
ノイズ推定部の一例としてのノイズベース推定部35は、FFT処理部31から出力されたフーリエ変換処理後の入力信号の振幅スペクトルX(t,f)と、ノイズ区間検出部33から出力されたノイズフラグとを用いて、数式(5)及び数式(6)に従って、ノイズベースN(t,f)の推定値を算出する。ノイズベース推定部35は、算出されたノイズベースN(t,f)の推定値を偏差推定部37及び音量調整係数算出部39に出力する。数式(5)において、αnはノイズベースの更新量を定めるための時定数であり、例えば10[秒]である。
図3(A)は、定常状態におけるノイズレベルに対応する推定ノイズベースの波形の一例を示すグラフである。図3(B)は、人混み状態におけるノイズレベルに対応する推定ノイズベースの波形の一例を示すグラフである。図3(A)及び図3(B)では、細い実線が短時間平均により表された入力信号レベルの波形であり、太い実線がノイズベース推定部35により推定されたノイズベースの波形である。
図3(A)のように、定常状態、即ち特定の発生音源が無いような環境音だけが存在する状態では、ノイズ音の信号レベルは、時間的な変動が小さい。一方、図3(B)に示すように、人混みの中で聞こえるノイズ音の信号レベルは、時間的な変動が大きい。本実施形態では、音量調整部15は、ある一定期間において推定されたノイズベースの信号レベルと入力信号レベルとのばらつきを偏差とみなし、推定されたノイズベースと偏差とを用いて、後述する音量調整係数を算出する。
偏差推定部37は、FFT処理部31から出力された入力信号の振幅スペクトルX(t,f)と、ノイズベース推定部35から出力されたノイズベースN(t,f)の推定値との間の偏差(ノイズ偏差)を算出する。
ここで、偏差(ノイズ偏差)は数式(7)により示されるが、時間軸方向のばらつきが大きくなるので、偏差推定部37は、数式(8)に従って、周波数方向においてノイズベースN(t,f)を平均化し、数式(9)に従って、周波数方向において偏差Nσ(t,f)を平均化する。数式(8)の算出結果はノイズベース平均値を表し、数式(9)の算出結果は偏差平均値を表す。
数式(8)及び数式(9)において、Ksは測定対象音の周波数領域の下限値であり、Keは測定対象音の周波数領域の上限値である。例えば、一般に人が話した音声が含まれる100[Hz]〜3[kHz]あたりが好ましい。
ここで、数式(9)の算出結果である偏差平均値は、各周波数のばらつきが蓄積されてしまい、図4(A)の細い実線に示すように、一定のオフセット値が加算された波形となる。従って、オフセット値の加算の影響を取り除くため、偏差推定部37は、数式(10)及び数式(11)に従って、数式(9)により示される偏差平均値の長時間平均S(t)及びミニマムホールドSmin(t)を算出する。図4(A)は、推定されたノイズベースN(t,f)と、入力信号と推定されたノイズベースとの偏差との一例を示すグラフである。図4(A)では、細い実線により示される偏差の波形が一定のオフセット値が加算され、太い実線は推定されたノイズベースの波形を示し、細い実線は偏差の波形を示す。
β,γは平滑化時定数である。例えば1秒程度で平滑化させるためには、ノイズ区間検出部33の判定周期が20[ミリ秒]であれば、β,γは0.05となる。なお、ミニマムホールドSmin(t)は、数式(11)に示す第1項が常に0(ゼロ)とならないように、所定の初期値が定められている。また、数式(11)において、MIN(A,B)は、A又はBのうち値が小さい方を選択する演算子である。
更に、偏差推定部37は、数式(10)の算出結果である偏差平均値の長時間平均S(t)から、数式(11)の算出結果であるミニマムホールドSmin(t)を減算し、音量レベルの調整に用いられるノイズ偏差Sd(t)を数式(12)に従って算出する。偏差推定部37は、数式(12)の算出結果であるノイズ偏差Sd(t)を音量調整係数算出部39に出力する。
音量調整係数導出部の一例としての音量調整係数算出部39は、ノイズベース推定部35から出力されたノイズベースN(t,f)と、偏差推定部37から出力されたノイズ偏差Sd(t)とを用いて、音量調整事前係数gpre(t)を数式(13)に従って算出する。数式(13)において、μはノイズ偏差Sd(t)の影響を緩和するために定められた定数である。
ここで、スピーカ29から出力される音の音量レベルには上限値が定められ、且つ、静かな環境下でもある程度の音量レベルの音が出力されないと聞こえないので下限値も定められる。従って、図4(B)に示すように、数式(13)の算出結果である音量調整事前係数gpre(t)と、スピーカ29から出力される音の音量レベルを増幅するための音量調整係数g(t)との間には、数式(14)〜数式(16)に示す関係が成り立つ。図4(B)は、音量調整事前係数gpre(t)と音量調整係数g(t)との関係の一例を示すグラフである。
即ち、音量調整係数算出部39は、数式(13)の算出結果である音量調整事前係数gpre(t)に応じて、入力信号に含まれる音声信号(例えば来店客注文音HV)の音量レベルを増幅するための音量調整係数g(t)を導出(算出)する。
数式(15)において、a,bは、音量調整事前係数gpre(t)がN1〜N2である場合に、音量調整係数g(t)と音量調整事前係数gpre(t)との関係(例えば図4(B)では一次関数)を定めるための定数である。Gminは音量調整係数g(t)の最小値であり、Gmaxは音量調整係数g(t)の最大値である。N1は、音量調整事前係数gpre(t)が小さくなり過ぎても音量調整係数g(t)が音量Gminとなるように設けられた音量調整事前係数gpre(t)の所定値である。N2は、音量調整事前係数gpre(t)が大きくなり過ぎても音量調整係数g(t)が音量Gmaxとなるように設けられた音量調整事前係数gpre(t)の所定値である。
音量レベル増幅部の一例としてのVGA41は、音量調整係数算出部39により算出された音量調整係数g(t)に応じて、入力信号の音量レベルを増幅する。音量レベルが増幅された入力信号は、エコーキャンセル処理部17又はDA変換部27に入力される。
図5(A)は、定常状態において本実施形態により得られた音量調整係数g(t)と従来技術により得られた音量調整係数との比較図である。図5(B)は、人混み状態において本実施形態により得られた音量調整係数g(t)と従来技術により得られた音量調整係数との比較図である。
図5(A)及び図5(B)では、およそ5〜15[秒]の区間において入力信号と推定されたノイズベースとの間の偏差の変動が大きいのは、例えばマイク11が来店客注文音HVを収音したためと考えられる。図5(A)及び図5(B)の太い実線に示す推定ノイズは従来技術により得られた音量調整係数であり、図5(A)及び図5(B)の点線に示す音量調整係数g(t)は本実施形態により得られた音量調整係数である。また、図5(A)及び図5(B)では、細い実線は入力信号と推定されたノイズベースとの間の偏差の波形を示す。
これにより、オーダーポスト端末10の音量調整部15は、図5(A)に示す定常状態、即ち特定の発生音源が無いような環境音だけが存在する状態でも、図5(B)に示す人混みの中の状態でも、入力信号と推定されたノイズベースとの間の偏差に応じて、入力信号の音量レベルを調整するための音量調整係数を適応的に算出することができる。従って、音量調整部15は、図5(A)に示す定常状態に比べて、図5(B)に示す人混みの中の状態では、より大きな音量調整係数を算出することができ、相手(例えばヘッドセット50を用いる店員)に対する音の聞き取り易さを向上することができる。
(オーダーポスト端末10の音量調整部15の動作手順)
次に、本実施形態のオーダーポスト端末10の音量調整部15における動作手順について、図6を参照して説明する。図6は、本実施形態の音量調整装置の一例としてのオーダーポスト端末10の音量調整部15における動作手順を説明するフローチャートである。図6では、例えばオーダーポスト端末10の周囲に近づいた来店客が商品(例えば飲食物)を注文している間の音量調整部15の動作手順を想定して説明する。
図6において、来店客が商品(例えば飲食物)を口頭にて注文し始めると、音量調整部15には、マイク11により収音された周囲音信号のAD変換出力が入力される(S11)。FFT処理部31は、入力信号に対して所定ポイント数によるフーリエ変換(例えば高速フーリエ変換又は離散フーリエ変換)を行い、周囲音信号(周囲音の周波数軸信号)又は音声信号(音声の周波数軸信号)を得て、ノイズベース推定部35及び偏差推定部37に出力する。
ノイズ区間検出部33は、入力信号レベルが所定の判定周期間にわたって所定閾値未満であるか否かを、所定の判定周期毎に判定する。つまり、ノイズ区間検出部33は、所定の判定周期毎に、所定の判定周期間の入力信号レベルが所定閾値未満であるか、即ち入力信号としてノイズ信号又はノイズ信号及び音声信号(例えば来店客注文音HV)が含まれた信号を検出する(S12)。ノイズ区間検出部33は、入力信号としてノイズ信号を検出した場合に、検出結果(判定結果)としてのノイズフラグ(noise flag)「1」をノイズベース推定部35に出力し、入力信号としてノイズ信号及び音声信号が含まれた信号を検出した場合に、検出結果(判定結果)としてのノイズフラグ「0」をノイズベース推定部35に出力する。
ノイズベース推定部35は、FFT処理部31から出力されたフーリエ変換処理後の入力信号の振幅スペクトルX(t,f)と、ノイズ区間検出部33から出力されたノイズフラグとを用いて、ノイズベースN(t,f)の推定値を算出する(S13)。ノイズベース推定部35は、算出されたノイズベースN(t,f)の推定値を偏差推定部37及び音量調整係数算出部39に出力する。
偏差推定部37は、FFT処理部31から出力された入力信号の振幅スペクトルX(t,f)と、ノイズベース推定部35から出力されたノイズベースN(t,f)の推定値との間の偏差(ノイズ偏差)Sd(t)を、数式(12)に従って算出する(S14)。偏差推定部37は、数式(12)の算出結果であるノイズ偏差Sd(t)を音量調整係数算出部39に出力する。
音量調整係数算出部39は、ノイズベース推定部35から出力されたノイズベースN(t,f)と、偏差推定部37から出力されたノイズ偏差Sd(t)とを用いて、音量調整事前係数gpre(t)を、数式(13)に従って算出する(S15)。更に、音量調整係数算出部39は、数式(13)の算出結果である音量調整事前係数gpre(t)に応じて、入力信号に含まれる音声信号(例えば来店客注文音HV)の音量レベルを増幅するための音量調整係数g(t)を導出(算出)する(S15)。
VGA41は、音量調整係数算出部39により算出された音量調整係数g(t)に応じて、入力信号の音量レベルを増幅する(S16)。音量レベルが増幅された入力信号は、エコーキャンセル処理部17に入力される。ステップS16の後、来店客の注文が終了すると図6に示す動作手順は終了し(S17、YES)、来店客の注文が終了しない限り、ステップS11〜ステップS16の各動作が繰り返される。
以上により、本実施形態の音量調整システム100では、オーダーポスト端末10は、オーダーポスト端末10の周囲音(例えば来店客注文音HV、ノイズ音NS)をマイク11において収音し、オーダーポスト端末10の周囲音に含まれるノイズ信号N(t,f)の信号レベルをノイズベース推定部35において推定する。オーダーポスト端末10は、オーダーポスト端末10の周囲音に含まれる入力信号の振幅スペクトルX(t,f)とノイズ信号の信号レベルN(t,f)との間のノイズ偏差Sd(t)を偏差推定部37において推定し、ノイズ偏差Sd(t)を基にして、入力信号の音量レベルを調整するための音量調整係数g(t)を音量調整係数算出部39において算出する。オーダーポスト端末10は、算出された音量調整係数g(t)を用いて、音声信号の音量レベルをVGA41において増幅する。
これにより、例えば店舗駐車場に設置されたオーダーポスト端末10は、様々な種類の騒音(ノイズ)が存在する環境下においても、ノイズの種類(例えば特定の音源が無いような環境音、又は人混みの中で聞こえるノイズ)に応じて、入力音声信号とノイズ信号との間の偏差を基にして、入力信号の音量レベルを増幅させるための音量調整係数を算出することができる。従って、オーダーポスト端末10は、ノイズの種類が環境音でも人混み中のノイズでも、スピーカから拡声される音声として、例えば通話相手(例えばドライブスルーサービスを提供する店内の店員)が用いるヘッドセット50のスピーカ55から拡声(出力)される音声、又は通話相手が話してスピーカ29から拡声(出力)される音声の音量レベルを適応的に調整することができ、来店客と店員との通話時の聞き取り易さを向上させることができる。
また、本実施形態では、オーダーポスト端末10は、オーダーポスト端末10の周囲音に含まれる信号の信号レベルが所定の判定周期にわたって所定閾値未満であるか否かを、所定の判定周期毎に判定し、この判定結果に応じて、ノイズ信号の信号レベルの推定値を算出する。
これにより、オーダーポスト端末10は、マイク11により収音された周囲音にノイズ音NS以外の音(例えば来店客注文音HV)が含まれているか否かに応じて、ノイズ信号の信号レベルの推定値を算出するので、ノイズベースの推定精度を向上することができる。
なお、上述した本実施形態の音量調整システム100では、音量調整装置の一例としてのオーダーポスト端末10は、入力信号(例えば、来店客注文音HVの音声信号、又はヘッドセット50から送信された店員の音声の音声信号)と、ノイズベース推定部35により推定されたノイズベースとの間の偏差に応じて、入力信号を増幅するための音量調整係数を算出した。
また、本発明に係る音量調整装置は、上述した本実施形態の音量調整システム100におけるオーダーポスト端末10の構成、即ち音量調整装置の外部から入力された音声信号(例えば来店客注文音HV、又はヘッドセット50から送信された店員の音声)とマイクにより収音された周囲音を基にして推定されたノイズベースとの間の偏差に応じて音量調整係数を算出する構成に限定されない。例えば、図7に示すオーディオプレイヤー端末10Aに適用しても良い。図7は、音量調整装置の他の一例としてのオーディオプレイヤー端末10Aの内部構成を詳細に示すブロック図である。
図7に示すオーディオプレイヤー端末10Aは、マイク11と、AD変換部13と、エコーキャンセル処理部17と、ノイズリダクション処理部19と、音量調整部15Aと、DA変換部27と、スピーカ29と、メモリ43と、操作部45と、再生処理部47とを含む。音量調整部15Aの内部構成は図2に示す構成と同一である。図7に示すオーディオプレイヤー端末10Aでは、図1に示すオーダーポスト端末10の各部と同一の動作を行うものには同一の符号を付与して説明を省略又は簡略化し、異なる内容について説明する。
メモリ43は、例えばハードディスク又はフラッシュメモリを用いて構成され、オーディオプレイヤー端末10Aを用いるユーザの保存操作の対象となった音楽ファイルを記憶している。
操作部45は、オーディオプレイヤー端末10Aを操作するユーザの入力操作を受け付け、入力操作によって入力されたデータ又は操作信号を音量調整部15A又は再生処理部47に出力する。操作部45は、例えばオーディオプレイヤー端末10Aに対応して配置されたタッチパネルを用いて構成される。また、操作部45は、タッチパネルに限らず、マウス、キーボード、テンキー等の入力媒体を用いて構成されても良い。操作部45は、例えばユーザが音楽ファイルの再生時の音量レベルを調整するための入力操作に応じて、音量レベルを増加又は減少するための入力操作信号を音量調整部15Aに出力する。
再生処理部47は、例えばユーザの再生操作に応じて、操作部45からの再生操作信号に対応する音楽ファイルをメモリ43から読み出して音量調整部15Aに出力する。
音量調整部15Aには、操作部45から出力された入力操作信号と、ノイズリダクション処理部19から出力された抑圧処理後のノイズ信号とが入力される。音量調整部15Aは、ノイズベース推定部35において、ノイズリダクション処理部19から出力されたノイズ信号に対応するノイズベースを、上述した実施形態と同様の方法によって推定する。
音量調整部15Aは、操作部45から出力された入力操作信号に対応する音量レベルの範囲において、再生処理部47から出力された音楽ファイルの音声信号のレベルと、音量調整部15Aのノイズベース推定部35により推定されたノイズベースとの間の偏差の推定値を算出する。入力操作信号に対応する音量レベルの範囲は、例えば音量レベルが0〜10で規定されている場合、「HIGH」(例えば音量レベルが7〜10)、「MIDDLE」(例えば音量レベルが4〜6)及び「LOW」(例えば音量レベルが0〜3)のうち、いずれかである。音量調整部15Aにおける偏差の算出方法は、上述した本実施形態の音量調整部15における偏差の算出方法と同一であるため、説明を省略する。音量調整部15Aは、算出された偏差の推定値を基に、入力信号を増幅するための音量調整係数を算出する。
なお、音量調整部15Aは、操作部45から出力された入力操作信号に対応する音量レベルの範囲に拘わらず、再生処理部47から出力された音楽ファイルの音声信号のレベルと、音量調整部15Aのノイズベース推定部35により推定されたノイズベースとの間の偏差の推定値を算出しても良い。
以上により、図7に示すオーディオプレイヤー端末10Aは、オーディオプレイヤー端末10Aの周囲音(例えばノイズ音NS)をマイク11において収音し、オーディオプレイヤー端末10Aの周囲音に含まれるノイズ信号N(t,f)の信号レベルをノイズベース推定部35において推定する。オーディオプレイヤー端末10Aは、所定の出力音声信号(例えばオーディオプレイヤー端末10Aにおいて再生される音楽ファイルの音声信号)の振幅スペクトルX(t,f)とノイズ信号(例えばノイズ音NS)の信号レベルN(t,f)との偏差Sd(t)を偏差推定部37において推定し、偏差Sd(t)を基にして、出力音声信号の音量レベルを調整するための音量調整係数g(t)を音量調整係数算出部39において算出する。オーディオプレイヤー端末10Aは、算出された音量調整係数g(t)を用いて、出力音声信号の音量レベルをVGA41において増幅する。
これにより、例えばユーザが用いるオーディオプレイヤー端末10Aは、様々な種類の騒音(ノイズ)が存在する環境下においても、ノイズの種類(例えば特定の音源が無いような環境音、又は人混みの中で聞こえるノイズ)に応じて、出力音声信号(例えばオーディオプレイヤー端末10Aにおいて再生される音楽ファイルの音声信号)とノイズ信号との間の偏差を基にして、出力音声信号の音量レベルを増幅させるための音量調整係数を算出することができる。従って、オーディオプレイヤー端末10Aは、ノイズの種類が環境音でも人混み中のノイズでも、音楽ファイルの音声信号の音量レベルを適応的に調整することができ、音楽ファイルの音声をユーザにとって快適に再生することができる。
以下、上述した本発明に係る音量調整装置、音量調整方法及び音量調整システムの構成、作用及び効果を説明する。
本発明の一実施形態は、ネットワークを介して接続された相手端末と通信する音量調整装置であって、前記音量調整装置の周囲音を収音する収音部と、前記収音部により収音された前記音量調整装置の周囲音に含まれるノイズ信号の信号レベルを推定するノイズ推定部と、前記収音部により収音された前記音量調整装置の周囲音に含まれる音声信号と前記ノイズ推定部により推定された前記ノイズ信号との偏差を推定する偏差推定部と、前記偏差推定部により推定された前記偏差を基に、前記音声信号の音量レベルを調整する音量調整係数を導出する音量調整係数導出部と、前記音量調整係数導出部により導出された前記音量調整係数に応じて、前記音声信号の音量レベルを増幅する音量レベル増幅部と、を備える音量調整装置である。
上述した構成では、音量調整装置の一例としてのオーダーポスト端末10は、オーダーポスト端末10の周囲音(例えば来店客注文音HV、ノイズ音NS)をマイク11において収音し、オーダーポスト端末10の周囲音に含まれるノイズ信号N(t,f)の信号レベルをノイズベース推定部35において推定する。オーダーポスト端末10は、オーダーポスト端末10の周囲音に含まれる入力信号の振幅スペクトルX(t,f)とノイズ信号の信号レベルN(t,f)とのノイズ偏差Sd(t)を偏差推定部37において推定し、ノイズ偏差Sd(t)を基にして、入力信号の音量レベルを調整するための音量調整係数g(t)を音量調整係数算出部39において算出する。オーダーポスト端末10は、算出された音量調整係数g(t)を用いて、音声信号の音量レベルをVGA41において増幅する。
これにより、例えば店舗駐車場に設置されたオーダーポスト端末10は、様々な種類の騒音(ノイズ)が存在する環境下においても、ノイズの種類(例えば特定の音源が無いような環境音、又は人混みの中で聞こえるノイズ)に応じて、入力音声信号とノイズ信号との間の偏差を基にして、入力信号の音量レベルを増幅させるための音量調整係数を算出することができる。従って、オーダーポスト端末10は、ノイズの種類が環境音でも人混み中のノイズでも、通話相手(例えばドライブスルーサービスを提供する店内の店員)が用いるヘッドセット50との間の通話音声の音量レベルを適応的に調整することができ、来店客と店員との通話時の聞き取り易さを向上させることができる。
また、本発明の一実施形態は、前記収音部により収音された前記音量調整装置の周囲音に含まれる信号の信号レベルが所定の判定周期にわたって所定閾値未満であるか否かを、前記所定の判定周期毎に判定するノイズ区間判定部と、を更に備え、前記ノイズ推定部は、前記ノイズ区間判定部の判定結果に応じて、前記ノイズ信号の信号レベルの推定値を導出する音量調整装置である。
上述した構成では、オーダーポスト端末10は、オーダーポスト端末10の周囲音に含まれる信号の信号レベルが所定の判定周期にわたって所定閾値未満であるか否かを、所定の判定周期毎に判定し、この判定結果に応じて、ノイズ信号の信号レベルの推定値を算出する。
これにより、オーダーポスト端末10は、マイク11により収音された周囲音にノイズ音NS以外の音(例えば来店客注文音HV)が含まれているか否かに応じて、ノイズ信号の信号レベルの推定値を算出するので、ノイズベースの推定精度を向上することができる。
また、本発明の一実施形態は、前記音量レベル増幅部により増幅された前記音声信号を前記相手端末に送信する無線通信部と、を更に備える音量調整装置である。
上述した構成では、オーダーポスト端末10は、VGA41により増幅された音声信号を、相手端末(例えばドライブスルーサービスを提供する店内の店員が用いるヘッドセット50)に送信するので、VGA41により音声信号の音量レベルが増幅される前に比べて、来店客と店員との通話時の聞き取り易さを向上させることができる。
また、本発明の一実施形態は、周囲音を収音する収音部と、前記収音部により収音された前記周囲音に含まれるノイズ信号を推定するノイズ推定部と、所定の出力音声信号と前記ノイズ推定部により推定された前記ノイズ信号との偏差を推定する偏差推定部と、前記偏差推定部により推定された前記偏差を基に、前記出力音声信号の音量レベルを調整する音量調整係数を導出する音量調整係数導出部と、前記音量調整係数導出部により導出された前記音量調整係数を用いて、前記出力音声信号の音量レベルを増幅する音量レベル増幅部と、前記音量レベル増幅部により増幅された前記出力音声信号を出力する音声出力部と、を備える音量調整装置である。
上述した構成では、音量調整装置の一例としてのオーディオプレイヤー端末10Aは、オーディオプレイヤー端末10Aの周囲音(例えばノイズ音NS)をマイク11において収音し、オーディオプレイヤー端末10Aの周囲音に含まれるノイズ信号N(t,f)の信号レベルをノイズベース推定部35において推定する。オーディオプレイヤー端末10Aは、所定の出力音声信号(例えばオーディオプレイヤー端末10Aにおいて再生される音楽ファイルの音声信号)の振幅スペクトルX(t,f)とノイズ信号(例えばノイズ音NS)の信号レベルN(t,f)との偏差Sd(t)を偏差推定部37において推定し、偏差Sd(t)を基にして、出力音声信号の音量レベルを調整するための音量調整係数g(t)を音量調整係数算出部39において算出する。オーディオプレイヤー端末10Aは、算出された音量調整係数g(t)を用いて、出力音声信号の音量レベルをVGA41において増幅する。
これにより、例えばユーザが用いるオーディオプレイヤー端末10Aは、様々な種類の騒音(ノイズ)が存在する環境下においても、ノイズの種類(例えば特定の音源が無いような環境音、又は人混みの中で聞こえるノイズ)に応じて、出力音声信号(例えばオーディオプレイヤー端末10Aにおいて再生される音楽ファイルの音声信号)とノイズ信号との間の偏差を基にして、出力音声信号の音量レベルを増幅させるための音量調整係数を算出することができる。従って、オーディオプレイヤー端末10Aは、ノイズの種類が環境音でも人混み中のノイズでも、音楽ファイルの音声信号の音量レベルを適応的に調整することができ、音楽ファイルの音声をユーザにとって快適に再生することができる。
また、本発明の一実施形態は、ネットワークを介して接続された相手端末と通信する音量調整装置における音量調整方法であって、前記音量調整装置の周囲音を収音するステップと、収音された前記音量調整装置の周囲音に含まれるノイズ信号の信号レベルを推定するステップと、収音された前記音量調整装置の周囲音に含まれる音声信号と推定された前記ノイズ信号との偏差を推定するステップと、推定された前記偏差を基に、前記音声信号の音量レベルを調整する音量調整係数を導出するステップと、導出された前記音量調整係数に応じて、前記音声信号の音量レベルを増幅するステップと、を有する音量調整方法である。
上述した方法では、音量調整装置の一例としてのオーダーポスト端末10は、オーダーポスト端末10の周囲音(例えば来店客注文音HV、ノイズ音NS)をマイク11において収音し、オーダーポスト端末10の周囲音に含まれるノイズ信号N(t,f)の信号レベルをノイズベース推定部35において推定する。オーダーポスト端末10は、オーダーポスト端末10の周囲音に含まれる入力音声信号の振幅スペクトルX(t,f)とノイズ信号の信号レベルN(t,f)との偏差Sd(t)を偏差推定部37において推定し、偏差Sd(t)を基にして、入力音声信号の音量レベルを調整するための音量調整係数g(t)を音量調整係数算出部39において算出する。オーダーポスト端末10は、算出された音量調整係数g(t)を用いて、音声信号の音量レベルをVGA41において増幅する。
これにより、例えば店舗駐車場に設置されたオーダーポスト端末10は、様々な種類の騒音(ノイズ)が存在する環境下においても、ノイズの種類(例えば特定の音源が無いような環境音、又は人混みの中で聞こえるノイズ)に応じて、入力音声信号とノイズ信号との間の偏差を基にして、入力音声信号の音量レベルを増幅させるための音量調整係数を算出することができる。従って、オーダーポスト端末10は、ノイズの種類が環境音でも人混み中のノイズでも、通話相手(例えばドライブスルーサービスを提供する店内の店員)が用いるヘッドセット50との間の通話音声の音量レベルを適応的に調整することができ、来店客と店員との通話時の聞き取り易さを向上させることができる。
また、本発明の一実施形態は、ネットワークを介して接続された相手端末と、前記相手端末と通信する音量調整装置とを含む音量調整システムであって、前記音量調整装置は、前記音量調整装置の周囲音を収音する収音部と、前記収音部により収音された前記音量調整装置の周囲音に含まれるノイズ信号の信号レベルを推定するノイズ推定部と、前記収音部により収音された前記音量調整装置の周囲音に含まれる音声信号と前記ノイズ推定部により推定された前記ノイズ信号との偏差を推定する偏差推定部と、前記偏差推定部により推定された前記偏差を基に、前記音声信号の音量レベルを調整する音量調整係数を導出する音量調整係数導出部と、前記音量調整係数導出部により導出された前記音量調整係数に応じて、前記音声信号の音量レベルを増幅する音量レベル増幅部と、前記音量レベル増幅部により増幅された前記音声信号を前記相手端末に送信する無線通信部と、を備え、前記相手端末は、前記音量調整装置から送信された、前記音量レベル増幅部により増幅された前記音声信号を出力する音声出力部と、を備える音量調整システムである。
上述したシステムでは、音量調整装置の一例としてのオーダーポスト端末10は、オーダーポスト端末10の周囲音(例えば来店客注文音HV、ノイズ音NS)をマイク11において収音し、オーダーポスト端末10の周囲音に含まれるノイズ信号N(t,f)の信号レベルをノイズベース推定部35において推定する。オーダーポスト端末10は、オーダーポスト端末10の周囲音に含まれる入力音声信号の振幅スペクトルX(t,f)とノイズ信号の信号レベルN(t,f)との偏差Sd(t)を偏差推定部37において推定し、偏差Sd(t)を基にして、入力音声信号の音量レベルを調整するための音量調整係数g(t)を音量調整係数算出部39において算出する。オーダーポスト端末10は、算出された音量調整係数g(t)を用いて、音声信号の音量レベルをVGA41において増幅し、増幅された音声信号を相手端末の一例としてのヘッドセット50に送信する。更に、ヘッドセット50は、オーダーポスト端末10から送信された増幅後の音声信号を出力する。
これにより、音量調整システム100では、例えば店舗駐車場に設置されたオーダーポスト端末10は、様々な種類の騒音(ノイズ)が存在する環境下においても、ノイズの種類(例えば特定の音源が無いような環境音、又は人混みの中で聞こえるノイズ)に応じて、入力音声信号とノイズ信号との間の偏差を基にして、入力音声信号の音量レベルを増幅させるための音量調整係数を算出することができる。従って、オーダーポスト端末10は、ノイズの種類が環境音でも人混み中のノイズでも、通話相手(例えばドライブスルーサービスを提供する店内の店員)が用いるヘッドセット50との間の通話音声の音量レベルを適応的に調整することができ、来店客と店員との通話時の聞き取り易さを向上させることができる。
以上、図面を参照しながら各種の実施形態について説明したが、本発明はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
なお、本発明に係る音量調整装置、音量調整方法又は音量調整システムは、例えば集合住宅の共用玄関に設置されるインターホン子機(ヘッドセット50に対応)と住戸内に設置されるインターホン親機(オーダーポスト端末10に対応)との組み合わせに適用しても良いし、更に、例えば企業内又は家屋内において用いられる電話の子機(ヘッドセット50に対応)と親機(オーダーポスト端末10)との組み合わせに適用しても良い。