JP2013009199A

JP2013009199A - 音響制御装置、音響補正装置、及び音響補正方法

Info

Publication number: JP2013009199A
Application number: JP2011141099A
Authority: JP
Inventors: Hirokazu Takeuchi; 広和竹内; Hiroshi Yonekubo; 裕米久保
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2011-06-24
Filing date: 2011-06-24
Publication date: 2013-01-10
Anticipated expiration: 2031-06-24
Also published as: US20120328114A1; JP5085769B1; EP2538559B1; US9002021B2; EP2538559A1

Abstract

【課題】より高品質の音響を実現することができる音響制御装置、音響補正装置、及び音響補正方法を提供する。
【解決手段】一実施形態に係る音響制御装置は、オーディオ信号を補正する音響補正部を備える音響補正装置に接続される音響制御装置であって、前記オーディオ信号を受信する第１の受信部と、環境音を受信する第２の受信部と、前記オーディオ信号と、前記環境音とに基づいて、周波数帯域ごとにマスキングゲインを算出するマスキングゲイン算出部と、予め設定された閾値未満の周波数帯域の前記マスキングゲインを第１の間隔で平滑化し、前記閾値以上の周波数帯域の前記マスキングゲインを前記第１の間隔より長い第２の間隔で平滑化してゲインを設定するゲイン制御部と、前記ゲイン制御部により設定された前記ゲインを前記音響補正装置の音響補正部に出力する出力部と、を具備する。
【選択図】図２

Description

本発明の実施形態は、音響制御装置、音響補正装置、及び音響補正方法に関する。

従来、オーディオ信号に対して補正を施すことにより、高音質化を実現することができる音響補正装置が一般的に知られている。音響補正装置は、例えば、周囲の背景雑音（環境音）を検出し、検出した環境音に基づいて、音量制御及び周波数に応じたイコライジング処理などをオーディオ信号に対して行う。

特開２０１０−１５４３８８号公報

音響補正装置は、環境音が小さくなった場合、オーディオ信号を元の状態に戻す。即ち、音響補正装置は、環境音が小さくなった場合、音量を下げるようにオーディオ信号に対して補正を行う。従来の音響補正装置は、オーディオ信号の音響特性を画一的に元の状態に戻すように補正を行う。しかし、このような場合、音響補正装置は、聴感上ユーザに「こもり（高域の欠落感）」を知覚させる可能性があるという課題がある。

そこで、より高品質の音響を実現することができる音響制御装置、音響補正装置、及び音響補正方法を提供することを目的とする。

一実施形態に係る音響制御装置は、オーディオ信号を補正する音響補正部を備える音響補正装置に接続される音響制御装置であって、前記オーディオ信号を受信する第１の受信部と、環境音を受信する第２の受信部と、前記オーディオ信号と、前記環境音とに基づいて、周波数帯域ごとにマスキングゲインを算出するマスキングゲイン算出部と、予め設定された閾値未満の周波数帯域の前記マスキングゲインを第１の間隔で平滑化し、前記閾値以上の周波数帯域の前記マスキングゲインを前記第１の間隔より長い第２の間隔で平滑化してゲインを設定する第１のゲイン制御部と、前記第１のゲイン制御部により設定された前記ゲインを前記音響補正装置の音響補正部に出力する出力部と、を具備する。

図１は、一実施形態に係る放送受信装置について説明する為の図である。図２は、一実施形態に係る音響制御部について説明する為の図である。図３は、一実施形態に係る音響制御部の処理について説明する為の図である。図４は、一実施形態に係る音響制御部の処理について説明する為の図である。図５は、一実施形態に係る音響制御部の処理について説明する為の図である。図６は、一実施形態に係る音響制御部の処理について説明する為の図である。図７は、一実施形態に係る音響制御部の処理について説明する為の図である。図８は、一実施形態に係る音響制御部の処理について説明する為の図である。図９は、一実施形態に係る音響制御部の処理について説明する為の図である。

以下、図を参照しながら、一実施形態に係る音響制御装置、音響補正装置、及び音響補正方法ついて詳細に説明する。

図１は、一実施形態に係る放送受信装置１００の例を示す。
なお、本実施形態では、放送受信装置１００は、コンテンツに基づいて映像を液晶表示装置に表示させるものと仮定して説明する。

放送受信装置１００は、放送入力端子１０１、チューナ１１１、復調部１１２、信号処理部１１３、通信インターフェース１１４、音声処理部１２１、音声出力端子１２２、環境音入力端子１２４、映像処理部１３１、ＯＳＤ処理部１３２、表示処理部１３３、映像出力端子１３５、制御部１５０、操作入力部１６１、受光部１６２、カードコネクタ１６４、ＵＳＢコネクタ１６６、及びディスクドライブ１７０を備える。

放送入力端子１０１は、例えばアンテナ１１０により受信されるディジタル放送信号が入力される入力端子である。アンテナ１１０は、例えば、地上ディジタル放送信号、ＢＳ（ｂｒｏａｄｃａｓｔｉｎｇｓａｔｅｌｌｉｔｅ）ディジタル放送信号、及び／または、１１０度ＣＳ（ｃｏｍｍｕｎｉｃａｔｉｏｎｓａｔｅｌｌｉｔｅ）ディジタル放送信号を受信する。即ち、放送入力端子１０１には、放送信号により供給される番組などのコンテンツが入力される。

放送入力端子１０１は、受信したディジタル放送信号をチューナ１１１に供給する。チューナ１１１は、ディジタル放送信号用のチューナである。チューナ１１１は、アンテナ１１０から供給されるディジタル放送信号のチューニング（選局）を行う。チューナ１１１は、チューニングしたディジタル放送信号を復調部１１２に送信する。

復調部１１２は、受信するディジタル放送信号の復調を行う。復調部１１２は、復調したディジタル放送信号（コンテンツ）を信号処理部１１３に入力する。即ち、アンテナ１１０、チューナ１１１、及び復調部１１２は、コンテンツを受信する受信手段として機能する。

信号処理部１１３は、ディジタル放送信号（動画のコンテンツデータ）に対して信号処理を施す信号処理手段として機能する。信号処理部１１３は、復調部１１２から供給されるディジタル放送信号に、信号処理を施す。即ち、信号処理部１１３は、ディジタル放送信号を映像信号、音声信号、及びその他のデータ信号に分離する。信号処理部１１３は、音声処理部１２１に音声信号を供給する。また、信号処理部１１３は、映像処理部１３１に映像信号を供給する。さらに、信号処理部１１３は、制御部１５０、及び／またはＯＳＤ処理部１３２にデータ信号を供給する。

通信インターフェース１１４は、例えばＨＤＭＩ（High Definition Multimedia Interface）（登録商標）端子などの、コンテンツを受信可能なインターフェースを備える。通信インターフェース１１４は、ディジタル映像信号、及びディジタル音声信号などが多重化されたコンテンツを他の機器から受信する。通信インターフェース１１４は、他の機器から受信したディジタル信号（コンテンツ）を信号処理部１１３に供給する。即ち、通信インターフェース１１４は、コンテンツを受信する受信手段として機能する。

信号処理部１１３は、通信インターフェース１１４から受信するディジタル信号に信号処理を施す。例えば、信号処理部１１３は、ディジタル信号をディジタル映像信号とディジタル音声信号とデータ信号とに分離する。信号処理部１１３は、音声処理部１２１にディジタル音声信号を供給する。また、信号処理部１１３は、映像処理部１３１にディジタル映像信号を供給する。さらに、信号処理部１１３は、制御部１５０、及び／またはＯＳＤ処理部１３２にデータ信号を供給する。

なお、信号処理部１１３は、通信インターフェース１１４に入力されるコンテンツと、放送入力端子１０１に入力されるコンテンツとのいずれかを選択し、処理を行う。即ち、信号処理部１１３は、ディジタル放送信号とディジタル信号のいずれかに対して信号の分離処理を行う。

音声処理部１２１は、信号処理部１１３から受信したディジタル音声信号を、スピーカ３００により再生可能なフォーマットの信号（オーディオ信号）に変換する。音声処理部１２１は、オーディオ信号を音声出力端子１２２に出力する。音声出力端子１２２は、供給されるオーディオ信号を装置外部に出力する。これにより、音声出力端子１２２に接続されるスピーカ３００は、供給されるオーディオ信号に基づいて音を再生する。

なお、オーディオ信号は、コンテンツにより種々の種類の音を含む。例えば、テレビ番組などのオーディオ信号は、人が発した声（音声）、音楽（音楽）、及び種々の雑音（背景雑音）などに基づく信号を含む。この場合の雑音は、例えば拍手、歓声、及び他の種々の音を含む。

環境音入力端子１２４は、例えばマイク５００などの音を検出する装置が接続される端子である。マイク５００は、例えば放送受信装置１００の近傍に設置され、放送受信装置１００の周囲の音（背景雑音）を検出し、信号に変換する。マイク５００は、この信号を環境音入力端子１２４に供給する。環境音入力端子１２４は、マイク５００から供給された信号を環境音として音声処理部１２１に供給する。

映像処理部１３１は、信号処理部１１３から受信した映像信号を、ディスプレイ４００で再生可能なフォーマットの映像信号に変換する。即ち、映像処理部１３１は、信号処理部１１３から受信した映像信号を、ディスプレイ４００で再生可能なフォーマットの映像信号にデコード（再生）する。また、映像処理部１３１は、ＯＳＤ処理部１３２から供給されるＯＳＤ信号を映像信号に重畳する。映像処理部１３１は、映像信号を表示処理部１３３に出力する。

ＯＳＤ処理部１３２は、信号処理部１１３から供給されるデータ信号、及び／または制御部１５０から供給される制御信号に基づいて、ＧＵＩ（グラフィックユーザインタフェース）画面、字幕、時刻、または他の情報などを画面に重畳して表示する為のＯＳＤ信号を生成する。

表示処理部１３３は、例えば、制御部１５０からの制御に基づいて、受信した映像信号に対して色味、明るさ、シャープ、コントラスト、またはその他の画質調整処理を行う。表示処理部１３３は、画質調整を施した映像信号を映像出力端子１３５に出力する。これにより、映像出力端子１３５に接続されるディスプレイ４００は、供給される映像信号に基づいて映像を表示する。

ディスプレイ４００は、例えば、マトリクス状に配列された複数の画素を備える液晶表示パネルと、この液晶パネルを照明するバックライトとを備える液晶表示装置などを備える。ディスプレイ４００は、放送受信装置１００から供給される映像信号に基づいて映像を表示する。

なお、放送受信装置１００は、映像出力端子１３５の代わりに、ディスプレイ４００を装置内部に備える構成であってもよい。また、放送受信装置１００は、音声出力端子１２２の代わりに、スピーカ３００を装置内部に備える構成であってもよい。

制御部１５０は、放送受信装置１００の各部の動作を制御する制御手段として機能する。制御部１５０は、ＣＰＵ１５１、ＲＯＭ１５２、ＲＡＭ１５３、及びＥＥＰＲＯＭ１５４などを備えている。制御部１５０は、操作入力部１６１から供給される操作信号に基づいて、種々の処理を行う。

ＣＰＵ１５１は、種々の演算処理を実行する演算素子などを備える。ＣＰＵ１５１は、ＲＯＭ１５２、またはＥＥＰＲＯＭ１５４などに記憶されているプログラムを実行することにより種々の機能を実現する。

ＲＯＭ１５２は、放送受信装置１００を制御する為のプログラム、及び各種の機能を実現する為のプログラムなどを記憶する。ＣＰＵ１５１は、操作入力部１６１から供給される操作信号に基づいて、ＲＯＭ１５２に記憶されているプログラムを起動する。これにより、制御部１５０は、各部の動作を制御する。

ＲＡＭ１５３は、ＣＰＵ１５１のワークメモリとして機能する。即ち、ＲＡＭ１５３は、ＣＰＵ１５１の演算結果、ＣＰＵ１５１により読み込まれたデータなどを記憶する。

ＥＥＰＲＯＭ１５４は、各種の設定情報、及びプログラムなどを記憶する不揮発性メモリである。

操作入力部１６１は、例えば、操作キー、キーボード、マウス、タッチパッドまたは操作入力に応じて操作信号を生成する事ができる他の入力装置などを備える入力手段である。例えば、操作入力部１６１は、操作入力に応じて操作信号を生成する。操作入力部１６１は、生成した操作信号を制御部１５０に供給する。

なお、タッチパッドは、静電センサ、サーモセンサ、または他の方式に基づいて位置情報を生成するデバイスを含む。また、放送受信装置１００がディスプレイ４００を備える場合、操作入力部１６１は、ディスプレイ４００と一体に形成されるタッチパネルなどを備える構成であってもよい。

受光部１６２は、例えば、リモートコントローラ１６３からの操作信号を受信するセンサなどを備える。受光部１６２は、受信した操作信号を制御部１５０に供給する。リモートコントローラ１６３は、ユーザの操作入力に基づいて操作信号を生成する。リモートコントローラ１６３は、生成した操作信号を赤外線通信により受光部１６２に送信する。なお、受光部１６２及びリモートコントローラ１６３は、電波などの他の無線通信により操作信号の送受信を行う構成であってもよい。

カードコネクタ１６４は、例えば、動画コンテンツを記憶するメモリカード１６５と通信を行う為のインターフェースである。カードコネクタ１６４は、接続されるメモリカード１６５から動画のコンテンツデータを読み出し、制御部１５０に供給する。

ＵＳＢコネクタ１６６は、ＵＳＢ機器１６７と通信を行う為のインターフェースである。ＵＳＢコネクタ１６６は、接続されるＵＳＢ機器１６７から供給される信号を制御部１５０に供給する。

例えば、ＵＳＢ機器１６７がキーボードなどの操作入力機器である場合、ＵＳＢコネクタ１６６は、操作信号をＵＳＢ機器１６７から受け取る。ＵＳＢコネクタ１６６は、受け取った操作信号を制御部１５０に供給する。この場合、制御部１５０は、ＵＳＢコネクタ１６６から供給される操作信号に基づいて種々の処理を実行する。

また、例えば、ＵＳＢ機器１６７が動画のコンテンツデータを記憶する記憶装置である場合、ＵＳＢコネクタ１６６は、コンテンツをＵＳＢ機器１６７から取得することができる。ＵＳＢコネクタ１６６は、取得したコンテンツを制御部１５０に供給する。

ディスクドライブ１７０は、例えば、コンパクトディスク（ＣＤ）、ディジタルバーサタイルディスク（ＤＶＤ）、ブルーレイディスク（Ｂｌｕ−ｒａｙＤｉｓｋ（登録商標））、または動画のコンテンツデータを記録可能な他の光ディスクＭを装着可能なドライブを有する。ディスクドライブ１７０は、装着される光ディスクＭからコンテンツを読み出し、読み出したコンテンツを制御部１５０に供給する。

また、放送受信装置１００は、図示しない電源部を備える。電源部は、放送受信装置１００の各部に電力を供給する。電源部は、例えば、ＡＣアダプタなどを介して供給される電力を変換し各部へ供給する。また、電源部は、バッテリーを備えていても良い。この場合、電源部は、ＡＣアダプタなどを介して供給される電力をバッテリーに充電する。電源部は、バッテリーに充電されている電力を放送受信装置１００の各部に供給する。

また、放送受信装置１００は、さらに他のインターフェースを備えていても良い。インターフェースは、例えば、Ｓｅｒｉａｌ−ＡＴＡ、ＬＡＮポートなどである。放送受信装置１００は、インターフェースにより接続される機器に記録されているコンテンツを取得し、再生することができる。また、放送受信装置１００は、再生したオーディオ信号及び映像信号を、インターフェースにより接続される機器に出力することが出来る。

また、放送受信装置１００がインターフェースを介してネットワークに接続される場合、放送受信装置１００は、ネットワーク上の動画のコンテンツデータを取得し、再生することができる。

またさらに、放送受信装置１００は、ハードディスク（ＨＤＤ）、ソリッドステイトディスク（ＳＳＤ）、または半導体メモリなどの記憶装置を備えていても良い。この記憶装置が動画のコンテンツデータを記憶する場合、放送受信装置１００は、この記憶装置に記憶されているコンテンツを読み出し、再生することが出来る。また、放送受信装置１００は、この記憶装置に例えば放送信号、またはネットワークなどにより供給されるコンテンツを記憶することができる。

また、音声処理部１２１は、音響制御部２００を備える。音響制御部２００は、音声処理部１２１により再生されたオーディオ信号に対して補正を施す。これにより、音響制御部２００は、ユーザにとってより聞き取りやすい音がスピーカ３００から再生されるようにオーディオ信号を制御する。例えば、音響制御部２００は、環境音入力端子１２４から供給された環境音と再生オーディオ信号に基づいて、周波数毎に再生オーディオ信号を補正することができる。

図２は、図１に示す音響制御部２００の例を示す。
図２に示すように、音響制御部２００は、入力端子２１０、イコライザ２２０、出力端子２３０、特徴パラメータ算出部２４０、スコア算出部２５０、マスキングレベル算出部２６０、マスキングゲイン算出部２７０、及びゲイン制御部２８０を備える。

音響制御部２００は、放送受信装置１００がオーディオ信号を再生する際にマイク５００により検出された環境音の特性と、オーディオ信号の音種別とに基づいて、ユーザにとってより聞き取りやすくオーディオ信号を補正する。なお、環境音は、エコーキャンセラ等によりスピーカ３００から出力された音の回り込みを抑制した信号である。

入力端子２１０は、音声処理部１２１により再生されたオーディオ信号を受信する受信手段である。入力端子２１０は、受信したオーディオ信号をイコライザ２２０、特徴パラメータ算出部２４０、及びマスキングゲイン算出部２７０に供給する。

イコライザ２２０は、ゲイン制御部２８０により指示されたゲイン特性に従ってオーディオ信号を補正する。イコライザ２２０は、補正されたオーディオ信号（補正オーディオ信号）を出力端子２３０に送信する。また、本イコライザ処理は周波数全帯域に渡るゲイン制御に相当する音量制御を含む。

出力端子２３０は、イコライザ２２０により補正された補正オーディオ信号を出力する、出力端子２３０に音声出力端子１２２が接続されている場合、出力端子２３０は、音声出力端子１２２を経由した放送受信装置１００の外部に補正オーディオ信号を出力する。この結果、音声出力端子１２２に接続されるスピーカ３００は、補正オーディオ信号に基づいて音を再生する。

特徴パラメータ算出部２４０は、オーディオ信号に基づいて各種の特徴パラメータを算出する。この場合、図３に示されるように、特徴パラメータ算出部２４０は、数１００ｍｓｅｃを１単位とする複数のフレームにオーディオ信号を分割する。さらに、特徴パラメータ算出部２４０は、数１０ｍｓｅｃを１単位とする複数のサブフレームに上記のフレームを分割する。

特徴パラメータ算出部２４０は、サブフレーム単位で、各種の特徴パラメータを算出する。この為に、特徴パラメータ算出部２４０は、サブフレーム単位で各種の特徴パラメータを生成するための判別情報を取得する。特徴パラメータ算出部２４０は、取得した判別情報のフレーム単位での統計量を算出することにより、特徴パラメータを算出する。

即ち、特徴パラメータ算出部２４０は、オーディオ信号から、サブフレーム単位で、音声信号と音楽信号とを判別するための判別情報を取得する。また、特徴パラメータ算出部２４０は、オーディオ信号から、サブフレーム単位で、音楽信号と雑音とを判別するための判別情報を取得する。また、特徴パラメータ算出部２４０は、オーディオ信号から、サブフレーム単位で、音声及び音楽の信号とノイズ信号とを判別するための各種の判別情報を取得する。

例えば、特徴パラメータ算出部２４０は、取得した各種の判別情報に基づいて、フレーム単位での統計量（例えば平均、分散、最大、最小等）を算出する。これにより、特徴パラメータ算出部２４０は、種々の特徴パラメータを算出する。

例えば、特徴パラメータ算出部２４０は、判別情報に基づいて、音声信号と音楽信号とを判別するための各種の特徴パラメータを算出する。また、特徴パラメータ算出部２４０は、判別情報に基づいて、音楽信号と雑音とを判別するための各種の特徴パラメータを算出する。また、特徴パラメータ算出部２４０は、判別情報に基づいて、音声及び音楽の信号とノイズ信号とを判別するための各種の特徴パラメータ等を算出する。

例えば、特徴パラメータ算出部２４０は、サブフレーム単位でオーディオ信号の信号振幅の二乗和（パワー値）を判別情報として算出する。特徴パラメータ算出部２４０は、算出されたパワー値に基づいてフレーム単位で統計量を算出することにより、パワー値に関する特徴パラメータｐｗを生成する。

また、特徴パラメータ算出部２４０は、サブフレーム単位でオーディオ信号の零交差周波数を判別情報として算出する。零交差周波数は、例えば、横軸を時間とし、縦軸を振幅とした場合にオーディオ信号が振幅方向の零と交差する回数である。特徴パラメータ算出部２４０は、算出された零交差周波数に基づいてフレーム単位で統計量を算出することにより、零交差周波数に関する特徴パラメータｚｃを生成する。

さらに、特徴パラメータ算出部２４０は、サブフレーム単位でオーディオ信号の周波数領域でのスペクトル変動を判別情報として算出する。特徴パラメータ算出部２４０は、算出されたスペクトル変動に基づいてフレーム単位で統計量を算出することにより、スペクトル変動に関する特徴パラメータｓｆを生成する。

また、特徴パラメータ算出部２４０は、サブフレーム単位でオーディオ信号における２チャンネルステレオの左右（ＬＲ）信号のパワー比（ＬＲパワー比）を判別情報として算出する。特徴パラメータ算出部２４０は、算出されたＬＲパワー比に基づいてフレーム単位で統計量を算出することにより、ＬＲパワー比に関する特徴パラメータｌｒを生成する。

さらに、特徴パラメータ算出部２４０は、サブフレーム単位でオーディオ信号のスペクトル平坦度を判別情報として算出する。特徴パラメータ算出部２４０は、算出されたスペクトル平坦度に基づいてフレーム単位で統計量を算出することにより、ノイズ信号に関する特徴パラメータＳＦＭを生成する。

パワー値に関する特徴パラメータｐｗは、サブフレーム間での信号パワーの違いを示す。例えば、特徴パラメータｐｗは、サブフレーム間のパワー値の分散を示す。オーディオ信号の主成分が音声である場合、サブフレーム間での信号パワーの違いが大きくなる傾向がある。即ち、オーディオ信号の主成分が音声である場合、特徴パラメータｐｗの値が大きくなる。

零交差周波数に関する特徴パラメータｚｃは、上記したように、横軸を時間とし、縦軸を振幅とした場合にオーディオ信号が振幅方向の零と交差する回数の変動を示す。音声信号では、零交差周波数が子音では高く母音では低くなる。即ち、オーディオ信号の主成分が音声である場合、零交差周波数に関する特徴パラメータｚｃの値のサブフレーム間の分散が大きくなる傾向がある。

スペクトル変動に関する特徴パラメータｓｆは、上記したように、サブフレーム単位でオーディオ信号の周波数領域でのスペクトル変動を示す。音声信号は、音楽信号に比べて周波数特性の変動が激しい。この為、オーディオ信号の主成分が音声である場合、スペクトル変動に関する特徴パラメータｓｆの分散が大きくなる傾向がある。

ＬＲパワー比に関する特徴パラメータｌｒは、上記したように、サブフレーム単位でオーディオ信号における２チャンネルステレオの左右（ＬＲ）信号のパワー比（ＬＲパワー比）を示す。音楽信号は、ボーカル以外の楽器演奏がセンター以外に定位していることが多い。この為、オーディオ信号の主成分が音楽である場合、左右のチャンネル間のパワー比が大きくなる傾向がある。

ノイズ信号に関する特徴パラメータＳＦＭは、上記したように、サブフレーム単位でオーディオ信号のスペクトル平坦度に基づくパラメータである。ノイズ信号は、平坦なスペクトルが形成される傾向がある。この為、オーディオ信号の主成分がノイズである場合、サブフレーム間でオーディオ信号の分散が小さくなる傾向がある。

特徴パラメータ算出部２４０は、生成した各種の特徴パラメータをスコア算出部２５０に供給する。

スコア算出部２５０は、特徴パラメータ算出部２４０から供給された各種の特徴パラメータに基づいて、オーディオ信号が音声に近いか音楽に近いかを示す音声・音楽識別スコアＳ１を算出する。また、スコア算出部２５０は、特徴パラメータ算出部２４０から供給された各種の特徴パラメータに基づいて、オーディオ信号が音楽に近いか背景雑音に近いかを示す音楽・背景音識別スコアＳ２を算出する。

また、スコア算出部２５０は、音声スコア算出部２５１、音楽スコア算出部２５２、及びノイズスコア算出部２５３を備える。スコア算出部２５０は、音声スコア算出部２５１、音楽スコア算出部２５２、及びノイズスコア算出部２５３により、音声スコアＳＳ、音楽スコアＳＭ、及びノイズスコアＳＮを算出する。スコア算出部２５０は、音声・音楽識別スコアＳ１及び音楽・背景音識別スコアＳ２に基づいて音声スコアＳＳ、音楽スコアＳＭ、及びノイズスコアＳＮを算出する。スコア算出部２５０は、算出した音声スコアＳＳ、音楽スコアＳＭ、及びノイズスコアＳＮをゲイン制御部２８０に供給する。

マスキングレベル算出部２６０は、環境音入力端子１２４により受信した環境音に基づいて、マスキングレベルを算出する。マスキングレベル算出部２６０は、算出したマスキングレベルをマスキングゲイン算出部２７０に供給する。

マスキングゲイン算出部２７０は、マスキングレベル算出部２６０から供給されたマスキングレベルと、オーディオ信号とに基づいて、周波数毎にマスキングゲインＧｍ［ｋ］を算出する。マスキングゲイン算出部２７０は、算出したマスキングゲインＧｍ［ｋ］をゲイン制御部２８０に供給する。

ゲイン制御部２８０は、スコア算出部２５０から供給された音声スコアＳＳ、音楽スコアＳＭ、及びノイズスコアＳＮ、並びに、マスキングゲイン算出部２７０から供給されたマスキングゲインＧｍ［ｋ］に基づいて、周波数毎にゲインＧ［ｋ］を決定する。ゲイン制御部２８０は、ゲインＧ［ｋ］をイコライザ２２０に供給する。

イコライザ２２０は、上記したように、ゲイン制御部２８０から供給されたゲインＧ［ｋ］に基づいてオーディオ信号を補正する。

次に、スコア算出部２５０の動作について詳細に説明する。
例えば、スコア算出部２５０は、線形識別関数を用いて音声・音楽識別スコアＳ１及び音楽・背景音識別スコアＳ２を算出する。しかし、スコア算出部２５０は、線形識別関数に限らず、如何なる方法を用いてもよい。

スコア算出部２５０は、音声・音楽識別スコアＳ１及び音楽・背景音識別スコアＳ２の算出に必要な各種特徴パラメータに乗ずる重み係数Ａ及びＢを予め記憶する。重み係数は、音種別の判別に効果の高い特徴パラメータほど大きい値が与えられる。即ち、重み係数Ａ及びＢは、スコアの算出に用いられる特徴パラメータ毎に予め記憶される。

スコア算出部２５０は、特徴パラメータ算出部２４０により算出された各種の特徴パラメータのうち、音声・音楽識別スコアＳ１の算出に用いる複数の特徴パラメータ（特徴パラメータセット）を選択する。この特徴パラメータセットは、例えばベクトルｘで表される。

特徴パラメータセットｘがｎ個の特徴パラメータを有する場合、音声・音楽識別スコアＳ１は、Ｓ１＝Ａ_０＋Ａ_１・ｘ_１＋Ａ_２・ｘ_２＋……＋Ａ_ｎ・ｘ_ｎにより算出される。

また、スコア算出部２５０は、特徴パラメータ算出部２４０により算出された各種の特徴パラメータのうち、音楽・背景音識別スコアＳ２の算出に用いる複数の特徴パラメータ（特徴パラメータセット）を選択する。この特徴パラメータセットは、例えばベクトルｙで表される。

特徴パラメータセットｙがｍ個の特徴パラメータを有する場合、音楽・背景音識別スコアＳ２は、Ｓ２＝Ｂ_０＋Ｂ_１・ｙ_１＋Ｂ_２・ｙ_２＋……＋Ｂ_ｍ・ｙ_ｍにより算出される。

なお、係数Ａは、オーディオ信号の主成分が音楽である場合、音声・音楽識別スコアＳ１と１．０との差が最小になり、且つ、オーディオ信号の主成分が音声である場合、音声・音楽識別スコアＳ１と−１．０との差が最小になるように設定される。

また、重み係数Ｂは、オーディオ信号の主成分が音楽である場合、音楽・背景音識別スコアＳ２と１．０との差が最小になり、且つ、オーディオ信号の主成分が背景音である場合、音楽・背景音識別スコアＳ２と−１．０との差が最小になるように設定される。

図４乃至図６は、音響制御部２００の処理の例を示す。
スコア算出部２５０は、特徴パラメータ算出部２４０から供給された各種の特徴パラメータに基づいて、音声・音楽識別スコアＳ１及び音楽・背景音識別スコアＳ２を算出する（ステップＳ１１）。

スコア算出部２５０は、音声・音楽識別スコアＳ１が負数であるか否か判定する（ステップＳ１２）。ステップＳ１２で音声・音楽識別スコアＳ１が負数であると判定した場合、スコア算出部２５０は、音楽・背景音識別スコアＳ２が正数であるか否か判定する（ステップＳ１３）。

ステップＳ１３で音楽・背景音識別スコアＳ２が正数であると判定した場合、スコア算出部２５０の音声スコア算出部２５１は、音声スコアＳＳを音声・音楽識別スコアＳ１の絶対値に設定する（ステップＳ１４）。さらに、スコア算出部２５０の音楽スコア算出部２５２は、音楽スコアＳＭを「０」に設定する（ステップＳ１５）。

また、ステップＳ１３で音楽・背景音識別スコアＳ２が正数ではないと判定した場合、スコア算出部２５０の音声スコア算出部２５１は、音声スコアＳＳをＳＳ＝｜Ｓ１｜＋αｓ・｜Ｓ２｜に設定する（ステップＳ１６）。即ち、音声スコア算出部２５１は、オーディオ信号に含まれる背景雑音に含まれる音声成分を考慮する為に、音楽・背景音識別スコアＳ２の絶対値を予め設定された係数αｓで補正した値を音声・音楽識別スコアＳ１の絶対値に加算する。さらに、スコア算出部２５０の音楽スコア算出部２５２は、音楽スコアＳＭを「０」に設定する（ステップＳ１７）。

スコア算出部２５０は、ステップＳ１４乃至ステップＳ１７で算出された音声スコアＳＳ及び音楽スコアＳＭを安定化させる為の補正値（安定化補正値）ＳＳ３及びＳＭ３を更新する（ステップＳ１８）。例えば、スコア算出部２５０は、連続してＣｓ回以上、音声スコアＳＳが正数（ＳＳ＞０）であった場合、安定化補正値ＳＳ３及び安定化補正値ＳＭ３を更新する。

この場合、スコア算出部２５０は、既に算出されている安定化補正値ＳＳ３に、予め設定された所定の安定化係数βｓを加算した値（ＳＳ３＋βｓ）を、新たな安定化補正値ＳＳ３として更新する。また、スコア算出部２５０は、既に算出されている安定化補正値ＳＭ３から、予め設定された所定の安定化係数γｍを減算した値（ＳＭ３−γｍ）を、新たな安定化補正値ＳＭ３として更新する。

また、ステップＳ１２で音声・音楽識別スコアＳ１が負数ではないと判定した場合、スコア算出部２５０は、図５のステップＳ２１に移行する。スコア算出部２５０は、音楽・背景音識別スコアＳ２が正数であるか否か判定する（ステップＳ２１）。

ステップＳ２１で音楽・背景音識別スコアＳ２が正数であると判定した場合、スコア算出部２５０の音声スコア算出部２５１は、音声スコアＳＳを「０」に設定する（ステップＳ２２）。さらに、スコア算出部２５０の音楽スコア算出部２５２は、音楽スコアＳＭを音声・音楽識別スコアＳ１に設定する（ステップＳ２３）。

また、ステップＳ２１で音楽・背景音識別スコアＳ２が正数ではないと判定した場合、スコア算出部２５０の音声スコア算出部２５１は、音声スコアＳＳをＳＳ＝−Ｓ１＋αｓ・｜Ｓ２｜に設定する（ステップＳ２４）。即ち、音声スコア算出部２５１は、オーディオ信号に含まれる背景雑音に含まれる音声成分を考慮する為に、音楽・背景音識別スコアＳ２の絶対値を予め設定された係数αｓで補正した値を音声・音楽識別スコアＳ１の負数（−Ｓ１）に加算する。

さらに、スコア算出部２５０の音楽スコア算出部２５２は、音楽スコアＳＭをＳＭ＝Ｓ１−αｎ・｜Ｓ２｜に設定する（ステップＳ２５）。即ち、音楽スコア算出部２５２は、オーディオ信号に含まれる背景雑音に含まれる音楽成分を考慮する為に、音楽・背景音識別スコアＳ２の絶対値を予め設定された係数αｍで補正した値を音声・音楽識別スコアＳ１から減算する。

スコア算出部２５０は、ステップＳ２２乃至ステップＳ２５で算出された音声スコアＳＳ及び音楽スコアＳＭを安定化させる為の補正値（安定化補正値）ＳＳ３及びＳＭ３を更新する（ステップＳ２６）。例えば、スコア算出部２５０は、連続してＣｍ回以上、音楽スコアＳＭが正数（ＳＭ＞０）であった場合、安定化補正値ＳＳ３及び安定化補正値ＳＭ３を更新する。

この場合、スコア算出部２５０は、既に算出されている安定化補正値ＳＳ３から、予め設定された所定の安定化係数γｓを減算した値（ＳＳ３−γｓ）を、新たな安定化補正値ＳＳ３として更新する。また、スコア算出部２５０は、既に算出されている安定化補正値ＳＭ３に、予め設定された所定の安定化係数βｍを加算した値（ＳＭ３＋βｍ）を、新たな安定化補正値ＳＭ３として更新する。

さらに、スコア算出部２５０は、図４のステップＳ１８と、図５のステップＳ２６で更新された安定化補正値ＳＳ３及び安定化補正値ＳＭ３をクリッピングする（ステップＳ１９）。これにより、スコア算出部２５０は、安定化補正値ＳＳ３及び安定化補正値ＳＭ３が所定の範囲内の値になるように制御する。例えば、スコア算出部２５０は、安定化補正値ＳＳ３がＳＳ３ｍｉｎ≦ＳＳ３≦ＳＳ３ｍａｘの値になるように制御する。また、例えば、スコア算出部２５０は、安定化補正値ＳＭ３がＳＭ３ｍｉｎ≦ＳＭ３≦ＳＭ３ｍａｘの値になるように制御する。

さらに、スコア算出部２５０は、図６のステップＳ３１に移行する。スコア算出部２５０は、ステップＳ２６でクリッピングされた安定化補正値ＳＳ３及び安定化補正値ＳＭ３に基づいて、音声スコアＳＳ及び音楽スコアＳＭを安定化させる（ステップＳ３１）。例えば、スコア算出部２５０は、既に算出された音声スコアＳＳに安定化補正値ＳＳ３を加算する。また、スコア算出部２５０は、既に算出された音楽スコアＳＭに安定化補正値ＳＭ３を加算する。

スコア算出部２５０は、ノイズ・非ノイズ識別スコアＳ３を算出する（ステップＳ３２）。例えば、スコア算出部２５０は、特徴パラメータＳＦＭの統計量を算出することにより、ノイズ・非ノイズ識別スコアＳ３を生成する。この場合、スコア算出部２５０は、複数の周波数帯域（低域、中域、高域）毎のスペクトル平坦度に基づいてノイズ・非ノイズ識別スコアＳ３を算出する。

スコア算出部２５０は、ノイズ・非ノイズ識別スコアＳ３が正数であるか否か判定する（ステップＳ３３）。ステップＳ３３でノイズ・非ノイズ識別スコアＳ３が正数であると判定した場合、スコア算出部２５０のノイズスコア算出部２５３は、ノイズスコアＳＮをノイズ・非ノイズ識別スコアＳ３に設定する（ステップＳ３４）。

また、ステップＳ３３でノイズ・非ノイズ識別スコアＳ３が正数ではないと判定した場合、スコア算出部２５０のノイズスコア算出部２５３は、ノイズスコアＳＮを「０」に設定する（ステップＳ３５）。

さらに、スコア算出部２５０は、ステップＳ３６で設定されたノイズスコアＳＮに対して安定化補正処理及びクリッピングを行う（ステップＳ３６）。

スコア算出部２５０は、スコア間調整補正を行う（ステップＳ３７）。即ち、スコア算出部２５０は、音声スコアＳＳ、音楽スコアＳＭ、及びノイズスコアＳＮの間のバランスを調整する。例えば、スコア算出部２５０は、音楽スコアＳＭ及びノイズスコアＳＮが予め設定された値より大きい場合、音楽スコアＳＭをノイズスコアＳＮに応じて低くするように補正する。

スコア算出部２５０は、上記の方法により算出された音声スコアＳＳ、音楽スコアＳＭ、及びノイズスコアＳＮをゲイン制御部２８０に供給する。

次に、マスキングレベル算出部２６０及びマスキングゲイン算出部２７０の動作について詳細に説明する。
マスキングレベル算出部２６０は、環境音入力端子１２４により受信した環境音と、聴覚特性として一般的に定められる周波数マスキング特性とに基づいて、ノイズマスキングレベルを算出する。周波数マスキング特性は、人間の聴覚特性として、ある音に対して周波数領域上でその周波数成分周辺（高域側と低域側の両方）の音が聞こえなくなくなる信号レベルを数値化したものである。例えば、マスキングレベル算出部２６０は、環境音の信号を時間周波数変換し、環境音の周波数特性を算出する。マスキングレベル算出部２６０は、環境音の個々の周波数成分に対して上記のマスキング特性を重ね合わせることにより環境音全体のマスキングレベルを算出する。マスキングレベル算出部２６０は、算出したマスキングレベルをマスキングゲイン算出部２７０に供給する。

マスキングゲイン算出部２７０は、マスキングレベル算出部２６０から供給されたマスキングレベルと、オーディオ信号とに基づいて、周波数毎にマスキングゲインＧｍ［ｋ］を算出する。これにより、マスキングゲイン算出部２７０は、オーディオ信号が環境音に埋もれないようにオーディオ信号をゲイン補正する為のマスキングゲインＧｍ［ｋ］を算出する。

例えば、マスキングゲイン算出部２７０は、算出したマスキングゲインＧｍ［ｋ］をゲイン制御部２８０に供給する。マスキングゲイン算出部２７０は、図７により示されるように、オーディオ信号の周波数特性（パワー）と、マスキングレベルとを重ねる。マスキングゲイン算出部２７０は、オーディオ信号の周波数特性をマスキングレベル以上の値に補正する為のゲイン（マスキングゲインＧｍ［ｋ］）を周波数帯域毎に算出する。マスキングゲイン算出部２７０は、算出したマスキングゲインＧｍ［ｋ］をゲイン制御部２８０に供給する。

なお、ｋは、周波数帯域を示すインデックスである。また、マスキングゲイン算出部２７０は、過大なゲイン、及び時系列での急激なゲインの変化を防ぐ為に、クリッピング処理、または時間平滑化処理を必要に応じて行う構成であってもよい。

次に、ゲイン制御部２８０の動作について詳細に説明する。
図８は、ゲイン制御部２８０の動作の例を示す。
ゲイン制御部２８０は、スコア算出部２５０から供給された音声スコアＳＳ、音楽スコアＳＭ、及びノイズスコアＳＮを受信する。また、ゲイン制御部２８０は、マスキングゲイン算出部２７０から供給されたマスキングゲインＧｍ［ｋ］を受信する。上記したように、マスキングゲインＧｍ［ｋ］は、周波数帯域ｋを補正する為のゲインである。なお、ある時刻（フレーム）ｔのデータに基づいてマスキングゲイン算出部２７０により生成されたマスキングゲインをＧｍ［ｔ］［ｋ］と記載する。

マスキングゲイン算出部２７０は、上記のフレーム毎にマスキングゲインＧｍ［ｔ］［ｋ］を算出する。マスキングゲイン算出部２７０は、算出したマスキングゲインＧｍ［ｔ］［ｋ］を逐次ゲイン制御部２８０に供給する。

また、ゲイン制御部２８０は、逐次マスキングゲイン算出部２７０から供給されたマスキングゲインＧｍ［ｔ］［ｋ］を記憶するメモリ（ゲインメモリ）を備える。ゲイン制御部２８０は、このゲインメモリに記憶されているマスキングゲインＧｍ［ｔ］［ｋ］に基づいて、ゲインＧ［ｋ］を時系列で平滑化する。

ゲイン制御部２８０には、平滑化に用いられる基準時間間隔（またはフレーム数）Ｎｓｔが予め設定されている。なお、基準時間間隔を単に基準間隔と称する。ゲイン制御部２８０は、マスキングゲインＧｍ［ｔ］［ｋ］を上記の基準間隔で平滑化し、基準ゲインＧｓｔ［ｔ］［ｋ］を算出する（ステップＳ４１）。ゲイン制御部２８０は、例えば、次の数式１により基準ゲインＧｓｔ［ｔ］［ｋ］を算出する。

ゲイン制御部２８０は、算出した基準ゲインＧｓｔ［ｔ］［ｋ］をゲインＧ［ｋ］として設定する（ステップＳ４２）。

さらに、ゲイン制御部２８０は、高域のゲインに対して補正を行う。ゲイン制御部２８０には、周波数が低域であるか高域であるかを判別する為の閾値Ｋｈｉｇｈを予め記憶するメモリを備える。ゲイン制御部２８０は、周波数帯域ｋが閾値Ｋｈｉｇｈより大きいか否か判定する（ステップＳ４３）。周波数帯域ｋが閾値Ｋｈｉｇｈより大きい場合、ゲイン制御部２８０は、高域のゲインを補正する処理（高域ゲイン補正）を行う。

即ち、周波数帯域ｋが閾値Ｋｈｉｇｈより大きい場合、ゲイン制御部２８０は、基準間隔Ｎｓｔより長い時間間隔Ｎｈｉｇｈでゲインを平滑化し、高域ゲインＧｈｉｇｈ［ｔ］［ｋ］を算出する（ステップＳ４４）。ゲイン制御部２８０は、例えば、次の数式２により高域ゲインＧｈｉｇｈ［ｔ］［ｋ］を算出する。

即ち、ゲイン制御部２８０は、ゲインメモリにより記憶されている過去に算出したゲインのうち、間隔Ｎｓｔ及び間隔Ｎｈｉｇｈにそれぞれ対応するゲインを抽出し、抽出したゲインを用いて平滑化を行う。

ゲイン制御部２８０は、既に設定したゲインＧ［ｋ］と高域ゲインＧｈｉｇｈ［ｔ］［ｋ］とを比較する。高域ゲインＧｈｉｇｈ［ｔ］［ｋ］がゲインＧ［ｋ］より大きい場合、ゲイン制御部２８０は、高域ゲインＧｈｉｇｈ［ｔ］［ｋ］をゲインＧ［ｋ］として設定する（ステップＳ４５）。

なお、上記したように、高域のゲインの平滑化に用いられる間隔Ｎｈｉｇｈは、基準間隔Ｎｓｔより長い。これにより、音響制御部２００は、高域のゲインがより緩やかに減衰するようにゲイン変化するように制御することができる。

図９は、ゲイン制御部２８０からイコライザ２２０に供給されたゲインＧ［ｋ］の例を示す。グラフ９０１乃至グラフ９０５は、それぞれ時間経過に伴うゲインＧ［ｋ］の変化の様子を示す。なお、グラフ９０１は、最初にゲイン制御部２８０からイコライザ２２０に供給されたゲイン［ｋ］を示す。グラフ９０２は、グラフ９０１の時点から一定時間経過後にゲイン制御部２８０からイコライザ２２０に供給されたゲイン［ｋ］を示す。グラフ９０３は、グラフ９０２の時点から一定時間経過後にゲイン制御部２８０からイコライザ２２０に供給されたゲイン［ｋ］を示す。グラフ９０４は、グラフ９０３の時点から一定時間経過後にゲイン制御部２８０からイコライザ２２０に供給されたゲイン［ｋ］を示す。グラフ９０５は、最後にゲイン制御部２８０からイコライザ２２０に供給されたゲイン［ｋ］を示す。

この例によると、Ｋｈｉｇｈより低域の周波数帯域で基準ゲインＧｓｔ［ｋ］が採用されているのに対して、Ｋｈｉｇｈより高域の周波数帯域で高域ゲインＧｈｉｇｈ［ｋ］が採用されている。この結果、高域のゲインは、低域のゲインに比べてより緩やかに減衰する。

上記したような構成によると、例えば、環境音が大きくなった場合、即ち、マスキングゲインＧｍ［ｋ］が小さい値から大きい値に変化する場合、音響制御部２００は、ゲインＧ［ｋ］として基準ゲインＧｓｔ［ｋ］を採用する。これにより、音響制御部２００は、環境音増大時には速やかにオーディオ信号を追従させて補正することが出来る。

また、例えば、環境音が小さくなった場合、即ち、マスキングゲインＧｍ［ｋ］が大きい値から小さい値に変化する場合、音響制御部２００は、高域のゲインＧ［ｋ］として高域ゲインＧｈｉｇｈ［ｋ］を採用する。これにより、音響制御部２００は、高域のオーディオ信号が緩やかに減衰するように補正することが出来る。この場合、音響制御部２００は、高域の音が急激に減衰することでユーザに「こもり（高域の欠落感）」を与えることを防ぐことができる。この結果、より高品質の音響を実現することができる音響制御装置、音響補正装置、及び音響補正方法を提供することができる。

さらに、ゲイン制御部２８０は、オーディオ信号で支配的な音種別を判定する。即ち、ゲイン制御部２８０は、スコア算出部２５０から供給された音声スコアＳＳ、音楽スコアＳＭ、及びノイズスコアＳＮに基づいて、オーディオ信号で支配的な音種別を判定する。

まず、ゲイン制御部２８０は、音楽スコアＳＭが最も高いか否か判定する（ステップＳ４６）。即ち、ゲイン制御部２８０は、音声スコアＳＳと音楽スコアＳＭとノイズスコアＳＮとを比較し、音楽スコアＳＭが最も高いか否か判定する。音楽スコアＳＭが最も高いと判定した場合、ゲイン制御部２８０は、音楽が支配的であると判定する。即ち、ゲイン制御部２８０は、音楽が主成分であると判定する。

ステップＳ４６で音楽が支配的であると判定した場合、ゲイン制御部２８０は、基準間隔Ｎｓｔ及び間隔Ｎｈｉｇｈより長い時間間隔Ｎｍｕｓｉｃでゲインを平滑化し、音楽用ゲインＧｍｕｓｉｃ［ｔ］［ｋ］を算出する（ステップＳ４７）。ゲイン制御部２８０は、例えば、次の数式３により音楽用ゲインＧｍｕｓｉｃ［ｔ］［ｋ］を算出する。

ゲイン制御部２８０は、既に設定したゲインＧ［ｋ］と音楽用ゲインＧｍｕｓｉｃ［ｔ］［ｋ］とを比較する。音楽用ゲインＧｍｕｓｉｃ［ｔ］［ｋ］がゲインＧ［ｋ］より大きい場合、ゲイン制御部２８０は、音楽用ゲインＧｍｕｓｉｃ［ｔ］［ｋ］をゲインＧ［ｋ］として設定する（ステップＳ４８）。

上記したように、音響制御部２００は、音楽の再生中に環境音が変化した場合、より緩やかにゲインＧ［ｋ］が変化するように制御する。このように、音響制御部２００は、音楽のレベルが急激に減衰することでユーザに違和感を与えることを防ぐことができる。

ステップＳ４６で音楽が支配的ではないと判定した場合、ゲイン制御部２８０は、ノイズスコアＳＮが最も高いか否か判定する（ステップＳ４９）。即ち、ゲイン制御部２８０は、音声スコアＳＳと音楽スコアＳＭとノイズスコアＳＮとを比較し、ノイズスコアＳＮが最も高いか否か判定する。ノイズスコアＳＮが最も高いと判定した場合、ゲイン制御部２８０は、ノイズが支配的であると判定する。即ち、ゲイン制御部２８０は、ノイズが主成分であると判定する。

ステップＳ４９でノイズが支配的であると判定した場合、ゲイン制御部２８０は、既に算出したゲインＧ［ｋ］に予め設定された減衰係数α（α＜１）を乗算する。ゲイン制御部２８０は、α・Ｇ［ｋ］をゲインＧ［ｋ］として設定する（ステップＳ５０）。これにより、音響制御部２００は、ノイズが増幅されることを防ぐことができる。ゲイン制御部２８０は、ゲインメモリを更新する（ステップＳ５１）。即ち、ゲイン制御部２８０は、逐次マスキングゲイン算出部２７０から供給されたマスキングゲインＧｍ［ｔ］［ｋ］をゲインメモリに追記する。

さらに、ゲイン制御部２８０は、全ての周波数帯域のゲインを算出したか否か判定する（ステップＳ５２）。全ての周波数帯域のゲインを算出していない場合、ゲイン制御部２８０は、ステップＳ４１に移行する。

全ての周波数帯域のゲインを算出した場合、ゲイン制御部２８０は、ゲインの平滑化を行う（ステップＳ５３）。即ち、ゲイン制御部２８０は、算出した複数のゲインＧ［ｋ］を周波数方向で平滑化する。これにより、音響制御部２００は、周波数帯域間でゲインが突出することを防ぐことができる。

ゲイン制御部２８０は、平滑化を行ったゲインＧ［ｋ］をイコライザ２２０に送信する（ステップＳ５４）。これにより、音響制御部２００は、１フレーム分の音響制御を終了する。

なお、本実施例のステップ４４、ステップ４７において平滑化フレーム数の増加によりゲイン係数の減衰時間延長を行っているが、減衰時間延長するための方法として直前のフレームのゲイン係数Ｇ［ｋ］に減衰係数（１．０より小さい）を乗算することでゲイン係数を算出してもよい。本発明は、周波数帯域毎に減衰時間を制御することが主眼であり、減衰時間を制御（延長）することで同様の効果が得られる。

例えば、ゲイン制御部２８０は、上記したように時間によりマスキングゲインを平滑することにより算出されたゲインと、直前のフレームのゲインに減衰係数を乗算することにより算出されたゲインとのいずれか一方をイコライザ２２０に出力する。例えば、ゲイン制御部２８０は、操作入力、または予め設定された設定情報に基づいて出力するゲインを選択する。なお、ゲイン制御部２８０は、時間によりマスキングゲインを平滑する構成を備えず、直前のフレームのゲインに減衰係数を乗算する構成のみを備えていてもよい。

上記した音響制御部２００は、環境音に応じて周波数帯域毎に適切な音響制御を行う。これにより、ユーザにこもり感を知覚させることを防ぐことができる。さらに、音響制御部２００は、音種別に応じて適切な音響制御を行うことにより、ユーザに違和感を与えることを防ぐことができる。

なお、上述の各実施の形態で説明した機能は、ハードウエアを用いて構成するに留まらず、ソフトウエアを用いて各機能を記載したプログラムをコンピュータに読み込ませて実現することもできる。また、各機能は、適宜ソフトウエア、ハードウエアのいずれかを選択して構成するものであっても良い。

なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。

１００…放送受信装置、１０１…放送入力端子、１１０…アンテナ、１１１…チューナ、１１２…復調部、１１３…信号処理部、１１４…通信インターフェース、１２１…音声処理部、１２２…音声出力端子、１２４…環境音入力端子、１３１…映像処理部、１３２…ＯＳＤ処理部、１３３…表示処理部、１３５…映像出力端子、１５０…制御部、１５１…ＣＰＵ、１５２…ＲＯＭ、１５３…ＲＡＭ、１５４…ＥＥＰＲＯＭ、１６１…操作入力部、１６２…受光部、１６３…リモートコントローラ、１６４…カードコネクタ、１６５…メモリカード、１６６…ＵＳＢコネクタ、１６７…ＵＳＢ機器、１７０…ディスクドライブ、２００…音響制御部、２１０…入力端子、２２０…イコライザ、２３０…出力端子、２４０…特徴パラメータ算出部、２５０…スコア算出部、２５１…音声スコア算出部、２５２…音楽スコア算出部、２５３…ノイズスコア算出部、２６０…マスキングレベル算出部、２７０…マスキングゲイン算出部、２８０…ゲイン制御部、３００…スピーカ、４００…ディスプレイ、５００…マイク。

Claims

オーディオ信号を補正する音響補正部を備える音響補正装置に接続される音響制御装置であって、
前記オーディオ信号を受信する第１の受信部と、
環境音を受信する第２の受信部と、
前記オーディオ信号と、前記環境音とに基づいて、周波数帯域ごとにマスキングゲインを算出するマスキングゲイン算出部と、
予め設定された閾値未満の周波数帯域の前記マスキングゲインを第１の間隔で平滑化し、前記閾値以上の周波数帯域の前記マスキングゲインを前記第１の間隔より長い第２の間隔で平滑化してゲインを設定する第１のゲイン制御部と、
前記第１のゲイン制御部により設定された前記ゲインを前記音響補正装置の音響補正部に出力する出力部と、
を具備する音響制御装置。
前記第１のゲイン制御部により過去に算出された前記ゲインを記憶する記憶部をさらに具備し、
前記第１のゲイン制御部は、前記記憶部により記憶されている前記ゲインから前記第１の間隔及び前記第２の間隔に対応する前記ゲインを抽出し、平滑化に用いる、
請求項１に記載の音響制御装置。
前記第１のゲイン制御部は、前記閾値以上の周波数帯域の前記マスキングゲインを前記第１の間隔で平滑化して基準ゲインを算出し、前記閾値以上の周波数帯域の前記マスキングゲインを前記第２の間隔で平滑化して高域ゲインを算出し、前記基準ゲインと前記高域ゲインとを周波数帯域毎に比較し、より大きい値を前記ゲインとして採用する、請求項２に記載の音響制御装置。
前記オーディオ信号の主成分の音種を判別する音種判別部をさらに具備し、
前記第１のゲイン制御部は、前記音種判別部により主成分の音種が音楽であると判別された場合、前記マスキングゲインを第２の間隔より長い第３の間隔で平滑化して音楽用ゲインを算出する、請求項３に記載の音響制御装置。
前記第１のゲイン制御部は、前記基準ゲインと、前記高域ゲインと、前記音楽用ゲインとを周波数帯域毎に比較し、最も大きい値を前記ゲインとして採用する、請求項４に記載の音響制御装置。
前記オーディオ信号の主成分の音種を判別する音種判別部をさらに具備し、
前記第１のゲイン制御部は、前記音種判別部により主成分の音種がノイズであると判別された場合、前記ゲインに予め設定された減衰係数を乗算する、請求項３に記載の音響制御装置。
前記第１のゲイン制御部により過去に算出された前記ゲインを記憶する記憶部と、
前記記憶部により記憶されている最も新しい前記ゲインに対して１より小さい予め設定された減衰係数を乗算し、乗算した値を前記ゲインとして設定する第２のゲイン制御部と、
をさらに具備し、
前記出力部は、前記第１のゲイン制御部により設定された前記ゲインと、前記第２のゲイン制御部により設定された前記ゲインとのいずれかを前記音響補正装置の音響補正部に出力する、
請求項１に記載の音響制御装置。
オーディオ信号を受信する第１の受信部と、
環境音を受信する第２の受信部と、
前記オーディオ信号と、前記環境音とに基づいて、周波数帯域ごとにマスキングゲインを算出するマスキングゲイン算出部と、
予め設定された閾値未満の周波数帯域の前記マスキングゲインを第１の間隔で平滑化し、前記閾値以上の周波数帯域の前記マスキングゲインを前記第１の間隔より長い第２の間隔で平滑化してゲインを設定するゲイン制御部と、
前記ゲイン制御部により設定された前記ゲインに基づいて前記オーディオ信号を補正する音響補正部と、
前記音響補正部により補正された前記オーディオ信号を出力する出力部と、
を具備する音響補正装置。
音を検出し、環境音として前記第２の受信部に供給するマイクをさらに具備する請求項８に記載の音響補正装置。
オーディオ信号を受信し、
環境音を受信し、
前記オーディオ信号と、前記環境音とに基づいて、周波数帯域ごとにマスキングゲインを算出し、
予め設定された閾値未満の周波数帯域の前記マスキングゲインを第１の間隔で平滑化し、前記閾値以上の周波数帯域の前記マスキングゲインを前記第１の間隔より長い第２の間隔で平滑化してゲインを設定し、
設定された前記ゲインに基づいて前記オーディオ信号を補正し、
補正された前記オーディオ信号を出力する、
音響補正方法。