JP2013009199A - 音響制御装置、音響補正装置、及び音響補正方法 - Google Patents

音響制御装置、音響補正装置、及び音響補正方法 Download PDF

Info

Publication number
JP2013009199A
JP2013009199A JP2011141099A JP2011141099A JP2013009199A JP 2013009199 A JP2013009199 A JP 2013009199A JP 2011141099 A JP2011141099 A JP 2011141099A JP 2011141099 A JP2011141099 A JP 2011141099A JP 2013009199 A JP2013009199 A JP 2013009199A
Authority
JP
Japan
Prior art keywords
gain
sound
unit
control unit
masking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011141099A
Other languages
English (en)
Other versions
JP5085769B1 (ja
Inventor
Hirokazu Takeuchi
広和 竹内
Hiroshi Yonekubo
裕 米久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2011141099A priority Critical patent/JP5085769B1/ja
Priority to EP20120152044 priority patent/EP2538559B1/en
Priority to US13/415,513 priority patent/US9002021B2/en
Application granted granted Critical
Publication of JP5085769B1 publication Critical patent/JP5085769B1/ja
Publication of JP2013009199A publication Critical patent/JP2013009199A/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】より高品質の音響を実現することができる音響制御装置、音響補正装置、及び音響補正方法を提供する。
【解決手段】一実施形態に係る音響制御装置は、オーディオ信号を補正する音響補正部を備える音響補正装置に接続される音響制御装置であって、前記オーディオ信号を受信する第1の受信部と、環境音を受信する第2の受信部と、前記オーディオ信号と、前記環境音とに基づいて、周波数帯域ごとにマスキングゲインを算出するマスキングゲイン算出部と、予め設定された閾値未満の周波数帯域の前記マスキングゲインを第1の間隔で平滑化し、前記閾値以上の周波数帯域の前記マスキングゲインを前記第1の間隔より長い第2の間隔で平滑化してゲインを設定するゲイン制御部と、前記ゲイン制御部により設定された前記ゲインを前記音響補正装置の音響補正部に出力する出力部と、を具備する。
【選択図】 図2

Description

本発明の実施形態は、音響制御装置、音響補正装置、及び音響補正方法に関する。
従来、オーディオ信号に対して補正を施すことにより、高音質化を実現することができる音響補正装置が一般的に知られている。音響補正装置は、例えば、周囲の背景雑音(環境音)を検出し、検出した環境音に基づいて、音量制御及び周波数に応じたイコライジング処理などをオーディオ信号に対して行う。
特開2010−154388号公報
音響補正装置は、環境音が小さくなった場合、オーディオ信号を元の状態に戻す。即ち、音響補正装置は、環境音が小さくなった場合、音量を下げるようにオーディオ信号に対して補正を行う。従来の音響補正装置は、オーディオ信号の音響特性を画一的に元の状態に戻すように補正を行う。しかし、このような場合、音響補正装置は、聴感上ユーザに「こもり(高域の欠落感)」を知覚させる可能性があるという課題がある。
そこで、より高品質の音響を実現することができる音響制御装置、音響補正装置、及び音響補正方法を提供することを目的とする。
一実施形態に係る音響制御装置は、オーディオ信号を補正する音響補正部を備える音響補正装置に接続される音響制御装置であって、前記オーディオ信号を受信する第1の受信部と、環境音を受信する第2の受信部と、前記オーディオ信号と、前記環境音とに基づいて、周波数帯域ごとにマスキングゲインを算出するマスキングゲイン算出部と、予め設定された閾値未満の周波数帯域の前記マスキングゲインを第1の間隔で平滑化し、前記閾値以上の周波数帯域の前記マスキングゲインを前記第1の間隔より長い第2の間隔で平滑化してゲインを設定する第1のゲイン制御部と、前記第1のゲイン制御部により設定された前記ゲインを前記音響補正装置の音響補正部に出力する出力部と、を具備する。
図1は、一実施形態に係る放送受信装置について説明する為の図である。 図2は、一実施形態に係る音響制御部について説明する為の図である。 図3は、一実施形態に係る音響制御部の処理について説明する為の図である。 図4は、一実施形態に係る音響制御部の処理について説明する為の図である。 図5は、一実施形態に係る音響制御部の処理について説明する為の図である。 図6は、一実施形態に係る音響制御部の処理について説明する為の図である。 図7は、一実施形態に係る音響制御部の処理について説明する為の図である。 図8は、一実施形態に係る音響制御部の処理について説明する為の図である。 図9は、一実施形態に係る音響制御部の処理について説明する為の図である。
以下、図を参照しながら、一実施形態に係る音響制御装置、音響補正装置、及び音響補正方法ついて詳細に説明する。
図1は、一実施形態に係る放送受信装置100の例を示す。
なお、本実施形態では、放送受信装置100は、コンテンツに基づいて映像を液晶表示装置に表示させるものと仮定して説明する。
放送受信装置100は、放送入力端子101、チューナ111、復調部112、信号処理部113、通信インターフェース114、音声処理部121、音声出力端子122、環境音入力端子124、映像処理部131、OSD処理部132、表示処理部133、映像出力端子135、制御部150、操作入力部161、受光部162、カードコネクタ164、USBコネクタ166、及びディスクドライブ170を備える。
放送入力端子101は、例えばアンテナ110により受信されるディジタル放送信号が入力される入力端子である。アンテナ110は、例えば、地上ディジタル放送信号、BS(broadcasting satellite)ディジタル放送信号、及び/または、110度CS(communication satellite)ディジタル放送信号を受信する。即ち、放送入力端子101には、放送信号により供給される番組などのコンテンツが入力される。
放送入力端子101は、受信したディジタル放送信号をチューナ111に供給する。チューナ111は、ディジタル放送信号用のチューナである。チューナ111は、アンテナ110から供給されるディジタル放送信号のチューニング(選局)を行う。チューナ111は、チューニングしたディジタル放送信号を復調部112に送信する。
復調部112は、受信するディジタル放送信号の復調を行う。復調部112は、復調したディジタル放送信号(コンテンツ)を信号処理部113に入力する。即ち、アンテナ110、チューナ111、及び復調部112は、コンテンツを受信する受信手段として機能する。
信号処理部113は、ディジタル放送信号(動画のコンテンツデータ)に対して信号処理を施す信号処理手段として機能する。信号処理部113は、復調部112から供給されるディジタル放送信号に、信号処理を施す。即ち、信号処理部113は、ディジタル放送信号を映像信号、音声信号、及びその他のデータ信号に分離する。信号処理部113は、音声処理部121に音声信号を供給する。また、信号処理部113は、映像処理部131に映像信号を供給する。さらに、信号処理部113は、制御部150、及び/またはOSD処理部132にデータ信号を供給する。
通信インターフェース114は、例えばHDMI(High Definition Multimedia Interface)(登録商標)端子などの、コンテンツを受信可能なインターフェースを備える。通信インターフェース114は、ディジタル映像信号、及びディジタル音声信号などが多重化されたコンテンツを他の機器から受信する。通信インターフェース114は、他の機器から受信したディジタル信号(コンテンツ)を信号処理部113に供給する。即ち、通信インターフェース114は、コンテンツを受信する受信手段として機能する。
信号処理部113は、通信インターフェース114から受信するディジタル信号に信号処理を施す。例えば、信号処理部113は、ディジタル信号をディジタル映像信号とディジタル音声信号とデータ信号とに分離する。信号処理部113は、音声処理部121にディジタル音声信号を供給する。また、信号処理部113は、映像処理部131にディジタル映像信号を供給する。さらに、信号処理部113は、制御部150、及び/またはOSD処理部132にデータ信号を供給する。
なお、信号処理部113は、通信インターフェース114に入力されるコンテンツと、放送入力端子101に入力されるコンテンツとのいずれかを選択し、処理を行う。即ち、信号処理部113は、ディジタル放送信号とディジタル信号のいずれかに対して信号の分離処理を行う。
音声処理部121は、信号処理部113から受信したディジタル音声信号を、スピーカ300により再生可能なフォーマットの信号(オーディオ信号)に変換する。音声処理部121は、オーディオ信号を音声出力端子122に出力する。音声出力端子122は、供給されるオーディオ信号を装置外部に出力する。これにより、音声出力端子122に接続されるスピーカ300は、供給されるオーディオ信号に基づいて音を再生する。
なお、オーディオ信号は、コンテンツにより種々の種類の音を含む。例えば、テレビ番組などのオーディオ信号は、人が発した声(音声)、音楽(音楽)、及び種々の雑音(背景雑音)などに基づく信号を含む。この場合の雑音は、例えば拍手、歓声、及び他の種々の音を含む。
環境音入力端子124は、例えばマイク500などの音を検出する装置が接続される端子である。マイク500は、例えば放送受信装置100の近傍に設置され、放送受信装置100の周囲の音(背景雑音)を検出し、信号に変換する。マイク500は、この信号を環境音入力端子124に供給する。環境音入力端子124は、マイク500から供給された信号を環境音として音声処理部121に供給する。
映像処理部131は、信号処理部113から受信した映像信号を、ディスプレイ400で再生可能なフォーマットの映像信号に変換する。即ち、映像処理部131は、信号処理部113から受信した映像信号を、ディスプレイ400で再生可能なフォーマットの映像信号にデコード(再生)する。また、映像処理部131は、OSD処理部132から供給されるOSD信号を映像信号に重畳する。映像処理部131は、映像信号を表示処理部133に出力する。
OSD処理部132は、信号処理部113から供給されるデータ信号、及び/または制御部150から供給される制御信号に基づいて、GUI(グラフィック ユーザ インタフェース)画面、字幕、時刻、または他の情報などを画面に重畳して表示する為のOSD信号を生成する。
表示処理部133は、例えば、制御部150からの制御に基づいて、受信した映像信号に対して色味、明るさ、シャープ、コントラスト、またはその他の画質調整処理を行う。表示処理部133は、画質調整を施した映像信号を映像出力端子135に出力する。これにより、映像出力端子135に接続されるディスプレイ400は、供給される映像信号に基づいて映像を表示する。
ディスプレイ400は、例えば、マトリクス状に配列された複数の画素を備える液晶表示パネルと、この液晶パネルを照明するバックライトとを備える液晶表示装置などを備える。ディスプレイ400は、放送受信装置100から供給される映像信号に基づいて映像を表示する。
なお、放送受信装置100は、映像出力端子135の代わりに、ディスプレイ400を装置内部に備える構成であってもよい。また、放送受信装置100は、音声出力端子122の代わりに、スピーカ300を装置内部に備える構成であってもよい。
制御部150は、放送受信装置100の各部の動作を制御する制御手段として機能する。制御部150は、CPU151、ROM152、RAM153、及びEEPROM154などを備えている。制御部150は、操作入力部161から供給される操作信号に基づいて、種々の処理を行う。
CPU151は、種々の演算処理を実行する演算素子などを備える。CPU151は、ROM152、またはEEPROM154などに記憶されているプログラムを実行することにより種々の機能を実現する。
ROM152は、放送受信装置100を制御する為のプログラム、及び各種の機能を実現する為のプログラムなどを記憶する。CPU151は、操作入力部161から供給される操作信号に基づいて、ROM152に記憶されているプログラムを起動する。これにより、制御部150は、各部の動作を制御する。
RAM153は、CPU151のワークメモリとして機能する。即ち、RAM153は、CPU151の演算結果、CPU151により読み込まれたデータなどを記憶する。
EEPROM154は、各種の設定情報、及びプログラムなどを記憶する不揮発性メモリである。
操作入力部161は、例えば、操作キー、キーボード、マウス、タッチパッドまたは操作入力に応じて操作信号を生成する事ができる他の入力装置などを備える入力手段である。例えば、操作入力部161は、操作入力に応じて操作信号を生成する。操作入力部161は、生成した操作信号を制御部150に供給する。
なお、タッチパッドは、静電センサ、サーモセンサ、または他の方式に基づいて位置情報を生成するデバイスを含む。また、放送受信装置100がディスプレイ400を備える場合、操作入力部161は、ディスプレイ400と一体に形成されるタッチパネルなどを備える構成であってもよい。
受光部162は、例えば、リモートコントローラ163からの操作信号を受信するセンサなどを備える。受光部162は、受信した操作信号を制御部150に供給する。リモートコントローラ163は、ユーザの操作入力に基づいて操作信号を生成する。リモートコントローラ163は、生成した操作信号を赤外線通信により受光部162に送信する。なお、受光部162及びリモートコントローラ163は、電波などの他の無線通信により操作信号の送受信を行う構成であってもよい。
カードコネクタ164は、例えば、動画コンテンツを記憶するメモリカード165と通信を行う為のインターフェースである。カードコネクタ164は、接続されるメモリカード165から動画のコンテンツデータを読み出し、制御部150に供給する。
USBコネクタ166は、USB機器167と通信を行う為のインターフェースである。USBコネクタ166は、接続されるUSB機器167から供給される信号を制御部150に供給する。
例えば、USB機器167がキーボードなどの操作入力機器である場合、USBコネクタ166は、操作信号をUSB機器167から受け取る。USBコネクタ166は、受け取った操作信号を制御部150に供給する。この場合、制御部150は、USBコネクタ166から供給される操作信号に基づいて種々の処理を実行する。
また、例えば、USB機器167が動画のコンテンツデータを記憶する記憶装置である場合、USBコネクタ166は、コンテンツをUSB機器167から取得することができる。USBコネクタ166は、取得したコンテンツを制御部150に供給する。
ディスクドライブ170は、例えば、コンパクトディスク(CD)、ディジタルバーサタイルディスク(DVD)、ブルーレイディスク(Blu−ray Disk(登録商標))、または動画のコンテンツデータを記録可能な他の光ディスクMを装着可能なドライブを有する。ディスクドライブ170は、装着される光ディスクMからコンテンツを読み出し、読み出したコンテンツを制御部150に供給する。
また、放送受信装置100は、図示しない電源部を備える。電源部は、放送受信装置100の各部に電力を供給する。電源部は、例えば、ACアダプタなどを介して供給される電力を変換し各部へ供給する。また、電源部は、バッテリーを備えていても良い。この場合、電源部は、ACアダプタなどを介して供給される電力をバッテリーに充電する。電源部は、バッテリーに充電されている電力を放送受信装置100の各部に供給する。
また、放送受信装置100は、さらに他のインターフェースを備えていても良い。インターフェースは、例えば、Serial−ATA、LANポートなどである。放送受信装置100は、インターフェースにより接続される機器に記録されているコンテンツを取得し、再生することができる。また、放送受信装置100は、再生したオーディオ信号及び映像信号を、インターフェースにより接続される機器に出力することが出来る。
また、放送受信装置100がインターフェースを介してネットワークに接続される場合、放送受信装置100は、ネットワーク上の動画のコンテンツデータを取得し、再生することができる。
またさらに、放送受信装置100は、ハードディスク(HDD)、ソリッドステイトディスク(SSD)、または半導体メモリなどの記憶装置を備えていても良い。この記憶装置が動画のコンテンツデータを記憶する場合、放送受信装置100は、この記憶装置に記憶されているコンテンツを読み出し、再生することが出来る。また、放送受信装置100は、この記憶装置に例えば放送信号、またはネットワークなどにより供給されるコンテンツを記憶することができる。
また、音声処理部121は、音響制御部200を備える。音響制御部200は、音声処理部121により再生されたオーディオ信号に対して補正を施す。これにより、音響制御部200は、ユーザにとってより聞き取りやすい音がスピーカ300から再生されるようにオーディオ信号を制御する。例えば、音響制御部200は、環境音入力端子124から供給された環境音と再生オーディオ信号に基づいて、周波数毎に再生オーディオ信号を補正することができる。
図2は、図1に示す音響制御部200の例を示す。
図2に示すように、音響制御部200は、入力端子210、イコライザ220、出力端子230、特徴パラメータ算出部240、スコア算出部250、マスキングレベル算出部260、マスキングゲイン算出部270、及びゲイン制御部280を備える。
音響制御部200は、放送受信装置100がオーディオ信号を再生する際にマイク500により検出された環境音の特性と、オーディオ信号の音種別とに基づいて、ユーザにとってより聞き取りやすくオーディオ信号を補正する。なお、環境音は、エコーキャンセラ等によりスピーカ300から出力された音の回り込みを抑制した信号である。
入力端子210は、音声処理部121により再生されたオーディオ信号を受信する受信手段である。入力端子210は、受信したオーディオ信号をイコライザ220、特徴パラメータ算出部240、及びマスキングゲイン算出部270に供給する。
イコライザ220は、ゲイン制御部280により指示されたゲイン特性に従ってオーディオ信号を補正する。イコライザ220は、補正されたオーディオ信号(補正オーディオ信号)を出力端子230に送信する。また、本イコライザ処理は周波数全帯域に渡るゲイン制御に相当する音量制御を含む。
出力端子230は、イコライザ220により補正された補正オーディオ信号を出力する、出力端子230に音声出力端子122が接続されている場合、出力端子230は、音声出力端子122を経由した放送受信装置100の外部に補正オーディオ信号を出力する。この結果、音声出力端子122に接続されるスピーカ300は、補正オーディオ信号に基づいて音を再生する。
特徴パラメータ算出部240は、オーディオ信号に基づいて各種の特徴パラメータを算出する。この場合、図3に示されるように、特徴パラメータ算出部240は、数100msecを1単位とする複数のフレームにオーディオ信号を分割する。さらに、特徴パラメータ算出部240は、数10msecを1単位とする複数のサブフレームに上記のフレームを分割する。
特徴パラメータ算出部240は、サブフレーム単位で、各種の特徴パラメータを算出する。この為に、特徴パラメータ算出部240は、サブフレーム単位で各種の特徴パラメータを生成するための判別情報を取得する。特徴パラメータ算出部240は、取得した判別情報のフレーム単位での統計量を算出することにより、特徴パラメータを算出する。
即ち、特徴パラメータ算出部240は、オーディオ信号から、サブフレーム単位で、音声信号と音楽信号とを判別するための判別情報を取得する。また、特徴パラメータ算出部240は、オーディオ信号から、サブフレーム単位で、音楽信号と雑音とを判別するための判別情報を取得する。また、特徴パラメータ算出部240は、オーディオ信号から、サブフレーム単位で、音声及び音楽の信号とノイズ信号とを判別するための各種の判別情報を取得する。
例えば、特徴パラメータ算出部240は、取得した各種の判別情報に基づいて、フレーム単位での統計量(例えば平均、分散、最大、最小等)を算出する。これにより、特徴パラメータ算出部240は、種々の特徴パラメータを算出する。
例えば、特徴パラメータ算出部240は、判別情報に基づいて、音声信号と音楽信号とを判別するための各種の特徴パラメータを算出する。また、特徴パラメータ算出部240は、判別情報に基づいて、音楽信号と雑音とを判別するための各種の特徴パラメータを算出する。また、特徴パラメータ算出部240は、判別情報に基づいて、音声及び音楽の信号とノイズ信号とを判別するための各種の特徴パラメータ等を算出する。
例えば、特徴パラメータ算出部240は、サブフレーム単位でオーディオ信号の信号振幅の二乗和(パワー値)を判別情報として算出する。特徴パラメータ算出部240は、算出されたパワー値に基づいてフレーム単位で統計量を算出することにより、パワー値に関する特徴パラメータpwを生成する。
また、特徴パラメータ算出部240は、サブフレーム単位でオーディオ信号の零交差周波数を判別情報として算出する。零交差周波数は、例えば、横軸を時間とし、縦軸を振幅とした場合にオーディオ信号が振幅方向の零と交差する回数である。特徴パラメータ算出部240は、算出された零交差周波数に基づいてフレーム単位で統計量を算出することにより、零交差周波数に関する特徴パラメータzcを生成する。
さらに、特徴パラメータ算出部240は、サブフレーム単位でオーディオ信号の周波数領域でのスペクトル変動を判別情報として算出する。特徴パラメータ算出部240は、算出されたスペクトル変動に基づいてフレーム単位で統計量を算出することにより、スペクトル変動に関する特徴パラメータsfを生成する。
また、特徴パラメータ算出部240は、サブフレーム単位でオーディオ信号における2チャンネルステレオの左右(LR)信号のパワー比(LRパワー比)を判別情報として算出する。特徴パラメータ算出部240は、算出されたLRパワー比に基づいてフレーム単位で統計量を算出することにより、LRパワー比に関する特徴パラメータlrを生成する。
さらに、特徴パラメータ算出部240は、サブフレーム単位でオーディオ信号のスペクトル平坦度を判別情報として算出する。特徴パラメータ算出部240は、算出されたスペクトル平坦度に基づいてフレーム単位で統計量を算出することにより、ノイズ信号に関する特徴パラメータSFMを生成する。
パワー値に関する特徴パラメータpwは、サブフレーム間での信号パワーの違いを示す。例えば、特徴パラメータpwは、サブフレーム間のパワー値の分散を示す。オーディオ信号の主成分が音声である場合、サブフレーム間での信号パワーの違いが大きくなる傾向がある。即ち、オーディオ信号の主成分が音声である場合、特徴パラメータpwの値が大きくなる。
零交差周波数に関する特徴パラメータzcは、上記したように、横軸を時間とし、縦軸を振幅とした場合にオーディオ信号が振幅方向の零と交差する回数の変動を示す。音声信号では、零交差周波数が子音では高く母音では低くなる。即ち、オーディオ信号の主成分が音声である場合、零交差周波数に関する特徴パラメータzcの値のサブフレーム間の分散が大きくなる傾向がある。
スペクトル変動に関する特徴パラメータsfは、上記したように、サブフレーム単位でオーディオ信号の周波数領域でのスペクトル変動を示す。音声信号は、音楽信号に比べて周波数特性の変動が激しい。この為、オーディオ信号の主成分が音声である場合、スペクトル変動に関する特徴パラメータsfの分散が大きくなる傾向がある。
LRパワー比に関する特徴パラメータlrは、上記したように、サブフレーム単位でオーディオ信号における2チャンネルステレオの左右(LR)信号のパワー比(LRパワー比)を示す。音楽信号は、ボーカル以外の楽器演奏がセンター以外に定位していることが多い。この為、オーディオ信号の主成分が音楽である場合、左右のチャンネル間のパワー比が大きくなる傾向がある。
ノイズ信号に関する特徴パラメータSFMは、上記したように、サブフレーム単位でオーディオ信号のスペクトル平坦度に基づくパラメータである。ノイズ信号は、平坦なスペクトルが形成される傾向がある。この為、オーディオ信号の主成分がノイズである場合、サブフレーム間でオーディオ信号の分散が小さくなる傾向がある。
特徴パラメータ算出部240は、生成した各種の特徴パラメータをスコア算出部250に供給する。
スコア算出部250は、特徴パラメータ算出部240から供給された各種の特徴パラメータに基づいて、オーディオ信号が音声に近いか音楽に近いかを示す音声・音楽識別スコアS1を算出する。また、スコア算出部250は、特徴パラメータ算出部240から供給された各種の特徴パラメータに基づいて、オーディオ信号が音楽に近いか背景雑音に近いかを示す音楽・背景音識別スコアS2を算出する。
また、スコア算出部250は、音声スコア算出部251、音楽スコア算出部252、及びノイズスコア算出部253を備える。スコア算出部250は、音声スコア算出部251、音楽スコア算出部252、及びノイズスコア算出部253により、音声スコアSS、音楽スコアSM、及びノイズスコアSNを算出する。スコア算出部250は、音声・音楽識別スコアS1及び音楽・背景音識別スコアS2に基づいて音声スコアSS、音楽スコアSM、及びノイズスコアSNを算出する。スコア算出部250は、算出した音声スコアSS、音楽スコアSM、及びノイズスコアSNをゲイン制御部280に供給する。
マスキングレベル算出部260は、環境音入力端子124により受信した環境音に基づいて、マスキングレベルを算出する。マスキングレベル算出部260は、算出したマスキングレベルをマスキングゲイン算出部270に供給する。
マスキングゲイン算出部270は、マスキングレベル算出部260から供給されたマスキングレベルと、オーディオ信号とに基づいて、周波数毎にマスキングゲインGm[k]を算出する。マスキングゲイン算出部270は、算出したマスキングゲインGm[k]をゲイン制御部280に供給する。
ゲイン制御部280は、スコア算出部250から供給された音声スコアSS、音楽スコアSM、及びノイズスコアSN、並びに、マスキングゲイン算出部270から供給されたマスキングゲインGm[k]に基づいて、周波数毎にゲインG[k]を決定する。ゲイン制御部280は、ゲインG[k]をイコライザ220に供給する。
イコライザ220は、上記したように、ゲイン制御部280から供給されたゲインG[k]に基づいてオーディオ信号を補正する。
次に、スコア算出部250の動作について詳細に説明する。
例えば、スコア算出部250は、線形識別関数を用いて音声・音楽識別スコアS1及び音楽・背景音識別スコアS2を算出する。しかし、スコア算出部250は、線形識別関数に限らず、如何なる方法を用いてもよい。
スコア算出部250は、音声・音楽識別スコアS1及び音楽・背景音識別スコアS2の算出に必要な各種特徴パラメータに乗ずる重み係数A及びBを予め記憶する。重み係数は、音種別の判別に効果の高い特徴パラメータほど大きい値が与えられる。即ち、重み係数A及びBは、スコアの算出に用いられる特徴パラメータ毎に予め記憶される。
スコア算出部250は、特徴パラメータ算出部240により算出された各種の特徴パラメータのうち、音声・音楽識別スコアS1の算出に用いる複数の特徴パラメータ(特徴パラメータセット)を選択する。この特徴パラメータセットは、例えばベクトルxで表される。
特徴パラメータセットxがn個の特徴パラメータを有する場合、音声・音楽識別スコアS1は、S1=A+A・x+A・x+……+A・xにより算出される。
また、スコア算出部250は、特徴パラメータ算出部240により算出された各種の特徴パラメータのうち、音楽・背景音識別スコアS2の算出に用いる複数の特徴パラメータ(特徴パラメータセット)を選択する。この特徴パラメータセットは、例えばベクトルyで表される。
特徴パラメータセットyがm個の特徴パラメータを有する場合、音楽・背景音識別スコアS2は、S2=B+B・y+B・y+……+B・yにより算出される。
なお、係数Aは、オーディオ信号の主成分が音楽である場合、音声・音楽識別スコアS1と1.0との差が最小になり、且つ、オーディオ信号の主成分が音声である場合、音声・音楽識別スコアS1と−1.0との差が最小になるように設定される。
また、重み係数Bは、オーディオ信号の主成分が音楽である場合、音楽・背景音識別スコアS2と1.0との差が最小になり、且つ、オーディオ信号の主成分が背景音である場合、音楽・背景音識別スコアS2と−1.0との差が最小になるように設定される。
図4乃至図6は、音響制御部200の処理の例を示す。
スコア算出部250は、特徴パラメータ算出部240から供給された各種の特徴パラメータに基づいて、音声・音楽識別スコアS1及び音楽・背景音識別スコアS2を算出する(ステップS11)。
スコア算出部250は、音声・音楽識別スコアS1が負数であるか否か判定する(ステップS12)。ステップS12で音声・音楽識別スコアS1が負数であると判定した場合、スコア算出部250は、音楽・背景音識別スコアS2が正数であるか否か判定する(ステップS13)。
ステップS13で音楽・背景音識別スコアS2が正数であると判定した場合、スコア算出部250の音声スコア算出部251は、音声スコアSSを音声・音楽識別スコアS1の絶対値に設定する(ステップS14)。さらに、スコア算出部250の音楽スコア算出部252は、音楽スコアSMを「0」に設定する(ステップS15)。
また、ステップS13で音楽・背景音識別スコアS2が正数ではないと判定した場合、スコア算出部250の音声スコア算出部251は、音声スコアSSをSS=|S1|+αs・|S2|に設定する(ステップS16)。即ち、音声スコア算出部251は、オーディオ信号に含まれる背景雑音に含まれる音声成分を考慮する為に、音楽・背景音識別スコアS2の絶対値を予め設定された係数αsで補正した値を音声・音楽識別スコアS1の絶対値に加算する。さらに、スコア算出部250の音楽スコア算出部252は、音楽スコアSMを「0」に設定する(ステップS17)。
スコア算出部250は、ステップS14乃至ステップS17で算出された音声スコアSS及び音楽スコアSMを安定化させる為の補正値(安定化補正値)SS3及びSM3を更新する(ステップS18)。例えば、スコア算出部250は、連続してCs回以上、音声スコアSSが正数(SS>0)であった場合、安定化補正値SS3及び安定化補正値SM3を更新する。
この場合、スコア算出部250は、既に算出されている安定化補正値SS3に、予め設定された所定の安定化係数βsを加算した値(SS3+βs)を、新たな安定化補正値SS3として更新する。また、スコア算出部250は、既に算出されている安定化補正値SM3から、予め設定された所定の安定化係数γmを減算した値(SM3−γm)を、新たな安定化補正値SM3として更新する。
また、ステップS12で音声・音楽識別スコアS1が負数ではないと判定した場合、スコア算出部250は、図5のステップS21に移行する。スコア算出部250は、音楽・背景音識別スコアS2が正数であるか否か判定する(ステップS21)。
ステップS21で音楽・背景音識別スコアS2が正数であると判定した場合、スコア算出部250の音声スコア算出部251は、音声スコアSSを「0」に設定する(ステップS22)。さらに、スコア算出部250の音楽スコア算出部252は、音楽スコアSMを音声・音楽識別スコアS1に設定する(ステップS23)。
また、ステップS21で音楽・背景音識別スコアS2が正数ではないと判定した場合、スコア算出部250の音声スコア算出部251は、音声スコアSSをSS=−S1+αs・|S2|に設定する(ステップS24)。即ち、音声スコア算出部251は、オーディオ信号に含まれる背景雑音に含まれる音声成分を考慮する為に、音楽・背景音識別スコアS2の絶対値を予め設定された係数αsで補正した値を音声・音楽識別スコアS1の負数(−S1)に加算する。
さらに、スコア算出部250の音楽スコア算出部252は、音楽スコアSMをSM=S1−αn・|S2|に設定する(ステップS25)。即ち、音楽スコア算出部252は、オーディオ信号に含まれる背景雑音に含まれる音楽成分を考慮する為に、音楽・背景音識別スコアS2の絶対値を予め設定された係数αmで補正した値を音声・音楽識別スコアS1から減算する。
スコア算出部250は、ステップS22乃至ステップS25で算出された音声スコアSS及び音楽スコアSMを安定化させる為の補正値(安定化補正値)SS3及びSM3を更新する(ステップS26)。例えば、スコア算出部250は、連続してCm回以上、音楽スコアSMが正数(SM>0)であった場合、安定化補正値SS3及び安定化補正値SM3を更新する。
この場合、スコア算出部250は、既に算出されている安定化補正値SS3から、予め設定された所定の安定化係数γsを減算した値(SS3−γs)を、新たな安定化補正値SS3として更新する。また、スコア算出部250は、既に算出されている安定化補正値SM3に、予め設定された所定の安定化係数βmを加算した値(SM3+βm)を、新たな安定化補正値SM3として更新する。
さらに、スコア算出部250は、図4のステップS18と、図5のステップS26で更新された安定化補正値SS3及び安定化補正値SM3をクリッピングする(ステップS19)。これにより、スコア算出部250は、安定化補正値SS3及び安定化補正値SM3が所定の範囲内の値になるように制御する。例えば、スコア算出部250は、安定化補正値SS3がSS3min≦SS3≦SS3maxの値になるように制御する。また、例えば、スコア算出部250は、安定化補正値SM3がSM3min≦SM3≦SM3maxの値になるように制御する。
さらに、スコア算出部250は、図6のステップS31に移行する。スコア算出部250は、ステップS26でクリッピングされた安定化補正値SS3及び安定化補正値SM3に基づいて、音声スコアSS及び音楽スコアSMを安定化させる(ステップS31)。例えば、スコア算出部250は、既に算出された音声スコアSSに安定化補正値SS3を加算する。また、スコア算出部250は、既に算出された音楽スコアSMに安定化補正値SM3を加算する。
スコア算出部250は、ノイズ・非ノイズ識別スコアS3を算出する(ステップS32)。例えば、スコア算出部250は、特徴パラメータSFMの統計量を算出することにより、ノイズ・非ノイズ識別スコアS3を生成する。この場合、スコア算出部250は、複数の周波数帯域(低域、中域、高域)毎のスペクトル平坦度に基づいてノイズ・非ノイズ識別スコアS3を算出する。
スコア算出部250は、ノイズ・非ノイズ識別スコアS3が正数であるか否か判定する(ステップS33)。ステップS33でノイズ・非ノイズ識別スコアS3が正数であると判定した場合、スコア算出部250のノイズスコア算出部253は、ノイズスコアSNをノイズ・非ノイズ識別スコアS3に設定する(ステップS34)。
また、ステップS33でノイズ・非ノイズ識別スコアS3が正数ではないと判定した場合、スコア算出部250のノイズスコア算出部253は、ノイズスコアSNを「0」に設定する(ステップS35)。
さらに、スコア算出部250は、ステップS36で設定されたノイズスコアSNに対して安定化補正処理及びクリッピングを行う(ステップS36)。
スコア算出部250は、スコア間調整補正を行う(ステップS37)。即ち、スコア算出部250は、音声スコアSS、音楽スコアSM、及びノイズスコアSNの間のバランスを調整する。例えば、スコア算出部250は、音楽スコアSM及びノイズスコアSNが予め設定された値より大きい場合、音楽スコアSMをノイズスコアSNに応じて低くするように補正する。
スコア算出部250は、上記の方法により算出された音声スコアSS、音楽スコアSM、及びノイズスコアSNをゲイン制御部280に供給する。
次に、マスキングレベル算出部260及びマスキングゲイン算出部270の動作について詳細に説明する。
マスキングレベル算出部260は、環境音入力端子124により受信した環境音と、聴覚特性として一般的に定められる周波数マスキング特性とに基づいて、ノイズマスキングレベルを算出する。周波数マスキング特性は、人間の聴覚特性として、ある音に対して周波数領域上でその周波数成分周辺(高域側と低域側の両方)の音が聞こえなくなくなる信号レベルを数値化したものである。例えば、マスキングレベル算出部260は、環境音の信号を時間周波数変換し、環境音の周波数特性を算出する。マスキングレベル算出部260は、環境音の個々の周波数成分に対して上記のマスキング特性を重ね合わせることにより環境音全体のマスキングレベルを算出する。マスキングレベル算出部260は、算出したマスキングレベルをマスキングゲイン算出部270に供給する。
マスキングゲイン算出部270は、マスキングレベル算出部260から供給されたマスキングレベルと、オーディオ信号とに基づいて、周波数毎にマスキングゲインGm[k]を算出する。これにより、マスキングゲイン算出部270は、オーディオ信号が環境音に埋もれないようにオーディオ信号をゲイン補正する為のマスキングゲインGm[k]を算出する。
例えば、マスキングゲイン算出部270は、算出したマスキングゲインGm[k]をゲイン制御部280に供給する。マスキングゲイン算出部270は、図7により示されるように、オーディオ信号の周波数特性(パワー)と、マスキングレベルとを重ねる。マスキングゲイン算出部270は、オーディオ信号の周波数特性をマスキングレベル以上の値に補正する為のゲイン(マスキングゲインGm[k])を周波数帯域毎に算出する。マスキングゲイン算出部270は、算出したマスキングゲインGm[k]をゲイン制御部280に供給する。
なお、kは、周波数帯域を示すインデックスである。また、マスキングゲイン算出部270は、過大なゲイン、及び時系列での急激なゲインの変化を防ぐ為に、クリッピング処理、または時間平滑化処理を必要に応じて行う構成であってもよい。
次に、ゲイン制御部280の動作について詳細に説明する。
図8は、ゲイン制御部280の動作の例を示す。
ゲイン制御部280は、スコア算出部250から供給された音声スコアSS、音楽スコアSM、及びノイズスコアSNを受信する。また、ゲイン制御部280は、マスキングゲイン算出部270から供給されたマスキングゲインGm[k]を受信する。上記したように、マスキングゲインGm[k]は、周波数帯域kを補正する為のゲインである。なお、ある時刻(フレーム)tのデータに基づいてマスキングゲイン算出部270により生成されたマスキングゲインをGm[t][k]と記載する。
マスキングゲイン算出部270は、上記のフレーム毎にマスキングゲインGm[t][k]を算出する。マスキングゲイン算出部270は、算出したマスキングゲインGm[t][k]を逐次ゲイン制御部280に供給する。
また、ゲイン制御部280は、逐次マスキングゲイン算出部270から供給されたマスキングゲインGm[t][k]を記憶するメモリ(ゲインメモリ)を備える。ゲイン制御部280は、このゲインメモリに記憶されているマスキングゲインGm[t][k]に基づいて、ゲインG[k]を時系列で平滑化する。
ゲイン制御部280には、平滑化に用いられる基準時間間隔(またはフレーム数)Nstが予め設定されている。なお、基準時間間隔を単に基準間隔と称する。ゲイン制御部280は、マスキングゲインGm[t][k]を上記の基準間隔で平滑化し、基準ゲインGst[t][k]を算出する(ステップS41)。ゲイン制御部280は、例えば、次の数式1により基準ゲインGst[t][k]を算出する。
Figure 2013009199
ゲイン制御部280は、算出した基準ゲインGst[t][k]をゲインG[k]として設定する(ステップS42)。
さらに、ゲイン制御部280は、高域のゲインに対して補正を行う。ゲイン制御部280には、周波数が低域であるか高域であるかを判別する為の閾値Khighを予め記憶するメモリを備える。ゲイン制御部280は、周波数帯域kが閾値Khighより大きいか否か判定する(ステップS43)。周波数帯域kが閾値Khighより大きい場合、ゲイン制御部280は、高域のゲインを補正する処理(高域ゲイン補正)を行う。
即ち、周波数帯域kが閾値Khighより大きい場合、ゲイン制御部280は、基準間隔Nstより長い時間間隔Nhighでゲインを平滑化し、高域ゲインGhigh[t][k]を算出する(ステップS44)。ゲイン制御部280は、例えば、次の数式2により高域ゲインGhigh[t][k]を算出する。
Figure 2013009199
即ち、ゲイン制御部280は、ゲインメモリにより記憶されている過去に算出したゲインのうち、間隔Nst及び間隔Nhighにそれぞれ対応するゲインを抽出し、抽出したゲインを用いて平滑化を行う。
ゲイン制御部280は、既に設定したゲインG[k]と高域ゲインGhigh[t][k]とを比較する。高域ゲインGhigh[t][k]がゲインG[k]より大きい場合、ゲイン制御部280は、高域ゲインGhigh[t][k]をゲインG[k]として設定する(ステップS45)。
なお、上記したように、高域のゲインの平滑化に用いられる間隔Nhighは、基準間隔Nstより長い。これにより、音響制御部200は、高域のゲインがより緩やかに減衰するようにゲイン変化するように制御することができる。
図9は、ゲイン制御部280からイコライザ220に供給されたゲインG[k]の例を示す。グラフ901乃至グラフ905は、それぞれ時間経過に伴うゲインG[k]の変化の様子を示す。なお、グラフ901は、最初にゲイン制御部280からイコライザ220に供給されたゲイン[k]を示す。グラフ902は、グラフ901の時点から一定時間経過後にゲイン制御部280からイコライザ220に供給されたゲイン[k]を示す。グラフ903は、グラフ902の時点から一定時間経過後にゲイン制御部280からイコライザ220に供給されたゲイン[k]を示す。グラフ904は、グラフ903の時点から一定時間経過後にゲイン制御部280からイコライザ220に供給されたゲイン[k]を示す。グラフ905は、最後にゲイン制御部280からイコライザ220に供給されたゲイン[k]を示す。
この例によると、Khighより低域の周波数帯域で基準ゲインGst[k]が採用されているのに対して、Khighより高域の周波数帯域で高域ゲインGhigh[k]が採用されている。この結果、高域のゲインは、低域のゲインに比べてより緩やかに減衰する。
上記したような構成によると、例えば、環境音が大きくなった場合、即ち、マスキングゲインGm[k]が小さい値から大きい値に変化する場合、音響制御部200は、ゲインG[k]として基準ゲインGst[k]を採用する。これにより、音響制御部200は、環境音増大時には速やかにオーディオ信号を追従させて補正することが出来る。
また、例えば、環境音が小さくなった場合、即ち、マスキングゲインGm[k]が大きい値から小さい値に変化する場合、音響制御部200は、高域のゲインG[k]として高域ゲインGhigh[k]を採用する。これにより、音響制御部200は、高域のオーディオ信号が緩やかに減衰するように補正することが出来る。この場合、音響制御部200は、高域の音が急激に減衰することでユーザに「こもり(高域の欠落感)」を与えることを防ぐことができる。この結果、より高品質の音響を実現することができる音響制御装置、音響補正装置、及び音響補正方法を提供することができる。
さらに、ゲイン制御部280は、オーディオ信号で支配的な音種別を判定する。即ち、ゲイン制御部280は、スコア算出部250から供給された音声スコアSS、音楽スコアSM、及びノイズスコアSNに基づいて、オーディオ信号で支配的な音種別を判定する。
まず、ゲイン制御部280は、音楽スコアSMが最も高いか否か判定する(ステップS46)。即ち、ゲイン制御部280は、音声スコアSSと音楽スコアSMとノイズスコアSNとを比較し、音楽スコアSMが最も高いか否か判定する。音楽スコアSMが最も高いと判定した場合、ゲイン制御部280は、音楽が支配的であると判定する。即ち、ゲイン制御部280は、音楽が主成分であると判定する。
ステップS46で音楽が支配的であると判定した場合、ゲイン制御部280は、基準間隔Nst及び間隔Nhighより長い時間間隔Nmusicでゲインを平滑化し、音楽用ゲインGmusic[t][k]を算出する(ステップS47)。ゲイン制御部280は、例えば、次の数式3により音楽用ゲインGmusic[t][k]を算出する。
Figure 2013009199
ゲイン制御部280は、既に設定したゲインG[k]と音楽用ゲインGmusic[t][k]とを比較する。音楽用ゲインGmusic[t][k]がゲインG[k]より大きい場合、ゲイン制御部280は、音楽用ゲインGmusic[t][k]をゲインG[k]として設定する(ステップS48)。
上記したように、音響制御部200は、音楽の再生中に環境音が変化した場合、より緩やかにゲインG[k]が変化するように制御する。このように、音響制御部200は、音楽のレベルが急激に減衰することでユーザに違和感を与えることを防ぐことができる。
ステップS46で音楽が支配的ではないと判定した場合、ゲイン制御部280は、ノイズスコアSNが最も高いか否か判定する(ステップS49)。即ち、ゲイン制御部280は、音声スコアSSと音楽スコアSMとノイズスコアSNとを比較し、ノイズスコアSNが最も高いか否か判定する。ノイズスコアSNが最も高いと判定した場合、ゲイン制御部280は、ノイズが支配的であると判定する。即ち、ゲイン制御部280は、ノイズが主成分であると判定する。
ステップS49でノイズが支配的であると判定した場合、ゲイン制御部280は、既に算出したゲインG[k]に予め設定された減衰係数α(α<1)を乗算する。ゲイン制御部280は、α・G[k]をゲインG[k]として設定する(ステップS50)。これにより、音響制御部200は、ノイズが増幅されることを防ぐことができる。 ゲイン制御部280は、ゲインメモリを更新する(ステップS51)。即ち、ゲイン制御部280は、逐次マスキングゲイン算出部270から供給されたマスキングゲインGm[t][k]をゲインメモリに追記する。
さらに、ゲイン制御部280は、全ての周波数帯域のゲインを算出したか否か判定する(ステップS52)。全ての周波数帯域のゲインを算出していない場合、ゲイン制御部280は、ステップS41に移行する。
全ての周波数帯域のゲインを算出した場合、ゲイン制御部280は、ゲインの平滑化を行う(ステップS53)。即ち、ゲイン制御部280は、算出した複数のゲインG[k]を周波数方向で平滑化する。これにより、音響制御部200は、周波数帯域間でゲインが突出することを防ぐことができる。
ゲイン制御部280は、平滑化を行ったゲインG[k]をイコライザ220に送信する(ステップS54)。これにより、音響制御部200は、1フレーム分の音響制御を終了する。
なお、本実施例のステップ44、ステップ47において平滑化フレーム数の増加によりゲイン係数の減衰時間延長を行っているが、減衰時間延長するための方法として直前のフレームのゲイン係数G[k]に減衰係数(1.0より小さい)を乗算することでゲイン係数を算出してもよい。本発明は、周波数帯域毎に減衰時間を制御することが主眼であり、減衰時間を制御(延長)することで同様の効果が得られる。
例えば、ゲイン制御部280は、上記したように時間によりマスキングゲインを平滑することにより算出されたゲインと、直前のフレームのゲインに減衰係数を乗算することにより算出されたゲインとのいずれか一方をイコライザ220に出力する。例えば、ゲイン制御部280は、操作入力、または予め設定された設定情報に基づいて出力するゲインを選択する。なお、ゲイン制御部280は、時間によりマスキングゲインを平滑する構成を備えず、直前のフレームのゲインに減衰係数を乗算する構成のみを備えていてもよい。
上記した音響制御部200は、環境音に応じて周波数帯域毎に適切な音響制御を行う。これにより、ユーザにこもり感を知覚させることを防ぐことができる。さらに、音響制御部200は、音種別に応じて適切な音響制御を行うことにより、ユーザに違和感を与えることを防ぐことができる。
なお、上述の各実施の形態で説明した機能は、ハードウエアを用いて構成するに留まらず、ソフトウエアを用いて各機能を記載したプログラムをコンピュータに読み込ませて実現することもできる。また、各機能は、適宜ソフトウエア、ハードウエアのいずれかを選択して構成するものであっても良い。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
100…放送受信装置、101…放送入力端子、110…アンテナ、111…チューナ、112…復調部、113…信号処理部、114…通信インターフェース、121…音声処理部、122…音声出力端子、124…環境音入力端子、131…映像処理部、132…OSD処理部、133…表示処理部、135…映像出力端子、150…制御部、151…CPU、152…ROM、153…RAM、154…EEPROM、161…操作入力部、162…受光部、163…リモートコントローラ、164…カードコネクタ、165…メモリカード、166…USBコネクタ、167…USB機器、170…ディスクドライブ、200…音響制御部、210…入力端子、220…イコライザ、230…出力端子、240…特徴パラメータ算出部、250…スコア算出部、251…音声スコア算出部、252…音楽スコア算出部、253…ノイズスコア算出部、260…マスキングレベル算出部、270…マスキングゲイン算出部、280…ゲイン制御部、300…スピーカ、400…ディスプレイ、500…マイク。

Claims (10)

  1. オーディオ信号を補正する音響補正部を備える音響補正装置に接続される音響制御装置であって、
    前記オーディオ信号を受信する第1の受信部と、
    環境音を受信する第2の受信部と、
    前記オーディオ信号と、前記環境音とに基づいて、周波数帯域ごとにマスキングゲインを算出するマスキングゲイン算出部と、
    予め設定された閾値未満の周波数帯域の前記マスキングゲインを第1の間隔で平滑化し、前記閾値以上の周波数帯域の前記マスキングゲインを前記第1の間隔より長い第2の間隔で平滑化してゲインを設定する第1のゲイン制御部と、
    前記第1のゲイン制御部により設定された前記ゲインを前記音響補正装置の音響補正部に出力する出力部と、
    を具備する音響制御装置。
  2. 前記第1のゲイン制御部により過去に算出された前記ゲインを記憶する記憶部をさらに具備し、
    前記第1のゲイン制御部は、前記記憶部により記憶されている前記ゲインから前記第1の間隔及び前記第2の間隔に対応する前記ゲインを抽出し、平滑化に用いる、
    請求項1に記載の音響制御装置。
  3. 前記第1のゲイン制御部は、前記閾値以上の周波数帯域の前記マスキングゲインを前記第1の間隔で平滑化して基準ゲインを算出し、前記閾値以上の周波数帯域の前記マスキングゲインを前記第2の間隔で平滑化して高域ゲインを算出し、前記基準ゲインと前記高域ゲインとを周波数帯域毎に比較し、より大きい値を前記ゲインとして採用する、請求項2に記載の音響制御装置。
  4. 前記オーディオ信号の主成分の音種を判別する音種判別部をさらに具備し、
    前記第1のゲイン制御部は、前記音種判別部により主成分の音種が音楽であると判別された場合、前記マスキングゲインを第2の間隔より長い第3の間隔で平滑化して音楽用ゲインを算出する、請求項3に記載の音響制御装置。
  5. 前記第1のゲイン制御部は、前記基準ゲインと、前記高域ゲインと、前記音楽用ゲインとを周波数帯域毎に比較し、最も大きい値を前記ゲインとして採用する、請求項4に記載の音響制御装置。
  6. 前記オーディオ信号の主成分の音種を判別する音種判別部をさらに具備し、
    前記第1のゲイン制御部は、前記音種判別部により主成分の音種がノイズであると判別された場合、前記ゲインに予め設定された減衰係数を乗算する、請求項3に記載の音響制御装置。
  7. 前記第1のゲイン制御部により過去に算出された前記ゲインを記憶する記憶部と、
    前記記憶部により記憶されている最も新しい前記ゲインに対して1より小さい予め設定された減衰係数を乗算し、乗算した値を前記ゲインとして設定する第2のゲイン制御部と、
    をさらに具備し、
    前記出力部は、前記第1のゲイン制御部により設定された前記ゲインと、前記第2のゲイン制御部により設定された前記ゲインとのいずれかを前記音響補正装置の音響補正部に出力する、
    請求項1に記載の音響制御装置。
  8. オーディオ信号を受信する第1の受信部と、
    環境音を受信する第2の受信部と、
    前記オーディオ信号と、前記環境音とに基づいて、周波数帯域ごとにマスキングゲインを算出するマスキングゲイン算出部と、
    予め設定された閾値未満の周波数帯域の前記マスキングゲインを第1の間隔で平滑化し、前記閾値以上の周波数帯域の前記マスキングゲインを前記第1の間隔より長い第2の間隔で平滑化してゲインを設定するゲイン制御部と、
    前記ゲイン制御部により設定された前記ゲインに基づいて前記オーディオ信号を補正する音響補正部と、
    前記音響補正部により補正された前記オーディオ信号を出力する出力部と、
    を具備する音響補正装置。
  9. 音を検出し、環境音として前記第2の受信部に供給するマイクをさらに具備する請求項8に記載の音響補正装置。
  10. オーディオ信号を受信し、
    環境音を受信し、
    前記オーディオ信号と、前記環境音とに基づいて、周波数帯域ごとにマスキングゲインを算出し、
    予め設定された閾値未満の周波数帯域の前記マスキングゲインを第1の間隔で平滑化し、前記閾値以上の周波数帯域の前記マスキングゲインを前記第1の間隔より長い第2の間隔で平滑化してゲインを設定し、
    設定された前記ゲインに基づいて前記オーディオ信号を補正し、
    補正された前記オーディオ信号を出力する、
    音響補正方法。
JP2011141099A 2011-06-24 2011-06-24 音響制御装置、音響補正装置、及び音響補正方法 Expired - Fee Related JP5085769B1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011141099A JP5085769B1 (ja) 2011-06-24 2011-06-24 音響制御装置、音響補正装置、及び音響補正方法
EP20120152044 EP2538559B1 (en) 2011-06-24 2012-01-23 Audio controlling apparatus, audio correction apparatus, and audio correction method
US13/415,513 US9002021B2 (en) 2011-06-24 2012-03-08 Audio controlling apparatus, audio correction apparatus, and audio correction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011141099A JP5085769B1 (ja) 2011-06-24 2011-06-24 音響制御装置、音響補正装置、及び音響補正方法

Publications (2)

Publication Number Publication Date
JP5085769B1 JP5085769B1 (ja) 2012-11-28
JP2013009199A true JP2013009199A (ja) 2013-01-10

Family

ID=45566837

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011141099A Expired - Fee Related JP5085769B1 (ja) 2011-06-24 2011-06-24 音響制御装置、音響補正装置、及び音響補正方法

Country Status (3)

Country Link
US (1) US9002021B2 (ja)
EP (1) EP2538559B1 (ja)
JP (1) JP5085769B1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014206609A (ja) * 2013-04-12 2014-10-30 コニカミノルタ株式会社 音響出力装置、およびこれを用いた画像形成装置
JP2019194742A (ja) * 2013-03-26 2019-11-07 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ分類および処理のための装置および方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013171089A (ja) * 2012-02-17 2013-09-02 Toshiba Corp 音声補正装置、方法、及びプログラム
CN107093991B (zh) * 2013-03-26 2020-10-09 杜比实验室特许公司 基于目标响度的响度归一化方法和设备
TWI546790B (zh) * 2015-05-27 2016-08-21 友達光電股份有限公司 源極驅動裝置及顯示訊號接收方法
JP2017216568A (ja) * 2016-05-31 2017-12-07 富士通株式会社 伝送装置
CN109831398B (zh) * 2018-12-29 2021-11-26 晶晨半导体(上海)股份有限公司 一种串行数据接收器的多级均衡器增益的自动调整方法
US11817114B2 (en) 2019-12-09 2023-11-14 Dolby Laboratories Licensing Corporation Content and environmentally aware environmental noise compensation
CN113473316B (zh) * 2021-06-30 2023-01-31 苏州科达科技股份有限公司 音频信号处理方法、装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009109791A (ja) * 2007-10-31 2009-05-21 Panasonic Corp 音声信号処理装置
JP2009175420A (ja) * 2008-01-24 2009-08-06 Toshiba Corp 音補正装置
JP2010092057A (ja) * 2009-10-29 2010-04-22 Fujitsu Ltd 受話音声処理装置及び受話音声再生装置
JP2010154388A (ja) * 2008-12-26 2010-07-08 Sony Corp 信号処理装置、その処理方法およびプログラム
JP2011065093A (ja) * 2009-09-18 2011-03-31 Toshiba Corp オーディオ信号補正装置及びオーディオ信号補正方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4553104A (en) * 1984-03-01 1985-11-12 Honeywell Inc. Method of compensating an amplifier system having a variable gain amplifier to achieve a constant overall system signal gain and an apparatus utilizing the same
JP2002330499A (ja) * 2001-04-27 2002-11-15 Pioneer Electronic Corp 自動音場補正装置及びそのためのコンピュータプログラム
US7013011B1 (en) * 2001-12-28 2006-03-14 Plantronics, Inc. Audio limiting circuit
JP2004061617A (ja) * 2002-07-25 2004-02-26 Fujitsu Ltd 受話音声処理装置
JP4282524B2 (ja) 2004-03-30 2009-06-24 三洋電機株式会社 Am受信回路
US7454335B2 (en) * 2006-03-20 2008-11-18 Mindspeed Technologies, Inc. Method and system for reducing effects of noise producing artifacts in a voice codec
JP4997833B2 (ja) * 2006-05-30 2012-08-08 沖電気工業株式会社 自動利得制御装置
US7991171B1 (en) * 2007-04-13 2011-08-02 Wheatstone Corporation Method and apparatus for processing an audio signal in multiple frequency bands
JP4973315B2 (ja) 2007-05-25 2012-07-11 ヤマハ株式会社 音響障害除去方法及び音場支援システム
US8515097B2 (en) * 2008-07-25 2013-08-20 Broadcom Corporation Single microphone wind noise suppression
US8229125B2 (en) * 2009-02-06 2012-07-24 Bose Corporation Adjusting dynamic range of an audio system
JP2010212898A (ja) 2009-03-09 2010-09-24 Sony Corp 音声信号処理装置及びテレビジョン受像機
JP5127754B2 (ja) * 2009-03-24 2013-01-23 株式会社東芝 信号処理装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009109791A (ja) * 2007-10-31 2009-05-21 Panasonic Corp 音声信号処理装置
JP2009175420A (ja) * 2008-01-24 2009-08-06 Toshiba Corp 音補正装置
JP2010154388A (ja) * 2008-12-26 2010-07-08 Sony Corp 信号処理装置、その処理方法およびプログラム
JP2011065093A (ja) * 2009-09-18 2011-03-31 Toshiba Corp オーディオ信号補正装置及びオーディオ信号補正方法
JP2010092057A (ja) * 2009-10-29 2010-04-22 Fujitsu Ltd 受話音声処理装置及び受話音声再生装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019194742A (ja) * 2013-03-26 2019-11-07 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ分類および処理のための装置および方法
JP2014206609A (ja) * 2013-04-12 2014-10-30 コニカミノルタ株式会社 音響出力装置、およびこれを用いた画像形成装置

Also Published As

Publication number Publication date
US20120328114A1 (en) 2012-12-27
JP5085769B1 (ja) 2012-11-28
EP2538559B1 (en) 2014-11-05
US9002021B2 (en) 2015-04-07
EP2538559A1 (en) 2012-12-26

Similar Documents

Publication Publication Date Title
JP5085769B1 (ja) 音響制御装置、音響補正装置、及び音響補正方法
US9865279B2 (en) Method and electronic device
KR101249239B1 (ko) 오디오 레벨 제어
JP4439579B1 (ja) 音質補正装置、音質補正方法及び音質補正用プログラム
US10176825B2 (en) Electronic apparatus, control method, and computer program
JP5012995B2 (ja) オーディオ信号処理装置及びオーディオ信号処理方法
JP2010513974A (ja) 音声データを処理するシステム
JP4982617B1 (ja) 音響制御装置、音響補正装置、及び音響補正方法
US9071215B2 (en) Audio signal processing device, method, program, and recording medium for processing audio signal to be reproduced by plurality of speakers
KR20130139074A (ko) 오디오 신호 처리 방법 및 이를 적용한 오디오 신호 처리 장치
KR102522567B1 (ko) 전자 장치 및 그 동작 방법
JP6039108B2 (ja) 電子機器、制御方法およびプログラム
JP5695896B2 (ja) 音質制御装置、音質制御方法及び音質制御用プログラム
JP2013106197A (ja) 音質制御装置、音質制御方法及び音質制御用プログラム
US20170257721A1 (en) Audio processing device and method
JP3627189B2 (ja) 音響電子回路の音量調節方法
KR102531634B1 (ko) 오디오 장치 및 그 제어방법
JP5330570B1 (ja) 映像処理装置および方法
US20120063612A1 (en) Acoustic signal corrector and acoustic signal correcting method
US8509457B2 (en) Tone balance volume control
JP2009206819A (ja) 音声信号処理装置、音声信号処理方法、音声信号処理プログラム、記録媒体、表示装置、並びに、表示装置用ラック
JP2018074219A (ja) 音声処理装置
JP2018019154A (ja) パラメトリックイコライザ装置、オーディオ再生装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120807

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120905

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150914

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees