以下、本発明に係る高域補完装置を備えたオーディオ再生装置について、図面を用いて詳細に説明を行う。
なお、本発明に係る高域補完装置を備えたオーディオ再生装置は、家庭に設置されるオーディオ再生装置であってもよく、携帯用オーディオ再生機器であってもよいが、車載用のオーディオ再生装置に用いることが好適であるといえる。
車室内は、車の駆動音や走行ノイズなどによりさまざまな騒音が発生する。このような環境において音楽の再生を行う車載用オーディオ再生装置では、騒音等により聴取される音楽が阻害されないように、低域や高域のレベルを強調するためのイコライザー機能等を備えるものが多く存在する。特に、車室が閉鎖された空間であることから、このようにオーディオ信号の低域や高域を強調することにより、音楽の臨場感を高めることが可能となる。
このように高域を強調する場合において、圧縮されたデジタルオーディオ信号では、その圧縮方式に応じて高域部分のオーディオ情報が削除される可能性がある。このため、高域の強調をより効果的にするためにも、高域の補完を行うことが好ましい。
さらに、車載用のオーディオ再生装置では、車内の限られた空間にスピーカ等が設置されることになるため、その設置位置に制限が生じる。特に、車載用のスピーカ等では、できる限り小型、軽量なものを設置することが多いため、高域の再生特性の劣ったスピーカを採用することが多かった。このため、ユーザにとっては、車内で音楽を聴取する場合に、高域の再生特性が不十分であると感じられる場合があり、音質に不満を生じやすい傾向があるという傾向がある。
このため、本発明に係る高域補完装置を備えたオーディオ再生装置は、車載用のオーディオ再生装置に用いることが好適であるといえる。
図1は、本発明に係る高域補完装置を備えたオーディオ再生装置を示したブロック図である。オーディオ再生装置1は、オーディオ再生部2と、高域補完部(高域補完装置)3と、オーディオ出力部4と、操作部5と、制御部6と、帯域幅設定部(高域補完装置)7とを有している。
なお、図1に示す黒矢印は、制御部6からオーディオ再生部2、高域補完部3、操作部5および帯域幅設定部7に対する制御信号の入出力状態を示しており、白矢印は、アナログ再生部により出力される高域補完前の(アナログ)オーディオ信号の入出力状態、および高域補完部3により高域補完がなされた後の(アナログ)オーディオ信号の入出力状態を示している。
オーディオ再生部2は、CD、MD、DVDなどの所定のメディアから所定圧縮方式で圧縮処理されたデジタルオーディオ信号を読み出してアナログのオーディオ信号に変換(デコード処理)した後に再生(出力)する機能を有している。具体的にオーディオ再生部2では、制御部6からの指示に従って、再生対象とするメディアの選択、読み出した音楽情報の再生、一時停止、停止などの処理が行われる。
なお、制御部6からオーディオ再生部2に対して、オーディオ信号の再生制御が行われた場合、オーディオ再生部2では、メディアから読み出されたデジタルオーディオデータの拡張子情報に基づいて、あるいはデジタルオーディオデータのヘッダ部分に記録される情報に基づいて、オーディオ信号の圧縮方式を判断する。本実施の形態に係るオーディオ再生部2では、WMA(Windows(登録商標) Media Audio)、MP3(MPEG Audio Layer-3)、AAC(Advanced Audio Coding:登録商標)、HE−AAC(High-Efficiency Advanced Audio Coding(登録商標))、MP3Pro、Apple Lossless(Apple(登録商標) Lossless Audio Codec、ALAC)、WMA Lossless、ATRAC(Adaptive TRansform Acoustic Coding:登録商標) Advanced Lossless、Monky’s Audio、FLAC(Free Lossless Audio Codec)等の圧縮方式を判断することが可能である。
これらの圧縮方式のうち、HE−AAC方式やMP3Pro方式は、圧縮しても高域のオーディオ信号が含まれる圧縮方式である。また、Apple Lossless、WMA Lossless、ATRAC Advanced Lossless、Monky’s Audio、FLAC等の圧縮方式は、デコード処理によりデータの欠陥の生じない(Lossless)圧縮方式であるため、オーディオ再生部2において、Lossless方式として判断される。
オーディオ再生部2では、圧縮されたオーディオ信号のデコード処理を圧縮方式に応じて実行し、アナログ形式のオーディオ信号へと変換する。オーディオ再生部2においてデコード処理されたオーディオ情報は、高域補完部3へ出力される。
なお、オーディオ再生部2では、デコード処理に基づいてオーディオ情報のサンプリングレートとビットレートを求める。求められたサンプリングレート、ビットレート、オーディオ信号の圧縮方式情報は、デコード情報として、制御部6に送信される。
オーディオ出力部4は、高域補完部3を経て再生(出力)されたオーディオ信号を、聴取者が聴覚により聴取できるように出力する機能を有している。オーディオ出力部4として、一般的にスピーカが用いられる。
帯域幅設定部7は、オーディオ再生部2において求められたデコード情報(サンプリングレート、ビットレート、圧縮方式情報)を、制御部6より受信して、オーディオ再生部2でデコード処理されたオーディオ信号の帯域幅情報を求める役割を有している。
オーディオ信号の帯域幅情報とは、デコードされたオーディオ信号に関して、音楽情報が記録されている高域上限の周波数の値(所定周波数)を示している。一般に、メディアに記録されるデジタルオーディオ信号は、データ量の低減を目的として、人間が聴取できない高域周波数帯域のデータを削除してデータの圧縮処理が行われている。このため、オーディオ再生部2においてデコード処理が行われたオーディオ信号には、圧縮処理に際して削除されてしまった高域帯域の情報が含まれていないことになる。
この削除された高域のオーディオ信号の周波数を判断することは容易ではない。一般に、削除された高域周波数帯域(帯域幅)は、デジタルオーディオ信号の圧縮方式により異なり、さらに、そのサンプリングレートおよびビットレートによっても変動するため、画一的に削除された帯域幅を求めることが容易ではなかった。厳密に削除された帯域幅情報を得るために、周波数解析用のプロセッサを用いて演算処理を行う方法を用いることもできるが、この方法を用いて帯域幅情報を算出する場合には、高い処理能力が必要とされるので、処理負担の増大や高価なプロセッサ等が必要になってしまうという問題があった。
一方で、オーディオ信号の圧縮方式と、そのサンプリングレートと、ビットレートとを抽出して場合分けすることにより、データの削除が行われた帯域幅を推定することができる。このため、帯域幅設定部7には、図2に示すように、帯域幅の設定を行うための帯域幅設定テーブルが設けられている。
帯域幅設定テーブルでは、WMA、MP3、AAC、HE−AAC等のそれぞれの圧縮方式が、サンプリングレート毎(例えば、44.1kHz、48.0kHz、32.0kHz等)に分類されており(帯域幅設定テーブルの第1列の情報)、分類された各圧縮方式に対応する帯域幅情報が、ビットレートの値(帯域幅設定テーブルの第1行の情報)に応じて求められるように規定されている。また、帯域幅設定テーブルには、各種Lossless方式の場合も規定されている。
例えば、圧縮方式がMP3、サンプリングレートが44.1kHz、ビットレートが96kbpsである場合には、図2に示す帯域幅設定テーブルより帯域幅として12kHzが求められる(設定される)。なお、HE−AAC方式およびMP3Pro方式は、圧縮しても高域のオーディオ信号が含まれる圧縮方式であるため、デコード処理されたオーディオ信号に対して高域補完処理を行う必要がない。したがって、帯域幅設定テーブルには、高域補完処理を行う必要がないことを示すOFF情報が記録されている。また、各種Lossless方式も、デコード処理によりデータの欠陥の生じない(Lossless)圧縮方式であるため、高域補完処理を行う必要がない。このため、帯域幅設定テーブルには、高域補完処理を行う必要がないことを示すOFF情報が記録されている。
さらに、オーディオ信号のビットレートが低い場合(ビットレートが32kbps〜40kbpsあたりの場合)には、高域補完を行っても効果的な音質向上が見込まれないため、帯域幅設定テーブルの低ビットレートに該当する箇所には、高域補完処理を行わないことを示すOFF情報が記録されている。さらに、オーディオ信号のビットレートが高い場合(ビットレートが192kbpsあたりの場合)には、そのビットレート値の高さから高域周波数において十分な周波数成分が含まれているため、高域補完を行う必要性が低くなる。このため、帯域幅設定テーブルの高ビットレートに該当する箇所には、高域補完処理を行わないことを示すOFF情報が記録されている。
各圧縮方式に対応する帯域幅情報は、本実施の形態に係るオーディオ再生装置1において再生される音楽の種類や、オーディオ再生装置1の設置環境などによって変更・調整することが可能となっている。各帯域幅情報は、音楽の種類や設置環境などに応じて統計的に決定されている。
このように、帯域幅設定テーブルを用いて帯域幅情報の設定を行い、設定された帯域幅情報より求められる周波数値を基準として多次のハイパスフィルタおよびローパスフィルタを適用することによって、所定の周波数帯域において連続的なスペクトルを備えた補完信号を生成することが可能となる。この補完信号の生成方法については、後述する。
また、帯域幅設定テーブルを用いて帯域幅情報の設定を行うことによって、高価な解析処理用のプロセッサなどを用いることなく帯域幅を求めることができる。このため、処理負担の増大および処理コストの上昇を抑えることが可能となる。
帯域幅設定部7において求められた帯域幅情報は、制御部6に出力される。
操作部5は、オーディオ再生装置1のフロントパネル部などに設置される操作ボタンであって、聴取者が各種設定などを行うために用いるものである。本実施の形態に係るオーディオ再生装置1では、少なくとも、オーディオ再生部2における音楽の再生ボタン、停止ボタン、音源メディア(ソース)選択ボタンを供えている。これらのボタンが聴取者に操作されると、操作されたボタン(操作内容)に関する操作情報が制御部6に伝達される。
制御部6は、操作部5より操作情報を受信し、受信された操作情報に基づいて、オーディオ再生部2における再生対象メディアの種類、読み出した音楽情報の再生、一時停止、停止などの処理内容を判断して、オーディオ再生部2に制御信号を出力する。オーディオ再生部2では、受信された制御信号に基づいて、該当するメディアに記録されるオーディオ信号の再生・停止処理が行われる。
また、制御部6は、オーディオ再生部2により受信したデコード情報(サンプリングレート、ビットレート、圧縮方式情報)を、帯域幅設定部7に出力することにより、帯域幅設定部7において、デコード情報に対応する帯域幅を求めさせる。制御部6では、帯域幅設定部7において求められた帯域幅情報を、高域補完部3に出力するとともに、高域補完部3の駆動制御を行う。制御部6における具体的な処理内容については、後で図面を用いて詳細に説明する。
高域補完部3は、オーディオ再生部2により再生されたオーディオ信号の高域補完を行う役割を有している。既に説明したように、圧縮されたデジタルオーディオ信号では、人間が聴取できない高域周波数帯域のデータが削除されている場合がある。このため、削除された高域周波数帯域のオーディオ信号を補完することにより高域の音質向上を図ることが好ましいが、削除された高域データは、圧縮方式、サンプリングレートおよびビットレートに応じて削除された帯域が異なる。このため、本実施の形態に係るオーディオ再生装置では、高域のオーディオ信号の情報が削除された周波数を示す帯域幅情報を、制御部6から取得することにより、好適に高域周波数の補完を行う。
図3は高域補完部3の概略構成を示したブロック図である。
高域補完部3は、第1ハイパスフィルタ部(ハイパスフィルタ手段)10と、サンプリング変換部11と、第2ハイパスフィルタ部(補完信号生成手段)12と、ローパスフィルタ部(補完信号生成手段)13と、ゲイン部(補完信号生成手段)14と、加算部15と、パラメータ設定部16(パラメータ設定手段)とを有している。
パラメータ設定部16は、制御部6より受信した帯域幅情報に基づいて、第1ハイパスフィルタ部10、第2ハイパスフィルタ部12およびローパスフィルタ部13のカットオフ周波数を設定し、サンプリング変換部11におけるサンプリング変換レートβを設定し、さらにゲイン部14における高域補完ゲインの値を設定する役割を有している。
具体的な各種内容の設定情報は、予め帯域幅に応じて各情報の値が記録されているパラメータ設定テーブルに基づいて、パラメータ設定部16が設定する。図4は、本実施の形態に係る高域補完部3のパラメータ設定テーブルを示したものである。パラメータ設定テーブルには、制御部6より取得する帯域幅情報に対応するサンプリング変換レートβの値、第1ハイパスフィルタ部10のカットオフ周波数の値[kHz]、第2ハイパスフィルタ部12のカットオフ周波数の値[kHz]、ローパスフィルタ部13のカットオフ周波数の値[kHz]、ゲイン部14の高域補完ゲインの設定値[dB]が記録されている。
本実施の形態に係るパラメータ設定テーブルでは、帯域幅情報として8kHz〜18kHzまでの情報が記録されている。この帯域幅情報は、帯域幅設定テーブルにおいて設定され得る帯域幅情報に対応した値となっている。
また、帯域幅に対応して設定されるサンプリング変換レートβは、帯域幅の値が大きな値になるに応じて、サンプリングレート変換レートβの値が小さくなるように設定されている。具体的には、帯域幅が8kHz〜14kHzの場合にサンプリング変換レートβの値が16に設定され、帯域幅が15kHz〜18kHzの場合にサンプリング変換レートβの値が8に設定される。このように、サンプリング変換レートβの値が16および8に設定されるのは、後述するように、オーディオ信号のダウンサンプリング処理およびアップサンプリング処理に基づく折り返し(エイリアシング)現象により生成される補完信号の信号精度を高めるためである。
また、帯域幅の値が大きい場合(15kHz〜18kHzの場合)にサンプリング変換レートβの値が8に設定されるのは、帯域幅の値が高い値である場合に、低い値である場合に比べて削除される高域周波数成分が少なくなるため、生成され得る補完信号における折り返し現象の繰り返し回数を少なくすることにより、削除される直前の周波数帯域におけるオーディオ信号の信号特性を広い帯域幅で利用することができるようにしたものである。
さらに、帯域幅の値が大きくなるに応じて、第1ハイパスフィルタ部10のカットオフ周波数の値[kHz]、第2ハイパスフィルタ部12のカットオフ周波数の値[kHz]、ローパスフィルタ部13のカットオフ周波数の値[kHz]が高くなるように設定されている。これは、補完信号の作成時において、データの削除が行われる直前の周波数帯域の情報を有効に用いて補完信号生成するために、帯域幅の値に対応させて各フィルタ部10、12、13のカットオフ周波数を変更させる構成としたためである。
なお、各フィルタ部10、12、13のカットオフ周波数の値は、帯域幅の値に加えて、サンプリング変換レートβの値にも依存した設定となっている。例えば、サンプリング変換レートβが16に設定される帯域幅(8kHz〜14kHz)では、帯域幅の値が1ずつ上昇する毎に、カットオフ周波数も1ずつ上昇しているが、サンプリング変換レートβの値が8に設定される帯域幅(15kHz〜18kHz)では、その上昇割合が、帯域幅の上昇よりも鈍くなるように設定されている。
一方で、高域補完ゲインの値は、帯域幅の値が小さくなると、帯域幅に応じて値が小さくなるように設定されており、高域補完された信号のレベルが聴感的に違和感を与えないように設定が行われている。例えば、オーディオ信号の種類(内容)によって異なるが、帯域幅が8kHzの場合には、この帯域幅にボーカル音が含まれることもあり得る。このため、帯域幅の値が低い場合に高域補完ゲインを高い値に設定してしまうと、補完処理によりボーカル音に違和感を与えてしまうおそれが生ずる。したがって、本実施の形態に係るゲイン部14では、帯域幅の値が小さくなるに応じて高域補完ゲインの値を小さく設定することにより、補完されたオーディオ信号における聴覚上の違和感を低減させることが可能となっている。
第1ハイパスフィルタ部10は、オーディオ再生部2より入力されるオーディオ信号より、高域周波数成分の抽出を行う役割を有している。本実施の形態に係る第1ハイパスフィルタ部10は、4次のバタワースハイパスフィルタにより構成されており、図5に示すように、4kHz〜18kHzのカットオフ周波数を備えたフィルタ特性を有している。第1ハイパスフィルタ部10では、パラメータ設定部16において設定されるカットオフ周波数の値に応じて対応する特性のハイパスフィルタが用いられる。
サンプリング変換部11は、第1ハイパスフィルタ部10により抽出された高域周波数成分のオーディオ信号に基づいて補完信号を生成する役割を有している。サンプリング変換部11は、図6に示すように、ダウンサンプリング部(ダウンサンプリング処理手段)20と、ゲイン補完部21と、アップサンプリング部(アップサンプリング手段)22とを有している。
サンプリング変換部11では、パラメータ設定部16において設定されたサンプリング変換レートβに基づいて、ダウンサンプリング部20で高域周波数成分のオーディオ信号(第1ハイパスフィルタ部10で、高域周波数抽出が行われたオーディオ信号)のダウンサンプリング処理を行った後に、サンプリング変換レートβに基づいて、ゲイン補完部21で、ダウンサンプリングされたオーディオ信号のゲイン補完を行い、その後、サンプリング変換レートβに基づいて、アップサンプリング部22で、ゲイン補完が行われたオーディオ信号のアップサンプリング処理を行う。
図7および図8は、ダウンサンプリング処理およびアップサンプリング処理により生ずる折り返し(エイリアシング)を利用して、補完信号を生成する過程を説明した図である。図7では、ダウンサンプリング処理およびアップサンプリング処理におけるサンプリング変換レートβの値が2の場合および4の場合を示しており、図8では、サンプリング変換レートβの値が8の場合および16の場合を示している。
図7(a)および図8(a)は、サンプリング周波数が48kHz、帯域幅の値が12のオーディオ信号に対して、第1ハイパスフィルタ部10でフィルタ処理を行うことにより高域周波数成分が抽出された信号の周波数特性を示している。第1ハイパスフィルタ部10により高域周波数成分の抽出が行われたオーディオ信号に対して、サンプリング変換レートβの値を2に設定してダウンサンプリング処理を行うと、図7(b)に示すようにサンプリング周波数が24kHzとなり、帯域幅が半分(1/2)となる。このように帯域幅が半分となったオーディオ信号にアップサンプリング処理を行うと、図7(c)に示すように、12kHzを中心として折り返し成分が発生し、アップサンプリング処理されたオーディオ信号に折り返し現象が生ずることになる。
一方で、第1ハイパスフィルタ部10により高域周波数成分の抽出が行われたオーディオ信号に対して、サンプリング変換レートβの値を4に設定してダウンサンプリング処理を行うと、図7(d)に示すようにサンプリング周波数が12kHzとなり、帯域幅が1/4となる。このように帯域幅が1/4となったオーディオ信号にアップサンプリング処理を行うと、図7(e)に示すように、6kHz、12kHz、18kHzを中心として折り返し成分が発生し、アップサンプリング処理されたオーディオ信号において共通する周波数特性を示す部分が4カ所繰り返しして発生することになる。
また、第1ハイパスフィルタ部10により高域周波数成分の抽出が行われたオーディオ信号に対してサンプリング変換レートβの値を8に設定してダウンサンプリング処理を行うと、図8(b)に示すようにサンプリング周波数が6kHzとなり、帯域幅が1/8となる。このように帯域幅が1/8となったオーディオ信号にアップサンプリング処理を行うと、図8(c)に示すように、3kHz、6kHz、9kHz、・・・、21kHzを中心として折り返し成分が発生し、アップサンプリング処理されたオーディオ信号において共通する周波数特性を示す部分が8カ所繰り返しして発生することになる。
さらに、第1ハイパスフィルタ部10により高域周波数成分の抽出が行われたオーディオ信号に対してサンプリング変換レートβの値を16に設定してダウンサンプリング処理を行うと、図8(d)に示すようにサンプリング周波数が3kHzとなり、帯域幅が1/16となる。このように帯域幅が1/16となったオーディオ信号にアップサンプリング処理を行うと、図8(e)に示すように、1.5kHz、3kHz、4.5kHz、6kHz、・・・、22.5kHzを中心として折り返し成分が発生し、アップサンプリング処理されたオーディオ信号において共通する周波数特性を示す部分が16カ所繰り返しして発生することになる。
このように、アップサンプリング処理およびダウンサンプリング処理を行うことにより、第1ハイパスフィルタ部10により抽出された高域周波数成分(帯域幅の値に対応するオーディオ信号の周波数成分)を用いて、全周波数領域にわたって複数コピーされた補完信号を作成することが可能となる。なお、ダウンサンプリング処理を行った後に、サンプリング変換レートβに応じたゲイン補完を行うのは、ダウンサンプリング処理により低下したエネルギー値を補正するためである。
第2ハイパスフィルタ部12およびローパスフィルタ部13は、サンプリング変換部11により生成された補完信号の高域成分抽出および低域成分抽出を行うことにより、特定の帯域の補完信号を抽出する役割を有している。
本実施の形態に係る第2ハイパスフィルタ部12は、4次のバタワースハイパスフィルタにより構成されており、図5に示すように、第1ハイパスフィルタ部10と同様のフィルタ特性を有している。第2ハイパスフィルタも、第1ハイパスフィルタと同様に、4kHz〜18kHzのカットオフ周波数を備えたフィルタ特性を有しており、パラメータ設定部16において設定されるカットオフ周波数の値に応じて対応する特性のハイパスフィルタが用いられる。
また、本実施の形態に係るローパスフィルタ部13は、2次のバタワースローパスフィルタにより構成されており、図9に示すように、6kHz〜20kHzのカットオフ周波数を備えたフィルタ特性を有している。ローパスフィルタ部13には、パラメータ設定部16において設定されるカットオフ周波数の値に応じて対応する特性のローパスフィルタが用いられる。
ゲイン部14は、第2ハイパスフィルタ部12およびローパスフィルタ部13により帯域補完が成された補完信号のゲイン調整を行う役割を有している。ゲイン部14において設定される高域補完ゲインの設定値は、上述したように、パラメータ設定部16でパラメータ設定テーブルに基づいて設定される。
ゲイン部14によりゲイン調整がなされた補完信号は、加算部15によりオーディオ再生部2より入力されたオーディオ信号と合成される。この加算部15によるオーディオ信号と補完信号との合成により、高域周波数帯域に対する補完処理の行われたオーディオ信号が、オーディオ出力部4へ出力されることになる。
オーディオ出力部4では、高域補完部3により高域周波数成分の補完処理が行われたオーディオ信号の音声出力処理を行う。オーディオ出力部4により出力されるオーディオ信号は、高域補完部3において高域周波数成分の補完処理が行われているため、高域補完処理が行われていないオーディオ信号に比べて、高域部分の音響効果が向上されたものとなる。
さらに、オーディオ信号の高域補完処理を行う場合には、帯域幅設定部7で設定された帯域幅に基づいて、高域補完処理用の各種パラメータがパラメータ設定部16で適切に設定されて補完信号が生成される。このため、圧縮処理により削除されてしまったオーディオ信号の周波数帯域(オーディオ信号の所定の帯域幅)の高域補完を行う際に、補完処理を行う周波数部分と、圧縮処理によりデータが削除されてしまった周波数部分との間にデータの補完されていない箇所が生じてしまうことがなくなる。したがって、周波数的に連続した周波数スペクトルを形成するようにして高域信号の補完を行うことができ、補完処理によって音楽全体のバランスを損なうような補完が行われてしまうことを防止することが可能となる。
さらに、高域補完部3における補完信号の生成処理は、数タップのIIRフィルタ(Infinite Impulse Response Filter)により構成される第1ハイパスフィルタ部10、第2ハイパスフィルタ部12、ローパスフィルタ部13や、簡易な構成により処理が実現されるサンプリング変換部11などにより行うことができるため、信号処理の負担軽減を実現することが可能となり、高価なプロセッサなどを用いる必要がない。
次に、制御部6において行われる処理を、図10に示すフローチャートに基づいて説明する。なお、説明の便宜上、ユーザが操作部5を操作することによりオーディオ再生部2においてオーディオ信号の再生処理を行う場合について説明を行うこととし、オーディオ再生部2により再生されるオーディオ信号のデコード情報は、圧縮方式がMP3、サンプリングレートが44.1kbps、ビットレートが96kbpsとする。
まず、制御部6は、操作部5より取得した再生情報に基づいて、オーディオ再生部2を制御してメディアに記録されるオーディオ信号の再生処理を実行させる(ステップS.1)。オーディオ再生部2では、制御部6の指示に応じてメディアからオーディオ信号のデジタル情報を読み出し、オーディオ信号の圧縮方式を求める。そして求められた圧縮方式に対応するデコーダを選択して、読み出されたデジタル情報のデコード処理を行い、オーディオ信号を高域補完部3に出力する。また、オーディオ再生部2では、求められた圧縮方式と、オーディオ信号のサンプリングレートとビットレートとを制御部6に送信する。
本実施の形態では、上述したように、圧縮方式がMP3、サンプリングレートが44.1kbps、ビットレートが96kbpsとなるデコード情報が、オーディオ再生部2から制御部6に送信される。
その後、制御部6は、オーディオ再生部2より、オーディオ信号の圧縮方式、サンプリングレート、ビットレートに関する情報(デコード情報)を受信し(ステップS.2)、受信した圧縮方式、サンプリングレート、ビットレートに関する情報を帯域幅設定部7に送信する(ステップS.3)。
帯域幅設定部7では、図2に示した帯域幅設定テーブルを参照し、制御部6より受信した圧縮方式、サンプリングレート、ビットレートに基づいて、帯域幅の設定を行う。本実施の形態では、圧縮方式がMP3、サンプリングレートが44.1kbps、ビットレートが96kbpsであるため、図2に示す帯域幅設定テーブルに基づいて帯域幅の値12が設定される。設定された帯域幅の値12は、帯域幅設定部7から制御部6に対して送信される。
制御部6は、帯域幅設定部7より帯域幅情報を受信し(ステップS.4)、受信した帯域幅情報がOFFでないか否かを判断する(ステップS.5)。受信した帯域幅情報がOFFでない場合(ステップS.5においてNoの場合)、つまり、帯域幅情報として帯域幅設定部7により設定された帯域幅の数値を受信した場合、制御部6は、帯域幅情報を高域補完部3のパラメータ設定部16に送信する(ステップS.6)。
パラメータ設定部16では、図4に示すパラメータ設定テーブルを参照して、受信した帯域幅に対応するサンプリング変換レートβの値、第1ハイパスフィルタ部10のカットオフ周波数の値、第2ハイパスフィルタ部12のカットオフ周波数の値、ローパスフィルタ部13のカットオフ周波数の値、ゲイン部14の高域補完ゲインの値を設定する。設定された値は、それぞれサンプリング変換部11におけるサンプリング変換レートβの設定値、第1ハイパスフィルタ部10におけるカットオフ周波数の設定値、第2ハイパスフィルタ部12におけるカットオフ周波数の設定値、ローパスフィルタ部13におけるカットオフ周波数の設定値、ゲイン部14における高域補完ゲインの設定値としてそれぞれ設定される。
本実施の形態に係るオーディオ再生装置1では、制御部6によりオーディオ信号の帯域幅として設定された12kHzの情報がパラメータ設定部16に伝達される。このため、パラメータ設定部16では、図4に示すパラメータ設定テーブルに基づいて、サンプリング変換レートβの設定値として16、第1ハイパスフィルタ部10のカットオフ周波数として10kHz、第2ハイパスフィルタ部12のカットオフ周波数として13kHz、ローパスフィルタ部13のカットオフ周波数として13kHz、ゲイン部14の高域補完ゲインの設定値として−4dBを設定する。
パラメータ設定部16により設定された設定値に基づいて各機能部10〜14のパラメータが設定された後、各機能部10〜14は設定されたパラメータに基づいて、高域補完処理を実行する。
オーディオ再生部2より入力されるオーディオ信号が図11(a)に示すような周波数特性を有している場合には、カットオフ周波数を10kHzに設定した第1ハイパスフィルタ部10を用いて、図11(b)に示すような高域周波数成分の抽出が行われる。その後、サンプリング変換部11におけるダウンサンプリング処理、ゲイン補完処理およびアップサンプリング処理により、補完信号が生成される。本実施の形態に係るサンプリング変換部11では、第1ハイパスフィルタにより抽出された高域成分(10kHz〜12kHzあたり)が、図12(a)に示すように全周波数帯域に応じて複数コピーされて補完信号が生成される。
その後、第2ハイパスフィルタ部12およびローパスフィルタ部13により帯域補完が行われた補完信号は、ゲイン部14においてゲイン調整が行われ、図12(b)に示すように、もとのオーディオ信号の周波数特性に適した高域補完信号が生成される。その後、加算部15において、図11(a)に示すオーディオ信号と、図12(b)に示す高域補完信号とが合成されることにより、図13に示すような高域成分(本実施の形態では、12kHzよりも高域の成分)のオーディオ信号を補完したオーディオ信号を生成することが可能となる。
特に、図13に示すように、高域成分の補完が行われたオーディオ信号は、オーディオ信号の帯域幅に基づいて設定されたパラメータを用いて補完信号が生成されるため、周波数スペクトルにおいて高域補完部分の特性が連続な特性を示すように補完処理を行うことができる。このため、高域補完処理が行われたオーディオ信号は、高域補完処理により高域周波数成分が好適に補完(生成)されることになり、聴取された音楽の特性を最適な状態にすることが可能となる。
一方で、受信した帯域幅情報がOFFである場合(ステップS.5においてYesの場合)、制御部6は、高域補完部3のパラメータ設定部16に対して高域補完処理を行わない旨の情報(例えば、OFF情報)を送信する(ステップS.7)。パラメータ設定部16では、OFF情報をパラメータ設定部16で受信し、受信したOFF情報により高域補完処理を行わない旨を判断する。そして、パラメータ設定部16は、第1ハイパスフィルタ部10、サンプリング変換部11、第2ハイパスフィルタ部12、ローパスフィルタ部13、ゲイン部14における処理を停止させる。この停止処理により、高域補完部3に入力されたオーディオ信号に対する高域補完処理が行われなくなる。
なお、第1ハイパスフィルタ部10、サンプリング変換部11、第2ハイパスフィルタ部12、ローパスフィルタ部13、ゲイン部14における処理が停止される場合であっても、図3に示すように、高域補完部3は、高域補完処理のなされていないオーディオ信号を、そのままオーディオ出力部4に出力することが可能な構成となっている。このため、本実施の形態に係る高域補完部3では、各機能部10〜14の機能が停止されている場合であっても、高域補完処理がなされていないオーディオ信号をオーディオ出力部4に出力することができる。
また、上述した処理では、パラメータ設定部16がOFF情報の取得に応じて、第1ハイパスフィルタ部10、サンプリング変換部11、第2ハイパスフィルタ部12、ローパスフィルタ部13、ゲイン部14における処理を停止させる構成を説明したが、パラメータ設定部16ではなく、制御部6が直接、第1ハイパスフィルタ部10、サンプリング変換部11、第2ハイパスフィルタ部12、ローパスフィルタ部13、ゲイン部14における処理を停止させる構成とするものであってもよい。
その後、制御部6は、再生停止情報を受信したか否かを判断する(ステップS.8)。再生停止情報とは、オーディオ再生部2におけるオーディオ信号のデコード処理を終了させる必要が生ずる情報を意味しており、例えば、オーディオ信号の出力処理を停止させるために、ユーザが停止ボタンを操作することにより、操作部5から制御部6に対して送信される停止操作情報や、オーディオ再生部2がメディアに記録されているオーディオ情報を全て読み出してしまって、再生処理を終了する場合に、オーディオ再生部2から制御部6に対して送信される再生終了情報等が該当する。
再生停止情報を受信した場合(ステップS.8においてYesの場合)、制御部6は、オーディオ再生部2に対してオーディオ再生処理を停止させるための停止情報を送信して(ステップS.9)、オーディオ出力部4からのオーディオ信号の出力処理を停止させ、処理を終了する。
一方で、再生停止情報を受信しなかった場合(ステップS.8においてNoの場合)、制御部6は、再生変更情報を取得したか否かを判断する(ステップS.10)。再生変更情報とは、オーディオ再生部2において新たなオーディオ信号のデコード処理を実行させる必要が生ずる情報を意味しており、例えば、異なる曲の再生を行うことを目的としてユーザが操作ボタンを操作することにより、操作部5から制御部6に対して送信される他曲再生開始情報や、デコード処理を行っていたオーディオ信号が1曲分終了して、次のオーディオ信号のデコード処理を行う必要が生じた場合に、オーディオ再生部2から制御部6に対して送信される次曲再生開始情報などが該当する。
再生変更情報を受信した場合(ステップS.10においてYesの場合)、制御部6は、処理をステップS.1に移行させることにより、オーディオ再生部2を制御して該当するオーディオ信号の再生処理を実行させる(ステップS.1)。その後、上述した一連の処理(ステップS.1〜ステップS.8の処理)を繰り返し実行する。
再生変更情報を受信しなかった場合(ステップS.10においてNo場合)、制御部6は、再生停止情報あるいは再生変更情報を受信するまで、上述した処理(ステップS.8以降の処理)を繰り返し実行する。
このように本実施の形態に係るオーディオ再生装置1では、帯域幅設定部7において、オーディオ再生部2において求められたオーディオ信号の圧縮方式、サンプリングレート、ビットレートに基づいて、帯域幅設定テーブルよりオーディオ信号の帯域幅を設定することができる。このため、圧縮されたオーディオ信号における帯域幅情報を、高価なプロセッサなどを用いることなく求めることができ、処理負担の低減を図ることが可能になると共に、プロセッサ等の使用に伴う処理コストの上昇を抑制することが可能となる。
さらに、本実施の形態に係るオーディオ再生装置1では、帯域幅設定部7が帯域幅の設定を行うので、ユーザが帯域幅の設定をする必要がなくなり、ユーザの処理負担を軽減することが可能となる。さらに、ユーザが帯域幅の設定をする必要がないため、ユーザが誤った帯域幅を設定してしまうことを防止することができ、帯域幅を適切に設定することが可能となる。
また、オーディオ信号の圧縮方式、サンプリングレート、ビットレートに基づいて、オーディオ信号の帯域幅を設定することができるので、従来のように高域補完処理を行う周波数が固定されてしまうことがなくなる。このため、オーディオ信号における帯域幅の相違を考慮した適切な高域補完処理を行うことが可能となり、聴覚的に違和感の生じない最適な高域補完処理を行うことが可能となる。
さらに、本実施の形態に係るオーディオ再生装置1では、高域周波数成分のオーディオ情報を損うことなく圧縮処理を行うことが可能なLossLess方式等の圧縮方式によりオーディオ信号の圧縮が行われている場合に、高域補完処理を行わないように高域補完部3を制御することができる。このため、オーディオ信号に対して聴感上違和感を与えるような無用の高域補完処理を行ってしまうことを防止することができる。
また、オーディオ信号のビットレートの値が低い場合には、デコード処理されたオーディオ信号の品質が低下するため、補完処理を行うことにより聴感上違和感を与えてしまう場合が有る。さらに、オーディオ信号のビットレートの値が高い場合には、高域補完処理を行わなくても高域周波数帯域における音響効果を聴感上得ることが可能な場合が有り、高域補完処理を行うことによる効果が乏しい場合がある。
本実施の形態に係るオーディオ再生装置1では、オーディオ信号のビットレートの値が高い場合や低い場合において、高域補完処理を行わないように高域補完部3を制御することができる。このため、高域補完処理を行っても音響的な補完効果が乏しい場合に補完処理を中断することにより、無用な処理負担の増大を抑えることができると共に、高域補完処理の効果を効果的に発揮できる場合にのみ、高域補完処理を行うように処理を調整することが可能となる。
さらに、帯域幅設定部7により設定された帯域幅情報に応じて、サンプリング変換部11におけるサンプリング変換レートβの設定値、各フィルタ部10、12、13におけるカットオフ周波数の設定値、および、ゲイン部14における高域補完ゲインの設定値が決定・変更されるため、圧縮されたオーディオ信号毎に異なる高域周波数成分の削除状態に対応した高域補完信号を生成することができる。このため、高域補完処理前のオーディオ信号に補完信号を合成させた場合に、オーディオ信号の周波数スペクトルが連続的な状態となるようにすることができ、補完処理が成されたオーディオ信号において聴覚的な違和感が生じてしまうことを防止することが可能となる。
また、本実施の形態に係る帯域幅設定テーブルでは、帯域幅の値が大きな値になるに応じて、サンプリング変換レートβの値が小さくなるように設定されている。このようにして、サンプリング変換レートβの値を設定することにより、オーディオ信号のダウンサンプリング処理およびアップサンプリング処理による折り返し(エイリアシング)の発生数を調整することができるので、生成される補完信号の信号精度を高めることが可能となる。
さらに、本実施の形態に係る帯域幅設定テーブルでは、帯域幅の値が大きくなるに応じて、第1ハイパスフィルタ部10のカットオフ周波数の値[kHz]、第2ハイパスフィルタ部12のカットオフ周波数の値[kHz]、ローパスフィルタ部13のカットオフ周波数の値[kHz]が高くなるように設定されている。このため、補完信号の作成時において、データの削除が行われる直前の周波数帯域の情報を有効的に用いてフィルタリング処理を行うことが可能となり、結果として最適な補完信号を生成することが可能となる。
さらに、本実施の形態に係る帯域幅設定テーブルでは、帯域幅の値が小さくなると、帯域幅に応じてゲイン部14における高域補完ゲインの値が小さくなるように設定されているため、高域補完された信号のレベルが聴感上で違和感を与えないように設定を行うことが可能となる。
以上、本発明に係る高域補完装置について、図面を用いて詳細に説明したが、本発明に係る高域補完装置は、上述した実施の形態に示した例に限定されるものではない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到しうることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
例えば、上述した実施の形態では、帯域幅設定部7を設け、制御部6より受信した、圧縮方式、サンプリングレート、ビットレートに基づいて、帯域幅設定部7で帯域幅情報を設定して、制御部6に返信する構成であった。しかしながら、帯域幅設定テーブルを制御部6内に記録させ、直接制御部6が、圧縮方式、サンプリングレート、ビットレートに基づいて帯域幅情報を設定する構成としてもよい。このような構成とすることにより、帯域幅設定部7としての機能を制御部6で実行させることができるので、本発明に係る高域補完装置に関する構成を簡略化させることが可能となる。
さらに、帯域幅設定テーブルをオーディオ再生部2に記録させることにより、圧縮方式、サンプリングレート、ビットレートに基づいて、オーディオ再生部2が帯域幅情報を設定する構成とするものであってもよい。また、帯域幅設定テーブルを高域補完部3のパラメータ設定部16に記録させることにより、制御部6から圧縮方式、サンプリングレート、ビットレートからなるデコード情報を受信し、受信したデコード情報に基づいて、パラメータ設定部16が帯域幅情報を設定する構成とするものであってもよい。このように、オーディオ再生部2やパラメータ設定部16で、帯域幅情報を設定する構成とすることにより、帯域幅設定部7としての機能を、オーディオ再生部2やパラメータ設定部16で実行させることができるので、本発明に係る高域補完装置に関する構成を簡略化させることが可能となる。