JP2010103768A

JP2010103768A - オーディオ装置及びオーディオ処理方法

Info

Publication number: JP2010103768A
Application number: JP2008273379A
Authority: JP
Inventors: Noriyuki Takashima; 紀之高島
Original assignee: Alpine Electronics Inc
Current assignee: Alpine Electronics Inc
Priority date: 2008-10-23
Filing date: 2008-10-23
Publication date: 2010-05-06
Anticipated expiration: 2028-10-23
Also published as: JP5522920B2

Abstract

【目的】フルセグ放送及びワンセグ放送受信時の音声レベルを同等にすることにより、フルセグ放送及びワンセグ放送受信を切り換えても違和感が生じないようにする「オーディオ装置及びオーディオ処理方法」を提供することである。
【構成】無相関化処理によりステレオ信号からサラウンド信号及びセンター信号を生成するオーディオシステムにおいて、符号化オーディオ信号よりステレオ信号を復号して出力すると共に符号化情報を抽出し、ステレオ信号L.Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L.Rに高相関な信号をセンター信号として生成し、符号化情報（ビットレート、フルセグ/ワンセグ受信の別など）に基づいてセンター信号のレベルを制御し、フルセグ/ワンセグ受信時における音声レベルが等しくなるように制御する。
【選択図】図１

Description

本発明は無相関化処理によりステレオ信号からサラウンド信号及びセンター信号を生成するオーディオ装置及びオーディオ処理方法に関わり、特に、音声符号化レートが変化しても受聴者が違和感を受けないオーディオ装置及びオーディオ処理方法に関する。

・地上波テレビ放送
日本国内では、地上波テレビ放送のディジタル化が進められており、2011年には全国で地上波ディジタル放送が実施され、アナログ波を停波する予定となっている。かかる地上波ディジタル放送では、図１８に示すように伝送方式として、高い周波数利用効率と伝送品質が得られるOFDM（Orthogonal Frequency Division Multiplexing：直交波周波数分割多重）方式が採用され、帯域幅6MHzの１つの放送チャンネル（物理チャンネル）を14個のセグメントに分割し、そのうちガードバンドを除いた13個のセグメントを複数のセグメント群（階層）のグループに分けて、各グループ単位で情報符号化方式や変調方式等の異なる番組（プログラム）を同時に放送することを可能にしている。

すなわち、地上波ディジタル放送では、１つのチャンネルを13のセグメントに分割して放送しており、13セグメントは最大3個の階層で構成されている。階層は、受信可能なC/N比（Carrier to Noise ratio：搬送波電力対雑音電力比）の大きさにより、強階層、中階層、弱階層と呼ばれている。強階層は最も低いC/N比において受信可能な階層、中階層は中間のC/N比において受信可能な階層、弱階層は最も良好なC/N比において受信可能な階層である。実際には、地上波ディジタル放送において中階層は運用される予定がないため、強階層と弱階層のみが放送される。13セグメントのうち12セグメントが弱階層の高いC/Ｎ比において受信可能な番組（フルセグあるいは12セグ番組）の放送に使用し、１セグメント（図１８の白セグメント）が強階層の低いC/Ｎ比において受信可能な番組(ワンセグあるいは1セグ番組)の放送に使用する。地上波ディジタル放送(地デジ放送という)では、セグメント単位で異なる変調方式を設定でき、複数の番組を同一帯域内で異なるビットレートや誤り耐性で伝送することが可能となる。

このため、移動受信機はC/N比に応じてフルセグ番組あるいはワンセグ番組を切り換えて受信する。すなわち、移動受信機における地デジ放送受信の特徴は、フルセグ放送とワンセグ放送の受信の切り換わりが発生することにある。自動車は移動体であるため、車載の地デジ放送受信機は受信状況が変化すると、その状況（C/N比）に応じてフルセグ放送、ワンセグ放送の受信を選択する。
フルセグ放送とワンセグ放送の違いは文字通り、地デジ放送フォーマットにおける13セグメントのうちの割り当て数の違いであり、映像・音声・その他情報の割当量が大幅に異なる。図１９は地デジ放送の音声符号化レート（ビットレートとも言う）をまとめたものであり、この図から判るように、フルセグ放送とワンセグ放送によって、サンプリング周波数と音声符号化レートが大きく異なる。
音声符号化レートが小さい程、狭い帯域で送信可能であり、一方、音声符号化レートが大きくなる程、広い帯域が必要になる。図２０は、フルセグ放送とワンセグ放送の音声情報量の違いを説明するための地デジ放送音声スペクトル図であり、Aはワンセグ、Bはフルセグの音声スペクトルである。ワンセグ放送は狭い帯域で良く、およそ10kHz以下の帯域で情報を持っていれば十分である。換言すれば、ワンセグ放送では圧縮により多くの音声情報が失われていることになる。
ワンセグ受信に際して失われた帯域を補う技術として帯域拡張技術SBR(Spectral Band Replication)が適用可能であり、HE-AACとして規格化されている。図２１はSBRを適用した場合のワンセグ放送の音声スペクトルを示すもので、フルセグの音声スペクトルと同等の特性を示している。また、失われた帯域を補う技術として、別に倍音強調、帯域拡張技術も各社より発表されている。これら補完技術はユーザ側にもわかりやすい訴求なため、よく研究されている。

ところで、圧縮音声では帯域の大小の外に他の視点をも考慮する必要がある。それは音声の相関性である。MP3(MPEG-1)やAAC(MPEG-2/-4)のオーディオ符号化方式として、ジョイントステレオ符号化方式、ステレオ符号化方式がある。このうちジョイントステレオ符号化方式は、ステレオ信号L，R間の相関性を重視した圧縮法方法であり、ステレオ信号L，R間の高い相関成分と低い相関成分（L/Rそれぞれにある）を符号化し、相関の低い成分をさらに間引き、高圧縮率を図る方式で、低い音声符号化レート、例えばワングセグ放送に最適な圧縮方式である。しかし、かかる音声圧縮により音の拡がり感が失われる。音声圧縮により失った音の拡がり感を再現させたいといったニーズに応えることが出来るのが、適応信号処理による無相関化処理技術（特許文献１）である。この技術によれば、復号化された圧縮音声より高い相関成分と低い相関成分を再分離することができ、音の拡がり感を再現できる。

・無相関化処理
図２２は上記無相関化処理を実現する無相関化処理部の構成図であり、圧縮符号化されたオーディオ信号より復号されたステレオ信号L,Rを入力されて、ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号SL,SRを適応信号処理により発生する第１、第２の適応信号処理部１１０，１２０、ステレオ信号L,Rに高相関な信号をセンター信号Cとして生成するセンター信号生成部１３０を備えている。
第１の適応信号処理部１１０は、ステレオ信号R（＝X_R(n)）に含まれるステレオ信号L(=X_L(n)）と相関の高い高相関信号成分Ｃ_Ｌを抽出し、該ステレオ信号L(=X_L(n)）から該高相関信号成分C_Lを減算して第１のサラウンド信号SLを出力する。第２の適応信号処理部１２０は、ステレオ信号L（＝X_L(n)）に含まれるステレオ信号R(=X_L(n)）と相関の高い高相関信号成分C_Rを抽出し、該ステレオ信号R(=X_R(n)）から該高相関信号成分C_Ｒを減算して第２のサラウンド信号SLを出力する。センター信号生成部１３０において、加算器１３１は高相関信号成分Ｃ_Ｌと高相関信号成分C_Ｒを加算し、乗算器１３２は加算結果に0.5を乗算してセンター信号C(=0.5×（C_L＋C_R）)を出力する。

第１の適応信号処理部１１０は、ステレオ信号R（＝X_R(n)）に含まれる、ステレオ信号L(=X_L(n)）と相関の高い高相関信号成分C_Lを抽出して出力するタップ長２ｍの適応フィルタ（ADF：Adaptive Filter）１１２、LMS適応信号処理により、適応フィルタ１１２の２ｍ個の係数を求めて該適応フィルタに設定するLMS演算部１１４、適応フィルタの段数の半分ｍに応じた遅延時間(モデリング遅延)が設定され、ステレオ信号Lを該設定時間分、遅延する遅延回路１１６、遅延回路から出力するステレオ信号L（＝d_L(n)）より適応フィルタから出力する高相関信号成分C_Lを減算してサラウンド信号ＳＬを発生する演算部１１８を備えている。なお。適応フィルタ１１２は例えばFIRディジタルフィルタで構成される。
第２の適応信号処理部１２０は、ステレオ信号L（＝X_Ｌ(n)）に含まれる、ステレオ信号R(=X_R(n)）と相関の高い高相関信号成分Ｃ_Rを抽出して出力するタップ長２ｍの適応フィルタ１２２、LMS適応信号処理により、適応フィルタ１２２の２ｍ個の係数を求めて該適応フィルタに設定するLMS演算部１２４、適応フィルタの段数の半分ｍに応じた遅延時間(モデリング遅延)が設定され、ステレオ信号Ｒ信号を該設定時間分、遅延する遅延回路１２６、遅延回路１２６から出力するステレオ信号R（＝d_R(n)）より適応フィルタから出力する高相関信号成分C_Rを減算してサラウンド信号SRを発生する演算部１２８を備えている。

LMS演算部１１４、１２４は１サンプル毎(例えばサンプリング周波数44.1KHｚであれば、１/44100(sec)毎)に、それぞれ(1a),(1b)式の係数更新式

の演算を行なって適応フィルタ１１２，１２２の２ｍ個の係数を更新する。(1a)、(1b)式において、(n)は1サンプリング前の信号、(n＋1)は現サンプリング時の信号を示す。(1a)式において、W_L(n)、W_L(n＋1)は適応フィルタ１１２の係数、μはステップサイズパラメータ、e_L(n)は誤差信号（サラウンド信号SL）、X_L(n) はステレオ信号Lである。(1b)式において、W_R(n)、W_R(n＋1)は適応フィルタ１２２の係数、μはステップサイズパラメータ、e_R(n)は誤差信号（サラウンド信号SR）、X_R(n) はステレオ信号Rである。
又、高相関成分信号C_L、C_R、Cは次式によって表わされる。

ただし、Tは転置を示す。

以上により作成されたステレオ信号Ｌ（＝d_L(n)），Ｒ（＝d_R(n)）、２つのサラウンド信号ＳＬ，ＳＲ、センター信号Ｃはそれぞれ、図２３に示す車室内前方の左右のフロントスピーカSP_FL、SP_FR、車室内後方の左右のリアスピーカSP_RL、SP_RR、前方中央のセンタースピーカSP_Cにそれぞれ入力される。
図２２の無相関化処理によりサラウンド信号SL,SRを生成すれば、低相関のサラウンド信号を安定して取り出せることができ、再生音場において拡がり感を大きくできる利点がある。
特許３６８２０３２号

図２２の無相関化処理部に入力するステレオ信号が、フルセグ放送とワンセグ放送の間で切り換わった場合を想定する。
フルセグの符号化オーディオ信号は図１９からもわかるようにワンセグの符号化オーディオ信号よりも高い音声符号化レートであり、デコード後のフルセグのステレオ信号には拡がりのある低い相関成分がワンセグに比べて多く含まれている反面、ワンセグに比べて高い相関成分が少ないことが予測される。すなわち、フルセグのステレオ信号には拡がりのある低い相関成分が比較的多く残る結果、逆に高い相関成分が少なくなる。一方、ワンセグの符号化オーディオ信号は音声符号化レートが低いため、音声の圧縮率を高める必要があり、相関の低い成分を削減する傾向にあり、反面、デコード後のワンセグのステレオ信号には高い相関成分は多くなる。
従って、無相関化処理部において、フルセグのステレオ信号に無相関化処理を施すと、低い相関成分が良好に取り出されるが、高い相関成分がワンセグに比べれば低出力になる。反対にワンセグの音声信号に無相関化処理を施すと高い相関成分が良好に取り出されるが、低い相関成分がフルセグに比べれば低出力になる。
高い相関成分はセンター信号Cとなってフロント中央のスピーカに入力するため、高い相関成分の大小は音の定位に影響を与え、音声レベルにも差を与える。このため、高相関成分が少ないフルセグ受信時の音声レベルは、高相関成分が多いワンセグ受信時の音声レベルより低くなり、フルセグ放送、ワンセグ放送の受信切換が生じると音声レベルが変化して受聴者に違和感を与える問題が生じる。特に、受信状況の変化は都市部で頻繁に発生し、ユーザは運転中に音声を聴くことが中心になるため、音質、音量の変化がユーザにとって気になり、ユーザにストレスを与える。

本発明の目的は、フルセグ放送及びワンセグ放送の受信時の音声レベルを同等にすることにより、フルセグ放送及びワンセグ放送の受信を切り換えても違和感が生じないようにすることである。
本発明の目的は、圧縮音声の符号化レートが変化しても受信時の音声レベルを同等にすることにより、フルセグ放送及びワンセグ放送の受信切換が発生して圧縮音声の符号化レートが変化しても違和感が生じないようにすることである。
本発明の目的は、圧縮音声がモノラル、ステレオ、サラウンドであっても受信時の音声レベルを同等にすることにより、モノラル、ステレオ、サラウンド放送の受信切換時に違和感が生じないようにすることである。
本発明の目的は、センター信号のレベルを制御することにより、あるいは、適応信号アルゴリズムにより無相関処理を行う場合はステップサイズパラメータ値、あるいは適応フィルタのタップ長を制御することにより、音声レベルを同等にすることである。

本発明は、無相関化処理によりステレオ信号からサラウンド信号及びセンター信号を生成するオーディオ装置において、音声符号化レート等が変化しても受聴者に違和感を与えないオーディオ装置及びオーディオ処理方法である。
・オーディオ装置
本発明のオーディオ装置は、符号化オーディオ信号よりステレオ信号L,Rを復号して出力すると共に符号化情報を抽出する復号部、前記ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L,Rに高相関な信号をセンター信号として生成する無相関化処理部、前記符号化情報に基づいて前記センター信号のレベルを制御するレベル制御部を備えている。

前記レベル制御部は、以下の(1)〜(4)により前記センター信号のレベルを制御する。すなわち、前記レベル制御部は、
(1)前記符号化オーディオ信号の符号化レートに基づいて前記センター信号のレベルを制御する、
(2)前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるかに基づいて前記センター信号のレベルを制御する、
(3)前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるか、並びに、該符号化オーディオ信号の符号化レートを考慮して前記センター信号のレベルを制御する、
(4)前記符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに基づいて前記センター信号のレベルを制御する。
また、前記レベル制御部は、ゲインを制御することにより、あるいは、適応信号アルゴリズムにより無相関処理を行う場合はステップサイズパラメータ値、あるいは適応フィルタのタップ長を制御することにより、前記センター信号のレベルを制御する。

・オーディオ処理方法
本発明のオーディオ処理方法は、符号化オーディオ信号よりステレオ信号L,Rを復号して出力すると共に符号化情報を抽出するステップ、前記ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L,Rに高相関な信号をセンター信号として生成するステップ、前記符号化情報に基づいて前記センター信号のレベルを制御するステップ、前記ステレオ信号L,R、２つのサラウンド信号、センター信号をそれぞれ対応するスピーカに入力するステップを備えている。
前記レベル制御ステップにおいて、上記の(1)〜(４)により前記センター信号のレベルを制御する。
また、ゲインを制御することにより、あるいは、適応信号アルゴリズムにより無相関処理を行う場合はステップサイズパラメータ値、あるいは適応フィルタのタップ長を制御することにより、前記センター信号のレベルを制御する。

本発明によれば、フルセグ放送及びワンセグ放送の受信時の音声レベルを同等にするようにしたから、フルセグ放送及びワンセグ放送の受信を切り換えても違和感が生じないようにできる。
本発明によれば、圧縮音声の符号化レートが変化しても受信時の音声レベルを同等にするようにしたから、フルセグ放送及びワンセグ放送の受信切換が発生して圧縮音声の符号化レートが変化しても違和感が生じないようにできる。
本発明によれば、圧縮音声がモノラル、ステレオ、サラウンドであっても受信時の音声レベルを同等にしたから、モノラル、ステレオ、サラウンド放送の受信切換時に違和感が生じないようにできる。
本発明によれば、センター信号のレベルを制御することにより、あるいは、適応信号アルゴリズムにより無相関処理を行う場合はステップサイズパラメータ値、あるいは適応フィルタのタップ長を制御することにより、各種受信状態における受信音声レベルを同等にして違和感をなくすことが出来る。

（Ａ）オーディオシステムの構成
図１は本発明のオーディオシステムの構成図である。地上波ディジタル放送受信機１はユーザにより選局された放送電波を受信し、OFDM復調してオーディオデータストリームＡＤをオーディオ装置２に入力する。オーディオ装置２の地上波ディジタルデコーダ２０は、受信状況（例えばデータ誤り率等）に応じてフルセグオーディオデータあるいはワンセグオーディオデータの一方を選択し、選択したオーディオデータをステレオ信号Ｌ．Ｒにデコードして無相関化処理部３０に入力する。また、デコーダ２０は入力信号より各種符号化情報Ｈを分離して後述するコントローラ７０に入力する。符号化情報には、デコードするオーディオデータの音声符号化レート、放送番組のジャンル情報、放送形態（モノラル、ステレオ、サラウンドの別）、受信状態（フルセグ、ワンセグ受信の別）を等が含まれている。

無相関化処理部３０は、入力されたステレオ信号Ｌ．Ｒに基づいて無相関化処理を行う。このため、地デジデコーダ２０は、選択したフルセグオーディオデータあるいはワンセグオーディオデータをデコードしてステレオ信号Ｌ，Ｒを発生する必要があり、５．１ｃｈサラウンド放送を受信した場合には、デコーダ２０は５．１ｃｈサラウンド信号を２ｃｈステレオ信号にダウンミックスして無相関化処理部３０に入力する。図２はダウンミックスの処理フロー図であり、MPL１〜MPL6は乗算器、ADD1〜ADD4は加算器であり、乗算値Att1〜Att3の初期値は一定値0.707(-3dB) である。なお、低周波信号LFEはダウンミックスしない（−INF=0.000）。
無相関化処理部３０は、図２２に示した構成とほぼ同一の構成を備え、ステレオ信号Ｌ，Ｒの無相関化処理を行い、無相関化された低相関成分のサラウンド信号ＳＬ，ＳＲ、高相関成分のセンター信号Ｃ及びステレオ信号Ｌ，Ｒをそれぞれ出力する。サラウンド信号処理部３０が、図２２に示した構成と異なる点は、適応フィルタのタップ長や適応信号処理アルゴリズムにおけるステップサイズパラメータμの値をコントローラ７０からの指示により変更できるようになっている点である。
ゲイン制御部４０はコントローラからの指示によりゲインを可変してセンター信号Ｃのレベルを制御する。オーディオ信号処理部５０は、入力されるステレオ信号Ｌ，Ｒ、サラウンド信号ＳＬ，ＳＲ、センター信号Ｃに周知の音質制御処理、例えば、イコライジング処理、タイムコレクション処理、クロスオーバ処理などの音質制御処理を施し、各信号を対応するアンプを介して図示しないスピーカ（図２３参照）に入力する。実施例では、無相関化処理部３０とゲイン制御部４０とオーディオ信号処理部５０はＤＳＰ（ディジタルシグナルプロセッサ）６０により実現される。

マイコン構成のコントローラ７０は、符号化情報Ｈに基づき、制御信号Ｓ１（ステップサイズパラメータまたはタップ長），Ｓ２（ゲイン）、Ｓ３（音質）をそれぞれ無相関化処理部３０、ゲイン制御部４０、オーディオ信号処理部５０に入力する。
図３に示すように、フルセグの符号化オーディオデータは符号化レートが高いため、デコード処理により得られるステレオ信号には、拡がりのある低い相関成分が比較的多く残るが、半面、高い相関成分が少なくなる。一方、ワンセグの符号化オーディオデータは符号化レートが低いため、デコード処理により得られるステレオ信号には、低い相関成分が少なくなるが、高い相関成分が多くなる。高い相関成分はセンター信号Cとなってフロント中央のスピーカに入力するため、高い相関成分の大小は音の定位に影響を与え、音声レベルにも差を与え、高相関成分が少ないフルセグ受信時の音声レベルは、高相関成分が多いワンセグ受信時の音声レベルより低くなる

コントローラ７０は、フルセグ受信か、ワンセグ受信かに応じてセンター信号Ｃのレベルを制御してフルセグ受信時とワンセグ受信時における音声レベルが等しくなるように制御する。センター信号Ｃのレベルを制御するには、(1)センター信号Ｃが入力するゲイン制御部４０のゲインを制御信号Ｓ２により制御する方法、(2)無相関化処理部３０の適応フィルタのタップ長や適応信号処理アルゴリズムにおけるステップサイズパラメータμの値を制御信号Ｓ１により制御する方法がある。
後述するように、センター信号のレベルは、デコードするオーディオデータがフルセグのオーディオデータであるか否かにより、あるいは、符号化レートにより、あるいは、符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに等により変化する。そこで、センター信号Ｃのレベルを制御するには以下の実施態様が考えられる。

１）第１の実施態様
デコードするオーディオデータがフルセグのオーディオデータであるか、ワンセグのオーディオデータかに基づいて、コントローラ７０が、ゲイン、ステップサイズパラメータ、タップ長の少なくとも１つを制御してセンター信号Ｃのレベルを制御する。
２）第２の実施態様
オーディオデータの符号化レートに基づいて、コントローラ７０が、ゲイン、ステップサイズパラメータ、タップ長の少なくとも１つを制御して高相関成分信号であるセンター信号Ｃのレベルを制御する。
３）第３の実施態様
符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるか、並びに、該符号化オーディオ信号の符号化レートの両方を考慮して、コントローラ７０が、ゲイン、ステップサイズパラメータ、タップ長の少なくとも１つを制御して高相関成分信号であるセンター信号Ｃのレベルを制御する。
４）第４の実施態様
符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに基づいて、コントローラ７０が、ゲイン、ステップサイズパラメータ、タップ長の少なくとも１つを制御して高相関成分信号であるセンター信号Ｃのレベルを制御する。

（B）フルセグ、ワンセグと高相関成分の関係
図４はフルセグのステレオ信号L，R間の相互相関係数分布Bとワンセグのステレオ信号L，R間の相互相関係数分布Aの説明図である。２つの番組が図示する期間内において切り換わっており、前半は相互相関係数が１付近で推移している。具体的に言うと前半は気象情報の番組であるため、フルセグ、ワンセグともにモノラルのため、ステレオ信号L，R間の相関は１付近となる。しかし、この番組が終わった時点で相互相関係数が下がり、フルセグでは5.1chサラウンド放送が、ワンセグではステレオ放送が開始する。
5.1chサラウンド放送の場合、各チャンネル間の相関が低い音作りに設定されているため、図２に従ってダウンミックスしてもこの傾向はあらわれ、ワンセグに比べてわずかに相互相関係数が低くなる傾向を示す。このとき、図１の無相関化処理部３０において無相関化処理を施すと、図５に示すように高相関成分の出力に差が生じ、ワンセグステレオ信号の高相関成分Aの方がフルセグステレオ信号の高相関成分Bのレベルより高くなる。特に、音声の帯域200〜1kHzは音声における相関が最も高い帯域であるため、このレベル差が定位に影響する。つまり、ワンセグ放送受信からフルセグ放送受信に変化したとき、音声レベルが低いと感じ、逆の場合には高いと感じる。
同様に別の番組で、ワンセグステレオ放送の相互相関係数Aとフルセグステレオ放送の相互相関係数Bとの比較を図６に示す。わずかではあるが、ワンセグの方が、相関が高いと読み取ることができる。

図４〜図６を考察すると、ワンセグオーディオデータ再生時にセンター信号Ｃのレベルを小さくし、フルセグオーディオデータ再生時にセンター信号Ｃのレベルを大きくすれば、フルセグ受信時とワンセグ受信時における音声レベルを略等しくできる。例えば、図７（Ａ）に示すようにワンセグオーディオデータ再生時、センター信号Ｃが入力されるゲイン制御部４０のゲインを小さくし、フルセグオーディオデータ再生時、該ゲイン制御部４０のゲインを大きくする。
また、符号化レートが異なるとステレオ信号L,Rの高相関成分にレベル差が生じる。そこで、更にフルセグ再生時におけるセンター信号Ｃのレベルを符号化レートに基づいて制御する。このようにすれば、フルセグ受信時とワンセグ受信時における音声レベル差を更に小さくすることができる。図７（Ｂ）は、
１）ワンセグオーディオデータ再生時（符号化レートは低速、中速）、ゲイン制御部４０のゲインを小さな値（−3dB）にし、
フルセグオーディオデータ再生時には、
２)符号化レートが中速であれば、ゲイン制御部４０のゲインを標準値（0dB）にし、
３)符号化レートが高速であれば、ゲイン制御部４０のゲインを大きな値（+3dB）にする。図７（Ｃ）は、図７（Ｂ）に従ってゲインを制御する場合の具体的な制御例であり、フルセグ再生時におけるゲインを、符号化レートに基づいて３段階に制御する。
なお、オーディオデータの符号化レートのみに基づいてセンター信号Ｃのレベルを制御することもできる。例えば、符号化レートが中速時にセンター信号Ｃのレベルを変えず、低速時にセンター信号Ｃのレベルを下げ、高速時にセンター信号Ｃのレベルを上げれば、それぞれのビットレート時における再生音声レベルを略同等にできる。

符号化オーディオデータがモノラルデータであれば、図４よりステレオ信号L,Rの相互相関は１になるため高相関成分は最大になる。また、符号化オーディオデータが標準ステレオデータであれば、モノラルデータの場合より高相関成分レベルは下がるが、符号化レートが大きい高音質ステレオデータや5.1chサラウンドデータの場合に比べて高相関成分レベルが大きくなる。そこで、図７（Ｄ）に示すように、符号化オーディオデータがモノラルデータであるか、標準ステレオデータであるか、高音質ステレオデータや5.1chサラウンドデータであるかによりゲイン制御部４０のゲインを制御する。

（Ｃ）実施例
（ａ）第１実施例
図８は、ゲインによりセンター信号Ｃのレベルを制御する第１実施例の構成図であり、図１と同一部分には同一符号を付している。又、無相関化処理部６０は図２２とほぼ同等の構成を備え、同一部分には同一符号を付している。
コントローラ７０は、図７（Ａ）〜（Ｄ）のいずれかにより、すなわち、デコードするオーディオデータがフルセグのオーディオデータであるか否かにより、あるいは、符号化レートにより、あるいは、符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに、レベル制御部４０のゲインを決定し、ゲイン制御部４０に設定する。これにより、レベル制御部４０は設定されたゲインでセンター信号Ｃを増幅して出力する。

図９は図７（Ｃ）に従ってゲイン制御部４０のゲインを制御してセンター信号レベルを増大した場合の本発明の効果説明図であり、Ａはワンセグステレオ信号の高相関成分のレベル、Ｂはフルセグ5.1chサラウンドデータをダウンミックスして得られるステレオ信号の高相関成分のレベル、Ｃはゲインを+6dBにしたときの、フルセグ5.1chサラウンドデータから得られるステレオ信号の高相関成分のレベル特性である。図９よりゲインを+6dBにしたときのレベル特性はワンセグステレオ信号の高相関成分のレベル特性とほぼ一致し、結果的にワンセグとフルセグの音声レベルをほぼ同等にすることができる。
具体的なゲイン制御は、モノラル放送の場合にはゲインを制御せず、高品質ステレオ放送やサラウンド放送の場合にゲインを+6dBにしてセンター信号レベルをアップする。すなわち、図７（Ｃ）より明らかなように、ワンセグとフルセグ（5.1ch）とでは相対的に6dBの差があり、ワンセグにおけるゲインを制御せずそのままの値とすれば、フルセグ（5.1ch）におけるゲインを＋6dBする。また、フルセグ標準ステレオ信号の場合は、ゲインをワンセグとフルセグ（5.1ch）の差+6dBの中間＋3dBにしてセンター信号レベルをアップする。

（ｂ）第２実施例
図１０はゲインとステップサイズパラメータμを調整することによりセンター信号Ｃのレベルを制御する第２実施例の構成図であり、図１と同一部分には同一符号を付している。又、無相関化処理部６０は図２２とほぼ同等の構成を備え、同一部分には同一符号を付している。
無相関化処理部６０が算出する高相関成分はモノラル→ステレオ→サラウンドの順に低くなる。高相関成分はセンター信号Ｃとなるため、そのレベルが低い程、音声が聞き取りにくくなる。ところで、無相関化処理部６０の適応信号処理部１１０，１２０における適応速度を上げたほうが高相関成分の抽出がしやすくなる。そこで、適応アルゴリズムにおけるステップサイズパラメータμを大きくして適応速度を上げると高相関成分の抽出速度が上昇する。このため、第２実施例では、高相関成分が低くなるほど、ステップサイズパラメータμを大きくして適応速度を上げ、かつゲインを制御する。このようにすれば、第1実施例のゲインのみを制御する場合に比べてより効果的に音声レベルの制御が可能になる。
以上より、ステップサイズパラメータμをモノラル→ステレオ→サラウンドと変化するに従って大きくなるように制御し、同時に第１実施例の図７（Ｃ）のゲイン制御と同じようにゲインを制御する。図１１はワンセグ/フルセグと符号化レートの組み合わせにより、どのようにゲインとステップサイズパラメータμを決定するかを示す説明図である。
この図１１の例では、１)ワンセグ再生時（モノラル、ステレオ）にはμ=0.0001、ゲイン=−3dBとし、それぞれを最小にする。又、フルセグ再生時には、符号化レートあるいは、モノラル/標準ステレオ/高音質ステレオ（5.1chサラウンド）に応じてステップサイズパラメータμ及びゲインを決定する。すなわち、2）フルセグ再生時であって、符号化オーディオデータがモノラル（低速）の場合には、μ=0.0001、ゲイン=−3dBにし、3）フルセグ再生時であって、符号化オーディオデータが標準ステレオデータ（中速）の場合には、μ=0.0003、ゲイン=0dBにし、4）フルセグ再生時であって、高音質ステレオデータあるいは5.1chサラウンドデータ（高速）の場合には、μ=0.0008、ゲイン=＋3dBとし最大にする。

コントローラ７０は、図１１にしたがってレベル制御部４０のゲインと適応アルゴリズムのステップサイズパラメータμを決定し、それぞれをゲイン制御部４０と第１、第２の応信号処理部１１４，１２４のLMS演算部１１４，１２４に設定する。これにより、LMS演算部１１４，１２４は設定されたステップサイズパラメータμに基づいて適応信号処理を行い、又、レベル制御部４０は設定されたゲインでセンター信号Ｃを増幅して出力する。

図１２は第２実施例の効果説明図であり、（Ａ）はステップサイズパラメータμのみ制御してセンター信号レベルをアップした例、（Ｂ）は図１１に従ってステップサイズパラメータμとゲインの両方を制御してセンター信号レベルをアップした例である。
図１２の（Ａ）において、Ａはμ＝0.0003のときのワンセグステレオ信号の高相関成分のレベル、Ｂはμ＝0.0003のときのフルセグ5.1chサラウンドデータをダウンミックスして得られるステレオ信号の高相関成分のレベル、Ｃはμ＝0.001としたときのフルセグ5.1chサラウンドデータをダウンミックスして得られるステレオ信号の高相関成分のレベルである。ステップサイズパラメータμをのみ制御したときの高相関成分のレベルアップ量は小さく、μを0.0003から0.001と大きくしてもレベル特性をワンセグステレオ信号の高相関成分のレベル特性Aに出来ない。そこで、図１２（Ｂ）に示すようにμを0.0003から0.001と大きくし、かつ、ゲインを+4.5dBにする。このように、μを大きくすると共に、ゲインをアップすることによりフルセグ5.1chサラウンドデータをダウンミックスして得られるステレオ信号の高相関成分のレベル特性は、ワンセグステレオ信号の高相関成分のレベル特性と同等になる。この結果、ワンセグ再生時とフルセグ再生時の音声レベルを同じにでき、ワンセグ/フルセグ切換時における違和感をなくすることきできる。

以上の第２実施例では、ワンセグ/フルセグと符号化レートの組み合わせによりステップサイズパラメータμ及びゲインを制御する場合であるが、ワンセグ受信/フルセグ受信の別のみにより、あるいは、符号化レートのみにより、あるいは、符号化オーディオデータがモノラル/標準ステレオ/高音質ステレオデータまたは5.1chサラウンドデータであるかによりステップサイズパラメータμ及びゲインを制御することができる。

（ｃ）第３実施例
図１３はゲインと適応フィルタのタップ長を調整することによりセンター信号Ｃのレベルを制御する第３実施例の構成図であり、図１と同一部分には同一符号を付している。又、無相関化処理部６０は図２２とほぼ同等の構成を備え、同一部分には同一符号を付している。
第２実施例で説明したように、無相関化処理部６０の適応信号処理部１１０，１２０における適応速度を上げたほうが高相関成分の抽出がしやすくなる。そこで、適応フィルタ１１２，１２２のタップ長を長くして適応速度を上げると高相関成分の抽出速度が上昇する。このため、第３実施例では、高相関成分が低くなるほど、タップ長を長くして適応速度を上げ、かつゲインを制御する。このようにすれば、第１実施例のゲインのみを制御する場合に比べてより効果的に音声レベルの制御が可能になる。
以上より、タップ長をモノラル→ステレオ→サラウンドと変化するに従って長くなるように制御し、同時に第１実施例の図７（Ｃ）のゲイン制御と同じようにゲインを制御する。図１４はワンセグ/フルセグと符号化レートの組み合わせにより、どのようにゲインとタップ長を決定するかを示す説明図である。
この図１４の例では、１)ワンセグ再生時（モノラル、ステレオ）にはタップ長＝8、ゲイン=−3dBとし、それぞれを最小にする。又、フルセグ再生時には、符号化レートあるいは、モノラル/標準ステレオ/高音質ステレオまたは5.1chサラウンドに応じてタップ長及びゲインを決定する。すなわち、2）フルセグ再生時であって、符号化オーディオデータがモノラル（低速）の場合には、タップ長=8、ゲイン=−3dBにし、3）フルセグ再生時であって、符号化オーディオデータが標準ステレオデータ（中速）の場合には、タップ長=16、ゲイン=0dBにし、4）フルセグ再生時であって、高音質ステレオデータあるいは5.1chサラウンドデータ（高速）の場合には、タップ長=32、ゲイン=＋3dBと最大にする。

コントローラ７０は、図１４にしたがってレベル制御部４０のゲインと適応フィルタ１１２，１２２のタップ長を決定し、それぞれをゲイン制御部４０と適応フィルタ１１２，１２２に設定する。これにより、適応信号処理部１１０，１２０のLMS演算部１１４，１２４は設定されたタップ長の適応信号処理を行い、又、レベル制御部４０は設定されたゲインでセンター信号Ｃを増幅して出力する。
タップ長を長くすると共に、ゲインをアップすることによりフルセグ5.1chサラウンドデータをダウンミックスして得られるステレオ信号の高相関成分のレベル特性をワンセグステレオ信号の高相関成分のレベル特性と同等にすることができる。この結果、ワンセグ再生時とフルセグ再生時の音声レベルを同じにでき、ワンセグ/フルセグ切換時における違和感をなくすることきできる。
以上の第３実施例ではゲインとタップ長の両方を調整する場合であるが、ゲインとステップサイズパラメータとタップ長の全てを調整してセンター信号Ｃのレベルを制御することができる。図１５はかかる変形例の構成図であり、図１、図２２と同一部分には同一符号を付している。
又、以上の第２実施例では、ワンセグ/フルセグと符号化レートの組み合わせによりタップ長及びゲインを制御する場合であるが、ワンセグ受信/フルセグ受信の別のみにより、あるいは、符号化レートのみにより、あるいは、符号化オーディオデータがモノラル/標準ステレオ/高音質ステレオデータまたは5.1chサラウンドデータであるかによりタップ長を制御することができる。

（ｄ）第４実施例
図１６はセンター信号とステレオL,R信号のレベルを調整することにより音声レベルを同等とすると共に前方定位感を向上する第４実施例の構成図であり、図１,図２２と同一部分には同一符号を付している。異なる点は、ステレオL,R信号のレベルを調整するゲイン制御部４１，４２を設け、コントローラ７０がこれらゲイン制御部のゲインg１を制御するようにしている点である。
図１７は、ワンセグ/フルセグと符号化レートの組み合わせにより、どのように各ゲイン制御部４０〜４２のゲインg1,g2を決定するかを示す説明図である。ステレオL,R信号のレベルを小さくすると前方定位感が向上する。そこで、図１７に示すようにレベル制御部４１，４２のゲインg1を制御し、同時に、レベル制御部４０のゲインg2を第１実施例と同様に制御する。すなわち、図１７の例では、１)ワンセグ再生時（モノラル、ステレオ）にはg1=0dB、g2=−3dBとする。又、フルセグ再生時には、符号化レートあるいは、モノラル/標準ステレオ/高音質ステレオまたは5.1chサラウンドに応じてゲインg1,g2を決定する。すなわち、2）フルセグ再生時であって、符号化オーディオデータがモノラル（低速）の場合には、g1=0dB、g2=−3dBとする。また、3）フルセグ再生時であって、符号化オーディオデータが標準ステレオデータ（中速）の場合には、g1=−3dB、g2=0dBとし、4）フルセグ再生時であって、高音質ステレオデータや5.1chサラウンドデータ（高速）の場合には、g1=-6dB、g2=+3dBとする。

コントローラ７０は、図１７にしたがって各ゲイン制御部４０〜４２のゲインg1,g2を決定し、それぞれをゲイン制御部４０〜４２に設定する。
第４実施例によれば、第１実施例と同様にセンター信号のゲインを制御するため、ワンセグ再生時、フルセグ再生時の音声レベルを同一にでき、ワンセグ/フルセグ切換時における違和感を無くすことが出来る。また、第４実施例によれば、フルセグ再生時において音声符号化レートに基づいてステレオL,R信号のゲインを制御してそのレベルを下げるようにしているため、前方定位感を向上することが出来る。
以上の第４実施例では、ワンセグ/フルセグと符号化レートの組み合わせによりステレオL,R信号のゲイン及びセンター信号のゲインを制御する場合であるが、ワンセグ受信/フルセグ受信の別のみにより、あるいは、符号化レートのみにより、あるいは、符号化オーディオデータがモノラル/標準ステレオ/高音質ステレオデータまたは5.1chサラウンドデータ、であるかにより各ゲインを制御することができる。

本発明のオーディオシステムの構成図である。ダウンミックスの処理フロー図である。フルセグ、ワンセグの符号化オーディオデータにおける低相関成分、高相関成分の多、少の説明図である。フルセグ、ワンセグステレオ信号L，R間の相互相関係数分布である。フルセグ、ワンセグステレオ信号における高相関成分のレベル説明図である。別の番組のフルセグ、ワンセグステレオ信号における高相関成分のレベル明図である。センター信号のゲイン制御説明図表である。ゲインによりセンター信号Ｃのレベルを制御する第１実施例の構成図である。第１実施例の効果説明図である。第２実施例の構成図である。第２実施例におけるゲインおよびステップサイズパラメータ制御の説明図表である。第２実施例の本発明の効果説明図である。第３実施例の構成図である。第３実施例におけるゲインとタップ長制御の説明図表である。変形例の構成図である。第４実施例の構成図である。第４実施例における各ゲイン制御の説明図表である。フルセグ、ワンセグの帯域説明図である。地デジ放送の音声符号化レート説明図表である。フルセグ放送とワンセグ放送の音声情報量の違いを説明するための地デジ放送音声スペクトル図である。 SBRを適用した場合のワンセグ放送の音声スペクトル図である。無相関化処理を実現する無相関化処理部の構成図である。車室内のスピーカ配置図である。

符号の説明

１地上波ディジタル放送受信機
２オーディオ装置
２０地上波ディジタルデコーダ
３０無相関化処理部
４０ゲイン制御部
５０オーディオ信号処理部
７０コントローラ

Claims

無相関化処理によりステレオ信号からサラウンド信号及びセンター信号を生成するオーディオ装置において、
符号化オーディオ信号よりステレオ信号を復号して出力すると共に符号化情報を抽出する復号部、
前記ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L,Rに高相関な信号をセンター信号として生成する無相関化処理部、
前記符号化情報に基づいて前記センター信号のレベルを制御するレベル制御部、
を備えたことを特徴とするオーディオ装置。
前記レベル制御部は前記符号化オーディオ信号の符号化レートに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項１記載のオーディオ装置。
前記レベル制御部は前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるかに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項１記載のオーディオ装置。
前記レベル制御部は前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるか、並びに、該符号化オーディオ信号の符号化レートを考慮して前記センター信号のレベルを制御する、
ことを特徴とする請求項１記載のオーディオ装置。
前記レベル制御部は前記符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項１記載のオーディオ装置。
前記レベル制御部からの制御信号に基づいてゲインを可変して前記センター信号のレベルを制御するゲイン可変部、
を備えたことを特徴とする請求項１乃至５記載のオーディオ装置。
前記無相関化処理部において適応信号処理により前記サラウンド信号とセンター信号を発生する場合、前記レベル制御部からの制御信号に基づいて適応信号アルゴリズムのステップサイズパラメータを可変して該センター信号のレベルを可変する手段、
を備えたことを特徴とする請求項１乃至５記載のオーディオ装置。
前記無相関化処理部において適応信号処理により前記サラウンド信号とセンター信号を発生する場合、前記レベル制御部からの制御信号に基づいて適応信号処理部を構成する適応フィルタのタップ長を可変して該センター信号のレベルを可変する手段、
を備えたことを特徴とする請求項１乃至５記載のオーディオ装置。
前記レベル制御部からの制御信号に基づいて、ゲインを可変して前記オーディオ信号処理部から出力される前記センター信号のレベルおよび前記ステレオ信号のレベルをそれぞれ制御する複数のゲイン可変部、
を備えたことを特徴とする請求項１乃至５記載のオーディオ装置。
前記無相関化処理部は、
一方のステレオ信号Ｒから、他方のステレオ信号Ｌと相関の高い高相関信号成分Ｃ_Ｌを抽出し、該他方のステレオ信号Ｌより該高相関信号Ｃ_Ｌを減算して第１のサラウンド信号ＳＬを出力する第１の適応信号処理部と、
前記他方のステレオ信号Ｌから、前記一方のステレオ信号Ｒと相関の高い高相関信号成分Ｃ_Ｒを抽出し、該一方のステレオ信号Ｒより該高相関信号Ｃ_Ｒを減算して第２のサラウンド信号ＳＲを出力する第２の適応信号処理部と、
前記高相関信号Ｃ_Ｌと高相関信号Ｃ_Ｒを合成して前記センター信号を出力する合成部、
を備え、前記レベル制御部は、前記第１、第２の適応信号処理部の適応信号アルゴリズムに使用するステップサイズパラメータを可変して該センター信号のレベルを可変する、
ことを特徴とする請求項１記載のオーディオ装置。
前記レベル制御部は、前記ステップサイズパラメータと共に前記センター信号のレベルを制御することを特徴とする請求項１０記載のオーディオ装置。
前記無相関化処理部は、
一方のステレオ信号Ｒから、他方のステレオ信号Ｌと相関の高い高相関信号成分Ｃ_Ｌを抽出し、該他方のステレオ信号Ｌより該高相関信号Ｃ_Ｌを減算して第１のサラウンド信号ＳＬを出力する第１の適応信号処理部と、
前記他方のステレオ信号Ｌから、前記一方のステレオ信号Ｒと相関の高い高相関信号成分Ｃ_Ｒを抽出し、該一方のステレオ信号Ｒより該高相関信号Ｃ_Ｒを減算して第２のサラウンド信号ＳＲを出力する第２の適応信号処理部と、
前記高相関信号Ｃ_Ｌと高相関信号Ｃ_Ｒを合成して前記センター信号を出力する合成部、
を備え、前記レベル制御部は、前記第１、第２の適応信号処理部を構成する適応フィルのタップ長を制御して該センター信号のレベルを可変する、
ことを特徴とする請求項１記載のオーディオ装置。
前記レベル制御部は、前記タップ長と共に前記センター信号のレベルを制御することを特徴とする請求項１２記載のオーディオ装置。
無相関化処理によりステレオ信号からサラウンド信号及びセンター信号を生成するオーディオ処理方法において、
符号化オーディオ信号よりステレオ信号L,Rを復号して出力すると共に符号化情報を抽出するステップ、
前記ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L,Rに高相関な信号をセンター信号として生成するステップ、
前記符号化情報に基づいて前記センター信号のレベルを制御するステップ、
前記ステレオ信号L,R、２つのサラウンド信号、センター信号をそれぞれ対応するスピーカに入力するステップ
を備えたことを特徴とするオーディオ処理方法。
前記符号化オーディオ信号の符号化レートに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項１４記載のオーディオ処理方法。
前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるかに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項１４記載のオーディオ処理方法。
前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるか、並びに、該符号化オーディオ信号の符号化レートを考慮して前記センター信号のレベルを制御する、
ことを特徴とする請求項１４記載のオーディオ処理方法。
前記符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項１４記載のオーディオ処理方法。