JP2010103768A - オーディオ装置及びオーディオ処理方法 - Google Patents
オーディオ装置及びオーディオ処理方法 Download PDFInfo
- Publication number
- JP2010103768A JP2010103768A JP2008273379A JP2008273379A JP2010103768A JP 2010103768 A JP2010103768 A JP 2010103768A JP 2008273379 A JP2008273379 A JP 2008273379A JP 2008273379 A JP2008273379 A JP 2008273379A JP 2010103768 A JP2010103768 A JP 2010103768A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- audio
- level
- stereo
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 13
- 230000005236 sound signal Effects 0.000 claims abstract description 48
- 230000003044 adaptive effect Effects 0.000 claims description 63
- 230000001276 controlling effect Effects 0.000 claims description 24
- 230000002596 correlated effect Effects 0.000 claims description 24
- 239000000284 extract Substances 0.000 claims description 8
- 230000000875 corresponding effect Effects 0.000 claims description 5
- 230000002087 whitening effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 24
- 238000000034 method Methods 0.000 description 17
- 238000004364 calculation method Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 230000004807 localization Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 102100034033 Alpha-adducin Human genes 0.000 description 1
- 101000799076 Homo sapiens Alpha-adducin Proteins 0.000 description 1
- 101100383923 Monascus purpureus mpl6 gene Proteins 0.000 description 1
- 101150071716 PCSK1 gene Proteins 0.000 description 1
- 101000629598 Rattus norvegicus Sterol regulatory element-binding protein 1 Proteins 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000002789 length control Methods 0.000 description 1
- 101150011281 mpl1 gene Proteins 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Landscapes
- Stereophonic System (AREA)
Abstract
【構成】無相関化処理によりステレオ信号からサラウンド信号及びセンター信号を生成するオーディオシステムにおいて、符号化オーディオ信号よりステレオ信号を復号して出力すると共に符号化情報を抽出し、ステレオ信号L.Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L.Rに高相関な信号をセンター信号として生成し、符号化情報(ビットレート、フルセグ/ワンセグ受信の別など)に基づいてセンター信号のレベルを制御し、フルセグ/ワンセグ受信時における音声レベルが等しくなるように制御する。
【選択図】図1
Description
日本国内では、地上波テレビ放送のディジタル化が進められており、2011年には全国で地上波ディジタル放送が実施され、アナログ波を停波する予定となっている。かかる地上波ディジタル放送では、図18に示すように伝送方式として、高い周波数利用効率と伝送品質が得られるOFDM(Orthogonal Frequency Division Multiplexing:直交波周波数分割多重)方式が採用され、帯域幅6MHzの1つの放送チャンネル(物理チャンネル)を14個のセグメントに分割し、そのうちガードバンドを除いた13個のセグメントを複数のセグメント群(階層)のグループに分けて、各グループ単位で情報符号化方式や変調方式等の異なる番組(プログラム)を同時に放送することを可能にしている。
フルセグ放送とワンセグ放送の違いは文字通り、地デジ放送フォーマットにおける13セグメントのうちの割り当て数の違いであり、映像・音声・その他情報の割当量が大幅に異なる。図19は地デジ放送の音声符号化レート(ビットレートとも言う)をまとめたものであり、この図から判るように、フルセグ放送とワンセグ放送によって、サンプリング周波数と音声符号化レートが大きく異なる。
音声符号化レートが小さい程、狭い帯域で送信可能であり、一方、音声符号化レートが大きくなる程、広い帯域が必要になる。図20は、フルセグ放送とワンセグ放送の音声情報量の違いを説明するための地デジ放送音声スペクトル図であり、Aはワンセグ、Bはフルセグの音声スペクトルである。ワンセグ放送は狭い帯域で良く、およそ10kHz以下の帯域で情報を持っていれば十分である。換言すれば、ワンセグ放送では圧縮により多くの音声情報が失われていることになる。
ワンセグ受信に際して失われた帯域を補う技術として帯域拡張技術SBR(Spectral Band Replication)が適用可能であり、HE-AACとして規格化されている。図21はSBRを適用した場合のワンセグ放送の音声スペクトルを示すもので、フルセグの音声スペクトルと同等の特性を示している。また、失われた帯域を補う技術として、別に倍音強調、帯域拡張技術も各社より発表されている。これら補完技術はユーザ側にもわかりやすい訴求なため、よく研究されている。
図22は上記無相関化処理を実現する無相関化処理部の構成図であり、圧縮符号化されたオーディオ信号より復号されたステレオ信号L,Rを入力されて、ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号SL,SRを適応信号処理により発生する第1、第2の適応信号処理部110,120、ステレオ信号L,Rに高相関な信号をセンター信号Cとして生成するセンター信号生成部130を備えている。
第1の適応信号処理部110は、ステレオ信号R(=XR(n))に含まれるステレオ信号L(=XL(n))と相関の高い高相関信号成分CLを抽出し、該ステレオ信号L(=XL(n))から該高相関信号成分CLを減算して第1のサラウンド信号SLを出力する。第2の適応信号処理部120は、ステレオ信号L(=XL(n))に含まれるステレオ信号R(=XL(n))と相関の高い高相関信号成分CRを抽出し、該ステレオ信号R(=XR(n))から該高相関信号成分CRを減算して第2のサラウンド信号SLを出力する。センター信号生成部130において、加算器131は高相関信号成分CLと高相関信号成分CRを加算し、乗算器132は加算結果に0.5を乗算してセンター信号C(=0.5×(CL+CR))を出力する。
第2の適応信号処理部120は、ステレオ信号L(=XL(n))に含まれる、ステレオ信号R(=XR(n))と相関の高い高相関信号成分CRを抽出して出力するタップ長2mの適応フィルタ122、LMS適応信号処理により、適応フィルタ122の2m個の係数を求めて該適応フィルタに設定するLMS演算部124、適応フィルタの段数の半分mに応じた遅延時間(モデリング遅延)が設定され、ステレオ信号R信号を該設定時間分、遅延する遅延回路126、遅延回路126から出力するステレオ信号R(=dR(n))より適応フィルタから出力する高相関信号成分CRを減算してサラウンド信号SRを発生する演算部128を備えている。
又、高相関成分信号CL、C R、Cは次式によって表わされる。
図22の無相関化処理によりサラウンド信号SL,SRを生成すれば、低相関のサラウンド信号を安定して取り出せることができ、再生音場において拡がり感を大きくできる利点がある。
フルセグの符号化オーディオ信号は図19からもわかるようにワンセグの符号化オーディオ信号よりも高い音声符号化レートであり、デコード後のフルセグのステレオ信号には拡がりのある低い相関成分がワンセグに比べて多く含まれている反面、ワンセグに比べて高い相関成分が少ないことが予測される。すなわち、フルセグのステレオ信号には拡がりのある低い相関成分が比較的多く残る結果、逆に高い相関成分が少なくなる。一方、ワンセグの符号化オーディオ信号は音声符号化レートが低いため、音声の圧縮率を高める必要があり、相関の低い成分を削減する傾向にあり、反面、デコード後のワンセグのステレオ信号には高い相関成分は多くなる。
従って、無相関化処理部において、フルセグのステレオ信号に無相関化処理を施すと、低い相関成分が良好に取り出されるが、高い相関成分がワンセグに比べれば低出力になる。反対にワンセグの音声信号に無相関化処理を施すと高い相関成分が良好に取り出されるが、低い相関成分がフルセグに比べれば低出力になる。
高い相関成分はセンター信号Cとなってフロント中央のスピーカに入力するため、高い相関成分の大小は音の定位に影響を与え、音声レベルにも差を与える。このため、高相関成分が少ないフルセグ受信時の音声レベルは、高相関成分が多いワンセグ受信時の音声レベルより低くなり、フルセグ放送、ワンセグ放送の受信切換が生じると音声レベルが変化して受聴者に違和感を与える問題が生じる。特に、受信状況の変化は都市部で頻繁に発生し、ユーザは運転中に音声を聴くことが中心になるため、音質、音量の変化がユーザにとって気になり、ユーザにストレスを与える。
本発明の目的は、圧縮音声の符号化レートが変化しても受信時の音声レベルを同等にすることにより、フルセグ放送及びワンセグ放送の受信切換が発生して圧縮音声の符号化レートが変化しても違和感が生じないようにすることである。
本発明の目的は、圧縮音声がモノラル、ステレオ、サラウンドであっても受信時の音声レベルを同等にすることにより、モノラル、ステレオ、サラウンド放送の受信切換時に違和感が生じないようにすることである。
本発明の目的は、センター信号のレベルを制御することにより、あるいは、適応信号アルゴリズムにより無相関処理を行う場合はステップサイズパラメータ値、あるいは適応フィルタのタップ長を制御することにより、音声レベルを同等にすることである。
・オーディオ装置
本発明のオーディオ装置は、符号化オーディオ信号よりステレオ信号L,Rを復号して出力すると共に符号化情報を抽出する復号部、前記ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L,Rに高相関な信号をセンター信号として生成する無相関化処理部、前記符号化情報に基づいて前記センター信号のレベルを制御するレベル制御部を備えている。
(1)前記符号化オーディオ信号の符号化レートに基づいて前記センター信号のレベルを制御する、
(2)前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるかに基づいて前記センター信号のレベルを制御する、
(3)前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるか、並びに、該符号化オーディオ信号の符号化レートを考慮して前記センター信号のレベルを制御する、
(4)前記符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに基づいて前記センター信号のレベルを制御する。
また、前記レベル制御部は、ゲインを制御することにより、あるいは、適応信号アルゴリズムにより無相関処理を行う場合はステップサイズパラメータ値、あるいは適応フィルタのタップ長を制御することにより、前記センター信号のレベルを制御する。
本発明のオーディオ処理方法は、符号化オーディオ信号よりステレオ信号L,Rを復号して出力すると共に符号化情報を抽出するステップ、前記ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L,Rに高相関な信号をセンター信号として生成するステップ、前記符号化情報に基づいて前記センター信号のレベルを制御するステップ、前記ステレオ信号L,R、2つのサラウンド信号、センター信号をそれぞれ対応するスピーカに入力するステップを備えている。
前記レベル制御ステップにおいて、上記の(1)〜(4)により前記センター信号のレベルを制御する。
また、ゲインを制御することにより、あるいは、適応信号アルゴリズムにより無相関処理を行う場合はステップサイズパラメータ値、あるいは適応フィルタのタップ長を制御することにより、前記センター信号のレベルを制御する。
本発明によれば、圧縮音声の符号化レートが変化しても受信時の音声レベルを同等にするようにしたから、フルセグ放送及びワンセグ放送の受信切換が発生して圧縮音声の符号化レートが変化しても違和感が生じないようにできる。
本発明によれば、圧縮音声がモノラル、ステレオ、サラウンドであっても受信時の音声レベルを同等にしたから、モノラル、ステレオ、サラウンド放送の受信切換時に違和感が生じないようにできる。
本発明によれば、センター信号のレベルを制御することにより、あるいは、適応信号アルゴリズムにより無相関処理を行う場合はステップサイズパラメータ値、あるいは適応フィルタのタップ長を制御することにより、各種受信状態における受信音声レベルを同等にして違和感をなくすことが出来る。
図1は本発明のオーディオシステムの構成図である。地上波ディジタル放送受信機1はユーザにより選局された放送電波を受信し、OFDM復調してオーディオデータストリームADをオーディオ装置2に入力する。オーディオ装置2の地上波ディジタルデコーダ20は、受信状況(例えばデータ誤り率等)に応じてフルセグオーディオデータあるいはワンセグオーディオデータの一方を選択し、選択したオーディオデータをステレオ信号L.Rにデコードして無相関化処理部30に入力する。また、デコーダ20は入力信号より各種符号化情報Hを分離して後述するコントローラ70に入力する。符号化情報には、デコードするオーディオデータの音声符号化レート、放送番組のジャンル情報、放送形態(モノラル、ステレオ、サラウンドの別)、受信状態(フルセグ、ワンセグ受信の別)を等が含まれている。
無相関化処理部30は、図22に示した構成とほぼ同一の構成を備え、ステレオ信号L,Rの無相関化処理を行い、無相関化された低相関成分のサラウンド信号SL,SR、高相関成分のセンター信号C及びステレオ信号L,Rをそれぞれ出力する。サラウンド信号処理部30が、図22に示した構成と異なる点は、適応フィルタのタップ長や適応信号処理アルゴリズムにおけるステップサイズパラメータμの値をコントローラ70からの指示により変更できるようになっている点である。
ゲイン制御部40はコントローラからの指示によりゲインを可変してセンター信号Cのレベルを制御する。オーディオ信号処理部50は、入力されるステレオ信号L,R、サラウンド信号SL,SR、センター信号Cに周知の音質制御処理、例えば、イコライジング処理、タイムコレクション処理、クロスオーバ処理などの音質制御処理を施し、各信号を対応するアンプを介して図示しないスピーカ(図23参照)に入力する。実施例では、無相関化処理部30とゲイン制御部40とオーディオ信号処理部50はDSP(ディジタルシグナルプロセッサ)60により実現される。
図3に示すように、フルセグの符号化オーディオデータは符号化レートが高いため、デコード処理により得られるステレオ信号には、拡がりのある低い相関成分が比較的多く残るが、半面、高い相関成分が少なくなる。一方、ワンセグの符号化オーディオデータは符号化レートが低いため、デコード処理により得られるステレオ信号には、低い相関成分が少なくなるが、高い相関成分が多くなる。高い相関成分はセンター信号Cとなってフロント中央のスピーカに入力するため、高い相関成分の大小は音の定位に影響を与え、音声レベルにも差を与え、高相関成分が少ないフルセグ受信時の音声レベルは、高相関成分が多いワンセグ受信時の音声レベルより低くなる
後述するように、センター信号のレベルは、デコードするオーディオデータがフルセグのオーディオデータであるか否かにより、あるいは、符号化レートにより、あるいは、符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに等により変化する。そこで、センター信号Cのレベルを制御するには以下の実施態様が考えられる。
デコードするオーディオデータがフルセグのオーディオデータであるか、ワンセグのオーディオデータかに基づいて、コントローラ70が、ゲイン、ステップサイズパラメータ、タップ長の少なくとも1つを制御してセンター信号Cのレベルを制御する。
2)第2の実施態様
オーディオデータの符号化レートに基づいて、コントローラ70が、ゲイン、ステップサイズパラメータ、タップ長の少なくとも1つを制御して高相関成分信号であるセンター信号Cのレベルを制御する。
3)第3の実施態様
符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるか、並びに、該符号化オーディオ信号の符号化レートの両方を考慮して、コントローラ70が、ゲイン、ステップサイズパラメータ、タップ長の少なくとも1つを制御して高相関成分信号であるセンター信号Cのレベルを制御する。
4)第4の実施態様
符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに基づいて、コントローラ70が、ゲイン、ステップサイズパラメータ、タップ長の少なくとも1つを制御して高相関成分信号であるセンター信号Cのレベルを制御する。
図4はフルセグのステレオ信号L,R間の相互相関係数分布Bとワンセグのステレオ信号L,R間の相互相関係数分布Aの説明図である。2つの番組が図示する期間内において切り換わっており、前半は相互相関係数が1付近で推移している。具体的に言うと前半は気象情報の番組であるため、フルセグ、ワンセグともにモノラルのため、ステレオ信号L,R間の相関は1付近となる。しかし、この番組が終わった時点で相互相関係数が下がり、フルセグでは5.1chサラウンド放送が、ワンセグではステレオ放送が開始する。
5.1chサラウンド放送の場合、各チャンネル間の相関が低い音作りに設定されているため、図2に従ってダウンミックスしてもこの傾向はあらわれ、ワンセグに比べてわずかに相互相関係数が低くなる傾向を示す。このとき、図1の無相関化処理部30において無相関化処理を施すと、図5に示すように高相関成分の出力に差が生じ、ワンセグステレオ信号の高相関成分Aの方がフルセグステレオ信号の高相関成分Bのレベルより高くなる。特に、音声の帯域200〜1kHzは音声における相関が最も高い帯域であるため、このレベル差が定位に影響する。つまり、ワンセグ放送受信からフルセグ放送受信に変化したとき、音声レベルが低いと感じ、逆の場合には高いと感じる。
同様に別の番組で、ワンセグステレオ放送の相互相関係数Aとフルセグステレオ放送の相互相関係数Bとの比較を図6に示す。わずかではあるが、ワンセグの方が、相関が高いと読み取ることができる。
また、符号化レートが異なるとステレオ信号L,Rの高相関成分にレベル差が生じる。そこで、更にフルセグ再生時におけるセンター信号Cのレベルを符号化レートに基づいて制御する。このようにすれば、フルセグ受信時とワンセグ受信時における音声レベル差を更に小さくすることができる。図7(B)は、
1)ワンセグオーディオデータ再生時(符号化レートは低速、中速)、ゲイン制御部40のゲインを小さな値(−3dB)にし、
フルセグオーディオデータ再生時には、
2)符号化レートが中速であれば、ゲイン制御部40のゲインを標準値(0dB)にし、
3)符号化レートが高速であれば、ゲイン制御部40のゲインを大きな値(+3dB)にする。図7(C)は、図7(B)に従ってゲインを制御する場合の具体的な制御例であり、フルセグ再生時におけるゲインを、符号化レートに基づいて3段階に制御する。
なお、オーディオデータの符号化レートのみに基づいてセンター信号Cのレベルを制御することもできる。例えば、符号化レートが中速時にセンター信号Cのレベルを変えず、低速時にセンター信号Cのレベルを下げ、高速時にセンター信号Cのレベルを上げれば、それぞれのビットレート時における再生音声レベルを略同等にできる。
(a)第1実施例
図8は、ゲインによりセンター信号Cのレベルを制御する第1実施例の構成図であり、図1と同一部分には同一符号を付している。又、無相関化処理部60は図22とほぼ同等の構成を備え、同一部分には同一符号を付している。
コントローラ70は、図7(A)〜(D)のいずれかにより、すなわち、デコードするオーディオデータがフルセグのオーディオデータであるか否かにより、あるいは、符号化レートにより、あるいは、符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに、レベル制御部40のゲインを決定し、ゲイン制御部40に設定する。これにより、レベル制御部40は設定されたゲインでセンター信号Cを増幅して出力する。
具体的なゲイン制御は、モノラル放送の場合にはゲインを制御せず、高品質ステレオ放送やサラウンド放送の場合にゲインを+6dBにしてセンター信号レベルをアップする。すなわち、図7(C)より明らかなように、ワンセグとフルセグ(5.1ch)とでは相対的に6dBの差があり、ワンセグにおけるゲインを制御せずそのままの値とすれば、フルセグ(5.1ch)におけるゲインを+6dBする。また、フルセグ標準ステレオ信号の場合は、ゲインをワンセグとフルセグ(5.1ch)の差+6dBの中間+3dBにしてセンター信号レベルをアップする。
図10はゲインとステップサイズパラメータμを調整することによりセンター信号Cのレベルを制御する第2実施例の構成図であり、図1と同一部分には同一符号を付している。又、無相関化処理部60は図22とほぼ同等の構成を備え、同一部分には同一符号を付している。
無相関化処理部60が算出する高相関成分はモノラル→ステレオ→サラウンドの順に低くなる。高相関成分はセンター信号Cとなるため、そのレベルが低い程、音声が聞き取りにくくなる。ところで、無相関化処理部60の適応信号処理部110,120における適応速度を上げたほうが高相関成分の抽出がしやすくなる。そこで、適応アルゴリズムにおけるステップサイズパラメータμを大きくして適応速度を上げると高相関成分の抽出速度が上昇する。このため、第2実施例では、高相関成分が低くなるほど、ステップサイズパラメータμを大きくして適応速度を上げ、かつゲインを制御する。このようにすれば、第1実施例のゲインのみを制御する場合に比べてより効果的に音声レベルの制御が可能になる。
以上より、ステップサイズパラメータμをモノラル→ステレオ→サラウンドと変化するに従って大きくなるように制御し、同時に第1実施例の図7(C)のゲイン制御と同じようにゲインを制御する。図11はワンセグ/フルセグと符号化レートの組み合わせにより、どのようにゲインとステップサイズパラメータμを決定するかを示す説明図である。
この図11の例では、1)ワンセグ再生時(モノラル、ステレオ)にはμ=0.0001、ゲイン=−3dBとし、それぞれを最小にする。又、フルセグ再生時には、符号化レートあるいは、モノラル/標準ステレオ/高音質ステレオ(5.1chサラウンド)に応じてステップサイズパラメータμ及びゲインを決定する。すなわち、2)フルセグ再生時であって、符号化オーディオデータがモノラル(低速)の場合には、μ=0.0001、ゲイン=−3dBにし、3)フルセグ再生時であって、符号化オーディオデータが標準ステレオデータ(中速)の場合には、μ=0.0003、ゲイン=0dBにし、4)フルセグ再生時であって、高音質ステレオデータあるいは5.1chサラウンドデータ(高速)の場合には、μ=0.0008、ゲイン=+3dBとし最大にする。
図12の(A)において、Aはμ=0.0003のときのワンセグステレオ信号の高相関成分のレベル、Bはμ=0.0003のときのフルセグ5.1chサラウンドデータをダウンミックスして得られるステレオ信号の高相関成分のレベル、Cはμ=0.001としたときのフルセグ5.1chサラウンドデータをダウンミックスして得られるステレオ信号の高相関成分のレベルである。ステップサイズパラメータμをのみ制御したときの高相関成分のレベルアップ量は小さく、μを0.0003から0.001と大きくしてもレベル特性をワンセグステレオ信号の高相関成分のレベル特性Aに出来ない。そこで、図12(B)に示すようにμを0.0003から0.001と大きくし、かつ、ゲインを+4.5dBにする。このように、μを大きくすると共に、ゲインをアップすることによりフルセグ5.1chサラウンドデータをダウンミックスして得られるステレオ信号の高相関成分のレベル特性は、ワンセグステレオ信号の高相関成分のレベル特性と同等になる。この結果、ワンセグ再生時とフルセグ再生時の音声レベルを同じにでき、ワンセグ/フルセグ切換時における違和感をなくすることきできる。
図13はゲインと適応フィルタのタップ長を調整することによりセンター信号Cのレベルを制御する第3実施例の構成図であり、図1と同一部分には同一符号を付している。又、無相関化処理部60は図22とほぼ同等の構成を備え、同一部分には同一符号を付している。
第2実施例で説明したように、無相関化処理部60の適応信号処理部110,120における適応速度を上げたほうが高相関成分の抽出がしやすくなる。そこで、適応フィルタ112,122のタップ長を長くして適応速度を上げると高相関成分の抽出速度が上昇する。このため、第3実施例では、高相関成分が低くなるほど、タップ長を長くして適応速度を上げ、かつゲインを制御する。このようにすれば、第1実施例のゲインのみを制御する場合に比べてより効果的に音声レベルの制御が可能になる。
以上より、タップ長をモノラル→ステレオ→サラウンドと変化するに従って長くなるように制御し、同時に第1実施例の図7(C)のゲイン制御と同じようにゲインを制御する。図14はワンセグ/フルセグと符号化レートの組み合わせにより、どのようにゲインとタップ長を決定するかを示す説明図である。
この図14の例では、1)ワンセグ再生時(モノラル、ステレオ)にはタップ長=8、ゲイン=−3dBとし、それぞれを最小にする。又、フルセグ再生時には、符号化レートあるいは、モノラル/標準ステレオ/高音質ステレオまたは5.1chサラウンドに応じてタップ長及びゲインを決定する。すなわち、2)フルセグ再生時であって、符号化オーディオデータがモノラル(低速)の場合には、タップ長=8、ゲイン=−3dBにし、3)フルセグ再生時であって、符号化オーディオデータが標準ステレオデータ(中速)の場合には、タップ長=16、ゲイン=0dBにし、4)フルセグ再生時であって、高音質ステレオデータあるいは5.1chサラウンドデータ(高速)の場合には、タップ長=32、ゲイン=+3dBと最大にする。
タップ長を長くすると共に、ゲインをアップすることによりフルセグ5.1chサラウンドデータをダウンミックスして得られるステレオ信号の高相関成分のレベル特性をワンセグステレオ信号の高相関成分のレベル特性と同等にすることができる。この結果、ワンセグ再生時とフルセグ再生時の音声レベルを同じにでき、ワンセグ/フルセグ切換時における違和感をなくすることきできる。
以上の第3実施例ではゲインとタップ長の両方を調整する場合であるが、ゲインとステップサイズパラメータとタップ長の全てを調整してセンター信号Cのレベルを制御することができる。図15はかかる変形例の構成図であり、図1、図22と同一部分には同一符号を付している。
又、以上の第2実施例では、ワンセグ/フルセグと符号化レートの組み合わせによりタップ長及びゲインを制御する場合であるが、ワンセグ受信/フルセグ受信の別のみにより、あるいは、符号化レートのみにより、あるいは、符号化オーディオデータがモノラル/標準ステレオ/高音質ステレオデータまたは5.1chサラウンドデータであるかによりタップ長を制御することができる。
図16はセンター信号とステレオL,R信号のレベルを調整することにより音声レベルを同等とすると共に前方定位感を向上する第4実施例の構成図であり、図1,図22と同一部分には同一符号を付している。異なる点は、ステレオL,R信号のレベルを調整するゲイン制御部41,42を設け、コントローラ70がこれらゲイン制御部のゲインg1を制御するようにしている点である。
図17は、ワンセグ/フルセグと符号化レートの組み合わせにより、どのように各ゲイン制御部40〜42のゲインg1,g2を決定するかを示す説明図である。ステレオL,R信号のレベルを小さくすると前方定位感が向上する。そこで、図17に示すようにレベル制御部41,42のゲインg1を制御し、同時に、レベル制御部40のゲインg2を第1実施例と同様に制御する。すなわち、図17の例では、1)ワンセグ再生時(モノラル、ステレオ)にはg1=0dB、g2=−3dBとする。又、フルセグ再生時には、符号化レートあるいは、モノラル/標準ステレオ/高音質ステレオまたは5.1chサラウンドに応じてゲインg1,g2を決定する。すなわち、2)フルセグ再生時であって、符号化オーディオデータがモノラル(低速)の場合には、g1=0dB、g2=−3dBとする。また、3)フルセグ再生時であって、符号化オーディオデータが標準ステレオデータ(中速)の場合には、g1=−3dB、g2=0dBとし、4)フルセグ再生時であって、高音質ステレオデータや5.1chサラウンドデータ(高速)の場合には、g1=-6dB、g2=+3dBとする。
第4実施例によれば、第1実施例と同様にセンター信号のゲインを制御するため、ワンセグ再生時、フルセグ再生時の音声レベルを同一にでき、ワンセグ/フルセグ切換時における違和感を無くすことが出来る。また、第4実施例によれば、フルセグ再生時において音声符号化レートに基づいてステレオL,R信号のゲインを制御してそのレベルを下げるようにしているため、前方定位感を向上することが出来る。
以上の第4実施例では、ワンセグ/フルセグと符号化レートの組み合わせによりステレオL,R信号のゲイン及びセンター信号のゲインを制御する場合であるが、ワンセグ受信/フルセグ受信の別のみにより、あるいは、符号化レートのみにより、あるいは、符号化オーディオデータがモノラル/標準ステレオ/高音質ステレオデータまたは5.1chサラウンドデータ、であるかにより各ゲインを制御することができる。
2 オーディオ装置
20 地上波ディジタルデコーダ
30 無相関化処理部
40 ゲイン制御部
50 オーディオ信号処理部
70 コントローラ
Claims (18)
- 無相関化処理によりステレオ信号からサラウンド信号及びセンター信号を生成するオーディオ装置において、
符号化オーディオ信号よりステレオ信号を復号して出力すると共に符号化情報を抽出する復号部、
前記ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L,Rに高相関な信号をセンター信号として生成する無相関化処理部、
前記符号化情報に基づいて前記センター信号のレベルを制御するレベル制御部、
を備えたことを特徴とするオーディオ装置。 - 前記レベル制御部は前記符号化オーディオ信号の符号化レートに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項1記載のオーディオ装置。 - 前記レベル制御部は前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるかに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項1記載のオーディオ装置。 - 前記レベル制御部は前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるか、並びに、該符号化オーディオ信号の符号化レートを考慮して前記センター信号のレベルを制御する、
ことを特徴とする請求項1記載のオーディオ装置。 - 前記レベル制御部は前記符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項1記載のオーディオ装置。 - 前記レベル制御部からの制御信号に基づいてゲインを可変して前記センター信号のレベルを制御するゲイン可変部、
を備えたことを特徴とする請求項1乃至5記載のオーディオ装置。 - 前記無相関化処理部において適応信号処理により前記サラウンド信号とセンター信号を発生する場合、前記レベル制御部からの制御信号に基づいて適応信号アルゴリズムのステップサイズパラメータを可変して該センター信号のレベルを可変する手段、
を備えたことを特徴とする請求項1乃至5記載のオーディオ装置。 - 前記無相関化処理部において適応信号処理により前記サラウンド信号とセンター信号を発生する場合、前記レベル制御部からの制御信号に基づいて適応信号処理部を構成する適応フィルタのタップ長を可変して該センター信号のレベルを可変する手段、
を備えたことを特徴とする請求項1乃至5記載のオーディオ装置。 - 前記レベル制御部からの制御信号に基づいて、ゲインを可変して前記オーディオ信号処理部から出力される前記センター信号のレベルおよび前記ステレオ信号のレベルをそれぞれ制御する複数のゲイン可変部、
を備えたことを特徴とする請求項1乃至5記載のオーディオ装置。 - 前記無相関化処理部は、
一方のステレオ信号Rから、他方のステレオ信号Lと相関の高い高相関信号成分CLを抽出し、該他方のステレオ信号Lより該高相関信号CLを減算して第1のサラウンド信号SLを出力する第1の適応信号処理部と、
前記他方のステレオ信号Lから、前記一方のステレオ信号Rと相関の高い高相関信号成分CRを抽出し、該一方のステレオ信号Rより該高相関信号CRを減算して第2のサラウンド信号SRを出力する第2の適応信号処理部と、
前記高相関信号CLと高相関信号CRを合成して前記センター信号を出力する合成部、
を備え、前記レベル制御部は、前記第1、第2の適応信号処理部の適応信号アルゴリズムに使用するステップサイズパラメータを可変して該センター信号のレベルを可変する、
ことを特徴とする請求項1記載のオーディオ装置。 - 前記レベル制御部は、前記ステップサイズパラメータと共に前記センター信号のレベルを制御することを特徴とする請求項10記載のオーディオ装置。
- 前記無相関化処理部は、
一方のステレオ信号Rから、他方のステレオ信号Lと相関の高い高相関信号成分CLを抽出し、該他方のステレオ信号Lより該高相関信号CLを減算して第1のサラウンド信号SLを出力する第1の適応信号処理部と、
前記他方のステレオ信号Lから、前記一方のステレオ信号Rと相関の高い高相関信号成分CRを抽出し、該一方のステレオ信号Rより該高相関信号CRを減算して第2のサラウンド信号SRを出力する第2の適応信号処理部と、
前記高相関信号CLと高相関信号CRを合成して前記センター信号を出力する合成部、
を備え、前記レベル制御部は、前記第1、第2の適応信号処理部を構成する適応フィルのタップ長を制御して該センター信号のレベルを可変する、
ことを特徴とする請求項1記載のオーディオ装置。 - 前記レベル制御部は、前記タップ長と共に前記センター信号のレベルを制御することを特徴とする請求項12記載のオーディオ装置。
- 無相関化処理によりステレオ信号からサラウンド信号及びセンター信号を生成するオーディオ処理方法において、
符号化オーディオ信号よりステレオ信号L,Rを復号して出力すると共に符号化情報を抽出するステップ、
前記ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L,Rに高相関な信号をセンター信号として生成するステップ、
前記符号化情報に基づいて前記センター信号のレベルを制御するステップ、
前記ステレオ信号L,R、2つのサラウンド信号、センター信号をそれぞれ対応するスピーカに入力するステップ
を備えたことを特徴とするオーディオ処理方法。 - 前記符号化オーディオ信号の符号化レートに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項14記載のオーディオ処理方法。 - 前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるかに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項14記載のオーディオ処理方法。 - 前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるか、並びに、該符号化オーディオ信号の符号化レートを考慮して前記センター信号のレベルを制御する、
ことを特徴とする請求項14記載のオーディオ処理方法。 - 前記符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項14記載のオーディオ処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008273379A JP5522920B2 (ja) | 2008-10-23 | 2008-10-23 | オーディオ装置及びオーディオ処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008273379A JP5522920B2 (ja) | 2008-10-23 | 2008-10-23 | オーディオ装置及びオーディオ処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010103768A true JP2010103768A (ja) | 2010-05-06 |
JP5522920B2 JP5522920B2 (ja) | 2014-06-18 |
Family
ID=42293994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008273379A Expired - Fee Related JP5522920B2 (ja) | 2008-10-23 | 2008-10-23 | オーディオ装置及びオーディオ処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5522920B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011244196A (ja) * | 2010-05-18 | 2011-12-01 | Sharp Corp | 音声信号処理装置、方法、プログラム、及び記録媒体 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06253398A (ja) * | 1993-01-27 | 1994-09-09 | Philips Electron Nv | オーディオ信号処理装置 |
JPH10290500A (ja) * | 1997-04-11 | 1998-10-27 | Yamaha Corp | ステレオシステム |
JP2002330492A (ja) * | 2001-03-13 | 2002-11-15 | Thomson Licensing Sa | 音声再生装置及び音声再生方法 |
JP2004112317A (ja) * | 2002-09-18 | 2004-04-08 | Sony Corp | サラウンド音響システム |
JP2006217210A (ja) * | 2005-02-03 | 2006-08-17 | Alpine Electronics Inc | オーディオ装置 |
JP2007028065A (ja) * | 2005-07-14 | 2007-02-01 | Victor Co Of Japan Ltd | サラウンド再生装置 |
JP2007519349A (ja) * | 2004-01-20 | 2007-07-12 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル出力信号を構築する装置および方法またはダウンミックス信号を生成する装置および方法 |
JP2008227788A (ja) * | 2007-03-12 | 2008-09-25 | Alpine Electronics Inc | オーディオ装置 |
-
2008
- 2008-10-23 JP JP2008273379A patent/JP5522920B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06253398A (ja) * | 1993-01-27 | 1994-09-09 | Philips Electron Nv | オーディオ信号処理装置 |
JPH10290500A (ja) * | 1997-04-11 | 1998-10-27 | Yamaha Corp | ステレオシステム |
JP2002330492A (ja) * | 2001-03-13 | 2002-11-15 | Thomson Licensing Sa | 音声再生装置及び音声再生方法 |
JP2004112317A (ja) * | 2002-09-18 | 2004-04-08 | Sony Corp | サラウンド音響システム |
JP2007519349A (ja) * | 2004-01-20 | 2007-07-12 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル出力信号を構築する装置および方法またはダウンミックス信号を生成する装置および方法 |
JP2006217210A (ja) * | 2005-02-03 | 2006-08-17 | Alpine Electronics Inc | オーディオ装置 |
JP2007028065A (ja) * | 2005-07-14 | 2007-02-01 | Victor Co Of Japan Ltd | サラウンド再生装置 |
JP2008227788A (ja) * | 2007-03-12 | 2008-09-25 | Alpine Electronics Inc | オーディオ装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011244196A (ja) * | 2010-05-18 | 2011-12-01 | Sharp Corp | 音声信号処理装置、方法、プログラム、及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP5522920B2 (ja) | 2014-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4939933B2 (ja) | オーディオ信号符号化装置及びオーディオ信号復号化装置 | |
EP1790195B1 (en) | Method of mixing audio channels using correlated outputs | |
JP5455647B2 (ja) | オーディオデコーダ | |
EP0574145B1 (en) | Encoding and decoding of audio information | |
EP1603119A2 (en) | Efficient and scalable parametric stereo coding for low bitrate audio coding applications | |
US20100235171A1 (en) | Audio decoder | |
US20090234657A1 (en) | Energy shaping apparatus and energy shaping method | |
US8184817B2 (en) | Multi-channel acoustic signal processing device | |
JP2001514808A (ja) | 最大側方分離法による多チャネルの能動マトリックス音再生 | |
WO2008111771A1 (en) | A method and an apparatus for processing an audio signal | |
JP2001069597A (ja) | 音声処理方法及び装置 | |
JPH10210600A (ja) | 音響処理回路 | |
JP2008227788A (ja) | オーディオ装置 | |
JP5328637B2 (ja) | マルチチャンネル復号装置、マルチチャンネル復号方法、プログラム及び半導体集積回路 | |
JP5202090B2 (ja) | サラウンド生成装置 | |
JP2008301427A (ja) | マルチチャンネル音声再生装置 | |
JP5038145B2 (ja) | 定位制御装置、定位制御方法、定位制御プログラムおよびコンピュータに読み取り可能な記録媒体 | |
JP2001298680A (ja) | ディジタル放送用信号の仕様およびその受信装置 | |
JP5522920B2 (ja) | オーディオ装置及びオーディオ処理方法 | |
JP4459177B2 (ja) | サラウンド生成装置 | |
JP4963987B2 (ja) | オーディオ装置 | |
JP2009159020A (ja) | 信号処理装置、信号処理方法、プログラム | |
JP2008158300A (ja) | 信号処理装置、信号処理方法、再生装置、再生方法、電子機器 | |
JP5032921B2 (ja) | 音像制御装置および音像制御方法 | |
JP2010287970A (ja) | 放送受信装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130410 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130423 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140124 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140408 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140408 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5522920 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |