JP2008519307A - 多チャンネル音声信号の符号化及び復号化 - Google Patents

多チャンネル音声信号の符号化及び復号化 Download PDF

Info

Publication number
JP2008519307A
JP2008519307A JP2007539673A JP2007539673A JP2008519307A JP 2008519307 A JP2008519307 A JP 2008519307A JP 2007539673 A JP2007539673 A JP 2007539673A JP 2007539673 A JP2007539673 A JP 2007539673A JP 2008519307 A JP2008519307 A JP 2008519307A
Authority
JP
Japan
Prior art keywords
signal
unit
residual
signals
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007539673A
Other languages
English (en)
Other versions
JP5238256B2 (ja
Inventor
ホトー,ヘラルド,ハー
マイバーグ,フランソワ,ピー
ブレーバールト,ディルク,イェー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008519307A publication Critical patent/JP2008519307A/ja
Application granted granted Critical
Publication of JP5238256B2 publication Critical patent/JP5238256B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

符号化装置(1)であって、第1の数(M)の入力音声チャンネルを第2のより少数(N)の出力音声チャンネルへ変換し、第1の信号(Lf;Rf;Co)及び第2の信号(Lr;Rr;Le)を第3の信号(L;R;C)及び第4の信号(Ls;Rs;Cs)に変換する少なくとも1つの変換ユニット(12)を有する。第3の、つまり主要信号は、第1及び第2の信号の信号エネルギーの大部分を有し、一方で第4の、つまり残差信号は当該信号エネルギーの残余を有する。符号化装置は、第3の信号(L;R;C)を用い出力信号を生成するよう、及び第4の信号(Ls;Rs;Cs)を出力するよう配置される。復号化装置(2)であって、第1の数(N)の入力音声チャンネルを第2のより多数(M)の出力音声チャンネルへ変換し、第1の信号(L;R;C)及び第2の信号(Ld;Rd;Ld)を第3の信号(Lf;Rf;Co)及び第4の信号(Lr;Rr;Le)に変換する少なくとも1つの変換ユニット(24)を有する。第1の、つまり主要信号は、第3及び第4の信号の信号エネルギーの大部分を有し、一方で第2の、つまり残差信号は当該信号エネルギーの残余を有する。符号化装置は、少なくとも1つの第2の信号(Ld;Rd;Cd)を受信するよう配置される。

Description

本発明は、多チャンネル符号化及び復号化に関する。より詳細には、本発明は、複数の音声チャンネルをより少数の音声チャンネルへ変換(符号化)する装置及び方法、並びに複数の音声チャンネルをより多数の音声チャンネルへ変換(復号化)する装置及び方法に関する。
多チャンネルを用いる音声システムは、良く知られている。従来のステレオシステムは2つの音声チャンネルのみを用いるが、最新の5.1システムは6チャンネル、つまり前面左(lf)、背面左(lr)、前面右(rf)、背面右(rr)、中央(co)及び低周波数効果(lfe又はle)を用いる。チャンネル数の増加は、格納及び/又は送信されるべき音声データ量の増大を引き起こしている。このデータの増加は、符号化によりデータ量を低減する努力を引き起こした。
これら符号化技術の1つは、Mid/Side(M/S)符号化又は和/差符号化として知られ、非特許文献1に議論されている。Mid/Side符号化は、標準的に1対のステレオ信号を符号化するために用いられる。M/S符号化を用い、第1の(例えば左)信号l[n]及び第2の(例えば右)信号r[n]を有する音声信号は、和信号m[n]及び差(残差)信号s[n]として符号化される。
m[n]=r[n]+l[n]
s[n]=r[n]−l[n] (1)
(大部分の)同一信号l[n]及びr[n]では、対応する差信号s[n]がゼロに近いので、M/S符号化は大きな符号化利得を与える。一方、和信号は、事実上全ての信号エネルギーを有する。従ってこの場合、和及び差信号の符号化に要するビットレートは、単一チャンネルのみの符号化に要するビットレートと近い。
代案として、式(1)のMid/Side符号化処理は、回転行列を用い記述され得る。
Figure 2008519307
ここで、左及び右信号は、角度π/4だけ回転される。和信号は、左及び右のサンプルの線l=rへの投影として解釈され得る。一方、差(又は残差)信号は、左及び右のサンプルの線l=−rへの投影として解釈され得る。
この技術は、π/4以外の回転角を許容することにより一般化され得る。広範囲の入力信号に対し残差信号の信号パワーを最小化するため(つまり符号化利得を最大化する)、回転角は更に、信号に依存して良い。次のユニタリ回転は、1対のチャンネルに適用されて良い。
Figure 2008519307
ここでm’[n]及びs’[n]は、主要及び残差信号をそれぞれ表す。角度αは、残差信号のパワーを最小化するよう、従って主要信号のパワーを最大化するよう選択される。この一般化された回転技術は、しばしば主成分分析(PCA)として参照される。
式(3)の回転は残差信号のパワーを最小化するので、残差信号は、特により高い周波数において標準的に知覚関連情報をほとんど有さないと考えられる。このため、従来の符号化システムは、式(3)の回転及び同様の変換で生成された残差信号を廃棄する。以上で参照された技術は主としてステレオ信号を対象としているが、当該技術は、1対の信号を、格納及び/又は送信される主要信号及び廃棄される残差信号へ繰り返し減少させることにより、5.1信号のような多チャンネルを有する音声信号に適用されて良い。
残差信号の廃棄は、勿論、結果としてデータを減少させる。しかしながら、本発明の発明者らは、残差信号が比較的大容量の情報を有する場合のみ、有意なデータの減少が達成されることを理解していた。残差信号の廃棄は、このような場合、必ず結果として不要な知覚可能な音声信号の歪みを生じる。
復号化装置では、以上に議論された技術は、符号化信号から元の信号を再構成するために用いられる。例えばM/S符号化が用いられている場合、逆回転により元の信号対を再生するために、主要信号及び残差信号の両方が必要である。従来技術の符号化装置では、残差信号は受信されず、従って合成残差信号は各主要信号から逆相関器を用い引き出される。これは元の信号に近似させるが、合成残差信号の波形は、標準的に実際の残差信号の波形と異なる。結果として、復号化信号と元の信号の間に相違がある。
欧州特許第04103168.3号明細書 ジェイ・ディー・ジョンソン、エー・ジェイ・フェレイラ(J.D.Johnston、A.J.Ferreira)、サム−ディファレンス・ステレオ・トランスフォーム・コーディング(Sum−difference stereo transform coding)、ICASSP会報(Proceedings of the International Conference on Acoustics and Speech Signal Processing (ICASSP))、(米国)、1992年、II、p.569−572
本発明の目的は、従来技術の上述の及び他の問題を克服し、及び信号品質を改善させる符号化装置及び復号化装置を提供することである。
従って本発明は、第1の数の入力音声チャンネルを第2の数の出力音声チャンネルに変換する符号化装置を提供する。当該第1の数は当該第2の数より大きい。当該装置は、少なくとも2つの変換ユニットを有し、それぞれ第1の信号及び第2の信号を第3の信号及び第4の信号に変換する。当該第3の信号は、当該第1及び第2の信号の大部分の信号エネルギーを有する。当該第4の信号は、当該信号エネルギーの残余を有する。当該符号化装置は、当該第3の信号を用い出力信号を生成するよう配置される。当該符号化装置は、第4の信号を出力するよう更に配置される。
少なくとも1つの第4の信号を出力することにより、つまり上述の残差信号を廃棄する代わりに出力することにより、元の信号の有意に良好な再構成が復号器により生成され得る。
符号化装置が2つ以上の変換ユニットを有する場合、第4の信号は望ましくは各変換ユニットへ出力される。しかしながらこれは必須ではなく、選択された変換ユニットの第4の信号は、復号器における信号品質を向上するために用いられ得る。留意すべき点は、変換ユニットが並列又は直列(カスケード)に配置され得ること、及び変換ユニットが2つ以上の、例えば3個の入力チャンネルを有して良いことである。
第4の信号全体、つまり第1及び第2の信号の全期間を出力可能であるが、第4の信号が出力されるべき時間区間を選択することが望ましい。より詳細には、知覚関連時間区間(例えば時間フレーム)を選択することにより、第4の信号を送信又は格納するために必要な送信又は記憶容量は、減少される。同時に、依然として有意な信号品質の向上を従来技術に提供する。例えば、5kHzより低い周波数を有する時間区間のみが、周波数に依存した選択を用い選択される。
更に好適な実施例では、時間区間又は信号部分の選択は、実質的に第4の(つまり残差)信号の知覚関連部分を通過させ、第4の信号の知覚関連の少ない部分を減衰し、及び第4の信号の知覚関連の最も少ない部分を抑制することにより達成される。つまり、信号部分(又はフレーム)は、少なくとも3個のグループに分割される。つまり、知覚的に最も関連のある信号部分は、実質的に減衰されずに通過する。知覚的に関連の少ない信号部分も通過するが、減衰される。そして知覚的に最も関連の少ない信号部分は、抑制される。このように、それぞれ異なる関連を有する信号部分間でより円滑な遷移が達成され、結果としてより高い信号品質を得る。
知覚関連性は、多くの方法で、例えば特定の時間区間の間の変換ユニットの第4の信号と第3の信号とのパワー比のような比に依存する例えば重み付け(つまり利得又は減衰)値を提供する重み付け関数を用いることにより、決定されて良い。
個々のチャンネルの時間及び/又は周波数区間の選択の代わりに、又は更に、第4の信号が出力されるチャンネルもまた選択されて良い。少なくとも2つの変換ユニットがカスケードに配置される場合、望ましくは符号化装置の出力端子に最も近い変換ユニットが選択され、符号化装置の第4の信号を出力し、同時に(信号処理方向に)更に離れた1つ以上の変換ユニットの第4の信号は廃棄されて良い。言い換えると、(信号処理方向に)下流の変換ユニットは、他の変換ユニットの前に選択され、それらそれぞれの第4の信号を出力する。本発明の発明者らは、符号化装置の出力端子の最も近くで、つまり最終段で生成された第4の信号が、標準的に復号化装置の最初の段で用いられ、及び従って復号化信号の品質に最も大きい関連を有することを理解していた。このため、望ましくは、特に利用可能な送信容量が全ての第4の信号の送信を許容しない場合、これら第4の信号は送信され、一方より少ない関連を有する変換ユニットの第4の信号が廃棄される。
変換ユニットのこの選択は、一時的又は恒久的であって良い。一時的な場合、全ての変換ユニットは、利用可能な送信容量又は他の因子に依存して、それぞれの第4の信号を通過又は阻止する選択ユニットを設けられて良い。恒久的な場合、特定の変換ユニットの選択ユニットは、標準的に装置の出力端子から最も離れており、省略されて良い。
本発明はまた、以上に定められたような符号化装置を用い符号化された音声信号を復号化する復号化装置を提供する。従って本発明は、第1の数の入力音声チャンネルを第2の数の出力音声チャンネルに変換する復号化装置を提供する。当該第1の数は当該第2の数より小さい。当該装置は、少なくとも2つの変換ユニットを有し、それぞれ第1の信号及び第2の信号を第3の信号及び第4の信号に変換する。当該第1の信号は、当該第3及び第4の信号の大部分の信号エネルギーを有する。当該第2の信号は、当該信号エネルギーの残余を有する。当該装置は、第1の信号を逆相関し合成の第2の信号を生成する少なくとも1つの逆相関ユニットを更に有する。当該復号化装置は、少なくとも1つの追加の第2の信号を受信するよう更に配置される。
復号化装置で生成された如何なる合成残差信号も標準的に元の残差信号と同一でないので、追加の第2の信号(つまり符号化装置で第4の信号として参照された残差信号)を受信することにより、復号化音声信号の品質改善が達成される。
好適な実施例では、受信した第2の信号は、導出された合成の第2の信号と結合され、従って変換ユニットに供給される第2の信号は、2つの信号の合成である。これは、合成残差信号が常に利用可能であり、また当該合成残差信号の時間区間では、如何なる残差信号も送信されないという利点を有する。これらの合成残差信号の時間区間では、実際には残差信号が送信され、変換ユニットにより用いられる残差信号は、送信残差信号と合成残差信号の合成であり、及び従って合成残差信号を部分的にのみ有する。
好適な実施例では、復号化装置は、合成信号を減衰する、受信残差信号により制御される減衰ユニットを設けられる。これは、選択された残差信号と選択されていない残差信号との間のより円滑な遷移を可能にし、如何なる切り替えアーティファクトも回避する。より詳細には、これは、各合成残差信号の振幅を、対応する受信残差信号により制御可能にする。従って、合成残差信号と実際に送信残差信号との合成の有意な改善が達成される。
以上では、M/S及びPCA符号化を参照した。代案として又は更に、振幅に関連する符号化技術が用いられ得る。
留意すべき点は、本発明が空間音声符号化、つまり2つのチャンネルのみを有するステレオ符号化とは対称的に標準的に2つ以上のチャンネルを有する音声符号化に関することである。
本発明は、第1の数の入力音声チャンネルを第2の数の出力音声チャンネルに変換する方法を提供する。当該第1の数は当該第2の数より大きい。当該方法は、少なくとも2つの段階を有する。つまり、第1の信号及び第2の信号を第3の信号及び第4の信号に変換する段階である。当該第3の信号は、当該第1及び第2の信号の大部分の信号エネルギーを有する。当該第4の信号は、当該信号エネルギーの残余を有する。そして、当該第3の信号を用い出力信号を生成する段階である。当該方法は、第4の信号を出力する段階を更に有する。
本発明は、第1の数の入力音声チャンネルを第2の数の出力音声チャンネルに変換する方法を更に提供する。当該第1の数は当該第2の数より小さい。当該方法は、少なくとも2つの段階を有する。つまり、第1の信号及び第2の信号を第3の信号及び第4の信号に変換する段階である。当該第1の信号は、当該第3及び第4の信号の大部分の信号エネルギーを有する。当該第2の信号は、当該信号エネルギーの残余を有する。そして、当該第1の信号から当該第2の信号を引き出す段階である。当該方法は、追加の第2の信号を受信する段階を更に有する。
当該方法は、第1の信号を逆相関する段階を更に有し、導出した合成の第2の信号を生成して良い。望ましくは、当該方法は、合成の第2の信号を減衰する段階を更に有し、当該段階は、対応する受信した第2の信号により制御される。有利なことに、当該方法は、合成の第2の信号と受信した第2の信号を結合する段階、及び結合された信号を変換する段階で用いる段階を更に有して良い。
本発明は、以上に定められた符号化及び復号化方法を実行するコンピュータープログラムを更に提供する。コンピュータープログラムは、CD又はDVDのようなデータ担体に格納された、コンピューターが実行可能な命令のセットを有して良い。コンピューターが実行可能な命令のセットは、プログラム可能なコンピューターに以上に定められた方法を実行させ、またリモートサーバーからの、例えばインターネットを介したダウンロードに利用可能であって良い。
本発明は、例である図示された実施例を参照し、以下に更に説明される。
図1に単なる非限定的な例として示された本発明の装置10は、2対1変換ユニット12と、選択減衰(S&A)ユニット15を有する。変換ユニット12は、信号の第1の対を信号の第2の対に変換するよう配置された従来の変換ユニットであって良い。当該第2の対は、大部分の信号エネルギーを有する主要信号及び残りの信号エネルギーを有する残差信号を有する。信号の第2の対(つまり主要及び残差信号)は、信号回転又は同様の技術を用い、例えば上述の式(3)を用い第1の対から引き出されて良い。
図1の例では、変換ユニット12は、共にステレオ信号を構成する左信号l[k]及び右信号r[k]を受信する。添え字kは、周波数帯又はビンを表す。信号l[k]及びr[k]は、望ましくは時間信号l[n]及びr[n]から、短時間フーリエ変換(STFT)又は同様の変換を用い引き出される。従って、信号l[k]及びr[k]は、時間フレームのような時間区間の周波数成分を表す。
従来技術の配置では、主要信号m[k]は符号化に用いられ、一方、残差信号s[k]は廃棄され、変換ユニット12は主要信号m[k]及び変換に関連したパラメーターのセット(Pars)を生成する。2004年7月5日に出願された特許文献1(PHNL040762)は、残差信号s[k]の一部が用いられる符号器配置を記載している。より詳細には、初期の用途の配置では、残差信号の知覚関連部分を選択し、一方知覚に無関連の部分を廃棄する選択器が用いられる。従って、ある部分(時間フレームの周波数表現であって良い)は、選択されるか廃棄されるかの何れかである。特許文献1の全体の内容は、本願明細書に組み込まれる。特許文献1は、ステレオ符号器及び復号器における残差信号の部分の選択を記載する。しかしながら、5.1構成のような多チャンネル符号化及び復号化装置における残差信号の選択は、記載されていない。
上述の特許文献1による選択は、重み付け関数W’を示す図3に図示される。残差信号の部分に割り当てられた重みwは、関連因子zに依存する。関連因子zは、残差信号s[k]のパワーと主要信号のパワーとの比m:z=P(s[k])/P(m[k])、又は特に主要信号と比較した残差信号の(相対)知覚関連性を表す如何なる他の因子であって良い。残差信号の相対パワーが特定の閾値zを超えた場合、重み付け因子wは1に等しい。これは、残差信号部分が完全に符号化されそして送信されることを意味する。残差信号の相対パワーが特定の閾値zより小さい場合、重み付け因子wは0に等しく、残差信号の関連部分は廃棄される。
本発明の発明者らは、この選択が非常に粗悪であり、可聴の切り替えアーティファクトを生じ得ることを理解している。特に、復号化信号の品質は、送信データ量を有意に増加することなく、改善され得る。従って、本発明は、関連部分と非関連部分との間を区別するだけでなく、関連のより少ない部分、つまり(最も)関連する部分ほど関連しないが無関連でもない部分を識別する残差信号の(部分の)選択を提供する。
本発明による重み付け関数Wの例は、図4及び図5に図示される。図4の例では、重み付け関数Wは、2つの閾値z及びzを有する。zがzより小さい場合、重み付け係数wはゼロに等しい。zがzより大きいがzより小さい場合、重み付け係数wは、(この例では)0.5に等しい(他の値、例えば0.25又は0.67もまた用いられて良いことが理解されるだろう)。zがzより大きい場合、wは1に等しい。図4の例では、従って3個の異なる重み付け係数の値が用いられる。
図5の例では、重み付け係数wは、0(z=z)から0.5(z=z)を経由し1.0(z=1)へ次第に増加する。結果として、最も関連のある信号部分(z=1)だけが、1に等しい重み付け係数を有し、及びzより大きい関連因子zを有する全ての信号部分は、ゼロでない重み付け係数wを有する。図5の例では、理論的に有限数の異なる重み付け係数の値が用いられる。重み付け関数Wの漸増は、結果として異なる減衰レベルの間の円滑な「切り替え」を生じる。
勿論、図4及び図5に図示された関数以外の他の関数が用いられて良い。一般に、重み付け関数は、元の信号対l[k]、r[k]の再構成に如何なる有意な貢献もしない残差信号の部分が除去され、中間の関連を有する残差信号の部分が減衰され、及び非常に重要な部分が実質的に減衰されずに通過するという特性を有する。
留意すべき点は、パワー比の代わりに、帯域幅のような他の基準が用いられ得ることである。例えば、信号パワーに無関係に、特定の閾周波数より低い周波数を有する信号部分を選択するよう決定され得る。
図1に示された本発明による選択減衰(S&A)ユニット15は、信号部分を選択するだけでなく、特定の選択された信号部分を減衰する。残差信号s[k]に加え、選択減衰ユニット15は、主要信号m[k]を受信する。示された実施例では、選択減衰ユニット15はまた、2対1変換ユニット12により生成された信号パラメーター(Pars)、及び元の信号対l[k]及びr[k]を受信する。元の信号対を選択減衰ユニット15に供給することは、主要信号及び残差信号の相対パワー(又は他の特性)に加え又は代わりとして、選択減衰ユニットの決定に元の信号対の相対パワー(又は他の特性)を含める可能性を提供する。信号パラメーターを選択減衰ユニット15に供給することは、更なる信号特性を選択減衰処理で使用可能にする。
選択減衰ユニット15は、主要信号m[k]と共に符号化され得る重み付けされた残差信号ws[k]を出力する。重み付け残差信号ws[k]は、元の残差信号s[k]より少ない情報を有し、及び従って符号化信号対の送信に必要なビットレートを低減することが理解される。他方で、重み付け残差信号ws[k]の算入は、残差信号が廃棄される従来技術の配置と比較して、信号品質の有意な向上を提供する。選択減衰ユニット15は、図4及び図5に図示された重み付け関数W、又は選択及び必要に応じて残差信号s[k]を減衰する如何なる等価なツールを用いる。
復号化装置で用いられる本発明による配置は、図2に図示される。単に例である配置20は、ミキシングユニット24及び重み付けユニット29を有する。配置20は、主要信号m[k]、重み付け残差信号ws[k]及び信号パラメーター(Pars)を受信する。主要信号m[k]は、逆相関器(D)23へ供給され、残差信号が送信されない従来技術の配置で行われるように、合成残差信号s[k]を引き出す。この合成残差信号s[k]は、減衰器26へ供給され、減衰器26において重み付け残差信号ws[k]の制御の下で減衰される。信号パラメーターはまた、減衰器26へ供給され、合成残差信号の減衰を更に制御する。結果として生じる減衰合成残差信号及び重み付け残差信号は、結合ユニット27で結合される。結合ユニット27は、本発明では加算器により構成される。結果として生じる結合残差信号s[k]は、ミキシングユニット24の入力へ供給される。主要信号m[k]はミキシングユニット24の他の入力へ供給される。一方、信号パラメーター(例えばIID及びICCを有する)は、ミキシングユニット24の制御入力へ供給され、信号対m[k]、s[k]を、例えば上述の式(3)に記述された信号回転により、又は如何なる他の適切な技術により、信号対l’[k]、r’[k]に変換する。
従って、本発明の配置20では、ミキシングユニット24へ供給される残差信号s[k]は、(復号化)残差信号ws[k]及び合成残差信号の減衰されたものの合成である。如何なる(送信)残差信号ws[k]も利用可能でない場合、逆相関された信号s[k]が、実質的に減衰されずに用いられる。残差信号ws[k]が利用可能な場合、従って逆相関信号s[k]は減衰される。
本発明による符号化及び復号化装置は、図8、9、12及び13を参照し以下に議論される。しかしながら、先ず、従来技術による符号化装置及び復号化装置が図6及び図7を参照して議論される。
従来技術の符号化装置1’は、所謂5.1信号のような6チャンネルの音声入力信号を、2チャンネルの音声出力信号に符号化するために設計される。示された例では、入力チャンネルはlf(前面左)、lr(背面左)、rf(前面右)、rr(背面右)、co(中央)及びle(低周波数効果)である。これら全ての信号は、デジタル時間信号であり、lf[n]、lr[n]等、nをサンプル番号として表記され得る。
音声入力信号は、分割変換(T)ユニット11へ入力される。分割変換(T)ユニット11は、信号を時間区間に分割する。時間区間は次に、例えばFFT(高速フーリエ変換)を用い周波数ドメインに変換される。時間信号が分割される時間区間は、望ましくは、従来良く知られているように部分的に重複する。
分割変換ユニット11は、変換信号Lf、Lr、Rf、Rr、Co及びLeを生成する。Lf、Lr、Rf、Rr、Co及びLeは、時間区間の周波数ドメイン表現であり、Lf[k]、Lr[k]等、kを周波数インデックスとして表記され得る。これら変換信号は、2対1変換器12へ供給される。2対1変換器12は、入力信号の各対(例えばLf及びLr)を、主要信号(例えばL)及び残差信号に変換し、同時に信号パラメーターの関連セット(例えばPS1)を生成する。この変換は、標準的に信号の回転を有する。従って主要信号は信号エネルギーの大部分を有し、一方で残差信号は信号エネルギーの残余を有する。
図6の従来技術の装置では、残差信号は廃棄され、一方で主要信号は3対2変換ユニット13へ供給される。分かるように、各2対1変換ユニット12は、主要信号L、R及びC、及びそれぞれ関連パラメーターセットPS1、PS2及びPS3を生成する。パラメーターセットは、回転角α、チャンネル間強度差パラメーターIID及び/又はチャンネル間相関パラメーターICCのような、ユニット12により実行される変換に関連するパラメーターを有する。
3対2変換ユニット13は、3個の入力信号L、R及びCを2つの出力信号L及びRに変換し、同時に関連パラメーターセットPS4を生成する。留意すべき点は、入力信号L及びRがそれぞれ以上に定められた第1及び第2の信号と同一であって良く、信号L及びCがそれぞれ以上に定められた第3及び第4の信号と同一であって良いことである。
(変換ドメイン)信号L及びRは、逆変換(T−1)及び重複加算(OLA)ユニット14へ供給される。重複加算(OLA)ユニット14は、時間ドメイン信号l及びrを出力する。逆変換は、ユニット11の変換の片方であり、標準的に逆FFTである。重複加算演算は、実質的にユニット11の分割演算の逆であり、部分的に重複する時間フレームを加算する。
従って従来技術の符号器1’は、6個の入力音声(時間)信号を、2個の出力音声(時間)信号と4個のパラメーターセットに変換することが分かる。各変換ユニット12又は13では、出力信号は廃棄され、信号の数、及び従って必要な送信レートを低減する。
図7は、従来技術による互換性のある復号化装置を図示する。復号化装置2’は、2つの音声入力チャンネルを6個の音声出力チャンネルへ変換するよう設計され、入力(時間)信号l及びrを分割し変換する分割変換(T)ユニット21を有する。符号化装置でのように、短時間フーリエ変換(STFT)が用いられて良い。結果として生じる(変換ドメイン)信号L及びRは、2対3変換ユニット22へ供給される。2対3変換ユニット22へは、(第4の)パラメーターセットPS4も供給される(図6と比較のこと)。2対3変換ユニット22は、2つの信号L及びRを3個の信号L、R及びCに変換する。3個の信号L、R及びCは、それぞれ逆相関(D)ユニット23及びミキシング(M)ユニット24へ供給される。逆相関ユニット23は、信号L、R及びCのそれぞれ逆相関された信号Ld、Rd及びCdを生成する。これらの逆相関信号は、合成残差信号として機能し、符号化装置で廃棄された信号を効果的に置き換える。
3個のミキシングユニット24のそれぞれは、(アップ)ミキシング動作を制御する、それぞれのパラメーターセットPS1、PS2及びPS3を受信する。PCA(主成分分析)が用いられる場合、信号回転は、信号パラメーターセットに含まれた角度αにわたり実行される。他の適切なパラメーターは、例えば以上に説明されたIID及びICCである。これらのパラメーターの全ては必要ではなく、角度αがパラメーターIID及びICCから次式を用い引き出されて良い。
Figure 2008519307
及び
Figure 2008519307
ミキシングユニット24により生成された信号は、それぞれ信号対Lf及びLr、Rf及びRr、並びにCo及びLeである。これらの信号は、逆変換及び重複加算ユニット25により逆変換(T−1)される。逆変換及び重複加算ユニット25は、逆FFTのような適切な逆変換を実行し、そして次に時間信号対lf及びlr、rf及びrr、並びにco及びleを再構成する。従って従来技術の符号器2’は、1対の音声入力信号(l及びr)を、6個の音声出力信号に変換することが分かる。
知られている復号化装置2’の不利点は、出力信号品質が必ず制限されることである。更に利用可能な送信容量の如何なる増加も、出力信号品質の対応する増加を生じないことである。これはつまり、ミキシングユニット24により用いられる残差信号が、合成である、つまり主要信号から引き出されたという事実による。本発明は、既に図1乃至5を参照して説明されたように、残差信号の選択部分も送信することにより、これらの問題を解決する。
図8に示された本発明による符号化装置1は、図6に示された従来技術の符号器装置1’と同様であるが、3個の2対1ユニット12及び単一の3対2ユニット13により生成された残差信号の扱いが異なる。従来技術では、ユニット12の信号処理(標準的に信号回転)演算により生成された残差信号は、廃棄され、従って「2対1」ユニットと参照される。本発明の装置では、しかしながら、これらの残差信号は廃棄されずユニット12により出力され、そしてその後、選択減衰ユニット15により処理される。これは、2対1ユニット12と選択減衰ユニット15を有する図1の配置10と対応する。従って、分割変換ユニット11により生成された(Lf及びLrのような)変換入力信号、及び/又はユニット12により生成された信号パラメーター(図8にPS1、...、PS3と示される)はまた、選択減衰ユニット15へ供給されて良い。
各選択減衰ユニット15は、符号化装置1により出力される、それぞれの残差信号Ls、Rs及びCsを生成する。当業者は、これらの残差信号が、パラメーターセットPS1、...、PS4と同様に、適切に符号化され、及び/又は符号化装置により出力される前に量子化されて良いことを理解するだろう。
3対2ユニット13により生成された追加残差チャンネルEは、同様に選択的に出力されて良い。この残差チャンネルEは、図6を参照して説明された残差チャンネルCの予測エラーを表す。予測エラーは、残差チャンネルC及びその予測の差分に等しく、またはL及びRの一次結合であって良い。追加残差チャンネルEは、望ましくは、選択減衰演算(ユニット15)を行われないが、これは確実に可能である。逆変換(T−1)及び重複加算ユニット14は、示された実施例では、通常出力(時間)信号l及びrに加え、残差(時間)信号eを出力する。
追加残差チャンネルは、追加送信容量(ビット割り当て量)が利用可能な場合、用いられて良い。従って、追加送信容量は、全ての追加残差チャンネルにわたり分配されて良い。いくつかの分配特性は、以下に記載される。
−追加チャンネルは、左側音声チャンネルブロックと右側音声チャンネルブロックとに対称的に割り当てられる(ブロックは、例えばチャンネルに関連したユニットの数である)。
−追加チャンネルは、先ず符号化装置の出力に最も近いブロックに割り当てられる。及び
−利用可能な送信容量は、可能な限り多くの追加チャンネルにわたり分配される。
更に、追加チャンネルの帯域幅は制限され、例えば2kHzに制限されて良い。
図9は、本発明による、例である互換性のある復号化装置を図示する。本発明の復号化装置2は、図7の従来技術の復号化装置2’と同様であるが、ユニット26及び27、追加残差チャンネルLs、Rs及びCsの使用、及び更なる残差チャンネルeの選択的使用が異なる。
図9に示されるように、図9の符号化装置は、3個の重み付けユニット(図2の29)を有する。各重み付けユニットは、逆相関ユニット23、減衰ユニット26及び結合ユニット27を有する。これら各重み付けユニットは、それぞれの残差信号Ls、Rs及びCsを、それぞれのパラメーターセットPS1、PS2及びPS3と共に受信する。重み付けユニット29は、それぞれ逆相関ユニット23、制御された減衰ユニット26及び結合ユニット27を有し、合成残差信号と送信残差信号の重み付けを提供することにより、復号化信号lf、lr、...、leの有意な品質向上を可能にする。
復号化装置2は、図8の符号化装置1だけでなく、残差信号を生成する他の符号化装置で符号化された信号も復号化可能なことが理解されるだろう。言い換えると、図1に図示されたような配置10の重み付けは有利であるが、これら残差信号は、このような配置で重み付けされる必要はない。復号化装置2は、従って従来技術の符号化装置、例えば図6の従来技術の符号化装置により符号化された信号を復号化可能である。
本発明の復号化装置2の実施例は、減衰ユニット26が省略され、チャンネルL、R及びCの逆相関されたものが結合ユニット27に直接供給されると考えられる。本発明の範囲に包含されるこのような実施例では、追加残差チャンネルLs、Rs及びCsの使用は、図7に示される従来技術の復号器2’と比較して改善された信号品質をもたらす。しかしながら、減衰ユニット26を設けることにより、追加残差チャンネルLs、Rs及びCsはより有用に用いられる。
選択的な更なる残差チャンネルeは、2対3ユニット22で第3のチャンネルとして用いられ、従って2個の代わりに3個の入力チャンネルを設ける。これは、例えば残差チャンネルCの予測を調整することにより、信号L、R及びCを(変換)入力チャンネルL及びR及びパラメーターセットPS4から引き出す場合、信号品質を改善する。
図10は、従来技術の6対1符号化装置1’を図示する。この符号化装置は、3個の分割変換ユニット11、5個の2対1ユニット12、13a及び13b、並びに逆変換及び重複加算ユニット14を有する。図6の従来技術の符号化装置1’と比較すると、第1の段(ユニット11及び12)は同一だが、図6の3対2ユニット13は、共に単一の信号M及び2つのパラメーターセットPS4及びPS5を生成する2つの2対1ユニット13a及び13bで置き換えられていることが分かる。単一の(変換ドメイン)信号Mは、逆に変換され、望ましくは重複加算演算を行われ、格納及び/又は送信されて良い単一の音声出力(時間)信号mを生成する。
図11は、対応する従来技術の1対6復号化装置を図示する。図11の復号化装置2’は、単一の音声入力(時間)信号mを6個の音声出力(時間)信号に、5個のアップミックス(M)ユニット22a、22b及び24を用い復号化する。図7の従来技術の2対6復号化装置と比較すると、2対3(アップミックス)ユニット22は、それぞれ、それぞれのパラメーターセットPS5、PS4を受信し単一の入力信号mを3個の中間信号L、R及びCに変換するアップミックスユニット22a及び22bで置き換えられていることが分かる。
図10の従来技術の符号化装置1’は、本発明によると、変更され、図12の本発明の6対1符号化装置を生成して良い。図12の単なる例である実施例では、選択減衰(S&A)ユニット15、16a及び16bが追加され、追加残差チャンネルLs、Rs、Cs、LRs及びMsを生成する。従って、図12の符号化装置1は、出力信号mに加え、5個のパラメーターセットPS1、...PS5及び5個の残差チャンネルLs、Rs、Cs、LRs及びMsを生成し、残差チャンネルは望ましくは重み付けされる。
既に以上に示されたように、選択減衰ユニット15は省略され、従って重み付けされない追加チャンネルLs、Rs及びCsを提供して良い。いくつかの実施例では、選択減衰ユニット16a及び16bは省略されて良い。しかしながら、望ましくは全てのS&Aユニット15、16a及び16bは、図12に図示されるように存在する。
また、例えば送信容量が不十分な場合、残差チャンネルを5個の利用可能な残差チャンネルから選択することが可能である。この場合、符号化装置1の出力端子の最も近くの、つまり変換ユニット14の最も近くの残差チャンネルを選択し送信することが望ましい。これらの残差チャンネルは、対応する復号化装置で最初に使用され、従って復号化処理及び復号化信号品質に最も大きな影響を及ぼす。図12の例では、2対1ユニット13bにより生成された残差チャンネルMsは、最初に選択され、そして次に2対1ユニット13aにより生成された残差チャンネルLRsが選択される。より多くの送信容量が利用可能な場合のみ、残差チャンネルLs、Rs及び/又はCsが選択される。
図13は、互換性のある1対6復号器を図示する。図13の単なる例である実施例では、単一の音声入力(時間)チャンネルmは、6個の音声出力(時間)チャンネルに、5個のパラメーターセットPS1、...、PS5及び5個の残差チャンネルMs、LRs、Ls、Rs及びCsを用い変換される。各残差チャンネルは、図2に図示されたような配置20を用い処理される。各配置は、逆相関ユニット23(又は23a/b)、減衰ユニット26(又は26a/b)、結合ユニット27、及びアップミックスユニット22a、22b又は24を有する。減衰ユニット及び結合ユニットは、残差チャンネルに合成残差チャンネルの振幅を制御させ、及び受信残差チャンネルと合成残差チャンネルの適切な合成を提供させる。従って示された例では、各変換ユニットは、対応する第2の信号を受信するよう配置される。しかしながら、これは必須ではなく、選択された数の変換ユニット24のみ、例えば変換ユニット22a及び22bだけが、第2の信号を受信するよう配置され得る。
本発明は、符号化する場合、残差信号が少なくとも3個の分類、つまり知覚的に関連がある、関連が少ない、及び関連がない、に分割され得ること、及び従って残差信号が減衰され得るという見識に基づく。本発明は、復号化する場合、復号化残差信号が用いられ、合成残差信号の減衰を制御し、再構成残差信号を生成し得るという見識から更に利益を得る。
本発明は、インターネットラジオ、インターネットストリーミング、電子音楽配信(EMD)、固体(例えばMP3又はAAC)オーディオプレーヤー、消費者音声システム、商用音声システム等のような、音声符号化を有する如何なる用途で利用されて良い。
留意すべき点は、本願明細書で用いられた如何なる語も、本発明の範囲を限定するものと見なされるべきでないことである。特に、「有する」の語は、詳細に記載されない如何なる要素も排除することを意味しない。単数の(回路)要素は、複数の(回路)要素又はそれらの等価物で代用されて良い。
当業者には、本発明は以上に説明された例である実施例に限定されず、複数の変形及び変更が請求の範囲に定められた本発明の範囲内で可能であることが明らかであろう。
本発明による符号化装置の一部を図示する。 本発明による復号化装置の一部を図示する。 従来技術による信号選択関数を図示する。 本発明による第1の信号選択関数を図示する。 本発明による第2の信号選択関数を図示する。 従来技術による符号化装置の第1の実施例を図示する。 従来技術による復号化装置の第1の実施例を図示する。 本発明による符号化装置の第1の実施例を図示する。 本発明による復号化装置の第1の実施例を図示する。 従来技術による符号化装置の第2の実施例を図示する。 従来技術による復号化装置の第2の実施例を図示する。 本発明による符号化装置の第2の実施例を図示する。 本発明による復号化装置の第2の実施例を図示する。

Claims (20)

  1. 符号化装置であって、第1の数の入力音声チャンネルを第2の数の出力音声チャンネルに変換し、前記第1の数は前記第2の数より大きく、前記装置は、それぞれ第1の信号及び第2の信号を第3の信号及び第4の信号に変換する少なくとも2つの変換ユニットを有し、前記第3の信号は、前記第1及び第2の信号の大部分の信号エネルギーを有し、及び前記第4の信号は、前記信号エネルギーの残余を有し、前記符号化装置は、前記第3の信号を用い出力信号を生成するよう配置され、
    前記符号化装置は、第4の信号を出力するよう更に配置される、符号化装置。
  2. 前記第4の信号が出力されるべき時間区間を選択する選択ユニットを更に有する、請求項1記載の符号化装置。
  3. 前記選択ユニットは、前記第4の信号の知覚関連部分を実質的に通過させ、前記第4の信号の知覚関連の少ない部分を減衰し、及び前記第4の信号の知覚関連の最も少ない部分を抑制するよう更に配置された、請求項2記載の符号化装置。
  4. 並列に配置された少なくとも3個の変換ユニットを有し、各変換ユニットは、変換時間区間を生成するそれぞれの分割及び変換ユニットと結合され、前記装置は、出力時間信号を生成する逆変換及び重複加算ユニットを更に有する、請求項1記載の符号化装置。
  5. 少なくとも2つのカスケード変換ユニットを有し、前記符号化装置の出力端子と最も近い前記変換ユニットは、選択され、前記変換ユニットの第4の信号を出力し、他の変換ユニットの第4の信号は廃棄される、請求項1記載の符号化装置。
  6. 復号化装置であって、第1の数の入力音声チャンネルを第2の数の出力音声チャンネルに変換し、前記第1の数は前記第2の数より小さく、前記装置は、それぞれ第1の信号及び第2の信号を第3の信号及び第4の信号に変換する少なくとも2つの変換ユニットを有し、前記第1の信号は、前記第3及び第4の信号の大部分の信号エネルギーを有し、及び前記第2の信号は、前記信号エネルギーの残余を有し、前記装置は、第1の信号を逆相関し合成の第2の信号を生成する少なくとも1つの逆相関ユニットを更に有し、
    前記復号化装置は、少なくとも1つの追加の第2の信号を受信するよう更に配置される、復号化装置。
  7. 各変換ユニットは、対応する第2の信号を受信するよう配置される、請求項6記載の復号化装置。
  8. 対応する合成の第2の信号を減衰する、受信した第2の信号により制御される少なくとも1つの減衰ユニットを更に有する、請求項6記載の復号化装置。
  9. 前記合成の第2の信号と前記受信した第2の信号を結合する少なくとも1つの合成ユニットを更に有し、結果として結合された信号を前記変換ユニットで用いる、請求項8記載の復号化装置。
  10. 3個の変換ユニットは、並列に配置される、請求項6記載の復号化装置。
  11. 少なくとも1つの分割及び変換ユニット及び少なくとも2つの逆変換及び重複加算ユニットを更に有する、請求項6記載の復号化装置。
  12. 音声システムであって、請求項1記載の符号化装置を有する、音声システム。
  13. 音声システムであって、請求項6記載の復号化装置を有する、音声システム。
  14. 方法であって、第1の数の入力音声チャンネルを第2の数の出力音声チャンネルに変換し、前記第1の数は前記第2の数より大きく、前記方法は少なくとも2つの段階を有し、前記段階は、第1の信号及び第2の信号を第3の信号及び第4の信号に変換する段階、及び前記第3の信号を用い出力信号を生成する段階であり、前記第3の信号は、前記第1及び第2の信号の大部分の信号エネルギーを有し、及び前記第4の信号は、前記信号エネルギーの残余を有し、
    前記方法は、第4の信号を出力する段階を更に有する、方法。
  15. 少なくとも2つのカスケード変換段階を有し、前記カスケードの下流の変換段階の第4の信号は、送信され、他方の変換段階の第4の信号は廃棄される、請求項14記載の方法。
  16. 方法であって、第1の数の入力音声チャンネルを第2の数の出力音声チャンネルに変換し、前記第1の数は前記第2の数より小さく、前記方法は少なくとも2つの段階を有し、前記段階は、第1の信号及び第2の信号を第3の信号及び第4の信号に変換する段階、及び前記第2の信号を前記第1の信号から引き出す段階であり、前記第1の信号は、前記第3及び第4の信号の大部分の信号エネルギーを有し、及び前記第2の信号は、前記信号エネルギーの残余を有し、
    前記方法は、追加の第2の信号を受信する段階を更に有する、方法。
  17. 第1の信号を逆相関する段階を更に有し、合成の第2の信号を生成する、請求項16記載の方法。
  18. 前記合成の第2の信号を減衰する段階を更に有し、前記段階は、対応する受信した第2の信号により制御される、請求項17記載の方法。
  19. 前記合成の第2の信号と前記受信した第2の信号を結合する段階、及び結合された信号を前記変換する段階で用いる段階を更に有する、請求項18記載の方法。
  20. コンピュータープログラムであって、請求項14又は16記載の方法を実行するコンピュータープログラム。
JP2007539673A 2004-11-04 2005-10-31 多チャンネル音声信号の符号化及び復号化 Active JP5238256B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP04105527 2004-11-04
EP04105527.8 2004-11-04
EP05103079 2005-04-18
EP05103079.9 2005-04-18
EP05103443 2005-04-27
EP05103443.7 2005-04-27
PCT/IB2005/053550 WO2006048817A1 (en) 2004-11-04 2005-10-31 Encoding and decoding of multi-channel audio signals

Publications (2)

Publication Number Publication Date
JP2008519307A true JP2008519307A (ja) 2008-06-05
JP5238256B2 JP5238256B2 (ja) 2013-07-17

Family

ID=35478388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007539673A Active JP5238256B2 (ja) 2004-11-04 2005-10-31 多チャンネル音声信号の符号化及び復号化

Country Status (9)

Country Link
US (1) US7809580B2 (ja)
EP (1) EP1810279B1 (ja)
JP (1) JP5238256B2 (ja)
KR (1) KR101183859B1 (ja)
CN (1) CN101053017B (ja)
BR (1) BRPI0517987B1 (ja)
MX (1) MX2007005262A (ja)
RU (1) RU2407068C2 (ja)
WO (1) WO2006048817A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011527763A (ja) * 2008-07-11 2011-11-04 サムスン エレクトロニクス カンパニー リミテッド マルチチャネルの符号化及び復号化方法並びに装置
JP2013125150A (ja) * 2011-12-14 2013-06-24 Fujitsu Ltd 復号装置、復号方法、及び復号プログラム
US8831960B2 (en) 2011-08-30 2014-09-09 Fujitsu Limited Audio encoding device, audio encoding method, and computer-readable recording medium storing audio encoding computer program for encoding audio using a weighted residual signal
JP2021525390A (ja) * 2018-05-31 2021-09-24 華為技術有限公司Huawei Technologies Co.,Ltd. ステレオ信号符号化方法およびステレオ信号符号化装置
JP2021525391A (ja) * 2018-05-31 2021-09-24 華為技術有限公司Huawei Technologies Co.,Ltd. ダウンミックス信号及び残差信号を計算するための方法及び装置

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2391714C2 (ru) * 2004-07-14 2010-06-10 Конинклейке Филипс Электроникс Н.В. Преобразование аудиоканалов
CN101116136B (zh) * 2005-02-10 2011-05-18 皇家飞利浦电子股份有限公司 声音合成的装置和方法
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
ATE531036T1 (de) * 2006-03-15 2011-11-15 France Telecom Einrichtung und verfahren zur codierung durch hauptkomponentenanalyse eines mehrkanaligen audiosignals
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
EP2511903A3 (en) * 2007-10-22 2012-11-28 Electronics and Telecommunications Research Institute Multi-object audio decoding method and apparatus thereof
KR101441897B1 (ko) 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
RU2498526C2 (ru) 2008-12-11 2013-11-10 Фраунхофер-Гезелльшафт цур Фердерунг дер ангевандтен Устройство для генерирования многоканального звукового сигнала
RU2449307C2 (ru) * 2009-04-02 2012-04-27 ОАО "Научно-производственное объединение "ЛЭМЗ" Способ обзорной импульсно-доплеровской радиолокации целей на фоне отражений от земной поверхности
FR2954640B1 (fr) * 2009-12-23 2012-01-20 Arkamys Procede d'optimisation de la reception stereo pour radio analogique et recepteur de radio analogique associe
CN103733256A (zh) * 2011-06-07 2014-04-16 三星电子株式会社 音频信号处理方法、音频编码设备、音频解码设备和采用所述方法的终端
US9098576B1 (en) 2011-10-17 2015-08-04 Google Inc. Ensemble interest point detection for audio matching
US8805560B1 (en) 2011-10-18 2014-08-12 Google Inc. Noise based interest point density pruning
US8831763B1 (en) 2011-10-18 2014-09-09 Google Inc. Intelligent interest point pruning for audio matching
US8886543B1 (en) 2011-11-15 2014-11-11 Google Inc. Frequency ratio fingerprint characterization for audio matching
US9268845B1 (en) 2012-03-08 2016-02-23 Google Inc. Audio matching using time alignment, frequency alignment, and interest point overlap to filter false positives
US9471673B1 (en) 2012-03-12 2016-10-18 Google Inc. Audio matching using time-frequency onsets
US9087124B1 (en) 2012-03-26 2015-07-21 Google Inc. Adaptive weighting of popular reference content in audio matching
US9148738B1 (en) 2012-03-30 2015-09-29 Google Inc. Using local gradients for pitch resistant audio matching
JP5949270B2 (ja) 2012-07-24 2016-07-06 富士通株式会社 オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
CA2926243C (en) * 2013-10-21 2018-01-23 Lars Villemoes Decorrelator structure for parametric reconstruction of audio signals
KR101453733B1 (ko) 2014-04-07 2014-10-22 삼성전자주식회사 오디오 신호 처리장치
CN105632505B (zh) * 2014-11-28 2019-12-20 北京天籁传音数字技术有限公司 主成分分析pca映射模型的编解码方法及装置
EP3246923A1 (en) * 2016-05-20 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a multichannel audio signal
US10839814B2 (en) 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals
US10535357B2 (en) * 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
US10580420B2 (en) * 2017-10-05 2020-03-03 Qualcomm Incorporated Encoding or decoding of audio signals
CN112740708B (zh) * 2020-05-21 2022-07-22 华为技术有限公司 一种音频数据传输方法及相关装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06318922A (ja) * 1993-01-22 1994-11-15 Philips Electron Nv 左及び右ステレオ信号と中央信号のディジタル3チャンネル送信システム
JP2002162996A (ja) * 2000-11-24 2002-06-07 Matsushita Electric Ind Co Ltd オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム
JP2002541524A (ja) * 1999-04-07 2002-12-03 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 損失のない符号化・復号へのマトリックス改良
WO2003085645A1 (en) * 2002-04-10 2003-10-16 Koninklijke Philips Electronics N.V. Coding of stereo signals

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040086130A1 (en) * 2002-05-03 2004-05-06 Eid Bradley F. Multi-channel sound processing systems
CN100539742C (zh) * 2002-07-12 2009-09-09 皇家飞利浦电子股份有限公司 多声道音频信号编解码方法和装置
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7646875B2 (en) * 2004-04-05 2010-01-12 Koninklijke Philips Electronics N.V. Stereo coding and decoding methods and apparatus thereof
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
ATE470930T1 (de) * 2005-03-30 2010-06-15 Koninkl Philips Electronics Nv Skalierbare mehrkanal-audiokodierung

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06318922A (ja) * 1993-01-22 1994-11-15 Philips Electron Nv 左及び右ステレオ信号と中央信号のディジタル3チャンネル送信システム
JP2002541524A (ja) * 1999-04-07 2002-12-03 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 損失のない符号化・復号へのマトリックス改良
JP2002162996A (ja) * 2000-11-24 2002-06-07 Matsushita Electric Ind Co Ltd オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム
WO2003085645A1 (en) * 2002-04-10 2003-10-16 Koninklijke Philips Electronics N.V. Coding of stereo signals

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JPN5007019950; HERRE J: 'MP3 SURROUND: EFFICIENT AND COMPATIBLE CODING OF MULTI-CANNEL AUDIO' AUDIO ENGINEERING SOCIETY CONVENTION PREPRINT , 20040508, P1-14 *
JPN5007019951; GRILL BERNHARD: 'MP3 IN MPEG-4' PREPRINTS OF PAPERS PRESENTED AT THE AES CONVENTION , 20031010, P1-7 *
JPN5007019952; VAN DER WAAL R G: 'Subband Coding of Stereophonic Digital Audio Signals' ICASSP V2 CONF 16, 19910414, P3601-3604, IEEE *
JPN6011027307; Dai Yang, Hongmei Ai, Kyriakakis C., Kuo C.-C.J.: 'High-fidelity multichannel audio coding with Karhunen-Loeve transform' Speech and Audio Processing, IEEE Transactions on , 200307, p.365-380, IEEE *
JPN6011027309; Johnston J.D., Ferreira A.J.: 'Sum-difference stereo transform coding' Acoustics, Speech, and Signal Processing, 1992. ICASSP-92., 1992 IEEE International Conference on , 199203, p.II-569 - II-572, IEEE *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011527763A (ja) * 2008-07-11 2011-11-04 サムスン エレクトロニクス カンパニー リミテッド マルチチャネルの符号化及び復号化方法並びに装置
JP2014063202A (ja) * 2008-07-11 2014-04-10 Samsung Electronics Co Ltd マルチチャネルの符号化及び復号化方法並びに装置
US8831960B2 (en) 2011-08-30 2014-09-09 Fujitsu Limited Audio encoding device, audio encoding method, and computer-readable recording medium storing audio encoding computer program for encoding audio using a weighted residual signal
JP2013125150A (ja) * 2011-12-14 2013-06-24 Fujitsu Ltd 復号装置、復号方法、及び復号プログラム
JP2021525390A (ja) * 2018-05-31 2021-09-24 華為技術有限公司Huawei Technologies Co.,Ltd. ステレオ信号符号化方法およびステレオ信号符号化装置
JP2021525391A (ja) * 2018-05-31 2021-09-24 華為技術有限公司Huawei Technologies Co.,Ltd. ダウンミックス信号及び残差信号を計算するための方法及び装置
JP7110401B2 (ja) 2018-05-31 2022-08-01 華為技術有限公司 ステレオ信号符号化方法およびステレオ信号符号化装置
US11462224B2 (en) 2018-05-31 2022-10-04 Huawei Technologies Co., Ltd. Stereo signal encoding method and apparatus using a residual signal encoding parameter
US11961526B2 (en) 2018-05-31 2024-04-16 Huawei Technologies Co., Ltd. Method and apparatus for calculating downmixed signal and residual signal
US11978463B2 (en) 2018-05-31 2024-05-07 Huawei Technologies Co., Ltd. Stereo signal encoding method and apparatus using a residual signal encoding parameter

Also Published As

Publication number Publication date
BRPI0517987A (pt) 2008-10-21
US20090055194A1 (en) 2009-02-26
CN101053017B (zh) 2012-10-10
BRPI0517987A8 (pt) 2018-07-31
KR20070085721A (ko) 2007-08-27
EP1810279A1 (en) 2007-07-25
BRPI0517987B1 (pt) 2021-04-27
WO2006048817A1 (en) 2006-05-11
MX2007005262A (es) 2007-07-09
KR101183859B1 (ko) 2012-09-19
RU2007120528A (ru) 2008-12-10
RU2407068C2 (ru) 2010-12-20
CN101053017A (zh) 2007-10-10
JP5238256B2 (ja) 2013-07-17
EP1810279B1 (en) 2013-12-11
US7809580B2 (en) 2010-10-05

Similar Documents

Publication Publication Date Title
JP5238256B2 (ja) 多チャンネル音声信号の符号化及び復号化
RU2625444C2 (ru) Система обработки аудио
JP5688862B2 (ja) 混合の可逆的音声圧縮
AU2006233504B2 (en) Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
CA2697830C (en) A method and an apparatus for processing a signal
JP5106383B2 (ja) オーディオ符号化および復号化
JP4616349B2 (ja) ステレオ互換性のあるマルチチャネルオーディオ符号化
JP5455647B2 (ja) オーディオデコーダ
JP5645951B2 (ja) ダウンミックス信号表現に基づくアップミックス信号を提供する装置、マルチチャネルオーディオ信号を表しているビットストリームを提供する装置、方法、コンピュータプログラム、および線形結合パラメータを使用してマルチチャネルオーディオ信号を表しているビットストリーム
JP4664431B2 (ja) アンビエンス信号を生成するための装置および方法
EP1376538A1 (en) Hybrid multi-channel/cue coding/decoding of audio signals
US10141004B2 (en) Hybrid waveform-coded and parametric-coded speech enhancement
JP2008519306A (ja) 信号の組のエンコード及びデコード
US9280974B2 (en) Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program
KR20090095009A (ko) 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치
JP2015507228A (ja) マルチチャネルオーディオ信号の適応ダウン及びアップミキシングを実行するための方法及び装置
JP4809234B2 (ja) オーディオ符号化装置、復号化装置、方法、及びプログラム
JP2009151183A (ja) マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法
TW202411984A (zh) 用於具有元資料之參數化經寫碼獨立串流之不連續傳輸的編碼器及編碼方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110531

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110829

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120221

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120515

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120522

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130131

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130401

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5238256

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250