JP5171269B2 - マルチチャネルオーディオ符号化における忠実度の最適化及び信号伝送量の低減 - Google Patents

マルチチャネルオーディオ符号化における忠実度の最適化及び信号伝送量の低減 Download PDF

Info

Publication number
JP5171269B2
JP5171269B2 JP2007556114A JP2007556114A JP5171269B2 JP 5171269 B2 JP5171269 B2 JP 5171269B2 JP 2007556114 A JP2007556114 A JP 2007556114A JP 2007556114 A JP2007556114 A JP 2007556114A JP 5171269 B2 JP5171269 B2 JP 5171269B2
Authority
JP
Japan
Prior art keywords
length
sub
frame
signal
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007556114A
Other languages
English (en)
Other versions
JP2008532064A (ja
Inventor
アニセ タレブ,
ステファン アンデルソン,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority claimed from PCT/SE2006/000235 external-priority patent/WO2006091151A1/en
Publication of JP2008532064A publication Critical patent/JP2008532064A/ja
Application granted granted Critical
Publication of JP5171269B2 publication Critical patent/JP5171269B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Description

本発明は、オーディオ符号化及び復号化技術に関し、特に、ステレオ符号化等のマルチチャネルオーディオ符号化に関する。
高い音声品質を維持しながら音声信号を低ビットレートで伝送し保存することへの市場の要求は大きい。特に、伝送リソース又は記憶装置が限られている場合、低ビットレートでの動作が重要なコスト要素である。このことが典型的に当てはまるのは、例えば、GSM、UMTS又はCDMAなどのモバイル通信システムでのストリーミング及びメッセージングのアプリケーションの場合である。
図1を用いて、マルチチャネル符号化/復号化を使用する音声伝送システムの一般的な例を概略的に説明する。全体のシステムは基本的に、送信側にマルチチャネル・オーディオエンコーダ100と送信モジュール10を備え、受信側に受信モジュール20とマルチチャネル・オーディオデコーダ200を備える。
音声信号のステレオ符号化又はマルチチャネル符号化の最も単純な方法は、図2に示すように、異なるチャネルの信号を個別に独立の信号として別々に符号化することである。しかしこれでは、複数のチャネル間の冗長性は取り除かれず、ビットレートはチャネル数に比例することになる。
もう1つの基本的な方法で、ステレオFMラジオ放送で使用され、昔からあるモノラル・ラジオ受信機と互換性を確保する方法は、関与する2つのチャネルの和と差の信号を送信することである。
MPEG−1/2レイヤIII及びMPEG−2/4AACなどの最先端のオーディオコーデックは、いわゆるジョイントステレオ符号化を使用する。この技術によれば、異なるチャネルの信号は別々に個別に処理されるのではなく、一緒に処理される。最も広く使用されているジョイントステレオ符号化 (joint stereo coding) は、「Mid/Side」(M/S)ステレオ符号化及びインテンシティステレオ符号化 (intensity stereo coding) として知られる2つの符号化であり、それらは普通、符号化されるステレオ信号又はマルチチャネル信号のサブバンドに適用される。
M/Sステレオ符号化は、チャネルのサブバンドの和と差の信号を符号化して送信し、それによりチャネルのサブバンド間の冗長性を利用する点において、前述のステレオFMラジオの手順と類似している。M/Sステレオ符号化に基づくコーダの構成と動作については、例えば文献[1](特許文献1)に記載されている。
他方、インテンシティステレオは、ステレオの無関係さを使用することができる。インテンシティステレオでは、(異なるサブバンドの)チャネルの連結強度(joint intensity)を、チャネル間に信号の強度がどのように分布しているかを示す位置情報と共に送信する。インテンシティステレオでは、チャネルのスペクトル振幅情報だけを出力し、位相情報は伝達しない。このため及び、チャネル間時間情報(より具体的にはチャネル間時間差)は特に低周波数においては心理音響関連性が大きいことから、インテンシティステレオは、例えば2kHzを超える高い周波数でのみの使用とすることができる。インテンシティステレオ符号化方法は、例えば文献[2](特許文献2)に記載されている。
バイノーラルキュー符号化(BCC)と呼ばれる最近開発されたステレオ符号化方法が、文献[3](非特許文献1)に記載されている。この方法はパラメトリック・マルチチャネル音声符号化方法である。この種のパラメトリック符号化技術の基本原理は、符号化側においてN個のチャネルからの入力信号を1つのモノラル信号に合成することである。モノラル信号は、従来のどのモノラルのオーディオコーデックを使用しても符号化できる。並行して、パラメータはマルチチャネル音像を表すチャネル信号から引き出せる。パラメータは符号化され、音声ビット・ストリームと一緒にデコーダに送信される。デコーダはまずモノラル信号を復号し、次にマルチチャネル音像のパラメトリック表現に基づきチャネル信号を再生する。
バイノーラルキュー符号化(BCC)法の原理は、符号化モノラル信号及びいわゆるBCCパラメータを送信することである。BCCパラメータは、元のマルチチャネル入力信号のサブバンドに関する符号化されたチャネル間レベル差及び符号化されたチャネル間時間差を含む。デコーダは、BCCパラメータに基づき、モノラル信号のサブバンドに関するレベルならびに位相及び/又は遅延の補正を活用することにより、異なるチャネルの信号を再生する。例えばM/Sステレオ又はインテンシティステレオに対する利点は、チャネル間時間情報を備えるステレオ情報がはるかに低いビットレートで送信されることである。しかし、BCCは演算量の要求が厳しく、また、一般には聴感上の最適化ができない。
文献[4](特許文献3)に記載される別の技術は、モノラル信号及びいわゆるサイド情報 (side information) を符号化する同じ原理を使用する。この場合、サイド情報は予測フィルタ (predictor signal) 及び状況に応じて残差信号 (residual signal) で構成される。予測フィルタは、LMSアルゴリズムで推定され、モノラル信号に適用されると、マルチチャネル音声信号の予測を与える。この技術を使用して、マルチチャネル音源を非常に低いビットレートで符号化することができるが、品質低下という犠牲を伴う。
図3に、そのパラメトリック・ステレオ符号化の基本原理を示す。図3は、ダウンミキシング・モジュール120、中核のモノラルコーデック130、230、及びパラメトリック・ステレオ・サイド情報エンコーダ/デコーダ140、240を備えるステレオコーデックの構成を示している。ダウンミキシングは、マルチチャネル(この場合はステレオ)信号をモノラル信号に変換する。パラメトリック・ステレオコーデックの目的は、復元されたモノラル信号と付加的なステレオ・パラメータを与えて、デコーダでステレオ信号を再生することである。
最後に、すべてを網羅するために、3D音声で使用される技術にも触れておく。この技術は、いわゆる頭部関連フィルタで音源信号をフィルタリングして左右のチャネル信号を合成する。しかし、この技術は、分離される異なる音源信号を必要とし、それ故、一般にステレオ又はマルチチャネルの符号化に適用されることはない。
[1] 米国特許第5,285,498号 [2] 欧州特許第0,497,413号 [4] 米国特許第5,434,948号 [3] C. Faller et al., "Binaural cue coding applied to stereo and multi-channel audio compression", 112th AES convention, May 2002, Munich, Germany. [5] S-S. Kuo, J. D. Johnston, "A study why cross channel prediction is not applicable to perceptual audio coding", IEEE Signal Processing Lett, vol. 8, pp. 245-247. [6] B. Edler, C. Faller and G. Schuller, "Perceptual audio coding using a time- varying linear pre- and post-filter", in AES Convention, Los Angeles, CA, Sept. 2000. [7] Bernd Edler and Gerald Schuller, "Audio coding using a psychoacoustical pre- and post-filter", ICASSP-2000 Conference Record, 2000. [8] Dieter Bauer and Dieter Seitzer, "Statistical properties of high-quality stereo signals in the time domain", IEEE International Conf. on Acoustics, Speech, and Signal Processing, vol. 3, pp. 2045-2048, May 1989. [9] Gene H. Golub and Charles F. van Loan, "Matrix Computations", second edition, chapter 4, pages 137-138, The John Hopkins University Press, 1989.
本発明は先行技術による装置の上記及び他の欠点を克服する。
本発明の全体的な目的は、低ビットレートで高品質のマルチチャネルオーディオを提供することである。
特に、なるべく少ない符号化ビット数を使用して、ステレオ又はマルチチャネルの情報を正確に表す能力のある効率的な符号化処理を提供することが望まれる。ステレオ符号化に関しては、例えば、ステレオ音像の躍動感がよく表現され、ステレオ信号の再生品質が高められることが重要である。
利用可能なビット割り当て量の効率的な使用、及び、必要な信号伝送量の最適化を実現することも、本発明の目的である。
マルチチャネルオーディオ信号を符号化する方法及び装置を提供することも、本発明の特定の目的である。
本発明の別の特定の目的は、符号化されたマルチチャネルオーディオ信号を復号化する方法及び装置を提供することである。
本発明のまた別の目的は、改良されたオーディオ伝送システムを提供することである。
上記及び他の目的は、特許請求の範囲で定義される本発明により達成される。
現在のところ、例えばモバイル通信システムでも使用するのに経済的に魅力的なビットレートで、高品質のステレオ又はマルチチャネルのオーディオを提供する標準化されたコーデックは入手できない。入手可能なコーデックで可能なことは、オーディオ信号のモノラルでの伝送及び/又は保存である。ある程度までは、ステレオでの伝送や保存も可能ではあるが、多くの場合、ビットレートの制約によってステレオ表現を極めて大幅に制限されることになる。
本発明は、オーディオ信号からのステレオ又はマルチチャネルの情報を分離することを可能にし、かつ最適な可能な方法でそれを正確に表すことを可能にする解決策を提案することにより、上記の問題を克服する。本発明は、第1の符号化処理において1つ以上のマルチチャネルの第1の信号を符号化し、フィルタに基づく第2の符号化処理において1つ以上のマルチチャネルの第2の信号を符号化することを基本原理とする。本発明による基本概念は、第2の符号化処理のために、i)符号化フレーム全体のサブフレームのセットへのフレーム分割構成と、ii)各サブフレームのフィルタ長との組合せを、所定の条件に従って選択することである。第2の信号は、選択された組合せに従って、選択されたサブフレームのセットの各サブフレームにおいて符号化される。
可変フレーム長の場合、符号化フレームは、種々のフレーム分割構成に従って複数のサブフレームに分割される。サブフレームは相異なるサイズであってもよいが、通常、任意の所定のフレーム分割構成のサブフレームの長さの合計は符号化フレーム全体の長さと等しい。フレーム分割構成を選択すると同時に各サブフレームに対するフィルタ長を調整するという可能性により、追加的な自由度が得られ、一般に性能は向上する。所定の条件は、符号化フレーム全体にわたる第2の符号化処理の性能を表す尺度の最適化に基づくものであることが好ましい。
第2の符号化処理又はそれに関連するコントローラは、選択されたフレーム分割構成及び選択されたフレーム分割構成の各サブフレームのフィルタ長を表す出力データを生成する。符号化情報の正確な復号化を可能にするために、この出力データは、符号化側から復号化側へ送信される必要がある。フレーム分割構成とフィルタ長との適切な組合せの選択により、全体の性能は大幅に向上するが、オーディオ送信システムにおける符号化側から復号化側への送信に必要とされる信号伝送量はその分増加することは明らかである。したがって、本発明の特定の例示的な実施形態においては、ある特定の長さの各サブフレームを事前定義済みフィルタ長と関連付けるのが望ましい。通常、長いフィルタは長いフレームに割り当てられ、短いフィルタは短いフレームに割り当てられる。
換言すると、所定の条件は、符号化フレームのサブフレームのセットへのフレーム分割構成を示すと共に各サブフレームに対して選択されるフィルタ次元数を示すように、各サブフレームのフィルタ長がサブフレームの長さに依存して選択されるという必要条件を含む。これにより、必要とする復号化側への信号伝送量を低減することができる。
本発明の好適な実施形態において、所定の条件は、各サブフレームのフィルタ長がサブフレームの長さに応じて制御されるという必要条件に従う符号化フレーム全体にわたる前記第2の符号化処理の性能を表す尺度の最適化に基づくものである。
復号化側においては、デコーダは、対応する第2の符号化処理で使用されたサブフレームのセットへの符号化フレーム全体のフレーム分割構成及び各サブフレームのフィルタ長を表す情報を受信する。この情報は、第2の信号を正確に復号化する目的で、第2の復号化処理において第2の信号復元データを解釈するために使用される。上述のように、この情報は、符号化フレームのサブフレームのセットへのフレーム分割構成を示すと共に各サブフレームに対して選択されたフィルタ次元数を示すデータを含むことが好ましい。
第1の符号化処理が符号化フレーム全体のサブフレームのセットへのフレーム分割構成によるいわゆる可変フレーム長処理を使用する場合、第2の符号化処理に対しても同一のフレーム分割構成を使用するのが有用である。その場合、1つの符号化処理に対するフレーム分割構成を表す情報を信号で伝送することで十分である。
符号化と、それに関連するフレーム分割構成及びフィルタ長の制御は、フレーム毎に実行されることが好ましい。更に、制御システムは、マルチチャネルオーディオ信号のチャネル間相関特性に基づいて動作することが好ましい。
例えば、第1の符号化処理を主符号化処理とし、第1の信号を主信号とすることができる。また例えば、第2の符号化処理を補助/副信号処理とし、第2の信号をステレオ副信号等の副信号とすることができる。そのような場合、通常、第2の符号化処理は、調整可能な適応チャネル間予測(ICP)フィルタ長と組み合わせて可変フレーム長処理を使用して、第1及び第2の信号に基づいて第2の信号を予測するためのICPを含む。そのような方式を使用する利点は、ステレオ又はマルチチャネルイメージのダイナミクスが適切に表現されることである。フレーム分割構成及び関連するフィルタ長の選択は、一般に第2の符号化処理の推定性能に基づくことが好ましく、特にICPフィルタに基づくことが好ましい。
本発明は、主に、第1の符号化処理が主符号化処理であり、第2の符号化処理が補助符号化処理である場合に関するが、第1の符号化処理が補助符号化処理であり、第2の符号化処理が主符号化処理である場合にも適用可能であることを理解すべきである。また、フレーム分割構成及び関連するフィルタ長の制御が第1の符号化処理及び第2の符号化処理の双方に対して実行されることも可能である。
本発明は、以下の利点を提供する。
・マルチチャネルオーディオ符号化/復号化の改良。
・オーディオ送信システムの改良。
・マルチチャネルオーディオ再生品質の向上。
・比較的低いビットレートでの高品質のマルチチャネルオーディオ。
・最適化された信号伝送量での高忠実度化。
・ステレオ音像のダイナミクスの適切な表現。
・ステレオ信号再生品質の向上。
本発明が提供する他の利点は、以下の本発明の実施形態の詳細な説明を読めば理解されるであろう。
添付の図面及び以下の説明によって、本発明は、その他の目的及び利点とともに、最もよく理解されるであろう。
全図面を通して同じ参照番号は同一又は類似の要素に用いられるものとする。
本発明は、音声アプリケーションのマルチチャネル符号化/復号化技術に関し、特にオーディオ伝送システム及び/又はオーディオストレージ用のステレオ符号化/復号化に関する。音声アプリケーションとしてふさわしい例としては、電話会議システム、モバイル通信システムにおけるステレオ音声伝送、音声サービスを提供する様々なシステム、及びマルチチャネル・ホーム・シネマ・システム等が挙げられる。
本発明の理解を助けるために、既存技術の問題について簡潔な概観と分析から始めるのが役に立つと思われる。前述のように、現在のところ、例えばモバイル通信システムでも経済的負担が少なく使用する気を起こさせるビットレートで高品質のステレオ又はマルチチャネル音声を提供する標準化されたコーデックは入手できない。入手できるコーデックで可能なことは、音声信号のモノラルでの伝送及び/又は保存である。ある程度までは、ステレオ伝送や保存も可能であるが、多くの場合、ビットレートの制約により極めて大きくステレオ表現が制限される。
最先端のマルチチャネル符号化技術の問題は、優れた品質を提供するためには高ビットレートが必要となることである。インテンシティステレオは、例えばたった2、3kbpsほどの低ビットレートで利用される場合には、チャネル間時間情報をほとんど提供できないので上手くいかない。この情報は例えば2kHz未満の低周波数に対して聴感上重要なので、そのような低周波数でステレオ効果を提供することはできない。
他方BCCは、チャネル間時間情報も伝送するので、例えば3kbpsの低ビットレートで、低周波数でもステレオ音像又はマルチチャネル音像を再生することができる。しかし、この技術は、エンコーダとデコーダの両方でチャネルのそれぞれについて、演算量の多い時間/周波数変換を必要とする。さらに、BCCは、元のチャネル信号との知覚差を最小にする意味では、伝送されたモノラル信号からチャネル信号へのマッピングを行おうとはしない。
チャネル間予測(Inter-channel prediction : ICP)とも呼ばれる、マルチチャネル符号化用のLMS技術(文献[4](特許文献3)参照)は、残差信号の伝送を省略することにより低ビットレートを可能にしている。チャネル復元フィルタを得るために、条件なしの誤差最小化手順を用い、その出力信号が対象信号に最も一致するようにフィルタを計算する。フィルタを計算するために、幾つかの誤差測定値を使用できる。平均二乗誤差あるいは加重平均二乗誤差が周知であり、少ない演算量で済む。
一般的に、最先端の方法の大部分がハイファイのオーディオ信号又は単なる音声の符号化のために開発されたと言うことができる。信号エネルギが低周波数領域に集中している音声符号化 (speech coding) では、サブバンド符号化は滅多に使用されない。BCCのような方法は、低ビットレートでステレオ音声の符号化を可能にするけれども、サブバンド変換符号化処理では演算量も遅延も多くなる。
研究の結論によれば、ICP符号化技術は、低い周波数にエネルギが集中しているステレオ信号に対しては、高品質のステレオ信号を得ることはできないが、冗長性の削減は可能である[5](非特許文献2)。ICPフィルタリングの白色化効果により、高周波数領域のエネルギが増加し、知覚変換符号化器にとっては正味の符号化損失になる。これらの結果は、文献[6](非特許文献3)及び[7](非特許文献4)で確認され、品質の向上は音声信号に対してだけ報告された。
ICP復元信号の精度は、存在するチャネル間相関により決定される。Bauer等による文献[8](非特許文献5)は、音声信号の左チャネルと右チャネルとの間に線形関係を見出せなかった。しかし、図4のモノラル信号と副信号とのクロススペクトルから見ることができるように、音声信号の低周波数領域(0〜2000Hz)で強いチャネル間相関が見られる。ステレオ符号化手段としてのICPフィルタでは、チャネル間相関が弱い場合には、対象信号の予測値の精度が劣化する。
図5は、本発明の好適な実施形態におけるマルチチャネルエンコーダを示す概略ブロック図である。マルチチャネルエンコーダは、基本的に、オプションの前処理部110、オプションの(線形)結合部120、複数のエンコーダ130、140、コントローラ150及びオプションのマルチプレクサ(MUX)160を具備する。エンコーダの数Nは2以上であり、第1エンコーダ130及び第2エンコーダ140を含むが、更なるエンコーダを有してもよい。
一般に、本発明は、マルチチャネル又はポリフォニック信号 (polyphonic signal) を取り扱う。最初のマルチチャネル入力信号は、オーディオ信号記憶装置(不図示)から供給されてもよいし、例えばマイクロフォンのセット(不図示)から「生で」提供されてもよい。通常、オーディオ信号は、デジタル形式でない場合、マルチチャネル符号器に入力される前にデジタル化される。マルチチャネル信号は、例えば主信号及び副信号、並びに可能性として更なる信号表現等のN個の信号表現を生成するオプションの信号結合部120及びオプションの前処理部110に供給されうる。
オプションの前処理部110にはマルチチャネル信号又はポリフォニック信号が入力されうる。
(任意で前処理された)信号は、任意の信号結合部120に出力される。信号結合部120は、入力信号の線形結合などの様々な信号結合手順を実行して少なくとも第1の信号と第2の信号を作り出す複数の結合モジュールを有する。例えば、第1の符号化処理を主符号化処理とし、第1の信号を主信号とすることができる。第2の符号化処理は、例えば補助(副 (side) )信号処理とすることができ、その場合、第2の信号は、ステレオ副信号 (stereo side signal) などの補助(副)信号とすることができる。従来のステレオ符号化では、例えば、LチャネルとRチャネルの信号を足しその和信号を2で割って、第1の信号(主信号)として従来のモノラル信号を出力する。LチャネルとRチャネルを引き算しその差信号を2で割って、第2の信号として従来の副信号を出力することもできる。本発明によれば、信号結合部において、異なるチャネルの少なくとも一部からの信号の寄与を重み付けして、さまざまな種類の線形結合や他の種類の信号結合を実行することができる。本発明が使用する信号結合は2つのチャネルに限定されるわけではなく、多数のチャネルを含みうることはいうまでもない。図5に示されるように、2以上の信号を生成することも可能である。入力チャネルの1つを直接第1の信号として、もう1つの入力チャネルを第2の信号として使用することも可能である。ステレオ符号化に関しては、例えば、Lチャネルを主信号として使用し、Rチャネルを副信号として使用してもよいし、あるいはその逆でもよい。この他にも変形例は多数存在する。
第1エンコーダ130に第1の信号が入力されると、エンコーダ130は適切な符号化原理に従って第1の信号を符号化する。第2の信号は、第2エンコーダ140に供給され、そこで第2の信号が符号化される。3つ以上のエンコーダを使用する場合は通常、追加の各信号は各エンコーダにおいて符号化されることになる。
例えば第1エンコーダを主エンコーダとし、第2エンコーダを副エンコーダとしてもよい。その場合、例えば副エンコーダである第2エンコーダ140は、第1の信号及び第2の信号に基づいて信号再生データを生成する適応チャネル間予測(ICP)ステージを含むことができる。第1エンコーダからの破線で示されるように、第1の(主)信号は、第1エンコーダ130により生成される信号符号化パラメータから同等に推定してもよい。
マルチチャネルエンコーダは、コントローラ150を更に具備する。コントローラ150は、符号化性能を最適化するために追加の自由度を提供するように構成される。本発明の好適な実施形態によれば、制御システムは、考慮するエンコーダに対して、符号化フレーム全体のサブフレームのセットへのフレーム分割構成と各サブフレームのフィルタ長との組合せを、所定の条件に従って選択するように構成される。対応する信号は、選択された組合せに従って、選択されたサブフレームのセットの各サブフレームにおいて符号化される。別個のコントローラ150として又は考慮するエンコーダに内蔵されるものとして実現されてもよい制御システムは、適切な制御コマンドをエンコーダに供給する。
フレーム分割構成を選択すると同時に各サブフレームのフィルタ長を調整するという可能性により追加の自由度が得られ、一般に性能は向上する。所定の条件は、符号化フレーム全体にわたる第2の符号化処理の性能を表す尺度の最適化に基づくものであることが好ましい。
各エンコーダの出力信号、並びにコントローラからのフレーム分割及びフィルタ長の情報は、マルチプレクサ160の単一の送信(又は格納)信号に多重化されるのが好ましい。もっとも、出力信号は別個に送信(又は格納)されてもよい。
可変サイズのサブフレームを使用するいわゆる信号適応最適化フレーム処理 (signal-adaptive optimized frame processing) により、性能尺度を最適化するためにより高い自由度が得られる。シミュレーションによれば、いくつかのオーディオフレームでは、より長いフィルタの使用によって良い性能が得られたが、他のフレームに対しては、使用するフィルタ係数の数に比例して性能が向上するわけではないことがわかった。
可変フレーム長に対して、符号化フレームは、一般に種々のフレーム分割構成に従って複数のサブフレームに分割される。サブフレームは異なるサイズを有してもよいが、任意の所定のフレーム分割構成のサブフレームの長さの合計は、通常、符号化フレーム全体の長さに等しい。
例として引用することで本明細書に組み込まれる同時係属の米国特許出願第11/011765号及び対応国際出願PCT/SE2004/001867に記載されるように、複数の符号化スキームが提供されている。ここで、各符号化スキームは、それぞれのサブフレームを全部合わせると全体の符号化フレーム(マスタフレームとも呼ばれる)を構成するサブフレームセットを特徴とするか、又はそれに関連する。好ましくは、符号化される信号の信号コンテンツに少なくとも一部依存して、特定の符号化スキームが選択され、次いで信号は、選択されたサブフレームセットの各サブフレームでそれぞれ符号化される。
一般に符号化は、通常1度に1フレーム実施され、各フレームは通常所定の時間枠内の音声サンプルを備える。サンプルをフレームに分割すると、フレームの境界に切れ目が生じることが避けられない。音の変化に応じて符号化パラメータが変化するのだが、符号化パラメータは基本的に各フレーム境界で変化することになる。これが、知覚されてしまうような誤差となりうる。これを少しでも補償する一方法は、符号化されるサンプルだけでなく、フレームの絶対的に近いサンプルも基にして符号化することである。その方法で、異なるフレーム間の遷移が滑らかになるだろう。その代わりにあるいは追加的に、フレーム境界で生じる知覚歪みを減少させるために補間法も使用される。しかし、そのような手順はいずれも、大量の追加的な演算リソースが必要となり、そのような符号化技術に対してリソースを配分することは困難となる可能性もある。
この観点から考えると、フレームの境界数が少なくなるように、なるべく長いフレームを使用するほうが都合がよい。また、符号化効率も高くなり、必要な伝送ビットレートも低くできる。しかし、フレームが長いと、プリエコーやゴーストのような音の問題を引き起こす。
逆に短いフレームを利用すると、符号化効率は減少して伝送ビットレートは高くなり、フレーム境界の歪みの問題が増加しうることは、当業者なら誰でも理解するであろう。しかし、フレームが短くなると、例えばゴーストのような音やプリエコーなどの知覚歪みの影響であまり困ることはなくなる。符号化誤差をなるべく少なくするためには、できるだけ短いフレーム長を使用すべきである。
したがって、フレーム長については相反する要件が有るように見える。それ故、音声知覚のためには、符号化する信号に存在する信号特性に基づいたフレーム長を使用するのが好ましい。音声知覚に関するフレーム長の影響は符号化する音の性質に依存して異なるだろうから、信号自体の性質を使用するフレーム長に関係させることで改善が見込める。特に、この手順は、副信号符号化に好都合であるとわかっている。
小さな一時的変動のために、例えば場合によっては、比較的長いフレームを使用して副信号を符号化するほうがよいこともある。これに相当するのは、コンサートの録音などの拡散音場が大きい録音のこともある。ステレオ音声会話などのそれ以外の場合には、短いフレームが好ましい。
例えば、使用されるサブフレーム長は、次式により選ぶことができる。
Figure 0005171269
ここで、lsfはサブフレーム長であり、lfは全体の符号化フレーム長であり、nは整数である。しかし、これが単なる例にすぎないことは理解されるべきである。サブフレームセットの合計長が一定に維持される限り、どのフレーム長も使用可能である。
どのフレーム長を使用するかの決定方法としては一般に、閉ループ決定又は開ループ決定の2つの基本的方法がある。
閉ループ決定を使用する場合、入力信号は通常すべての利用可能符号化スキームで符号化される。好ましくは、フレーム長のすべての可能な組み合わせがテストされ、目的の品質、例えば信号対雑音比や重み付き信号対雑音比について、最良の結果となる関連サブフレームセットを有する符号化スキームが選択される。
もう一方の手法は、信号の統計に基づく開ループ決定によるフレーム長の決定である。すなわち、この手法では、(副)信号のスペクトル特性が、どの符号化スキームを使用しようとしているかを決定する基礎として使用される。前述のように、様々なサブフレームセットを特徴とする様々な符号化スキームが利用可能である。しかし、この実施形態では、入力(副)信号がまず分析され、次に適切な符号化スキームが選択され利用される。
開ループ決定の利点は、実際にはただ1つの符号化しか実行しなくてもよいことである。反対に不利な点は、信号特性の分析が極めて複雑になることがあり、前もって起こりうる行動を予測することが難しいことである。
閉ループ選択を使用すると、符号化スキームは実装に何らの変更を起こすことなく、交換することが可能である。他方、多くの符号化スキームが調査される場合、計算上の要件が厳しくなる。
入力(副)信号に対するそのような可変フレーム長符号化の利点は、一方で精細な時間解像度と粗い周波数解像度との間で選択してもよく、他方で粗い時間解像度と精細な周波数解像度との間で選択してもよいことである。上記の実施形態は、マルチチャネル音像又はステレオ音像を可能な最善の方法で維持するであろう。
異なる符号化スキームで利用される実際の符号化については、幾つかの要件もある。特に、閉ループ選択を使用する場合、相当数のほぼ同時の符号化を実施するために、演算リソースが多くなくてはならない。符号化処理が複雑になればなるほど演算能力が必要となる。さらに、伝送の点で低ビットレートであることも望まれる。
本発明の例示の実施形態による可変長最適化フレーム処理 (Variable Length Optimized Frame Processing) は、入力として大きな「マスタフレーム」を必要とし、ある数のフレーム分割構成を与えられ、MSEや重み付きMSEなどの歪み測定値に基づいて最適なフレーム分割構成を選択する。
フレーム分割は様々なサイズでもよいが、分割されたフレームの全部の合計はマスタフレームの全長となる。長さLmsのマスタフレームについて可能なフレーム分割の一例を図6に示し、可能なフレーム構成の一例を図7に示す。
上述のように、概念としては、符号化フレーム(マスタフレーム)全体にわたる考慮する符号化処理又は符号化方式の性能を表す忠実度尺度を最適化するように、関連するフレーム分割構成及び各サブフレームのフィルタ長/次元数による符号化方式の組合せを選択することである。
全ての可能な組合せがテストされ、最適な信号対雑音比又は重み付き信号対雑音比等の品質評価値が最良となるサブフレームのセット及びフィルタ長による符号化方式を選択するとよい。
各サブフレームのフィルタ長を調整することができることで追加の自由度が提供され、一般に性能は向上する。この方式を使用する利点は、ステレオ又はマルチチャネル音像のダイナミクスが適切に表されることである。
自由度が高ければ最適な選択を見つけられる。しかし、復号化側に転送される制御情報量は増加してしまう。符号化側から復号化側への送信に必要とされる信号伝送量を低減するという特定の課題に対しては、ある特定の長さの各サブフレームが事前定義済みのフィルタ長と関連付けられるのが好ましい。通常、長いフィルタは長いフレームに割り当てられ、短いフィルタは短いフレームに割り当てられる。いずれにしても、所定の条件は、符号化フレームのサブフレームのセットへのフレーム分割構成を示すと共に各サブフレームに対して選択されるフィルタ次元数を示すように、各サブフレームのフィルタ長がサブフレームの長さに依存して選択されるという必要条件を含む。これにより、必要とされる復号化側への信号伝送量が低減される。
本発明の好適な実施形態においては、所定の条件は、各サブフレームのフィルタ長がサブフレームの長さに応じて制御されるという条件に従う、符号化フレーム全体にわたる第2の符号化処理の性能を表す尺度の最適化に基づく。
第1の符号化処理がサブフレームのセットへの符号化フレーム全体のフレーム分割構成によるいわゆる可変フレーム長処理を使用する場合、第2の符号化処理に対しても同一のフレーム分割構成を使用するのが有用である。このように、1つの符号化処理のみに対するフレーム分割構成を表す情報を信号で伝送することで十分である。
図6及び図7の特定の例を参照して、可能なフレーム構成を以下に示す。
Figure 0005171269
(m1,m2,m3,m4)の形をしており、ここでmkは、マスタフレーム内のL/4ミリ秒の長さのk番目の(サブ)フレームに対して選択されるフレームタイプを表す。例えば次の如くである。
k=0は、フィルタ長をPとしてL/4ミリ秒のフレーム。
k=1は、フィルタ長を2×PとしてL/2ミリ秒のフレーム。
k=2は、フィルタ長を4×PとしてLミリ秒の最大フレーム。
例えば、構成(0,0,1,1)は、Lミリ秒のマスタフレームが、フィルタ長をPとするL/4ミリ秒の2つの(サブ)フレームと、これに続く、フィルタ長を2×PとするL/2ミリ秒の1つの(サブ)フレームとに分割されることを示す。また、構成(2,2,2,2)は、フィルタ長を4×PとするLミリ秒のフレームが使用されることを示す。このように、(m1,m2,m3,m4)の情報は、フレーム分割の構成のみならずフィルタ長の情報も同時に示すことがわかる。
最適構成は、例えばMSE又は同等に最大SNRに基づき選択される。例えば、構成(0,0,1,1)が使用される場合、長さPのフィルタ2つと長さ2×Pのフィルタ1つで、フィルタの合計数は3である。
その対応するフィルタとそれぞれの長さで、(SNR又はMSEで測定して)最良の性能となるフレーム構成が選択される。
フレーム選択前のフィルタの計算は、フィルタの量子化ステージを含むことで、開ループか又は閉ループのどちらでもよい。
この手法を使用する利点は、この手順ではステレオ音像又はマルチチャネル音像の躍動感がよく表現されることである。
可変フレーム長処理に伴って、エンコーダの分析窓同士のオーバーラップ長を異ならせるようにしてもよい。それ故デコーダでは、それに対応してチャネル信号の窓への合成や異なる信号長のオーバーラップ加算が不可欠である。
定常信号に関してはステレオ音像が非常に安定していて、推定チャネル・フィルタがまったく変動がないことはよくある。
図8は、本発明の好適な実施形態における基本的なマルチチャネル符号化手順を示す概略的なフローチャートである。ステップS1において、1つ以上のオーディオチャネルの第1の信号が、第1の符号化処理において符号化される。ステップS2において、フレーム分割構成と各サブフレームに対するフィルタ長との組合せが、フィルタに基づく第2の符号化処理に対して選択される。この選択手順は、性能尺度の最適化に基づいてもよい所定の条件に従って実行される。ステップS3において、第2の信号が、選択された組合せに従って符号化フレーム全体の各サブフレームにおいて符号化される。
復号化処理は周知のものであり、基本的には、着信データストリームの読み取り、データの変換、逆量子化、マルチチャネル音声信号の復元を含む。詳細には、第1の信号の復元データに応答して、前記複数チャネルのうち少なくとも1つの符号化された第1の信号が、第1の復号化処理において復号化される。また、第2の信号の復元データに応答して、前記複数チャネルのうち少なくとも1つの符号化された第2の信号が、第2の復号化処理において復号化される。少なくとも後者の場合、対応する第2の符号化処理において使用された、符号化フレーム全体のサブフレームのセットへのフレーム分割構成及び各サブフレームに対するフィルタ長を表す情報が、復号化側において受信される。この制御情報に基づいて、第2の復号化処理において第2の信号復元データを解釈する方法が判定される。
特に好適な実施形態において、制御情報は、符号化フレームのサブフレームのセットへのフレーム分割構成を示すと共に各サブフレームに対して選択されたフィルタ次元数を示すデータを含む。
より詳細な理解のために、主にステレオ(2チャネル)符号化及び復号化の例示的な実施形態を参照して本発明を説明する。なお、本発明は、一般に複数チャネルに適用可能である。例としては、5.1(左前方、中央前方、右前方、左後方、右後方、サブウーファー)又は2.1(左、右、及び中央のサブウーファー)マルチチャネルサウンドの符号化/復号化を含むが、それらに限定されない。
本発明は、副エンコーダ、主エンコーダ、あるいは副エンコーダ及び主エンコーダの双方に適用可能である。実際には、マルチチャネルエンコーダ全体においてN個のエンコーダの任意のサブセットに本発明を適用できる。
図9は、本発明の好適な実施形態におけるエンコーダの関連する部分を示す概略ブロック図である。エンコーダは、典型的なモノラル信号等の第1の(主)信号を符号化する第1(主)エンコーダ130、(補助/副)信号符号化に対する第2(補助/副)エンコーダ140、コントローラ150及びオプションのマルチプレクサ160を基本的に具備する。コントローラ150は、主信号及び副信号を受信でき、符号化フレーム全体のフレーム分割構成と各サブフレームのフィルタ長との組合せを最適に又は少なくとも次善に(所定の制約の下で)選択するために必要な計算を実行するように構成される。コントローラ150は、「別個の」コントローラであってもよく、あるいは副エンコーダ140に内蔵されてもよい。フレーム分割及びフィルタ長を表す符号化パラメータ及び情報は、マルチプレクサ160において単一の送信又は格納信号に多重化されるのが好ましい。
図10は、本発明の別の例示的な実施形態によるエンコーダの関連する部分を示す概略ブロック図である。この特定の実現例において、ステレオ又はマルチチャネル符号器全体の各副エンコーダは、それぞれ内蔵されたコントローラを有する。副エンコーダ内のコントローラは、副符号化処理に対してフレーム分割構成及びフィルタ長を選択するように構成されることが好ましい。この選択は、エンコーダ性能の最適化及び/又は各サブフレームのフィルタ長がサブフレームの長さに依存して選択されるという条件に基づくとよい。
例えば、主エンコーダが符号化フレーム全体のサブフレームのセットへのフレーム分割構成によるいわゆる可変フレーム長処理を使用する場合、副エンコーダに対しても同一のフレーム分割構成を使用するのが有用である。これにより、1つのエンコーダのみに対するフレーム分割構成を表す情報を復号化側に送信することで十分である。通常、主エンコーダのコントローラは、符号化フレーム全体に対して使用するフレーム分割構成を副エンコーダのコントローラに信号で伝送し、副エンコーダのコントローラは、同一のフレーム分割を使用する。副符号化処理に対して2つの別の方法が存在する。すなわち、1)判定したフレーム分割がフィルタ長を直接制御するようにすること、あるいは、2)判定したフレーム分割に対してフィルタ長を自由に選択することである。当然、後者の方法の方が高い自由度を与えるが、多くの信号伝送量が必要になる可能性がある。前者の方法は、追加的な信号伝送量を必要としない。主エンコーダのコントローラが選択されたフレーム分割構成に関する情報を復号化側に送信し、復号化側がその情報を使用して送信された信号復元データを解釈し、符号化されたマルチチャネルオーディオ情報を正確に復号化することで十分である。しかし、フィルタ長の選択がある程度制限されるため、前者の方法は次善となる可能性はある。
図11は、本発明の好適な実施形態におけるデコーダの関連する部分を示す概略ブロック図である。デコーダは、オプションのデマルチプレクサ210、第1(主)デコーダ230、第2(補助/副)デコーダ240、コントローラ250、オプションの信号結合部260及びオプションの後処理部270を基本的に具備する。デマルチプレクサ210は、第1の(主)信号の復元データ、第2の(補助/副)信号の復元データ、並びにフレーム分割構成及びフィルタ長に関する情報等の制御情報等の入力された復元情報を分離する。第1(主)デコーダ230は、符号化パラメータを表す第1の(主)信号の形式で通常提供される第1の(主)信号復元データに応答して、第1の(主)信号を復元する。第2(補助/副)デコーダ240は、量子化フィルタ係数及び復元された第1の信号に応答して、第2の(副)信号を復元する。第2(副)デコーダ240はコントローラ250により制御され、コントローラ250は副デコーダに内蔵されてもされなくてもよい。コントローラは、フレーム分割構成及びフィルタ長に関する情報を符号化側から受信し、それに従って副デコーダ240を制御する。
主エンコーダがフレーム分割構成によるいわゆる可変フレーム長処理を使用し、かつ、主エンコーダのコントローラが選択されたフレーム分割構成に関する情報を復号化側に送信する場合、副デコーダ240を制御する際に使用するために、主デコーダ230はオプションとしてコントローラ250にその情報を信号で伝送することが可能である(破線で示す)。
以下では、本発明の十分な理解に資するために、チャネル間予測などのパラメトリック符号化原理に基づく様々な例示の実施形態を参照して、本発明を詳細に説明する。
(チャネル間予測を使用するパラメトリック符号化)
一般に、チャネル間予測(ICP)技術は、チャネル間に内在するチャネル間相関を利用する。ステレオ符号化では、チャネルは普通、左信号l(n)と右信号r(n)により表される。それと等価の表現は、モノラル信号m(n)(主信号の特殊な場合)及び副信号s(n)である。両方の表現は同等であり、通常は従来の行列演算で関連付けられる。
Figure 0005171269
ICP技術では予測値^S(n)で副信号s(n)を表すことを狙いとしている。予測値^S(n)は、モノラル信号m(n)を次式で表されるN個のフィルタ係数ht(i)を有する時変FIRフィルタH(z)でフィルタリングすることで取得される。
Figure 0005171269
同じ方法が、左チャネルと右チャネルにも直接適用できることに注意すべきである。
エンコーダで推定されるICPフィルタは、副信号予測誤差e(n)の例えば平均二乗誤差(MSE)又は関連する性能測定値、例えば心理音響的に重み付けした平均二乗誤差を最小化することで推定されうる。MSEは、通常次式で求められる。
Figure 0005171269
上式で、Lはフレームサイズ、NはICPフィルタの長さ(length)/次数(order)/次元(dimension)である。簡単に言うと、ICPフィルタの性能ひいてはMSEの大きさは、最終的にステレオ分離を決定する主要因である。副信号は左チャネルと右チャネルとの間の差を表現するので、正確な副信号の再現は十分な広がりのあるステレオ音像を確実にするのに必要不可欠である。
最適なフィルタ係数は、全サンプルにわたる予測誤差のMSEを最小化することで見つけられ、次式で求められる。
Figure 0005171269
式(4)の相関ベクトルr及び共分散行列Rは、以下により定義される。
Figure 0005171269
ただし、
Figure 0005171269
式(5)を式(3)に代入することにより、(量子化されていない)ICPフィルタの最小MSE(MMSE)に関する単純化した代数式が得られる。
Figure 0005171269
ただし、Pssは副信号の電力であり、sTsとも表される。
r=Rhoptを式(7)に代入すると、次式が得られる。
Figure 0005171269
RをLDLT因数分解(文献[9](非特許文献6)参照)すると、次の等式が得られる。
Figure 0005171269
ここでまず、反復的な方法でzを解く。
Figure 0005171269
これから新しいベクトルq=LThを導入する。行列Dは対角成分だけ0でない値をとるので、qを見つけるのは容易である。
Figure 0005171269
求めるフィルタ・ベクトルhは、式(10)と同じ方法で反復的に計算できる。
Figure 0005171269
正則行列反転に比べて計算量が節約できることのほかに、この解決策は異なる次元数n(フィルタ長)に相当するフィルタ係数を効率的に計算する可能性を提供する。
Figure 0005171269
最適ICP(FIR)フィルタ係数hoptが推定され、量子化され、フレームごとにデコーダに送信されうる。
一般に、フィルタ係数はベクトルとして取り扱われ、そのベクトルはベクトル量子化(VQ)を使用して効率的に量子化される。フィルタ係数の量子化は、ICP符号化手順の最も重要な面の1つである。当然のことながら、フィルタ係数に関して持ち込まれる量子化雑音は、MSEの減少に直接関連することがある。
MMSEは、前記したとおり、以下のように定義されている。
Figure 0005171269
optの量子化は、次式で表される量子化誤差eを生じる。
Figure 0005171269
新しいMSEは、次式のように表される。
Figure 0005171269
Rhopt=rなので、式(15)の最後の2項は打ち消され、量子化フィルタのMSEは次式のようになる。
Figure 0005171269
この意味することは、少しでも予測利得を得るためには、量子化誤差項の値は予測項の値未満、すなわち、
Figure 0005171269
である必要があるということである。
一般に、長いベクトルの量子化は、大きな量子化誤差を生じる。なお、量子化ICPフィルタのMSEは以下のように定義される。
Figure 0005171269
取得されるMSEは、選択したフィルタ次元数nと生じる量子化誤差とのトレードオフである。固定のビット数を仮定して、式(17)が常に最小となるように、各フレームに対するフィルタ次元数を選択する方式を考える。
Figure 0005171269
本発明の例示的な実施形態によれば、次式に従ってフレーム分割構成及びそのフィルタ長を選択するのが望ましい。
Figure 0005171269
ただし、
Figure 0005171269
上式において、Nは可能なフィルタ次元数ベクトルの集合、Mは可能なフレーム長構成の集合である。式(20)は単なる例にすぎず、さまざまな変形例が存在することは理解すべきである。
上述した実施形態は単なる例示にすぎず、本発明が実施形態に限定されるものではない。本明細書の開示と特許請求の範囲に記載される基礎をなす原理を維持しつつ更に行う修正、変更、改善は、本発明の範疇に含まれる。
マルチチャネル符号化/復号化を使用する音声伝送システムの一般的な例を示すブロック図である。 異なるチャネルの信号が個別で無関係な信号として、それぞれどのように符号化されるかを説明する図である。 パラメトリック・ステレオ符号化の基本原理を示すブロック図である。 モノラル信号と副信号とのクロススペクトルを示す図である。 本発明の好適な実施形態におけるマルチチャネルエンコーダを示す概略ブロック図である。 マスタフレームの異なるフレーム分割を示す概略的なタイミングチャートである。 本発明の実施形態における異なるフレーム構成を示す図である。 本発明の好適な実施形態におけ基本的なマルチチャネル符号化手順を示す概略的なフローチャートである。 本発明の好適な実施形態におけるエンコーダの関連する部分を示す概略ブロック図である。 本発明の別の実施形態におけるエンコーダの関連する部分を示す概略ブロック図である。 本発明の好適な実施形態におけるデコーダを示す図である。

Claims (21)

  1. 主符号化処理において、マルチチャネルのうち少なくとも1つのチャネルの主信号を符号化するステップと、
    前記主信号に基づいて副信号を予測するための、調整可能なフィルタ長を有するチャネル間予測フィルタを用いた適応チャネル間予測を含む副符号化処理において、前記マルチチャネルのうち少なくとも1つのチャネルの副信号を符号化するステップと、
    を有する、マルチチャネルのオーディオ信号を符号化する符号化方法であって、
    符号化フレーム全体にわたる前記副符号化処理の性能を表す忠実度尺度を最適化するように規定された所定の条件に従って、前記副符号化処理のために、i)符号化フレーム全体の可変長サブフレームのセットへのフレーム分割構成と、ii)各サブフレームにおける前記チャネル間予測フィルタのフィルタ長との組合せを選択する選択ステップを有し、
    前記可変長サブフレームのセットには、サイズの相異なる複数のサブフレームが含まれ、各サブフレームの長さは、当該長さに対応付けられている所定のフィルタ長と関連付けられ、
    前記副信号を符号化するステップは、フレーム全体に対して、選択された前記組合せに従って、選択された前記サブフレームのセットの各サブフレームにおいて、前記チャネル間予測フィルタのフィルタ長を、選択された対応するフィルタ長に設定して、前記副信号を符号化する、
    ことを特徴とする符号化方法。
  2. 各サブフレームのフィルタ長は、サブフレームの長さが長いほど長い値が選択されるように、サブフレームの長さに依存して選択されることを特徴とする請求項1記載の符号化方法。
  3. 各サブフレームの長さ前記所定のフィルタ長と関連付けられていることにより、前記所定の条件は、サブフレームの長さが長いほど長いフィルタ長が選択されるよう、符号化フレームのサブフレームのセットへのフレーム分割構成の指示が各サブフレームに対して選択されるフィルタ長を同時に示すように、各サブフレームのフィルタ長がサブフレームの長さに依存して選択されるという必要条件を含むことを特徴とする請求項2記載の符号化方法。
  4. 前記所定の条件は、各サブフレームのフィルタ長がサブフレームの長さにより制御される符号化フレーム全体にわたる前記副符号化処理の性能を表す尺度の最適化に基づいたものであることを特徴とする請求項3記載の符号化方法。
  5. 前記主符号化処理も、符号化フレーム全体のサブフレームのセットへのフレーム分割構成に基づき行われ、
    前記所定の条件は、前記副符号化処理のための符号化フレーム全体のサブフレームのセットへの前記フレーム分割構成が前記主符号化処理の前記フレーム分割構成と同一となるように選択されるという必要条件を含む
    ことを特徴とする請求項1記載の符号化方法。
  6. 選択された前記フレーム分割構成及び選択された前記フレーム分割構成の各サブフレームのフィルタ長を表す出力データを生成するステップを有することを特徴とする請求項1記載の符号化方法。
  7. 前記選択ステップと前記主信号を符号化するステップと前記副信号を符号化するステップは、フレーム毎に実行されることを特徴とする請求項1記載の符号化方法。
  8. 前記選択ステップは前記チャネル間予測フィルタの推定性能に基づいて実行されることを特徴とする請求項1記載の符号化方法。
  9. マルチチャネルのうち少なくとも1つのチャネルの主信号を符号化する主エンコーダと、
    前記主信号に基づいて副信号を予測するための、調整可能なフィルタ長を有するチャネル間予測フィルタを用いた適応チャネル間予測を含む副符号化処理において、前記マルチチャネルのうち少なくとも1つのチャネルの副信号を符号化する副エンコーダと、
    を備える、マルチチャネルのオーディオ信号を符号化する符号化装置であって、
    符号化フレーム全体にわたる前記副符号化処理の性能を表す忠実度尺度を最適化するように規定された所定の条件に従って、前記副エンコーダのために、i)符号化フレーム全体の可変長サブフレームのセットへのフレーム分割構成と、ii)各サブフレームにおける前記チャネル間予測フィルタのフィルタ長との組合せを選択する選択手段を有し、
    前記選択手段は、サイズの相異なる複数のサブフレームが含まれるように前記可変長サブフレームのセットを選択し、かつ、各サブフレームの長さを、当該長さに対応付けられている所定のフィルタ長と関連付けるように構成され、
    前記副エンコーダは、フレーム全体に対して、選択された前記組合せに従って、選択された前記サブフレームのセットの各サブフレームにおいて、前記チャネル間予測フィルタのフィルタ長を、選択された対応するフィルタ長に設定して、前記副信号を符号化する、
    ことを特徴とする符号化装置。
  10. 前記選択手段は、サブフレームの長さが長いほど長い値が選択されるように、サブフレームの長さに依存して各サブフレームのフィルタ長を選択することを特徴とする請求項9記載の符号化装置。
  11. 前記選択手段は、
    各サブフレームの長さ前記所定のフィルタ長と関連付けられていることにより、サブフレームの長さが長いほど長いフィルタ長が選択されるよう、符号化フレームのサブフレームのセットへのフレーム分割構成の指示が各サブフレームに対して選択されるフィルタ長を同時に示すように、各サブフレームのフィルタ長がサブフレームの長さに依存して選択されるという必要条件に基づいて動作することを特徴とする請求項9記載の符号化装置。
  12. 前記選択手段は、各サブフレームのフィルタ長がサブフレームの長さにより制御される符号化フレーム全体にわたる前記副符号化処理の性能を表す尺度の最適化に基づいて動作することを特徴とする請求項11記載の符号化装置。
  13. 前記主エンコーダも、符号化フレーム全体のサブフレームのセットへのフレーム分割構成に基づいて動作し、
    前記選択手段は、前記副符号化処理のための符号化フレーム全体のサブフレームのセットへの前記フレーム分割構成が前記主エンコーダの前記フレーム分割構成と同一となるように選択されるという必要条件の下で動作することを特徴とする請求項9記載の符号化装置。
  14. 選択された前記フレーム分割構成及び選択された前記フレーム分割構成の各サブフレームのフィルタ長を表す出力データを生成する生成手段を備えることを特徴とする請求項9記載の符号化装置。
  15. 前記選択手段と、前記主エンコーダと、前記副エンコーダは、フレーム毎に動作可能であることを特徴とする請求項9記載の符号化装置。
  16. 前記選択手段は前記チャネル間予測フィルタの推定性能に応じて動作することを特徴とする請求項9記載の符号化装置。
  17. 主信号復元データに応答して、主復号化処理において、マルチチャネルのうち少なくとも1つのチャネルの符号化された主信号を復号化するステップと、
    副信号復元データに応答して、副復号化処理において、前記マルチチャネルのうち少なくとも1つのチャネルの符号化された副信号を復号化するステップと、
    を有する、符号化されたマルチチャネルのオーディオ信号を復号化する復号化方法であって、
    対応する副符号化処理において使用された符号化フレーム全体の可変長サブフレームのセットであって、サイズの相異なる複数のサブフレームを含み、各サブフレームの長さが、当該長さに対応付けられている所定のフィルタ長と関連付けられている可変長サブフレームのセットへのフレーム分割構成と各サブフレームのフィルタ長とを表す情報を受信する受信ステップと、
    前記副復号化処理において前記副信号復元データを解釈する方法を前記情報に基づいて決定する決定ステップと、
    を有することを特徴とする復号化方法。
  18. 各サブフレームの長さ前記所定のフィルタ長と関連付けられていることにより、サブフレームの長さが長いほど長いフィルタ長が選択されるよう、各サブフレームのフィルタ長はサブフレームの長さに依存して選択され、前記情報は、符号化フレームのサブフレームのセットへのフレーム分割構成を示すと共に各サブフレームに対して選択されたフィルタ長を示すデータを含むことを特徴とする請求項17記載の復号化方法。
  19. 主信号復元データに応答して、主復号化処理において、マルチチャネルのうち少なくとも1つのチャネルの符号化された主信号を復号化する手段と、
    副信号復元データに応答して、副復号化処理において、前記マルチチャネルのうち少なくとも1つのチャネルの符号化された副信号を復号化する手段と、
    を有する、符号化されたマルチチャネルのオーディオ信号を復号化する復号化装置であって、
    対応する副符号化処理において使用された符号化フレーム全体の可変長サブフレームのセットであって、サイズの相異なる複数のサブフレームを含み、各サブフレームの長さが、当該長さに対応付けられている所定のフィルタ長と関連付けられている可変長サブフレームのセットへのフレーム分割構成と各サブフレームのフィルタ長とを表す情報を受信する受信手段と、
    前記副復号化処理において前記副信号復元データを解釈する方法を前記情報に基づいて決定する決定手段と、
    を有することを特徴とする復号化装置。
  20. 各サブフレームの長さ前記所定のフィルタ長と関連付けられていることにより、サブフレームの長さが長いほど長いフィルタ長が選択されるよう、各サブフレームのフィルタ長はサブフレームの長さに依存して選択され、前記情報は、符号化フレームのサブフレームのセットへのフレーム分割構成を示すと共に各サブフレームに対して選択されたフィルタ長を示すデータを含むことを特徴とする請求項19記載の復号化装置。
  21. 請求項9記載の符号化装置と、請求項19記載の復号化装置とを備えることを特徴とするオーディオ送信システム。
JP2007556114A 2005-02-23 2006-02-22 マルチチャネルオーディオ符号化における忠実度の最適化及び信号伝送量の低減 Expired - Fee Related JP5171269B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US65495605P 2005-02-23 2005-02-23
US60/654956 2005-02-23
SEPCT/SE2005/002033 2005-12-22
PCT/SE2005/002033 WO2006091139A1 (en) 2005-02-23 2005-12-22 Adaptive bit allocation for multi-channel audio encoding
PCT/SE2006/000235 WO2006091151A1 (en) 2005-02-23 2006-02-22 Optimized fidelity and reduced signaling in multi-channel audio encoding

Publications (2)

Publication Number Publication Date
JP2008532064A JP2008532064A (ja) 2008-08-14
JP5171269B2 true JP5171269B2 (ja) 2013-03-27

Family

ID=36927684

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007552087A Expired - Fee Related JP4809370B2 (ja) 2005-02-23 2005-12-22 マルチチャネル音声符号化における適応ビット割り当て
JP2007556114A Expired - Fee Related JP5171269B2 (ja) 2005-02-23 2006-02-22 マルチチャネルオーディオ符号化における忠実度の最適化及び信号伝送量の低減

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2007552087A Expired - Fee Related JP4809370B2 (ja) 2005-02-23 2005-12-22 マルチチャネル音声符号化における適応ビット割り当て

Country Status (7)

Country Link
US (2) US7945055B2 (ja)
EP (1) EP1851866B1 (ja)
JP (2) JP4809370B2 (ja)
CN (3) CN101124740B (ja)
AT (2) ATE521143T1 (ja)
ES (1) ES2389499T3 (ja)
WO (1) WO2006091139A1 (ja)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6904404B1 (en) * 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
RU2363116C2 (ru) * 2002-07-12 2009-07-27 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US8121836B2 (en) 2005-07-11 2012-02-21 Lg Electronics Inc. Apparatus and method of processing an audio signal
US20070133819A1 (en) * 2005-12-12 2007-06-14 Laurent Benaroya Method for establishing the separation signals relating to sources based on a signal from the mix of those signals
RU2466469C2 (ru) * 2007-01-10 2012-11-10 Конинклейке Филипс Электроникс Н.В. Аудиодекодер
US8983830B2 (en) * 2007-03-30 2015-03-17 Panasonic Intellectual Property Corporation Of America Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies
EP2201566B1 (en) 2007-09-19 2015-11-11 Telefonaktiebolaget LM Ericsson (publ) Joint multi-channel audio encoding/decoding
CN101842832B (zh) 2007-10-31 2012-11-07 松下电器产业株式会社 编码装置和解码装置
JP5404412B2 (ja) * 2007-11-01 2014-01-29 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
KR101452722B1 (ko) 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
WO2009144953A1 (ja) * 2008-05-30 2009-12-03 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
JP5608660B2 (ja) * 2008-10-10 2014-10-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) エネルギ保存型マルチチャネルオーディオ符号化
KR101315617B1 (ko) * 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
US9384748B2 (en) 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
US8504184B2 (en) 2009-02-04 2013-08-06 Panasonic Corporation Combination device, telecommunication system, and combining method
CN105225667B (zh) 2009-03-17 2019-04-05 杜比国际公司 编码器系统、解码器系统、编码方法和解码方法
GB2470059A (en) 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
CN102422347B (zh) * 2009-05-20 2013-07-03 松下电器产业株式会社 编码装置、解码装置及编码和解码方法
JP2011002574A (ja) * 2009-06-17 2011-01-06 Nippon Hoso Kyokai <Nhk> 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
WO2011013980A2 (en) 2009-07-27 2011-02-03 Lg Electronics Inc. A method and an apparatus for processing an audio signal
JP5793675B2 (ja) * 2009-07-31 2015-10-14 パナソニックIpマネジメント株式会社 符号化装置および復号装置
JP5345024B2 (ja) * 2009-08-28 2013-11-20 日本放送協会 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
JP5547813B2 (ja) * 2009-09-17 2014-07-16 インダストリー−アカデミック コーペレイション ファウンデイション, ヨンセイ ユニバーシティ オーディオ信号を処理する方法及び装置
RU2586851C2 (ru) 2010-02-24 2016-06-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство для формирования улучшенного сигнала микширования с понижением, способ формирования улучшенного сигнала микширования с понижением и компьютерная программа
ES2810824T3 (es) 2010-04-09 2021-03-09 Dolby Int Ab Sistema decodificador, método de decodificación y programa informático respectivo
BR122020024855B1 (pt) * 2010-04-13 2021-03-30 Fraunhofer - Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Codificador de áudio ou vídeo, decodificador de áudio ou vídeo e métodos relacionados para o processamento do sinal de áudio ou vídeo de múltiplos canais usando uma direção de previsão variável
ES2902392T3 (es) 2010-07-02 2022-03-28 Dolby Int Ab Descodificación de audio con pos-filtración selectiva
ES2526320T3 (es) * 2010-08-24 2015-01-09 Dolby International Ab Ocultamiento de la recepción mono intermitente de receptores de radio estéreo de FM
TWI516138B (zh) 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
SG189277A1 (en) * 2010-10-06 2013-05-31 Fraunhofer Ges Forschung Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac)
TWI716169B (zh) 2010-12-03 2021-01-11 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
JP5680391B2 (ja) * 2010-12-07 2015-03-04 日本放送協会 音響符号化装置及びプログラム
JP5582027B2 (ja) * 2010-12-28 2014-09-03 富士通株式会社 符号器、符号化方法および符号化プログラム
US9424852B2 (en) * 2011-02-02 2016-08-23 Telefonaktiebolaget Lm Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
CN103460287B (zh) * 2011-04-05 2016-03-23 日本电信电话株式会社 音响信号的编码方法、解码方法、编码装置、解码装置
JP5825353B2 (ja) * 2011-09-28 2015-12-02 富士通株式会社 無線信号送信方法、無線信号送信装置及び無線信号受信装置
CN103220058A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据与视觉数据同步装置及其方法
US10100501B2 (en) 2012-08-24 2018-10-16 Bradley Fixtures Corporation Multi-purpose hand washing station
PT2959482T (pt) * 2013-02-20 2019-08-02 Fraunhofer Ges Forschung Aparelho e método para codificar ou descodificar um sinal de áudio usando uma sobreposição dependente da localização de transiente
KR101751228B1 (ko) * 2013-05-24 2017-06-27 돌비 인터네셔널 에이비 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩
CN110875048B (zh) * 2014-05-01 2023-06-09 日本电信电话株式会社 编码装置、及其方法、记录介质
EP2960903A1 (en) 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
EP3860154B1 (en) * 2014-06-27 2024-02-21 Dolby International AB Method for decoding a compressed hoa dataframe representation of a sound field.
CN104157293B (zh) * 2014-08-28 2017-04-05 福建师范大学福清分校 一种增强声环境中目标语音信号拾取的信号处理方法
CN104347077B (zh) * 2014-10-23 2018-01-16 清华大学 一种立体声编解码方法
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
US12125492B2 (en) 2015-09-25 2024-10-22 Voiceage Coproration Method and system for decoding left and right channels of a stereo sound signal
ES2904275T3 (es) 2015-09-25 2022-04-04 Voiceage Corp Método y sistema de decodificación de los canales izquierdo y derecho de una señal sonora estéreo
JP6721977B2 (ja) * 2015-12-15 2020-07-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法
CN109389985B (zh) * 2017-08-10 2021-09-14 华为技术有限公司 时域立体声编解码方法和相关产品
AU2018338424B2 (en) * 2017-09-20 2023-03-02 Voiceage Corporation Method and device for efficiently distributing a bit-budget in a CELP codec
JP7092049B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 多地点制御方法、装置及びプログラム
WO2022074202A2 (en) * 2020-10-09 2022-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, or computer program for processing an encoded audio scene using a parameter smoothing
BR112023006291A2 (pt) * 2020-10-09 2023-05-09 Fraunhofer Ges Forschung Dispositivo, método ou programa de computador para processar uma cena de áudio codificada usando uma conversão de parâmetro

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2637090B2 (ja) * 1987-01-26 1997-08-06 株式会社日立製作所 音響信号処理回路
US5434948A (en) 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
NL9100173A (nl) 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5285498A (en) 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
JPH05289700A (ja) * 1992-04-09 1993-11-05 Olympus Optical Co Ltd 音声符号化装置
IT1257065B (it) * 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
JPH0736493A (ja) * 1993-07-22 1995-02-07 Matsushita Electric Ind Co Ltd 可変レート音声符号化装置
JPH07334195A (ja) * 1994-06-14 1995-12-22 Matsushita Electric Ind Co Ltd サブフレーム長可変音声符号化装置
US5694332A (en) * 1994-12-13 1997-12-02 Lsi Logic Corporation MPEG audio decoding system with subframe input buffering
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
SE9700772D0 (sv) 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
JPH1132399A (ja) 1997-05-13 1999-02-02 Sony Corp 符号化方法及び装置、並びに記録媒体
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6012031A (en) * 1997-09-24 2000-01-04 Sony Corporation Variable-length moving-average filter
DE69711102T2 (de) 1997-12-27 2002-11-07 Stmicroelectronics Asia Pacific Pte Ltd., Singapur/Singapore Verfahren und gerät zur schätzung von koppelparametern in einem transformationskodierer für hochwertige tonsignale
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
JP3606458B2 (ja) * 1998-10-13 2005-01-05 日本ビクター株式会社 音声信号伝送方法及び音声復号方法
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
JP2001184090A (ja) 1999-12-27 2001-07-06 Fuji Techno Enterprise:Kk 信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE519981C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
JP3894722B2 (ja) 2000-10-27 2007-03-22 松下電器産業株式会社 ステレオオーディオ信号高能率符号化装置
JP3846194B2 (ja) 2001-01-18 2006-11-15 日本ビクター株式会社 音声符号化方法,音声復号化方法,音声受信装置及び音声信号伝送方法
DE60209888T2 (de) 2001-05-08 2006-11-23 Koninklijke Philips Electronics N.V. Kodieren eines audiosignals
US7460993B2 (en) 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
ES2268340T3 (es) * 2002-04-22 2007-03-16 Koninklijke Philips Electronics N.V. Representacion de audio parametrico de multiples canales.
EP1500082B1 (en) 2002-04-22 2007-02-14 Koninklijke Philips Electronics N.V. Signal synthesizing
JP4062971B2 (ja) 2002-05-27 2008-03-19 松下電器産業株式会社 オーディオ信号符号化方法
RU2363116C2 (ru) * 2002-07-12 2009-07-27 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
CN100505554C (zh) * 2002-08-21 2009-06-24 广州广晟数码技术有限公司 用于从编码后的音频数据流中解码重建多声道音频信号的方法
JP4022111B2 (ja) 2002-08-23 2007-12-12 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置及び信号符号化方法
JP4373693B2 (ja) * 2003-03-28 2009-11-25 パナソニック株式会社 音響信号の階層符号化方法および階層復号化方法
CN100546233C (zh) 2003-04-30 2009-09-30 诺基亚公司 用于支持多声道音频扩展的方法和设备
DE10328777A1 (de) 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
CN1212608C (zh) * 2003-09-12 2005-07-27 中国科学院声学研究所 一种采用后置滤波器的多通道语音增强方法
US7725324B2 (en) 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US8843378B2 (en) 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal

Also Published As

Publication number Publication date
CN101128867B (zh) 2012-06-20
US20060246868A1 (en) 2006-11-02
ES2389499T3 (es) 2012-10-26
ATE521143T1 (de) 2011-09-15
EP1851866A4 (en) 2010-05-19
CN101124740A (zh) 2008-02-13
CN101128866B (zh) 2011-09-21
CN101128866A (zh) 2008-02-20
EP1851866B1 (en) 2011-08-17
JP2008529056A (ja) 2008-07-31
JP4809370B2 (ja) 2011-11-09
WO2006091139A1 (en) 2006-08-31
US7822617B2 (en) 2010-10-26
CN101128867A (zh) 2008-02-20
US20060195314A1 (en) 2006-08-31
CN101124740B (zh) 2012-05-30
ATE518313T1 (de) 2011-08-15
JP2008532064A (ja) 2008-08-14
EP1851866A1 (en) 2007-11-07
US7945055B2 (en) 2011-05-17

Similar Documents

Publication Publication Date Title
JP5171269B2 (ja) マルチチャネルオーディオ符号化における忠実度の最適化及び信号伝送量の低減
EP1856688B1 (en) Optimized fidelity and reduced signaling in multi-channel audio encoding
RU2698154C1 (ru) Стереофоническое кодирование на основе mdct с комплексным предсказанием
RU2765565C2 (ru) Способ и система для кодирования стереофонического звукового сигнала с использованием параметров кодирования первичного канала для кодирования вторичного канала
CN100559465C (zh) 保真度优化的可变帧长编码
KR101717006B1 (ko) 오디오 프로세싱 시스템
US7809579B2 (en) Fidelity-optimized variable frame length encoding
JP5455647B2 (ja) オーディオデコーダ
AU2007237227B2 (en) Fidelity-optimised pre-echo suppressing encoding

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121225

R150 Certificate of patent or registration of utility model

Ref document number: 5171269

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees