JP2016531327A - 先進的結合のための非一様パラメータ量子化 - Google Patents

先進的結合のための非一様パラメータ量子化 Download PDF

Info

Publication number
JP2016531327A
JP2016531327A JP2016541900A JP2016541900A JP2016531327A JP 2016531327 A JP2016531327 A JP 2016531327A JP 2016541900 A JP2016541900 A JP 2016541900A JP 2016541900 A JP2016541900 A JP 2016541900A JP 2016531327 A JP2016531327 A JP 2016531327A
Authority
JP
Japan
Prior art keywords
parameter
step size
quantized
scalar quantization
dequantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016541900A
Other languages
English (en)
Other versions
JP6201057B2 (ja
Inventor
プルンハーゲン,ヘイコ
エクストランド,ペール
Original Assignee
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー・インターナショナル・アーベー filed Critical ドルビー・インターナショナル・アーベー
Publication of JP2016531327A publication Critical patent/JP2016531327A/ja
Application granted granted Critical
Publication of JP6201057B2 publication Critical patent/JP6201057B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/02Traffic management, e.g. flow control or congestion control
    • H04W28/06Optimizing the usage of the radio link, e.g. header compression, information sizing, discarding information
    • H04W28/065Optimizing the usage of the radio link, e.g. header compression, information sizing, discarding information using assembly or disassembly of packets
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/02Traffic management, e.g. flow control or congestion control
    • H04W28/0215Traffic management, e.g. flow control or congestion control based on user or device properties, e.g. MTC-capable devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)
  • Error Detection And Correction (AREA)

Abstract

本開示は、オーディオ信号のパラメトリックな空間的符号化に関係するパラメータの非一様量子化のための方法、装置およびコンピュータ・プログラム・プロダクトを提供する。本開示はさらに、非一様に量子化されたパラメータを考慮に入れるオーディオ・デコード・システムにおいてオーディオ・オブジェクトを再構築する方法および装置に関する。本開示によれば、そのようなアプローチにより、再構築されるオーディオ・オブジェクトの品質を実質的に低下させることなくビット消費を低減することが可能になる。

Description

関連出願への相互参照
本願は2013年9月12日に出願された米国仮特許出願第61/877,166号の優先権を主張するものである。同出願の内容はここに参照によってその全体において組み込まれる。
技術分野
本稿の開示は、概括的にはオーディオ符号化に関し、詳細には、オーディオ信号のパラメトリックな空間的符号化のためのシステムにおいて使われるパラメータの知覚的に最適化された量子化に関する。
低ビット・オーディオ符号化システムの性能は、パラメトリック・ステレオ(PS)符号化ツールが用いられるときにステレオ信号について著しく改善できる。そのようなシステムでは、モノ信号は典型的には、現状技術のオーディオ符号化器を使って量子化され、伝達され、ステレオ・パラメータはエンコーダにおいて推定され、量子化され、サイド情報としてビットストリームに加えられる。デコーダでは、ステレオ信号は、ステレオ・パラメータの助けを得て、デコードされたモノ信号から再構成される。
いくつかの可能なパラメトリック・ステレオ符号化の変形がある。よって、いくつかのエンコーダ型があり、それらは、モノ・ダウンミックスに加えて、生成されるビットストリームに埋め込まれる種々のステレオ・パラメータを生成する。そのような符号化のためのツールも標準化されている。そのような標準の例はMPEG4オーディオである(ISO/IEC14496-3)。
オーディオ符号化システム一般、特にパラメトリック・ステレオ符号化の背後にある主要な発想ならびにこの技術分野のいくつかの課題の一つは、良好なオーディオ品質を得つつ、エンコーダからデコーダにビットストリームにおいて転送される必要のある情報の量を最小にするということである。ビットストリーム情報の高レベルの圧縮は、複雑で非効率的な計算プロセスのためまたは圧縮プロセスにおいて情報が失われたため、受け入れられない音質につながることがありうる。他方、ビットストリーム情報の低レベルの圧縮は、やはり受け入れられない音質につながりうる容量の問題につながりうる。
よって、改善されたパラメトリック・ステレオ符号化方法の必要がある。
下記では、例示的実施形態がより詳細に、付属の図面を参照して記述される。
ある例示的実施形態に基づくパラメトリック・ステレオ・エンコードおよびデコード・システムのブロック図である。 図1のパラメトリック・ステレオ・エンコード・システムのエンコード部分におけるステレオ・パラメータの処理に関係するブロック図である。 図1のパラメトリック・ステレオ・エンコード・システムのデコード部分におけるステレオ・パラメータの処理に関係するブロック図である。 一つのステレオ・パラメータの関数としてスケーリング因子sの値を示す図である。 aおよびbがステレオ・パラメータであるとして、(a,b)平面において非一様および一様量子化器(細かいおよび粗い)を示す図である。 一様な細かいおよび一様な粗い量子化の例についての平均的なパラメトリック・ステレオ・ビット消費を、ある例示的実施形態に基づく非一様な細かいおよび非一様な粗い量子化と比較して示す図である。 もう一つの例示的実施形態に基づくパラメトリック・マルチチャネル・エンコードおよびデコード・システムのブロック図である。 すべての図面は概略的であり、一般に、本開示を明快にするために必要な部分を示すのみである。一方、他の部分は省略されたり示唆されるだけであったりすることがある。特に断わりのない限り、同様の参照符号は異なる図面における同様の部分を指す。
上記に鑑み、エンコーダ、デコーダ、エンコーダおよびデコーダを有するシステムならびに関連する方法であって向上した効率および符号化されたオーディオ信号の品質を提供するものを提供することが目的である。
〈I.概観――エンコーダ〉
第一の側面によれば、例示的実施形態は、エンコード方法、エンコーダおよびエンコードのためのコンピュータ・プロダクトを提案する。提案される方法、エンコーダおよびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもちうる。
例示的実施形態によれば、オーディオ信号のパラメトリックな空間的符号化に関係するパラメータの量子化のためのオーディオ・エンコーダにおける方法であって:少なくとも、量子化されるべき第一のパラメータおよび第二のパラメータを受領する段階と;非一様なきざみサイズをもつ第一のスカラー量子化方式に基づいて前記第一のパラメータを量子化して量子化された第一のパラメータを得る段階であって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、段階と;前記第一のスカラー量子化方式を使って前記量子化された第一のパラメータを量子化解除して、前記第一のパラメータの近似である量子化解除された第一のパラメータを得る段階と;量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定する段階と;前記スケーリング因子および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化して、量子化された第二のパラメータを得る段階とを含む、方法が提供される。
本方法は、人間の音知覚が均一ではないという理解に基づく。むしろ、人間の音知覚はいくつかの音特性に関してはより高く、他の音特性にについてはより低い。このことは、人間の音知覚がオーディオ信号のパラメトリックな空間的符号化に関係するパラメータのいくつかの値については、他のそのような値についてより敏感であることを含意する。提供される方法によれば、第一のそのようなパラメータは非一様なきざみサイズで量子化され、人間の音知覚が最も敏感なところではより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でないところではより大きなきざみサイズが使われる。そのような非一様なきざみサイズ方式を使って量子化することにより、知覚可能な音質を低下させることなく平均的なパラメトリック・ステレオのビット消費を低減することが可能である。
諸実施形態によれば、本方法のスケーリング関数は区分線形関数である。
諸実施形態によれば、前記スケーリング因子および前記第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化する方法段階は、前記第二のパラメータを前記第二のスカラー量子化方式に基づく量子化にかける前に、前記第二のパラメータを前記スケーリング因子で割ることを含む。
本方法の代替的な実施形態によれば、前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二のパラメータの量子化の前に、前記スケーリング因子によってスケーリングされる。
本方法の諸実施形態によれば、前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二のパラメータの値とともに増大する。
本方法の諸実施形態によれば、前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式より多くの量子化きざみを含む。
本方法の諸実施形態によれば、前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式をオフセットし、ミラーリングし、連結することによって構築される。
本方法の諸実施形態によれば、前記第一および/または第二のスカラー量子化方式の最大のきざみサイズは、前記第一および/または第二のスカラー量子化方式の最小のきざみサイズの約4倍の大きさである。
例示的実施形態によれば、処理機能を有する装置で実行されたときに前記第一の側面のいずれかの方法を実行するよう適応されたコンピュータ・コード命令を有するコンピュータ可読媒体が提供される。
例示的実施形態によれば、オーディオ信号のパラメトリックな空間的符号化に関係するパラメータの量子化のためのオーディオ・エンコーダであって:少なくとも、量子化されるべき第一のパラメータおよび第二のパラメータを受領するよう構成された受領コンポーネントと;非一様なきざみサイズをもつ第一のスカラー量子化方式に基づいて前記第一のパラメータを量子化して量子化された第一のパラメータを得るよう構成された、前記受領コンポーネントの下流に配置された第一の量子化コンポーネントであって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、第一の量子化コンポーネントと;前記第一の量子化コンポーネントから前記第一の量子化されたパラメータを受領し、前記第一のスカラー量子化方式を使って前記量子化された第一のパラメータを量子化解除して、前記第一のパラメータの近似である量子化解除された第一のパラメータを得るよう構成された量子化解除コンポーネントと;前記量子化解除された第一のパラメータを受領し、量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定するよう構成されたスケーリング因子決定コンポーネントと;前記第二のパラメータおよび前記スケーリング因子を受領して、前記スケーリング因子および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化して、量子化された第二のパラメータを得るよう構成された第二の量子化コンポーネントとを有する、オーディオ・エンコーダが提供される。
〈II.概観――デコーダ〉
第二の側面によれば、例示的実施形態は、デコード方法、デコーダおよびデコードのためのコンピュータ・プログラム・プロダクトを提案する。提案される方法、デコーダおよびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもちうる。
上記のエンコーダの概観において呈示された特徴およびセットアップに関する利点は、一般に、デコーダについての対応する特徴およびセットアップについても有効でありうる。
例示的実施形態によれば、オーディオ信号のパラメトリックな空間的符号化に関係する量子化されたパラメータの量子化解除のためのオーディオ・デコーダにおける方法であって:少なくとも、第一の量子化されたパラメータおよび第二の量子化されたパラメータを受領する段階と;非一様なきざみサイズをもつ第一のスカラー量子化方式に従って前記量子化された第一のパラメータを量子化解除して量子化解除された第一のパラメータを得る段階であって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、段階と;量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定する段階と;前記スケーリング関数および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記第二の量子化されたパラメータを量子化解除して、量子化解除された第二のパラメータを得る段階とを含む、方法が提供される。
本方法の諸実施形態によれば、前記スケーリング関数は区分線形関数である。
ある実施形態によれば、前記スケーリング因子および前記第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化解除する段階は、前記第二のスカラー量子化方式に従って前記第二の量子化されたパラメータを量子化解除し、その結果に前記スケーリング因子を乗算することを含む。
代替的な実施形態によれば、前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二の量子化されたパラメータの量子化解除の前に、前記スケーリング因子によってスケーリングされる。
さらなる諸実施形態によれば、前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二のパラメータの値とともに増大する。
ある実施形態によれば、前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式より多くの量子化きざみを含む。
ある実施形態によれば、前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式をオフセットし、ミラーリングし、連結することによって構築される。
ある実施形態によれば、前記第一および/または第二のスカラー量子化方式の最大のきざみサイズは、前記第一および/または第二のスカラー量子化方式の最小のきざみサイズの約4倍の大きさである。
例示的実施形態によれば、処理機能を有する装置によって実行されたときに前記第二の側面のいずれかの方法を実行するよう適応されたコンピュータ・コード命令を有するコンピュータ可読媒体が提供される。
例示的実施形態によれば、オーディオ信号のパラメトリックな空間的符号化に関係する量子化されたパラメータの量子化解除のためのオーディオ・デコーダであって:少なくとも、第一の量子化されたパラメータおよび第二の量子化されたパラメータを受領するよう構成された受領コンポーネントと;前記受領コンポーネントの下流に配置され、非一様なきざみサイズをもつ第一のスカラー量子化方式に従って前記量子化された第一のパラメータを量子化解除して量子化解除された第一のパラメータを得るよう構成された第一の量子化解除コンポーネントであって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、第一の量子化解除コンポーネントと;前記第一の量子化解除コンポーネントから前記量子化解除された第一のパラメータを受領し、量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定するよう構成されたスケーリング因子決定コンポーネントと;前記スケーリング因子および前記第二の量子化されたパラメータを受領し、前記スケーリング因子および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記第二の量子化されたパラメータを量子化解除して、量子化解除された第二のパラメータを得るよう構成された第二の量子化解除コンポーネントとを有する、オーディオ・デコーダが提供される。
〈III.概観――オーディオ・エンコード/デコード・システム〉
第三の側面によれば、例示的実施形態は、第一の側面に基づくエンコーダおよび第二の側面に基づくデコーダを有するデコード/エンコード・システムを提案する。
上記のエンコーダおよびデコーダの概観において呈示された特徴およびセットアップに関する利点は、一般に、本システムについての対応する特徴およびセットアップについても有効でありうる。
例示的実施形態によれば、オーディオ・エンコーダが前記第一および第二の量子化されたパラメータをオーディオ・デコーダに伝送するよう構成されているそのようなシステムが提供される。
〈IV.例示的実施形態〉
本稿の開示は、オーディオ信号のパラメトリックな空間的符号化のためのシステムにおいて使用されるパラメータの知覚的に最適化された量子化を論じる。下記で考察される例では、2チャネル信号についてのパラメトリック・ステレオ符号化の特殊な場合が論じられる。同じ技法は、パラメトリックなマルチチャネル符号化において、たとえば5-3-5モードで動作するシステムにおいて使用されることもできる。そのようなシステムの例示的実施形態は、図7に概要が示されており、下記で簡単に論じる。ここに呈示される例示的実施形態は、知覚されるオーディオ品質に影響することなくこれらのパラメータを伝達するために必要とされるビットレートの低減を許容するとともに、スカラー・パラメータについての確立されたエントロピー符号化技法(時間または周波数差分符号化に続けてハフマン符号化など)を続けて使うことを許容する単純な非一様量子化に関する。
図1は、本稿で論じられるパラメトリック・ステレオ・エンコードおよびデコード・システム100の実施形態のブロック図を示している。左チャネル101(L)および右チャネル102(R)を含むステレオ信号がシステム100のエンコーダ部分110によって受領される。ステレオ信号は「先進的結合(ACPL: Advanced Coupling)」エンコーダ112への入力として送られる。該エンコーダ112は、モノ・ダウンミックス103(M)およびステレオ・
パラメータa(図1では104aとして参照される)およびb(図1では104bとして参照される)を生成する。さらに、エンコーダ部分110は、モノ・ダウンミックス103をビットストリーム105に変換するダウンミックス・エンコーダ114(DMXEnc)と、量子化されたステレオ・パラメータのストリーム106を生成するステレオ・パラメータ量子化手段116(Q)と、デコーダ部分120に伝達される、量子化されたステレオ・パラメータをも含む最終的なビットストリーム108を生成するマルチプレクサ118(MUX)とを有する。デコーダ部分120は、はいってくる該最終的なビットストリーム108を受領して、ビットストリーム105および量子化されたステレオ・パラメータのストリーム106を再生成するデマルチプレクサ122(DE-MUX)と、ビットストリーム105を受領してデコードされたモノ・ダウンミックス103’(M')を出力するダウンミックス・デコーダ124(DMXDec)と、量子化されたステレオ・パラメータ106のストリームを受領して、量子化解除されたステレオ・パラメータa' 104a’およびb' 104b’を出力するステレオ・パラメータ量子化解除手段126(Q')と、最後に、デコードされたモノ・ダウンミックス103’および量子化解除されたステレオ・パラメータ104a’、104b’を受領してこれらのはいってくる信号を再構成されたステレオ信号101’(L')および102’(R')に変換するACPLデコーダ128とを有する。
はいってくるステレオ信号101(L)および102(R)から始めると、ACPLエンコーダ112は、次の式:
M=(L+R)/2 (式1)
S=(L−R)/2 (式2)
に従ってモノ・ダウンミックス103(M)およびサイド信号(S)を計算する。
ステレオ・パラメータaおよびbは時間および周波数選択的な仕方で、すなわち各時間/周波数タイルについて、典型的にはQMFバンクのようなフィルタバンクの助けを用いて、知覚的な周波数スケールに従ってQMF帯域を、一組のパラメータ帯域を形成するよう非一様にグループ化することを使って、計算される。
ACPLデコーダでは、デコードされたモノ・ダウンミックスM'は、ステレオ・パラメータa'、b'およびM'の脱相関されたバージョン(decorr(M'))と一緒になって、次式:
S'=a'*M'+b'*decorr(M') (式3)
に従ってサイド信号の近似を再構成するための入力として使われる。
次いで、L'およびR'が
L'=M'+S' (式4)
R'=M'−S' (式5)
として計算される。
パラメータ対(a,b)は二次元(a,b)面での点と考えられる。パラメータa,bは、知覚されるステレオ・イメージに関係している。パラメータaは主として知覚される音源の位置(たとえば左または右)に関係し、パラメータbは主として知覚される音源のサイズまたは幅(小さく、よく局在化されているまたは幅広く環境性)に関係する。表1は、知覚されるステレオ・イメージおよび対応するパラメータa,bの値の若干の典型的な例を挙げている。
Figure 2016531327
bは決して負にならないことに注意。また、たとえbおよびaの絶対値がしばしば0から1の範囲内であるとしても、1より大きな絶対値をもつこともできることも注意しておくべきである。たとえば、LおよびRにおける強い位相外れ成分の場合、すなわちLとRの間の相関が負であるときがそうである。
今の問題は、ここで、パラメトリックなステレオ/空間的符号化システムにおいてサイド情報として伝送するためにパラメータa,bを量子化する技法を設計することである。従来技術の単純で素直な手法は、一様な量子化を使い、aおよびbを独立に量子化する、すなわち二つのスカラー量子化器を使うというものである。典型的な量子化きざみサイズは、細かい量子化についてはデルタ=0.1、粗い量子化についてはデルタ=0.2である。図5の左下および右下のパネルは、細かいおよび粗い量子化についてそのような量子化方式によって表わされることのできる(a,b)面内の点を示している。典型的には、量子化されたパラメータaおよびbは、ハフマン符号化と組み合わせた時間差分または周波数差分符号化を使って、独立にエントロピー符号化される。
しかしながら、本発明者らは、今や、パラメータ量子化の(レート‐歪みの意味での)性能は、知覚的な側面を考慮に入れることによって、そのようなスカラー量子化に対して改善されることができることを認識するに至った。特に、人間の聴覚系のパラメータ値の小さな変化(量子化によって導入される誤差など)に対する敏感さは(a,b)面内の位置に依存する。そのような小さな変化または「最小可知差異」(JND: just-noticable differences)の可聴性を調べる知覚的な実験は、aおよびbについてのJNDは、(a,b)面内の点(1,0)および(−1,0)によって表わされる知覚されるステレオ・イメージをもつ音源については実質的に小さいことを示している。よって、aおよびbの一様な量子化は(1,0)および(−1,0)に近い領域については粗すぎ(可聴なアーチファクトがある)、(0,0)および(0,1)付近のような他の領域では不必要に細かい(不必要に高いサイド情報ビットレートを引き起こす)ことがありうる。もちろん、ステレオ・パラメータaおよびbの合同した〔ジョイントの〕非一様な量子化を達成するために(a,b)についてのベクトル量子化器を考えることも可能であろう。しかしながら、ベクトル量子化器は計算上、より複雑であり、エントロピー符号化(時間または周波数差分)が適応される必要があり、やはりより複雑になる。
よって、パラメータaおよびbについての新規な非一様な量子化方式が本願において導入される。aおよびbについての非一様な量子化方式は、位置依存のJNDを活用する(ベクトル量子化器でもできるように)が、aおよびbの従来技術の一様で独立な量子化に対する小さな修正として実装されることができる。さらに、従来技術の時間または周波数差分エントロピー符号化が基本的に不変のままであることができる。インデックス範囲および記号〔シンボル〕確率における変化を反映するために、ハフマン・コードブックが更新される必要があるだけである。
結果として得られる量子化方式が図2および図3に示されている。図2はエンコーダ部分110のステレオ・パラメータ量子化手段116に関係し、図3はデコーダ部分120のステレオ・パラメータ量子化解除手段126に関係する。ステレオ・パラメータ量子化方式は、量子化手段Qa(図2では202として参照される)においてパラメータa(図2では104aとして参照される)に非一様なスカラー量子化を適用することによって始まる。量子化されたパラメータ106aはマルチプレクサ118に転送される。量子化されたパラメータは量子化解除手段Qa-1(図2では204として参照される)において直接、パラメータa'に量子化解除されもする。量子化されたパラメータ106aはデコーダ部分120においてもa'(図3では104a’として参照される)に量子化解除されるので、a'はシステム100のエンコーダ部分110とデコーダ部分120の両方において同一である。そこで、a'は、aの実際の値に依存してbの量子化をするために使われるスケーリング因子s(スケーリング手段206によって実行される)を計算するために使われる。パラメータb(図2において104bとして参照される)はこのスケーリング因子sによって割られ(逆数手段208および乗算手段210によって実行される)、次いでもう一つの非一様なスカラー量子化器Qb(図2では212として参照されている)に送られ、そこから量子化されたパラメータ106bが転送される。このプロセスは、図3に示されるステレオ・パラメータ量子化解除手段126において部分的に反転される。はいってくる量子化されたパラメータ106aおよび106bは量子化解除手段Qa-1(図3では304として参照される)およびQb-1(図3では308として参照される)においてa'(図3では104a’として参照される)およびエンコーダ部分110においてスケーリング因子sで以前に割ったb'に量子化解除される。スケーリング手段306は、エンコーダ部分110におけるスケーリング手段206と同じようにして量子化解除されたパラメータa'(104a)に基づいてスケーリング因子sを決定する。次いで、スケーリング因子は、乗算手段310において量子化解除されたパラメータ106bの量子化解除の結果と乗算され、量子化解除されたパラメータb'(図3では104b’として参照される)が得られる。よって、aの量子化解除およびスケーリング因子の計算は、エンコーダ部分110およびデコーダ部分120の両方において実装され、sの正確に同じ値がbのエンコードおよびデコードのために使われることを保証する。
aおよびbについての非一様な量子化は、0から1までの範囲の値についての単純な非一様な量子化器に基づく。ここで、1付近の値についての量子化きざみサイズは0付近の値についての量子化きざみサイズの約4倍であり、量子化きざみサイズはパラメータの値とともに増大する。たとえば、量子化きざみサイズは、対応する量子化解除された値を同定するインデックスとともにほぼ線形に増大することができる。8個の区間(すなわち9個のインデックス)をもつ量子化器について、次の値が得られる。ここで、量子化きざみサイズは、二つの隣り合う量子化解除された値の間の差である。
Figure 2016531327
この表は、量子化解除手段Qb-1(図3では308として参照される)のために使用できる量子化方式の例である。しかしながら、パラメータaについては値のより大きな範囲を扱う必要がある。量子化解除手段Qa-1(図3では304として参照される)のための量子化方式の例は、上記の表2に示される非一様量子化区間をミラーリングして連結して、−2から2の範囲の値を表わすことのできる量子化器を与えることによって、簡単に構築されることができる。ここで、−2、0、2付近の値についての量子化きざみサイズは−1および1付近の値についての量子化きざみサイズの約4倍である。結果として得られる値を下記の表3に示す。
Figure 2016531327
図4は、aの関数としてスケーリング因子sの値を示している。これは、a=−1およびa=1についてs=1(すなわちスケーリングなし)、a=−2、a=0およびa=2についてs=4(bの4倍粗い量子化)となる区分線形関数である。図4の関数は例であり、他のそのような関数が理論的には可能であることを指摘しておく。同じ考えは量子化方式に適用可能である。
aおよびbの、結果として得られる非一様な量子化が図5の左上のパネルに示されている。ここで、この量子化器によって表現できる(a,b)平面内の各点が×によってマークされている。最も敏感な点(1,0)および(−1,0)のあたりでは、aおよびb両方についての量子化きざみサイズは約0.06であり、(0,0)のあたりのaおよびbについては約0.2である。よって、量子化きざみは、aおよびbの一様なスカラー量子化の量子化きざみより、JNDにずっと適合されている。
より粗い量子化が望まれる場合には、非一様な量子化器の一つおきの量子化解除された値を脱落させ、それにより量子化きざみサイズを2倍にすることが可能である。表4は、パラメータbについての次の粗い非一様な量子化器およびパラメータaについての非一様な量子化器が、上記で示したのと同じようにして得られることを示している。
Figure 2016531327
図4に示されるスケーリング関数は、粗い量子化について不変のままであり、(a,b)についての、結果として得られる粗い量子化器は図5の右上のパネルにおいて示される。そのような粗い量子化は、符号化システムが非常に低い目標ビットレートで動作させられる場合に望ましいことがある。その場合、ステレオ・パラメータのより粗い量子化によって節約されたビットをモノ・ダウンミックス信号M(図1では103として参照される)を符号化することに費やすことが有利でありうる。
ステレオ・パラメータaおよびbの非一様および一様な量子化の間の効率の差が図6に例証されている。差は細かいおよび粗い量子化について示されている。11時間の音楽に対応する毎秒平均ビット消費が示されている。この図から、非一様な量子化についてのビット消費は一様な量子化についてよりも実質的に低いことが結論できる。さらに、より粗い非一様な量子化は、毎秒ビット消費を、より粗い一様な量子化よりも大きく低減することが結論できる。
最後に、5-3-5パラメトリック・マルチチャネル・エンコードおよびデコード・システム700の例示的実施形態のブロック図が図7に開示される。左前方チャネル701、左サラウンド・チャネル702、中央前方チャネル703、右前方チャネル704および右サラウンド・チャネル705を含むマルチチャネル信号がシステム700のエンコーダ部分710によって受領される。左前方チャネル701および左サラウンド・チャネル702の信号は入力として第一の「先進的結合(ACPL)」エンコーダ712に送られる。該エンコーダ712は、左ダウンミックス706およびステレオ・パラメータaL(708aとして参照される)およびbL(708bとして参照される)を生成する。同様に、右前方チャネル704および右サラウンド・チャネル705の信号は入力として第二の「先進的結合(ACPL)」エンコーダ713に送られる。該エンコーダ713は、右ダウンミックス707およびステレオ・パラメータaR(709aとして参照される)およびbR(709bとして参照される)を生成する。さらに、エンコーダ部分710は、左ダウンミックス706、中央前方チャネル703および右ダウンミックス707をビットストリーム722に変換する3チャネル・ダウンミックス・エンコーダ714と、ステレオ・パラメータ708aおよび708bに基づいて、量子化されたステレオ・パラメータの第一のストリーム720を生成する第一のステレオ・パラメータ量子化手段715と、ステレオ・パラメータ709aおよび709bに基づいて、量子化されたステレオ・パラメータの第二のストリーム724を生成する第二のステレオ・パラメータ量子化手段716と、デコーダ部分740に伝達される、量子化されたステレオ・パラメータをも含む最終的なビットストリーム735を生成するマルチプレクサ730とを有する。デコーダ部分740は、はいってくる該最終的なビットストリーム735を受領して、ビットストリーム722、量子化されたステレオ・パラメータの第一のストリーム720および量子化されたステレオ・パラメータの第二のストリーム724を再生成するデマルチプレクサ742を有する。量子化されたステレオ・パラメータの第一のストリーム720は、第一のステレオ・パラメータ量子化解除手段745によって受領され、それが量子化解除されたステレオ・パラメータ708a’および708b’を出力する。量子化されたステレオ・パラメータの第二のストリーム724は、第二のステレオ・パラメータ量子化解除手段746によって受領され、それが量子化解除されたステレオ・パラメータ709a’および709b’を出力する。ビットストリーム722は、再生成された左ダウンミックス706’、再構築された中央前方チャネル703’および再生成された右ダウンミックス707’を出力する3チャネル・ダウンミックス・デコーダ744によって受領される。第一のACPLデコーダ747は量子化解除されたステレオ・パラメータ708a’および708b’ならびに再生成された左ダウンミックス706’を受領し、再構築された左前方チャネル701’および再構築された左サラウンド・チャネル702’を出力する。同様に、第二のACPLデコーダ748は量子化解除されたステレオ・パラメータ709a’および709b’ならびに再生成された右ダウンミックス707’を受領し、再構築された右前方チャネル704’および再構築された右サラウンド・チャネル705’を出力する。
〈等価物、拡張、代替その他〉
上記の記述を吟味すれば、当業者には本開示のさらなる実施形態が明白になるであろう。本稿および図面は実施形態および例を開示しているが、本開示はこれらの個別的な例に制約されるものではない。付属の請求項によって定義される本開示の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
さらに、図面、本開示および付属の請求項の吟味から、本開示を実施する当業者によって、開示される実施形態に対する変形が理解され、実施されることができる。請求項において、「有する/含む」の語は他の要素またはステップを排除するものではなく、単数形の表現は複数を排除するものではない。ある種の施策が互いに異なる従属請求項に記載されているというだけの事実がこれらの施策の組み合わせが有利に使用できないことを示すものではない。
上記で開示されたシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェアまたはそれらの組み合わせとして実装されうる。ハードウェア実装では、上記の記述で言及された機能ユニットの間でのタスクの分割は必ずしも物理的なユニットへの分割に対応しない。逆に、一つの物理的コンポーネントが複数の機能を有していてもよく、一つのタスクが協働するいくつかの物理的コンポーネントによって実行されてもよい。ある種のコンポーネントまたはすべてのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよく、あるいはハードウェアとしてまたは特定用途向け集積回路として実装されてもよい。そのようなソフトウェアは、コンピュータ記憶媒体(または非一時的な媒体)および通信媒体(または一時的な媒体)を含みうるコンピュータ可読媒体上で頒布されてもよい。当業者にはよく知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータのような情報の記憶のための任意の方法または技術において実装される揮発性および不揮発性、リムーバブルおよび非リムーバブル媒体を含む。コンピュータ記憶媒体は、これに限られないが、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶デバイスまたは、所望される情報を記憶するために使用されることができ、コンピュータによってアクセスされることができる他の任意の媒体を含む。さらに、通信媒体が典型的にはコンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータを、搬送波または他の転送機構のような変調されたデータ信号において具現し、任意の情報送達媒体を含むことは当業者にはよく知られている。

Claims (21)

  1. オーディオ信号のパラメトリックな空間的符号化に関係するパラメータの量子化のためのオーディオ・エンコーダにおける方法であって:
    少なくとも、量子化されるべき第一のパラメータおよび第二のパラメータを受領する段階と;
    非一様なきざみサイズをもつ第一のスカラー量子化方式に基づいて前記第一のパラメータを量子化して、量子化された第一のパラメータを得る段階であって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、段階と;
    前記第一のスカラー量子化方式を使って前記量子化された第一のパラメータを量子化解除して、前記第一のパラメータの近似である量子化解除された第一のパラメータを得る段階と;
    量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定する段階と;
    前記スケーリング因子および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化して、量子化された第二のパラメータを得る段階とを含む、
    方法。
  2. 前記スケーリング関数は区分線形関数である、請求項1記載の方法。
  3. 前記スケーリング因子および前記第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化する段階は、前記第二のパラメータを前記第二のスカラー量子化方式に基づく量子化にかける前に、前記第二のパラメータを前記スケーリング因子で割ることを含む、請求項1または2記載の方法。
  4. 前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二のパラメータの量子化の前に、前記スケーリング因子によってスケーリングされる、請求項1または2記載の方法。
  5. 前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二のパラメータの値とともに増大する、請求項1ないし4のうちいずれか一項記載の方法。
  6. 前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式より多くの量子化きざみを含む、請求項1ないし5のうちいずれか一項記載の方法。
  7. 前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式をオフセットし、ミラーリングし、連結することによって構築される、請求項1ないし6のうちいずれか一項記載の方法。
  8. 前記第一および/または第二のスカラー量子化方式の最大のきざみサイズは、前記第一および/または第二のスカラー量子化方式の最小のきざみサイズの約4倍の大きさである、請求項1ないし7のうちいずれか一項記載の方法。
  9. 処理機能を有する装置で実行されたときに請求項1ないし8のうちいずれか一項記載の方法を実行するよう適応されたコンピュータ・コード命令を有するコンピュータ可読媒体。
  10. オーディオ信号のパラメトリックな空間的符号化に関係するパラメータの量子化のためのオーディオ・エンコーダであって:
    少なくとも、量子化されるべき第一のパラメータおよび第二のパラメータを受領するよう構成された受領コンポーネントと;
    非一様なきざみサイズをもつ第一のスカラー量子化方式に基づいて前記第一のパラメータを量子化して量子化された第一のパラメータを得るよう構成された、前記受領コンポーネントの下流に配置された第一の量子化コンポーネントであって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、第一の量子化コンポーネントと;
    前記第一の量子化コンポーネントから前記第一の量子化されたパラメータを受領し、前記第一のスカラー量子化方式を使って前記量子化された第一のパラメータを量子化解除して、前記第一のパラメータの近似である量子化解除された第一のパラメータを得るよう構成された量子化解除コンポーネントと;
    前記量子化解除された第一のパラメータを受領し、量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定するよう構成されたスケーリング因子決定コンポーネントと;
    前記第二のパラメータおよび前記スケーリング因子を受領して、前記スケーリング因子および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化して、量子化された第二のパラメータを得るよう構成された第二の量子化コンポーネントとを有する、
    オーディオ・エンコーダ。
  11. オーディオ信号のパラメトリックな空間的符号化に関係する量子化されたパラメータの量子化解除のためのオーディオ・デコーダにおける方法であって:
    少なくとも、第一の量子化されたパラメータおよび第二の量子化されたパラメータを受領する段階と;
    非一様なきざみサイズをもつ第一のスカラー量子化方式に従って前記量子化された第一のパラメータを量子化解除して量子化解除された第一のパラメータを得る段階であって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、段階と;
    量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定する段階と;
    前記スケーリング関数および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記第二の量子化されたパラメータを量子化解除して、量子化解除された第二のパラメータを得る段階とを含む、
    方法。
  12. 前記スケーリング関数は区分線形関数である、請求項11記載の方法。
  13. 前記スケーリング因子および前記第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化解除する段階は、前記第二のスカラー量子化方式に従って前記第二の量子化されたパラメータを量子化解除し、その結果に前記スケーリング因子を乗算することを含む、請求項11または12記載の方法。
  14. 前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二の量子化されたパラメータの量子化解除の前に、前記スケーリング因子によってスケーリングされる、請求項11または12記載の方法。
  15. 前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二のパラメータの値とともに増大する、請求項11ないし14のうちいずれか一項記載の方法。
  16. 前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式より多くの量子化きざみを含む、請求項11ないし15のうちいずれか一項記載の方法。
  17. 前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式をオフセットし、ミラーリングし、連結することによって構築される、請求項11ないし16のうちいずれか一項記載の方法。
  18. 前記第一および/または第二のスカラー量子化方式の最大のきざみサイズは、前記第一および/または第二のスカラー量子化方式の最小のきざみサイズの約4倍の大きさである、請求項11ないし17のうちいずれか一項記載の方法。
  19. 処理機能を有する装置によって実行されたときに請求項11ないし18のうちいずれか一項記載の方法を実行するよう適応されたコンピュータ・コード命令を有するコンピュータ可読媒体。
  20. オーディオ信号のパラメトリックな空間的符号化に関係する量子化されたパラメータの量子化解除のためのオーディオ・デコーダであって:
    少なくとも、第一の量子化されたパラメータおよび第二の量子化されたパラメータを受領するよう構成された受領コンポーネントと;
    前記受領コンポーネントの下流に配置され、非一様なきざみサイズをもつ第一のスカラー量子化方式に従って前記量子化された第一のパラメータを量子化解除して量子化解除された第一のパラメータを得るよう構成された第一の量子化解除コンポーネントであって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、第一の量子化解除コンポーネントと;
    前記第一の量子化解除コンポーネントから前記量子化解除された第一のパラメータを受領し、量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定するよう構成されたスケーリング因子決定コンポーネントと;
    前記スケーリング因子および前記第二の量子化されたパラメータを受領し、前記スケーリング因子および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記第二の量子化されたパラメータを量子化解除して、量子化解除された第二のパラメータを得るよう構成された第二の量子化解除コンポーネントとを有する、
    オーディオ・デコーダ。
  21. 請求項10記載のエンコーダおよび請求項20記載のオーディオ・デコーダを有するオーディオ・エンコード/デコード・システムであって、前記オーディオ・エンコーダが前記第一および第二の量子化されたパラメータを前記オーディオ・デコーダに伝送するよう構成されている、システム。
JP2016541900A 2013-09-12 2014-09-08 先進的結合のための非一様パラメータ量子化 Active JP6201057B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361877166P 2013-09-12 2013-09-12
US61/877,166 2013-09-12
PCT/EP2014/069040 WO2015036349A1 (en) 2013-09-12 2014-09-08 Non-uniform parameter quantization for advanced coupling

Publications (2)

Publication Number Publication Date
JP2016531327A true JP2016531327A (ja) 2016-10-06
JP6201057B2 JP6201057B2 (ja) 2017-09-20

Family

ID=51518765

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016541900A Active JP6201057B2 (ja) 2013-09-12 2014-09-08 先進的結合のための非一様パラメータ量子化

Country Status (23)

Country Link
US (7) US9672837B2 (ja)
EP (2) EP3321932B1 (ja)
JP (1) JP6201057B2 (ja)
KR (1) KR101777631B1 (ja)
CN (1) CN105531763B (ja)
AR (3) AR097618A1 (ja)
AU (1) AU2014320538B2 (ja)
BR (1) BR112016005192B1 (ja)
CA (1) CA2922256C (ja)
CL (1) CL2016000571A1 (ja)
DK (1) DK3044788T3 (ja)
ES (1) ES2645839T3 (ja)
HK (2) HK1220037A1 (ja)
IL (1) IL244153A (ja)
MX (1) MX356805B (ja)
MY (1) MY187124A (ja)
NO (1) NO2996227T3 (ja)
PL (1) PL3044788T3 (ja)
RU (1) RU2628898C1 (ja)
SG (1) SG11201601144WA (ja)
TW (1) TWI579831B (ja)
UA (1) UA116482C2 (ja)
WO (1) WO2015036349A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110100279A (zh) * 2016-11-08 2019-08-06 弗劳恩霍夫应用研究促进协会 使用边增益和残差增益对多声道信号进行编码或解码的装置和方法

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3067886A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
GB2559199A (en) * 2017-01-31 2018-08-01 Nokia Technologies Oy Stereo audio signal encoder
GB2559200A (en) * 2017-01-31 2018-08-01 Nokia Technologies Oy Stereo audio signal encoder
WO2019020757A2 (en) 2017-07-28 2019-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. APPARATUS FOR ENCODING OR DECODING A MULTI-CHANNEL SIGNAL ENCODED USING A FILLING SIGNAL GENERATED BY A BROADBAND FILTER
US11328735B2 (en) * 2017-11-10 2022-05-10 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
US10827173B2 (en) * 2017-11-13 2020-11-03 Electronics And Telecommunications Research Institute Method and apparatus for quantization
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US10559315B2 (en) 2018-03-28 2020-02-11 Qualcomm Incorporated Extended-range coarse-fine quantization for audio coding
US10762910B2 (en) 2018-06-01 2020-09-01 Qualcomm Incorporated Hierarchical fine quantization for audio coding
GB2590651A (en) * 2019-12-23 2021-07-07 Nokia Technologies Oy Combining of spatial audio parameters
CN113206673B (zh) * 2021-05-24 2024-04-02 上海海事大学 用于网络化控制系统信号量化的差分缩放方法及终端

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005196040A (ja) * 2004-01-09 2005-07-21 Japan Science & Technology Agency 歪みあり符号方法及び装置、歪みあり符号化プログラム及び記録媒体

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL9100173A (nl) * 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US6253165B1 (en) 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
EP1500084B1 (en) 2002-04-22 2008-01-23 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
KR100554680B1 (ko) * 2003-08-20 2006-02-24 한국전자통신연구원 크기 변화에 강인한 양자화 기반 오디오 워터마킹 장치 및방법
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
JP4521032B2 (ja) * 2005-04-19 2010-08-11 ドルビー インターナショナル アクチボラゲット 空間音声パラメータの効率的符号化のためのエネルギー対応量子化
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
WO2009048239A2 (en) 2007-10-12 2009-04-16 Electronics And Telecommunications Research Institute Encoding and decoding method using variable subband analysis and apparatus thereof
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
WO2010000313A1 (en) * 2008-07-01 2010-01-07 Nokia Corporation Apparatus and method for adjusting spatial cue information of a multichannel audio signal
WO2010075895A1 (en) 2008-12-30 2010-07-08 Nokia Corporation Parametric audio coding
MX2011009660A (es) 2009-03-17 2011-09-30 Dolby Int Ab Codificacion estereo avanzada basada en una combinacion de codificacion izquierda/derecha o media/lateral seleccionable de manera adaptable y de codificacion estereo parametrica.
CN101673549B (zh) * 2009-09-28 2011-12-14 武汉大学 一种移动音源空间音频参数预测编解码方法及系统
WO2011073600A1 (fr) 2009-12-18 2011-06-23 France Telecom Codage/decodage parametrique stereo avec optimisation du traitement de reduction des canaux
GB2485979A (en) * 2010-11-26 2012-06-06 Univ Surrey Spatial audio coding
ES2741559T3 (es) * 2011-04-15 2020-02-11 Ericsson Telefon Ab L M Compartición adaptativa de la velocidad de ganancia-forma
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005196040A (ja) * 2004-01-09 2005-07-21 Japan Science & Technology Agency 歪みあり符号方法及び装置、歪みあり符号化プログラム及び記録媒体

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110100279A (zh) * 2016-11-08 2019-08-06 弗劳恩霍夫应用研究促进协会 使用边增益和残差增益对多声道信号进行编码或解码的装置和方法
JP2019536112A (ja) * 2016-11-08 2019-12-12 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. サイドゲインおよび残余ゲインを使用してマルチチャネル信号を符号化または復号するための装置および方法
JP2022003405A (ja) * 2016-11-08 2022-01-11 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. サイドゲインおよび残余ゲインを使用してマルチチャネル信号を符号化または復号するための装置および方法
JP7008716B2 (ja) 2016-11-08 2022-01-25 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. サイドゲインおよび残余ゲインを使用してマルチチャネル信号を符号化または復号するための装置および方法
US11450328B2 (en) 2016-11-08 2022-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain
US11488609B2 (en) 2016-11-08 2022-11-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation
JP7443307B2 (ja) 2016-11-08 2024-03-05 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. サイドゲインおよび残余ゲインを使用してマルチチャネル信号を符号化または復号するための装置および方法
CN110100279B (zh) * 2016-11-08 2024-03-08 弗劳恩霍夫应用研究促进协会 对多声道信号进行编码或解码的装置和方法

Also Published As

Publication number Publication date
US10383003B2 (en) 2019-08-13
US20220295347A1 (en) 2022-09-15
EP3044788B1 (en) 2017-08-09
EP3321932B1 (en) 2020-06-24
NO2996227T3 (ja) 2018-03-10
DK3044788T3 (da) 2017-11-13
US11838798B2 (en) 2023-12-05
KR20160042113A (ko) 2016-04-18
CL2016000571A1 (es) 2017-03-24
WO2015036349A1 (en) 2015-03-19
TW201521011A (zh) 2015-06-01
AU2014320538B2 (en) 2017-10-12
SG11201601144WA (en) 2016-03-30
HK1220037A1 (zh) 2017-04-21
MX2016002793A (es) 2016-05-26
US20200389815A1 (en) 2020-12-10
CN105531763A (zh) 2016-04-27
RU2628898C1 (ru) 2017-08-22
KR101777631B1 (ko) 2017-09-13
US20180352475A1 (en) 2018-12-06
JP6201057B2 (ja) 2017-09-20
HK1247432A1 (zh) 2018-09-21
US20240155427A1 (en) 2024-05-09
CN105531763B (zh) 2017-08-15
CA2922256C (en) 2017-11-07
US10694424B2 (en) 2020-06-23
EP3044788A1 (en) 2016-07-20
US9672837B2 (en) 2017-06-06
IL244153A0 (en) 2016-04-21
US20190320348A1 (en) 2019-10-17
IL244153A (en) 2016-08-31
MY187124A (en) 2021-09-02
MX356805B (es) 2018-06-13
PL3044788T3 (pl) 2018-01-31
EP3321932A1 (en) 2018-05-16
US11297533B2 (en) 2022-04-05
US20170238208A1 (en) 2017-08-17
TWI579831B (zh) 2017-04-21
AR115820A2 (es) 2021-03-03
CA2922256A1 (en) 2015-03-19
ES2645839T3 (es) 2017-12-11
US20160217800A1 (en) 2016-07-28
AR097618A1 (es) 2016-04-06
AU2014320538A1 (en) 2016-03-10
US10057808B2 (en) 2018-08-21
UA116482C2 (uk) 2018-03-26
AR115819A2 (es) 2021-03-03
BR112016005192B1 (pt) 2021-02-09

Similar Documents

Publication Publication Date Title
JP6201057B2 (ja) 先進的結合のための非一様パラメータ量子化
US8180061B2 (en) Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
JP4521032B2 (ja) 空間音声パラメータの効率的符号化のためのエネルギー対応量子化
US7719445B2 (en) Method and apparatus for encoding/decoding multi-channel audio signal
KR20170078663A (ko) 오디오 신호의 파라메트릭 믹싱

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170828

R150 Certificate of patent or registration of utility model

Ref document number: 6201057

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250