JP6201057B2 - 先進的結合のための非一様パラメータ量子化 - Google Patents
先進的結合のための非一様パラメータ量子化 Download PDFInfo
- Publication number
- JP6201057B2 JP6201057B2 JP2016541900A JP2016541900A JP6201057B2 JP 6201057 B2 JP6201057 B2 JP 6201057B2 JP 2016541900 A JP2016541900 A JP 2016541900A JP 2016541900 A JP2016541900 A JP 2016541900A JP 6201057 B2 JP6201057 B2 JP 6201057B2
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- step size
- dequantized
- scalar quantization
- scaling factor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013139 quantization Methods 0.000 title claims description 173
- 230000008878 coupling Effects 0.000 title description 4
- 238000010168 coupling process Methods 0.000 title description 4
- 238000005859 coupling reaction Methods 0.000 title description 4
- 238000000034 method Methods 0.000 claims description 77
- 230000006870 function Effects 0.000 claims description 43
- 230000008447 perception Effects 0.000 claims description 29
- 230000005236 sound signal Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 6
- 238000012886 linear function Methods 0.000 claims description 6
- 240000006890 Erythroxylum coca Species 0.000 claims 8
- 235000008957 cocaer Nutrition 0.000 claims 8
- ZPUCINDJVBIVPJ-LJISPDSOSA-N cocaine Chemical compound O([C@H]1C[C@@H]2CC[C@@H](N2C)[C@H]1C(=O)OC)C(=O)C1=CC=CC=C1 ZPUCINDJVBIVPJ-LJISPDSOSA-N 0.000 claims 8
- 230000008901 benefit Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000007906 compression Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W28/00—Network traffic management; Network resource management
- H04W28/02—Traffic management, e.g. flow control or congestion control
- H04W28/06—Optimizing the usage of the radio link, e.g. header compression, information sizing, discarding information
- H04W28/065—Optimizing the usage of the radio link, e.g. header compression, information sizing, discarding information using assembly or disassembly of packets
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W28/00—Network traffic management; Network resource management
- H04W28/02—Traffic management, e.g. flow control or congestion control
- H04W28/0215—Traffic management, e.g. flow control or congestion control based on user or device properties, e.g. MTC-capable devices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Error Detection And Correction (AREA)
- Stereophonic System (AREA)
Description
本願は2013年9月12日に出願された米国仮特許出願第61/877,166号の優先権を主張するものである。同出願の内容はここに参照によってその全体において組み込まれる。
本稿の開示は、概括的にはオーディオ符号化に関し、詳細には、オーディオ信号のパラメトリックな空間的符号化のためのシステムにおいて使われるパラメータの知覚的に最適化された量子化に関する。
第一の側面によれば、例示的実施形態は、エンコード方法、エンコーダおよびエンコードのためのコンピュータ・プロダクトを提案する。提案される方法、エンコーダおよびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもちうる。
第二の側面によれば、例示的実施形態は、デコード方法、デコーダおよびデコードのためのコンピュータ・プログラム・プロダクトを提案する。提案される方法、デコーダおよびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもちうる。
第三の側面によれば、例示的実施形態は、第一の側面に基づくエンコーダおよび第二の側面に基づくデコーダを有するデコード/エンコード・システムを提案する。
本稿の開示は、オーディオ信号のパラメトリックな空間的符号化のためのシステムにおいて使用されるパラメータの知覚的に最適化された量子化を論じる。下記で考察される例では、2チャネル信号についてのパラメトリック・ステレオ符号化の特殊な場合が論じられる。同じ技法は、パラメトリックなマルチチャネル符号化において、たとえば5-3-5モードで動作するシステムにおいて使用されることもできる。そのようなシステムの例示的実施形態は、図7に概要が示されており、下記で簡単に論じる。ここに呈示される例示的実施形態は、知覚されるオーディオ品質に影響することなくこれらのパラメータを伝達するために必要とされるビットレートの低減を許容するとともに、スカラー・パラメータについての確立されたエントロピー符号化技法(時間または周波数差分符号化に続けてハフマン符号化など)を続けて使うことを許容する単純な非一様量子化に関する。
パラメータa(図1では104aとして参照される)およびb(図1では104bとして参照される)を生成する。さらに、エンコーダ部分110は、モノ・ダウンミックス103をビットストリーム105に変換するダウンミックス・エンコーダ114(DMXEnc)と、量子化されたステレオ・パラメータのストリーム106を生成するステレオ・パラメータ量子化手段116(Q)と、デコーダ部分120に伝達される、量子化されたステレオ・パラメータをも含む最終的なビットストリーム108を生成するマルチプレクサ118(MUX)とを有する。デコーダ部分120は、はいってくる該最終的なビットストリーム108を受領して、ビットストリーム105および量子化されたステレオ・パラメータのストリーム106を再生成するデマルチプレクサ122(DE-MUX)と、ビットストリーム105を受領してデコードされたモノ・ダウンミックス103’(M')を出力するダウンミックス・デコーダ124(DMXDec)と、量子化されたステレオ・パラメータ106のストリームを受領して、量子化解除されたステレオ・パラメータa' 104a’およびb' 104b’を出力するステレオ・パラメータ量子化解除手段126(Q')と、最後に、デコードされたモノ・ダウンミックス103’および量子化解除されたステレオ・パラメータ104a’、104b’を受領してこれらのはいってくる信号を再構成されたステレオ信号101’(L')および102’(R')に変換するACPLデコーダ128とを有する。
M=(L+R)/2 (式1)
S=(L−R)/2 (式2)
に従ってモノ・ダウンミックス103(M)およびサイド信号(S)を計算する。
S'=a'*M'+b'*decorr(M') (式3)
に従ってサイド信号の近似を再構成するための入力として使われる。
L'=M'+S' (式4)
R'=M'−S' (式5)
として計算される。
上記の記述を吟味すれば、当業者には本開示のさらなる実施形態が明白になるであろう。本稿および図面は実施形態および例を開示しているが、本開示はこれらの個別的な例に制約されるものではない。付属の請求項によって定義される本開示の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
いくつかの態様を記載しておく。
〔態様1〕
オーディオ信号のパラメトリックな空間的符号化に関係するパラメータの量子化のためのオーディオ・エンコーダにおける方法であって:
少なくとも、量子化されるべき第一のパラメータおよび第二のパラメータを受領する段階と;
非一様なきざみサイズをもつ第一のスカラー量子化方式に基づいて前記第一のパラメータを量子化して、量子化された第一のパラメータを得る段階であって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、段階と;
前記第一のスカラー量子化方式を使って前記量子化された第一のパラメータを量子化解除して、前記第一のパラメータの近似である量子化解除された第一のパラメータを得る段階と;
量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定する段階と;
前記スケーリング因子および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化して、量子化された第二のパラメータを得る段階とを含む、
方法。
〔態様2〕
前記スケーリング関数は区分線形関数である、態様1記載の方法。
〔態様3〕
前記スケーリング因子および前記第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化する段階は、前記第二のパラメータを前記第二のスカラー量子化方式に基づく量子化にかける前に、前記第二のパラメータを前記スケーリング因子で割ることを含む、態様1または2記載の方法。
〔態様4〕
前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二のパラメータの量子化の前に、前記スケーリング因子によってスケーリングされる、態様1または2記載の方法。
〔態様5〕
前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二のパラメータの値とともに増大する、態様1ないし4のうちいずれか一項記載の方法。
〔態様6〕
前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式より多くの量子化きざみを含む、態様1ないし5のうちいずれか一項記載の方法。
〔態様7〕
前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式をオフセットし、ミラーリングし、連結することによって構築される、態様1ないし6のうちいずれか一項記載の方法。
〔態様8〕
前記第一および/または第二のスカラー量子化方式の最大のきざみサイズは、前記第一および/または第二のスカラー量子化方式の最小のきざみサイズの約4倍の大きさである、態様1ないし7のうちいずれか一項記載の方法。
〔態様9〕
処理機能を有する装置で実行されたときに態様1ないし8のうちいずれか一項記載の方法を実行するよう適応されたコンピュータ・コード命令を有するコンピュータ可読媒体。
〔態様10〕
オーディオ信号のパラメトリックな空間的符号化に関係するパラメータの量子化のためのオーディオ・エンコーダであって:
少なくとも、量子化されるべき第一のパラメータおよび第二のパラメータを受領するよう構成された受領コンポーネントと;
非一様なきざみサイズをもつ第一のスカラー量子化方式に基づいて前記第一のパラメータを量子化して量子化された第一のパラメータを得るよう構成された、前記受領コンポーネントの下流に配置された第一の量子化コンポーネントであって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、第一の量子化コンポーネントと;
前記第一の量子化コンポーネントから前記第一の量子化されたパラメータを受領し、前記第一のスカラー量子化方式を使って前記量子化された第一のパラメータを量子化解除して、前記第一のパラメータの近似である量子化解除された第一のパラメータを得るよう構成された量子化解除コンポーネントと;
前記量子化解除された第一のパラメータを受領し、量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定するよう構成されたスケーリング因子決定コンポーネントと;
前記第二のパラメータおよび前記スケーリング因子を受領して、前記スケーリング因子および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化して、量子化された第二のパラメータを得るよう構成された第二の量子化コンポーネントとを有する、
オーディオ・エンコーダ。
〔態様11〕
オーディオ信号のパラメトリックな空間的符号化に関係する量子化されたパラメータの量子化解除のためのオーディオ・デコーダにおける方法であって:
少なくとも、第一の量子化されたパラメータおよび第二の量子化されたパラメータを受領する段階と;
非一様なきざみサイズをもつ第一のスカラー量子化方式に従って前記量子化された第一のパラメータを量子化解除して量子化解除された第一のパラメータを得る段階であって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、段階と;
量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定する段階と;
前記スケーリング関数および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記第二の量子化されたパラメータを量子化解除して、量子化解除された第二のパラメータを得る段階とを含む、
方法。
〔態様12〕
前記スケーリング関数は区分線形関数である、態様11記載の方法。
〔態様13〕
前記スケーリング因子および前記第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化解除する段階は、前記第二のスカラー量子化方式に従って前記第二の量子化されたパラメータを量子化解除し、その結果に前記スケーリング因子を乗算することを含む、態様11または12記載の方法。
〔態様14〕
前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二の量子化されたパラメータの量子化解除の前に、前記スケーリング因子によってスケーリングされる、態様11または12記載の方法。
〔態様15〕
前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二のパラメータの値とともに増大する、態様11ないし14のうちいずれか一項記載の方法。
〔態様16〕
前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式より多くの量子化きざみを含む、態様11ないし15のうちいずれか一項記載の方法。
〔態様17〕
前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式をオフセットし、ミラーリングし、連結することによって構築される、態様11ないし16のうちいずれか一項記載の方法。
〔態様18〕
前記第一および/または第二のスカラー量子化方式の最大のきざみサイズは、前記第一および/または第二のスカラー量子化方式の最小のきざみサイズの約4倍の大きさである、態様11ないし17のうちいずれか一項記載の方法。
〔態様19〕
処理機能を有する装置によって実行されたときに態様11ないし18のうちいずれか一項記載の方法を実行するよう適応されたコンピュータ・コード命令を有するコンピュータ可読媒体。
〔態様20〕
オーディオ信号のパラメトリックな空間的符号化に関係する量子化されたパラメータの量子化解除のためのオーディオ・デコーダであって:
少なくとも、第一の量子化されたパラメータおよび第二の量子化されたパラメータを受領するよう構成された受領コンポーネントと;
前記受領コンポーネントの下流に配置され、非一様なきざみサイズをもつ第一のスカラー量子化方式に従って前記量子化された第一のパラメータを量子化解除して量子化解除された第一のパラメータを得るよう構成された第一の量子化解除コンポーネントであって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、第一の量子化解除コンポーネントと;
前記第一の量子化解除コンポーネントから前記量子化解除された第一のパラメータを受領し、量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定するよう構成されたスケーリング因子決定コンポーネントと;
前記スケーリング因子および前記第二の量子化されたパラメータを受領し、前記スケーリング因子および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記第二の量子化されたパラメータを量子化解除して、量子化解除された第二のパラメータを得るよう構成された第二の量子化解除コンポーネントとを有する、
オーディオ・デコーダ。
〔態様21〕
態様10記載のエンコーダおよび態様20記載のオーディオ・デコーダを有するオーディオ・エンコード/デコード・システムであって、前記オーディオ・エンコーダが前記第一および第二の量子化されたパラメータを前記オーディオ・デコーダに伝送するよう構成されている、システム。
Claims (21)
- オーディオ信号のパラメトリックな空間的符号化に関係するパラメータの量子化のためのオーディオ・エンコーダにおける方法であって:
少なくとも、量子化されるべき第一のパラメータおよび第二のパラメータを受領する段階と;
非一様なきざみサイズをもつ第一のスカラー量子化方式に基づいて前記第一のパラメータを量子化して、量子化された第一のパラメータを得る段階であって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、段階と;
前記第一のスカラー量子化方式を使って前記量子化された第一のパラメータを量子化解除して、前記第一のパラメータの近似である量子化解除された第一のパラメータを得る段階と;
量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定する段階と;
前記スケーリング因子および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化して、量子化された第二のパラメータを得る段階とを含む、
方法。 - 前記スケーリング関数は区分線形関数である、請求項1記載の方法。
- 前記スケーリング因子および前記第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化する段階は、前記第二のパラメータを前記第二のスカラー量子化方式に基づく量子化にかける前に、前記第二のパラメータを前記スケーリング因子で割ることを含む、請求項1または2記載の方法。
- 前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二のパラメータの量子化の前に、前記スケーリング因子によってスケーリングされる、請求項1または2記載の方法。
- 前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二のパラメータの値とともに増大する、請求項1ないし4のうちいずれか一項記載の方法。
- 前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式より多くの量子化きざみを含む、請求項1ないし5のうちいずれか一項記載の方法。
- 前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式をオフセットし、ミラーリングし、連結することによって構築される、請求項1ないし6のうちいずれか一項記載の方法。
- 前記第一および/または第二のスカラー量子化方式の最大のきざみサイズは、前記第一および/または第二のスカラー量子化方式の最小のきざみサイズの約4倍の大きさである、請求項1ないし7のうちいずれか一項記載の方法。
- 処理機能を有する装置で実行されたときに請求項1ないし8のうちいずれか一項記載の方法を実行するよう適応されたコンピュータ・コード命令を有するコンピュータ可読媒体。
- オーディオ信号のパラメトリックな空間的符号化に関係するパラメータの量子化のためのオーディオ・エンコーダであって:
少なくとも、量子化されるべき第一のパラメータおよび第二のパラメータを受領するよう構成された受領コンポーネントと;
非一様なきざみサイズをもつ第一のスカラー量子化方式に基づいて前記第一のパラメータを量子化して量子化された第一のパラメータを得るよう構成された、前記受領コンポーネントの下流に配置された第一の量子化コンポーネントであって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、第一の量子化コンポーネントと;
前記第一の量子化コンポーネントから前記量子化された第一のパラメータを受領し、前記第一のスカラー量子化方式を使って前記量子化された第一のパラメータを量子化解除して、前記第一のパラメータの近似である量子化解除された第一のパラメータを得るよう構成された量子化解除コンポーネントと;
前記量子化解除された第一のパラメータを受領し、量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定するよう構成されたスケーリング因子決定コンポーネントと;
前記第二のパラメータおよび前記スケーリング因子を受領して、前記スケーリング因子および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記第二のパラメータを量子化して、量子化された第二のパラメータを得るよう構成された第二の量子化コンポーネントとを有する、
オーディオ・エンコーダ。 - オーディオ信号のパラメトリックな空間的符号化に関係する量子化されたパラメータの量子化解除のためのオーディオ・デコーダにおける方法であって:
少なくとも、量子化された第一のパラメータおよび量子化された第二のパラメータを受領する段階と;
非一様なきざみサイズをもつ第一のスカラー量子化方式に従って前記量子化された第一のパラメータを量子化解除して量子化解除された第一のパラメータを得る段階であって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、段階と;
量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定する段階と;
前記スケーリング因子および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記量子化された第二のパラメータを量子化解除して、量子化解除された第二のパラメータを得る段階とを含む、
方法。 - 前記スケーリング関数は区分線形関数である、請求項11記載の方法。
- 前記スケーリング因子および非一様なきざみサイズをもつ前記第二のスカラー量子化方式に基づいて前記量子化された第二のパラメータを量子化解除して、量子化解除された第二のパラメータを得る段階は、前記第二のスカラー量子化方式に従って前記量子化された第二のパラメータを量子化解除し、その結果に前記スケーリング因子を乗算して、前記量子化解除された第二のパラメータを得ることを含む、請求項11または12記載の方法。
- 前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記量子化された第二のパラメータの量子化解除の前に、前記スケーリング因子によってスケーリングされる、請求項11または12記載の方法。
- 前記第二のスカラー量子化方式の前記非一様なきざみサイズは、前記第二のパラメータの値とともに増大する、請求項11ないし14のうちいずれか一項記載の方法。
- 前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式より多くの量子化きざみを含む、請求項11ないし15のうちいずれか一項記載の方法。
- 前記第一のスカラー量子化方式は、前記第二のスカラー量子化方式をオフセットし、ミラーリングし、連結することによって構築される、請求項11ないし16のうちいずれか一項記載の方法。
- 前記第一および/または第二のスカラー量子化方式の最大のきざみサイズは、前記第一および/または第二のスカラー量子化方式の最小のきざみサイズの約4倍の大きさである、請求項11ないし17のうちいずれか一項記載の方法。
- 処理機能を有する装置によって実行されたときに請求項11ないし18のうちいずれか一項記載の方法を実行するよう適応されたコンピュータ・コード命令を有するコンピュータ可読媒体。
- オーディオ信号のパラメトリックな空間的符号化に関係する量子化されたパラメータの量子化解除のためのオーディオ・デコーダであって:
少なくとも、量子化された第一のパラメータおよび量子化された第二のパラメータを受領するよう構成された受領コンポーネントと;
前記受領コンポーネントの下流に配置され、非一様なきざみサイズをもつ第一のスカラー量子化方式に従って前記量子化された第一のパラメータを量子化解除して量子化解除された第一のパラメータを得るよう構成された第一の量子化解除コンポーネントであって、人間の音知覚が最も敏感な前記第一のパラメータの範囲についてはより小さなきざみサイズが使われ、人間の音知覚がそれほど敏感でない前記第一のパラメータの範囲についてはより大きなきざみサイズが使われるように前記非一様なきざみサイズが選択される、第一の量子化解除コンポーネントと;
前記第一の量子化解除コンポーネントから前記量子化解除された第一のパラメータを受領し、量子化解除された第一のパラメータの値を、量子化解除された第一のパラメータの値に対応するきざみサイズとともに増大するスケーリング因子に対してマッピングするスケーリング関数にアクセスして、前記量子化解除された第一のパラメータに前記スケーリング関数の作用を受けさせることによってスケーリング因子を決定するよう構成されたスケーリング因子決定コンポーネントと;
前記スケーリング因子および前記量子化された第二のパラメータを受領し、前記スケーリング因子および非一様なきざみサイズをもつ第二のスカラー量子化方式に基づいて前記量子化された第二のパラメータを量子化解除して、量子化解除された第二のパラメータを得るよう構成された第二の量子化解除コンポーネントとを有する、
オーディオ・デコーダ。 - 請求項10記載のエンコーダおよび請求項20記載のオーディオ・デコーダを有するオーディオ・エンコード/デコード・システムであって、前記オーディオ・エンコーダが前記量子化された第一および第二のパラメータを前記オーディオ・デコーダに伝送するよう構成されている、システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361877166P | 2013-09-12 | 2013-09-12 | |
US61/877,166 | 2013-09-12 | ||
PCT/EP2014/069040 WO2015036349A1 (en) | 2013-09-12 | 2014-09-08 | Non-uniform parameter quantization for advanced coupling |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016531327A JP2016531327A (ja) | 2016-10-06 |
JP6201057B2 true JP6201057B2 (ja) | 2017-09-20 |
Family
ID=51518765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016541900A Active JP6201057B2 (ja) | 2013-09-12 | 2014-09-08 | 先進的結合のための非一様パラメータ量子化 |
Country Status (23)
Country | Link |
---|---|
US (7) | US9672837B2 (ja) |
EP (2) | EP3321932B1 (ja) |
JP (1) | JP6201057B2 (ja) |
KR (1) | KR101777631B1 (ja) |
CN (1) | CN105531763B (ja) |
AR (3) | AR097618A1 (ja) |
AU (1) | AU2014320538B2 (ja) |
BR (1) | BR112016005192B1 (ja) |
CA (1) | CA2922256C (ja) |
CL (1) | CL2016000571A1 (ja) |
DK (1) | DK3044788T3 (ja) |
ES (1) | ES2645839T3 (ja) |
HK (2) | HK1220037A1 (ja) |
IL (1) | IL244153A (ja) |
MX (1) | MX356805B (ja) |
MY (1) | MY187124A (ja) |
NO (1) | NO2996227T3 (ja) |
PL (1) | PL3044788T3 (ja) |
RU (1) | RU2628898C1 (ja) |
SG (1) | SG11201601144WA (ja) |
TW (1) | TWI579831B (ja) |
UA (1) | UA116482C2 (ja) |
WO (1) | WO2015036349A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3067887A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
RU2725178C1 (ru) * | 2016-11-08 | 2020-06-30 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для кодирования или декодирования многоканального сигнала с использованием коэффициента передачи побочного сигнала и коэффициента передачи остаточного сигнала |
GB2559200A (en) | 2017-01-31 | 2018-08-01 | Nokia Technologies Oy | Stereo audio signal encoder |
GB2559199A (en) * | 2017-01-31 | 2018-08-01 | Nokia Technologies Oy | Stereo audio signal encoder |
WO2019020757A2 (en) | 2017-07-28 | 2019-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | APPARATUS FOR ENCODING OR DECODING A MULTI-CHANNEL SIGNAL ENCODED USING A FILLING SIGNAL GENERATED BY A BROADBAND FILTER |
US11328735B2 (en) * | 2017-11-10 | 2022-05-10 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
US10827173B2 (en) * | 2017-11-13 | 2020-11-03 | Electronics And Telecommunications Research Institute | Method and apparatus for quantization |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
US10559315B2 (en) | 2018-03-28 | 2020-02-11 | Qualcomm Incorporated | Extended-range coarse-fine quantization for audio coding |
US10762910B2 (en) | 2018-06-01 | 2020-09-01 | Qualcomm Incorporated | Hierarchical fine quantization for audio coding |
GB2590651A (en) * | 2019-12-23 | 2021-07-07 | Nokia Technologies Oy | Combining of spatial audio parameters |
CN113206673B (zh) * | 2021-05-24 | 2024-04-02 | 上海海事大学 | 用于网络化控制系统信号量化的差分缩放方法及终端 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL9100173A (nl) * | 1991-02-01 | 1992-09-01 | Philips Nv | Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting. |
US6253165B1 (en) | 1998-06-30 | 2001-06-26 | Microsoft Corporation | System and method for modeling probability distribution functions of transform coefficients of encoded signal |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
JP4714416B2 (ja) | 2002-04-22 | 2011-06-29 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 空間的オーディオのパラメータ表示 |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
JP4245606B2 (ja) * | 2003-06-10 | 2009-03-25 | 富士通株式会社 | 音声符号化装置 |
KR100554680B1 (ko) * | 2003-08-20 | 2006-02-24 | 한국전자통신연구원 | 크기 변화에 강인한 양자화 기반 오디오 워터마킹 장치 및방법 |
JP4303135B2 (ja) * | 2004-01-09 | 2009-07-29 | 独立行政法人科学技術振興機構 | 歪みあり符号方法及び装置、歪みあり符号化プログラム及び記録媒体 |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
SE0402650D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
US7751572B2 (en) | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
ES2297825T3 (es) | 2005-04-19 | 2008-05-01 | Coding Technologies Ab | Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales. |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
WO2009048239A2 (en) | 2007-10-12 | 2009-04-16 | Electronics And Telecommunications Research Institute | Encoding and decoding method using variable subband analysis and apparatus thereof |
ATE500588T1 (de) * | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
ATE538469T1 (de) * | 2008-07-01 | 2012-01-15 | Nokia Corp | Vorrichtung und verfahren zum justieren von räumlichen hinweisinformationen eines mehrkanaligen audiosignals |
WO2010075895A1 (en) | 2008-12-30 | 2010-07-08 | Nokia Corporation | Parametric audio coding |
BR122019023877B1 (pt) | 2009-03-17 | 2021-08-17 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
CN101673549B (zh) * | 2009-09-28 | 2011-12-14 | 武汉大学 | 一种移动音源空间音频参数预测编解码方法及系统 |
WO2011073600A1 (fr) | 2009-12-18 | 2011-06-23 | France Telecom | Codage/decodage parametrique stereo avec optimisation du traitement de reduction des canaux |
GB2485979A (en) * | 2010-11-26 | 2012-06-06 | Univ Surrey | Spatial audio coding |
PT2697795E (pt) * | 2011-04-15 | 2015-09-25 | Ericsson Telefon Ab L M | Utilização conjunta adaptativa de taxas de ganho/forma |
RU2464649C1 (ru) * | 2011-06-01 | 2012-10-20 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ обработки звукового сигнала |
-
2014
- 2014-08-20 TW TW103128646A patent/TWI579831B/zh active
- 2014-09-08 BR BR112016005192-0A patent/BR112016005192B1/pt active IP Right Grant
- 2014-09-08 RU RU2016108327A patent/RU2628898C1/ru active
- 2014-09-08 WO PCT/EP2014/069040 patent/WO2015036349A1/en active Application Filing
- 2014-09-08 AU AU2014320538A patent/AU2014320538B2/en active Active
- 2014-09-08 PL PL14761831T patent/PL3044788T3/pl unknown
- 2014-09-08 UA UAA201602283A patent/UA116482C2/uk unknown
- 2014-09-08 ES ES14761831.8T patent/ES2645839T3/es active Active
- 2014-09-08 CN CN201480050109.4A patent/CN105531763B/zh active Active
- 2014-09-08 EP EP17185212.2A patent/EP3321932B1/en active Active
- 2014-09-08 JP JP2016541900A patent/JP6201057B2/ja active Active
- 2014-09-08 DK DK14761831.8T patent/DK3044788T3/da active
- 2014-09-08 CA CA2922256A patent/CA2922256C/en active Active
- 2014-09-08 KR KR1020167006488A patent/KR101777631B1/ko active IP Right Grant
- 2014-09-08 SG SG11201601144WA patent/SG11201601144WA/en unknown
- 2014-09-08 MY MYPI2016700684A patent/MY187124A/en unknown
- 2014-09-08 EP EP14761831.8A patent/EP3044788B1/en active Active
- 2014-09-08 MX MX2016002793A patent/MX356805B/es active IP Right Grant
- 2014-09-08 US US14/916,534 patent/US9672837B2/en active Active
- 2014-09-10 AR ARP140103377A patent/AR097618A1/es active IP Right Grant
-
2015
- 2015-08-19 NO NO15181552A patent/NO2996227T3/no unknown
-
2016
- 2016-02-16 IL IL244153A patent/IL244153A/en active IP Right Grant
- 2016-03-10 CL CL2016000571A patent/CL2016000571A1/es unknown
- 2016-07-11 HK HK16108093.1A patent/HK1220037A1/zh unknown
-
2017
- 2017-05-02 US US15/584,534 patent/US10057808B2/en active Active
-
2018
- 2018-05-21 HK HK18106609.0A patent/HK1247432A1/zh unknown
- 2018-08-10 US US16/101,220 patent/US10383003B2/en active Active
-
2019
- 2019-06-27 US US16/454,649 patent/US10694424B2/en active Active
- 2019-07-19 AR ARP190102045A patent/AR115819A2/es active IP Right Grant
- 2019-07-19 AR ARP190102046A patent/AR115820A2/es active IP Right Grant
-
2020
- 2020-06-19 US US16/905,920 patent/US11297533B2/en active Active
-
2022
- 2022-04-01 US US17/711,191 patent/US11838798B2/en active Active
-
2023
- 2023-11-06 US US18/503,083 patent/US20240155427A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6201057B2 (ja) | 先進的結合のための非一様パラメータ量子化 | |
US8180061B2 (en) | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding | |
US7719445B2 (en) | Method and apparatus for encoding/decoding multi-channel audio signal | |
TWI584271B (zh) | 編碼裝置及其編碼方法、解碼裝置及其解碼方法、電腦程式 | |
JP6105159B2 (ja) | オーディオ・エンコーダおよびデコーダ | |
US20200160872A1 (en) | Encoding And Decoding Methods, And Encoding And Decoding Apparatuses For Stereo Signal | |
KR20170078663A (ko) | 오디오 신호의 파라메트릭 믹싱 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170523 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170727 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170801 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170828 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6201057 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |