JP7157736B2 - サブバンドエネルギー平滑化を伴う変換ベースのオーディオコーデック及び方法 - Google Patents
サブバンドエネルギー平滑化を伴う変換ベースのオーディオコーデック及び方法 Download PDFInfo
- Publication number
- JP7157736B2 JP7157736B2 JP2019511895A JP2019511895A JP7157736B2 JP 7157736 B2 JP7157736 B2 JP 7157736B2 JP 2019511895 A JP2019511895 A JP 2019511895A JP 2019511895 A JP2019511895 A JP 2019511895A JP 7157736 B2 JP7157736 B2 JP 7157736B2
- Authority
- JP
- Japan
- Prior art keywords
- transform
- smoothing
- audio signal
- matrix
- frequency transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000009499 grossing Methods 0.000 title claims description 128
- 238000000034 method Methods 0.000 title claims description 82
- 239000011159 matrix material Substances 0.000 claims description 79
- 230000005236 sound signal Effects 0.000 claims description 56
- 239000013598 vector Substances 0.000 claims description 45
- 230000009466 transformation Effects 0.000 claims description 39
- 238000012545 processing Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 22
- 230000003595 spectral effect Effects 0.000 claims description 10
- 230000002441 reversible effect Effects 0.000 claims description 6
- 238000012856 packing Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 10
- 238000013139 quantization Methods 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000005192 partition Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
エネルギー平滑化を伴う変換ベースのコーデック及び方法の実施形態は、符号化中、ベクトル量子化によって引き起こされるアーティファクトを低減及び軽減するのに使用される。このことは、オーディオ信号の周波数変換係数に直交変換及びベクトル置換の組み合わせを適用することによって達成される。ここで、コーデック及び方法の実施形態の概要を説明する。
図3は、図1に示すエネルギー平滑化を伴う変換ベースのエンコーダの実施形態の詳細事項を示すブロック図である。図3に示されるように、エンコーダ110は、直交変換及び置換システム300を含み、これは、以下で詳細に説明される。エンコーダ110への入力は、オーディオ信号140である。この信号140は、直交変換及び置換システム300に入力される周波数変換係数ブロック310を含む。幾つかの実施形態では、これらの周波数変換係数ブロック310は、正規化された修正離散コサイン変換(MDCT)係数である。
上述したように、符号化されたビットストリーム150は、格納、又は送信、或いはその両方が行われる。次に、符号化されたビットストリーム150は、エネルギー平滑化を伴う変換ベースのデコーダ120を含む受信デバイスに配信されて、レンダリングされる。図4は、図1に示すエネルギー平滑化を伴う変換ベースのデコーダの実施形態の詳細を示すブロック図である。デコーダ120は、周波数変換係数に適用される直交変換及びベクトル置換の逆の動作を行う逆直交変換及び置換システム400を含む。これは以下で詳細に説明される。
ここで、エネルギー平滑化を伴う変換ベースのコーデック及び方法の詳細を説明する。多くの変形形態が実施可能であり、当業者は、本明細書の開示内容に基づいて同じ結果を達成できる他の多くの方法を理解するであろう点に留意されたい。
図5は、図3に示される直交変換及び置換システム300の実施形態を示す詳細なブロック図である。図5は、システム300及び本明細書に含まれる方法の例示的な実施形態を示しており、多数の変形形態が、図5に示されるものから実施可能であることに留意されたい。時間領域においてオーディオ信号に対して実行される何らかのフィルタリング、プリエンファシス、又はその他の何らかの動作は、オーディオ信号がシステム300によって処理される前に実行されることに留意されたい。
図6は、置換システム500と相互作用する直交変換システム510の実施形態を示す詳細なブロック図である。具体的には、図6は、これらの実施形態においてインターリービングである置換と、変換との組み合わせが、どのようにして周波数サブバンド又はパーティションに適用されるかを示している。図6に示されるこれらの実施形態では、係数ベクトルの長さは、Mの整数倍であると仮定されており、ここで、Mは、変換行列のサイズである。図6に示される例示的な実施形態では、Mの大きさは4に等しい。更に、図6に示される実施形態では、置換システム500は、最初に、周波数変換係数を処理し、続いて直交変換システム510が処理する。
幾つかの実施形態では、変換行列は、部分アダマール行列の種類からのタイプのものである。この行列は、変換行列に関して上記及び下記で与えられた要件を満たす。
具体的には、この行列は、
であるように直交し、エネルギーは、適切な正規化を用いて保存され制御可能である。
変換パラメータxは、サブバンドの長さN、サブバンドをベクトル量子化するのに使用されるパルス数K、並びに所望の平滑化レベルに対する設定値である平滑化パラメータsの関数として計算される。数学的には、変換パラメータは、以下のように記述することができる。
s(低)=0.35、s(中)=0.45、s(高)=0.75
で与えられる。平滑化レベルは、デコーダ120に伝達され、エンコーダ110及びデコーダ120の両方は、平滑化パラメータsを使用して、変換パラメータxに関する全く同じ値を導出する。
幾つかの実施形態では、置換システム500は、インターリービングを実行する。インターリービングは、与えられたルールに従ってベクトルの係数(又は要素)を再配列するプロセスである。幾つかの実施形態では、このルールは決定論的であり、他の実施形態では、このルールは確率論的である。当業者に知られているように、インターリービングは、幾つかの方法で実行することができる。
エネルギー平滑化決定ブロック520の実施形態は、エネルギー平滑化を適用すべきか否かを決定し、その場合、どの程度の平滑化を適用すべきかを決定する。幾つかの実施形態では、平滑化を適用するか否かについての決定は、フレーム又はサブバンドごとにエンコーダ110にて決定される。幾つかの実施形態では、この決定は、高域周波数スペクトルの解析に基づいており、このスペクトルが、音調構造又はノイズのような構造を有するか否かを測定することを伴う。
この解析を定量化するために、平坦度尺度は、サブバンドごとに計算され、特定の閾値を上回る(例えば、2kHzを上回る)サブバンドにわたって平均化される。平均平坦度尺度が閾値を下回る場合には、エネルギー平滑化は、そのサブバンドには適用されない。他方、平均平坦度尺度が、閾値に等しいか又はそれを上回る場合には、エネルギー平滑化が、サブバンドに適用される。
を使用して所与のサブバンドに対して計算され、ここで、Kは、サブバンドの長さ(ビン単位)であり、
は、所与のMDCTビンの正規化された(絶対)値であり、以下の式
で与えられ、ここで、X(k)は、ビンkにおけるMDCTの値である。
従って、この尺度は、サブバンドごとに計算され、単一の測定値をもたらすために全てのサブバンド及びチャネルにわたって平均化され、平均平坦度尺度(又は「平坦」)である。幾つかの実施形態では、この尺度に基づいて、平滑化決定は、以下の経験則から決定され、
((「平坦度」<1.19))の場合、「平滑化決定」=「なし」(エネルギー平滑化が適用されない)であり、
((「平坦度」>=1.19)かつ「平坦度」<1.25))の場合、「平滑化決定」=「低」であり、
((「平坦度」>=1.25)かつ「平坦度」<1.48))の場合、「平滑化決定」=「中」であり、
((「平坦度」>=1.48))の場合、「平滑化決定」=「高」である。
更に別の実施形態では、スペクトルのスパース性尺度が、平滑化レベルを決定するのに使用される。上記と同様に、このスパース性尺度は、以下の式、すなわち、
を使用してサブバンドごとにエンコーダ上で計算され、ここで、
及び
である。
図8は、図1及び図3に示されるエネルギー平滑化を伴う変換ベースのエンコーダ110の動作の実施形態を示すフローチャートである。この動作は、入力としてオーディオ信号140を受信することで始まる(ボックス800)。オーディオ信号140は、この実施例では正規化された修正離散コサイン変換(MDCT)係数である周波数変換係数ブロック310を含む(ボックス810)。
図9は、図4に示される逆直交変換及び置換システム400の実施形態を示す詳細なブロック図である。図9は、システム400及び本明細書に含まれる方法の例示的な実施形態を示しており、図9に示されるものから、多数の変形形態が実施可能であることに留意されたい。
図10は、逆置換システム910と相互作用する逆直交変換システム900の実施形態を示す詳細なブロック図である。具体的には、図10は、これらの実施形態においてデインターリービングである逆置換と逆変換との組み合わせが、どのようにして周波数サブバンド又はパーティションに適用されるかを示している。図10に示されるこれらの実施形態では、係数ベクトルの長さは、Mの整数倍であると仮定されており、ここで、Mは、変換行列のサイズである。図10に示される例示的な実施形態では、Mの大きさは、4に等しい。更に、図10に示される例示的な実施形態では、逆直交変換システム900は、最初に周波数変換係数を処理した後、逆置換システム910が処理する。
を使用して計算される。
を利用することによって計算される。次に、デコーダは、逆変換行列を適用する。これは、逆置換(この実施例では、デインターリービングである)の後又は前に行われる。
図11は、行列ベースのデインターリービングを使用して逆置換を適用する例示的な実施形態を示している。これは、図7に示されるインターリービング動作と反対又は逆の動作である。このデインターリービングは、デコーダ120上での逆置換システム910によって実行される。この実施例では、長さP×4のシーケンスは、4列及びP行の逆行列を使用してデインターリーブされる。図11に示されるように、デインターリービングの際に、行列は、列方向に充填され、行方向に読み取られる。
図12は、図1及び図4に示されるエネルギー平滑化を伴う変換ベースのデコーダ120の動作の実施形態を示すフローチャートである。この動作は、符号化されたビットストリーム150を入力として受け取ることで始まる(ボックス1200)。符号化されたビットストリームに逆量子化が適用される(ボックス1210)。また、符号化されたビットストリーム150は、エンコーダ110からデコーダ120に渡される平滑化パラメータを含む。デコーダ120は、この平滑化パラメータから平滑化レベルを読み取る(ボックス1220)。
直交変換システム510及び置換システム500の代替の実施形態が可能である。一例として、図13は、拡張された元のシーケンス1300がMの倍数ではない場合における、置換システム500と相互作用する直交変換システム510の実施形態を示す詳細なブロック図である。具体的には、図13は、係数ベクトルの長さが、M(Mは変換行列のサイズである)の倍数でない場合、これらの実施形態ではインターリービングである置換と変換との組み合わせが、どのようにして周波数サブバンド又はパーティションに適用されるかを示している。図13に示される実施例では、M=4であり、シーケンス1300の長さは、18個の係数である。
110 エンコーダ
130 コンテンツ生成環境
135 マイクロホン
140 オーディオ信号
150 符号化されたビットストリーム
160 配信環境
165 ネットワーク
170 媒体
175 符号化されて送信されたビットストリーム
180 復元されたオーディオ信号
185 再生環境
190 リスナー
Claims (20)
- オーディオ信号を処理するための方法であって、該方法は、
エンコーダを使用して、前記オーディオ信号の周波数変換係数に直交変換及びベクトル置換を適用して、処理された周波数変換係数を生成する段階と、
前記処理された周波数変換係数を量子化して、処理されて量子化された周波数変換係数を生成する段階と、
前記処理されて量子化された周波数変換係数を、符号化されたビットストリームにパックする段階と、
デコーダを使用して、前記符号化されたビットストリームを処理して、前記エンコーダの逆の動作を行って前記オーディオ信号を復元する段階と、
を含む方法。 - 前記直交変換のサイズは、4より大きいか又はそれに等しい任意の2の累乗である、請求項1に記載の方法。
- 前記直交変換及びベクトル置換を前記周波数変換係数に一回のみ適用する段階を更に含む、請求項1に記載の方法。
- 前記直交変換及びベクトル置換を前記周波数変換係数に複数回適用する段階を更に含む、請求項1に記載の方法。
- 前記直交変換は可変であり、少なくとも1つのコーデックメトリックの関数である平滑化パラメータによって前記直交変換を制御する段階を更に含む、請求項1に記載の方法。
- 前記ベクトル置換の置換処理されたシーケンスのサイズは、前記直交変換のサイズより大きいか又はそれに等しい任意の値である、請求項1に記載の方法。
- 前記周波数変換係数を含む周波数変換係数ベクトルに前記ベクトル置換を適用して、置換ルールに従って、前記周波数変換係数ベクトルの要素を再配列する段階を更に含み、前記周波数変換係数ベクトルがベクトル長を有する、請求項1に記載の方法。
- サイズMの変換行列である前記直交変換を前記周波数変換係数ベクトルに適用する段階を更に含む、請求項7に記載の方法。
- 前記周波数変換係数ベクトルのM個の点に一度に前記変換行列を適用する段階を更に含み、前記ベクトル長はMより大きいか又はそれに等しい、請求項8に記載の方法。
- 音楽ノイズアーティファクトを軽減するようにオーディオ信号を符号化するための方法であって、該方法は、
前記オーディオ信号を複数の周波数サブバンドに分割する段階と、
各サブバンドに関する変換行列を計算する段階と、
前記変換行列を使用して、4より大きいか又はそれに等しい任意の2の累乗であるサイズの直交変換を各サブバンドにおける周波数変換係数に適用し、前記周波数変換係数にインターリービングを適用して処理された周波数変換係数を得る段階と、
音楽アーティファクトが軽減されるように、前記処理された周波数変換係数をベクトル量子化して、該周波数変換係数を前記オーディオ信号を表し符号化されたビットストリームにビットパックする段階と、
を含む方法。 - 各サブバンドに関するスペクトル平坦度を計算する段階と、
前記スペクトル平坦度から、各サブバンドに適用されるエネルギー平滑化の量を表すエネルギー平滑化レベルを含む平滑化パラメータを決定する段階と、
を更に含む、請求項10に記載の方法。 - 前記符号化されたビットストリーム内の前記平滑化パラメータをエンコーダからデコーダに送信する段階を更に含む、請求項11に記載の方法。
- 前記平滑化パラメータを使用して前記変換行列を計算する段階を更に含む、請求項11に記載の方法。
- 各サブバンドに関する前記変換行列を計算する段階は更に、
前記平滑化パラメータ、処理されるサブバンドの長さ、及びベクトル量子化器のパルス数の関数として変換パラメータを計算する段階と、
前記変換パラメータを使用して前記変換行列を計算する段階と、
を含む、請求項13に記載の方法。 - 前記直交変換は、最初に前記周波数変換係数に適用され、前記インターリービングは、前記直交変換が適用された後に適用される、請求項10に記載の方法。
- 前記インターリービングは、最初に前記周波数変換係数に適用され、前記直交変換は、前記インターリービングが適用された後に適用される、請求項10に記載の方法。
- オーディオ信号を表し符号化されたビットストリームを復号するための方法であって、該方法は、
前記符号化されたビットストリームを受け取る段階と、
前記オーディオ信号の各サブバンドに逆変換行列及び逆置換を適用して、復元された周波数変換係数を得る段階と、
前記オーディオ信号を復元して、復元されたオーディオ信号を得る段階と、
前記復元されたオーディオ信号を再生デバイス上で再生する段階と、
を含む方法。 - 各サブバンドに適用されるエネルギー平滑化のレベルを含む平滑化パラメータを、前記符号化されたビットストリームと共に受け取る段階と、
前記平滑化パラメータを使用して、前記逆変換行列を生成するのに使用される変換行列を計算する段階と、
を更に含む、請求項17に記載の方法。 - 前記変換行列を逆にして前記逆変換行列を得る段階と、
前記エネルギー平滑化のレベルに従って前記逆変換行列を適用する段階と、
を更に含む、請求項18に記載の方法。 - 前記符号化されたビットストリームを符号化したエンコーダによって適用される順序と逆の順序で前記逆変換行列及び逆置換を適用する段階を更に含む、請求項17に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/253,646 US10146500B2 (en) | 2016-08-31 | 2016-08-31 | Transform-based audio codec and method with subband energy smoothing |
US15/253,646 | 2016-08-31 | ||
PCT/US2017/049484 WO2018045099A1 (en) | 2016-08-31 | 2017-08-30 | Transform-based audio codec and method with subband energy smoothing |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019532329A JP2019532329A (ja) | 2019-11-07 |
JP7157736B2 true JP7157736B2 (ja) | 2022-10-20 |
Family
ID=61242318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019511895A Active JP7157736B2 (ja) | 2016-08-31 | 2017-08-30 | サブバンドエネルギー平滑化を伴う変換ベースのオーディオコーデック及び方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10146500B2 (ja) |
EP (1) | EP3507800B1 (ja) |
JP (1) | JP7157736B2 (ja) |
KR (1) | KR102553003B1 (ja) |
CN (1) | CN109983535B (ja) |
WO (1) | WO2018045099A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10366698B2 (en) | 2016-08-30 | 2019-07-30 | Dts, Inc. | Variable length coding of indices and bit scheduling in a pyramid vector quantizer |
US10586546B2 (en) | 2018-04-26 | 2020-03-10 | Qualcomm Incorporated | Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding |
US10573331B2 (en) * | 2018-05-01 | 2020-02-25 | Qualcomm Incorporated | Cooperative pyramid vector quantizers for scalable audio coding |
WO2024085903A1 (en) * | 2022-10-20 | 2024-04-25 | Google Llc | Non-windowed dct-based audio coding using advanced quantization |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000132193A (ja) | 1998-10-22 | 2000-05-12 | Sony Corp | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
JP2004004710A (ja) | 2002-04-11 | 2004-01-08 | Matsushita Electric Ind Co Ltd | 符号化装置および復号化装置 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3047562B2 (ja) * | 1991-10-23 | 2000-05-29 | 松下電器産業株式会社 | 高能率符号化方法及びその装置 |
EP0692881B1 (en) * | 1993-11-09 | 2005-06-15 | Sony Corporation | Quantization apparatus, quantization method, high efficiency encoder, high efficiency encoding method, decoder, high efficiency encoder and recording media |
TW321810B (ja) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
JPH10276095A (ja) * | 1997-03-28 | 1998-10-13 | Toshiba Corp | 符号化器及び復号化器 |
DK1173925T3 (da) * | 1999-04-07 | 2004-03-29 | Dolby Lab Licensing Corp | Matriksforbedringer til tabsfri kodning og dekodning |
US7536305B2 (en) * | 2002-09-04 | 2009-05-19 | Microsoft Corporation | Mixed lossless audio compression |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
AU2005239628B2 (en) * | 2005-01-14 | 2010-08-05 | Microsoft Technology Licensing, Llc | Reversible 2-dimensional pre-/post-filtering for lapped biorthogonal transform |
US7546240B2 (en) * | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
US7751488B2 (en) * | 2006-08-16 | 2010-07-06 | Harris Corporation | System and method for communicating data using symbol-based randomized orthogonal frequency division multiplexing (OFDM) |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8428957B2 (en) * | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
ATE535904T1 (de) | 2007-08-27 | 2011-12-15 | Ericsson Telefon Ab L M | Verbesserte transformationskodierung von sprach- und audiosignalen |
RU2010116748A (ru) | 2007-09-28 | 2011-11-10 | Войсэйдж Корпорейшн (Ca) | Способ и устройство для эффективного квантования данных, преобразуемых во встроенных речевых и аудиокодеках |
EP2304719B1 (en) | 2008-07-11 | 2017-07-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, methods for providing an audio stream and computer program |
TWI435317B (zh) * | 2009-10-20 | 2014-04-21 | Fraunhofer Ges Forschung | 音訊信號編碼器、音訊信號解碼器、用以提供音訊內容之編碼表示型態之方法、用以提供音訊內容之解碼表示型態之方法及使用於低延遲應用之電腦程式 |
RU2554554C2 (ru) * | 2011-01-25 | 2015-06-27 | Ниппон Телеграф Энд Телефон Корпорейшн | Способ кодирования, кодер, способ определения величины периодического признака, устройство определения величины периодического признака, программа и носитель записи |
US8838442B2 (en) | 2011-03-07 | 2014-09-16 | Xiph.org Foundation | Method and system for two-step spreading for tonal artifact avoidance in audio coding |
US8731949B2 (en) * | 2011-06-30 | 2014-05-20 | Zte Corporation | Method and system for audio encoding and decoding and method for estimating noise level |
US20130132100A1 (en) | 2011-10-28 | 2013-05-23 | Electronics And Telecommunications Research Institute | Apparatus and method for codec signal in a communication system |
SG194706A1 (en) | 2012-01-20 | 2013-12-30 | Fraunhofer Ges Forschung | Apparatus and method for audio encoding and decoding employing sinusoidalsubstitution |
EP2720222A1 (en) | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
RU2625945C2 (ru) * | 2013-01-29 | 2017-07-19 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для генерирования сигнала с улучшенным спектром, используя операцию ограничения энергии |
KR101757347B1 (ko) | 2013-01-29 | 2017-07-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 지각적 변환 오디오 코딩에서의 노이즈 채움 |
TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
-
2016
- 2016-08-31 US US15/253,646 patent/US10146500B2/en active Active
-
2017
- 2017-08-30 KR KR1020197008368A patent/KR102553003B1/ko active IP Right Grant
- 2017-08-30 WO PCT/US2017/049484 patent/WO2018045099A1/en unknown
- 2017-08-30 JP JP2019511895A patent/JP7157736B2/ja active Active
- 2017-08-30 EP EP17847510.9A patent/EP3507800B1/en active Active
- 2017-08-30 CN CN201780066489.4A patent/CN109983535B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000132193A (ja) | 1998-10-22 | 2000-05-12 | Sony Corp | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
JP2004004710A (ja) | 2002-04-11 | 2004-01-08 | Matsushita Electric Ind Co Ltd | 符号化装置および復号化装置 |
Also Published As
Publication number | Publication date |
---|---|
KR102553003B1 (ko) | 2023-07-06 |
CN109983535A (zh) | 2019-07-05 |
EP3507800B1 (en) | 2024-01-24 |
EP3507800A4 (en) | 2020-04-29 |
JP2019532329A (ja) | 2019-11-07 |
KR20190042058A (ko) | 2019-04-23 |
EP3507800A1 (en) | 2019-07-10 |
CN109983535B (zh) | 2023-09-12 |
US10146500B2 (en) | 2018-12-04 |
WO2018045099A1 (en) | 2018-03-08 |
US20180060023A1 (en) | 2018-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2933734C (en) | Coding independent frames of ambient higher-order ambisonic coefficients | |
JP7157736B2 (ja) | サブバンドエネルギー平滑化を伴う変換ベースのオーディオコーデック及び方法 | |
US9516446B2 (en) | Scalable downmix design for object-based surround codec with cluster analysis by synthesis | |
US9761229B2 (en) | Systems, methods, apparatus, and computer-readable media for audio object clustering | |
JP6439296B2 (ja) | 復号装置および方法、並びにプログラム | |
JP5400143B2 (ja) | オーバーラッピング変換の2つのブロック変換への因数分解 | |
US8838442B2 (en) | Method and system for two-step spreading for tonal artifact avoidance in audio coding | |
JP7123910B2 (ja) | インデックスコーディング及びビットスケジューリングを備えた量子化器 | |
US20150332683A1 (en) | Crossfading between higher order ambisonic signals | |
JP7257965B2 (ja) | デジタルオーディオ信号における差分データ | |
KR102032073B1 (ko) | 채널 기반의 오디오로부터 hoa로의 컨버전 | |
US20120232908A1 (en) | Methods and systems for avoiding partial collapse in multi-block audio coding | |
KR102677399B1 (ko) | 신호 처리 장치 및 방법, 그리고 프로그램 | |
JP2023072027A (ja) | 復号装置および方法、並びにプログラム | |
KR101464977B1 (ko) | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 | |
JP2011257575A (ja) | 音声処理装置、音声処理方法、プログラムおよび記録媒体 | |
KR20090030085A (ko) | 메모리 관리 방법 및 메모리 시스템 | |
JP2000250598A (ja) | 音声データ復号化装置、音声データ復号化方法及び記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200826 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210921 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210927 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20211227 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220628 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220907 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221007 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7157736 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |