JP7003253B2 - エンコーダおよび/またはデコーダの帯域幅の制御 - Google Patents
エンコーダおよび/またはデコーダの帯域幅の制御 Download PDFInfo
- Publication number
- JP7003253B2 JP7003253B2 JP2020524579A JP2020524579A JP7003253B2 JP 7003253 B2 JP7003253 B2 JP 7003253B2 JP 2020524579 A JP2020524579 A JP 2020524579A JP 2020524579 A JP2020524579 A JP 2020524579A JP 7003253 B2 JP7003253 B2 JP 7003253B2
- Authority
- JP
- Japan
- Prior art keywords
- bandwidth
- encoder
- decoder
- frequency domain
- tools
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 71
- 230000003595 spectral effect Effects 0.000 claims description 44
- 238000007493 shaping process Methods 0.000 claims description 34
- 238000012545 processing Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 5
- 230000001052 transient effect Effects 0.000 claims description 5
- 230000011664 signaling Effects 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 description 39
- 238000013139 quantization Methods 0.000 description 30
- 238000001514 detection method Methods 0.000 description 17
- 239000013598 vector Substances 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000005311 autocorrelation function Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000009499 grossing Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000011551 log transformation method Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3059—Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
- H03M7/3062—Compressive sampling or sensing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3066—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction by means of a mask or a bit-map
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6005—Decoder aspects
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6011—Encoder aspects
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本実施例は、特にオーディオ信号などの情報信号のためのエンコーダおよびデコーダおよびこれらの装置の方法に関する。
[1]3GPP EVSコーデック、http://www.3gpp.org/ftp//Specs/archive/26_series/26.445/26445-e10.zip、セクション5.1.6「帯域幅検出」
実施例によれば、エンコーダ装置が提供され、エンコーダ装置は、
情報信号を符号化するための複数の周波数領域、FD、エンコーダツールであって、情報信号は複数のフレームを表すエンコーダツール、および
複数のFDエンコーダツールの少なくともサブグループの帯域幅を選択するように構成されたエンコーダ帯域幅検出器およびコントローラを含み、サブグループは、サブグループのFDエンコーダツールの少なくとも1つが、サブグループにないFDエンコーダツールの少なくとも1つとは異なる帯域幅を有するように、情報信号特性に基づいて、複数のFDエンコーダツールよりも少ないFDエンコーダツールを含む。
NB、WB帯域幅に対応する1データビット
NB、WB、SSWB帯域幅に対応する2データビット
NB、WB、SSWB、SWB帯域幅に対応する2データビット
NB、WB、SSWB、SWB、FB帯域幅に対応する3データビット。
によって実行され、ここで、
はMDCT(またはMDST…)係数であり、
はバンドの数であり、
はバンドに関連付けられたインデックスである。
という形式になり、ここで、ggはグローバル利得、
はノイズレベルが推定されるスペクトル線の識別、および
は信号(例えば、MDCTまたはMDSTまたはTNS後の別のFDスペクトル)を指す。
FDデコーダツールは
少なくとも1つのFDデコーダツールを含むサブグループ、
少なくとも1つのFDデコーダツールを含む残りのFDデコーダツール、に分割されており、
ここで、デコーダ装置は、サブグループの複数のデコーダツールの少なくとも1つが、複数のデコーダツールの残りのFDデコーダツールの少なくとも1つとは異なる帯域幅で信号処理するように構成される。
残りのFDデコーダツールの少なくとも1つに共通の少なくとも第1の帯域幅、および
第1の帯域幅とは異なる少なくとも第2の帯域幅の間で制御するように構成され得る。
があってもよく、
は、ビットストリーム内の帯域幅情報に基づいて得られる。
ここで、
はTNSデコーダの出力であり、
はTNSデコーダの入力であり、
、
、
は、ビットストリーム内の帯域幅情報に基づいて得られる。
この文書に記載されている発明は、帯域幅検出器が誤った結果を返す場合でも、スペクトルホールの発生を回避することを可能にする。特に、オーディオコーディングアプリケーションのためのソフトバンドスイッチングが得られてもよい。
5.1 帯域幅の検出とツールの制御
情報信号(例えば、オーディオ信号)は、時間領域、TDで、異なる離散時刻(n)で取得された一連のサンプル(例えば、x(n))として記述できる。TD表現は、それぞれが複数のサンプル(例えば、フレームごとに2048サンプル)に関連付けられている複数のフレームから作成することができる。周波数領域、FDでは、フレームは、それぞれが特定の周波数に関連付けられている一連のビン(例えば、X(k))として表すことができる(各周波数はインデックスkに関連付けられている)。
情報信号を符号化するための複数の周波数領域、FD、エンコーダツール(31~36)であって、情報信号は複数のフレームを表す、エンコーダツール、および
サブグループのFDエンコーダツールの少なくとも1つ(例えば、33、36)が、サブグループにないFDエンコーダツールの少なくとも1つ(例えば、31、32、34、35)とは異なる帯域幅を持つように、情報信号の特性に基づいて、複数のFDエンコーダツールの少なくともサブグループ(例えば、TNSツール33、およびノイズレベル推定ツール36)の帯域幅を(例えば、S63で)選択するように構成されたエンコーダ帯域幅検出器およびコントローラ39を含む。
FDデコーダツールは
少なくとも1つのFDデコーダツール(例えば、43、45)を含むサブグループ、
少なくとも1つのFDデコーダツールを含む残りのFDデコーダツール(例えば、44、46、48a)に分割されており、
ここで、デコーダ装置40または40aは、ビットストリームに含まれる帯域幅情報に基づいて、サブグループ(例えば、43、45)の複数のデコーダツールの少なくとも1つの帯域幅を選択するように構成され、それによりサブグループの複数のデコーダツールの1つ(例えば、43、45)は、複数のデコーダツールの残りのFDデコーダツールの少なくとも1つ(例えば、44、46、48a)とは異なる帯域幅で信号処理を実行する。
FD動作のサブグループのための帯域幅を選択するステップ(例えば、S61b)、
FD動作のサブグループのための帯域幅で第1の信号処理動作を実行するステップ(例えば、S62b)、
サブグループにないFD動作のための異なる帯域幅で第2の信号処理動作を実行するステップ(例えば、S63b)を含む。
制御データに基づいてFD動作のサブグループのための帯域幅選択を選択するステップ(S61c)、
FD動作のサブグループのための帯域幅で第1の信号処理動作を実行するステップ(S62c)、
サブグループにないFD動作のための異なる帯域幅で第2の信号処理動作を実行するステップ(S63c)を含む。
のような方程式を使用して、帯域ごとのエネルギーを検出することができ、ここで、
はMDCTまたはMDST係数(またはFD内の信号の他の表現)であり、
(例えば64)は帯域の数であり、
は帯域に関連付けられたインデックスである(各インデックスはビンに関連付けられている)。
は、合計が
より小さい場合は1、合計が
より大きい場合は0のバイナリ値である。特定の帯域幅
に関連付けられている
は、エネルギー値の合計が特定の帯域幅
の閾値未満(およびその他の場合は「0」)である場合の静粛性を(例えば、論理値「1」によって)示す。合計は、さまざまなインデックス(例えば、ビンまたは帯域ごとのエネルギー)におけるエネルギー値の合計に関連しており、例えば
は、インデックス
に関連付けられた帯域幅の最初のインデックスからインデックス
に関連付けられた帯域幅の最後のインデックスまでである。調べた帯域幅の数は
である。
の場合に停止することがある(エネルギーが帯域幅
の閾値より大きい場合)。
の場合、スペクトルのカットオフ特性を示すフラグ
は、
によって検出することができ、ここで、
はカットオフ特性を確認する必要がある帯域間の距離、つまり
を定義する。
パラメータの帯域幅
(帯域幅選択情報)を使用して、例えばデコーダでTNSおよびノイズフィリングツールを制御し、信号39aを具体化することができる。パラメータ
は、記憶および/またはビット数
を使用してビットストリームで送信されてもよい。特に、ビット数は必ずしも一定ではなく、選択されたサンプルレート
に応じて変化する可能性があるため、必要のない場合はビットストリームのペイロードが減る。
NBおよびWB帯域幅(の1つの選択の通知)に対応する1つのデータビット
NB、WB、およびSSWB帯域幅(の1つの選択の通知)に対応する2データビット
NB、WB、SSWB、およびSWB帯域幅(の1つの選択の通知)に対応する2データビット
NB、WB、SSWB、SWB、およびFB帯域幅(の1つの選択の通知)に対応する3データビット。
が、TNSおよびノイズフィリング動作のための制御情報を自動的に知ることが可能である。例えば、
は帯域幅の下限に関連付けられた開始インデックスを参照する場合があり、
は帯域幅の上限に関連付けられた最終インデックスを参照する場合がある。したがって、帯域幅の選択と、この選択に基づくパラメータは、表1などの表から導出できる。
の場合、帯域幅検出器は不要であり、
および
である。つまり、パラメータ
はビットストリームに配置されない。しかしながら、デコーダは、選択された帯域幅が(例えば、表1の電子バージョンなどの電子機器に基づいて)NBであることを理解するであろう。
(39a)などの情報は、符号化され、デコーダ装置40または40aに送信することができ、それにより、デコーダノイズ推定器ツール43およびTNSデコーダツール45は、選択された帯域幅に関する情報を利用する。
、での静粛性の検出に関する情報などの1つ以上を含んでもよい。
修正離散コサイン変換(MDCT)または修正離散サイン変換(MDST)(または別の変調ラップ変換)ツール31は、TDのデジタル表現をFDのデジタル表現に変換することができる。それにもかかわらず、他の例(ラップ変換などの他の変換に基づく可能性がある)は、使用されてもよい。ここに例を示す。
の入力信号
は
オーディオサンプルで構成されてもよく、最新のものは
にある。過去のフレームのオーディオサンプルは、負のインデックスによってアクセスされ、例えば
は前のフレームの最新のものである。
は、
・
・
(一貫性のために初期化が必要)
に従って更新され得る。
時間サンプルのブロックは、以下の方程式
を使用して周波数係数
に変換でき、ここで、
は使用されているフレームサイズに応じた低遅延MDCTウィンドウである。ウィンドウは
で最適化され、異なるフレームサイズの他のバージョンが補間によって生成され得る。ウィンドウの形状は、最適化手順の結果であってもよく、ポイントごとに提供され得る。
線形予測コーディング(LPC)分析は、LPCツール32によって実行され得る。LPCは、線形予測モデルの情報を使用して、デジタル信号のスペクトルエンベロープを圧縮形式で表すために使用される。
は、
を使用して周波数領域に変換でき、ここで
は変換の長さである。この変換は、プルーニングFFTを使用して効率的に実装できることに注意されたい。次に、
の実数部と虚数部が抽出される。
LSFは、次の疑似コードで説明できる
および
のゼロクロッシング検索によって得られる
LPCシェーピングは、MDCTまたはMDSTスペクトルに変換された重み付けされた量子化LPフィルタ係数から計算された利得係数を適用することにより、MDCTまたはMDST(FD)ドメインで実行できる。
LPCシェーピング利得を計算するには、まず重み付けされたLPフィルタ係数
を、奇数DFTを使用して周波数領域に変換する。
LPCシェーピング利得
は、
の絶対値として得られる。
LPCシェーピング利得
は、次のコードで概説されるように、シェーピングされたスペクトル
を生成するために、各帯域のMDCTまたはMDST周波数ラインに個別に適用できる
図4aを参照すると、スペクトルノイズシェーパツール32aを使用することが可能である。
帯域あたりのエネルギー
は、
のように計算でき、
はMDCT(またはMDST、または別の変換)係数であり、
は帯域の数であり、
は帯域インデックスである。帯域は不均一で、知覚的に関連するバルク尺度に従う場合がある(低周波数では小さく、高周波数では大きくなる)。
に現れる可能性のある不安定性を平滑化するために使用できる。平滑化されていない場合、これらの不安定性は、特にエネルギーが0に近い谷で、対数領域に変換すると増幅される(ステップ5を参照)。
次に、帯域あたりの平滑化されたエネルギー
は、
を使用してプリエンファシスされ、
はプリエンファシスの傾きを制御し、サンプリング周波数に依存する。例えば、16KHzで18、48KHzで30である。このステップで使用されるプリエンファシスは、従来技術2のLPCベースの知覚フィルタで使用されるプリエンファシスと同じ目的を持ち、低周波数で整形スペクトルの振幅を増加させ、結果として低周波における量子化ノイズを低減する。
にローパスフィルタ(w(k))を適用する。このローパスフィルタは、心理音響モデルで使用される拡散関数と同様の効果があり、ピークでの量子化ノイズを低減するが、その代わりに知覚的にマスクされているピーク周辺の量子化ノイズが増加する。
最終的なスケール係数は、平均の除去と0.85の係数によるスケーリングの後に得られる。
コーデックには追加のグローバル利得があるため、情報を失うことなく平均値を除去できる。平均を除去すると、ベクトル量子化がより効率的になる。0.85のスケーリングは、ノイズシェーピングカーブの振幅をわずかに圧縮する。これは、ステップ6で説明した拡散関数と同様の知覚効果があり、ピークでの量子化ノイズの低減と、谷での量子化ノイズの増加である。
図7は、エンコーダ30または30aのTNSツール33などのTNSツールの動作を示す方法70を示す。
に対して繰り返すことができ、
である(num_filtersは、表2で与えられている)。反射係数を提供する他のTNS分析動作を実行できる。
のように計算でき、それぞれについて
(例えば)であり、
ここで
および
であり、
および
は表2で与えられている。
は、スペクトルサブセクションのエネルギー合計である(各フィルタのスタート周波数とストップ周波数との間の正規化係数)。
をオン/オフにする決定を実行することができる。
の場合、TNSフィルタ
をオンにし、ここで
であり、予測利得は、
のように計算できる。
について、(例えば、ステップS72で得られるような)反射係数が量子化されてもよい。例えば、アークサインドメインでのスカラー均一量子化を使用できる。
および/または
ここで、
および
は、例えば、最も近い整数への丸め関数であり、
は量子化器の出力インデックス、
は量子化された反射係数である。
は、例えば
のアルゴリズムを使用してフィルタリングでき、
ここで
は、TNSフィルタ処理されたMDCTまたはMDSTスペクトルである。
ここでは、スペクトル量子化ツール34について説明する。TNSフィルタリング(
)後のMDCTまたはMDSTスペクトルは、不感帯および均一閾値スカラー量子化を使用して量子化され、量子化されたMDCTまたはMDSTスペクトル
は、算術符号化を使用して符号化される。グローバル利得
は、量子化器のステップサイズを制御する。このグローバル利得は7ビットで量子化され、量子化されたグローバル利得インデックス
は、例えば0~127の整数になる。グローバル利得インデックスは、量子化されたMDCTまたはMDSTスペクトルを符号化するために必要なビット数が、利用可能なビットバジェットにできるだけ近くなるように選択できる。
によって与えられ、
は元の情報信号に対して1つのTDフレームで使用可能なビット数であり、
は表1によって提供され、
はTNS(現在のフレームでTNSによって消費されるビットの総数)によって提供され、
はLTPF 38b(LTPFによって消費されるビット数)に関連しており、例えば、
、
および
である。実施例では、保護ビット(例えば、巡回冗長コード、CRC、ビット)も考慮に入れることができる。
次に、量子化されたMDCTまたはMDSTスペクトルを符号化するために必要なビット数が、利用可能なビットバジェットにできるだけ近くなるように、グローバル利得インデックスを推定できる。この推定は、量子化されたスペクトルを符号化するために必要なビット数を大まかに概算する、複雑度の低い二分探索に基づいている。アルゴリズムは次のように説明できる
は、利用可能なビットバジェット
と比較できる。それらが互いに離れている場合、量子化されたグローバル利得インデックス
が調整され、スペクトルが再量子化される。量子化されたグローバル利得インデックス
を調整するために使用される手順を以下に示す
符号化されたデータのすべてまたは一部(TNSデータ、LTPFデータ、グローバル利得、量子化スペクトル…)は、例えば、任意のアルゴリズムによる圧縮によって、エントロピーコーディングできる。
ノイズ推定ツール36(ノイズレベル推定器)は、デコーダ側でのノイズフィリングを制御することができる。エンコーダ側では、ノイズレベルパラメータを推定、量子化、送信、またはビットストリームに記憶できる。
であるスペクトル係数に基づいて推定することができる。関連するスペクトル係数のインデックスは、
によって与えられ、ここで
は、ステップS62で検出された帯域幅および/または例えば以下の表で定義されている帯域幅検出器およびコントローラ39によって検出された帯域幅に依存し得る
後のスペクトルに基づいて推定され、グローバル利得によって正規化される。
最終的なノイズレベルは、8つのステップに量子化される。
したがって、ノイズレベル推定ツール36は、例えば帯域幅情報39aに基づいて、コントローラ39によって制御され得る。
符号化されたすべてのデータ(TNSデータ、LTPFデータ、グローバル利得、量子化スペクトル…)は、例えばデコーダツール42を使用して、デコーダ側でエントロピー復号できる。したがって、エンコーダによって提供されるビットストリームは、任意のアルゴリズムに従って解凍される。
ここでは、デコーダノイズフィリングツール43について説明する。デコーダノイズフィリングツール43は、とりわけ、デコーダ帯域幅コントローラ49によって(および/または、表1の制御データフィールドNbwおよび/またはPwbなどの、ビットストリームに符号化された情報39aを介してコントローラ39によって)制御され得る。
を使用して、識別された関連するスペクトルライン
に適用できる。
は、エンコーダ側のノイズ推定器で計算することができる。
は、ビットストリームのサイド情報としてコーディングされた3ビット値であってもよい。
は、例えば、次の手順を使用して得ることができる
は、ビットストリームの値として明示的に得られる。実施例では、パラメータ
は、エンコーダによって符号化されたビットストリームの制御フィールド内の帯域幅情報39a(Pbw)に基づいて、コントローラ49によって得られる。デコーダは、非一時的記憶ユニットに記憶された表3の電子バージョンを有することができる。したがって、ビットストリームの長さが短縮される。
ノイズフィリングが適用された後、例えば、
のような式を使用して、スペクトルにグローバル利得を適用でき、
ここで、
は、例えばエンコーダから得たグローバル利得インデックスである。
ここでは、MDCTまたはMDSTシェーピングツール46について説明する。LPCまたはSNSシェーピングは、MDCTまたはMDSTスペクトルに変換された、復号されたLPフィルタ係数から計算された利得係数を適用することにより、MDCT(FD)ドメインで実行できる。
LPCシェーピング利得を計算するには、まず復号されたLPフィルタ係数
を、奇数DFTを使用して周波数ドメインに変換する。
次に、LPCシェーピング利得
は、
の逆絶対値として計算される。
LPCシェーピング利得
は、例えば次のコードで概説されるように、シェーピングされたスペクトル
を生成するために、概説されているように各帯域のTNSフィルタ処理されたMDCT周波数ラインに個別に適用できる
以下のステップは、ノイズシェーパデコーダ、SNS、ツール46aで実行され得る。
エンコーダステップ8(セクション5.3.2を参照)で生成されたベクトル量子化インデックスは、ビットストリームから読み取られ、量子化されたスケール係数
を復号するために使用される。
セクション5.3.2のステップ9と同じである。
SNSスケール係数
は、以下のコードで概説されているように、復号されたスペクトル
を生成するために、各帯域の量子化されたMDCT(またはMDST、または別の変換)周波数ラインに個別に適用される。
5.12 デコーダでのMDCTまたはMDST合成
ここでは、逆MDCTまたはMDSTツール48aについて説明する(ラップ変換など、他の変換に基づく他のツールを使用できる)。
の生成
2.時間エイリアスバッファのウィンドウ処理
3.オーバーラップ加算演算を実行して、時間サンプル
を得る
ここで最初のフレームを復号する前に、
が0に初期化される。
図8aは、エンコーダ装置30または30aの少なくともいくつかのツールを実装し、および/または方法60および/または70の少なくともいくつかのステップを実行することができる装置110を示す。装置110は、プロセッサ111と、プロセッサ111によって実行されたときにプロセッサ111にエンコーダ装置30または30aのTDおよび/またはFDツールの少なくとも1つを実装させる命令を記憶する非一時的メモリユニット112とを含むことができる。特に、命令は、FDツール(例えば、TNSおよび/またはノイズフィリング)のサブグループおよびサブグループにない他のFDツール(例えば、31、32、34、35)を実装することができる。命令はまた、プロセッサ111によって実行されたときに、FDツールのサブグループ内のツール(例えば、TNSおよび/またはノイズフィリング)によって処理される信号の帯域幅が、サブグループにない他のFDツール(例えば、31、32、34、35)によって処理される信号の帯域幅と異なるように帯域幅の選択を実行する命令を含み得る。命令は、異なる帯域幅に関連するエネルギー検出に基づいて帯域幅選択を制御するようなものであり得る。命令はまた、プロセッサ111によって実行されたときに、デコーダを制御することを可能にし、特に、他のFDツールの帯域幅とは異なり得るFDツールのサブグループ(例えば、43、45)の帯域幅を制御することを可能にする命令を含み得る。エンコーダでサブグループ用に選択された帯域幅は、デコーダでサブグループ用に選択されたものと同じであってもよい。非一時的メモリユニット112は、表1、2、および/または3の電子バージョンの少なくとも一部などの他のデータも含み得る。装置110は、例えば、情報信号(例えば、オーディオ信号)から得られたビットストリームを記憶するための記憶スペース118を含み得る。装置110は、例えば、Bluetoothなどの特定のプロトコルを使用して、例えば無線でデータを送信するための出力ユニット117を含み得る。例えば、装置110は、非一時的メモリユニット112に記憶された命令を実行することによって、デコーダに送信されるビットストリームを定義することができる。装置110は、例えば、Bluetoothなどの特定のプロトコルを使用して、例えば無線でデータを得るための入力ユニット116も含み得る。
Claims (32)
- エンコーダ装置であって、
情報信号を符号化するための複数の周波数領域エンコーダツールであって、前記情報信号は複数のフレームを表すエンコーダツール、および
前記複数の周波数領域エンコーダツールの少なくともサブグループ(33、36)の帯域幅を選択するように構成されたエンコーダ帯域幅検出器およびコントローラ(39)を含み、前記サブグループ(33、36)は、前記サブグループ(33、36)の前記周波数領域エンコーダツールの少なくとも1つが、前記サブグループ(33、36)にない前記周波数領域エンコーダツールの少なくとも1つとは異なる帯域幅を有するように、情報信号特性に基づいて、前記複数の周波数領域エンコーダよりも少ない周波数領域エンコーダツールを含む、エンコーダ装置。 - 前記サブグループの少なくとも1つの周波数領域エンコーダツールは、一時的ノイズシェーピング、TNS、ツール(33)および/またはノイズレベル推定ツール(36)である、
請求項1に記載のエンコーダ装置。 - 前記サブグループ(33、36)にない少なくとも1つの周波数領域エンコーダツールは、線形予測コーディング、LPC、ベースのスペクトルシェーパ、スペクトルノイズシェーピング、SNS、ツール、スペクトル量子化器、および残差コーダの少なくとも1つから選択される、
請求項1または2に記載のエンコーダ装置。 - 前記エンコーダ帯域幅検出器およびコントローラ(39)は、前記サブグループにない前記周波数領域エンコーダツールの少なくとも1つに共通する少なくとも第1の帯域幅と、前記サブグループにない前記周波数領域エンコーダツールの前記少なくとも1つの前記帯域幅とは異なる第2の帯域幅との間で、前記サブグループ(33、36)の前記少なくとも1つの周波数領域エンコーダツールの前記帯域幅を選択するように構成される、
請求項1から3のいずれか一項に記載のエンコーダ装置。 - 前記エンコーダ帯域幅検出器およびコントローラ(39)は、前記情報信号に関する少なくとも1つのエネルギー推定に基づいて、前記複数の周波数領域エンコーダツールの前記少なくとも1つの前記帯域幅を選択するように構成される、
請求項1から4のいずれか一項に記載のエンコーダ装置。 - 前記エンコーダ帯域幅検出器およびコントローラ(39)は、前記複数の周波数領域エンコーダツールの前記少なくとも1つの前記帯域幅を制御するために、前記情報信号の帯域幅に関連する少なくとも1つのエネルギー推定をそれぞれの閾値と比較するように構成される、
請求項1から5のいずれか一項に記載のエンコーダ装置。 - 前記サブグループ(33、36)の前記複数の周波数領域エンコーダツールの前記少なくとも1つは、前記エンコーダ帯域幅検出器およびコントローラ(39)によって選択された前記帯域幅内でTNS入力信号を自己相関させるように構成されたTNSを含む、
請求項1から6のいずれか一項に記載のエンコーダ装置。 - 前記サブグループにない前記周波数領域エンコーダツールの前記少なくとも1つは、全帯域幅で動作するように構成される、請求項1から7のいずれか一項に記載のエンコーダ装置。
- 前記エンコーダ帯域幅検出器およびコントローラ(39)は、前記サブグループにない前記周波数領域エンコーダツールの前記少なくとも1つが動作するように構成されている前記全帯域幅内にある少なくとも1つの帯域幅を選択するように構成される、請求項8に記載のエンコーダ装置。
- 前記複数の周波数領域エンコーダツールの前記残りの周波数領域エンコーダツールの前記少なくとも1つは、前記エンコーダ帯域幅検出器およびコントローラ(39)によって選択された前記帯域幅に関してオープンチェーンで動作するように構成される、請求項1から9のいずれか一項に記載のエンコーダ装置。
- 前記エンコーダ帯域幅検出器およびコントローラ(39)は、有限数の帯域幅の中から、および/または事前定義された帯域幅のセットの中から、帯域幅を選択するように構成される、
請求項1から10のいずれか一項に記載のエンコーダ装置。 - 前記エンコーダ帯域幅検出器およびコントローラは(39)、以下の帯域幅4KHz、8KHz、12KHz、16KHz、および24KHz、および/またはNB、WB、SSWB、SWB、FBの少なくとも1つまたは組み合わせから選択を実行するように構成される、
請求項1から11のいずれか一項に記載のエンコーダ装置。 - 前記エンコーダ帯域幅検出器およびコントローラ(39)は、デコーダへの前記帯域幅のシグナリングを制御するように構成される、
請求項1から12のいずれか一項に記載のエンコーダ装置。 - 前記選択された帯域幅に関する情報を含む制御データフィールドを符号化するようにさらに構成される、
請求項1から13のいずれか一項に記載のエンコーダ装置。 - NB帯域幅に対応する0データビット、
NB、WB帯域幅に対応する1データビット、
NB、WB、SSWB帯域幅に対応する2データビット、
NB、WB、SSWB、SWB帯域幅に対応する2データビット、
NB、WB、SSWB、SWB、FB帯域幅に対応する3データビット、
を含む制御データフィールドを符号化するようにさらに構成される、
請求項1から14のいずれか一項に記載のエンコーダ装置。 - ビットストリームに符号化された情報信号を復号するための複数の周波数領域デコーダツール(43~48a)を含むデコーダ装置(40、40a)であって、
前記周波数領域デコーダツールは
少なくとも1つの周波数領域デコーダツール(43、45)を含むサブグループ、
少なくとも1つの周波数領域デコーダツール(44、46、48a)を含む残りの周波数領域デコーダツール、に分割されており、
ここで、前記デコーダ装置(40、40a)は、前記サブグループ(43、45)の前記複数のデコーダツールの少なくとも1つが、前記複数のデコーダツール(44、46、48a)の前記残りの周波数領域デコーダツールの少なくとも1つとは異なる帯域幅で信号処理するように構成される、デコーダ装置(40、40a)。 - 帯域幅情報に基づいて前記帯域幅を選択するように構成された帯域幅コントローラ(49)をさらに含む、
請求項19に記載のデコーダ装置。 - 前記サブグループは、デコーダノイズフィリングツール(43)および/または一時的ノイズシェーピング、TNS、デコーダ(45)の少なくとも1つを含む、
請求項19または20に記載のデコーダ装置。 - 前記残りの周波数領域デコーダツールの前記少なくとも1つは、デコーダ線形予測コーディング、LPC、ツール、スペクトルノイズシェーピング、SNS、ツール、デコーダグローバル利得ツール、MDCTまたはMDSTシェーピングツール、または別の変換に基づく別のシェーピングツールの少なくとも1つである、
請求項19から21のいずれか一項に記載のデコーダ装置。 - 前記サブグループ内の前記複数のデコーダツールの前記少なくとも1つの前記帯域幅を、
前記残りの周波数領域デコーダツールの少なくとも1つに共通の少なくとも第1の帯域幅、および
前記第1の帯域幅とは異なる少なくとも第2の帯域幅の間で制御するように構成される、
請求項19から22のいずれか一項に記載のデコーダ装置。 - 前記残りの周波数領域デコーダツールの前記少なくとも1つは、全帯域幅で動作するように構成される、請求項19から23のいずれか一項に記載のデコーダ装置。
- 前記残りの周波数領域デコーダツールの前記少なくとも1つは、前記選択された帯域幅に関してオープンチェーンで動作するように構成される、請求項20に記載のデコーダ装置。
- 有限数の帯域幅の中から、および/または事前定義された帯域幅のセットの中から、帯域幅を選択するようにさらに構成される、
請求項19から25のいずれか一項に記載のデコーダ。 - 8KHz、16KHz、24KHz、32KHz、および48KHz、および/またはNB、WB、SSWB、SWB、FBの少なくとも1つまたは組み合わせから選択を実行するようにさらに構成される、
請求項19から26のいずれか一項に記載のデコーダ。 - エンコーダ装置およびデコーダ装置を含むシステムであって、前記エンコーダ装置は請求項1から18のいずれかによる、および/または前記デコーダ装置は請求項19から29のいずれかによる、システム。
- 少なくとも複数の周波数領域動作に従って情報信号を符号化するための方法であってもよく、
周波数領域動作のサブグループのための帯域幅を選択するステップ、
周波数領域動作の前記サブグループのための前記帯域幅で第1の信号処理動作を実行するステップ、
前記サブグループにない周波数領域動作のための異なる帯域幅で第2の信号処理動作を実行するステップを含む、方法。 - 情報信号および制御データ(39a)を用いてビットストリームを復号するための方法であって、前記方法は、前記周波数領域における複数の信号処理動作を含み、
前記制御データ(39a)に基づいて周波数領域動作のサブグループのための帯域幅を選択するステップ、
周波数領域動作の前記サブグループのための前記帯域幅で第1の信号処理動作を実行するステップ、
前記サブグループにない周波数領域動作のための異なる帯域幅で第2の信号処理動作を実行するステップを含む、方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17201082.9 | 2017-11-10 | ||
EP17201082.9A EP3483882A1 (en) | 2017-11-10 | 2017-11-10 | Controlling bandwidth in encoders and/or decoders |
PCT/EP2018/080335 WO2019091977A1 (en) | 2017-11-10 | 2018-11-06 | Controlling bandwidth in encoders and/or decoders |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021502591A JP2021502591A (ja) | 2021-01-28 |
JP7003253B2 true JP7003253B2 (ja) | 2022-01-20 |
Family
ID=60301903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020524579A Active JP7003253B2 (ja) | 2017-11-10 | 2018-11-06 | エンコーダおよび/またはデコーダの帯域幅の制御 |
Country Status (18)
Country | Link |
---|---|
US (1) | US11462226B2 (ja) |
EP (2) | EP3483882A1 (ja) |
JP (1) | JP7003253B2 (ja) |
KR (1) | KR102426033B1 (ja) |
CN (1) | CN111344784B (ja) |
AR (1) | AR113479A1 (ja) |
AU (1) | AU2018363698B2 (ja) |
BR (1) | BR112020009034A2 (ja) |
CA (1) | CA3080907C (ja) |
ES (1) | ES2898281T3 (ja) |
MX (1) | MX2020004779A (ja) |
PL (1) | PL3707713T3 (ja) |
PT (1) | PT3707713T (ja) |
RU (1) | RU2752520C1 (ja) |
SG (1) | SG11202004171WA (ja) |
TW (1) | TWI691954B (ja) |
WO (1) | WO2019091977A1 (ja) |
ZA (1) | ZA202002082B (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112530444B (zh) * | 2019-09-18 | 2023-10-03 | 华为技术有限公司 | 音频编码方法和装置 |
CN113643713B (zh) * | 2021-10-13 | 2021-12-24 | 北京百瑞互联技术有限公司 | 一种蓝牙音频编码方法、装置及存储介质 |
Family Cites Families (183)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3639753A1 (de) | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
US5233660A (en) | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JPH05281996A (ja) | 1992-03-31 | 1993-10-29 | Sony Corp | ピッチ抽出装置 |
IT1270438B (it) | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
JP3402748B2 (ja) | 1994-05-23 | 2003-05-06 | 三洋電機株式会社 | 音声信号のピッチ周期抽出装置 |
JPH0811644A (ja) | 1994-06-27 | 1996-01-16 | Nissan Motor Co Ltd | ルーフモール取付構造 |
US6167093A (en) | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
DE69619284T3 (de) | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
US5781888A (en) | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
WO1997027578A1 (en) | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
US5812971A (en) | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JPH1091194A (ja) | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
AU9404098A (en) | 1997-09-23 | 1999-04-12 | Voxware, Inc. | Scalable and embedded codec for speech and audio signals |
JP3344962B2 (ja) | 1998-03-11 | 2002-11-18 | 松下電器産業株式会社 | オーディオ信号符号化装置、及びオーディオ信号復号化装置 |
US6507814B1 (en) | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7302396B1 (en) | 1999-04-27 | 2007-11-27 | Realnetworks, Inc. | System and method for cross-fading between audio streams |
US6735561B1 (en) | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US7099830B1 (en) | 2000-03-29 | 2006-08-29 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
EP1139665A1 (en) | 2000-03-29 | 2001-10-04 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for changing the output delay of audio or video data encoding |
US6665638B1 (en) | 2000-04-17 | 2003-12-16 | At&T Corp. | Adaptive short-term post-filters for speech coders |
US7395209B1 (en) | 2000-05-12 | 2008-07-01 | Cirrus Logic, Inc. | Fixed point audio decoding system and method |
WO2002101717A2 (en) | 2001-06-11 | 2002-12-19 | Ivl Technologies Ltd. | Pitch candidate selection method for multi-channel pitch detectors |
US7353168B2 (en) | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
US6785645B2 (en) | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7433824B2 (en) | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4287637B2 (ja) | 2002-10-17 | 2009-07-01 | パナソニック株式会社 | 音声符号化装置、音声符号化方法及びプログラム |
KR101049751B1 (ko) | 2003-02-11 | 2011-07-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
KR20030031936A (ko) | 2003-02-13 | 2003-04-23 | 배명진 | 피치변경법을 이용한 단일 음성 다중 목소리 합성기 |
US20040162866A1 (en) | 2003-02-19 | 2004-08-19 | Malvar Henrique S. | System and method for producing fast modulated complex lapped transforms |
ATE503246T1 (de) | 2003-06-17 | 2011-04-15 | Panasonic Corp | Empfangsvorrichtung, sendevorrichtung und übertragungssystem |
KR101058062B1 (ko) | 2003-06-30 | 2011-08-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 잡음 부가에 의한 디코딩된 오디오의 품질 개선 |
US7620545B2 (en) | 2003-07-08 | 2009-11-17 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
KR100550003B1 (ko) | 2003-07-11 | 2006-02-08 | 학교법인연세대학교 | 상호부호화기에서 개회로 피치 추정 방법 및 그 장치 |
WO2005027096A1 (en) | 2003-09-15 | 2005-03-24 | Zakrytoe Aktsionernoe Obschestvo Intel | Method and apparatus for encoding audio |
US7009533B1 (en) | 2004-02-13 | 2006-03-07 | Samplify Systems Llc | Adaptive compression and decompression of bandlimited signals |
KR20050087956A (ko) | 2004-02-27 | 2005-09-01 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
DE102004009949B4 (de) | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
WO2005086139A1 (en) | 2004-03-01 | 2005-09-15 | Dolby Laboratories Licensing Corporation | Multichannel audio coding |
DE102004009954B4 (de) | 2004-03-01 | 2005-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals |
JP4744438B2 (ja) | 2004-03-05 | 2011-08-10 | パナソニック株式会社 | エラー隠蔽装置およびエラー隠蔽方法 |
US7392195B2 (en) | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
KR100956877B1 (ko) | 2005-04-01 | 2010-05-11 | 콸콤 인코포레이티드 | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US7546240B2 (en) | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
KR20070037945A (ko) | 2005-10-04 | 2007-04-09 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
US20070118361A1 (en) | 2005-10-07 | 2007-05-24 | Deepen Sinha | Window apparatus and method |
KR100888474B1 (ko) | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US7805297B2 (en) | 2005-11-23 | 2010-09-28 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
US9123350B2 (en) | 2005-12-14 | 2015-09-01 | Panasonic Intellectual Property Management Co., Ltd. | Method and system for extracting audio features from an encoded bitstream for audio classification |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
CN101395661B (zh) | 2006-03-07 | 2013-02-06 | 艾利森电话股份有限公司 | 音频编码和解码的方法和设备 |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
ATE447227T1 (de) | 2006-05-30 | 2009-11-15 | Koninkl Philips Electronics Nv | Linear-prädiktive codierung eines audiosignals |
CN1983909B (zh) | 2006-06-08 | 2010-07-28 | 华为技术有限公司 | 一种丢帧隐藏装置和方法 |
US8015000B2 (en) | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
EP2054882B1 (en) | 2006-08-15 | 2011-01-19 | Dolby Laboratories Licensing Corporation | Arbitrary shaping of temporal noise envelope without side-information |
FR2905510B1 (fr) | 2006-09-01 | 2009-04-10 | Voxler Soc Par Actions Simplif | Procede d'analyse en temps reel de la voix pour le controle en temps reel d'un organe numerique et dispositif associe |
CN101140759B (zh) * | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
US7752038B2 (en) | 2006-10-13 | 2010-07-06 | Nokia Corporation | Pitch lag estimation |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
KR101292771B1 (ko) | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
JPWO2008072701A1 (ja) | 2006-12-13 | 2010-04-02 | パナソニック株式会社 | ポストフィルタおよびフィルタリング方法 |
FR2912249A1 (fr) | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
JP4871894B2 (ja) * | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
CN101308658B (zh) * | 2007-05-14 | 2011-04-27 | 深圳艾科创新微电子有限公司 | 一种基于片上系统的音频解码器及其解码方法 |
JP5618826B2 (ja) | 2007-06-14 | 2014-11-05 | ヴォイスエイジ・コーポレーション | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
JP4928366B2 (ja) | 2007-06-25 | 2012-05-09 | 日本電信電話株式会社 | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 |
JP4572218B2 (ja) | 2007-06-27 | 2010-11-04 | 日本電信電話株式会社 | 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体 |
US10795949B2 (en) | 2007-07-26 | 2020-10-06 | Hamid Hatami-Hanza | Methods and systems for investigation of compositions of ontological subjects and intelligent systems therefrom |
US20110116542A1 (en) | 2007-08-24 | 2011-05-19 | France Telecom | Symbol plane encoding/decoding with dynamic calculation of probability tables |
CN101790757B (zh) | 2007-08-27 | 2012-05-30 | 爱立信电话股份有限公司 | 语音与音频信号的改进的变换编码 |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
JP5547081B2 (ja) * | 2007-11-02 | 2014-07-09 | 華為技術有限公司 | 音声復号化方法及び装置 |
WO2009066869A1 (en) | 2007-11-21 | 2009-05-28 | Electronics And Telecommunications Research Institute | Frequency band determining method for quantization noise shaping and transient noise shaping method using the same |
KR101162275B1 (ko) | 2007-12-31 | 2012-07-04 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US8386271B2 (en) | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
CN102057424B (zh) | 2008-06-13 | 2015-06-17 | 诺基亚公司 | 用于经编码的音频数据的错误隐藏的方法和装置 |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
PL2346030T3 (pl) | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
MX2011000369A (es) | 2008-07-11 | 2011-07-29 | Ten Forschung Ev Fraunhofer | Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas. |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
TWI419148B (zh) | 2008-10-08 | 2013-12-11 | Fraunhofer Ges Forschung | 多解析度切換音訊編碼/解碼方案 |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
CA2750795C (en) | 2009-01-28 | 2015-05-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program |
JP4945586B2 (ja) | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
US20100223061A1 (en) | 2009-02-27 | 2010-09-02 | Nokia Corporation | Method and Apparatus for Audio Coding |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
FR2944664A1 (fr) | 2009-04-21 | 2010-10-22 | Thomson Licensing | Dispositif et procede de traitement d'images |
US8428938B2 (en) | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
US8352252B2 (en) | 2009-06-04 | 2013-01-08 | Qualcomm Incorporated | Systems and methods for preventing the loss of information within a speech frame |
KR20100136890A (ko) | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
ES2441069T3 (es) * | 2009-10-08 | 2014-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación |
WO2011044700A1 (en) | 2009-10-15 | 2011-04-21 | Voiceage Corporation | Simultaneous time-domain and frequency-domain noise shaping for tdac transforms |
WO2011048118A1 (en) | 2009-10-20 | 2011-04-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for providing an encoded representation of an audio content, method for providing a decoded representation of an audio content and computer program for use in low delay applications |
PT2491553T (pt) | 2009-10-20 | 2017-01-20 | Fraunhofer Ges Forschung | Codificador de áudio, descodificador de áudio, método para codificar uma informação de áudio, método para descodificar uma informação de áudio e programa de computador que utiliza uma redução iterativa de tamanho de intervalo |
US8207875B2 (en) | 2009-10-28 | 2012-06-26 | Motorola Mobility, Inc. | Encoder that optimizes bit allocation for information sub-parts |
US7978101B2 (en) | 2009-10-28 | 2011-07-12 | Motorola Mobility, Inc. | Encoder and decoder using arithmetic stage to compress code space that is not fully utilized |
KR101761629B1 (ko) | 2009-11-24 | 2017-07-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
MX2012008075A (es) | 2010-01-12 | 2013-12-16 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, metodo para codificar e informacion de audio, metodo para decodificar una informacion de audio y programa de computacion utilizando una modificacion de una representacion de un numero de un valor de contexto numerico previo. |
US20110196673A1 (en) | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
FR2961980A1 (fr) | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
EP3422346B1 (en) | 2010-07-02 | 2020-04-22 | Dolby International AB | Audio encoding with decision about the application of postfiltering when decoding |
ES2937066T3 (es) | 2010-07-20 | 2023-03-23 | Fraunhofer Ges Forschung | Decodificador de audio, procedimiento y programa informático para decodificación de audio |
US9082416B2 (en) | 2010-09-16 | 2015-07-14 | Qualcomm Incorporated | Estimating a pitch lag |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
AR085794A1 (es) | 2011-02-14 | 2013-10-30 | Fraunhofer Ges Forschung | Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral |
US9270807B2 (en) | 2011-02-23 | 2016-02-23 | Digimarc Corporation | Audio localization using audio signal encoding and recognition |
KR101748760B1 (ko) | 2011-03-18 | 2017-06-19 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치 |
MX2013012301A (es) * | 2011-04-21 | 2013-12-06 | Samsung Electronics Co Ltd | Aparato para cuantificar coeficientes de codificacion predictiva lineal, aparato de codificacion de sonido, aparato para decuantificar coeficientes de codificacion predictiva lineal, aparato de decodificacion de sonido y dispositivo electronico para los mismos. |
EP2707873B1 (en) | 2011-05-09 | 2015-04-08 | Dolby International AB | Method and encoder for processing a digital stereo audio signal |
FR2977439A1 (fr) | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
US9363339B2 (en) | 2011-07-12 | 2016-06-07 | Hughes Network Systems, Llc | Staged data compression, including block level long range compression, for data streams in a communications system |
FR2977969A1 (fr) | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
CN103493130B (zh) | 2012-01-20 | 2016-05-18 | 弗劳恩霍夫应用研究促进协会 | 用以利用正弦代换进行音频编码及译码的装置和方法 |
WO2013149672A1 (en) | 2012-04-05 | 2013-10-10 | Huawei Technologies Co., Ltd. | Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder |
US20130282373A1 (en) | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
US9026451B1 (en) | 2012-05-09 | 2015-05-05 | Google Inc. | Pitch post-filter |
WO2013183977A1 (ko) | 2012-06-08 | 2013-12-12 | 삼성전자 주식회사 | 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치 |
GB201210373D0 (en) | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
FR2992766A1 (fr) | 2012-06-29 | 2014-01-03 | France Telecom | Attenuation efficace de pre-echos dans un signal audionumerique |
CN106941004B (zh) | 2012-07-13 | 2021-05-18 | 华为技术有限公司 | 音频信号的比特分配的方法和装置 |
CN102779526B (zh) | 2012-08-07 | 2014-04-16 | 无锡成电科大科技发展有限公司 | 语音信号中基音提取及修正方法 |
US9406307B2 (en) | 2012-08-19 | 2016-08-02 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
US9293146B2 (en) | 2012-09-04 | 2016-03-22 | Apple Inc. | Intensity stereo coding in advanced audio coding |
US9280975B2 (en) | 2012-09-24 | 2016-03-08 | Samsung Electronics Co., Ltd. | Frame error concealment method and apparatus, and audio decoding method and apparatus |
CN103714821A (zh) | 2012-09-28 | 2014-04-09 | 杜比实验室特许公司 | 基于位置的混合域数据包丢失隐藏 |
US9401153B2 (en) | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
US9318116B2 (en) | 2012-12-14 | 2016-04-19 | Disney Enterprises, Inc. | Acoustic data transmission based on groups of audio receivers |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
FR3001593A1 (fr) | 2013-01-31 | 2014-08-01 | France Telecom | Correction perfectionnee de perte de trame au decodage d'un signal. |
RU2628144C2 (ru) | 2013-02-05 | 2017-08-15 | Телефонактиеболагет Л М Эрикссон (Пабл) | Способ и устройство для управления маскировкой потери аудиокадров |
TWI530941B (zh) | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
AU2014283389B2 (en) | 2013-06-21 | 2017-10-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization |
EP2830061A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
KR101831289B1 (ko) | 2013-10-18 | 2018-02-22 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 오디오 신호의 스펙트럼의 스펙트럼 계수들의 코딩 |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
EP3063761B1 (en) * | 2013-10-31 | 2017-11-22 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain |
KR101940740B1 (ko) | 2013-10-31 | 2019-01-22 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 |
ES2805744T3 (es) | 2013-10-31 | 2021-02-15 | Fraunhofer Ges Forschung | Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de errores en base a una señal de excitación de dominio de tiempo |
BR112016010197B1 (pt) | 2013-11-13 | 2021-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador para codificar um sinal áudio, sistema de transmissão de áudio e método para determinar os valores de correção |
GB2524333A (en) * | 2014-03-21 | 2015-09-23 | Nokia Technologies Oy | Audio signal payload |
ES2827278T3 (es) | 2014-04-17 | 2021-05-20 | Voiceage Corp | Método, dispositivo y memoria no transitoria legible por ordenador para codificación y decodificación predictiva linealde señales sonoras en la transición entre tramas que tienen diferentes tasas de muestreo |
US9396733B2 (en) | 2014-05-06 | 2016-07-19 | University Of Macau | Reversible audio data hiding |
NO2780522T3 (ja) | 2014-05-15 | 2018-06-09 | ||
EP2963649A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
PT3000110T (pt) | 2014-07-28 | 2017-02-15 | Fraunhofer Ges Forschung | Seleção de um de entre um primeiro algoritmo de codificação e um segundo algoritmo de codificação com o uso de redução de harmônicos. |
WO2016016724A2 (ko) * | 2014-07-28 | 2016-02-04 | 삼성전자 주식회사 | 패킷 손실 은닉방법 및 장치와 이를 적용한 복호화방법 및 장치 |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
EP2980798A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
EP2988300A1 (en) | 2014-08-18 | 2016-02-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Switching of sampling rates at audio processing devices |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US10296959B1 (en) | 2015-03-30 | 2019-05-21 | Audible, Inc. | Automated recommendations of audio narrations |
US9886963B2 (en) * | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
US10049684B2 (en) * | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
JP6422813B2 (ja) | 2015-04-13 | 2018-11-14 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法及びプログラム |
US9978400B2 (en) | 2015-06-11 | 2018-05-22 | Zte Corporation | Method and apparatus for frame loss concealment in transform domain |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
KR20170000933A (ko) | 2015-06-25 | 2017-01-04 | 한국전기연구원 | 시간 지연 추정을 이용한 풍력 터빈의 피치 제어 시스템 |
US9830921B2 (en) | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
WO2017039422A2 (ko) * | 2015-09-04 | 2017-03-09 | 삼성전자 주식회사 | 음질 향상을 위한 신호 처리방법 및 장치 |
US9978381B2 (en) | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10219147B2 (en) * | 2016-04-07 | 2019-02-26 | Mediatek Inc. | Enhanced codec control |
US10283143B2 (en) | 2016-04-08 | 2019-05-07 | Friday Harbor Llc | Estimating pitch of harmonic signals |
CN107103908B (zh) | 2017-05-02 | 2019-12-24 | 大连民族大学 | 复调音乐多音高估计方法及伪双谱在多音高估计中的应用 |
-
2017
- 2017-11-10 EP EP17201082.9A patent/EP3483882A1/en not_active Withdrawn
-
2018
- 2018-11-06 AU AU2018363698A patent/AU2018363698B2/en active Active
- 2018-11-06 WO PCT/EP2018/080335 patent/WO2019091977A1/en unknown
- 2018-11-06 KR KR1020207016100A patent/KR102426033B1/ko active IP Right Grant
- 2018-11-06 BR BR112020009034-4A patent/BR112020009034A2/pt unknown
- 2018-11-06 PT PT187966742T patent/PT3707713T/pt unknown
- 2018-11-06 MX MX2020004779A patent/MX2020004779A/es unknown
- 2018-11-06 CA CA3080907A patent/CA3080907C/en active Active
- 2018-11-06 EP EP18796674.2A patent/EP3707713B1/en active Active
- 2018-11-06 SG SG11202004171WA patent/SG11202004171WA/en unknown
- 2018-11-06 ES ES18796674T patent/ES2898281T3/es active Active
- 2018-11-06 JP JP2020524579A patent/JP7003253B2/ja active Active
- 2018-11-06 RU RU2020118947A patent/RU2752520C1/ru active
- 2018-11-06 PL PL18796674T patent/PL3707713T3/pl unknown
- 2018-11-06 CN CN201880072654.1A patent/CN111344784B/zh active Active
- 2018-11-07 TW TW107139532A patent/TWI691954B/zh active
- 2018-11-09 AR ARP180103271A patent/AR113479A1/es active IP Right Grant
-
2020
- 2020-05-04 US US16/866,280 patent/US11462226B2/en active Active
- 2020-05-04 ZA ZA2020/02082A patent/ZA202002082B/en unknown
Also Published As
Publication number | Publication date |
---|---|
ZA202002082B (en) | 2021-07-28 |
PT3707713T (pt) | 2021-12-03 |
JP2021502591A (ja) | 2021-01-28 |
BR112020009034A2 (pt) | 2020-10-27 |
RU2752520C1 (ru) | 2021-07-28 |
KR20200077591A (ko) | 2020-06-30 |
EP3483882A1 (en) | 2019-05-15 |
AU2018363698A1 (en) | 2020-05-21 |
AU2018363698B2 (en) | 2020-12-17 |
EP3707713B1 (en) | 2021-09-22 |
SG11202004171WA (en) | 2020-06-29 |
TW201923747A (zh) | 2019-06-16 |
KR102426033B1 (ko) | 2022-07-27 |
TWI691954B (zh) | 2020-04-21 |
CN111344784A (zh) | 2020-06-26 |
ES2898281T3 (es) | 2022-03-04 |
MX2020004779A (es) | 2020-08-13 |
CA3080907A1 (en) | 2019-05-16 |
CN111344784B (zh) | 2023-08-08 |
US11462226B2 (en) | 2022-10-04 |
AR113479A1 (es) | 2020-05-06 |
WO2019091977A1 (en) | 2019-05-16 |
US20200265852A1 (en) | 2020-08-20 |
CA3080907C (en) | 2023-12-19 |
EP3707713A1 (en) | 2020-09-16 |
PL3707713T3 (pl) | 2022-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2608878C1 (ru) | Регулировка уровня во временной области для декодирования или кодирования аудиосигналов | |
US11043226B2 (en) | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters | |
AU2015295624B2 (en) | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals | |
JP7003253B2 (ja) | エンコーダおよび/またはデコーダの帯域幅の制御 | |
AU2021303726B2 (en) | Audio quantizer and audio dequantizer and related methods | |
TWI841856B (zh) | 音頻量化器和音頻去量化器及相關方法以及電腦程式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200615 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210906 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211129 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7003253 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |