JP2016505168A - 音声信号復号化または符号化の時間領域レベル調整 - Google Patents
音声信号復号化または符号化の時間領域レベル調整 Download PDFInfo
- Publication number
- JP2016505168A JP2016505168A JP2015553045A JP2015553045A JP2016505168A JP 2016505168 A JP2016505168 A JP 2016505168A JP 2015553045 A JP2015553045 A JP 2015553045A JP 2015553045 A JP2015553045 A JP 2015553045A JP 2016505168 A JP2016505168 A JP 2016505168A
- Authority
- JP
- Japan
- Prior art keywords
- frequency band
- level
- audio signal
- level shift
- time domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 166
- 238000007781 pre-processing Methods 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims description 65
- 238000013139 quantization Methods 0.000 claims description 39
- 230000007704 transition Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 13
- 239000002131 composite material Substances 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 4
- 230000003595 spectral effect Effects 0.000 description 79
- 238000012545 processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 238000007493 shaping process Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000009795 derivation Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0018—Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/0332—Details of processing therefor involving modification of waveforms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
Description
以下に、本発明の実施例は、図面を参照して、更に詳細に記載されている。
各インデックスは、整数値(x)のシーケンス、例えばスペクトル線を表し、シーケンスの長さは、コードブック、例えばAAC−ELDの2または4の次元に依存する。
コードブックの各コード名のためにコードブックのコード名に関連して数値のシーケンスを決定する工程(ステップ1310)。前述したように、コードブックは数値のシーケンス、例えばコードブックのコード名によって2または4の数値を符号化する。コードブックは、数値の複数のシーケンスを符号化する複数のコードブックを含む。決定される数値のシーケンスは、コードブックの考慮されたコード名によって符号化される数値のシーケンスである。ステップ1310は、コードブックの各コード名のために行われる。たとえば、コードブックが81のコード名を含む場合、数値の81のシーケンスはステップ1310において決定される。
A) 逆量子化器をシーケンスの整数値に適用する(例えば、AAC―ELD:
x^(4/3))
B) A)のシーケンスの各値を2乗することによって、エネルギーを算出する
C) B)のシーケンスの合計を構築する
D) インデックスの所定の確率を有するC)を乗算する
E) スペクトル線につき予想されるエネルギーを得るために、コードブックの次元によって割る。
最後に、E)によって算出されるすべての値は、完全なコードブックの予想されるエネルギーを得るために合計されなければならない。
− 複数の周波数帯域信号を得るために符号化された音声信号表現を前処理する工程;
− 符号化された音声信号表現のための現在のレベル・シフト係数を決定するために周波数帯域信号のゲインに関連してサイド情報を分析する工程;
− レベル・シフトされた周波数帯域信号を得るためのレベル・シフト係数に従って周波数帯域信号のレベルをシフトする工程;
− 周波数帯域信号の時間領域表現への周波数−時間領域変換を実行する工程;および
− レベル・シフトされた周波数帯域信号に適用されるレベル・シフトを少なくとも部分的に補償するために、および十分に補償された時間領域表現を得るために時間領域表現について決定する工程。
− 一時的に、以前のレベル・シフト係数を格納すること、
− 現在のレベル・シフト係数にウィンドウ形状を適用することにより第1の複数のウィンドウ化サンプルを生成すること、
− 以前のレベル・シフト係数の一時的な格納の作用により与えられた以前のレベル・シフト係数に以前のウィンドウ形状を適用することにより第2の複数のウィンドウ化サンプルを生成すること、および
− 複数の複合サンプルを得るために第1の複数のウィンドウ化サンプルの、および第2の複数のウィンドウ化サンプルの相互に対応するウィンドウ化サンプルを結合すること。
− 以前のレベル・シフト係数を以前のフレーム係数シーケンスという結果になっている以前のウィンドウ形状の第2の部分と結合、
− 現在のレベル・シフト係数を現在のフレーム係数シーケンスという結果になっている現在のウィンドウ形状の第1の部分と結合、
− 以前のフレーム係数シーケンスおよび現在のフレーム係数シーケンスに基づいてクロスフェードされたレベル・シフト係数のシーケンスを決定。
Claims (16)
- 符号化された音声信号表現に基づいて復号化された音声信号表現を提供するように構成された音声信号デコーダ(100)であって、音声信号デコーダは:
符号化された音声信号表現から複数の周波数帯域信号を得るように構成されたデコーダ前処理ステージ(110);
サイド情報が符号化された音声信号表現のための現在のレベル・シフト係数を決定するために潜在的クリッピングを示すかどうかに関して符号化された音声信号表現の周波数帯域信号のゲインに関連してサイド情報を分析するように構成され、潜在的クリッピングを示す時、サイド情報が現在のレベル・シフト係数が少なくとも一つの最上位ビットのヘッドルームが得られるように、最下位ビットの方へシフトされる複数の周波数帯域信号の情報を引き起こすように構成されたクリッピング推定器(120);
レベル・シフトされた周波数帯域信号を得るための現在のレベル・シフト係数に従って周波数帯域信号のレベルをシフトさせるように構成されたレベルシフタ(130);
レベル・シフトされた周波数帯域信号を時間領域表現に変換するように構成された周波数−時間領域コンバータ;および
レベルシフタ(130)によってレベル・シフトされた周波数帯域信号に適用されるレベル・シフトを少なくとも部分的に補償し、実質的に補償された時間領域表現を得るためのレベル・シフト補償器(150)を含む、音声信号デコーダ。 - クリッピング推定器(120)がサイド情報および符号化された音声信号表現のうちの少なくとも1つに基づいてクリッピング確率を決定し、クリッピング確率に基づいて現在のレベル・シフト係数を決定するように構成された、請求項1に記載の音声信号デコーダ(100)。
- サイド情報は、複数の周波数帯域信号のための全体的なゲイン係数および複数のスケール係数のうちの少なくとも1つを含み、各スケール係数は複数の周波数帯域信号の中の1つの周波数帯域信号または周波数帯域信号の1つのグループに対応する、請求項1または請求項2に記載の音声信号デコーダ(100)。
- デコーダ前処理ステージ(110)が複数の連続したフレームの形で複数の周波数帯域信号を得るように構成され、クリッピング推定器(120)は、現在のフレームのための現在のレベル・シフト係数を決定するように構成される、請求項1ないし請求項3のいずれかに記載の音声信号デコーダ(100)。
- 復号化された音声信号表現が実質的に補償された時間領域表現に基づいて決定される、請求項1ないし請求項4のいずれかに記載の音声信号デコーダ(100)。
- 更に、レベル・シフト補償器(150)の下流の時間領域リミッタを含む、請求項1ないし請求項5のいずれかに記載の音声信号デコーダ(100)。
- 周波数帯域信号のゲインと関連するサイド情報は、複数の周波数帯域関連ゲイン係数を含む、請求項1ないし請求項6のいずれかに記載の音声信号デコーダ(100)。
- デコーダ前処理ステージ(110)は、複数の周波数帯域に特有の量子化インジケータのうちの周波数帯域に特有の量子化インジケータを用いて各周波数帯域信号を再量子化するように構成される逆量子化器を含む、請求項1ないし請求項7のいずれかに記載の音声信号デコーダ(100)。
- 更に、レベル・シフト補償器(150)による使用のためのクロスフェードされたレベル・シフト係数を得るために、現在のレベル・シフト係数と次のレベル・シフト係数とをクロスフェードさせるように構成された移行形状調整装置を含む、請求項1ないし請求項8のいずれかに記載の音声信号デコーダ(100)。
- 移行形状調整装置は、以前のレベル・シフト係数に対するメモリ(371)、現在のレベル・シフト係数にウィンドウ形状を適用することによって第1の複数のウィンドウ化されたサンプルを生成するように構成される第1のwindower(372)、メモリ(371)によって与えられる以前のレベル・シフト形状に以前のウィンドウ形状を適用することによって第2の複数のウィンドウ化されたサンプルを生成するように構成される第2のwindower(376)、および複数の複合サンプルを得るために相互に対応する第1の複数のウィンドウ化されたサンプルおよび第2の複数のウィンドウ化されたサンプルを結合するように構成されたサンプル・コンバイナ(379)を含む、請求項9に記載の音声信号デコーダ(100)。
- 現在のレベル・シフト係数は複数の周波数帯域信号の現在のフレームに有効であり、以前のレベル・シフト係数は、複数の周波数帯域信号の以前のフレームに有効であり、現在のフレームおよび以前のフレームが重なり合って;
移行形状調整は、
以前のレベル・シフト係数を以前のフレーム係数シーケンスという結果になっている以前のウィンドウ形状の第2の部分と結合するように構成され、
現在のレベル・シフト係数を現在のフレーム係数シーケンスという結果になっている現在のウィンドウ形状の第1の部分と結合するように構成され、および
以前のフレーム係数シーケンスおよび現在のフレーム係数シーケンスに基づいてクロスフェードされたレベル・シフト係数を決定するように構成される、請求項10に記載の音声信号デコーダ(100)。 - クリッピング推定器(120)は、最下位ビットが関連する情報を含まないことを意味する時間領域表現の範囲内における潜在的クリッピングを示すかどうかについての符号化された音声信号表現およびサイド情報のうちの少なくとも一方を分析するように構成され、この場合、レベルシフタによって適用されるレベル・シフトが最下位ビットに情報をシテトし、それによって最上位ビットを開放することにより最上位ビットにおいてヘッドルームが得られるように構成された、請求項1ないし請求項11のいずれかに記載の音声信号デコーダ(100)。
- クリッピング推定器(120)は、
確認されたコードブックとして複数のコードブックからコードブックを決定するためのコードブック決定器(1110)を含み、符号化された音声信号表現は確認されたコードブックを使用することにより符号化されたものであり、
推定器(1120)は、引き出されたレベル値として確認されたコードブックと関連したレベル値を引き出すために構成され、引き出されたレベル値を用いて音声信号のレベル推定を評価するために構成される、請求項1ないし請求項12のいずれかに記載の音声信号デコーダ。 - 入力音声信号の時間領域表現に基づいて符号化された音声信号表現を提供するように構成された音声信号エンコーダであって、音声信号エンコーダは、
入力信号表現のための現在のレベル・シフト係数を決定するために潜在的クリッピングが示されているかどうかについて入力音声信号の時間領域表現を分析するように構成されるクリッピング推定器であって、潜在的クリッピングが示されるとき、現在のレベル・シフト係数が最下位ビットにシフトされる入力音声信号の時間領域表現の原因となり、それによって少なくとも1つの最上位ビットにおいてヘッドルームが得られるクリッピング推定器;
レベル・シフトされた時間領域表現を得るための現在のレベル・シフト係数に従って入力音声信号の時間領域表現のレベルをシフトさせるように構成されたレベルシフタ;
レベル・シフトされた時間領域表現を複数の周波数帯域信号に変換するように構成された時間−周波数領域コンバータ;および
レベルシフタによってレベル・シフトされた時間領域表現に適用されるレベル・シフトを少なくとも部分的に補償し、複数の実質的に補償された周波数帯域信号を得るための複数の周波数帯域信号について決定を下すように構成されたレベル・シフト補償器を含む、音声信号エンコーダ。 - 符号化された音声信号表現を復号化し、対応する復号化音声信号表現を提供するための方法であって、前記方法は、
複数の周波数帯域信号を得るために符号化された音声信号表現を前処理するステップ;
符号化された音声信号表現のための現在のレベル・シフト係数を決定するために潜在的クリッピングをサイド情報が示唆するどうかについて周波数帯域信号のゲインと関連するサイド情報を分析するステップであって、サイド情報が潜在的クリッピングを示す場合、現在のレベル・シフト係数が最下位ビットにシフトする複数の周波数帯域信号の情報の原因となり、それによって少なくとも1つの最上位ビットにおけるヘッドルームが得られるものであるステップ;
レベル・シフトされた周波数帯域信号を得るためのレベル・シフト係数に従って周波数帯域信号のレベルをシフトさせるステップ;
周波数帯域信号の時間領域表現への周波数−時間領域変換を実行するステップ;および
レベル・シフトされた周波数帯域信号に適用されるレベル・シフトを少なくとも部分的に補償し、実質的に補償された時間領域表現を得るために時間領域表現について決定を下すステップを含む、方法。 - コンピュータに請求項15の方法を実行するように指示するためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13151910.0 | 2013-01-18 | ||
EP13151910.0A EP2757558A1 (en) | 2013-01-18 | 2013-01-18 | Time domain level adjustment for audio signal decoding or encoding |
PCT/EP2014/050171 WO2014111290A1 (en) | 2013-01-18 | 2014-01-07 | Time domain level adjustment for audio signal decoding or encoding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016505168A true JP2016505168A (ja) | 2016-02-18 |
JP6184519B2 JP6184519B2 (ja) | 2017-08-23 |
Family
ID=47603376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015553045A Active JP6184519B2 (ja) | 2013-01-18 | 2014-01-07 | 音声信号復号化または符号化の時間領域レベル調整 |
Country Status (11)
Country | Link |
---|---|
US (1) | US9830915B2 (ja) |
EP (2) | EP2757558A1 (ja) |
JP (1) | JP6184519B2 (ja) |
KR (2) | KR101953648B1 (ja) |
CN (1) | CN105210149B (ja) |
BR (1) | BR112015017293B1 (ja) |
CA (1) | CA2898005C (ja) |
ES (1) | ES2604983T3 (ja) |
MX (1) | MX346358B (ja) |
RU (1) | RU2608878C1 (ja) |
WO (1) | WO2014111290A1 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BRPI0518278B1 (pt) | 2004-10-26 | 2018-04-24 | Dolby Laboratories Licensing Corporation | Método e aparelho para controlar uma característica de sonoridade particular de um sinal de áudio |
TWI447709B (zh) | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
CN107403624B (zh) | 2012-05-18 | 2021-02-12 | 杜比实验室特许公司 | 用于音频信号的动态范围调整及控制的方法和设备 |
EP2757558A1 (en) * | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
TR201802631T4 (tr) | 2013-01-21 | 2018-03-21 | Dolby Laboratories Licensing Corp | Program Ses Şiddeti ve Sınır Meta Verilere Sahip Sesli Enkoder ve Dekoder |
CN109036443B (zh) | 2013-01-21 | 2023-08-18 | 杜比实验室特许公司 | 用于在不同回放设备之间优化响度和动态范围的系统和方法 |
JP6250071B2 (ja) | 2013-02-21 | 2017-12-20 | ドルビー・インターナショナル・アーベー | パラメトリック・マルチチャネル・エンコードのための方法 |
CN107093991B (zh) | 2013-03-26 | 2020-10-09 | 杜比实验室特许公司 | 基于目标响度的响度归一化方法和设备 |
US9635417B2 (en) | 2013-04-05 | 2017-04-25 | Dolby Laboratories Licensing Corporation | Acquisition, recovery, and matching of unique information from file-based media for automated file detection |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
CN104301064B (zh) | 2013-07-16 | 2018-05-04 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
WO2015038475A1 (en) | 2013-09-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
WO2015038522A1 (en) | 2013-09-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | Loudness adjustment for downmixed audio content |
US9509321B2 (en) * | 2013-11-27 | 2016-11-29 | Microchip Technology Incorporated | Main clock high precision oscillator |
CN105142067B (zh) | 2014-05-26 | 2020-01-07 | 杜比实验室特许公司 | 音频信号响度控制 |
CN106683681B (zh) * | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
EP3518236B8 (en) | 2014-10-10 | 2022-05-25 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
EP3258467B1 (en) * | 2015-02-10 | 2019-09-18 | Sony Corporation | Transmission and reception of audio streams |
CN104795072A (zh) * | 2015-03-25 | 2015-07-22 | 无锡天脉聚源传媒科技有限公司 | 一种音频数据的编码方法及装置 |
CN105662706B (zh) * | 2016-01-07 | 2018-06-05 | 深圳大学 | 增强时域表达的人工耳蜗信号处理方法及系统 |
CN109328382B (zh) * | 2016-06-22 | 2023-06-16 | 杜比国际公司 | 用于将数字音频信号从第一频域变换到第二频域的音频解码器及方法 |
KR102565447B1 (ko) * | 2017-07-26 | 2023-08-08 | 삼성전자주식회사 | 청각 인지 속성에 기반하여 디지털 오디오 신호의 이득을 조정하는 전자 장치 및 방법 |
US11120363B2 (en) | 2017-10-19 | 2021-09-14 | Adobe Inc. | Latency mitigation for encoding data |
US10942914B2 (en) * | 2017-10-19 | 2021-03-09 | Adobe Inc. | Latency optimization for digital asset compression |
US11086843B2 (en) | 2017-10-19 | 2021-08-10 | Adobe Inc. | Embedding codebooks for resource optimization |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091576A1 (en) * | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
US10331400B1 (en) * | 2018-02-22 | 2019-06-25 | Cirrus Logic, Inc. | Methods and apparatus for soft clipping |
CN109286922B (zh) * | 2018-09-27 | 2021-09-17 | 珠海市杰理科技股份有限公司 | 蓝牙提示音处理方法、系统、可读存储介质和蓝牙设备 |
JP2022521694A (ja) * | 2019-02-13 | 2022-04-12 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオオブジェクトクラスタリングのための適応型音量正規化 |
US11322127B2 (en) * | 2019-07-17 | 2022-05-03 | Silencer Devices, LLC. | Noise cancellation with improved frequency resolution |
CN111342937B (zh) * | 2020-03-17 | 2022-05-06 | 北京百瑞互联技术有限公司 | 一种动态调整编解码处理器电压和/或频率的方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001237708A (ja) * | 2000-02-24 | 2001-08-31 | Alpine Electronics Inc | データ処理方式 |
US20100266142A1 (en) * | 2007-12-11 | 2010-10-21 | Nxp B.V. | Prevention of audio signal clipping |
WO2013087861A2 (en) * | 2011-12-15 | 2013-06-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer programm for avoiding clipping artefacts |
WO2014111290A1 (en) * | 2013-01-18 | 2014-07-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU4265796A (en) | 1994-12-15 | 1996-07-03 | British Telecommunications Public Limited Company | Speech processing |
US6280309B1 (en) | 1995-10-19 | 2001-08-28 | Norton Company | Accessories and attachments for angle grinder |
US5796842A (en) * | 1996-06-07 | 1998-08-18 | That Corporation | BTSC encoder |
US6289309B1 (en) * | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
ES2269112T3 (es) * | 2000-02-29 | 2007-04-01 | Qualcomm Incorporated | Codificador de voz multimodal en bucle cerrado de dominio mixto. |
US6651040B1 (en) * | 2000-05-31 | 2003-11-18 | International Business Machines Corporation | Method for dynamic adjustment of audio input gain in a speech system |
CA2359771A1 (en) * | 2001-10-22 | 2003-04-22 | Dspfactory Ltd. | Low-resource real-time audio synthesis system and method |
JP2003280691A (ja) * | 2002-03-19 | 2003-10-02 | Sanyo Electric Co Ltd | 音声処理方法および音声処理装置 |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
DE10345995B4 (de) | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
US7751572B2 (en) * | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
BRPI0616624A2 (pt) * | 2005-09-30 | 2011-06-28 | Matsushita Electric Ind Co Ltd | aparelho de codificação de fala e método de codificação de fala |
DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
AU2008215231B2 (en) * | 2007-02-14 | 2010-02-18 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US8126578B2 (en) * | 2007-09-26 | 2012-02-28 | University Of Washington | Clipped-waveform repair in acoustic signals using generalized linear prediction |
CN101350199A (zh) * | 2008-07-29 | 2009-01-21 | 北京中星微电子有限公司 | 音频编码器及音频编码方法 |
EP2353161B1 (en) * | 2008-10-29 | 2017-05-24 | Dolby International AB | Signal clipping protection using pre-existing audio gain metadata |
US8346547B1 (en) * | 2009-05-18 | 2013-01-01 | Marvell International Ltd. | Encoder quantization architecture for advanced audio coding |
KR101412115B1 (ko) * | 2010-10-07 | 2014-06-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 비트 스트림 도메인 내의 코딩된 오디오 프레임들의 레벨 추정을 위한 장치 및 방법 |
TWI651005B (zh) * | 2011-07-01 | 2019-02-11 | 杜比實驗室特許公司 | 用於適應性音頻信號的產生、譯碼與呈現之系統與方法 |
-
2013
- 2013-01-18 EP EP13151910.0A patent/EP2757558A1/en not_active Withdrawn
-
2014
- 2014-01-07 EP EP14702195.0A patent/EP2946384B1/en active Active
- 2014-01-07 KR KR1020177024874A patent/KR101953648B1/ko active IP Right Grant
- 2014-01-07 KR KR1020157021762A patent/KR20150106929A/ko active Application Filing
- 2014-01-07 JP JP2015553045A patent/JP6184519B2/ja active Active
- 2014-01-07 MX MX2015009171A patent/MX346358B/es active IP Right Grant
- 2014-01-07 ES ES14702195.0T patent/ES2604983T3/es active Active
- 2014-01-07 WO PCT/EP2014/050171 patent/WO2014111290A1/en active Application Filing
- 2014-01-07 CA CA2898005A patent/CA2898005C/en active Active
- 2014-01-07 BR BR112015017293-8A patent/BR112015017293B1/pt active IP Right Grant
- 2014-01-07 RU RU2015134587A patent/RU2608878C1/ru active
- 2014-01-07 CN CN201480016606.2A patent/CN105210149B/zh active Active
-
2015
- 2015-07-09 US US14/795,063 patent/US9830915B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001237708A (ja) * | 2000-02-24 | 2001-08-31 | Alpine Electronics Inc | データ処理方式 |
US20100266142A1 (en) * | 2007-12-11 | 2010-10-21 | Nxp B.V. | Prevention of audio signal clipping |
WO2013087861A2 (en) * | 2011-12-15 | 2013-06-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer programm for avoiding clipping artefacts |
WO2014111290A1 (en) * | 2013-01-18 | 2014-07-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
Also Published As
Publication number | Publication date |
---|---|
CN105210149B (zh) | 2019-08-30 |
CA2898005A1 (en) | 2014-07-24 |
CA2898005C (en) | 2018-08-14 |
US9830915B2 (en) | 2017-11-28 |
ES2604983T3 (es) | 2017-03-10 |
MX346358B (es) | 2017-03-15 |
EP2946384A1 (en) | 2015-11-25 |
KR20150106929A (ko) | 2015-09-22 |
JP6184519B2 (ja) | 2017-08-23 |
EP2946384B1 (en) | 2016-11-02 |
MX2015009171A (es) | 2015-11-09 |
BR112015017293B1 (pt) | 2021-12-21 |
EP2757558A1 (en) | 2014-07-23 |
US20160019898A1 (en) | 2016-01-21 |
BR112015017293A2 (pt) | 2018-05-15 |
KR101953648B1 (ko) | 2019-05-23 |
WO2014111290A1 (en) | 2014-07-24 |
KR20170104661A (ko) | 2017-09-15 |
RU2608878C1 (ru) | 2017-01-25 |
CN105210149A (zh) | 2015-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6184519B2 (ja) | 音声信号復号化または符号化の時間領域レベル調整 | |
KR101508819B1 (ko) | 멀티 모드 오디오 코덱 및 이를 위해 적응된 celp 코딩 | |
CN108831501B (zh) | 用于带宽扩展的高频编码/高频解码方法和设备 | |
JP5096468B2 (ja) | サイド情報なしの時間的ノイズエンベロープの自由な整形 | |
JP5978218B2 (ja) | 低ビットレート低遅延の一般オーディオ信号の符号化 | |
JP6980871B2 (ja) | 信号符号化方法及びその装置、並びに信号復号方法及びその装置 | |
JP2011509426A (ja) | オーディオエンコーダおよびデコーダ | |
RU2762301C2 (ru) | Устройство и способ для кодирования и декодирования аудиосигнала с использованием понижающей дискретизации или интерполяции масштабных параметров | |
JP4639073B2 (ja) | オーディオ信号符号化装置および方法 | |
CN111344784B (zh) | 控制编码器和/或解码器中的带宽 | |
AU2014280256B2 (en) | Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding | |
AU2014280258B9 (en) | Apparatus and method for audio signal envelope encoding, processing and decoding by modelling a cumulative sum representation employing distribution quantization and coding | |
JP2008026372A (ja) | 符号化データの符号化則変換方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161017 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161025 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20170125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170627 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170725 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6184519 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |