JP6306175B2 - 時間ドメイン励振信号に基づくエラーコンシールメントを用いて、復号化されたオーディオ情報を提供するオーディオデコーダおよび復号化されたオーディオ情報を提供する方法 - Google Patents
時間ドメイン励振信号に基づくエラーコンシールメントを用いて、復号化されたオーディオ情報を提供するオーディオデコーダおよび復号化されたオーディオ情報を提供する方法 Download PDFInfo
- Publication number
- JP6306175B2 JP6306175B2 JP2016527210A JP2016527210A JP6306175B2 JP 6306175 B2 JP6306175 B2 JP 6306175B2 JP 2016527210 A JP2016527210 A JP 2016527210A JP 2016527210 A JP2016527210 A JP 2016527210A JP 6306175 B2 JP6306175 B2 JP 6306175B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- error concealment
- excitation signal
- time domain
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005284 excitation Effects 0.000 title claims description 422
- 238000000034 method Methods 0.000 title claims description 79
- 230000015572 biosynthetic process Effects 0.000 claims description 123
- 238000003786 synthesis reaction Methods 0.000 claims description 123
- 230000003595 spectral effect Effects 0.000 claims description 49
- 230000005236 sound signal Effects 0.000 claims description 48
- 230000000737 periodic effect Effects 0.000 claims description 38
- 230000008859 change Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 17
- 238000005070 sampling Methods 0.000 claims description 17
- 238000001914 filtration Methods 0.000 claims description 16
- 230000002829 reductive effect Effects 0.000 claims description 13
- 230000001419 dependent effect Effects 0.000 claims description 11
- 230000000630 rising effect Effects 0.000 claims description 5
- 230000002123 temporal effect Effects 0.000 claims description 4
- 230000014509 gene expression Effects 0.000 claims description 3
- 239000011295 pitch Substances 0.000 description 282
- 230000006870 function Effects 0.000 description 33
- 238000010586 diagram Methods 0.000 description 21
- 238000012545 processing Methods 0.000 description 18
- 238000013213 extrapolation Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 13
- 238000012986 modification Methods 0.000 description 13
- 230000003044 adaptive effect Effects 0.000 description 9
- 238000012805 post-processing Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000007704 transition Effects 0.000 description 9
- 238000005562 fading Methods 0.000 description 7
- 230000007774 longterm Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 238000011084 recovery Methods 0.000 description 5
- 238000007493 shaping process Methods 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000003362 replicative effect Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Description
したがって、エラーコンシールメントオーディオ情報は、「自然な」聴覚インプレッションを備えることが達成される。
結果的に、エラーコンシールメントオーディオ情報の改良された提供は、ロストオーディオフレームを改良された結果によってコンシールすることができるように達成することができる。
したがって、前に用いられたピッチ情報は再利用することができ、ピッチ情報の新たな演算のための演算労力を回避する。このように、エラーコンシールメントは、特に演算上効率的である。たとえば、ACELPのケースにおいて、フレーム当り4つのピッチ遅延とゲインを有する。コンシールしなければならないフレームの終わりにおけるピッチを予測することができる最後の2つのフレームを用いることができる。
符号化されたオーディオ情報は、たとえば、フレームロスが時々起こるような信頼できないチャネルを介して受信される可能性がある。オーディオデコーダ100は、更に符号化されたオーディオ情報110に基づいて復号化されたオーディオ情報112を提供する。
このノイズは、更にハイパスフィルタリングされ、有声のおよび立上りのフレームに対してオプションとしてプリエンファサイズされる。有声のおよび立上りのフレームに対して選択的に実行することができる、ハイパスフィルタリングおよびプリエンファシスは、図6において明示的には示されていないが、たとえば、ノイズ発生器660内でまたはコンバイナ/フェーダ670内で実行することができる。
[1]3GPP, "Audio codec processing functions; Extended Adaptive Multi-Rate - Wideband (AMR-WB+) codec; Transcoding functions," 2009, 3GPP TS 26.290.
[2]"MDCT-BASED CODER FOR HIGHLY ADAPTIVE SPEECH AND AUDIO CODING"; Guillaume Fuchs & al.; EUSIPCO 2009.
[3]ISO_IEC_DIS_23003-3_(E); Information technology - MPEG audio technologies - Part 3: Unified speech and audio coding.
[4]3GPP, "General Audio Codec audio processing functions; Enhanced aacPlus general audio codec; Additional decoder tools," 2009, 3GPP TS 26.402.
[5]"Audio decoder and coding error compensating method", 2000, EP 1207519 B1
[6]"Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pitch lag estimation", 2014, PCT/EP2014/062589
[7]"Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization", 2014, PCT/EP2014/062578
Claims (44)
- 符号化されたオーディオ情報(110;310)に基づいて復号化されたオーディオ情報(112;312)を提供するオーディオデコーダであって、
時間ドメイン励振信号(532)を用いて、周波数ドメイン表現(322)において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするためのエラーコンシールメントオーディオ情報(132;382;512)を提供するように構成された、エラーコンシールメント(130;380;500)を備え、
前記エラーコンシールメント(130;380;500)は、LPC合成(580)に対する入力信号(572)を取得するために、外挿された時間ドメイン励振信号(552)とノイズ信号(562)を結合するように構成され、
前記エラーコンシールメントは、前記LPC合成を実行するように構成され、
前記LPC合成は、前記エラーコンシールメントオーディオ情報(132;382;512)を取得するために、線形予測符号化パラメータに依存して前記LPC合成の入力信号(572)をフィルタリングするように構成され、
前記エラーコンシールメント(130;380;500)は、前記外挿された時間ドメイン励振信号(552)と結合された前記ノイズ信号(562)をハイパスフィルタリングするように構成された、
オーディオデコーダ(100;300)。 - 符号化されたオーディオ情報(110;310)に基づいて復号化されたオーディオ情報(112;312)を提供するオーディオデコーダであって、
時間ドメイン励振信号(532)を用いて、周波数ドメイン表現(322)において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするためのエラーコンシールメントオーディオ情報(132;382;512)を提供するように構成された、エラーコンシールメント(130;380;500)を備え、
前記オーディオデコーダは、前記周波数ドメイン表現(322)から導き出された複数のスペクトル値(342)に、スケールファクタベースのスケーリング(360)を適用するように構成された、周波数ドメインデコーダコア(120;340、350、360、366、370)を備え、
前記エラーコンシールメント(130;380;500)は、前記周波数ドメイン表現から導き出された時間ドメイン励振信号(532)を用いて、複数の符号化されたスケールファクタ(328)を備える周波数ドメイン表現(322)において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするための前記エラーコンシールメントオーディオ情報(132;382;512)を提供するように構成され、
前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームに基づいて、前記時間ドメイン励振信号(532)を取得するように構成された、オーディオデコーダ(100;300)。 - 符号化されたオーディオ情報(110;310)に基づいて復号化されたオーディオ情報(112;312)を提供するオーディオデコーダであって、
時間ドメイン励振信号(532)を用いて、周波数ドメイン表現(322)において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするためのエラーコンシールメントオーディオ情報(132;382;512)を提供するように構成された、エラーコンシールメント(130;380;500)を備え、
前記周波数ドメイン表現は、複数のスペクトル値の符号化された表現(326)と、前記スペクトル値をスケーリングするための複数のスケールファクタの符号化された表現(328)とを備え、前記オーディオデコーダは、複数の符号化されたスケールファクタに基づいて、スペクトル値をスケーリングするための複数の復号化スケールファクタ(352、354)を提供するように構成され、または、前記オーディオデコーダは、LPCパラメータの符号化された表現から前記スペクトル値をスケーリングするための複数のスケールファクタを導き出すように構成され、
前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームに基づいて、前記時間ドメイン励振信号(532)を取得するように構成された、オーディオデコーダ(100;300)。 - 前記オーディオデコーダは、前記周波数ドメイン表現において符号化された前記オーディオフレームに対して、中間量として時間ドメイン励振信号を用いることなく、前記周波数ドメイン表現(322)から時間ドメインオーディオ信号表現(122;372)を導き出すように構成された、周波数ドメインデコーダコア(120;340、350、350、366、370)を備えた、請求項1〜3のいずれかに記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームに基づいて前記時間ドメイン励振信号(532)を取得するように構成され、
前記エラーコンシールメントは、前記時間ドメイン励振信号を用いて、前記ロストオーディオフレームをコンシールするための前記エラーコンシールメントオーディオ情報(122;382;512)を提供するように構成された、
請求項1〜4のいずれかに記載のオーディオデコーダ(100;300)。 - 前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームに基づいてLPC分析(530)を実行し、線形予測符号化パラメータのセットと、前記ロストオーディオフレームに先行する前記周波数ドメイン表現において符号化された前記オーディオフレームのオーディオコンテンツを表現する前記時間ドメイン励振信号(532)とを取得するように構成された、または
前記エラーコンシールメント(130;380;500)は、前記ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームに基づいてLPC分析(530)を実行し、前記ロストオーディオフレームに先行する前記周波数ドメイン表現において符号化された前記オーディオフレームのオーディオコンテンツを表現する前記時間ドメイン励振信号(532)を取得するように構成された、または
前記オーディオデコーダは、線形予測符号化パラメータ推定を用いて、線形予測符号化パラメータのセットを取得するように構成された、または
前記オーディオデコーダは、変換を用いて、スケールファクタのセットに基づいて線形予測符号化パラメータのセットを取得するように構成された、
請求項1〜5のいずれかに記載のオーディオデコーダ(100;300)。 - 前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームに先行する前記周波数ドメイン表現において符号化された前記オーディオフレームのピッチを記述するピッチ情報(542)を取得し、前記ピッチ情報に依存して、前記エラーコンシールメントオーディオ情報(122;382;512)を提供するように構成された、請求項1〜6のいずれかに記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、前記ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームから導き出された前記時間ドメイン励振信号(532)に基づいて、前記ピッチ情報(542)を取得するように構成された、請求項7に記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、前記時間ドメイン励振信号(532)または時間ドメイン信号(522)の相互相関を評価し、粗いピッチ情報を決定するように構成され、
前記エラーコンシールメントは、前記粗いピッチ情報によって決定されたピッチの周辺で、クローズドループ探索を用いて、前記粗いピッチ情報をリファインするように構成された、
請求項8に記載のオーディオデコーダ(100;300)。 - 前記エラーコンシールメントは、前記符号化されたオーディオ情報のサイド情報に基づいて、ピッチ情報を取得するように構成された、請求項1〜6のいずれかに記載のオーディオデコーダ。
- 前記エラーコンシールメントは、前に復号化されたオーディオフレームに対して利用可能なピッチ情報に基づいて、ピッチ情報を取得するように構成された、請求項1〜6のいずれかに記載のオーディオデコーダ。
- 前記エラーコンシールメントは、時間ドメイン信号上でまたは残差信号上で実行されたピッチ探索に基づいて、ピッチ情報を取得するように構成された、請求項1〜6のいずれかに記載のオーディオデコーダ。
- 前記エラーコンシールメント(130;380;500)は、前記エラーコンシールメントオーディオ情報(132;382;512)の合成(580)のための励振信号(572)を取得するために、ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームから導き出された前記時間ドメイン励振信号(532)のピッチサイクルを1回または複数回複製するように構成された、請求項1〜12のいずれかに記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、バンド幅が周波数ドメイン表現において符号化されたオーディオフレームのサンプリングレートに依存するサンプリングレート依存フィルタを用いて、前記ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームの時間ドメイン表現から導き出された前記時間ドメイン励振信号(532)の前記ピッチサイクルをローパスフィルタリングするように構成された、請求項13に記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、ロストフレームの終わりにおけるピッチを予測するように構成され、
前記エラーコンシールメントは、LPC合成(580)に対する入力信号(572)を取得するために、前記時間ドメイン励振信号(532)またはその1つ以上の複製を前記予測されたピッチに適応させるように構成された、
請求項1〜14のいずれかに記載のオーディオデコーダ。 - 前記エラーコンシールメント(130;380;500)は、LPC合成(580)に対する入力信号(572)を取得するために、外挿された時間ドメイン励振信号(552)とノイズ信号(562)を結合するように構成され、
前記エラーコンシールメントは、LPC合成を実行するように構成され、
前記LPC合成は、前記エラーコンシールメントオーディオ情報(132;382;512)を取得するために、線形予測符号化パラメータに依存して、前記LPC合成の入力信号(572)をフィルタリングするように構成された、
請求項1〜15のいずれかに記載のオーディオデコーダ。 - 前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームの時間ドメイン表現(122;372;378;510)に基づいて実行された時間ドメインにおける相関を用いて、前記LPC合成(580)の入力信号(572)を取得するために用いられる前記外挿された時間ドメイン励振信号(552)のゲインを演算するように構成され、相関の遅延は、前記時間ドメイン励振信号(532)に基づいて取得されたピッチ情報に依存して、または励振ドメインにおける相関を用いて、セットされる、請求項16に記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、前記外挿された時間ドメイン励振信号(552)と結合された前記ノイズ信号(562)を、ハイパスフィルタリングするように構成された、請求項16または17に記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、前記ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームが有声であるまたは立上りを備える場合に、ノイズ信号が外挿された時間ドメイン励振信号(552)と結合されるプリエンファシスフィルタを用いて、前記ノイズ信号(562)のスペクトル形状を変えるように構成された、請求項13〜15のいずれかに記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームの時間ドメイン表現(122;372;378;510)に基づいて実行された時間ドメインにおける相関に依存して、前記ノイズ信号(562)のゲインを演算するように構成された、請求項1〜19のいずれかに記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、前記エラーコンシールメントオーディオ情報(132;382;512)を取得するために、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された時間ドメイン励振信号(532)を修正するように構成された、請求項1〜20のいずれかに記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、前記エラーコンシールメントオーディオ情報(132;382;512)を取得するために、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)の1つ以上の修正された複製を用いるように構成された、請求項21に記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(132;380;500)は、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製を修正し、それにより前記エラーコンシールメントオーディオ情報(132;382;512)の周期的な成分を時間とともに低減するように構成された、請求項21または22に記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(132;380;500)は、前記ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製をスケーリングし、それにより前記時間ドメイン励振信号を修正するように構成された、請求項21〜23のいずれかに記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製をスケーリングするために適用されるゲインを徐々に低減するように構成された、請求項23または24に記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製をスケーリングするために適用されるゲインを徐々に低減する速度を、前記ロストオーディオフレームに先行する1つ以上のオーディオフレームの1つ以上のパラメータに依存しておよび/または連続するロストオーディオフレームの数に依存して調整するように構成された、請求項23〜25のいずれかに記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメントは、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製をスケーリングするために適用されるゲインを徐々に低減する速度を、LPC合成に入力される時間ドメイン励振信号が、より長いピッチ周期の長さを有する信号と比較したとき、より短いピッチ周期の長さを有する信号に対して、より速くフェードアウトするように、前記時間ドメイン励振信号(532)のピッチ周期の長さに依存して調整するように構成された、請求項25または26に記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製をスケーリングするために適用されるゲインを徐々に低減する速度を、
LPC合成(580)に入力される時間ドメイン励振信号(572)の決定的な成分が、より小さい単位時間当りのピッチ変化を有する信号と比較したとき、より大きい単位時間当りのピッチ変化を有する信号に対して、より速くフェードアウトするように、および/または、LPC合成(580)に入力される時間ドメイン励振信号(572)の決定的な成分が、ピッチ予測が成功する信号と比較したとき、ピッチ予測が失敗する信号に対して、より速くフェードアウトするように、
ピッチ分析(540)またはピッチ予測の結果に依存して調整するように構成された、請求項25〜27のいずれかに記載のオーディオデコーダ(100;300)。 - 前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製を、1つ以上のロストオーディオフレームの時間に対するピッチの予測(540)に依存して時間スケーリングするように構成された、請求項21〜28のいずれかに記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、1つ以上のロストオーディオフレームの時間的な継続期間より長い時間に対して、前記エラーコンシールメントオーディオ情報(132;382;512)を提供するように構成された、請求項1〜29のいずれかに記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、前記エラーコンシールメントオーディオ情報(132;382;512)と、前記1つ以上のロストオーディオフレームに引き続く1つ以上の適切に受信されたオーディオフレームの時間ドメイン表現(122;372,378;512)とのオーバーラップ加算(390;590)を実行するように構成された、請求項30に記載のオーディオデコーダ(100;300)。
- 前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームまたはロストウィンドウに先行する少なくとも3つの部分的にオーバーラップするフレームまたはウィンドウに基づいて、前記エラーコンシールメントオーディオ情報(132;382;512)を導き出すように構成された、請求項1〜31のいずれかに記載のオーディオデコーダ(100;300)。
- 符号化されたオーディオ情報(110;310)に基づいて復号化されたオーディオ情報(112;312)を提供するオーディオデコーダであって、
時間ドメイン励振信号(532)を用いて、周波数ドメイン表現(322)において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするためのエラーコンシールメントオーディオ情報(132;382;512)を提供するように構成された、エラーコンシールメント(130;380;500)を備え、
前記エラーコンシールメント(130;380;500)は、前記エラーコンシールメントオーディオ情報(132;382;512)の合成(580)のための励振信号(572)を取得するために、ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームから導き出された前記時間ドメイン励振信号(532)のピッチサイクルを1回または複数回複製するように構成され、
前記エラーコンシールメント(130;380;500)は、バンド幅が周波数ドメイン表現において符号化されたオーディオフレームのサンプリングレートに依存するサンプリングレート依存フィルタを用いて、前記ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームの時間ドメイン表現から導き出された前記時間ドメイン励振信号(532)の前記ピッチサイクルをローパスフィルタリングするように構成された、
オーディオデコーダ(100;300)。 - 符号化されたオーディオ情報(110;310)に基づいて復号化されたオーディオ情報(112;312)を提供するオーディオデコーダであって、
時間ドメイン励振信号(532)を用いて、周波数ドメイン表現(322)において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするためのエラーコンシールメントオーディオ情報(132;382;512)を提供するように構成された、エラーコンシールメント(130;380;500)を備え、
前記エラーコンシールメント(130;380;500)は、前記エラーコンシールメントオーディオ情報(132;382;512)を取得するために、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された時間ドメイン励振信号(532)を修正するように構成され、
前記エラーコンシールメント(132;380;500)は、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製を修正し、それにより前記エラーコンシールメントオーディオ情報(132;382;512)の周期的な成分を時間とともに低減するように構成され、
前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製をスケーリングするために適用されるゲインを徐々に低減するように構成され、
前記エラーコンシールメントは、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製をスケーリングするために適用されるゲインを徐々に低減する速度を、LPC合成に入力される時間ドメイン励振信号が、より長いピッチ周期の長さを有する信号と比較したとき、より短いピッチ周期の長さを有する信号に対して、より速くフェードアウトするように、前記時間ドメイン励振信号(532)のピッチ周期の長さに依存して調整するように構成された、
オーディオデコーダ(100;300)。 - 符号化されたオーディオ情報(110;310)に基づいて復号化されたオーディオ情報(112;312)を提供するオーディオデコーダであって、
時間ドメイン励振信号(532)を用いて、周波数ドメイン表現(322)において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするためのエラーコンシールメントオーディオ情報(132;382;512)を提供するように構成された、エラーコンシールメント(130;380;500)を備え、
前記エラーコンシールメント(130;380;500)は、前記エラーコンシールメントオーディオ情報(132;382;512)を取得するために、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された時間ドメイン励振信号(532)を修正するように構成され、
前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製を、前記1つ以上のロストオーディオフレームの時間に対するピッチの予測(540)に依存して時間スケーリングするように構成された、
オーディオデコーダ(100;300)。 - 符号化されたオーディオ情報(110;310)に基づいて復号化されたオーディオ情報(112;312)を提供するオーディオデコーダであって、
時間ドメイン励振信号(532)を用いて、周波数ドメイン表現(322)において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするためのエラーコンシールメントオーディオ情報(132;382;512)を提供するように構成された、エラーコンシールメント(130;380;500)を備え、
前記エラーコンシールメント(130;380;500)は、前記エラーコンシールメントオーディオ情報(132;382;512)を取得するために、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された時間ドメイン励振信号(532)を修正するように構成され、
前記エラーコンシールメント(132;380;500)は、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製を修正し、それにより前記エラーコンシールメントオーディオ情報(132;382;512)の周期的な成分を時間とともに低減するように構成され、または、前記エラーコンシールメント(132;380;500)は、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製をスケーリングし、それにより前記時間ドメイン励振信号を修正するように構成され、
前記エラーコンシールメント(130;380;500)は、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製をスケーリングするために適用されるゲインを徐々に低減する速度を、
LPC合成(580)に入力される時間ドメイン励振信号(572)の決定的な成分が、より小さい単位時間当りのピッチ変化を有する信号と比較したとき、より大きい単位時間当りのピッチ変化を有する信号に対して、より速くフェードアウトするように、および/または、LPC合成(580)に入力される時間ドメイン励振信号(572)の決定的な成分が、ピッチ予測が成功する信号と比較したとき、ピッチ予測が失敗する信号に対して、より速くフェードアウトするように、
ピッチ分析(540)またはピッチ予測の結果に依存して調整するように構成された、
オーディオデコーダ(100;300)。 - 符号化されたオーディオ情報に基づいて復号化されたオーディオ情報を提供する方法であって、
時間ドメイン励振信号を用いて、周波数ドメイン表現において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするためのエラーコンシールメントオーディオ情報を提供するステップ(910)を備え、
前記方法は、LPC合成(580)に対する入力信号(572)を取得するために、外挿された時間ドメイン励振信号(552)とノイズ信号(562)を結合するステップを備え、
前記方法は、前記LPC合成を実行するステップを備え、
前記LPC合成は、前記エラーコンシールメントオーディオ情報(132;382;512)を取得するために、線形予測符号化パラメータに依存して前記LPC合成の入力信号(572)をフィルタリングし、
前記方法は、前記外挿された時間ドメイン励振信号(552)と結合された前記ノイズ信号(562)をハイパスフィルタリングするステップを備えた、
方法(900)。 - 符号化されたオーディオ情報に基づいて復号化されたオーディオ情報を提供する方法であって、
時間ドメイン励振信号を用いて、周波数ドメイン表現において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするためのエラーコンシールメントオーディオ情報を提供するステップ(910)と、
前記周波数ドメイン表現(322)から導き出された複数のスペクトル値(342)に、スケールファクタベースのスケーリング(360)を適用するステップと、
を備え、
複数の符号化されたスケールファクタ(328)を備える周波数ドメイン表現(322)において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするための前記エラーコンシールメントオーディオ情報(132;382;512)は、前記周波数ドメイン表現から導き出された時間ドメイン励振信号(532)を用いて提供され、
前記時間ドメイン励振信号(532)は、ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームに基づいて取得される、
方法(900)。 - 符号化されたオーディオ情報に基づいて復号化されたオーディオ情報を提供する方法であって、
時間ドメイン励振信号を用いて、周波数ドメイン表現において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするためのエラーコンシールメントオーディオ情報を提供するステップ(910)を備え、
前記周波数ドメイン表現は、複数のスペクトル値の符号化された表現(326)と、前記スペクトル値をスケーリングするための複数のスケールファクタの符号化された表現(328)とを備え、スペクトル値をスケーリングするための複数の復号化スケールファクタ(352、354)は、複数の符号化されたスケールファクタに基づいて提供され、または、前記スペクトル値をスケーリングするための複数のスケールファクタは、LPCパラメータの符号化された表現から導き出され、
前記時間ドメイン励振信号(532)は、ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームに基づいて取得される、
方法(900)。 - 符号化されたオーディオ情報に基づいて復号化されたオーディオ情報を提供する方法であって、
時間ドメイン励振信号を用いて、周波数ドメイン表現において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするためのエラーコンシールメントオーディオ情報を提供するステップ(910)を備え、
前記エラーコンシールメントオーディオ情報(132;382;512)の合成(580)のための励振信号(572)を取得するために、ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームから導き出された前記時間ドメイン励振信号(532)のピッチサイクルは、1回または複数回複製され、
前記ロストオーディオフレームに先行する前記周波数ドメイン表現(322)において符号化された前記オーディオフレームの時間ドメイン表現から導き出された前記時間ドメイン励振信号(532)の前記ピッチサイクルは、バンド幅が周波数ドメイン表現において符号化されたオーディオフレームのサンプリングレートに依存するサンプリングレート依存フィルタを用いて、ローパスフィルタリングされる、
方法(900)。 - 符号化されたオーディオ情報に基づいて復号化されたオーディオ情報を提供する方法であって、
時間ドメイン励振信号を用いて、周波数ドメイン表現において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするためのエラーコンシールメントオーディオ情報を提供するステップ(910)を備え、
前記エラーコンシールメントオーディオ情報(132;382;512)を取得するために、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された時間ドメイン励振信号(532)は修正され、
ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製は修正され、それにより前記エラーコンシールメントオーディオ情報(132;382;512)の周期的な成分を時間とともに低減し、
ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製をスケーリングするために適用されるゲインは徐々に低減され、
ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製をスケーリングするために適用されるゲインを徐々に低減する速度は、LPC合成に入力される時間ドメイン励振信号が、より長いピッチ周期の長さを有する信号と比較したとき、より短いピッチ周期の長さを有する信号に対して、より速くフェードアウトするように、前記時間ドメイン励振信号(532)のピッチ周期の長さに依存して調整される、
方法(900)。 - 符号化されたオーディオ情報に基づいて復号化されたオーディオ情報を提供する方法であって、
時間ドメイン励振信号を用いて、周波数ドメイン表現において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするためのエラーコンシールメントオーディオ情報を提供するステップ(910)を備え、
前記エラーコンシールメントオーディオ情報(132;382;512)を取得するために、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された時間ドメイン励振信号(532)は修正され、
ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製は、前記1つ以上のロストオーディオフレームの時間に対するピッチの予測(540)に依存して時間スケーリングされる、
方法(900)。 - 符号化されたオーディオ情報に基づいて復号化されたオーディオ情報を提供する方法であって、
時間ドメイン励振信号を用いて、周波数ドメイン表現において符号化されたオーディオフレームに引き続くオーディオフレームのロスをコンシールするためのエラーコンシールメントオーディオ情報を提供するステップ(910)を備え、
前記方法は、前記エラーコンシールメントオーディオ情報(132;382;512)を取得するために、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された時間ドメイン励振信号(532)を修正するステップを備え、
ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製は修正され、それにより前記エラーコンシールメントオーディオ情報(132;382;512)の周期的な成分を時間とともに低減し、または、ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製はスケーリングされ、それにより前記時間ドメイン励振信号を修正し、
ロストオーディオフレームに先行する1つ以上のオーディオフレームに基づいて取得された前記時間ドメイン励振信号(532)またはその1つ以上の複製をスケーリングするために適用されるゲインを徐々に低減する速度は、
LPC合成(580)に入力される時間ドメイン励振信号(572)の決定的な成分が、より小さい単位時間当りのピッチ変化を有する信号と比較したとき、より大きい単位時間当りのピッチ変化を有する信号に対して、より速くフェードアウトするように、および/または、LPC合成(580)に入力される時間ドメイン励振信号(572)の決定的な成分が、ピッチ予測が成功する信号と比較したとき、ピッチ予測が失敗する信号に対して、より速くフェードアウトするように、
ピッチ分析(540)またはピッチ予測の結果に依存して調整される、
方法(900)。 - コンピュータプログラムがコンピュータ上で動作するとき、請求項37〜43のいずれかに記載の方法を実行する、コンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13191133 | 2013-10-31 | ||
EP13191133.1 | 2013-10-31 | ||
EP14178824 | 2014-07-28 | ||
EP14178824.0 | 2014-07-28 | ||
PCT/EP2014/073035 WO2015063044A1 (en) | 2013-10-31 | 2014-10-27 | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016539360A JP2016539360A (ja) | 2016-12-15 |
JP6306175B2 true JP6306175B2 (ja) | 2018-04-04 |
Family
ID=51830301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016527210A Active JP6306175B2 (ja) | 2013-10-31 | 2014-10-27 | 時間ドメイン励振信号に基づくエラーコンシールメントを用いて、復号化されたオーディオ情報を提供するオーディオデコーダおよび復号化されたオーディオ情報を提供する方法 |
Country Status (20)
Country | Link |
---|---|
US (6) | US10381012B2 (ja) |
EP (5) | EP3285256B1 (ja) |
JP (1) | JP6306175B2 (ja) |
KR (4) | KR101957906B1 (ja) |
CN (1) | CN105765651B (ja) |
AU (5) | AU2014343904B2 (ja) |
BR (1) | BR112016009819B1 (ja) |
CA (5) | CA2984535C (ja) |
ES (5) | ES2659838T3 (ja) |
HK (3) | HK1251710A1 (ja) |
MX (1) | MX356334B (ja) |
MY (1) | MY178139A (ja) |
PL (5) | PL3063760T3 (ja) |
PT (5) | PT3285256T (ja) |
RU (1) | RU2678473C2 (ja) |
SG (3) | SG11201603429SA (ja) |
TR (1) | TR201802808T4 (ja) |
TW (1) | TWI569261B (ja) |
WO (1) | WO2015063044A1 (ja) |
ZA (1) | ZA201603528B (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2760573T3 (es) | 2013-10-31 | 2020-05-14 | Fraunhofer Ges Forschung | Decodificador de audio y método para proveer una información de audio decodificada usando un ocultamiento de error que modifica una señal de excitación de dominio de tiempo |
EP3285256B1 (en) | 2013-10-31 | 2019-06-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US10504525B2 (en) * | 2015-10-10 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Adaptive forward error correction redundant payload generation |
CN109155134B (zh) * | 2016-03-07 | 2023-05-23 | 弗劳恩霍夫应用研究促进协会 | 隐藏音频帧丢失的错误隐藏单元、音频解码器和相关方法 |
BR112018067944B1 (pt) | 2016-03-07 | 2024-03-05 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V | Unidade de ocultação de erro, método de ocultação de erro,decodificador de áudio, codificador de áudio, método para fornecer uma representação de áudio codificada e sistema |
WO2017153299A2 (en) | 2016-03-07 | 2017-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Error concealment unit, audio decoder, and related method and computer program fading out a concealed audio frame out according to different damping factors for different frequency bands |
CN107248411B (zh) | 2016-03-29 | 2020-08-07 | 华为技术有限公司 | 丢帧补偿处理方法和装置 |
CN108922551B (zh) * | 2017-05-16 | 2021-02-05 | 博通集成电路(上海)股份有限公司 | 用于补偿丢失帧的电路及方法 |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091573A1 (en) * | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
US10278034B1 (en) | 2018-03-20 | 2019-04-30 | Honeywell International Inc. | Audio processing system and method using push to talk (PTT) audio attributes |
EP3576088A1 (en) | 2018-05-30 | 2019-12-04 | Fraunhofer Gesellschaft zur Förderung der Angewand | Audio similarity evaluator, audio encoder, methods and computer program |
WO2020164751A1 (en) | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment |
WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
CN111554309A (zh) * | 2020-05-15 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 一种语音处理方法、装置、设备及存储介质 |
CN113763973A (zh) * | 2021-04-30 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 音频信号增强方法、装置、计算机设备和存储介质 |
CN112992160B (zh) * | 2021-05-08 | 2021-07-27 | 北京百瑞互联技术有限公司 | 一种音频错误隐藏方法及装置 |
CN114613372B (zh) * | 2022-02-21 | 2022-10-18 | 北京富通亚讯网络信息技术有限公司 | 一种音频传输抗丢包的错误隐藏技术方法 |
Family Cites Families (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5615298A (en) | 1994-03-14 | 1997-03-25 | Lucent Technologies Inc. | Excitation signal synthesis during frame erasure or packet loss |
JPH1091194A (ja) | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
US6188980B1 (en) | 1998-08-24 | 2001-02-13 | Conexant Systems, Inc. | Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients |
AU4072400A (en) | 1999-04-05 | 2000-10-23 | Hughes Electronics Corporation | A voicing measure as an estimate of signal periodicity for frequency domain interpolative speech codec system |
DE19921122C1 (de) | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
JP4464488B2 (ja) | 1999-06-30 | 2010-05-19 | パナソニック株式会社 | 音声復号化装置及び符号誤り補償方法、音声復号化方法 |
JP3804902B2 (ja) | 1999-09-27 | 2006-08-02 | パイオニア株式会社 | 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置 |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002014697A (ja) | 2000-06-30 | 2002-01-18 | Hitachi Ltd | ディジタルオーディオ装置 |
FR2813722B1 (fr) * | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
US7447639B2 (en) | 2001-01-24 | 2008-11-04 | Nokia Corporation | System and method for error concealment in digital audio transmission |
US7308406B2 (en) | 2001-08-17 | 2007-12-11 | Broadcom Corporation | Method and system for a waveform attenuation technique for predictive speech coding based on extrapolation of speech waveform |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
FR2846179B1 (fr) | 2002-10-21 | 2005-02-04 | Medialive | Embrouillage adaptatif et progressif de flux audio |
US6985856B2 (en) * | 2002-12-31 | 2006-01-10 | Nokia Corporation | Method and device for compressed-domain packet loss concealment |
JP2004361731A (ja) | 2003-06-05 | 2004-12-24 | Nec Corp | オーディオ復号装置及びオーディオ復号方法 |
EP1667109A4 (en) | 2003-09-17 | 2007-10-03 | Beijing E World Technology Co | METHOD AND DEVICE FOR QUANTIFYING MULTI-RESOLUTION VECTOR FOR AUDIO CODING AND DECODING |
KR100587953B1 (ko) * | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US8725501B2 (en) * | 2004-07-20 | 2014-05-13 | Panasonic Corporation | Audio decoding device and compensation frame generation method |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
US8798172B2 (en) | 2006-05-16 | 2014-08-05 | Samsung Electronics Co., Ltd. | Method and apparatus to conceal error in decoded audio signal |
US20090248404A1 (en) | 2006-07-12 | 2009-10-01 | Panasonic Corporation | Lost frame compensating method, audio encoding apparatus and audio decoding apparatus |
US20080046233A1 (en) | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Packet Loss Concealment for Sub-band Predictive Coding Based on Extrapolation of Full-band Audio Waveform |
JP2008058667A (ja) * | 2006-08-31 | 2008-03-13 | Sony Corp | 信号処理装置および方法、記録媒体、並びにプログラム |
JP5289319B2 (ja) * | 2006-10-20 | 2013-09-11 | フランス・テレコム | 隠蔽フレーム(パケット)を生成するための方法、プログラムおよび装置 |
FR2907586A1 (fr) | 2006-10-20 | 2008-04-25 | France Telecom | Synthese de blocs perdus d'un signal audionumerique,avec correction de periode de pitch. |
KR101292771B1 (ko) | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
KR100862662B1 (ko) | 2006-11-28 | 2008-10-10 | 삼성전자주식회사 | 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치 |
CN101207468B (zh) | 2006-12-19 | 2010-07-21 | 华为技术有限公司 | 丢帧隐藏方法、系统和装置 |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
CN101399040B (zh) * | 2007-09-27 | 2011-08-10 | 中兴通讯股份有限公司 | 一种帧错误隐藏的谱参数替换方法 |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
KR100998396B1 (ko) | 2008-03-20 | 2010-12-03 | 광주과학기술원 | 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치 |
CN101588341B (zh) | 2008-05-22 | 2012-07-04 | 华为技术有限公司 | 一种丢帧隐藏的方法及装置 |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
AU2009267459B2 (en) | 2008-07-11 | 2014-01-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
DE102008042579B4 (de) | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten |
US8706479B2 (en) | 2008-11-14 | 2014-04-22 | Broadcom Corporation | Packet loss concealment for sub-band codecs |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
US9076439B2 (en) | 2009-10-23 | 2015-07-07 | Broadcom Corporation | Bit error management and mitigation for sub-band coding |
US8321216B2 (en) * | 2010-02-23 | 2012-11-27 | Broadcom Corporation | Time-warping of audio signals for packet loss concealment avoiding audible artifacts |
US9263049B2 (en) * | 2010-10-25 | 2016-02-16 | Polycom, Inc. | Artifact reduction in packet loss concealment |
KR101551046B1 (ko) * | 2011-02-14 | 2015-09-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법 |
WO2013186345A1 (en) | 2012-06-14 | 2013-12-19 | Dolby International Ab | Error concealment strategy in a decoding system |
US9406307B2 (en) | 2012-08-19 | 2016-08-02 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
US9830920B2 (en) | 2012-08-19 | 2017-11-28 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
TR201808890T4 (tr) | 2013-06-21 | 2018-07-23 | Fraunhofer Ges Forschung | Bir konuşma çerçevesinin yeniden yapılandırılması. |
WO2014202539A1 (en) | 2013-06-21 | 2014-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pitch lag estimation |
CN104282309A (zh) * | 2013-07-05 | 2015-01-14 | 杜比实验室特许公司 | 丢包掩蔽装置和方法以及音频处理系统 |
EP3285256B1 (en) | 2013-10-31 | 2019-06-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
ES2760573T3 (es) | 2013-10-31 | 2020-05-14 | Fraunhofer Ges Forschung | Decodificador de audio y método para proveer una información de audio decodificada usando un ocultamiento de error que modifica una señal de excitación de dominio de tiempo |
KR102547480B1 (ko) | 2014-12-09 | 2023-06-26 | 돌비 인터네셔널 에이비 | Mdct-도메인 에러 은닉 |
-
2014
- 2014-10-27 EP EP17191506.9A patent/EP3285256B1/en active Active
- 2014-10-27 CA CA2984535A patent/CA2984535C/en active Active
- 2014-10-27 WO PCT/EP2014/073035 patent/WO2015063044A1/en active Application Filing
- 2014-10-27 ES ES14790073.2T patent/ES2659838T3/es active Active
- 2014-10-27 PL PL14790073T patent/PL3063760T3/pl unknown
- 2014-10-27 MX MX2016005535A patent/MX356334B/es active IP Right Grant
- 2014-10-27 TR TR2018/02808T patent/TR201802808T4/tr unknown
- 2014-10-27 ES ES17191506T patent/ES2746034T3/es active Active
- 2014-10-27 CN CN201480060303.0A patent/CN105765651B/zh active Active
- 2014-10-27 PT PT17191506T patent/PT3285256T/pt unknown
- 2014-10-27 CA CA2984532A patent/CA2984532C/en active Active
- 2014-10-27 PT PT147900732T patent/PT3063760T/pt unknown
- 2014-10-27 KR KR1020187005572A patent/KR101957906B1/ko active IP Right Grant
- 2014-10-27 EP EP14790073.2A patent/EP3063760B1/en active Active
- 2014-10-27 EP EP17191505.1A patent/EP3285255B1/en active Active
- 2014-10-27 KR KR1020187005570A patent/KR101957905B1/ko active IP Right Grant
- 2014-10-27 PT PT17191505T patent/PT3285255T/pt unknown
- 2014-10-27 CA CA2984562A patent/CA2984562C/en active Active
- 2014-10-27 PL PL17191503T patent/PL3288026T3/pl unknown
- 2014-10-27 KR KR1020187005569A patent/KR101981548B1/ko active IP Right Grant
- 2014-10-27 PL PL17191505T patent/PL3285255T3/pl unknown
- 2014-10-27 SG SG11201603429SA patent/SG11201603429SA/en unknown
- 2014-10-27 ES ES17191503T patent/ES2805744T3/es active Active
- 2014-10-27 PL PL17191506T patent/PL3285256T3/pl unknown
- 2014-10-27 PT PT17191502T patent/PT3285254T/pt unknown
- 2014-10-27 SG SG10201609235UA patent/SG10201609235UA/en unknown
- 2014-10-27 ES ES17191502T patent/ES2732952T3/es active Active
- 2014-10-27 MY MYPI2016000749A patent/MY178139A/en unknown
- 2014-10-27 AU AU2014343904A patent/AU2014343904B2/en active Active
- 2014-10-27 KR KR1020167014227A patent/KR101854297B1/ko active IP Right Grant
- 2014-10-27 ES ES17191505T patent/ES2739477T3/es active Active
- 2014-10-27 PL PL17191502T patent/PL3285254T3/pl unknown
- 2014-10-27 CA CA2929012A patent/CA2929012C/en active Active
- 2014-10-27 BR BR112016009819-6A patent/BR112016009819B1/pt active IP Right Grant
- 2014-10-27 JP JP2016527210A patent/JP6306175B2/ja active Active
- 2014-10-27 RU RU2016121172A patent/RU2678473C2/ru active
- 2014-10-27 EP EP17191503.6A patent/EP3288026B1/en active Active
- 2014-10-27 EP EP17191502.8A patent/EP3285254B1/en active Active
- 2014-10-27 PT PT171915036T patent/PT3288026T/pt unknown
- 2014-10-27 CA CA2984573A patent/CA2984573C/en active Active
- 2014-10-27 SG SG10201609234QA patent/SG10201609234QA/en unknown
- 2014-10-30 TW TW103137626A patent/TWI569261B/zh active
-
2016
- 2016-04-29 US US15/142,547 patent/US10381012B2/en active Active
- 2016-05-24 ZA ZA2016/03528A patent/ZA201603528B/en unknown
- 2016-09-09 US US15/261,443 patent/US10283124B2/en active Active
- 2016-09-09 US US15/261,380 patent/US10262662B2/en active Active
- 2016-09-09 US US15/261,517 patent/US10373621B2/en active Active
- 2016-09-09 US US15/261,341 patent/US10269358B2/en active Active
-
2017
- 2017-02-03 HK HK18110937.5A patent/HK1251710A1/zh unknown
- 2017-11-21 AU AU2017265032A patent/AU2017265032B2/en active Active
- 2017-11-21 AU AU2017265038A patent/AU2017265038B2/en active Active
- 2017-11-22 AU AU2017265062A patent/AU2017265062B2/en active Active
- 2017-11-22 AU AU2017265060A patent/AU2017265060B2/en active Active
- 2017-12-21 US US15/851,247 patent/US10269359B2/en active Active
-
2018
- 2018-08-21 HK HK18110734.0A patent/HK1251349B/zh unknown
- 2018-08-21 HK HK18110733.1A patent/HK1251348B/zh unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6306177B2 (ja) | 時間ドメイン励振信号を修正するエラーコンシールメントを用いて、復号化されたオーディオ情報を提供する、オーディオデコーダおよび復号化されたオーディオ情報を提供する方法 | |
JP6306175B2 (ja) | 時間ドメイン励振信号に基づくエラーコンシールメントを用いて、復号化されたオーディオ情報を提供するオーディオデコーダおよび復号化されたオーディオ情報を提供する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170801 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20171026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180307 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6306175 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |