JP5097219B2 - 非因果性ポストフィルタ - Google Patents
非因果性ポストフィルタ Download PDFInfo
- Publication number
- JP5097219B2 JP5097219B2 JP2009551967A JP2009551967A JP5097219B2 JP 5097219 B2 JP5097219 B2 JP 5097219B2 JP 2009551967 A JP2009551967 A JP 2009551967A JP 2009551967 A JP2009551967 A JP 2009551967A JP 5097219 B2 JP5097219 B2 JP 5097219B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- decoder
- pitch
- signal
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 61
- 238000001914 filtration Methods 0.000 claims abstract description 23
- 230000004044 response Effects 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 36
- 230000008859 change Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 230000006978 adaptation Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 15
- 230000003111 delayed effect Effects 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000001052 transient effect Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000001364 causal effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Solid-Sorbent Or Filter-Aiding Compositions (AREA)
Description
ただし、y(n)は復号化オーディオ又は音声信号、ypは以下のように計算される予測信号である。
yp = 0.5・(y(n-T)) + y(n+T)) (1)
yenh(n) = y(n) - α・LP{r(n)} (2)
Claims (19)
- フレームごとに符号化信号のパラメータ(4)を入力する受信機入力部(40)と、
前記受信機入力部(40)に接続され、前記パラメータに基づいて復号化オーディオ信号(5;54)のフレームを出力するデコーダ(20)と、
前記デコーダ(20)の出力に接続され、前記復号化オーディオ信号(5;54)のフレームに基づいて出力信号(6)を出力するポストフィルタ(30;30A,30B)と、
前記出力信号(6)の出力部(60)と、
を有するデコーダ装置であって、
前記受信機入力部(40)及び前記デコーダ(20)の少なくともいずれか一方は、第1のフレームのパラメータが前記受信機入力部(40)で利用可能になる時と前記第1のフレームの復号化オーディオ信号が前記デコーダ(20)の出力で利用可能になる時との間に少なくとも1つのフレームに対応する時間差が生じるように構成され、
前記ポストフィルタ(30;30A,30B)は、前記受信機入力部(40)に接続され、
前記ポストフィルタ(30;30A,30B)は、各後続フレームの前記パラメータ(4)に応じて前記復号化オーディオ信号(5;54)のフレームをフィルタリングして前記出力信号(6)を得るように構成される
ことを特徴とするデコーダ装置。 - 前記受信機入力部(40)は、連続する少なくとも2つのフレームのパラメータを記憶する記憶部(41)を含み、前記デコーダ(20)は、第1のフレームのパラメータ(4A)を前記記憶部(41)から受信し、前記ポストフィルタ(30;30A,30B)は、後続する第2のフレームのパラメータ(4B)にアクセスすることを特徴とする請求項1に記載のデコーダ装置。
- 前記デコーダ(20)は、前記ポストフィルタ(30;30A,30B)に出力する前に前記復号化オーディオ信号のフレームを遅延させる手段(51:53)を含むことを特徴とする請求項1に記載のデコーダ装置。
- 前記ポストフィルタ(30;30A,30B)は、ピッチポストフィルタを含み、前記ピッチポストフィルタにおいて使用されるピッチパラメータは、前記後続フレームのピッチパラメータに基づくものであることを特徴とする請求項1乃至3のいずれか1項に記載のデコーダ装置。
- 前記ポストフィルタ(30;30A,30B)の前記ピッチポストフィルタは、後続のサブフレームごとに、当該後続のサブフレームのピッチ値を差し引いた時間インデックスの値を求め、前記求めた値が現在の時間インデックス以上である場合、前記後続のサブフレームの前記ピッチ値を、現在のフレームのピッチ進みパラメータとして利用することを特徴とする請求項4に記載のデコーダ装置。
- 出力が前記ポストフィルタ(30;30A,30B)に接続されるオーディオ特性検出器を更に有し、
前記ポストフィルタ(30;30A,30B)は、前記ピッチポストフィルタにおいて使用される前記ピッチパラメータが、現在のフレームと先行フレーム及び後続フレームの少なくともいずれか一方との間のオーディオ特性の変化の有意性の基準に依存して、前記後続フレームの前記ピッチパラメータに基づいて適応化されるように構成されることを特徴とする請求項4又は5記載のデコーダ装置。 - 前記オーディオ特性検出器は、音声アクティビティ検出器及び有声音検出器のうちの少なくともいずれか一方であり、前記ポストフィルタは、有声音の開始が検出された場合に前記ピッチポストフィルタにおいて使用されるピッチパラメータを前記後続フレームのピッチパラメータに基づくものとするように構成されることを特徴とする請求項6に記載のデコーダ装置。
- 前記ポストフィルタ(30;30A,30B)は、前記後続フレームの復号化信号にもアクセスするように構成されることを特徴とする請求項1乃至7のいずれか1項に記載のデコーダ装置。
- 前記デコーダ(20)は、スケーラブルデコーダ(120)又はスケーラブルデコーダの一部であり、前記スケーラブルデコーダの2次デコーダ(25)は、前記スケーラブルデコーダの1次デコーダ(21)よりも高遅延であることを特徴とする請求項1乃至8のいずれか1項に記載のデコーダ装置。
- 前記デコーダ(20)はスケーラブルデコーダ(120)であって、該スケーラブルデコーダは、
前記受信機入力部(40)に接続され、前記パラメータ(4)に基づいて1次復号化信号(23)を出力する1次デコーダ(21)と、
前記受信機入力部(40)に接続され、前記パラメータ(4)に基づいて前記1次復号化信号(23)とは異なる2次復号化信号(26)を出力する2次デコーダ(25)と、
を含むことを特徴とする請求項1乃至8のいずれか1項に記載のデコーダ装置。 - フレームごとに符号化信号のパラメータを受信する受信ステップ(210)と、
前記パラメータを復号化して復号化オーディオ信号を得る復号化ステップ(212)と、を有し、
前記受信ステップ及び前記復号化ステップの少なくともいずれか一方は、第1のフレームのパラメータが受信後に利用可能になった時と前記第1のフレームの復号化オーディオ信号が復号化後に利用可能になる時との間に少なくとも1つのフレームに対応する時間差を生じさせ、
更に、
各後続フレームの前記パラメータに応じて前記復号化オーディオ信号のフレームをポストフィルタリングして出力信号を得るポストフィルタリングステップ(214)と、
前記出力信号を出力する出力ステップ(216)と、
を有することを特徴とする復号化方法。 - 各時点において連続する少なくとも2つのフレームのパラメータを記憶する記憶ステップを更に有し、前記復号化ステップは、第1のフレームのパラメータを使用して実行され、前記ポストフィルタリングは後続する第2のフレームのパラメータにアクセスして実行されることを特徴とする請求項11に記載の復号化方法。
- 前記ポストフィルタリングステップを実行する前に前記復号化オーディオ信号のフレームを遅延させるステップを更に有することを特徴とする請求項11に記載の復号化方法。
- 前記ポストフィルタリングステップ(214)はピッチポストフィルタリングを行うステップを含み、前記ピッチポストフィルタリングにおいて使用されるピッチパラメータは、前記後続フレームのピッチパラメータに基づくものであることを特徴とする請求項11乃至13のいずれか1項に記載の復号化方法。
- 前記ポストフィルタリングステップ(214)における前記ピッチポストフィルタリングは、
後続のサブフレームごとに、当該後続のサブフレームのピッチ値を差し引いた時間インデックスの値を求めるステップ(224)と、
前記求めた値が現在の時間インデックス以上である場合、前記後続のサブフレームの前記ピッチ値を、現在のフレームのピッチ進みパラメータとして利用するステップ(226)と、
を含むことを特徴とする請求項14に記載の復号化方法。 - 前記フレームごとの符号化信号のオーディオ特性を検出する検出ステップを更に有し、
前記ポストフィルタリングステップは、前記ピッチパラメータを、現在のフレームと先行フレーム及び後続フレームの少なくともいずれか一方との間のオーディオ特性の変化の有意性の基準に依存して、前記後続フレームの前記ピッチパラメータに基づいて適応化させる
ことを特徴とする請求項14又は15に記載の復号化方法。 - 前記検出ステップは、音声アクティビティ及び有声音の少なくともいずれか一方を検出するステップを含み、前記ポストフィルタリングステップは、有声音の開始が検出された場合にのみ、前記ピッチパラメータを前記後続フレームのピッチパラメータに基づくものとすることを特徴とする請求項16に記載の復号化方法。
- 前記ポストフィルタリングステップ(214)は、各後続フレームの復号化信号にも応じて実行されることを特徴とする請求項11乃至17のいずれか1項に記載の復号化方法。
- 前記復号化ステップ(212)は、スケーラブルデコーダにおいて復号化を行うステップであり、前記スケーラブルデコーダの2次復号化は、前記スケーラブルデコーダの1次復号化よりも高遅延であることを特徴とする請求項11乃至18のいずれか1項に記載の復号化方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US89266707P | 2007-03-02 | 2007-03-02 | |
US60/892,667 | 2007-03-02 | ||
PCT/SE2007/051000 WO2008108702A1 (en) | 2007-03-02 | 2007-12-14 | Non-causal postfilter |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010520505A JP2010520505A (ja) | 2010-06-10 |
JP5097219B2 true JP5097219B2 (ja) | 2012-12-12 |
Family
ID=39738489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009551967A Expired - Fee Related JP5097219B2 (ja) | 2007-03-02 | 2007-12-14 | 非因果性ポストフィルタ |
Country Status (7)
Country | Link |
---|---|
US (1) | US8620645B2 (ja) |
EP (1) | EP2132733B1 (ja) |
JP (1) | JP5097219B2 (ja) |
CN (1) | CN101622666B (ja) |
AT (1) | ATE548728T1 (ja) |
ES (1) | ES2383365T3 (ja) |
WO (1) | WO2008108702A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101770776B (zh) * | 2008-12-29 | 2011-06-08 | 华为技术有限公司 | 瞬态信号的编码方法和装置、解码方法和装置及处理系统 |
CA3160488C (en) | 2010-07-02 | 2023-09-05 | Dolby International Ab | Audio decoding with selective post filtering |
CN104025191A (zh) * | 2011-10-18 | 2014-09-03 | 爱立信(中国)通信有限公司 | 用于自适应多速率编解码器的改进方法和设备 |
CN105122358B (zh) * | 2013-01-29 | 2019-02-15 | 弗劳恩霍夫应用研究促进协会 | 用于处理编码信号的装置和方法与用于产生编码信号的编码器和方法 |
PL2959480T3 (pl) * | 2013-02-22 | 2016-12-30 | Sposoby i urządzenia do ramek hangover transmisji przerywanej w kodowaniu dźwięku | |
EP3291233B1 (en) | 2013-09-12 | 2019-10-16 | Dolby International AB | Time-alignment of qmf based processing data |
EP2980799A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
US10313249B1 (en) * | 2014-12-09 | 2019-06-04 | Cloud & Stream Gears Llc | Incremental autocorrelation calculation for big data using components |
US10178034B1 (en) * | 2014-12-09 | 2019-01-08 | Cloud & Stream Gears Llc | Iterative autocorrelation function calculation for streamed data using components |
US10492085B2 (en) * | 2016-01-15 | 2019-11-26 | Qualcomm Incorporated | Real-time transport protocol congestion control techniques in video telephony |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2588004B2 (ja) * | 1988-09-19 | 1997-03-05 | 日本電信電話株式会社 | 後処理フィルタ |
CA2142391C (en) * | 1994-03-14 | 2001-05-29 | Juin-Hwey Chen | Computational complexity reduction during frame erasure or packet loss |
US5544278A (en) * | 1994-04-29 | 1996-08-06 | Audio Codes Ltd. | Pitch post-filter |
US5664055A (en) * | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
JP3747492B2 (ja) * | 1995-06-20 | 2006-02-22 | ソニー株式会社 | 音声信号の再生方法及び再生装置 |
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
IL120788A (en) * | 1997-05-06 | 2000-07-16 | Audiocodes Ltd | Systems and methods for encoding and decoding speech for lossy transmission networks |
JP3206497B2 (ja) * | 1997-06-16 | 2001-09-10 | 日本電気株式会社 | インデックスによる信号生成型適応符号帳 |
JP3022462B2 (ja) * | 1998-01-13 | 2000-03-21 | 興和株式会社 | 振動波の符号化方法及び復号化方法 |
FI980132A (fi) | 1998-01-21 | 1999-07-22 | Nokia Mobile Phones Ltd | Adaptoituva jälkisuodatin |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6775649B1 (en) | 1999-09-01 | 2004-08-10 | Texas Instruments Incorporated | Concealment of frame erasures for speech transmission and storage system and method |
US6625226B1 (en) * | 1999-12-03 | 2003-09-23 | Allen Gersho | Variable bit rate coder, and associated method, for a communication station operable in a communication system |
US6687668B2 (en) * | 1999-12-31 | 2004-02-03 | C & S Technology Co., Ltd. | Method for improvement of G.723.1 processing time and speech quality and for reduction of bit rate in CELP vocoder and CELP vococer using the same |
US6850884B2 (en) * | 2000-09-15 | 2005-02-01 | Mindspeed Technologies, Inc. | Selection of coding parameters based on spectral content of a speech signal |
US7319703B2 (en) * | 2001-09-04 | 2008-01-15 | Nokia Corporation | Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts |
US7353168B2 (en) * | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
US20040002856A1 (en) | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
US7391812B2 (en) * | 2002-07-14 | 2008-06-24 | Apple Inc. | Adaptively post filtering encoded video |
US7394833B2 (en) * | 2003-02-11 | 2008-07-01 | Nokia Corporation | Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification |
US7478040B2 (en) * | 2003-10-24 | 2009-01-13 | Broadcom Corporation | Method for adaptive filtering |
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
-
2007
- 2007-12-14 US US12/529,682 patent/US8620645B2/en active Active
- 2007-12-14 ES ES07852271T patent/ES2383365T3/es active Active
- 2007-12-14 JP JP2009551967A patent/JP5097219B2/ja not_active Expired - Fee Related
- 2007-12-14 CN CN2007800519628A patent/CN101622666B/zh not_active Expired - Fee Related
- 2007-12-14 AT AT07852271T patent/ATE548728T1/de active
- 2007-12-14 WO PCT/SE2007/051000 patent/WO2008108702A1/en active Application Filing
- 2007-12-14 EP EP07852271A patent/EP2132733B1/en not_active Not-in-force
Also Published As
Publication number | Publication date |
---|---|
JP2010520505A (ja) | 2010-06-10 |
CN101622666B (zh) | 2012-08-15 |
US8620645B2 (en) | 2013-12-31 |
EP2132733B1 (en) | 2012-03-07 |
ES2383365T3 (es) | 2012-06-20 |
ATE548728T1 (de) | 2012-03-15 |
US20100063805A1 (en) | 2010-03-11 |
EP2132733A4 (en) | 2010-12-15 |
WO2008108702A1 (en) | 2008-09-12 |
EP2132733A1 (en) | 2009-12-16 |
CN101622666A (zh) | 2010-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5097219B2 (ja) | 非因果性ポストフィルタ | |
JP5009910B2 (ja) | レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法 | |
JP6887995B2 (ja) | セカンダリチャンネルを符号化するためにプライマリチャンネルのコーディングパラメータを使用するステレオ音声信号を符号化するための方法およびシステム | |
JP5149198B2 (ja) | 音声コーデック内の効率的なフレーム消去隠蔽の方法およびデバイス | |
RU2469419C2 (ru) | Способ и устройство для управления сглаживанием стационарного фонового шума | |
KR101303145B1 (ko) | 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더 | |
JP5395066B2 (ja) | 音声区間検出および音声信号分類ための方法および装置 | |
CA2483791A1 (en) | Method and device for efficient frame erasure concealment in linear predictive based speech codecs | |
AU2008221657B2 (en) | Method and arrangement for smoothing of stationary background noise | |
JP5255575B2 (ja) | レイヤード・コーデックのためのポストフィルタ | |
Gibson | Speech coding for wireless communications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120521 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120802 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120827 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120921 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5097219 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150928 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |