JP5164970B2 - 音声復号装置および音声復号方法 - Google Patents

音声復号装置および音声復号方法 Download PDF

Info

Publication number
JP5164970B2
JP5164970B2 JP2009502460A JP2009502460A JP5164970B2 JP 5164970 B2 JP5164970 B2 JP 5164970B2 JP 2009502460 A JP2009502460 A JP 2009502460A JP 2009502460 A JP2009502460 A JP 2009502460A JP 5164970 B2 JP5164970 B2 JP 5164970B2
Authority
JP
Japan
Prior art keywords
signal
high frequency
decoded
coefficient
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009502460A
Other languages
English (en)
Other versions
JPWO2008108082A1 (ja
Inventor
宏幸 江原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2009502460A priority Critical patent/JP5164970B2/ja
Publication of JPWO2008108082A1 publication Critical patent/JPWO2008108082A1/ja
Application granted granted Critical
Publication of JP5164970B2 publication Critical patent/JP5164970B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

本発明は、CELP(Code-Excited Linear Prediction)方式の音声復号装置および音声復号方法に関し、特に量子化雑音を人間の聴覚特性に合わせて補正し、復号される音声信号の主観品質を高める音声復号装置および音声復号方法に関する。
CELP型音声コーデックでは、復号音声の主観的品質を改善するため、ポストフィルタを用いることが多い(例えば、非特許文献1参照)。非特許文献1のポストフィルタは、ホルマント強調ポストフィルタ、ピッチ強調ポストフィルタ、およびスペクトル傾斜補正(または高域強調)フィルタの3種類のフィルタを直列接続したものに基づいている。ホルマント強調フィルタは音声信号のスペクトルの谷を深くすることにより、スペクトルの谷の部分に存在する量子化雑音を聞こえにくくする効果がある。ピッチ強調ポストフィルタは、音声信号のスペクトルのハーモニクスの谷を深くすることにより、ハーモニクスの谷の部分に存在する量子化雑音を聞こえにくくする効果がある。スペクトル傾斜補正フィルタは、主としてホルマント強調フィルタによって生じるスペクトル傾斜を元に戻す働きをする。例えばホルマント強調フィルタによって高域が減衰する場合、スペクトル傾斜補正フィルタは高域強調を行う。
一方、CELP型音声コーデックの復号信号は、周波数が高い成分ほど減衰しやすくなる傾向がある。これは、高い周波数の信号波形の方が低い周波数の信号波形に比べて波形のマッチングが難しいためである。このような復号信号の高域成分のエネルギー減衰は、聞き手に復号信号の帯域が狭まった印象を与え、これは、復号信号の主観品質の劣化要因となる。
上記のような問題を解決するために、復号音源信号に対する後処理として、復号音源信号の傾斜補正を行う技術が提案されている(例えば、特許文献1参照)。この技術では、復号音源信号のスペクトル傾斜に応じて、復号音源信号のスペクトルがフラットになるように復号音源信号の傾斜を補正する。
一方、復号音源信号に対する後処理として、復号音源信号の傾斜補正を行う際、高域強調をしすぎると、高域に存在する量子化雑音が聞こえるようになり、これは、主観品質を劣化させる方向に働く場合がある。この量子化雑音が主観品質の劣化として感じられるかどうかは復号信号、または入力信号の特徴に依存する。例えば、復号信号が、背景に雑音のないクリーンな音声信号である場合、つまり入力信号がそのような音声信号である場合には、高域強調によって増幅される高域の量子化雑音は比較的聞こえやすい。逆に、復号信号が、背景に高いレベルの雑音がある音声信号である場合、つまり入力信号がそのような音声信号である場合には、高域強調によって増幅される高域の量子化雑音は背景雑音にマスクされるため比較的聞こえにくい。このため、背景雑音のレベルが高い場合には、高域強調が弱すぎると、帯域が狭まった印象を与えることが主観品質を下げる要因となりやすいため、高域強調を十分行う必要がある。
J-H. Chen and A. Gersho, "Adaptive Postfiltering for Quality Enhancement of Coded Speech," IEEE Trans. on Speech and Audio Process. vol.3, no.1, January 1995 米国特許第6,385,573号公報
しかしながら、特許文献1に記載の高域強調という復号音源信号の傾斜補正処理においては、復号された音源信号のスペクトルの傾斜に応じて傾斜補正の度合いを決定しているものの、背景雑音レベルの大きさによって許容される傾斜補正の強さが変化するという事実を考慮していない。
本発明の目的は、復号音源信号に対する後処理として、復号音源信号の傾斜補正を行う際、背景雑音レベルの大きさに応じて高域強調の度合いを調整することができる音声復号装置および音声復号方法を提供することである。
本発明の音声復号装置は、音声信号を符号化して得られた符号化データを復号して復号音声信号を得る音声復号手段と、前記復号音声信号のモードが定常雑音区間であるか否かを一定時間毎に判定するモード判定手段と、前記復号音声信号のパワーを算出するパワー算出手段と、前記モード判定手段におけるモード判定結果と、前記復号音声信号のパワーとを用いて復号音声信号のSNR(Signal to Noise Ratio)を算出するSNR算出手段と、前記SNRを用いて音源信号の高域強調処理を含むポストフィルタリング処理を行うポストフィルタリング手段と、を具備する構成を採る。
本発明の音声復号方法は、音声信号を符号化して得られた符号化データを復号して復号音声信号を得るステップと、前記復号音声信号のモードが定常雑音区間であるか否かを一定時間毎に判定するステップと、前記復号音声信号のパワーを算出するステップと、前記モード判定手段におけるモード判定結果と、前記復号音声信号のパワーとを用いて復号音声信号のSNRを算出するステップと、前記SNRを用いて音源信号の高域強調処理を含むポストフィルタリング処理を行うステップと、を有するようにした。
本発明によれば、復号音源信号に対する後処理として、復号音源信号の傾斜補正を行う際、復号音声信号のSNRに基づき、重み付き線形予測残差信号の高域強調処理用の係数を算出し、背景雑音レベルの大きさに応じて高域強調の度合いを調整することができるため、出力される音声信号の主観品質を高めることができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
図1は、本発明の実施の形態に係る音声符号化装置100の主要な構成を示すブロック図である。
図1において、音声符号化装置100は、LPC抽出/符号化部101、音源信号探索
/符号化部102、および多重化部103を備える。
LPC抽出/符号化部101は、入力される音声信号に対し線形予測分析を行って線形予測係数(LPC:Linear Prediction Coefficient)を抽出し、得られたLPCを音源信号探索/符号化部102に出力する。さらにLPC抽出/符号化部101は、前記LPCを量子化および符号化し、得られる量子化LPCを音源信号探索/符号化部102に、LPC符号化データを多重化部103に、それぞれ出力する。
音源信号探索/符号化部102は、LPC抽出/符号化部101から入力されるLPCに重み係数を乗じて得られる係数をフィルタ係数とする聴覚重み付けフィルタを用いて、入力音声信号に対しフィルタリング処理を行って聴覚重み付け入力音声信号を得る。また、音源信号探索/符号化部102は、量子化LPCをフィルタ係数とするLPC合成フィルタを用いて、別途生成した音源信号に対しフィルタリング処理を行って復号信号を得、復号信号に対してさらに聴覚重み付けフィルタをかけることにより聴覚重み付け合成信号を得る。ここで、音源信号探索/符号化部102は、得られる聴覚重み付け合成信号と、聴覚重み付け入力音声信号との残差信号を最小とする音源信号を探索し、探索により特定された音源信号を示す情報を音源符号化データとして多重化部103に出力する。
多重化部103は、LPC抽出/符号化部101から入力されるLPC符号化データと、音源信号探索/符号化部102から入力される音源符号化データとを多重化し、得られる音声符号化データに対してさらにチャネル符号化などの処理を行い伝送路に送出する。
図2は、本実施の形態に係る音声復号装置200の主要な構成を示すブロック図である。
図2において、音声復号装置200は、分離部201、重み係数決定部202、LPC復号部203、音源信号復号部204、LPC合成フィルタ205、パワー算出部206、モード判定部207、SNR算出部208、およびポストフィルタ209を備える。
分離部201は、音声符号化装置100から送信される音声符号化データから、符号化ビットレートに関する情報(ビットレート情報)、LPC符号化データ、および、音源符号化データを分離し、重み係数決定部202、LPC復号部203、および音源信号復号部204それぞれに出力する。
重み係数決定部202は、分離部201から入力されるビットレート情報に応じて、ポストフィルタリング処理用の第1重み係数γ1および第2重み係数γ2を算出または選択し、ポストフィルタ209に出力する。なお、第1重み係数γ1および第2重み係数γ2の詳細については後述する。
LPC復号部203は、分離部201から入力されるLPC符号化データを用いて復号処理を行い、得られるLPCをLPC合成フィルタ205およびポストフィルタ209に出力する。ここで、音声符号化装置100におけるLPCの量子化および符号化は、LPCと1対1の対応関係を有する線スペクトル対(LSP:Line Spectrum Pair または Line Spectral Pair。線スペクトル周波数(LSF:Line Spectrum Frequency または Line Spectral Frequency)と呼ばれることもある)を量子化および符号化することで行われるものとする。かかる場合、LPC復号部203は、復号処理においてまず量子化LSPを得、これをLPCに変換して量子化LPCを得る。LPC復号部203は、復号された量子化LSP(以下、「復号LSP」と称す)をモード判定部207に出力する。
音源信号復号部204は、分離部201から入力される音源符号化データを用いて復号
処理を行い、得られる復号音源信号をLPC合成フィルタ205に出力し、復号音源信号の復号過程で得られる復号ピッチラグおよび復号ピッチゲインをモード判定部207に出力する。
LPC合成フィルタ205は、LPC復号部203から入力される復号LPCをフィルタ係数とする線形予測フィルタであり、音源信号復号部204から入力される音源信号に対しフィルタリング処理を行い、得られる復号音声信号をパワー算出部206およびポストフィルタ209に出力する。
パワー算出部206は、LPC合成フィルタ205から入力される復号音声信号のパワーを算出し、モード判定部207およびSNR算出部208に出力する。ここで、復号音声信号のパワーは、復号音声信号の2乗和のサンプルあたりの平均値を、デシベル(dB)で表した値である。すなわち、「X」を用いて、復号音声信号の2乗和のサンプルあたりの平均値を示す場合、デシベルで表される復号音声信号のパワーは10log10Xとなる。
モード判定部207は、LPC復号部203から入力される復号LSP、音源信号復号部204から入力される復号ピッチラグ、復号ピッチゲイン、およびパワー算出部206から入力される復号音声信号パワーを用いて、下記の(a)〜(f)までの基準に従い、復号音声信号が定常雑音区間であるか否かを判定し、判定結果をSNR算出部208に出力する。すなわち、モード判定部207は、(a)所定時間における復号LSPの変動幅が所定レベル以上である場合には、定常雑音区間でないと判定し、(b)過去に定常雑音区間と判定された区間における復号LSPの平均値と、LPC復号部203から入力される復号LSPとの距離が大きい場合には、定常雑音区間でないと判定し、(c)音源信号復号部204から入力される復号ピッチゲイン、またはこのピッチゲインを時間的に平滑化した値が所定の閾値以上である場合には、定常雑音区間ではないと判定し、(d)過去所定の時間内に音源信号復号部204から入力された複数個の復号ピッチラグ間の類似度合いが所定レベル以上である場合には、定常雑音区間ではないと判定し、(e)パワー算出部206から入力された復号音源信号パワーが過去に比べて所定の閾値以上の上昇率で上昇した場合には、定常雑音区間でないと判定し、(f)LPC復号部203から入力される隣接する復号LSP間の間隔が所定の閾値よりも狭く、急峻なスペクトルピークが存在する場合には、定常雑音区間ではないと判定する。これらの判定基準を用いて、復号音声信号の定常的な区間を検出し(例えば前記(a)の基準を用いる)、検出された定常的な区間から、音声信号の有声定常部など雑音区間ではない区間を除外し(例えば前記(c)(d)の基準を用いる)、さらに定常雑音区間でない区間を除外して(例えば前記(b)(e)(f)の基準を用いる)、定常雑音区間を得る。
SNR(Signal to Noise Ratio)算出部208は、パワー算出部206から入力される復号音源信号のパワー、およびモード判定部207から入力されるモード判定結果を用いて復号音源信号のSNRを算出し、ポストフィルタ209に出力する。なお、SNR算出部208の詳細な構成および動作については後述する。
ポストフィルタ209は、重み係数決定部202から入力される第1重み係数γ1、第2重み係数γ2、LPC復号部203から入力されるLPC、LPC合成フィルタ205から入力される復号音声信号、およびSNR算出部208から入力されるSNRを用いて、ポストフィルタリング処理を行い、得られる音声信号を出力する。なお、ポストフィルタ209におけるポストフィルタリング処理については後述する。
図3は、SNR算出部208の内部の構成を示すブロック図である。
図3において、SNR算出部208は、雑音レベル短期平均部281、SNR算出部282、および雑音レベル長期平均部283を備える。
雑音レベル短期平均部281は、パワー算出部206から入力される現フレームの復号音声信号パワーが、雑音レベル長期平均部282から入力される雑音レベルより低い場合に、現フレームの復号音声信号パワーと、雑音レベルとを用いて下記の式(1)に従って雑音レベルを更新する。そして、雑音レベル短期平均部281は、更新された雑音レベルを雑音レベル長期平均部283およびSNR算出部282に出力する。また、雑音レベル短期平均部281は、現フレームの復号音声信号のパワーが雑音レベル以上である場合には、入力した雑音レベルを更新せずに雑音レベル長期平均部283およびSNR算出部282に出力する。ここで、雑音レベル短期平均部281の意図することは、雑音レベルより入力された復号音声信号パワーの方が低い場合はその雑音レベルの信頼性が低いと考え、入力された復号音声信号のパワーが雑音レベルにより反映されるように、復号音声信号の短時間平均によって雑音レベルを更新することにある。したがって、式(1)の係数0.5はこれに限定されず、後述される雑音レベル長期平均部283で用いられる(2)式の係数0.9375より小さい値であればよい。これにより、雑音レベル長期平均部283で算出される長時間平均の雑音レベルよりもより現在の復号音声信号のパワーが反映されやすくなり、雑音レベルが速やかに現在の復号音声信号のパワーに近づくようになる。
(雑音レベル)=0.5×(雑音レベル)+0.5×(現フレームの復号音声信号パワー) …(1)
SNR算出部282は、パワー算出部206から入力される復号音声信号パワーと、雑音レベル短期平均部281から入力される雑音レベルとの差を算出し、復号音声信号のSNRとしてポストフィルタ209に出力する。ここで、復号音声信号パワーおよび雑音レベルは、両方ともデシベルで表される値であるため、両者の差を算出することにより、SNRが得られる。
雑音レベル長期平均部283は、モード判定部207から入力されるモード判定結果が定常雑音区間を示すか、または現フレームの復号音声信号パワーが所定の閾値未満である場合に、現フレームの復号音声信号パワーと、雑音レベル短期平均部281から入力される雑音レベルとを用いて下記の式(2)に従い雑音レベルを更新する。そして、雑音レベル長期平均部283は、更新された雑音レベルを次フレームの処理における雑音レベルとして、雑音レベル短期平均部281に出力する。また、雑音レベル長期平均部283は、モード判定結果が定常雑音区間を示さず、かつパワー算出部206から入力される現フレームの復号音声信号のパワーが所定の閾値以上である場合には、入力された雑音レベルを更新せず、そのまま次フレームの処理において用いる雑音レベルとして、雑音レベル短期平均部281に出力する。ここで、雑音レベル長期平均部283の意図することは、雑音区間または無音区間における復号音声信号パワーの長時間平均を求めることにある。したがって、式(2)の係数0.9375は、この値に限定されるものではないが、0.9以上の1.0に近い値に設定される。なお、0.9375は15/16であり、固定小数点演算化による誤差が発生しない値となっている。
(雑音レベル)=0.9375×(雑音レベル)+(1−0.9375)×(現フレームの復号音声信号パワー) …(2)
図4は、SNR算出部208において復号音声信号のSNRを算出する手順を示すフロー図である。
まず、ステップ(以下、「ST」と記す)1010において、雑音レベル短期平均部281は、雑音レベル長期平均部283から入力される雑音レベルよりも、パワー算出部206から入力される復号音声信号のパワーが小さいか否かを判定する。
ST1010において復号音声信号のパワーが雑音レベルより小さいと判定された場合(ST1010:「YES」)には、雑音レベル短期平均部281は、ST1020において、復号音声信号のパワーと雑音レベルとを用い、式(1)に従って雑音レベルを更新する。
一方、ST1010において復号音声信号のパワーが雑音レベル以上であると判定された場合(ST1010:「NO」)には、雑音レベル短期平均部281は、ST1030において、雑音レベルを更新せずにそのまま出力する。
次いで、ST1040において、SNR算出部282は、パワー算出部206から入力される復号音声信号パワーと、雑音レベル短期平均部281から入力される雑音レベルとの差をSNRとして算出する。
次いで、ST1050において、雑音レベル長期平均部283は、モード判定部207から入力されるモード判定結果が定常雑音区間を示すか否かを判定する。
ST1050においてモード判定結果が定常雑音区間を示さないと判定された場合(ST1050:「NO」)には、雑音レベル長期平均部283は、次いでST1060において、復号音声信号のパワーが所定の閾値未満であるか否かを判定する。
ST1060において復号音声信号のパワーが所定の閾値以上であると判定された場合(ST1060:「NO」)には、雑音レベル長期平均部283は、雑音レベルの更新を行わない。
一方、ST1050においてモード判定結果が定常雑音区間を示すと判定された場合(ST1050:「YES」)、またはST1060において復号音声信号のパワーが所定の閾値未満であると判定された場合(ST1060:「YES」)には、ST1070において、雑音レベル長期平均部283は、復号音声信号のパワーと、雑音レベルとを用いて式(2)に従い、雑音レベルを更新する。
図5は、ポストフィルタ209の内部の構成を示すブロック図である。
図5において、ポストフィルタ209は、第1乗算係数算出部291、第1重み付きLPC算出部292、LPC逆フィルタ293、LPF(Low Pass Filter)294、HPF(High Pass Filter)295、第1エネルギー算出部296、第2エネルギー算出部297、第3エネルギー算出部298、相互相関算出部299、エネルギー比算出部300、高域強調係数算出部301、低域増幅係数算出部302、高域増幅係数算出部303、乗算器304、乗算器305、加算器306、第2乗算係数算出部307、第2重み付きLPC算出部308、LPC合成フィルタ309を備える。
第1乗算係数算出部291は、重み係数決定部202から入力される第1重み係数γを用い、j次の線形予測係数に乗じる係数γ を第1乗算係数として算出して第1重み付きLPC算出部292に出力する。ここで、γ は、γのj乗を求めることにより算出される。なお、0≦γ≦1である。
第1重み付きLPC算出部292は、LPC復号部203から入力されるj次のLPCに、第1乗算係数算出部291から入力される第1乗算係数γ を乗じて、乗算結果を第1重み付きLPCとしてLPC逆フィルタ293に出力する。
LPC逆フィルタ293は、伝達関数がHi(z)=1+ΣM j=1j1×z−jであらわされる線形予測逆フィルタであり、LPC合成フィルタ205から入力される復号音声信号に対しフィルタリング処理を行い、得られる重み付き線形予測残差信号をLPF294、HPF295、および第3エネルギー算出部298に出力する。ここで、aj1は、第1重み付きLPC算出部292から入力されるj次の第1重み付きLPCを示す。
LPF294は、直線位相の低域通過フィルタであり、LPC逆フィルタ293から入力される重み付き線形予測残差信号の低域成分を抽出して第1エネルギー算出部296、相互相関算出部299、および乗算器304に出力する。HPF295は、直線位相の高域通過フィルタであり、LPC逆フィルタ293から入力される重み付き線形予測残差信号の高域成分を抽出して第2エネルギー算出部297、相互相関算出部299、および乗算器305に出力する。ここで、LPF294の出力信号とHPF295の出力信号とを加算して得られる信号と、LPC逆フィルタ293の出力信号とは一致するという関係にある。なお、LPF294とHPF295とは両方とも遮断特性がゆるやかなフィルタであり、例えばHPF295の出力信号には、ある程度の低域成分が残るように設計されている。
第1エネルギー算出部296は、LPF294から入力される重み付き線形予測残差信号の低域成分のエネルギーを算出し、エネルギー比算出部300、低域増幅係数算出部302、および高域増幅係数算出部303に出力する。
第2エネルギー算出部297は、HPF295から入力される重み付き線形予測残差信号の高域成分のエネルギーを算出し、エネルギー比算出部300、低域増幅係数算出部302、および高域増幅係数算出部303に出力する。
第3エネルギー算出部298は、LPC逆フィルタ293から入力される重み付き線形予測残差信号のエネルギーを算出し、低域増幅係数算出部302、および高域増幅係数算出部303に出力する。
相互相関算出部299は、LPF294から入力される重み付き線形予測残差信号の低域成分と、HPF295から入力される重み付き線形予測残差信号の高域成分との相互相関を算出し、低域増幅係数算出部302および高域増幅係数算出部303に出力する。
エネルギー比算出部300は、第1エネルギー算出部296から入力される重み付き線形予測残差信号の低域成分のエネルギーと、第2エネルギー算出部297から入力される重み付き線形予測残差信号の高域成分のエネルギーとの比を算出し、エネルギー比ERとして高域強調係数算出部301に出力する。エネルギー比ERは、ER=10(log10EL−log10EH)という式により算出され、デシベル単位で表される。ここで、ELは低域成分のエネルギーを示し、EHは高域成分のエネルギーを示す。
高域強調係数算出部301は、エネルギー比算出部300から入力されるエネルギー比ER、およびSNR算出部208から入力されるSNRを用いて、高域強調係数Rを算出し低域増幅係数算出部302および高域増幅係数算出部303に出力する。ここで、高域強調係数Rは、高域強調処理後の線形予測残差信号の低域成分と高域成分とのエネルギー比として定義される係数である。つまり、高域強調をすることによって低域成分と高域成分のエネルギー比をどのくらいにしたいのかを示す数である。
低域増幅係数算出部302は、高域強調係数算出部301から入力される高域強調係数R、第1エネルギー算出部296から入力される重み付き線形予測残差信号の低域成分のエネルギー、第2エネルギー算出部297から入力される重み付き線形予測残差信号の高
域成分のエネルギー、第3エネルギー算出部298から入力される重み付き線形予測残差信号のエネルギー、および相互相関算出部299から入力される重み付き線形予測残差信号の高域成分と低域成分との相互相関を用いて、下記の式(3)に従い低域増幅係数βを算出して乗算器304に出力する。
Figure 0005164970
式(3)において、iはサンプル番号、ex[i]は高域強調処理前の音源信号(重み付き線形予測残差信号)、eh[i]はex[i]の高域成分、el[i]はex[i]の低域成分それぞれを示す(以下同様)。
高域増幅係数算出部303は、高域強調係数算出部301から入力される高域強調係数R、第1エネルギー算出部296から入力される重み付き線形予測残差信号の低域成分のエネルギー、第2エネルギー算出部297から入力される重み付き線形予測残差信号の高域成分のエネルギー、第3エネルギー算出部298から入力される重み付き線形予測残差信号のエネルギー、および相互相関算出部299から入力される重み付き線形予測残差信号の高域成分と低域成分との相互相関を用いて、下記の式(4)に従い高域増幅係数αを算出して乗算器305に出力する。式(4)の詳細については後述する。
Figure 0005164970
乗算器304は、LPF294から入力される重み付き線形予測残差信号の低域成分に、低域増幅係数算出部302から入力される低域増幅係数βを乗じて、乗算結果を加算器306に出力する。この乗算結果はすなわち、重み付き線形予測残差信号の低域成分を増幅した結果である。
乗算器305は、HPF295から入力される重み付き線形予測残差信号の高域成分に、高域増幅係数算出部303から入力される高域増幅係数αを乗じて、乗算結果を加算器306に出力する。この乗算結果はすなわち、重み付き線形予測残差信号の高域成分を増幅した結果である。
加算器306は、乗算器304の乗算結果と乗算器305の乗算結果とを加算し、加算結果をLPC合成フィルタ309に出力する。この加算結果すなわち、低域増幅係数βで増幅された低域成分と、高域増幅係数αで増幅された高域成分とを加算した結果であり、重み付き線形予測残差信号に対し高域強調処理を行った結果となる。
第2乗算係数算出部307は、重み係数決定部202から入力される第2重み係数γを用い、j次の線形予測係数に乗じる係数γ を第2乗算係数として算出して第2重み付きLPC算出部308に出力する。ここで、γ は、γのj乗を求めることにより算出される。
第2重み付きLPC算出部308は、LPC復号部203から入力されるj次のLPC
に、第2乗算係数算出部307から入力される第2乗算係数γ を乗じて、乗算結果を第2重み付きLPCとしてLPC合成フィルタ309に出力する。
LPC合成フィルタ309は、伝達関数がHs(z)=1/(1+aj2×z−j)で表される線形予測フィルタで、加算器306から入力される高域強調処理後の重み付け線形予測残差信号に対してフィルタリング処理を行い、ポストフィルタリング後の音声信号を出力する。ここで、aj2は、第2重み付きLPC算出部308から入力されるj次の第2重み付きLPCを示す。
図6は、高域強調係数算出部301、低域増幅係数算出部302、および高域増幅係数算出部303において、高域強調係数R、低域増幅係数β、および高域増幅係数αを算出する手順を示すフロー図である。
まず、高域強調係数算出部301は、SNR算出部282で算出されたSNRが閾値AA1より大きいか否かを判定し(ST2010)、SNRが閾値AA1より大きいと判定された場合(ST2010:「YES」)には、変数Kの値を定数BB1に設定するとともに、変数Attの値を定数CC1に設定する(ST2020)。一方、SNRが閾値AA1以下であると判定された場合(ST2010:「NO」)には、高域強調係数算出部301は、SNRが閾値AA2より小さいか否かを判定する(ST2030)。SNRが閾値AA2より小さいと判定された場合(ST2030:「YES」)には、高域強調係数算出部301は、変数Kの値を定数BB2に設定するとともに、変数Attの値を定数CC2設定する(ST2040)。一方、SNRが閾値AA2以上であると判定された場合(ST2030:「NO」)には、高域強調係数算出部301は、下記の式(5)および式(6)それぞれに従って変数Kおよび変数Attの値を設定する(ST2050)。AA1,AA2,BB1,BB2,CC1,CC2の値としては、例えば、AA1=7,AA2=5,BB1=3.0,BB2=1.0、CC1=0.625または0.7、CC2=0.125または0.2、などが好適である。
K=(SNR−AA2)×(BB1−BB2)/(AA1−AA2)+BB2
…(5)Att=(SNR−AA2)×(CC1−CC2)/(AA1−AA2)+CC2
…(6)
次いで、高域強調係数算出部301は、エネルギー比算出部300で算出されたエネルギー比ERが変数Kの値以下であるか否かを判定する(ST2060)。ST2060において、エネルギー比ERが変数Kの値以下であると判定された場合(ST2060:「YES」)には、低域増幅係数算出部302は、低域増幅係数βを「1」とし、高域増幅係数算出部303は、高域増幅係数αを「1」とする(ST2070)。ここで、低域増幅係数βおよび高域増幅係数αを「1」にするということは、LPF294およびHPF295それぞれで抽出された、重み付き線形予測残差信号の低域成分および高域成分の両方とも増幅しないということである。
一方、ST2060において、エネルギー比ERが変数Kの値より大きいと判定された場合(ST2060:「NO」)には、高域強調係数算出部301は、下記の式(7)に従って高域強調係数Rを算出する(ST2080)。式(7)の意味するところは、高域強調処理後の音源信号の低域成分と高域成分のレベル比は最低Kであり、かつ、高域強調処理前のレベル比に応じて高域強調処理後のレベル比が大きくなるということである。また、高域強調係数算出部301の処理から、SNRが高いほどAttもKも大きく、SNRが低いほどAttもKも小さくなる。したがって、SNRが高い場合はレベル比の最低値Kは高くなり、SNRが低い場合はレベル比の最低値Kは低くなる。また、SNRが高いとAttが大きくなるので、高域強調処理後のレベル比Rも大きくなり、SNRが低い
とAttが小さくなるので、高域強調処理後のレベル比Rも小さくなる。レベル比が低いほどスペクトルはフラットに近づき、高域が持ち上げられる(すなわち強調される)ことになる。したがって、AttもKも、SNRが高くなると高域強調の強さが弱くなり、SNRが低くなると高域強調の強さが強くなるように、高域強調係数を制御するパラメータとして機能する。
R=(ER−K)×Att+K …(7)
次いで、低域増幅係数算出部302および高域増幅係数算出部303は、それぞれ式(3)および式(4)に従って、低域増幅係数βおよび高域増幅係数αそれぞれを算出する(ST2090)。ここで、式(3)および式(4)は、下記の式(8)および式(9)に示す2つの拘束条件から導かれる式である。これら2つの式が意味するのは、高域強調処理の前後で音源信号のエネルギーが変わらないこと、高域強調処理の後の低域成分と高域成分のエネルギー比がRになること、の2つである。
Figure 0005164970
Figure 0005164970
式(8)および式(9)において、高域強調処理前の音源信号ex[i]、高域強調処理後の音源信号ex’[i]、ex[i]の高域成分eh[i]、ex[i]の低域成分el[i]は、下記の式(10)および式(11)に示すような関係にある。
ex[i]=eh[i]+el[i] …(10)
ex’[i]=α×eh[i]+β×el[i] …(11)
従って、式(8)および式(9)は、下記の式(12)および式(13)と等価となり、これらの式から式(3)および式(4)が得られる。
Figure 0005164970
Figure 0005164970
図7は、ポストフィルタ209におけるポストフィルタリング処理の主な手順を示すフロー図である。
ST3010において、LPC逆フィルタ293は、LPC合成フィルタ205から入力される復号音声信号に対しLPC合成フィルタリング処理を行って重み付き線形予測残差信号を得る。
ST3020において、LPF294は、重み付け線形予測残差信号の低域成分を抽出する。
ST3030において、HPF295は、重み付け線形予測残差信号の高域成分を抽出する。
ST3040において、第1エネルギー算出部296、第2エネルギー算出部297、第3エネルギー算出部298、および相互相関算出部299それぞれは、重み付き線形予測残差信号の低域成分のエネルギー、重み付き線形予測残差信号の高域成分のエネルギー、重み付き線形予測残差信号のエネルギー、および重み付き線形予測残差信号の低域成分と高域成分との相互相関をそれぞれ算出する。
ST3050において、エネルギー比算出部300は、重み付き線形予測残差信号の低域成分と高域成分とのエネルギー比ERを算出する。
ST3060において、高域強調係数算出部301は、SNR算出部208で算出されたSNR、およびエネルギー比算出部300で算出されたエネルギー比ERを用いて、高域強調係数Rを算出する。
ST3070において、加算器306は、乗算器304で増幅された低域成分と、乗算器305で増幅された高域成分とを加算して、高域強調された重み付き線形予測残差信号を得る。
ST3080において、LPC合成フィルタ309は、高域強調された重み付き線形予測残差信号に対しLPC合成フィルタリング処理を行って、ポストフィルタリング後の音声信号を得る。
なお、図7に示すポストフィルタリング処理の手順において、例えばST3020およびST3030のように、処理の順序が入れ替え可能であったり、並行して処理可能であったりするような場合には、そのようにポストフィルタリング処理の手順を変更することも可能である。
このように、本実施の形態によれば、音声復号装置は、復号音声信号のSNRに基づき、重み付き線形予測残差信号の高域強調処理用の係数を算出してポストフィルタリング処理を行うため、背景雑音レベルの大きさに応じて高域強調の度合いを調整することができる。
なお、本実施の形態では、重み係数決定部202は、ビットレート情報に応じて、ポストフィルタリング処理用の第1重み係数γ1および第2重み係数γ2を算出する場合を例にとって説明した。しかし、、本発明はこれに限定されず、例えば、スケーラブル符号化では、音声符号化装置から送信される符号化データにいくつのレイヤまでの符号化データが含まれているかを示すレイヤ情報など、ビットレート情報に類する情報をビットレート情報の代わりに用いてもよい。また、ビットレート情報やこれに類する情報は、分離部201に入力される符号化データに多重化されていても良く、または分離部201に別途入力されても良く、または分離部201の内部で決定および生成されてもよい。さらには、ビットレート情報やこれに類する情報が分離部201から出力されず、重み係数決定部202が存在しない構成も可能である。この場合、重み係数は予め定められた固定値となる。
また、本実施の形態では、パワー算出部206は、復号音声信号のパワーを算出する場合を例にとって説明した。しかし、本発明はこれに限定されず、パワー算出部206は、復号音声信号のエネルギーを算出してもよい。エネルギーとするには、サンプルあたりの平均値をとらなければよい。また、パワーは10log10Xで算出したが、log10
Xとして閾値等を設計しなおしてもよいし、対数をとらない線形領域で設計することも可能である。
また、本実施の形態では、モード判定部207が復号音声信号のモードを判定する場合を例にとって説明した。しかし、音声符号化装置が入力音声信号の特徴を分析してモード情報を符号化し、音声復号装置に伝送してもよい。
また、本実施の形態において、本実施の形態に係る音声復号装置は、本実施の形態に係る音声符号化装置が送信した音声符号化データを受信して処理を行う場合を例にとって説明した。しかし、本発明はこれに限定されず、本実施の形態に係る音声復号装置が受信して処理する音声符号化データは、この音声復号装置が処理可能である音声符号化データを生成可能な音声符号化装置が送信したものであればよい。
以上、本発明の実施の形態について説明した。
本発明に係る音声復号装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係る音声復号方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る音声復号装置と同様の機能を実現することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてあり得る。
2007年3月2日出願の特願2007−053531の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る音声復号装置および音声復号方法は、音声コーデックにおける量子化雑音をシェイピングする等の用途に適用することができる。
本発明の一実施の形態に係る音声符号化装置の主要な構成を示すブロック図 本発明の一実施の形態に係る音声復号装置の主要な構成を示すブロック図 本発明の一実施の形態に係るSNR算出部の内部の構成を示すブロック図 本発明の一実施の形態に係るSNR算出部において復号音声信号のSNRを算出する手順を示すフロー図 本発明の一実施の形態に係るポストフィルタの内部の構成を示すブロック図 本発明の一実施の形態に係る高域強調係数、低域増幅係数、および高域増幅係数を算出する手順を示すフロー図 本発明の一実施の形態に係るポストフィルタにおけるポストフィルタリング処理の主な手順を示すフロー図

Claims (2)

  1. 音声信号を符号化して得られた符号化データを復号して復号音声信号を得る音声復号手段と、
    前記復号音声信号のモードが定常雑音区間であるか否かを一定時間毎に判定するモード判定手段と、
    前記復号音声信号のパワーを算出するパワー算出手段と、
    前記モード判定手段におけるモード判定結果と、前記復号音声信号のパワーとを用いて復号音声信号のSNR(Signal to Noise Ratio)を算出するSNR算出手段と、
    前記SNRを用いて音源信号の高域強調処理を含むポストフィルタリング処理を行うポストフィルタリング手段と、
    を具備し、
    前記ポストフィルタリング手段は、
    前記復号音声信号に対しLPC逆フィルタリング処理を行い線形予測残差信号を得るLPC逆フィルタリング手段と、
    前記SNRを用いて高域強調係数を算出する高域強調係数算出手段と、
    前記高域強調係数を用いて低域増幅係数と、高域増幅係数とを算出する増幅係数算出手段と、
    前記低域増幅係数を用いて線形予測残差信号の低域成分を増幅して得られる低域増幅信号と、前記高域増幅係数を用いて線形予測残差信号の高域成分を増幅して得られる高域増幅信号とを加算し、高域強調後の線形予測残差信号を得る高域強調処理手段と、
    前記高域強調後の線形予測残差信号に対しLPC合成フィルタリング処理を行うLPC合成フィルタリング手段と、を具備する、
    音声復号装置。
  2. 音声信号を符号化して得られた符号化データを復号して復号音声信号を得るステップと、
    前記復号音声信号のモードが定常雑音区間であるか否かを一定時間毎に判定するステップと、
    前記復号音声信号のパワーを算出するステップと、
    前記モード判定するステップにおけるモード判定結果と、前記復号音声信号のパワーとを用いて復号音声信号のSNRを算出するステップと、
    前記SNRを用いて音源信号の高域強調処理を含むポストフィルタリング処理を行うステップと、
    を具備し、
    前記ポストフィルタリング処理を行うステップは、
    前記復号音声信号に対しLPC逆フィルタリング処理を行い線形予測残差信号を得るステップと、
    前記SNRを用いて高域強調係数を算出するステップと、
    前記高域強調係数を用いて低域増幅係数と、高域増幅係数とを算出するステップと、
    前記低域増幅係数を用いて線形予測残差信号の低域成分を増幅して得られる低域増幅信号と、前記高域増幅係数を用いて線形予測残差信号の高域成分を増幅して得られる高域増幅信号とを加算し、高域強調後の線形予測残差信号を得るステップと、
    前記高域強調後の線形予測残差信号に対しLPC合成フィルタリング処理を行うステップと、を具備する、
    音声復号方法。
JP2009502460A 2007-03-02 2008-02-29 音声復号装置および音声復号方法 Expired - Fee Related JP5164970B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009502460A JP5164970B2 (ja) 2007-03-02 2008-02-29 音声復号装置および音声復号方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007053531 2007-03-02
JP2007053531 2007-03-02
PCT/JP2008/000406 WO2008108082A1 (ja) 2007-03-02 2008-02-29 音声復号装置および音声復号方法
JP2009502460A JP5164970B2 (ja) 2007-03-02 2008-02-29 音声復号装置および音声復号方法

Publications (2)

Publication Number Publication Date
JPWO2008108082A1 JPWO2008108082A1 (ja) 2010-06-10
JP5164970B2 true JP5164970B2 (ja) 2013-03-21

Family

ID=39737980

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009502460A Expired - Fee Related JP5164970B2 (ja) 2007-03-02 2008-02-29 音声復号装置および音声復号方法

Country Status (5)

Country Link
US (1) US8554548B2 (ja)
EP (1) EP2116997A4 (ja)
JP (1) JP5164970B2 (ja)
CN (1) CN101617362B (ja)
WO (1) WO2008108082A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0910811B1 (pt) * 2008-07-11 2021-09-21 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio.
US9253568B2 (en) * 2008-07-25 2016-02-02 Broadcom Corporation Single-microphone wind noise suppression
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
IL302557B1 (en) 2010-07-02 2024-04-01 Dolby Int Ab After–selective bass filter
ES2742823T3 (es) * 2011-04-22 2020-02-17 Wyeth Llc Composiciones relacionadas con una toxina mutante de Clostridium difficile y sus procedimientos
US9117455B2 (en) * 2011-07-29 2015-08-25 Dts Llc Adaptive voice intelligibility processor
US9390721B2 (en) * 2012-01-20 2016-07-12 Panasonic Intellectual Property Corporation Of America Speech decoding device and speech decoding method
WO2013124712A1 (en) * 2012-02-24 2013-08-29 Nokia Corporation Noise adaptive post filtering
WO2014034697A1 (ja) * 2012-08-29 2014-03-06 日本電信電話株式会社 復号方法、復号装置、プログラム、及びその記録媒体
CN105976830B (zh) * 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
US20150025894A1 (en) * 2013-07-16 2015-01-22 Electronics And Telecommunications Research Institute Method for encoding and decoding of multi channel audio signal, encoder and decoder
WO2015079946A1 (ja) * 2013-11-29 2015-06-04 ソニー株式会社 周波数帯域拡大装置および方法、並びにプログラム
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
CN107925388B (zh) 2016-02-17 2021-11-30 弗劳恩霍夫应用研究促进协会 后置处理器、预处理器、音频编解码器及相关方法
US9838737B2 (en) * 2016-05-05 2017-12-05 Google Inc. Filtering wind noises in video content
CN116312601B (zh) * 2023-05-22 2023-08-29 北京探境科技有限公司 音频处理方法、装置、存储介质及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10171497A (ja) * 1996-12-12 1998-06-26 Oki Electric Ind Co Ltd 背景雑音除去装置

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263099A (ja) * 1995-03-23 1996-10-11 Toshiba Corp 符号化装置
JPH09281995A (ja) 1996-04-12 1997-10-31 Nec Corp 信号符号化装置及び方法
US6092041A (en) * 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
DE19643900C1 (de) * 1996-10-30 1998-02-12 Ericsson Telefon Ab L M Nachfiltern von Hörsignalen, speziell von Sprachsignalen
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
US6240383B1 (en) * 1997-07-25 2001-05-29 Nec Corporation Celp speech coding and decoding system for creating comfort noise dependent on the spectral envelope of the speech signal
EP1001542B1 (en) * 1998-05-27 2011-03-02 Ntt Mobile Communications Network Inc. Voice decoder and voice decoding method
US6385573B1 (en) 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6377915B1 (en) * 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
CA2430319C (en) * 2000-11-30 2011-03-01 Matsushita Electric Industrial Co., Ltd. Speech decoding apparatus and speech decoding method
JP3566220B2 (ja) * 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
CN1243424C (zh) * 2002-05-31 2006-02-22 上海贝尔有限公司 宽带码分多址移动通信系统下行链路信噪比估计装置及估计方法
JP4365610B2 (ja) 2003-03-31 2009-11-18 パナソニック株式会社 音声復号化装置および音声復号化方法
JP4786183B2 (ja) * 2003-05-01 2011-10-05 富士通株式会社 音声復号化装置、音声復号化方法、プログラム、記録媒体
WO2005041170A1 (en) * 2003-10-24 2005-05-06 Nokia Corpration Noise-dependent postfiltering
CN101006495A (zh) 2004-08-31 2007-07-25 松下电器产业株式会社 语音编码装置、语音解码装置、通信装置以及语音编码方法
KR20070061818A (ko) 2004-09-17 2007-06-14 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치, 음성 복호 장치, 통신 장치 및 음성부호화 방법
JP4732730B2 (ja) 2004-09-30 2011-07-27 パナソニック株式会社 音声復号装置
JP4613746B2 (ja) 2005-08-17 2011-01-19 三菱電機株式会社 被写体存在証明サービスシステム
US20090018824A1 (en) 2006-01-31 2009-01-15 Matsushita Electric Industrial Co., Ltd. Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method
US8239191B2 (en) 2006-09-15 2012-08-07 Panasonic Corporation Speech encoding apparatus and speech encoding method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10171497A (ja) * 1996-12-12 1998-06-26 Oki Electric Ind Co Ltd 背景雑音除去装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6012051745; Volodya Grancharov, Jonas Samuelsson, W.Bastiaan Kleijn: 'NOISE-DEPENDENT POSTFILTERING' Proceedings of IEEE International Conference on Acoustics , 20040517 *

Also Published As

Publication number Publication date
WO2008108082A1 (ja) 2008-09-12
CN101617362A (zh) 2009-12-30
US8554548B2 (en) 2013-10-08
US20100100373A1 (en) 2010-04-22
EP2116997A1 (en) 2009-11-11
CN101617362B (zh) 2012-07-18
EP2116997A4 (en) 2011-11-23
JPWO2008108082A1 (ja) 2010-06-10

Similar Documents

Publication Publication Date Title
JP5164970B2 (ja) 音声復号装置および音声復号方法
JP5061111B2 (ja) 音声符号化装置および音声符号化方法
KR101078625B1 (ko) 이득 계수 제한을 위한 시스템, 방법 및 장치
JP5688852B2 (ja) オーディオコーデックポストフィルタ
US8069040B2 (en) Systems, methods, and apparatus for quantization of spectral envelope representation
WO2007000988A1 (ja) スケーラブル復号装置および消失データ補間方法
US20100010810A1 (en) Post filter and filtering method
US9082398B2 (en) System and method for post excitation enhancement for low bit rate speech coding
CN1947173B (zh) 分层编码装置及分层编码方法
US9589576B2 (en) Bandwidth extension of audio signals
JPH1097296A (ja) 音声符号化方法および装置、音声復号化方法および装置
HUE031761T2 (en) Systems and procedures for performing noise modulation and gain adjustment
JP5291004B2 (ja) 通信ネットワークにおける方法及び装置
EP3281197B1 (en) Audio encoder and method for encoding an audio signal
Grancharov et al. Noise-dependent postfiltering
JPWO2008072733A1 (ja) 符号化装置および符号化方法
JPWO2007037359A1 (ja) 音声符号化装置および音声符号化方法
Jokinen et al. Utilization of the Lombard effect in post-filtering for intelligibility enhancement of telephone speech.
KR20100012788A (ko) Mdct 영역에서의 후처리 방법, 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121218

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151228

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5164970

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees