JPH07160296A - 音声復号装置 - Google Patents
音声復号装置Info
- Publication number
- JPH07160296A JPH07160296A JP5310523A JP31052393A JPH07160296A JP H07160296 A JPH07160296 A JP H07160296A JP 5310523 A JP5310523 A JP 5310523A JP 31052393 A JP31052393 A JP 31052393A JP H07160296 A JPH07160296 A JP H07160296A
- Authority
- JP
- Japan
- Prior art keywords
- filter
- index relating
- post
- signal
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 37
- 230000000873 masking effect Effects 0.000 claims abstract description 26
- 238000004364 calculation method Methods 0.000 claims description 28
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 238000003786 synthesis reaction Methods 0.000 claims description 14
- 238000013139 quantization Methods 0.000 abstract description 8
- 230000002194 synthesizing effect Effects 0.000 abstract 4
- 238000010586 diagram Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 3
- 238000005311 autocorrelation function Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 101000622137 Homo sapiens P-selectin Proteins 0.000 description 1
- 102100023472 P-selectin Human genes 0.000 description 1
- 101000873420 Simian virus 40 SV40 early leader protein Proteins 0.000 description 1
- 108700043492 SprD Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 244000144992 flock Species 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【目的】 再生信号に重畳する量子化雑音を制御し音質
を向上させるポストフィルタを有する音声復号装置の提
供。 【構成】 デマルチプレクサ100はスペクトルパラメ
ータに関するインデクス、ピッチに関するインデクス、
振幅に関するインデクス、音源信号に関するインデクス
を受信し分離する。合成フィルタ140は、前記ピッチ
に関するインデクスと前記音源に関するインデクスと前
記振幅に関するインデクスを用いて合成フィルタの駆動
信号を復元し、前記スペクトルパラメータに関するイン
デクスを用いて合成フィルタを構成し前記駆動信号によ
り前記合成フィルタを駆動して再生信号を得る。フィル
タ係数計算部210は、再生信号から聴覚のマスキング
しきい値を求め、前記マスキングしきい値に対応してポ
ストフィルタの係数を求める。ポストフィルタ200
は、前記係数をポストフィルタに使用する。
を向上させるポストフィルタを有する音声復号装置の提
供。 【構成】 デマルチプレクサ100はスペクトルパラメ
ータに関するインデクス、ピッチに関するインデクス、
振幅に関するインデクス、音源信号に関するインデクス
を受信し分離する。合成フィルタ140は、前記ピッチ
に関するインデクスと前記音源に関するインデクスと前
記振幅に関するインデクスを用いて合成フィルタの駆動
信号を復元し、前記スペクトルパラメータに関するイン
デクスを用いて合成フィルタを構成し前記駆動信号によ
り前記合成フィルタを駆動して再生信号を得る。フィル
タ係数計算部210は、再生信号から聴覚のマスキング
しきい値を求め、前記マスキングしきい値に対応してポ
ストフィルタの係数を求める。ポストフィルタ200
は、前記係数をポストフィルタに使用する。
Description
【0001】
【産業上の利用分野】本発明は、符号化側から受信した
インデクスを用いて音声を再生する音声復号装置であっ
て、特に、再生信号に重畳する量子化雑音を制御し音質
を向上させるポストフィルタを有する音声復号装置に関
する。
インデクスを用いて音声を再生する音声復号装置であっ
て、特に、再生信号に重畳する量子化雑音を制御し音質
を向上させるポストフィルタを有する音声復号装置に関
する。
【0002】
【従来の技術】音声信号を低いビットレートである程度
良好に符号化伝送する方式としてCELP(Code
Excited Linear Predictio
n)方式が知られている。この方式の詳細は、例えば、
M.Schroeder andB.Atal氏によ
る”Code−excited linear pre
diction: High quality spe
ech at verylow bit rates”
(Proc.ICASSP,pp.937−940,1
985年)と題した論文(文献1)やW.Kleiji
n氏らによる”Improved speech qu
ality and efficientvector
quantization in SELP”(Pr
oc.ICASSP,pp.155−158,198
8)と題した論文(文献2)等を参照することができ
る。図1はCELP方式の復号側のブロック図である。
図において、デマルチプレクサ100は、送信側からス
ペクトルパラメータに関するインデクスと、振幅に関す
るインデクスと、ピッチに関するインデクスと音源信号
に関するインデクスとを受信し分離する。適応コードブ
ック部110は、ピッチに関するインデクスを入力し、
下式により適応コードベクトルを計算する。
良好に符号化伝送する方式としてCELP(Code
Excited Linear Predictio
n)方式が知られている。この方式の詳細は、例えば、
M.Schroeder andB.Atal氏によ
る”Code−excited linear pre
diction: High quality spe
ech at verylow bit rates”
(Proc.ICASSP,pp.937−940,1
985年)と題した論文(文献1)やW.Kleiji
n氏らによる”Improved speech qu
ality and efficientvector
quantization in SELP”(Pr
oc.ICASSP,pp.155−158,198
8)と題した論文(文献2)等を参照することができ
る。図1はCELP方式の復号側のブロック図である。
図において、デマルチプレクサ100は、送信側からス
ペクトルパラメータに関するインデクスと、振幅に関す
るインデクスと、ピッチに関するインデクスと音源信号
に関するインデクスとを受信し分離する。適応コードブ
ック部110は、ピッチに関するインデクスを入力し、
下式により適応コードベクトルを計算する。
【0003】 z(n)=β・v(n−d) (1) ここで、dはピッチに関するインデクスから計算し、β
は振幅に関するインデクスから計算する。
は振幅に関するインデクスから計算する。
【0004】音源コードブック部120は、音源に関す
るインデクスを用いてコードブック125から対応する
コードベクトルsj (n)を読みだし、下式により音源
コードベクトルを求め出力する。
るインデクスを用いてコードブック125から対応する
コードベクトルsj (n)を読みだし、下式により音源
コードベクトルを求め出力する。
【0005】 r(n)=γ・sj (n) (2) ここでγは、振幅に関するインデクスから求めた音源信
号に関するゲインである。次に、加算部130は、
(1)式のz(n)と(2)式のr(n)とを加算して
駆動信号v(n)を求める。
号に関するゲインである。次に、加算部130は、
(1)式のz(n)と(2)式のr(n)とを加算して
駆動信号v(n)を求める。
【0006】 c(n)=z(n)+r(n) (3) 合成フィルタ部140は、スペクトルパラメータに関す
るインデクスを用いて、合成フィルタを構成し、駆動信
号を用いて駆動して再生信号x(n)を求める。
るインデクスを用いて、合成フィルタを構成し、駆動信
号を用いて駆動して再生信号x(n)を求める。
【0007】
【数1】
【0008】ここで、α’i (i=1...M:Mは次
数)は、スペクトルパラメータ復元部145においてス
ペクトルパラメータインデクスから復元した線形予測係
数である。
数)は、スペクトルパラメータ復元部145においてス
ペクトルパラメータインデクスから復元した線形予測係
数である。
【0009】ポストフィルタ150は、再生信号x
(n)に重畳する量子化複雑音を制御し、音質を向上さ
せる働きをする。ポストフィルタの典型的な伝達関数H
(z)は下式で表される。
(n)に重畳する量子化複雑音を制御し、音質を向上さ
せる働きをする。ポストフィルタの典型的な伝達関数H
(z)は下式で表される。
【0010】
【数2】
【0011】ここで、γ1 、γ2 はポストフィルタにお
ける量子化雑音の制御度をコントロールする定数であ
り、0<γ1 <γ2 <1に選ぶ。また、ηは高域を強調
する係数であり、0<η<1に選ぶ。なお、ポストフィ
ルタの詳細については、J.Chen氏らによる”Re
al−time vector APC speech
conding at 4800 bps with
adaptive postfiltering”と題
した論文(Proc.IEEE ICASSP,pp.
2185−2188,1987年)(文献3)等を参照
できる。
ける量子化雑音の制御度をコントロールする定数であ
り、0<γ1 <γ2 <1に選ぶ。また、ηは高域を強調
する係数であり、0<η<1に選ぶ。なお、ポストフィ
ルタの詳細については、J.Chen氏らによる”Re
al−time vector APC speech
conding at 4800 bps with
adaptive postfiltering”と題
した論文(Proc.IEEE ICASSP,pp.
2185−2188,1987年)(文献3)等を参照
できる。
【0012】ゲイン調整部160では、ポストフィルタ
による利得を正規化するために、ポストフィルタ入力信
号x(n)の短時間パワP1 と、ポストフィルタ出力信
号x’(n)の短時間パワP2 とを用いて下式によりゲ
イン調整量Gを求める。
による利得を正規化するために、ポストフィルタ入力信
号x(n)の短時間パワP1 と、ポストフィルタ出力信
号x’(n)の短時間パワP2 とを用いて下式によりゲ
イン調整量Gを求める。
【0013】
【数3】
【0014】さらに、下式によりゲイン調整を行った出
力信号y(n)を求めて出力する。
力信号y(n)を求めて出力する。
【0015】 y(n)=g(n)・x’(n) (7) ただし、 g(n)=(1−δ)g(n−1)+δ・G (8) ここで、δは時定数であり、正の微小量に選ぶ。
【0016】
【発明が解決しようとする課題】しかしながら、上記の
従来方式では、特にポストフィルタにおいて、量子化雑
音の制御がγ1 、γ2 の選び方に依存していること、聴
覚の特性を考慮したものではないことから、ビットレー
トを低減化していくと、量子化雑音の制御が困難で音質
が大幅に劣化するという問題点があった。
従来方式では、特にポストフィルタにおいて、量子化雑
音の制御がγ1 、γ2 の選び方に依存していること、聴
覚の特性を考慮したものではないことから、ビットレー
トを低減化していくと、量子化雑音の制御が困難で音質
が大幅に劣化するという問題点があった。
【0017】
【課題を解決するための手段】本発明による音声復号装
置によれば、スペクトルパラメータに関するインデクス
と振幅に関するインデクスとピッチに関するインデクス
と音源信号に関するインデクスとを受信し分離するデマ
ルチプレクサ部と、前記ピッチに関するインデクスと前
記音源になするインデクスと前記振幅に関するインデク
スを用いて合成フィルタの駆動信号を復元し、前記スペ
クトルパラメータに関するインデクスを用いて合成フィ
ルタを構成し前記駆動信号により前記合成フィルタを駆
動して再生信号を得る合成フィルタ部と、前記合成フィ
ルタの出力信号を入力して前記再生信号のスペクトルを
制御するポストフィルタ部とを有する音声復号方式にお
いて、前記再生信号から聴覚のマスキングしきい値を求
め、前記マスキングしきい値に対応してポストフィルタ
の係数を求めるフィルタ係数計算部と、前記係数をポス
トフィルタに使用するポストフィルタ部とを有すること
を特徴とする。
置によれば、スペクトルパラメータに関するインデクス
と振幅に関するインデクスとピッチに関するインデクス
と音源信号に関するインデクスとを受信し分離するデマ
ルチプレクサ部と、前記ピッチに関するインデクスと前
記音源になするインデクスと前記振幅に関するインデク
スを用いて合成フィルタの駆動信号を復元し、前記スペ
クトルパラメータに関するインデクスを用いて合成フィ
ルタを構成し前記駆動信号により前記合成フィルタを駆
動して再生信号を得る合成フィルタ部と、前記合成フィ
ルタの出力信号を入力して前記再生信号のスペクトルを
制御するポストフィルタ部とを有する音声復号方式にお
いて、前記再生信号から聴覚のマスキングしきい値を求
め、前記マスキングしきい値に対応してポストフィルタ
の係数を求めるフィルタ係数計算部と、前記係数をポス
トフィルタに使用するポストフィルタ部とを有すること
を特徴とする。
【0018】また、本発明による音声復号装置によれ
ば、上述のフィルタ係数計算部において、前記スペクト
ルパラメータに関するインデクスをもとに聴覚のマスキ
ングしきい値を求め、前記マスキングしきい値に対応し
てポストフィルタの係数を求めるフィルタ係数計算部を
有することを特徴とする。
ば、上述のフィルタ係数計算部において、前記スペクト
ルパラメータに関するインデクスをもとに聴覚のマスキ
ングしきい値を求め、前記マスキングしきい値に対応し
てポストフィルタの係数を求めるフィルタ係数計算部を
有することを特徴とする。
【0019】
【作用】本発明による音声復号装置の作用を示す。
【0020】本発明では聴覚のマスキングしきい値を反
映させたフィルタ係数の計算と、その係数を用いるポス
トフィルタの構成がポイントであり、それ以外の構成要
素については、図1に示した従来方式と同一の構成であ
るので、特に、フィルタ係数計算部とポストフィルタに
ついて説明する。
映させたフィルタ係数の計算と、その係数を用いるポス
トフィルタの構成がポイントであり、それ以外の構成要
素については、図1に示した従来方式と同一の構成であ
るので、特に、フィルタ係数計算部とポストフィルタに
ついて説明する。
【0021】フィルタ係数計算部においては、聴覚のマ
スキング特性を考慮して、聴覚のマスキングしきい値を
もとにポストフィルタの係数を求めることを特徴とす
る。そして、ポストフィルタにおいて、再生信号に重畳
した量子化雑音が聴覚のマスキングしきい値以下になる
ように、量子化雑音を整形することにより、音質の改善
を行う。
スキング特性を考慮して、聴覚のマスキングしきい値を
もとにポストフィルタの係数を求めることを特徴とす
る。そして、ポストフィルタにおいて、再生信号に重畳
した量子化雑音が聴覚のマスキングしきい値以下になる
ように、量子化雑音を整形することにより、音質の改善
を行う。
【0022】本発明によるフィルタ係数計算部において
は、まず、再生信号x(n)から聴覚のマスキングしき
い値を求める。再生信号をフーリエ変換し、パワスペク
トルを求める。パワスペクトルに対して、臨界帯域毎に
パワの和を求める。ここで各臨界帯域の下限、上限の周
波数については、E.Zwicker氏らによる”Ps
ychoacoustics”と題した単行本(Spr
inger−Verlag社,1990年)(文献4)
を参照することができる。次に、spreading function(散布関数)を臨界帯域のパワに畳み
込んでspreading supectrum(散布
スペクトラム)を計算する。そして、spreadin
g supectrumに対して各臨界多域毎にあらか
じめ定められたしきい値だけ補正してマスキングしきい
値スペクトルPm 1 (i=1...B:ここでBは臨界
帯域数)を計算する。なお、spreading fu
nctionや、前記しきい値の具体例については、
J.Johnston氏らによる”Transform
Coding of Audio Signals
using Pcrceptual Noise Cr
iteria”(IEEE J.Sel.Areas
in Commun.,pp.314−323,198
8年)と題した論文(文献5)等を参照できる。Pm 1
を線形周波数軸に変換した後に、逆フーリエ変換を行
い、自己相関関数を計算する。次に、L+1点の自己相
関から周知の線形予測分析を用いて、L次の線形予測係
数bi (i=1...L)を計算する。これらの計算に
より、係数bi は聴覚のマスキングしきい値を反映した
フィルタ係数となっている。
は、まず、再生信号x(n)から聴覚のマスキングしき
い値を求める。再生信号をフーリエ変換し、パワスペク
トルを求める。パワスペクトルに対して、臨界帯域毎に
パワの和を求める。ここで各臨界帯域の下限、上限の周
波数については、E.Zwicker氏らによる”Ps
ychoacoustics”と題した単行本(Spr
inger−Verlag社,1990年)(文献4)
を参照することができる。次に、spreading function(散布関数)を臨界帯域のパワに畳み
込んでspreading supectrum(散布
スペクトラム)を計算する。そして、spreadin
g supectrumに対して各臨界多域毎にあらか
じめ定められたしきい値だけ補正してマスキングしきい
値スペクトルPm 1 (i=1...B:ここでBは臨界
帯域数)を計算する。なお、spreading fu
nctionや、前記しきい値の具体例については、
J.Johnston氏らによる”Transform
Coding of Audio Signals
using Pcrceptual Noise Cr
iteria”(IEEE J.Sel.Areas
in Commun.,pp.314−323,198
8年)と題した論文(文献5)等を参照できる。Pm 1
を線形周波数軸に変換した後に、逆フーリエ変換を行
い、自己相関関数を計算する。次に、L+1点の自己相
関から周知の線形予測分析を用いて、L次の線形予測係
数bi (i=1...L)を計算する。これらの計算に
より、係数bi は聴覚のマスキングしきい値を反映した
フィルタ係数となっている。
【0023】次に、ポストフィルタ部では、マスキング
しきい値にもとづくフィルタ係数を用いるポストフィル
タの伝達特性は下式で表される。
しきい値にもとづくフィルタ係数を用いるポストフィル
タの伝達特性は下式で表される。
【0024】
【数4】
【0025】ただし、0<γ1 <γ2 <1である。
【0026】また、本発明の音声復号方式におけるフィ
ルタ係数計算部によれば、フーリエ変換してパワスペク
トルを求める際に、再生信号x(n)をフーリエ変換す
るのではなく、スペクトルパラメータに関するインデク
スから復元した線形予測係数をフーリエ変換してパワス
ペクトル包絡を求めて、マスキングしきい値を計算して
もよい。
ルタ係数計算部によれば、フーリエ変換してパワスペク
トルを求める際に、再生信号x(n)をフーリエ変換す
るのではなく、スペクトルパラメータに関するインデク
スから復元した線形予測係数をフーリエ変換してパワス
ペクトル包絡を求めて、マスキングしきい値を計算して
もよい。
【0027】
【実施例】図2は、本発明による音声復号装置の第1の
実施例を示すブロック図である。図1と同一の番号を付
した構成要素は、図1と同一の動作を行うので説明は省
略する。
実施例を示すブロック図である。図1と同一の番号を付
した構成要素は、図1と同一の動作を行うので説明は省
略する。
【0028】フィルタ係数計算部210は、まず、合成
フィルタ140の出力信号x(n)をあらかじめ定めら
れたサンプル数だけ蓄積する。図3にフィルタ係数計算
部210の構成を示す。
フィルタ140の出力信号x(n)をあらかじめ定めら
れたサンプル数だけ蓄積する。図3にフィルタ係数計算
部210の構成を示す。
【0029】図3において、フーリエ変換部215は、
あらかじめ定められたサンプル数の信号x(n)を入力
し、あらかじめ定められた窓関数(例えばハミング窓)
を乗じあらかじめ定められた点数のフーリエ変換を施
す。パワスペクトル計算部220は、215の出力に対
して次式によりパワスペクトルP(w)を計算する。
あらかじめ定められたサンプル数の信号x(n)を入力
し、あらかじめ定められた窓関数(例えばハミング窓)
を乗じあらかじめ定められた点数のフーリエ変換を施
す。パワスペクトル計算部220は、215の出力に対
して次式によりパワスペクトルP(w)を計算する。
【0030】 P(w)=Re[X(w)]2 +Im[X(w)]2 (w=0...π] (7) ここで、Re[X(w)]、Im[X(w)]はフーリ
エ変換したスペクトルの実部、虚部を示す。wは角周波
数である。臨界帯域スペクトル計算部225は、P
(w)を用いて下式の計算を行う。
エ変換したスペクトルの実部、虚部を示す。wは角周波
数である。臨界帯域スペクトル計算部225は、P
(w)を用いて下式の計算を行う。
【0031】
【数5】
【0032】ここで、Bi は帯域番号iの臨界帯域スペ
クトルである。bli 、bhi はi番目の臨界帯域の下
限、上限の周波数である。具体的な周波数については、
前記文献4を照できる。
クトルである。bli 、bhi はi番目の臨界帯域の下
限、上限の周波数である。具体的な周波数については、
前記文献4を照できる。
【0033】次に、下式に従い、臨界帯域スペクトルに
散布関数を畳み込む。
散布関数を畳み込む。
【0034】
【数6】
【0035】ここでsprd(j,i)は散布関数であ
り、具体的な値は前記文献4を参照できる。また、b
m a x は、角周波数πまでの間に含まれる臨界帯域の個
数である。225は、Ci を出力する。
り、具体的な値は前記文献4を参照できる。また、b
m a x は、角周波数πまでの間に含まれる臨界帯域の個
数である。225は、Ci を出力する。
【0036】マスキングしきい値スペクトル計算部23
0は、下式に従い、マスキングしきい値スペクトルTh
i を計算する。
0は、下式に従い、マスキングしきい値スペクトルTh
i を計算する。
【0037】 Thi =Ci Ti (10) ただし Ti =10- ( O i / 1 0 ) (11) Oi =α(14.5+i)+(1−α)5.5 (12) α=min[(NG/R),1.0] (13)
【0038】
【数7】
【0039】ここで、k1 はi次目のkパラメータであ
り、入力した線形予測係数α’i から衆知の方法により
変換して求める。また、Mは線形予測係数の次数であ
る。Rはあらかじめ定められたしきい値である。マスキ
ングしきい値スペクトルは、絶対しきい値を考慮するこ
とにより、下式のようになる。
り、入力した線形予測係数α’i から衆知の方法により
変換して求める。また、Mは線形予測係数の次数であ
る。Rはあらかじめ定められたしきい値である。マスキ
ングしきい値スペクトルは、絶対しきい値を考慮するこ
とにより、下式のようになる。
【0040】 Th’i =max[Thi ,absthi ] (15) ここで、absthi は、臨界帯域iにおける絶対しき
い値であり、前記文献4を参照できる。
い値であり、前記文献4を参照できる。
【0041】係数計算部240は、マスキングしきい値
スペクトルTh・i(i=1...bm a x )に対し
て、周波数軸をバーク軸からヘルツ軸に変換したスペク
トルPm (f)を求め、さらに、逆フーリエ変換して自
己相関関数R(n)を求め、R(n)のL+1点分から
周知の線形予測分析を施してフィルタ係数bi (i=
1...L)を求めて出力する。
スペクトルTh・i(i=1...bm a x )に対し
て、周波数軸をバーク軸からヘルツ軸に変換したスペク
トルPm (f)を求め、さらに、逆フーリエ変換して自
己相関関数R(n)を求め、R(n)のL+1点分から
周知の線形予測分析を施してフィルタ係数bi (i=
1...L)を求めて出力する。
【0042】図2にもどり、ポストフィルタ200は、
bi を用いて伝達特性が(6)式で表されるポストフィ
ルタリングを行う。
bi を用いて伝達特性が(6)式で表されるポストフィ
ルタリングを行う。
【0043】図4は、本発明による第2の実施例を示し
たフロック図である。図において図1、図2と同一の番
号を付した構成要素は、図1、図2と同一の動作を行う
ので、説明は省略する。図4と図2との違いは、フィル
タ係数計算部310である。フィルタ係数計算部310
を図5に示す。図において、フーリエ変換部300は、
音声信号x(n)ではなく、スペクトルパラメータ(こ
こでは線形予測係数α’i )に対してフーリエ変換を施
す点が異なる。
たフロック図である。図において図1、図2と同一の番
号を付した構成要素は、図1、図2と同一の動作を行う
ので、説明は省略する。図4と図2との違いは、フィル
タ係数計算部310である。フィルタ係数計算部310
を図5に示す。図において、フーリエ変換部300は、
音声信号x(n)ではなく、スペクトルパラメータ(こ
こでは線形予測係数α’i )に対してフーリエ変換を施
す点が異なる。
【0044】上述の実施例において、マスキングしきい
値スペクトルの計算法としては、他の周知な方法を使用
することができる。
値スペクトルの計算法としては、他の周知な方法を使用
することができる。
【0045】また、フィルタ係数計算部であ、演算量を
低減化するために、フーリエ変換のかわりに、帯域分割
フィルタ群を用いることもできる。
低減化するために、フーリエ変換のかわりに、帯域分割
フィルタ群を用いることもできる。
【0046】
【発明の効果】以上述べたように、本発明によれば、音
声復号部により再生した再生信号、もしくは受信したス
ペクトルパラメータに関するインデクスをもとに、聴覚
マスキングしきい値を求め、これを反映したフィルタ係
数を求めて、この係数をポストフィルタに使用している
ので、従来方式に比べ、再生信号に重畳した量子化雑音
を聴感的に低減化することが可能であり、より低いビッ
トレートにおいて音質が改善されるという大きな効果を
有する。
声復号部により再生した再生信号、もしくは受信したス
ペクトルパラメータに関するインデクスをもとに、聴覚
マスキングしきい値を求め、これを反映したフィルタ係
数を求めて、この係数をポストフィルタに使用している
ので、従来方式に比べ、再生信号に重畳した量子化雑音
を聴感的に低減化することが可能であり、より低いビッ
トレートにおいて音質が改善されるという大きな効果を
有する。
【図1】従来方式の例を示すブロック図である。
【図2】本発明の第1の実施例を示すブロック図であ
る。
る。
【図3】図2中のフィルタ係数計算部210の構成を示
すブロックである。
すブロックである。
【図4】本発明の第2の実施例を示すブロック図であ
る。
る。
【図5】図4中のフィルタ係数計算部310の構成を示
すブロック図である。
すブロック図である。
100 デマルチプレクサ 110 適応コードブック部 120 音源コードブック 130 加算部 140 合成フィルタ部 145 スペクトルパラメータ復元部 150、200 ポストフィルタ 160 ゲイン調整部 210、310 フィルタ係数計算部 215、300 フーリエ変換部 220 パワスペクトル計算部 225 臨界帯域スペクトル計算部 230 マスキングしきい値スペクトル計算部 240 係数計算部
Claims (2)
- 【請求項1】 スペクトルパラメータに関するインデク
スと振幅に関するインデクスとピッチに関するインデク
スと音源信号に関するインデクスとを受信し分離するデ
マルチプレクサ部と、前記ピッチに関するインデクスと
前記音源に関するインデクスと前記振幅に関するインデ
クスを用いて合成フィルタの駆動信号を復元し、前記ス
ペクトルパラメータに関するインデクスを用いて合成フ
ィルタを構成し前記駆動信号により前記合成フィルタを
駆動して再生信号を得る合成フィルタ部と、前記合成フ
ィルタの出力信号を入力して前記再生信号のスペクトル
を制御するポストフィルタ部とを有する音声復号方式に
おいて、前記再生信号から聴覚のマスキングしきい値を
求め、前記マスキングしきい値に対応してポストフィル
タの係数を求めるフィルタ係数計算部と、前記係数をポ
ストフィルタに使用するポストフィルタ部とを有するこ
とを特徴とする音声復号装置。 - 【請求項2】 前記フィルタ係数計算部において、前記
スペクトルパラメータのインデクスをもとに聴覚のマス
キングしきい値を求め、前記マスキングしきい値に対応
してポストフィルタの係数を求めるフィルタ係数計算部
と、前記係数をポストフィルタに使用するポストフィル
タ部を有することを特徴とする請求項1記載の音声復号
装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5310523A JP3024468B2 (ja) | 1993-12-10 | 1993-12-10 | 音声復号装置 |
DE69420682T DE69420682T2 (de) | 1993-12-10 | 1994-12-09 | Sprachdekodierer |
EP94119540A EP0658875B1 (en) | 1993-12-10 | 1994-12-09 | Speech decoder |
US08/355,305 US5659661A (en) | 1993-12-10 | 1994-12-12 | Speech decoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5310523A JP3024468B2 (ja) | 1993-12-10 | 1993-12-10 | 音声復号装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07160296A true JPH07160296A (ja) | 1995-06-23 |
JP3024468B2 JP3024468B2 (ja) | 2000-03-21 |
Family
ID=18006259
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5310523A Expired - Fee Related JP3024468B2 (ja) | 1993-12-10 | 1993-12-10 | 音声復号装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5659661A (ja) |
EP (1) | EP0658875B1 (ja) |
JP (1) | JP3024468B2 (ja) |
DE (1) | DE69420682T2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005532586A (ja) * | 2002-07-08 | 2005-10-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ処理 |
WO2006134992A1 (ja) | 2005-06-17 | 2006-12-21 | Matsushita Electric Industrial Co., Ltd. | ポストフィルタ、復号化装置及びポストフィルタ処理方法 |
WO2008072671A1 (ja) * | 2006-12-13 | 2008-06-19 | Panasonic Corporation | 音声復号化装置およびパワ調整方法 |
JP2015007805A (ja) * | 2007-06-14 | 2015-01-15 | オランジュ | 符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5978783A (en) * | 1995-01-10 | 1999-11-02 | Lucent Technologies Inc. | Feedback control system for telecommunications systems |
US7079177B2 (en) * | 1995-02-27 | 2006-07-18 | Canon Kabushiki Kaisha | Remote control system and access control method for information input apparatus with limitation by user for image access and camemremote control |
EP0763818B1 (en) * | 1995-09-14 | 2003-05-14 | Kabushiki Kaisha Toshiba | Formant emphasis method and formant emphasis filter device |
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
GB2338630B (en) * | 1998-06-20 | 2000-07-26 | Motorola Ltd | Speech decoder and method of operation |
JP3319396B2 (ja) * | 1998-07-13 | 2002-08-26 | 日本電気株式会社 | 音声符号化装置ならびに音声符号化復号化装置 |
US7110953B1 (en) * | 2000-06-02 | 2006-09-19 | Agere Systems Inc. | Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction |
WO2004027754A1 (en) * | 2002-09-17 | 2004-04-01 | Koninklijke Philips Electronics N.V. | A method of synthesizing of an unvoiced speech signal |
EP1782419A1 (en) * | 2004-08-17 | 2007-05-09 | Koninklijke Philips Electronics N.V. | Scalable audio coding |
JP4107613B2 (ja) * | 2006-09-04 | 2008-06-25 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 残響除去における低コストのフィルタ係数決定法 |
CN101169934B (zh) * | 2006-10-24 | 2011-05-11 | 华为技术有限公司 | 时域听觉阈值加权滤波器的构造方法和设备、编解码器 |
US8401845B2 (en) * | 2008-03-05 | 2013-03-19 | Voiceage Corporation | System and method for enhancing a decoded tonal sound signal |
SI3848929T1 (sl) * | 2013-03-04 | 2023-12-29 | Voiceage Evs Llc | Naprava in metoda za zmanjšanje šuma kvantizacije v dekoderju časovne domene |
FR3007184A1 (fr) * | 2013-06-14 | 2014-12-19 | France Telecom | Controle du traitement d'attenuation d'un bruit de quantification introduit par un codage en compresssion |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05232998A (ja) * | 1991-06-28 | 1993-09-10 | Sip Soc It Per Esercizio Delle Telecommun Pa | 合成による分析技術に基づく音声コーダの改良 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2102254B (en) * | 1981-05-11 | 1985-08-07 | Kokusai Denshin Denwa Co Ltd | A speech analysis-synthesis system |
NL8400728A (nl) * | 1984-03-07 | 1985-10-01 | Philips Nv | Digitale spraakcoder met basisband residucodering. |
US4912764A (en) * | 1985-08-28 | 1990-03-27 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech coder with different excitation types |
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
JP3033060B2 (ja) * | 1988-12-22 | 2000-04-17 | 国際電信電話株式会社 | 音声予測符号化・復号化方式 |
US5261027A (en) * | 1989-06-28 | 1993-11-09 | Fujitsu Limited | Code excited linear prediction speech coding system |
JP2626223B2 (ja) * | 1990-09-26 | 1997-07-02 | 日本電気株式会社 | 音声符号化装置 |
JP2906646B2 (ja) * | 1990-11-09 | 1999-06-21 | 松下電器産業株式会社 | 音声帯域分割符号化装置 |
JP2776050B2 (ja) * | 1991-02-26 | 1998-07-16 | 日本電気株式会社 | 音声符号化方式 |
US5195168A (en) * | 1991-03-15 | 1993-03-16 | Codex Corporation | Speech coder and method having spectral interpolation and fast codebook search |
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
US5339384A (en) * | 1992-02-18 | 1994-08-16 | At&T Bell Laboratories | Code-excited linear predictive coding with low delay for speech or audio signals |
US5432883A (en) * | 1992-04-24 | 1995-07-11 | Olympus Optical Co., Ltd. | Voice coding apparatus with synthesized speech LPC code book |
-
1993
- 1993-12-10 JP JP5310523A patent/JP3024468B2/ja not_active Expired - Fee Related
-
1994
- 1994-12-09 EP EP94119540A patent/EP0658875B1/en not_active Expired - Lifetime
- 1994-12-09 DE DE69420682T patent/DE69420682T2/de not_active Expired - Fee Related
- 1994-12-12 US US08/355,305 patent/US5659661A/en not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05232998A (ja) * | 1991-06-28 | 1993-09-10 | Sip Soc It Per Esercizio Delle Telecommun Pa | 合成による分析技術に基づく音声コーダの改良 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005532586A (ja) * | 2002-07-08 | 2005-10-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ処理 |
WO2006134992A1 (ja) | 2005-06-17 | 2006-12-21 | Matsushita Electric Industrial Co., Ltd. | ポストフィルタ、復号化装置及びポストフィルタ処理方法 |
US8315863B2 (en) | 2005-06-17 | 2012-11-20 | Panasonic Corporation | Post filter, decoder, and post filtering method |
WO2008072671A1 (ja) * | 2006-12-13 | 2008-06-19 | Panasonic Corporation | 音声復号化装置およびパワ調整方法 |
JP2015007805A (ja) * | 2007-06-14 | 2015-01-15 | オランジュ | 符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
DE69420682T2 (de) | 2000-08-10 |
JP3024468B2 (ja) | 2000-03-21 |
EP0658875A3 (en) | 1997-07-02 |
DE69420682D1 (de) | 1999-10-21 |
EP0658875B1 (en) | 1999-09-15 |
US5659661A (en) | 1997-08-19 |
EP0658875A2 (en) | 1995-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3653826B2 (ja) | 音声復号化方法及び装置 | |
KR101345695B1 (ko) | 대역폭 확장 출력 데이터를 생성하기 위한 장치 및 방법 | |
KR101120911B1 (ko) | 음성신호 복호화 장치 및 음성신호 부호화 장치 | |
US6654716B2 (en) | Perceptually improved enhancement of encoded acoustic signals | |
EP0732686B1 (en) | Low-delay code-excited linear-predictive coding of wideband speech at 32kbits/sec | |
JP4777918B2 (ja) | 音声処理装置及び音声を処理する方法 | |
JP3024468B2 (ja) | 音声復号装置 | |
EP2774145B1 (en) | Improving non-speech content for low rate celp decoder | |
EP1141946A1 (en) | Coded enhancement feature for improved performance in coding communication signals | |
CA2424373C (en) | Perceptually improved encoding of acoustic signals | |
AU2001284607A1 (en) | Perceptually improved enhancement of encoded acoustic signals | |
JP4040126B2 (ja) | 音声復号化方法および装置 | |
Ordentlich et al. | Low-delay code-excited linear-predictive coding of wideband speech at 32 kbps | |
AU2001284606A1 (en) | Perceptually improved encoding of acoustic signals | |
JP3612260B2 (ja) | 音声符号化方法及び装置並びに及び音声復号方法及び装置 | |
JPH09138697A (ja) | ホルマント強調方法 | |
JPH0537393A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080121 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090121 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100121 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |