JP2003195900A - 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法 - Google Patents

音声信号符号化装置、音声信号復号装置及び音声信号符号化方法

Info

Publication number
JP2003195900A
JP2003195900A JP2001396474A JP2001396474A JP2003195900A JP 2003195900 A JP2003195900 A JP 2003195900A JP 2001396474 A JP2001396474 A JP 2001396474A JP 2001396474 A JP2001396474 A JP 2001396474A JP 2003195900 A JP2003195900 A JP 2003195900A
Authority
JP
Japan
Prior art keywords
noise
signal
input
sound source
speech signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001396474A
Other languages
English (en)
Other versions
JP3785363B2 (ja
Inventor
Koji Yoshida
幸司 吉田
Tadashi Yonezaki
正 米崎
Takuya Kawashima
拓也 河嶋
Shigeaki Sasaki
茂明 佐々木
Kazunori Mano
一則 間野
Akitoshi Kataoka
章俊 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Panasonic Holdings Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Matsushita Electric Industrial Co Ltd filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001396474A priority Critical patent/JP3785363B2/ja
Publication of JP2003195900A publication Critical patent/JP2003195900A/ja
Application granted granted Critical
Publication of JP3785363B2 publication Critical patent/JP3785363B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 背景雑音が重畳された音声信号が入力さ
れた場合でも、主観的な品質の劣化を抑制した音声符号
化データを得ること。 【解決手段】 有音無音判定器104によって、入力音
声信号の処理フレームが、音声信号が支配的である有音
区間か、又は非音声信号が支配的である無音区間かを判
定する。そして無音区間である処理フレームが入力音声
信号として入力された際、聴覚重みフィルタ106のフ
ィルタ特性を、高周波数帯域を抑圧するように変換す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声信号符号化装
置、音声信号復号装置及び音声信号符号化方法に関し、
特に音声信号を符号励振線形予測(CELP:Code-Exc
ited Linear Prediction)符号化する場合に適用して好
適なものである。
【0002】
【従来の技術】従来、有線通信、移動体通信、ディジタ
ル記録メモ等に用いられる音声の圧縮展開を行う音声符
号化のうち、中低ビットレートの音声符号化では、音声
の生成過程をモデル化し、入力信号情報を声帯を模した
音源情報と声道を模した合成フィルタ情報に分離して符
号化する手法が一般的に用いられている。特に、音源情
報として音源ベクトルを符号帳から選択し、合成フィル
タ情報を線形予測分析により抽出するCELP型音声符
号化が広く使用されている。
【0003】CELP型音声符号化方式は、音声をある
一定のフレーム長(5ms〜50ms程度)に区切り、
各フレーム毎に音声の線形予測分析を行い、フレーム毎
の線形予測分析による予測残差(励振信号)を既知の波
形からなる適応符号ベクトルと雑音符号ベクトルを用い
て符号化するものである。適応符号ベクトルは過去に生
成した駆動音源ベクトルを格納している適応符号帳か
ら、雑音符号ベクトルは予め用意され定められた形状を
有するベクトルを格納している雑音符号帳から選択され
て使用される。
【0004】従来のこの種の音声信号符号化装置の構成
を、図8に示す。先ず、音声信号符号化装置30では、
入力音声信号が線形予測分析器1に入力され、当該線形
予測分析器1により入力音声が線形予測分析される。聴
覚重みフィルタ生成器2は、分析された線形予測係数を
用いて聴覚重みフィルタ11を生成する。聴覚重みフィ
ルタHp(Z)は、分析された線形予測係数{αi|i
=1,………,P}(Pは分析次数)で、次式を用いて
表される。
【0005】
【数1】 ここで、γZ、γPはフォルマント強調係数で0<γP
γZ<1を満たす定数である。
【0006】適応符号帳5は過去に生成した音源信号を
蓄えている。乗算器6は適応符号帳5から選択された適
応音源ベクトルにゲイン定数を乗じて適応音源信号を求
める。雑音符号帳7には予め定められた音源ベクトルが
蓄えられている。乗算器8は雑音符号帳7から選択され
た雑音音源ベクトルにゲイン定数を乗じて雑音音源信号
を求める。加算器9は適応音源信号と雑音音源信号を加
算し音源信号を得る。
【0007】合成フィルタ10は、加算器9により得ら
れた音源信号を、線形予測係数で構成されるフィルタで
フィルタリングすることで合成音声を得る。聴覚重みフ
ィルタ11は、合成音声に対する聴覚的な信号強調を、
聴覚重みフィルタ生成器2で生成されたフィルタを用い
て行う。聴覚重みフィルタ12は入力信号に対して聴覚
的な信号強調を行う。
【0008】減算器13は聴覚的に重み付けされた入力
音声と合成音声の誤差信号を求める。二乗誤差最小化器
14は誤差信号のエネルギーを算出し、エネルギーが最
小となる音源ベクトルとゲイン定数の組み合わせを求め
る。そして二乗誤差最小化器14により求められた音源
ベクトル、ゲイン定数とそのときの線形予測係数が多重
化器15により多重化されて音声符号化データが形成さ
れる。
【0009】このようにして形成された音声符号化デー
タを復号する音声信号復号装置40の構成を、図9に示
す。音声符号化データは分離器17に入力され、当該分
離器17により音声符号化データが線形予測係数、音源
ベクトル及びゲイン定数に分離される。適応符号帳18
は過去に生成した音源信号を蓄えている。乗算器19は
適応符号帳18から選択された適応音源ベクトルにゲイ
ン定数を乗じて適応音源信号を求める。雑音符号帳20
は予め定められた音源ベクトルが蓄えられている。
【0010】乗算器21は雑音符号帳20から選択され
た雑音音源ベクトルにゲイン定数を乗じて雑音音源信号
を求める。加算器22は適応音源信号と雑音音源信号を
加算し音源信号を生成する。合成フィルタ23は、生成
された音源ベクトルを、入力した線形予測係数で構成す
る合成フィルタ23でフィルタリングし復号音声を合成
する。
【0011】このように符号励振線形予測符号化技術を
用いれば、聴感上量子化誤差の影響を受け易い周波数帯
域に重みを付けて算出した誤差を最小化する音源を選択
することができるため、主観的な量子化歪が少ない復号
音声を得ることができる音声信号符号化装置30及び音
声信号復号装置40を実現することができる。
【0012】
【発明が解決しようとする課題】しかしながら、特に入
力音声として背景雑音が重畳された広周波数帯域信号が
与えられたとき主観的な音声品質が劣化する問題があ
る。
【0013】この問題点について図10を用いて説明す
る。人の聴覚は4〜5kHzを境に信号に対する感度が大
きく変化する。図10ではこの聴覚特性を破線で示して
おり、ここでの説明では破線以下の振幅値の信号に対し
て感度が0、つまり、その信号を検知できないと仮定す
る。
【0014】また図中の一点鎖線は聴覚重みフィルタ処
理前の雑音振幅周波数特性を示し、図中細線は聴覚重み
フィルタ処理後の雑音振幅周波数特性を示す。このと
き、図中、一点鎖線と細線で示す2つの雑音振幅周波数
特性の主観品質を比較したとき、聴覚特性を示す破線を
超える振幅値の周波数帯域のみが主観的な品質に影響す
るため、一点鎖線(聴覚重みフィルタ処理前の雑音振幅
周波数特性)の方がSN比が高く、主観的な品質が良い
と考えられる。すなわちこの例では聴覚重みフィルタを
用いることで主観的な品質が劣化してしまう。
【0015】このことは音声信号のみであれば、低周波
数帯域にエネルギが偏っているため大きな問題とはなら
ないが、音声信号に高周波数帯域にもエネルギを有する
ような背景雑音が重畳されたとき、聴感上さほど重要で
ない高周波数帯域の信号の量子化誤差を少なくする音源
が選択されることとなり、復号音声の品質が劣化する要
因となる。
【0016】本発明はかかる点に鑑みてなされたもので
あり、背景雑音が重畳された音声信号が入力された場合
でも、主観的な品質の劣化を抑制し得る音声信号符号化
装置、音声信号復号装置及び音声信号符号化方法を提供
することを目的とする。
【0017】
【課題を解決するための手段】かかる課題を解決するた
め本発明は、以下の構成を採る。
【0018】(1)本発明の音声信号符号化装置は、入
力音声信号に対して処理フレーム単位で線形予測分析処
理を施すことにより線形予測係数を算出する線形予測分
析手段と、適応符号帳及び雑音符号帳に格納された適応
音源及び雑音音源に対して前記線形予測係数を用いたフ
ィルタリング処理を施すことにより符号化合成音を得る
合成フィルタと、適応音源及び雑音音源のゲインを求
め、さらにゲインを用いて得られる合成音と入力音声信
号との間の符号化歪みが最小となる適応音源及び雑音音
源の符号及びゲインを探索する演算手段と、入力音声信
号及び合成音に対して聴覚重み付け処理を施す聴覚重み
フィルタと、入力音声信号の処理フレームが、音声信号
が支配的である有音区間か、又は非音声信号が支配的で
ある無音区間かを判定する有音無音判定手段と、有音無
音判定手段により無音区間であると判定された処理フレ
ームが入力音声信号として入力された際、聴覚重みフィ
ルタのフィルタ特性を、高周波数帯域を抑圧するように
変換するフィルタ特性変換手段と、を具備する構成を採
る。
【0019】この構成によれば、聴感上重要な低域をよ
り正確に表現できる音源候補を選択し易くすることがで
きるので、聴感上の劣化の少ない音声符号化データを形
成することができる。
【0020】(2)本発明の音声信号符号化装置は、
(1)に加えて、さらに、有音無音判定手段により無音
区間であると判定された処理フレームが入力音声信号と
して入力された際、音源情報を生成するために設けられ
た適応符号帳及び雑音符号帳のうち、雑音符号帳から出
力される雑音音源ベクトルの高周波数帯域を抑圧する周
波数特性変換手段を具備する構成を採る。
【0021】(3)本発明の音声信号復号装置は、
(2)の音声信号符号化装置から得られる情報を用いて
音声信号を復号する符号励振線形予測型の音声信号復号
装置であって、(2)の音声信号符号化装置から得られ
る情報を用いて、処理フレームが音声信号が支配的であ
る有音区間か、又は非音声信号が支配的である無音区間
かを判定する有音無音判定手段と、無音区間において雑
音符号帳から得られる雑音音源ベクトルの高周波数帯域
を抑圧する特性変換手段と、無音区間において雑音音源
ベクトルに対して抑圧した周波数帯域の信号エネルギを
補完する特性を有する雑音ベクトルを生成する雑音生成
手段と、(2)の音声信号符号化装置から得られる情報
を用いて生成した雑音ベクトルのゲインを推定し、雑音
ベクトルに乗ずる乗算手段と、生成した雑音を音源信号
に加算する加算手段と、を具備する構成を採る。
【0022】(2)及び(3)の構成によれば、音声信
号復号装置側で、雑音が重畳された入力信号に対して量
子化雑音が顕著となる高周波成分信号を定常雑音で置換
することができるので、量子化雑音に起因する耳障りな
雑音感を抑え、安定した背景雑音を復号して出力するこ
とができる。
【0023】(4)本発明の音声信号符号化方法は、入
力音声信号に対して処理フレーム単位で線形予測分析処
理を施すことにより線形予測係数を算出するステップ
と、適応符号帳及び雑音符号帳に格納された適応音源及
び雑音音源に対して前記線形予測係数を用いたフィルタ
リング処理を施すことにより符号化合成音を得るステッ
プと、適応音源及び雑音音源のゲインを求め、このゲイ
ンを用いて得られる合成音と入力音声信号との間の符号
化歪みが最小となる適応音源及び雑音音源の符号及びゲ
インを探索するステップと、入力音声信号及び合成音に
対して聴覚重み付け処理を施すステップと、入力音声信
号の処理フレームが、音声信号が支配的である有音区間
か、又は非音声信号が支配的である無音区間かを判定す
るステップと、無音区間であると判定された処理フレー
ムが入力音声信号として入力された際、聴覚重みフィル
タのフィルタ特性を、高周波数帯域を抑圧するように変
換するステップと、を有するようにする。
【0024】この方法によれば、聴感上重要な低域をよ
り正確に表現できる音源候補を選択し易くすることがで
きるので、聴感上の劣化の少ない音声符号化データを形
成することができる。
【0025】(5)本発明のプログラムは、コンピュー
タに、入力音声信号に対して処理フレーム単位で線形予
測分析処理を施すことにより線形予測係数を算出する手
順と、適応符号帳及び雑音符号帳に格納された適応音源
及び雑音音源に対して前記線形予測係数を用いたフィル
タリング処理を施すことにより符号化合成音を得る手順
と、適応音源及び前記雑音音源のゲインを求め、このゲ
インを用いて得られる合成音と入力音声信号との間の符
号化歪みが最小となる適応音源及び雑音音源の符号及び
ゲインを探索する手順と、入力音声信号及び合成音に対
して聴覚重み付け処理を施す手順と、入力音声信号の処
理フレームが、音声信号が支配的である有音区間か、又
は非音声信号が支配的である無音区間かを判定する手順
と、無音区間であると判定された処理フレームが入力音
声信号として入力された際、聴覚重みフィルタのフィル
タ特性を、高周波数帯域を抑圧するように変換する手順
と、を実行させる構成を採る。
【0026】この構成によれば、コンピュータが、聴感
上重要な低域をより正確に表現できる音源候補を選択し
て、聴感上の劣化の少ない音声符号化データを形成する
ことができる。
【0027】
【発明の実施の形態】本発明者らは、入力音声として背
景雑音が重畳された広周波数帯域信号が与えられたとき
に主観的な音声品質が劣化するのは、聴覚重みフィルタ
の生成において静的な聴覚特性を考慮していないためで
あると考えることで本発明に至った。
【0028】本発明の骨子は、入力信号を、音声信号が
支配的である有音区間と、背景雑音が支配的である無音
区間とに分類し、当該有音区間と無音区間とでそれぞれ
異なる聴覚重みフィルタ特性を使って符号励振線形予測
符号化処理を行うようにしたことである。
【0029】以下、本発明の実施の形態について図面を
参照して詳細に説明する。
【0030】(実施の形態1)図1において、100は
全体として、本発明による実施の形態1に係る音声信号
符号化装置の構成を示す。音声信号符号化装置100
は、入力音声信号を線形予測分析器101に入力する。
線形予測分析器101は入力音声を線形予測分析する。
これにより線形予測分析器101は線形予測係数{αi
|i=1,………,P}を得る。ここでPは分析次数で
ある。
【0031】聴覚重みフィルタ生成器102は分析され
た線形予測係数を用いて聴覚重みフィルタを生成する。
具体的には、聴覚重みフィルタ生成器102は抽出され
た線形予測係数から、次式を用いてフィルタの振幅周波
数特性の谷部を強調した聴覚重みフィルタHP(Z)を
生成する。
【0032】
【数2】 ここで、γZ、γPはフォルマント強調係数で0<γP
γZ<1を満たす定数である。図2に、このように構成
された聴覚重みフィルタの振幅周波数特性の一例を示
す。
【0033】また音声信号符号化装置100は有音無音
判定器104を有し、当該有音無音判定器104に入力
音声信号を入力させる。有音無音判定器104は入力音
声信号から処理フレームが有音区間であるか無音区間で
あるかを判定する。ここで有音区間とは音声信号が支配
的な区間であり、無音区間とは背景雑音が支配的な区間
である。
【0034】このような有音区間と無音区間の判定は、
音声信号と背景雑音それぞれにより異なる周波数特性や
規則性を基に容易に行うことができる。有音無音判定器
104は判定結果をフィルタ変換器105に送出する。
【0035】フィルタ変換器105は有音無音判定器1
04から入力音声信号が有音区間であることを示す判定
結果が入力された場合には、聴覚重みフィルタ生成器1
02から出力される聴覚重みフィルタ特性をそのまま聴
覚重みフィルタ106に送出する。これに対して有音無
音判定器104から入力音声信号が無音区間であること
を示す判定結果が入力された場合には、聴覚重みフィル
タ生成器102から出力される聴覚重みフィルタ特性の
高周波数帯域を抑圧するように周波数特性を変換した
後、聴覚重みフィルタ106に送出する。
【0036】適応符号帳107は過去に生成した音源信
号を蓄えている。つまり適応符号帳107は過去に生成
された音源信号によって更新される動的な符号帳であ
る。乗算器108は適応符号帳107により選択された
適応音源ベクトルにゲイン定数を乗じて適応音源信号を
求める。雑音符号帳109は予め定められた音源ベクト
ルが蓄えられている。乗算器110は雑音符号帳109
により選択された雑音音源ベクトルにゲイン定数を乗じ
て雑音音源信号を求める。加算器111は適応音源信号
と雑音音源信号を加算し音源信号を得る。
【0037】このように音声信号符号化装置100にお
いては、適応符号帳107、雑音符号帳109、乗算器
108、110及び加算器111により音源が形成さ
れ、適応符号帳107及び雑音符号帳109により選択
された音源ベクトルが、それぞれ乗算器108と乗算器
110により定数倍され、加算器111で加算されるこ
とで音源信号が生成される。
【0038】合成フィルタ112は加算器111から出
力される音源信号に対して線形予測係数で構成されるフ
ィルタでフィルタリングすることで合成音声を得る。具
体的には、合成フィルタ112では、線形予測係数{α
i|i=1,………,P}で構成され、次式で表される
フィルタH(Z)を用いて音源信号をフィルタリングし
て合成音声を得る。
【0039】
【数3】 聴覚重みフィルタ106は、合成音声に対する聴覚的な
信号強調を、フィルタ変換器105で生成されたフィル
タを用いて行う。聴覚重みフィルタ113は入力音声信
号に対して聴覚的な信号強調を行う。この際、聴覚重み
フィルタ113はフィルタ変換器105で生成されたフ
ィルタを用いて聴覚的な信号強調を行う。
【0040】ここで上述したようにフィルタ変換器10
5は、無音区間において聴覚重みフィルタの高周波数帯
域を抑圧する。この実施の形態の場合、この処理を実現
するため、聴覚重みフィルタHP(Z)のインパルス応
答をhp(t)とすると、このhp(t)に対して低域通
過フィルタのインパルス応答hlpf(t)を畳み込むこ
とで周波数特性を変換した合成フィルタFP(Z)を得
るようになされている。このときフィルタ変換器105
は出力する合成フィルタFP(Z)のインパルス応答fp
(t)を、次式に従って決定する。
【0041】
【数4】 聴覚重みフィルタ106及び聴覚重みフィルタ113で
は、このように決定されたフィルタを用いて、合成音声
及び入力音声をフィルタリングすることで聴覚的に重み
付けされた入力音声及び合成音声とを得る。減算器11
4は聴覚的に重み付けされた入力音声と合成音声の誤差
信号を求める。
【0042】二乗誤差最小化器115は誤差信号のエネ
ルギを算出し、エネルギが最小となる音源ベクトルとゲ
イン定数の組み合わせを求める。そして二乗誤差最小化
器115により求められた音源ベクトル、ゲイン定数と
そのときの線形予測係数が多重化器116により多重化
されて音声符号化データが形成される。
【0043】次に図2〜図5を用いて、この実施の形態
の音声信号符号化装置100の動作について説明する。
図4は、入力音声信号が音声信号が支配的である場合、
すなわち処理フレームが有音区間である場合について着
目したものである。一方、図5は、入力音声信号が非音
声信号(背景雑音)が支配的である場合、つまり処理フ
レームが無音区間である場合について着目したものであ
る。
【0044】まず有音区間について説明する。有音無音
判定器104により現在の処理フレームが有音区間であ
ることを示す判定結果が得られ、聴覚重みフィルタ10
6、113は、図2の点線で示すような聴覚重みフィル
タ生成器102により生成された聴覚重みフィルタ特性
とされる。このようなフィルタ特性の聴覚重みフィルタ
106、113を用いることにより、小さな振幅の周波
数帯域を強調した信号間で誤差を最小化することができ
る。例えば図3の一点鎖線のような振幅周波数特性をも
つ量子化雑音を、図4に示す振幅周波数特性とすること
ができる。
【0045】ここで図3及び図4の斜線部の面積は量子
化雑音エネルギを示しており、この量子化雑音エネルギ
はコーデックの構成とビットレートにより決定される。
ところで、聴感に対応する雑音の客観尺度としてSN比
があり、SN比が同じならば主観的に感じる雑音の大き
さは等しい。このことは雑音エネルギが同じならば、信
号の振幅周波数特性に合わせて、大きな振幅の周波数帯
域の振幅が大きくなるように雑音の振幅周波数特性をシ
ェービングすることで主観的な品質を向上させることが
できることを意味している。
【0046】このことから図4に示す量子化雑音の振幅
周波数特性は、図3に示す量子化雑音よりも主観的に感
じる雑音が小さいということができ、聴覚重みフィルタ
106、113により主観的な品質が向上することを示
している。
【0047】これに対して、処理フレームとして、背景
雑音が支配的である無音区間が入力された場合、有音無
音判定器104により現在の処理フレームが無音区間で
あることを示す判定結果が得られ、聴覚重みフィルタ1
06、113はフィルタ変換器105により、図5の破
線で示すような高周波数帯域を抑圧するような聴覚重み
フィルタ特性とされる。
【0048】この結果、高周波数帯域にもエネルギを有
するような背景雑音が重畳された入力音声が符号化対象
となった場合でも、聴覚重みフィルタ106、113に
より高周波数帯域成分が抑制されるので、二乗誤差最小
化器115では例えば4〜5[kHz]までの聴覚上重
要となる低周波数帯域の量子化誤差を少なくする音源が
選択される。つまり聴感上重要な低周波数帯域に重み付
けした誤差尺度に基づいて音源探索することになり、主
観的な音声品質を向上させることができる。
【0049】具体的には、上述したように、二乗誤差最
小化器115では、減算器114から出力される差分信
号のエネルギが最小となる音源を選択することで、量子
化誤差を小さくしている。このため差分信号において高
周波数帯域のエネルギを抑制することで、二乗誤差最小
化器115は、低周波数帯域の量子化誤差を小さくする
ような音源を選択するように動作するので、実際上重要
となる低周波数帯域の量子化誤差の低減効果が生じる。
【0050】因みに、音声信号が支配的である有音区間
では、音声信号が低周波数帯域に大きなエネルギをもっ
ているので、高周波数帯域をそれほど抑制しなくても、
二乗誤差最小化器115により低周波数帯域の量子化誤
差を重点的に小さくするような音源が選択されるので、
この実施の形態では、有音区間の処理フレームが入力さ
れた場合には、聴覚重みフィルタ106、113に高周
波数帯域を抑制する特性を持たせないようにしている。
【0051】以上の構成によれば、入力音声信号を声帯
を模した音源情報と声道を模した合成フィルタ情報に分
離して符号化する場合に、入力音声信号が有音区間か無
音区間かを判定し、音声信号が殆ど含まれず背景雑音が
支配的である無音区間であった場合に聴覚重みフィルタ
106、113のフィルタ特性を高周波数帯域成分を抑
制するように設定したことにより、背景雑音における低
周波数帯域での量子化歪みを低減することができる。こ
の結果、聴感上重要な低域をより正確に表現できる音源
候補を選択し易くできるので、聴感上の劣化が少ない音
声符号化装置100を実現できる。
【0052】(実施の形態2)図1との対応部分に同一
符号を付して示す図6において、200は全体として本
発明の実施の形態2に係る音声信号符号化装置の構成を
示す。この実施の形態の音声信号符号化装置200は、
雑音符号帳109から出力された雑音音源ベクトルの特
性を有音無音判定器104の判定結果に応じて変換する
特性変換器201を有すること、及び有音無音判定器1
04の判定結果の情報を多重化器116に出力すること
を除いて、実施の形態1の音声信号符号化装置100と
同様の構成でなる。
【0053】特性変換器201はフィルタ変換器105
と同様の特性を有する。特性変換器201は有音無音判
定器104からの判定結果に応じてフィルタ変換器10
5に同期して雑音音源ベクトルの周波数特性を変更す
る。すなわち特性変換器201は、有音無音判定器10
4から入力処理フレームが無音区間である判定結果が入
力されると、雑音符号帳109から入力される雑音音源
ベクトルνS(t)に対して、フィルタ変換器105と
同じ低域通過フィルタ特性hlpf(t)を用いて、次式
で示すフィルタリング処理を施すことにより、特性変換
器出力ψS(t)を得る。
【0054】
【数5】 ここで雑音符号帳109には一般に周波数特性が平坦な
雑音音源ベクトルが蓄積されているので、特性変換器2
01は、フィルタ変換器105に同期して無音区間にお
いてこの平坦な周波数特性の雑音音源ベクトルの高周波
数帯域を抑制するように周波数特性を変更する。
【0055】図7に、音声信号符号化装置200により
得られた符号化データを復号する音声信号復号装置30
0の構成を示す。音声信号復号装置300は、分離器3
01で音声信号符号化装置200から受信した符号化デ
ータを線形予測係数、有音無音判定情報、音源ベクトル
情報(適応音源ベクトル情報、雑音音源ベクトル情報)
及びゲイン定数(適応音源ゲイン定数、雑音音源ゲイン
定数)に分離する。そして線形予測係数を合成フィルタ
312に、適応音源ベクトル情報を適応符号帳302
に、雑音音源ベクトル情報を雑音符号帳304に、適応
音源ゲイン定数、雑音音源ゲイン定数をそれぞれ適応符
号帳302、雑音符号帳304に対応する乗算器30
3、307に、有音無音判定情報を有音無音判定器30
5に送出する。適応符号帳302は過去に生成した音源
信号を蓄えている。乗算器303は適応符号帳302か
ら出力された適応音源ベクトルに適応音源ゲイン定数を
乗じて適応音源信号を求める。雑音符号帳304は予め
定められた音源ベクトルが蓄えられている。
【0056】有音無音判定器305は音声信号符号化装
置200からの有音無音判定情報を用いて処理フレーム
が有音区間であるか無音区間であるか判定する。特性変
換器306は雑音符号帳304から選択された雑音音源
ベクトルの特性を有音無音情報に応じて変換する。実際
上、特性変換器306は、音声信号符号化装置200の
特性変換器201と同様のフィルタ特性を有し、(5)
式に基づいて雑音符号帳304から入力された雑音音源
ベクトルをフィルタリングする。
【0057】乗算器307は特性変換器306から出力
されたベクトルに雑音音源ゲイン定数を乗じて雑音音源
信号を求める。加算器308は適応音源信号と雑音音源
信号を加算し音源信号を生成する。
【0058】雑音生成器309は特性変換器306で変
換した雑音音源の周波数領域でのエネルギ分布特性を補
完する自励雑音ベクトルを生成する。実際上、雑音生成
器309は有音無音情報に基づいて次式により自励雑音
ベクトルνr(t)を生成する。
【0059】
【数6】 ここでr(t)は例えば発振器を用いて音声信号符号化
装置200と独立して音声信号復号装置300で生成す
る白色雑音であり、hhpfは特性変換器306で用いた
lpfと相補して全域通過型フィルタを構成する高域通
過型フィルタである。
【0060】乗算器310は有音無音情報及び雑音音源
ゲイン定数を利用して決定したゲインを自励雑音ベクト
ルに乗じ自励雑音信号を出力する。加算器311は音源
信号と自励雑音信号を加算し、補正音源信号を生成す
る。合成フィルタ312は生成された補正音源信号をフ
ィルタリングし復号音声を合成する。
【0061】以上の構成によれば、音声信号符号化装置
200により、誤差算出対象外の周波数帯域で生じる量
子化雑音を抑制し、音声信号復号装置300により、定
常的な雑音に置換するようにしたことにより、主観的な
音声品質を向上させることができる。
【0062】なお、上述の実施の形態では、有音無音判
定情報は符号化装置から送信される構成として説明した
が、符号化装置から送信する構成とせず、復号装置で受
信した他の情報を用いて判定する構成としても良い。
【0063】
【発明の効果】以上説明したように、本発明によれば、
入力音声信号の処理フレームが、音声信号が支配的であ
る有音区間か、又は非音声信号が支配的である無音区間
かを判定し、無音区間である処理フレームが入力音声信
号として入力された際、聴覚重みフィルタのフィルタ特
性を、高周波数帯域を抑圧するようにしたことにより、
背景雑音が重畳された音声信号が入力された場合でも、
主観的な品質の劣化を抑制し得る音声信号符号化装置を
実現できる。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係る音声信号符号化装
置の構成を示すブロック図
【図2】実施の形態での有音区間における聴覚重みフィ
ルタ特性の説明に供する特性曲線図
【図3】聴覚重みフィルタ特性の説明に供する特性曲線
【図4】実施の形態での有音区間における量子化雑音特
性を示す特性曲線図
【図5】実施の形態での無音区間における聴覚重みフィ
ルタ特性の説明に供する特性曲線図
【図6】実施の形態2の音声信号符号化装置の構成を示
すブロック図
【図7】実施の形態2の音声信号復号装置の構成を示す
ブロック図
【図8】符号励振線形予測符号化を行う従来の音声信号
符号化装置の構成を示すブロック図
【図9】従来の音声信号復号装置の構成を示すブロック
【図10】量子化雑音と主観特性の関係を示す特性曲線
【符号の説明】
100、200 音声信号符号化装置 101 線形予測分析器 102 聴覚重みフィルタ生成器 104、305 有音無音判定器 105 フィルタ変換器 106、113 聴覚重みフィルタ 107、302 適応符号帳 109、304 雑音符号帳 201 特性変換器 300 音声信号復号装置
フロントページの続き (72)発明者 米崎 正 神奈川県横浜市港北区綱島東四丁目3番1 号 松下通信工業株式会社内 (72)発明者 河嶋 拓也 石川県金沢市西念一丁目1番3号 株式会 社松下通信金沢研究所内 (72)発明者 佐々木 茂明 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 間野 一則 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 片岡 章俊 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5D045 CA01 CB01 CC02 CC07 5J064 AA01 BA13 BB03 BB07 BC08 BC09 BC11 BC14 BC18 BC26 BD02 BD03

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 入力音声信号に対して処理フレーム単位
    で線形予測分析処理を施すことにより線形予測係数を算
    出する線形予測分析手段と、 適応符号帳及び雑音符号帳に格納された適応音源及び雑
    音音源に対して前記線形予測係数を用いたフィルタリン
    グ処理を施すことにより符号化合成音を得る合成フィル
    タと、 前記適応音源及び前記雑音音源のゲインを求め、さらに
    前記ゲインを用いて得られる前記合成音と前記入力音声
    信号との間の符号化歪みが最小となる前記適応音源及び
    前記雑音音源の符号及び前記ゲインを探索する演算手段
    と、 前記入力音声信号及び前記合成音に対して聴覚重み付け
    処理を施す聴覚重みフィルタと、 前記入力音声信号の処理フレームが、音声信号が支配的
    である有音区間か、又は非音声信号が支配的である無音
    区間かを判定する有音無音判定手段と、 前記有音無音判定手段により無音区間であると判定され
    た処理フレームが前記入力音声信号として入力された
    際、前記聴覚重みフィルタのフィルタ特性を、高周波数
    帯域を抑圧するように変換するフィルタ特性変換手段と
    を具備することを特徴とする音声信号符号化装置。
  2. 【請求項2】 さらに、有音無音判定手段により無音区
    間であると判定された処理フレームが入力音声信号とし
    て入力された際、音源情報を生成するために設けられた
    適応符号帳及び雑音符号帳のうち、雑音符号帳から出力
    される雑音音源ベクトルの高周波数帯域を抑圧する周波
    数特性変換手段を具備することを特徴とする請求項1に
    記載の音声信号符号化装置。
  3. 【請求項3】 請求項2に記載の音声信号符号化装置か
    ら得られる情報を用いて音声信号を復号する符号励振線
    形予測型の音声信号復号装置であって、 請求項2の音声信号符号化装置から得られる情報を用い
    て、処理フレームが音声信号が支配的である有音区間
    か、又は非音声信号が支配的である無音区間かを判定す
    る有音無音判定手段と、 無音区間において雑音符号帳から得られる雑音音源ベク
    トルの高周波数帯域を抑圧する特性変換手段と、 無音区間において雑音音源ベクトルに対して抑圧した周
    波数帯域の信号エネルギを補完する特性を有する雑音ベ
    クトルを生成する雑音生成手段と、 請求項2の音声信号符号化装置から得られる情報を用い
    て生成した雑音ベクトルのゲインを推定し、雑音ベクト
    ルに乗ずる乗算手段と、 生成した雑音を音源信号に加算する加算手段とを具備す
    ることを特徴とする音声信号復号装置。
  4. 【請求項4】 入力音声信号に対して処理フレーム単位
    で線形予測分析処理を施すことにより線形予測係数を算
    出するステップと、適応符号帳及び雑音符号帳に格納さ
    れた適応音源及び雑音音源に対して前記線形予測係数を
    用いたフィルタリング処理を施すことにより符号化合成
    音を得るステップと、前記適応音源及び前記雑音音源の
    ゲインを求め、このゲインを用いて得られる前記合成音
    と前記入力音声信号との間の符号化歪みが最小となる前
    記適応音源及び前記雑音音源の符号及び前記ゲインを探
    索するステップと、前記入力音声信号及び前記合成音に
    対して聴覚重み付け処理を施すステップと、前記入力音
    声信号の処理フレームが、音声信号が支配的である有音
    区間か、又は非音声信号が支配的である無音区間かを判
    定するステップと、無音区間であると判定された処理フ
    レームが前記入力音声信号として入力された際、前記聴
    覚重みフィルタのフィルタ特性を、高周波数帯域を抑圧
    するように変換するステップと、を有することを特徴と
    する音声信号符号化方法。
  5. 【請求項5】 コンピュータに、入力音声信号に対して
    処理フレーム単位で線形予測分析処理を施すことにより
    線形予測係数を算出する手順と、適応符号帳及び雑音符
    号帳に格納された適応音源及び雑音音源に対して前記線
    形予測係数を用いたフィルタリング処理を施すことによ
    り符号化合成音を得る手順と、前記適応音源及び前記雑
    音音源のゲインを求め、このゲインを用いて得られる前
    記合成音と前記入力音声信号との間の符号化歪みが最小
    となる前記適応音源及び前記雑音音源の符号及び前記ゲ
    インを探索する手順と、前記入力音声信号及び前記合成
    音に対して聴覚重み付け処理を施す手順と、前記入力音
    声信号の処理フレームが、音声信号が支配的である有音
    区間か、又は非音声信号が支配的である無音区間かを判
    定する手順と、無音区間であると判定された処理フレー
    ムが前記入力音声信号として入力された際、前記聴覚重
    みフィルタのフィルタ特性を、高周波数帯域を抑圧する
    ように変換する手順と、を実行させるためのプログラ
    ム。
JP2001396474A 2001-12-27 2001-12-27 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法 Expired - Fee Related JP3785363B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001396474A JP3785363B2 (ja) 2001-12-27 2001-12-27 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001396474A JP3785363B2 (ja) 2001-12-27 2001-12-27 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法

Publications (2)

Publication Number Publication Date
JP2003195900A true JP2003195900A (ja) 2003-07-09
JP3785363B2 JP3785363B2 (ja) 2006-06-14

Family

ID=27602558

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001396474A Expired - Fee Related JP3785363B2 (ja) 2001-12-27 2001-12-27 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法

Country Status (1)

Country Link
JP (1) JP3785363B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008032828A1 (fr) 2006-09-15 2008-03-20 Panasonic Corporation Dispositif de codage audio et procédé de codage audio
JP2008304775A (ja) * 2007-06-08 2008-12-18 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
JP2021060618A (ja) * 2011-05-25 2021-04-15 ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008032828A1 (fr) 2006-09-15 2008-03-20 Panasonic Corporation Dispositif de codage audio et procédé de codage audio
US8239191B2 (en) 2006-09-15 2012-08-07 Panasonic Corporation Speech encoding apparatus and speech encoding method
JP2008304775A (ja) * 2007-06-08 2008-12-18 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
JP2021060618A (ja) * 2011-05-25 2021-04-15 ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス
JP7177185B2 (ja) 2011-05-25 2022-11-22 ▲ホア▼▲ウェイ▼技術有限公司 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス

Also Published As

Publication number Publication date
JP3785363B2 (ja) 2006-06-14

Similar Documents

Publication Publication Date Title
RU2262748C2 (ru) Многорежимное устройство кодирования
JP4308345B2 (ja) マルチモード音声符号化装置及び復号化装置
JP3653826B2 (ja) 音声復号化方法及び装置
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
KR100915733B1 (ko) 음성 신호들의 대역폭의 인공 확장을 위한 방법 및 장치
US7636055B2 (en) Signal decoding apparatus and signal decoding method
EP0770987A2 (en) Method and apparatus for reproducing speech signals, method and apparatus for decoding the speech, method and apparatus for synthesizing the speech and portable radio terminal apparatus
JP4040126B2 (ja) 音声復号化方法および装置
JPH08179796A (ja) 音声符号化方法
JP4679513B2 (ja) 階層符号化装置および階層符号化方法
JP4445328B2 (ja) 音声・楽音復号化装置および音声・楽音復号化方法
JPWO2006120931A1 (ja) 符号化装置、復号化装置及びこれらの方法
JPH1020891A (ja) 音声符号化方法及び装置
EP1619666B1 (en) Speech decoder, speech decoding method, program, recording medium
EP3281197B1 (en) Audio encoder and method for encoding an audio signal
WO2014034697A1 (ja) 復号方法、復号装置、プログラム、及びその記録媒体
JP3612260B2 (ja) 音声符号化方法及び装置並びに及び音声復号方法及び装置
JP2003044099A (ja) ピッチ周期探索範囲設定装置及びピッチ周期探索装置
JP3785363B2 (ja) 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法
JP2000122679A (ja) 音声帯域拡張方法及び装置、音声合成方法及び装置
JP3510643B2 (ja) 音声信号のピッチ周期処理方法
JP4954310B2 (ja) モード判定装置及びモード判定方法
WO2004040553A1 (ja) 帯域拡張装置及び方法
JP2004151424A (ja) トランスコーダ及び符号変換方法
JP3006790B2 (ja) 音声符号化復号化方法及びその装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040301

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060317

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090324

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100324

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110324

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110324

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120324

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130324

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130324

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees