JP3451998B2

JP3451998B2 - 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体

Info

Publication number: JP3451998B2
Application number: JP29879599A
Authority: JP
Inventors: 芹沢　　昌宏; 伊藤　　博紀
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1999-05-31
Filing date: 1999-10-20
Publication date: 2003-09-29
Anticipated expiration: 2019-10-20
Also published as: US8195469B1; CA2373479A1; JP2001051699A; EP1199710B1; EP1199710A4; WO2000074036A1; CA2373479C; EP1199710A1

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声信号等のデジ
タル情報を符号化・復号する装置に関し、特に無音声部
の符号化・復号技術に関する。

【０００２】

【従来の技術】この種の従来の音声符号化・復号装置
は、音声がない区間（「無音声区間」という）を、音声
区間の符号化に比べて非常に低いビットレートで符号化
することにより、伝送する平均ビットレートを低減する
ものであり、例えば、文献１（IEEE Communications
Magazine, 第64−73頁、Sep、1997）等の記載が参照さ
れる。

【０００３】この従来の符号化装置では、入力信号を予
め定めたフレーム（10 msec）毎に音声区間であるか無
音声区間であるかを判別し、音声区間である場合には、
通常の音声符号化方式（ITU−T勧告G.729）により入力
信号を符号化・復号し、一方、無音声区間の場合、符号
化装置では入力信号の特徴パラメータを間欠的に符号化
し、復号装置に伝送する。復号装置では、全てのフレー
ムではなく、間欠的に受信した特徴パラメータの繰り返
しあるいは平滑化を行うことで全フレームの特徴パラメ
ータを計算し、これらを用いて信号を復号する。

【０００４】音声区間か無音声区間かを判別する方法と
して、上記文献１記載されているように、フレーム毎に
入力信号から計算する二乗平均平方根（root mean sq
uares;「RMS」という）、低周波数領域に対応するRMS、
零交差数、及びスペクトル包絡特性を表すフィルタ係数
を用いる方法がある。これらの変量と各々の無音声区間
における平均値との差分に基づき、閾値処理により判別
を行なう。

【０００５】音声区間を符号化する方法としては、例え
ば、文献２（ITU−T勧告G.729、COM15−152 July 199
5）に記載されているCELP (Code Excited Linear Pr
ediction Coding；符号励振線形予測符号化)方式があ
る。CELP方式については、文献３（Code−Excited Line
ar Prediction : High Quality Speech at Very LowBit
Rates (IEEE Proc. ICASSP−85、 pp.937− 940、198
5) )の記載も参照される。

【０００６】従来の装置の符号化処理では、入力信号を
予め定めたフレーム毎に線形予測分析して、音声信号の
スペクトル包絡特性を表す線形予測(フィルタ)係数を算
出し、そのスペクトル包絡特性に対応するＬＰ合成フィ
ルタを駆動して励振信号を算出し、それぞれ符号化す
る。

【０００７】励振信号の符号化は、フレームを更にサブ
フレームに分割してサブフレーム毎に行う。ここで、励
振信号は、入力信号のピッチ周期を表す周期成分と残り
の残差成分とそれらのゲインにより構成される。入力信
号のピッチ周期を表す周期成分は、「適応コードブッ
ク」と呼ばれる過去の励振信号を保持するコードブック
に格納された適応コードベクトルとして表され、前記残
差成分は、複数のパルスからなるマルチパルス信号とし
て表される。

【０００８】また、復号処理では、復号したピッチ周期
成分と残差信号から得た励振信号を、復号したフィルタ
係数で構成する合成フィルタに入力して音声信号を復号
する。

【０００９】無音声区間を符号化する方法として、上記
文献１に記載されているように、まず、符号化装置で、
入力信号の特徴パラメータとしてRMSとスペクトル特性
を表すフィルタ係数を符号化する。

【００１０】次に、復号装置では、乱数信号と乱数的に
生成したパルス性信号とピッチ信号の線形和をRMSで調
整し、これをフィルタ係数を用いて構成した合成フィル
タに入力することにより、無音声信号を復号する。

【００１１】特徴パラメータは、無音声区間で信号の性
質が変化したフレームでのみ伝送し、それ以外のフレー
ムでは何も伝送しない。但し、特徴パラメータを伝送す
るか否かの情報は別途伝送する。

【００１２】この特徴パラメータを何も伝送しないフレ
ームでは、過去の伝送された特徴パラメータを繰り返し
使用する。但し、波形上での不連続が生じないように、
RMSは、平滑化処理を施している。

【００１３】図８は、従来の符号化装置の構成を示すブ
ロック図である。図８を参照すると、この符号化装置
は、音声部符号化回路12と、無音声部符号化回路14と、
信号判定回路16と、切り替え回路18と、ビット生成回路
20とを備えている。

【００１４】入力端子10は、入力信号を一定フレーム単
位、例えば10msec単位で入力する。信号判定回路16は、
入力端子10からの入力信号を用いてフレームが音声区間
か無音声区間かの判定を行ない、判定結果（VAD判定符
号）を切り替え回路18とビット列生成回路20に渡す。

【００１５】音声部符号化回路12は、入力端子10からの
入力信号をフレーム毎に符号化し、信号符号列を切り替
え回路18に渡す。

【００１６】無音声部符号化回路14は、入力端子10から
の入力信号をフレーム毎に符号化し、信号符号列を切り
替え回路18に渡す。また、無音声区間において信号符号
列を伝送するか否かの判定情報（DTX判定符号）をビッ
ト生成回路20に渡す。

【００１７】切り替え回路18は、信号判定回路16から渡
されるVAD判定符号に基づき、入力信号が音声区間とさ
れた場合には、音声部符号化回路12から渡された信号符
号列を、VAD判定符号で入力信号が無音声区間とされた
場合には、無音声符号化回路14から渡された信号符号列
をビット列生成回路20に渡す。

【００１８】ビット列生成回路20は、信号判定回路16か
ら渡されるVAD判定符号と、無音声部符号化回路10から
渡されるDTX判定符号と、切り替え回路18から渡される
信号符号列とを多重して、ビット列を生成し、出力端子
22から出力する。

【００１９】図９は、従来の復号装置を説明するブロッ
ク図である。

【００２０】図９を参照すると、この復号装置は、ビッ
ト列分解回路26と、切り替え回路28と、音声部復号回路
30と、無音声部復号回路34とを備えて構成される。ビッ
ト列分解回路26は、入力端子24から入力したビット列を
VAD判定符号とDTX判定符号及び信号符号列に分解し、VA
D判定符号と信号符号列を切り替え回路28に渡し、DTX判
定符号を無音声部復号回路34に渡す。

【００２１】切り替え回路28は、ビット列分解回路26か
ら渡されたVAD判定符号に基づき、入力信号が音声区間
とされた場合にはビット列分解回路26から渡された信号
符号列を音声部復号回路30に渡し、VAD判定符号で入力
信号が無音声区間とされた場合には無音声部復号回路34
に渡す。

【００２２】音声部復号回路30は、切り替え回路28から
渡された信号符号列を用いて信号を復号し、出力端子32
から出力する。

【００２３】無音声部復号回路34は、ビット列分解回路
26から渡されたDTX判定符号と切り替え回路28から渡さ
れた信号符号列を用いて、無音声部の信号を復号し、出
力端子32から出力する。

【００２４】図１０は、従来の復号装置における無音声
復号回路34の構成を示すブロック図である。図１０を参
照すると、無音声復号回路34は、パラメータ復号回路54
と、乱数回路56と、パルス回路53と、混合回路61と、平
滑化回路66と、合成回路68とを備えている。

【００２５】パラメータ復号回路54は、入力端子52で入
力した信号符号列から求めたフィルタ係数とRMSをそれ
ぞれ合成回路68と平滑化回路66に渡す。

【００２６】平滑化回路66は、パラメータ復号回路54か
ら渡されたRMSを平滑化して得た平滑化RMSを、混合回路
61に渡す。但し、入力端子50から入力されたDTX判定符
号で信号符号列が伝送されないことが示された場合に
は、前フレームのRMSを用いて平滑化を行なう。

【００２７】各無音声区間中の先頭から数えてnフレー
ム目で使用する平滑化RMS P(n)は、nフレーム目に入力
されたRMS p(n)を用いて次式（１）で計算する。但
し、何も伝送されてこないフレームではp(n)の代わりに
直前に伝送されたRMSを用いて次式（１）を計算する。

【００２８】 P(n)=(1−α)・p(n−1)＋α・p(n) …（1）

【００２９】ここで、αは平滑化の程度を決定する平滑
化係数であり、上記文献１では、固定値0.125を用いて
いる。また、Ｐ(−1)=0である。

【００３０】乱数回路56は、乱数を生成し、混合回路61
に渡す。パルス回路53は、乱数で各々生成した位置と振
幅を持つパルスから成るパルス列信号を生成し、混合回
路61に渡す。

【００３１】ピッチ回路58は、前述の適応コードベクト
ルからなるピッチ信号を生成し、混合回路61に渡す。適
応コードベクトルを規定するピッチ周期は伝送されない
ことから、代わりに乱数信号を用いる。

【００３２】混合回路61では、乱数回路56から渡された
乱数信号r(i)と、パルス回路53から渡されたパルス列信
号p(i)と、ピッチ回路58から渡されたピッチ信号q(i)と
の線形和処理により、合成フィルタの励振信号x(i)を計
算し、合成回路68に渡す。

【００３３】線形和の結合係数を計算する方法として、
例えば、上記文献１に記載された方法が用いられる。

【００３４】まず、ピッチ信号の結合係数Gqを制限され
た範囲内の値から乱数で選択する。

【００３５】次に、計算したピッチ信号の結合係数Gqを
用いて、ピッチ信号とパルス列信号の線形和から計算し
たRMSが前記平滑化RMSと同一になるように、パルス列信
号の結合係数Gpを計算する。

【００３６】以上で計算した結合係数を用いてピッチ信
号とパルス列信号との線形和 e(i)を次式（２）で計算
する。

【００３７】e(i) = Gq ・q(i) + Gp・p(i) …（2）

【００３８】更に、この線形和 e(i) と乱数信号との
新たな線形和が前記平滑化RMSと同一になるように、線
形和 e(i) の結合係数Grを計算する。ここで、乱数信
号の結合係数は固定値γ=0.6を用いている。

【００３９】従って、合成フィルタの励振信号x(i)は次
式（３）で計算される。

【００４０】 x(i) = Gr ・[Gq ・q(i) + Gp・p(i)] + γ・r(i) …（3）

【００４１】合成回路68は、混合回路61から渡される励
振信号を、パラメータ復号回路54から渡されるフィルタ
係数で構成するフィルタに入力することにより、信号を
復号し、出力端子70から出力する。

【００４２】

【発明が解決しようとする課題】しかしながら、上記し
た従来の装置は下記記載の問題点を有している。

【００４３】第１の問題点は、復号装置において、無音
声区間を復号する際に使用するフィルタ係数が不連続に
変化する場合があり、その結果、復号信号の品質が劣化
する、ということである。

【００４４】その理由は、間欠的に伝送されるフィルタ
係数をそのまま用いている、ためである。

【００４５】第２の問題点は、無音声区間における最初
の区間（例えば数百msec）において直前の有音声区間に
よる影響を受ける場合があり、その結果、復号信号でそ
の振幅が実際より高くなったり、エコーを含むことによ
る復号信号の音質劣化が生じる、ということである。

【００４６】その理由は、無音声区間では、無音声区間
における再生信号が不連続にならないように、RMSの平
滑化処理を、常に行なっている、ためである。

【００４７】第３の問題点は、無音声区間の復号信号が
入力信号の背景雑音とは聴覚的に著しく異なる場合があ
り、その結果、有音声部に含まれる背景雑音と聴覚的な
不連続が生じる、ということである。

【００４８】その理由は、無音声区間において再生フィ
ルタの励振信号を生成する時に、乱数成分に対するパル
ス成分とピッチ成分の比を一定値としている、ためであ
る。

【００４９】したがって本発明は、上記問題点に鑑みて
なされたものであって、その主たる目的は、無音声区間
を高性能に符号化することで、無音声部符号化の導入に
より伝送ビットレートの平均値を下げても、高符号化品
質を実現する、装置を提供することにある。

【００５０】また本発明の他の目的は、無音声区間復号
時のフィルタ係数の不連続に帰因する復号音質劣化を低
減する復号装置を提供することにある。

【００５１】

【課題を解決するための手段】前記目的を達成する第１
の発明は、各フレームにおいて復号信号が音声区間であ
るか無音声区間であるかの判別情報に従い前記復号信号
の特徴パラメータから信号を復号する方法を切り替える
音声復号装置において、前記特徴パラメータの中で前記
復号信号のスペクトル包絡特性を表す特徴パラメータを
時間方向に平滑化した値を用いて復号する手段を備えて
いる。

【００５２】第２の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別情報に
従い前記復号信号の特徴パラメータから信号を復号する
方法を切り替える音声復号装置において、音声区間から
無音声区間に切り替わってからの時間経過に応じて、前
記特徴パラメータの少なくとも一つについて時間方向に
平滑化する程度を変更した値を用いて復号する手段を備
える。

【００５３】第３の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、音声区間から無音
声区間に切り替わった直後の区間では伝送された特徴パ
ラメータの少なくとも一つを直接使用し、それ以降は、
前記特徴パラメータの内少なくとも一つについて時間方
向に平滑化した値を信号復号で用いて復号する手段を備
える。

【００５４】第４の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、前記特徴パラメー
タの内少なくとも一つに応じて、前記特徴パラメータの
少なくとも一つについて時間方向に平滑化する程度を変
更した値を用いて復号する手段を備える。

【００５５】第５の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、前記特徴パラメー
タの内少なくとも一つ及び音声区間から無音声区間に切
り替わってからの時間経過に応じて、前記特徴パラメー
タの少なくとも一つについて時間方向に平滑化する程度
を変更した値を用いて復号する手段を備える。

【００５６】第５の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、前記特徴パラメー
タが予め定めた条件を満たす区間では伝送された特徴パ
ラメータの内少なくとも一つを直接使用し、それ以降
は、前記特徴パラメータの内少なくとも一つについて時
間方向に平滑化した値を信号復号で用いて復号する手段
を備えたことを特徴とする音声復号装置。

【００５７】第６の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、前記特徴パラメー
タの内少なくとも一つ及び音声区間から無音声区間に切
り替わってからの時間経過に応じて、前記特徴パラメー
タの内少なくとも一つについて時間方向に平滑化する程
度を変更した値を用いて復号する手段を備える。

【００５８】第７の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、音声区間から無音
声区間に切り替わった直後且つ前記特徴パラメータが予
め定めた条件を満たす区間では伝送された特徴パラメー
タの少なくとも一つを直接使用し、それ以降は、前記特
徴パラメータの内少なくとも一つについて時間方向に平
滑化した値を信号復号で用いて復号する手段を備える。

【００５９】第８の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別情報に
従い前記復号信号に対応する特徴パラメータから信号を
復号する方法を切り替え、少なくとも一部の区間におい
て、無音声区間の信号を複数種類の信号から成る励振信
号を合成フィルタに入力することにより生成する音声復
号装置において、受信した特徴パラメータの少なくとも
一つに基づき、前記無音声区間における前記複数種類の
信号を加算する際の係数を決定する手段を備える。

【００６０】第９の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別情報に
従い前記復号信号に対応する特徴パラメータから信号を
復号する方法を切り替え、無音声区間の信号を複数種類
の信号から成る励振信号を合成フィルタに入力すること
により生成する音声復号装置において、少なくとも一部
の区間において、受信した特徴パラメータの時間方向に
平滑化した平滑化パラメータの少なくとも一つに基づ
き、前記無音声区間における前記複数種類の信号を加算
する際の係数を決定する。

【００６１】第１０の発明は、前記第１乃至第９の発明
において、前記特徴パラメータが、前記復号信号に対応
するスペクトル包絡を表す量とパワーを表す量の少なく
とも一つを含む。

【００６２】第１１の発明は、各フレームにおいて入力
信号が音声区間であるか無音声区間であるかの判別を行
い前記入力信号の特徴パラメータを符号化する符号化装
置と、第１乃至第１０のいずれかの音声復号装置とを備
える。

【００６３】

【発明の実施の形態】本発明の実施の形態について説明
する。本発明の音声復号装置は、第１の実施の形態にお
いて、各フレームにおいて復号信号が音声区間であるか
無音声区間であるかの判別情報に従い前記復号信号の特
徴パラメータから信号を復号する方法を切り替える手段
（図９の28）と、前記特徴パラメータの中で、前記復号
信号のスペクトル包絡特性を表す特徴パラメータを時間
方向に平滑化する手段（図１の64）と、平滑化した特徴
パラメータを用いて復号処理を行なう手段（図１の56、
53、58、61及び68）とを備えている。

【００６４】本発明の音声復号装置は、第２の実施の形
態において、各フレームにおいて復号信号が音声区間で
あるか無音声区間であるかの判別に従い前記復号信号の
特徴パラメータから信号を復号する方法を切り替える手
段（図２の28）と、前記特徴パラメータの内少なくとも
一つ及び音声区間から無音声区間に切り替わってからの
時間経過に応じて、前記特徴パラメータの少なくとも一
つに関して時間方向に平滑化する手段（図２の36、図３
の49と51）と、この平滑化した特徴パラメータを用いて
復号処理を行なう手段（図３の56、53、58、61及び68）
とを備えている。

【００６５】本発明の音声復号装置は、第３の実施の形
態において、各フレームにおいて復号信号が音声区間で
あるか無音声区間であるかの判別に従い前記復号信号の
特徴パラメータから信号を復号する方法を切り替える手
段（図２の28）と、音声区間から無音声区間に切り替わ
った直後で前記特徴パラメータが予め定めた条件を満た
す区間では伝送された特徴パラメータの少なくとも一つ
を直接使用し、それ以降は前記特徴パラメータの内少な
くとも一つに関して時間方向に平滑化した値を生成する
手段（図２の３６、図３の４９と５１）、前記平滑化し
た値を用いて復号処理を行なう手段（図３の56、53、5
8、61及び68）とを備えている。

【００６６】本発明の音声復号装置は、第４の実施の形
態において、各フレームにおいて復号信号が音声区間で
あるか無音声区間であるかの判別に従い前記復号信号に
対応する特徴パラメータから信号を復号する方法を切り
替える手段（図４の28）と、無音声区間の信号を複数種
類の信号から成る励振信号を合成フィルタに入力するこ
とにより生成する手段（図５の56、53、58、60、68）
と、受信した特徴パラメータの少なくとも一つに基づき
前記無音声区間における前記複数種類の信号を加算する
際の係数を決定する手段（図４の38）とを備えている。

【００６７】本発明の音声復号装置は、第５の実施の形
態において、各フレームにおいて復号信号が音声区間で
あるか無音声区間であるかの判別に従い前記復号信号に
対応する特徴パラメータから信号を復号する方法を切り
替える手段（図６の28）と、無音声区間の信号を複数種
類の信号から成る励振信号を合成フィルタに入力するこ
とにより生成する手段（図７の56、53、58、60、68）
と、受信した特徴パラメータの時間方向に平滑化した平
滑化パラメータを計算する手段（図７の64と50）と計算
した平滑化パラメータの少なくとも一つに基づき前記無
音声区間における前記複数種類の信号を加算する際の係
数を決定する手段（図６の38）とを備えている。

【００６８】本発明の音声復号装置は、第６の実施の形
態において、前記特徴パラメータが前記復号信号に対応
するスペクトル包絡を表す量とパワーを表す量の少なく
とも一つを含む。

【００６９】本発明の符号化・復号装置は、その好まし
い実施の形態において、各フレームにおいて入力信号が
音声区間であるか無音声区間であるかの判別を行い前記
入力信号の特徴パラメータを符号化する手段（図８参
照）と、前記した第１乃至第６の実施の形態の音声復号
装置を有する。

【００７０】本発明の実施の形態について動作・原理に
ついて以下に説明する。

【００７１】本発明においては、音声復号装置におい
て、無音声区間を復号する際に、間欠的に伝送されるフ
ィルタ係数を、RMSと同様に平滑化処理した後に、合成
フィルタで使用する。これにより、間欠的に伝送してい
ることにより生じるフィルタ係数が不連続に変化するこ
とを防ぐことができ、その結果、復号音質を改善でき
る。

【００７２】音声復号装置において、無音声区間で平滑
化されたフィルタ係数やRMSを用いる場合、平滑化処理
により過去のフレームで伝送されたフィルタ係数やRMS
の影響を受けることになる。

【００７３】無音声区間の先頭区間の信号には、直前の
有音声区間の特性が含まれているため、この区間で平滑
化処理を行なうことにより、その区間の特性を含んだ特
徴パラメータを用いて復号することになる。その結果、
復号信号の波形振幅が実際より大きくなったり、復号信
号がエコーを含む等の復号音声の劣化が生じることがあ
る。

【００７４】これを防ぐために、音声区間から無音声区
間に入ってからの一定時間や一定フレーム数や、復号さ
れた特徴パラメータが予め定めた条件を満たす場合、例
えば、振幅を表すRMSが予め定めた値より未だ大きい場
合は平滑化を行なわないように、平滑化係数を設定す
る。これにより、先頭区間において平滑化により生ず
る、直前の有音声区間からの影響を削減することができ
る。

【００７５】入力信号に重畳した背景雑音の種類によっ
ては、音声部復号回路で復号される信号に含まれる背景
雑音と、無音声復号回路で復号される信号に聴覚的な差
が生じる場合がある。これは、無音声復号回路で、合成
フィルタの励振信号の加算割合を、そのRMSが伝送され
たRMSの平滑化値と同じになるという条件のみで計算し
ているためである。

【００７６】本発明においては、この加算割合を、入力
信号の性質を考慮して決定することにより、前記聴覚的
な差による復号音質の劣化を削減することができる。考
慮の仕方としては、例えば、平均RMSが小さい時は主に
乱数的な雑音を使用し、平均RMSが大きい時、あるいは
フィルタ係数から計算したスペクトルが平坦でない場合
は、主ににパルス性信号あるいはピッチ信号を使用す
る。

【００７７】

【実施例】上記した本発明の実施の形態についてさらに
詳細に説明すべく、本発明の実施例について図面を参照
して以下に説明する。以下に説明する本発明の実施例に
おける符号化装置は、その基本構成が図８に示したもの
と同一のものが用いられる。また本発明の一実施例にお
ける復号装置の基本構成は、図９に示したものと同一と
される。

【００７８】図１は、本発明の第１の実施例の復号装置
における無音声部復号回路の構成を示すブロック図であ
る。図１を参照すると、本発明の第１の実施例における
無音声部復号回路が、図１０に示した無音声部復号回路
34と相違する点は、平滑化回路64をさらに備えているこ
とである。以下では、主に従来の装置との相違点につい
て説明し、同一部分の説明は適宜省略する。

【００７９】パラメータ復号回路54は、入力端子52から
入力した信号符号列から求めたフィルタ係数とRMSをそ
れぞれ平滑化回路64と平滑化回路66に渡す。

【００８０】平滑化回路64は、パラメータ復号回路54か
ら渡されたフィルタ係数を平滑化し、合成回路68に渡
す。但し、入力端子50から入力されたDTX判定符号で信
号符号列が伝送されないことが示された場合は、前フレ
ームのフィルタ係数を用いて平滑化を行なう。

【００８１】各無音声区間中の先頭から数えてnフレー
ム目で使用する平滑化フィルタ係数F(n,i),(i=1,...,M)
は、nフレーム目に入力されたフィルタ係数 f(n,i),(i
=1,...,M)を用いて次式（４）で計算する。但し、何も
伝送されてこないフレームでは、f(n,i)の代わりに直前
に伝送されたフィルタ係数を用いて次式（４）を計算す
る。

【００８２】 F(n,i) = (1−β)F(n−1,i) + βf(n,i) …（4）

【００８３】ここで、βは平滑化の程度を決定する平滑
化係数である。また、F(−1,i)=0,(i=1,...,M)である。

【００８４】Mはフィルタの次数である。合成回路68
は、混合回路61から渡される励振信号を、平滑回路64か
ら渡されるフィルタ係数で構成するフィルタに入力する
ことにより、信号を復号し、出力端子70から出力する。

【００８５】図２は、本発明の第２の実施例における復
号装置の構成を示す図である。本発明の第２の実施例
が、図９に示した従来の復号装置と相違する点は、無音
声部復号回路35の構成が相違することと、平滑化制御回
路36を備えていることである。以下では、主に従来の装
置との相違点について説明し、同一部分の説明は適宜省
略する。

【００８６】ビット列分解回路26は、入力端子24から入
力したビット列をVAD判定符号、DTX判定符号及び信号符
号列に分解し、VAD判定符号を平滑化制御回路36と切り
替え回路28に渡し、信号符号列を切り替え回路28に渡
し、DTX判定符号を無音声部復号回路35に渡す。

【００８７】切り替え回路28は、ビット列分解回路26か
ら渡されたVAD判定符号で入力信号が音声区間とされた
場合はビット列分解回路26から渡された信号符号列を音
声部復号回路30に渡し、VAD判定符号で入力信号が無音
声区間とされた場合は無音声部復号回路35に渡す。

【００８８】平滑化制御回路36は、ビット列分解回路26
から渡されるVAD判定符号の変化に応じた平滑化係数α
(n)とβ(n)を無音声部復号回路35に渡す。ここで nは
各無音声区間中の先頭から数えたフレーム番号である。

【００８９】例えば、VAD判定符号が無音声区間をある
ことを示す場合、最初の特定フレーム数又は特定時間長
で、平滑化係数α(n)とβ(n)を1とすることにより、無
音声区間における先頭部分に残っている直前の有音声部
による影響を除去することができる。また、同様に伝送
されたフィルタ係数やRMS等が特定の条件を満たす間、
平滑化係数α(n)とβ(n)を1とすることにより、無音声
区間における先頭部分に残っている直前の有音声部によ
る影響を除去することができる。条件の例としては、RM
Sが直前の有音声区間の影響を受けていることを検出す
るための方法として、「RMSが予め定めた閾値以上であ
る」又は「RMSとその無音区間における先頭サブフレー
ムのRMSとが予め定めた閾値以下である」がある。ま
た、フィルタ係数が音声区間の平均スペクトルに類似し
ていることを検出するために、「フィルタ係数が予め定
めた標準フィルタ係数との距離（例えば二乗距離）が予
め定めた閾値以下である」等がある。

【００９０】更に、直前の音声区間の長さが一定フレー
ム数あるいは一定時間長よりも短い場合は、その音声区
間の直前の無音声区間と入力信号の性質が類似している
と考えて、フィルタ係数とRMSの平滑化値を計算する時
の初期値Ｐ(-1)、F(−1,i),(i=1,...,M)として、直前の
無音声区間の最終フレームでの平滑化値を用いることが
できる。

【００９１】無音声部復号回路35は、平滑化制御回路36
から渡された平滑化係数α(n)とβ(n)、ビット列分解回
路26から渡されたDTX判定符号、及び切り替え回路28か
ら渡された信号符号列を用いて無音声区間の信号を復号
し、出力端子32から出力する。

【００９２】図３は、本発明の第２の実施例における無
音声部復号回路35の構成を示す図である。本発明の第２
の実施例が、前記第１の実施例における無音声部復号回
路と相違する点は、平滑化回路49と平滑化回路51の構成
である。

【００９３】パラメータ復号回路54は、入力端子52で入
力した信号符号列から求めたフィルタ係数とRMSをそれ
ぞれ平滑化回路49と平滑化回路51に渡す。

【００９４】平滑化回路49は、パラメータ復号回路54か
ら渡されたフィルタ係数を、入力端子65から入力した平
滑化係数β(n)を用いて平滑化し、合成回路68に渡す。
但し、入力端子50から入力されたDTX判定符号で信号符
号列が伝送されないことが示された場合は、前フレーム
のフィルタ係数を繰り返し使用する。

【００９５】各無音声区間中の先頭から数えてnフレー
ム目で使用する平滑化フィルタ係数F(n,i),(i=1,...,M)
は、nフレーム目に入力されたフィルタ係数 f(n,i),(i
=1,...,M)を用いて、上式（4）と同様の次式（５）で計
算する。

【００９６】 F(n,i) = (1−β(n))・F(n−1,i) + β(n)・f(n,i) …（5）ここで、β(n)は、各無音声区間中の先頭からの経過フ
レーム数に応じて変化する値であり、経過フレーム数が
少ない時には過去のフレームからの影響を忘却するよう
に1付近の値を取る。例えば、β(1)=β(2)=1.0、β(3)=
β(4)=… =β(L)= 0.7 とすることできる。Lは各無音
声区間のフレーム数である。

【００９７】平滑化回路51は、パラメータ復号回路54か
ら渡されたRMSを平滑化し、混合回路61に渡す。但し、
入力端子50から入力されたDTX判定符号で信号符号列が
伝送されないことが示された場合は、直前に伝送された
RMSを用いて平滑化を行なう。各無音声区間中の先頭か
ら数えてnフレーム目で使用する平滑化RMS P(n)は、n
フレーム目に入力されたRMS p(n) を用いて、上式（1）
と同様の次式（６）で計算する。

【００９８】 P(n) = (1−α(n))・P(n−1) + α(n)・p(n) …（6）ここで、α(ｎ)は、β(n)と同様に、各無音声区間中の
先頭からの経過フレーム数に応じて変化する値であり、
経過フレーム数が少ない時には過去のフレームからの影
響を忘却するように1付近の値を取る。例えば、α(1)=
α(2)=1.0、α(3)=α(4)=… =α(L)= 0.7 とすることで
きる。Lは各無音声区間のフレーム数である。

【００９９】なお、平滑化回路49と平滑化回路51の処理
のいずれか一方の処理のみを行なうこともできる。その
場合は、パラメータ復号回路54から受け渡されるフィル
タ係数あるいはRMSを、直接合成回路68又は混合回路61
に渡すことになる。

【０１００】混合回路61では、平滑化回路51から渡され
る平滑化RMSを用いて、乱数回路56から渡された乱数信
号r(i)とパルス回路53から渡されたパルス列信号p(i)と
ピッチ回路58から渡されたピッチ信号q(i)との線形和処
理を行なうことにより、合成フィルタの励振信号x(i)を
計算し、合成回路68に渡す。

【０１０１】合成回路68は、混合回路61から渡される励
振信号を、平滑化回路49から渡されるフィルタ係数で構
成するフィルタに入力することにより、信号を復号し、
出力端子70から出力する。

【０１０２】図４は、本発明の第３の実施例における復
号装置の構成を示す図である。本発明の第３の実施例の
復号装置が、従来の復号装置と相違する点は、無音声部
検定回路38と無音声部復号回路37である。

【０１０３】ビット列分解回路26は、入力端子24から入
力したビット列をVAD判定符号とDTX判定符号及び信号符
号列に分解し、VAD判定符号と信号符号列を切り替え回
路28に渡し、DTX判定符号を無音声部復号回路37に渡
す。

【０１０４】切り替え回路28は、ビット列分解回路26か
ら渡された信号符号列を、ビット列分解回路26から渡さ
れたVAD判定符号で入力信号が音声区間とされた場合に
は音声部復号回路30に渡し、VAD判定符号で入力信号が
無音声区間とされた場合には無音声部復号回路37に渡
す。

【０１０５】無音声部検定回路38は、無音声部復号回路
37から渡されたフィルタ係数とRMSを用いて、図５にお
ける混合回路62で用いる線形和の結合係数を調整する設
定パラメータを決定し、無音声部復号回路37に渡す。こ
の調整パラメータの計算に関しては、混合回路62での処
理と合わせて後述する。

【０１０６】無音声部復号回路37は、ビット列分解回路
26から渡されたDTX判定符号、及び切り替え回路28から
渡された信号符号列を用いて無音声区間の信号を復号
し、出力端子32から出力する。

【０１０７】図５は、本発明の第３の実施例における無
音声部復号回路37の構成を示す図である。本発明の第３
の実施例における無音声部復号回路37が、前記第１の実
施例における無音声部復号回路35と相違する点は、混合
回路62及びパラメータ復号回路54の出力先である。以下
では、主に従来の装置との相違点について説明し、同一
部分の説明は適宜省略する。

【０１０８】パラメータ復号回路54は、入力端子52で入
力した信号符号列からフィルタ係数とRMSを求め、フィ
ルタ係数を平滑化回路64と出力端子23に渡し、RMSを平
滑化回路66と出力端子25に渡す。

【０１０９】平滑化回路66は、パラメータ復号回路54か
ら渡されたRMSを平滑化し、混合回路62に渡す。但し、
入力端子50から入力されたDTX判定符号で信号符号列が
伝送されないことが示された場合は、直前に伝送された
RMSを用いて平滑化を行なう。また、この場合、平滑化
の係数α(n)やβ(n)を零とすることで平滑化したRMSを
更新しないように制御することもできる。

【０１１０】乱数回路56は、乱数を生成し、混合回路62
に渡す。

【０１１１】パルス回路53は、乱数で生成した位置と振
幅を持つパルスから成るパルス列信号を生成し、混合回
路62に渡す。ピッチ回路58は、前述の適応コードベクト
ルからなるピッチ信号を生成し、混合回路62に渡す。

【０１１２】混合回路62は、入力端子60から入力した設
定パラメータと平滑化回路66から渡された平滑化RMSを
用いて、前述の線形和の結合係数を計算する。

【０１１３】また、この結合係数を用いて、乱数回路56
から渡された乱数信号とパルス回路53から渡されたパル
ス列信号とピッチ回路53から渡されたピッチ信号との線
形和信号を計算し、合成回路68に渡す。

【０１１４】合成回路68は、混合回路62から渡される励
振信号を、平滑化回路64から渡されるフィルタ係数で構
成するフィルタに入力することにより、信号を復号し、
出力端子70から出力する。

【０１１５】無音声部検定回路38と混合回路62について
説明する。

【０１１６】無音声部検定回路38において無音声部にお
ける背景雑音の性質を決定し、この性質に従って、混合
回路62におけるピッチ信号、パルス列信号及び乱数信号
の結合係数の計算方法を変更する。変更する設定パラメ
ータとしては、結合係数を決定する順番や、結合係数γ
がある。

【０１１７】無音性部検定回路38が、無音声部における
背景雑音の性質を検定するための情報としては、例え
ば、RMSとフィルタ係数がある。

【０１１８】この情報から前記設定パラメータを操作す
る方法として、例えば、前記RMSが予め定めた閾値より
も小さく、背景雑音がないと見なした場合や、フィルタ
係数から計算した入力信号のスペクトル傾きが平坦な白
色雑音と見なした場合は、乱数信号の寄与を大きくする
方法がある。これは、結合係数の計算順番はそのままで
γを小さくすることと等価である。

【０１１９】なお、この無音声信号の設定パラメータを
信号符号列に含めて伝送することもできる。

【０１２０】図６は、本発明の第４の実施例における復
号装置の構成を示す図である。本発明の第４の実施例に
おける復号装置が、前記第２の実施例における復号装置
と相違する点は、無音声部検定回路38と無音声部復号回
路39である。

【０１２１】ビット列分解回路26は、入力端子24から入
力したビット列をVAD判定符号とDTX判定符号及び信号符
号列に分解し、VAD判定符号を平滑化制御回路36と切り
替え回路28に渡し、信号符号列を切り替え回路28に渡
し、DTX判定符号を無音声部復号回路39に渡す。

【０１２２】切り替え回路28は、ビット列分解回路26か
ら渡されたVAD判定符号で入力信号が音声区間とされた
場合にはビット列分解回路26から渡された信号符号列を
音声部復号回路30に渡し、VAD判定符号で入力信号が無
音声区間とされた場合には無音声部復号回路39に渡す。
無音声部検定回路38と無音声部復号回路39に信号符号列
を渡す。

【０１２３】平滑化制御回路36は、ビット列分解回路26
から渡されるVAD判定符号の変化に応じた前記平滑化係
数α(n)とβ(n)を無音声部復号回路39に渡す。

【０１２４】無音声部検定回路38は、無音声部復号回路
39から渡された平滑化RMSを用いて、図７における混合
回路62で使用する線形和の結合係数を調整する設定パラ
メータを決定し、無音声部復号回路39に渡す。

【０１２５】無音声部検定回路39での設定パラメータの
決定処理はRMSを平滑化RMSに置き換えることで、前述し
た無音声部検定回路38と同様の処理を適用できる。

【０１２６】無音声部復号回路39は、ビット列分解回路
26から渡されたDTX判定符号、及び切り替え回路28から
渡された信号符号列、平滑化制御回路36から渡された平
滑化係数α(n)とβ(n)、及び無音声部検定回路38から渡
された設定パラメータを用いて無音声区間の信号を復号
し、出力端子32から出力する。

【０１２７】また、図７の平滑化回路50で計算された平
滑化RMSと、平滑化回路64で計算された平滑化フィルタ
係数を無音声部検定回路38に渡す。

【０１２８】図７は、本発明の第４の実施例における無
音声部復号回路39の構成を示す図である。本発明の本発
明の第４の実施例における無音声部復号回路39が、前記
第2の実施例における無音声部復号回路と相違する点
は、平均化回路50と平滑化回路64からの出力が出力端子
69及び出力端子63から出力される構成とされていること
である。

【０１２９】上記各実施例では、合成フィルタの励振信
号を計算する時にピッチ信号とパルス列信号と乱数信号
全てを用いているが、いずれかを省く構成としてもよ
い。

【０１３０】本発明は、従来の技術の欄にて説明した符
号化装置とともに、掲題無線端末や無線基地局に搭載し
て、音声信号圧縮技術を用いた無線音声通信システムを
容易に構築することができる。また、既に説明した復号
方法を実行するためのプログラムをフロッピィディスク
等の記録媒体に格納しておき、スピーカー等が接続され
たパーソナルコンピュータにこのプログラムをロードす
ることにより、音声端末を構築することも容易にでき
る。

【０１３１】

【発明の効果】以上説明したように、本発明によれば下
記記載の効果を奏する。

【０１３２】本発明の第１の効果は、復号装置におい
て、無音声区間を復号する際に使用するフィルタ係数が
不連続に変化することによる、復号音質の劣化を低減す
る、ということである。

【０１３３】その理由は、本発明においては、間欠的に
伝送されるフィルタ係数を平滑化処理した後に用いてい
るためである。

【０１３４】本発明の第２の効果は、復号装置におい
て、無音声区間の先頭部分で直前の有音声区間による影
響を受けることによる復号音質の劣化を低減する、とい
うことである。

【０１３５】その理由は、本発明においては、無音声区
間の先頭部分では、特徴パラメータの平滑化処理を行な
わないように平滑化係数を設定している、ためである。

【０１３６】本発明の第３の効果は、復号装置におい
て、音声区間と無音声区間の切り替わりにより生じる聴
覚的な不連続を低減する、ということである。

【０１３７】その理由は、本発明においては、無音声区
間において再生フィルタの励振信号を生成する時に、乱
数成分に対するパルス成分とピッチ成分の比を入力信号
の性質に応じて変更するためである。

【図面の簡単な説明】

【図１】本発明の第1の実施例における無音声部復号回
路の構成を示す図である。

【図２】本発明の第２の実施例における復号装置の構成
を示す図である。

【図３】本発明の第２の実施例における無音声部復号回
路の構成を示す図である。

【図４】本発明の第３の実施例における復号装置の構成
を示す図である。

【図５】本発明の第３の実施例における無音声部復号回
路の構成を示す図である。

【図６】本発明の第４の実施例における復号装置の構成
を示す図である。

【図７】本発明の第４の実施例における無音声部復号回
路の構成を示す図である。

【図８】従来及び本発明の実施例に係る符号化装置の構
成を示す図である。

【図９】従来の復号装置の構成を示す図である。

【図１０】従来の復号装置における無音声部復号回路の
構成を示す図である。

【符号の説明】

１０、２４、５０、５２、６５、６７、６０、６３入
力端子１２音声部符号化回路１４無音声部符号化回路１８、２８切り替え回路２０ビット列生成回路２２、２３、２５、３２、７０出力端子２６ビット列分割回路３０音声部復号回路３４、３５、３７、３９無音声部復号回路３６平滑化制御回路３８無音声部検定回路４９、５１、６４、６６平滑化回路５３パルス回路５４パラメータ復号回路５６乱数回路５８ピッチ回路６１、６２混合回路６８合成回路

フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 11/02 G10L 13/00 G10L 19/00 - 19/14 H04B 14/04 H03M 7/30

Claims

(57)【特許請求の範囲】

【請求項１】音声信号が音声区間であるか無音声区間で
あるかに従って、受信した特徴パラメータから信号を復
号する音声復号装置において、前記無音声区間では、この無音声区間の信号を複数種類
の信号から成る励振信号を合成フィルタに入力すること
により生成する無音声区間復号器を備え、前記無音声区間復号器は、前記特徴パラメータの少なく
とも１つに基づき、前記無音声区間における前記複数種
類の信号のそれぞれを重み付け加算する際の重み付け係
数を決定する重み付け係数決定手段を備え、この重み付け係数を用いて生成された励振信号が前記合
成フィルタに供給されることを特徴とする音声復号装
置。
【請求項２】音声信号が音声区間であるか無音声区間で
あるかに従って、受信した特徴パラメータから信号を復
号する音声復号装置において、前記無音声区間では、この無音声区間の信号を複数種類
の信号から成る励振信号を合成フィルタに入力すること
により生成する無音声区間復号器を備え、前記無音声区間復号器は、時間方向に平滑化された前記
特徴パラメータの少なくとも一つに基づき、前記無音声
区間における前記複数種類の信号のそれぞれを重み付け
加算する際の重み付け係数を決定する重み付け係数決定
手段を備え、この重み付け係数を用いて生成された励振信号が前記合
成フィルタに供給されることを特徴とする音声復号装
置。
【請求項３】前記特徴パラメータが、前記復号信号に対
応するスペクトル包絡を表す量とパワーを表す量の少な
くとも一つを含む、ことを特徴とする請求項１または２
に記載の音声復号装置。
【請求項４】各フレームにおいて入力信号が音声区間で
あるか無音声区間であるかの判別を行い前記入力信号の
特徴パラメータを符号化して出力する符号化装置と、請
求項１乃至３のいずれか一項に記載の音声復号装置とを
備えた音声符号化・復号装置。
【請求項５】請求項１乃至４の音声符号化・復号装置あ
るいは復号装置を備えることを特徴とする基地局装置。
【請求項６】請求項１乃至４の音声符号化・復号装置あ
るいは復号装置を備えることを特徴とする通信端末装
置。
【請求項７】音声信号が音声区間であるか無音声区間で
あるかに従って、復号方法を変更し、受信した特徴パラ
メータから信号を復号する音声復号方法であり、前記無
音区間の少なくとも一部の復号は、前記特徴パラメータの少なくとも一つに基づき、前記無
音声区間における励振信号を複数種類の信号のそれぞれ
を重み付け加算して生成するための係数を決定する重み
付け係数決定ステップと、決定された係数に基づいて励振信号を生成し、この励振
信号を合成フィルタに入力することにより前記無音声区
間の信号を生成するステップとによりなされることを特
徴とする音声復号方法。
【請求項８】音声信号が音声区間であるか無音声区間で
あるかに従って、復号方法を変更し、受信した特徴パラ
メータから信号を復号する音声復号方法であり、前記無
音区間の少なくとも一部の復号は、前記特徴パラメータを平滑化し、平滑化されたパラメー
タを計算するステップと、前記平滑化されたパラメータの少なくとも一つに基づ
き、前記無音声区間における励振信号を複数種類の信号
のそれぞれを重み付け加算して生成するための係数を決
定する重み付け係数決定ステップと、決定された係数を用いて励振信号を生成し、この励振信
号を合成フィルタに入力することにより前記無音声区間
の信号を生成するステップによりなされることを特徴と
する音声復号方法。
【請求項９】前記特徴パラメータが、前記復号信号に対
応するスペクトル包絡を表す量とパワーを表す量との少
なくとも一つを含む、ことを特徴とする請求項７または
８に記載の音声復号方法。
【請求項１０】各フレームにおいて入力信号が音声区間
であるか無音声区間であるかの判別を行い前記入力信号
の特徴パラメータを符号化して出力する符号化ステップ
と、請求項７乃至９のいずれか一つに記載の音声復号方
法を実施するステップとを組み合わせてなる音声符号化
・復号方法。
【請求項１１】音声信号が音声区間であるか無音声区間
であるかに従って、復号方法を変更し、受信した特徴パ
ラメータから信号を復号する音声復号方法を実行するプ
ログラムを記録した記録媒体であり、前記無音区間の復
号するためのステップとして、少なくとも一部の区間に
おいて、前記特徴パラメータの少なくとも一つに基づ
き、前記無音声区間における励振信号を複数種類の信号
のそれぞれを重み付け加算して生成するための係数を決
定する重み付け係数決定ステップと、決定された係数に基づいて励振信号を生成し、この励振
信号を合成フィルタに入力することにより前記無音声区
間の復号信号を生成するステップとを格納した記録媒
体。
【請求項１２】音声信号が音声区間であるか無音声区間
であるかに従って、復号方法を変更し、受信した特徴パ
ラメータから信号を復号する音声復号方法を実行するプ
ログラムを記録した記録媒体であり、前記無音区間の復
号のためのステップとして、少なくとも一部の区間において、前記特徴パラメータを
平滑化し、平滑化されたパラメータを計算するステップ
と、前記計算した平滑化されたパラメータの少なくとも一つ
に基づき、前記無音声区間における励振信号を複数種類
の信号のそれぞれを重み付け加算して生成するための係
数を決定する重み付け係数決定ステップと、決定された係数を用いて励振信号を生成し、この励振信
号を合成フィルタに入力することにより前記無音声区間
の復号信号を生成するステップとを格納した記録媒体。
【請求項１３】前記特徴パラメータが、前記復号信号に
対応するスペクトル包絡を表す量とパワーを表す量との
少なくとも一つを含む、ことを特徴とする請求項１１ま
たは１２に記載の記録媒体。
【請求項１４】各フレームにおいて入力信号が音声区間
であるか無音声区間であるかの判別を行い前記入力信号
の特徴パラメータを符号化して出力する符号化ステップ
と、請求項１１乃至１３のいずれか一つに記載の音声復
号方法ステップとを組み合わせてなるプログラムを格納
した記録媒体。