JP2003233398A - 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 - Google Patents

無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体

Info

Publication number
JP2003233398A
JP2003233398A JP2003062333A JP2003062333A JP2003233398A JP 2003233398 A JP2003233398 A JP 2003233398A JP 2003062333 A JP2003062333 A JP 2003062333A JP 2003062333 A JP2003062333 A JP 2003062333A JP 2003233398 A JP2003233398 A JP 2003233398A
Authority
JP
Japan
Prior art keywords
voice
decoding
signal
section
voice section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003062333A
Other languages
English (en)
Other versions
JP3475958B2 (ja
Inventor
Masahiro Serizawa
芹沢  昌宏
Hironori Ito
伊藤  博紀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2003062333A priority Critical patent/JP3475958B2/ja
Publication of JP2003233398A publication Critical patent/JP2003233398A/ja
Application granted granted Critical
Publication of JP3475958B2 publication Critical patent/JP3475958B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 無音声区間を非常に低いビットレートで符号
化する場合の音質劣化を低減する装置の提供。 【解決手段】 ビット列分解手段から出力されたVAD判
定符号から入力信号が音声/無音声区間に応じて信号符
号列を音声部復号手段/無音声部復号手段に渡す切替手
段と、無音声部復号手段が信号符号列から求めたフィル
タ係数とRMSを出力するパラメータ復号手段と、パラメ
ータ復号手段から出力されたRMS、フィルタ係数を平滑
化して出力する平滑化手段と、乱数で各々生成した位置
と振幅を持つパルスから成るパルス列信号を生成するパ
ルス生成手段と、ピッチ信号を生成するピッチ生成手段
と、乱数信号とパルス生成手段から渡されたパルス列信
号と、ピッチ信号との線形和処理により合成フィルタの
励振信号を生成する混合手段と、励振信号を平滑化され
たフィルタ係数で構成するフィルタに入力することによ
り信号を復号して出力する合成手段とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号等のデジ
タル情報を符号化・復号する装置に関し、特に無音声部
の符号化・復号技術に関する。
【0002】
【従来の技術】この種の従来の音声符号化・復号装置
は、音声がない区間(「無音声区間」という)を、音声
区間の符号化に比べて非常に低いビットレートで符号化
することにより、伝送する平均ビットレートを低減する
ものであり、例えば、文献1(IEEE Communications
Magazine, 第64−73頁、Sep、1997)等の記載が参照さ
れる。
【0003】この従来の符号化装置では、入力信号を予
め定めたフレーム(10 msec)毎に音声区間であるか無
音声区間であるかを判別し、音声区間である場合には、
通常の音声符号化方式(ITU−T勧告G.729)により入力
信号を符号化・復号し、一方、無音声区間の場合、符号
化装置では入力信号の特徴パラメータを間欠的に符号化
し、復号装置に伝送する。復号装置では、全てのフレー
ムではなく、間欠的に受信した特徴パラメータの繰り返
しあるいは平滑化を行うことで全フレームの特徴パラメ
ータを計算し、これらを用いて信号を復号する。
【0004】音声区間か無音声区間かを判別する方法と
して、上記文献1記載されているように、フレーム毎に
入力信号から計算する二乗平均平方根(root mean sq
uares;「RMS」という)、低周波数領域に対応するRMS、
零交差数、及びスペクトル包絡特性を表すフィルタ係数
を用いる方法がある。これらの変量と各々の無音声区間
における平均値との差分に基づき、閾値処理により判別
を行なう。
【0005】音声区間を符号化する方法としては、例え
ば、文献2(ITU−T勧告G.729、COM15−152 July 199
5)に記載されているCELP (Code Excited Linear Pr
ediction Coding;符号励振線形予測符号化)方式があ
る。CELP方式については、文献3(Code−Excited Line
ar Prediction : High Quality Speech at Very LowBit
Rates (IEEE Proc. ICASSP−85、 pp.937− 940、198
5) )の記載も参照される。
【0006】従来の装置の符号化処理では、入力信号を
予め定めたフレーム毎に線形予測分析して、音声信号の
スペクトル包絡特性を表す線形予測(フィルタ)係数を算
出し、そのスペクトル包絡特性に対応するLP合成フィ
ルタを駆動して励振信号を算出し、それぞれ符号化す
る。
【0007】励振信号の符号化は、フレームを更にサブ
フレームに分割してサブフレーム毎に行う。ここで、励
振信号は、入力信号のピッチ周期を表す周期成分と残り
の残差成分とそれらのゲインにより構成される。入力信
号のピッチ周期を表す周期成分は、「適応コードブッ
ク」と呼ばれる過去の励振信号を保持するコードブック
に格納された適応コードベクトルとして表され、前記残
差成分は、複数のパルスからなるマルチパルス信号とし
て表される。
【0008】また、復号処理では、復号したピッチ周期
成分と残差信号から得た励振信号を、復号したフィルタ
係数で構成する合成フィルタに入力して音声信号を復号
する。
【0009】無音声区間を符号化する方法として、上記
文献1に記載されているように、まず、符号化装置で、
入力信号の特徴パラメータとしてRMSとスペクトル特性
を表すフィルタ係数を符号化する。
【0010】次に、復号装置では、乱数信号と乱数的に
生成したパルス性信号とピッチ信号の線形和をRMSで調
整し、これをフィルタ係数を用いて構成した合成フィル
タに入力することにより、無音声信号を復号する。
【0011】特徴パラメータは、無音声区間で信号の性
質が変化したフレームでのみ伝送し、それ以外のフレー
ムでは何も伝送しない。但し、特徴パラメータを伝送す
るか否かの情報は別途伝送する。
【0012】この特徴パラメータを何も伝送しないフレ
ームでは、過去の伝送された特徴パラメータを繰り返し
使用する。但し、波形上での不連続が生じないように、
RMSは、平滑化処理を施している。
【0013】図8は、従来の符号化装置の構成を示すブ
ロック図である。図8を参照すると、この符号化装置
は、音声部符号化回路12と、無音声部符号化回路14と、
信号判定回路16と、切り替え回路18と、ビット生成回路
20とを備えている。
【0014】入力端子10は、入力信号を一定フレーム単
位、例えば10msec単位で入力する。信号判定回路16は、
入力端子10からの入力信号を用いてフレームが音声区間
か無音声区間かの判定を行ない、判定結果(VAD判定符
号)を切り替え回路18とビット列生成回路20に渡す。
【0015】音声部符号化回路12は、入力端子10からの
入力信号をフレーム毎に符号化し、信号符号列を切り替
え回路18に渡す。
【0016】無音声部符号化回路14は、入力端子10から
の入力信号をフレーム毎に符号化し、信号符号列を切り
替え回路18に渡す。また、無音声区間において信号符号
列を伝送するか否かの判定情報(DTX判定符号)をビッ
ト生成回路20に渡す。
【0017】切り替え回路18は、信号判定回路16から渡
されるVAD判定符号に基づき、入力信号が音声区間とさ
れた場合には、音声部符号化回路12から渡された信号符
号列を、VAD判定符号で入力信号が無音声区間とされた
場合には、無音声符号化回路14から渡された信号符号列
をビット列生成回路20に渡す。
【0018】ビット列生成回路20は、信号判定回路16か
ら渡されるVAD判定符号と、無音声部符号化回路10から
渡されるDTX判定符号と、切り替え回路18から渡される
信号符号列とを多重して、ビット列を生成し、出力端子
22から出力する。
【0019】図9は、従来の復号装置を説明するブロッ
ク図である。
【0020】図9を参照すると、この復号装置は、ビッ
ト列分解回路26と、切り替え回路28と、音声部復号回路
30と、無音声部復号回路34とを備えて構成される。ビッ
ト列分解回路26は、入力端子24から入力したビット列を
VAD判定符号とDTX判定符号及び信号符号列に分解し、VA
D判定符号と信号符号列を切り替え回路28に渡し、DTX判
定符号を無音声部復号回路34に渡す。
【0021】切り替え回路28は、ビット列分解回路26か
ら渡されたVAD判定符号に基づき、入力信号が音声区間
とされた場合にはビット列分解回路26から渡された信号
符号列を音声部復号回路30に渡し、VAD判定符号で入力
信号が無音声区間とされた場合には無音声部復号回路34
に渡す。
【0022】音声部復号回路30は、切り替え回路28から
渡された信号符号列を用いて信号を復号し、出力端子32
から出力する。
【0023】無音声部復号回路34は、ビット列分解回路
26から渡されたDTX判定符号と切り替え回路28から渡さ
れた信号符号列を用いて、無音声部の信号を復号し、出
力端子32から出力する。
【0024】図10は、従来の復号装置における無音声
復号回路34の構成を示すブロック図である。図10を参
照すると、無音声復号回路34は、パラメータ復号回路54
と、乱数回路56と、パルス回路53と、混合回路61と、平
滑化回路66と、合成回路68とを備えている。
【0025】パラメータ復号回路54は、入力端子52で入
力した信号符号列から求めたフィルタ係数とRMSをそれ
ぞれ合成回路68と平滑化回路66に渡す。
【0026】平滑化回路66は、パラメータ復号回路54か
ら渡されたRMSを平滑化して得た平滑化RMSを、混合回路
61に渡す。但し、入力端子50から入力されたDTX判定符
号で信号符号列が伝送されないことが示された場合に
は、前フレームのRMSを用いて平滑化を行なう。
【0027】各無音声区間中の先頭から数えてnフレー
ム目で使用する平滑化RMS P(n)は、nフレーム目に入力
されたRMS p(n)を用いて次式(1)で計算する。但
し、何も伝送されてこないフレームではp(n)の代わりに
直前に伝送されたRMSを用いて次式(1)を計算する。
【0028】 P(n)=(1−α)・p(n−1)+α・p(n) …(1)
【0029】ここで、αは平滑化の程度を決定する平滑
化係数であり、上記文献1では、固定値0.125を用いて
いる。また、P(−1)=0である。
【0030】乱数回路56は、乱数を生成し、混合回路61
に渡す。パルス回路53は、乱数で各々生成した位置と振
幅を持つパルスから成るパルス列信号を生成し、混合回
路61に渡す。
【0031】ピッチ回路58は、前述の適応コードベクト
ルからなるピッチ信号を生成し、混合回路61に渡す。適
応コードベクトルを規定するピッチ周期は伝送されない
ことから、代わりに乱数信号を用いる。
【0032】混合回路61では、乱数回路56から渡された
乱数信号r(i)と、パルス回路53から渡されたパルス列信
号p(i)と、ピッチ回路58から渡されたピッチ信号q(i)と
の線形和処理により、合成フィルタの励振信号x(i)を計
算し、合成回路68に渡す。
【0033】線形和の結合係数を計算する方法として、
例えば、上記文献1に記載された方法が用いられる。
【0034】まず、ピッチ信号の結合係数Gqを制限され
た範囲内の値から乱数で選択する。
【0035】次に、計算したピッチ信号の結合係数Gqを
用いて、ピッチ信号とパルス列信号の線形和から計算し
たRMSが前記平滑化RMSと同一になるように、パルス列信
号の結合係数Gpを計算する。
【0036】以上で計算した結合係数を用いてピッチ信
号とパルス列信号との線形和 e(i)を次式(2)で計算
する。
【0037】e(i) = Gq ・q(i) + Gp・p(i) …(2)
【0038】更に、この線形和 e(i) と乱数信号との
新たな線形和が前記平滑化RMSと同一になるように、線
形和 e(i) の結合係数Grを計算する。ここで、乱数信
号の結合係数は固定値γ=0.6を用いている。
【0039】従って、合成フィルタの励振信号x(i)は次
式(3)で計算される。
【0040】 x(i) = Gr ・[Gq ・q(i) + Gp・p(i)] + γ・r(i) …(3)
【0041】合成回路68は、混合回路61から渡される励
振信号を、パラメータ復号回路54から渡されるフィルタ
係数で構成するフィルタに入力することにより、信号を
復号し、出力端子70から出力する。
【0042】
【発明が解決しようとする課題】しかしながら、上記し
た従来の装置は下記記載の問題点を有している。
【0043】第1の問題点は、復号装置において、無音
声区間を復号する際に使用するフィルタ係数が不連続に
変化する場合があり、その結果、復号信号の品質が劣化
する、ということである。
【0044】その理由は、間欠的に伝送されるフィルタ
係数をそのまま用いている、ためである。
【0045】第2の問題点は、無音声区間における最初
の区間(例えば数百msec)において直前の有音声区間に
よる影響を受ける場合があり、その結果、復号信号でそ
の振幅が実際より高くなったり、エコーを含むことによ
る復号信号の音質劣化が生じる、ということである。
【0046】その理由は、無音声区間では、無音声区間
における再生信号が不連続にならないように、RMSの平
滑化処理を、常に行なっている、ためである。
【0047】第3の問題点は、無音声区間の復号信号が
入力信号の背景雑音とは聴覚的に著しく異なる場合があ
り、その結果、有音声部に含まれる背景雑音と聴覚的な
不連続が生じる、ということである。
【0048】その理由は、無音声区間において再生フィ
ルタの励振信号を生成する時に、乱数成分に対するパル
ス成分とピッチ成分の比を一定値としている、ためであ
る。
【0049】したがって本発明は、上記問題点に鑑みて
なされたものであって、その主たる目的は、無音声区間
を高性能に符号化することで、無音声部符号化の導入に
より伝送ビットレートの平均値を下げても、高符号化品
質を実現する、装置を提供することにある。
【0050】また本発明の他の目的は、無音声区間復号
時のフィルタ係数の不連続に帰因する復号音質劣化を低
減する復号装置を提供することにある。
【0051】
【課題を解決するための手段】前記目的を達成する第1
の発明は、各フレームにおいて復号信号が音声区間であ
るか無音声区間であるかの判別情報に従い前記復号信号
の特徴パラメータから信号を復号する方法を切り替える
音声復号装置において、前記特徴パラメータの中で前記
復号信号のスペクトル包絡特性を表す特徴パラメータを
時間方向に平滑化した値を用いて復号する手段を備えて
いる。
【0052】第2の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別情報に
従い前記復号信号の特徴パラメータから信号を復号する
方法を切り替える音声復号装置において、音声区間から
無音声区間に切り替わってからの時間経過に応じて、前
記特徴パラメータの少なくとも一つについて時間方向に
平滑化する程度を変更した値を用いて復号する手段を備
える。
【0053】第3の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、音声区間から無音
声区間に切り替わった直後の区間では伝送された特徴パ
ラメータの少なくとも一つを直接使用し、それ以降は、
前記特徴パラメータの内少なくとも一つについて時間方
向に平滑化した値を信号復号で用いて復号する手段を備
える。
【0054】第4の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、前記特徴パラメー
タの内少なくとも一つに応じて、前記特徴パラメータの
少なくとも一つについて時間方向に平滑化する程度を変
更した値を用いて復号する手段を備える。
【0055】第5の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、前記特徴パラメー
タの内少なくとも一つ及び音声区間から無音声区間に切
り替わってからの時間経過に応じて、前記特徴パラメー
タの少なくとも一つについて時間方向に平滑化する程度
を変更した値を用いて復号する手段を備える。
【0056】第6の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、前記特徴パラメー
タが予め定めた条件を満たす区間では伝送された特徴パ
ラメータの内少なくとも一つを直接使用し、それ以降
は、前記特徴パラメータの内少なくとも一つについて時
間方向に平滑化した値を信号復号で用いて復号する手段
を備えたことを特徴とする音声復号装置。
【0057】第7の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、前記特徴パラメー
タの内少なくとも一つ及び音声区間から無音声区間に切
り替わってからの時間経過に応じて、前記特徴パラメー
タの内少なくとも一つについて時間方向に平滑化する程
度を変更した値を用いて復号する手段を備える。
【0058】第8の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、音声区間から無音
声区間に切り替わった直後且つ前記特徴パラメータが予
め定めた条件を満たす区間では伝送された特徴パラメー
タの少なくとも一つを直接使用し、それ以降は、前記特
徴パラメータの内少なくとも一つについて時間方向に平
滑化した値を信号復号で用いて復号する手段を備える。
【0059】第9の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別情報に
従い前記復号信号に対応する特徴パラメータから信号を
復号する方法を切り替え、少なくとも一部の区間におい
て、無音声区間の信号を複数種類の信号から成る励振信
号を合成フィルタに入力することにより生成する音声復
号装置において、受信した特徴パラメータの少なくとも
一つに基づき、前記無音声区間における前記複数種類の
信号を加算する際の係数を決定する手段を備える。
【0060】第10の発明は、各フレームにおいて復号
信号が音声区間であるか無音声区間であるかの判別情報
に従い前記復号信号に対応する特徴パラメータから信号
を復号する方法を切り替え、無音声区間の信号を複数種
類の信号から成る励振信号を合成フィルタに入力するこ
とにより生成する音声復号装置において、少なくとも一
部の区間において、受信した特徴パラメータの時間方向
に平滑化した平滑化パラメータの少なくとも一つに基づ
き、前記無音声区間における前記複数種類の信号を加算
する際の係数を決定する。
【0061】第11の発明は、前記第1乃至第10の発
明において、前記特徴パラメータが、前記復号信号に対
応するスペクトル包絡を表す量とパワーを表す量の少な
くとも一つを含む。
【0062】第12の発明は、各フレームにおいて入力
信号が音声区間であるか無音声区間であるかの判別を行
い前記入力信号の特徴パラメータを符号化する符号化装
置と、第1乃至第11のいずれかの音声復号装置とを備
える。
【0063】
【発明の実施の形態】本発明の実施の形態について説明
する。本発明の音声復号装置は、第1の実施の形態にお
いて、各フレームにおいて復号信号が音声区間であるか
無音声区間であるかの判別情報に従い前記復号信号の特
徴パラメータから信号を復号する方法を切り替える手段
(図9の28)と、前記特徴パラメータの中で、前記復号
信号のスペクトル包絡特性を表す特徴パラメータを時間
方向に平滑化する手段(図1の64)と、平滑化した特徴
パラメータを用いて復号処理を行なう手段(図1の56、
53、58、61及び68)とを備えている。
【0064】本発明の音声復号装置は、第2の実施の形
態において、各フレームにおいて復号信号が音声区間で
あるか無音声区間であるかの判別に従い前記復号信号の
特徴パラメータから信号を復号する方法を切り替える手
段(図2の28)と、前記特徴パラメータの内少なくとも
一つ及び音声区間から無音声区間に切り替わってからの
時間経過に応じて、前記特徴パラメータの少なくとも一
つに関して時間方向に平滑化する手段(図2の36、図3
の49と51)と、この平滑化した特徴パラメータを用いて
復号処理を行なう手段(図3の56、53、58、61及び68)
とを備えている。
【0065】本発明の音声復号装置は、第3の実施の形
態において、各フレームにおいて復号信号が音声区間で
あるか無音声区間であるかの判別に従い前記復号信号の
特徴パラメータから信号を復号する方法を切り替える手
段(図2の28)と、音声区間から無音声区間に切り替わ
った直後で前記特徴パラメータが予め定めた条件を満た
す区間では伝送された特徴パラメータの少なくとも一つ
を直接使用し、それ以降は前記特徴パラメータの内少な
くとも一つに関して時間方向に平滑化した値を生成する
手段(図2の36、図3の49と51)、前記平滑化し
た値を用いて復号処理を行なう手段(図3の56、53、5
8、61及び68)とを備えている。
【0066】本発明の音声復号装置は、第4の実施の形
態において、各フレームにおいて復号信号が音声区間で
あるか無音声区間であるかの判別に従い前記復号信号に
対応する特徴パラメータから信号を復号する方法を切り
替える手段(図4の28)と、無音声区間の信号を複数種
類の信号から成る励振信号を合成フィルタに入力するこ
とにより生成する手段(図5の56、53、58、60、68)
と、受信した特徴パラメータの少なくとも一つに基づき
前記無音声区間における前記複数種類の信号を加算する
際の係数を決定する手段(図4の38)とを備えている。
【0067】本発明の音声復号装置は、第5の実施の形
態において、各フレームにおいて復号信号が音声区間で
あるか無音声区間であるかの判別に従い前記復号信号に
対応する特徴パラメータから信号を復号する方法を切り
替える手段(図6の28)と、無音声区間の信号を複数種
類の信号から成る励振信号を合成フィルタに入力するこ
とにより生成する手段(図7の56、53、58、60、68)
と、受信した特徴パラメータの時間方向に平滑化した平
滑化パラメータを計算する手段(図7の64と50)と計算
した平滑化パラメータの少なくとも一つに基づき前記無
音声区間における前記複数種類の信号を加算する際の係
数を決定する手段(図6の38)とを備えている。
【0068】本発明の音声復号装置は、第6の実施の形
態において、前記特徴パラメータが前記復号信号に対応
するスペクトル包絡を表す量とパワーを表す量の少なく
とも一つを含む。
【0069】本発明の符号化・復号装置は、その好まし
い実施の形態において、各フレームにおいて入力信号が
音声区間であるか無音声区間であるかの判別を行い前記
入力信号の特徴パラメータを符号化する手段(図8参
照)と、前記した第1乃至第6の実施の形態の音声復号
装置を有する。
【0070】本発明の実施の形態について動作・原理に
ついて以下に説明する。
【0071】本発明においては、音声復号装置におい
て、無音声区間を復号する際に、間欠的に伝送されるフ
ィルタ係数を、RMSと同様に平滑化処理した後に、合成
フィルタで使用する。これにより、間欠的に伝送してい
ることにより生じるフィルタ係数が不連続に変化するこ
とを防ぐことができ、その結果、復号音質を改善でき
る。
【0072】音声復号装置において、無音声区間で平滑
化されたフィルタ係数やRMSを用いる場合、平滑化処理
により過去のフレームで伝送されたフィルタ係数やRMS
の影響を受けることになる。
【0073】無音声区間の先頭区間の信号には、直前の
有音声区間の特性が含まれているため、この区間で平滑
化処理を行なうことにより、その区間の特性を含んだ特
徴パラメータを用いて復号することになる。その結果、
復号信号の波形振幅が実際より大きくなったり、復号信
号がエコーを含む等の復号音声の劣化が生じることがあ
る。
【0074】これを防ぐために、音声区間から無音声区
間に入ってからの一定時間や一定フレーム数や、復号さ
れた特徴パラメータが予め定めた条件を満たす場合、例
えば、振幅を表すRMSが予め定めた値より未だ大きい場
合は平滑化を行なわないように、平滑化係数を設定す
る。これにより、先頭区間において平滑化により生ず
る、直前の有音声区間からの影響を削減することができ
る。
【0075】入力信号に重畳した背景雑音の種類によっ
ては、音声部復号回路で復号される信号に含まれる背景
雑音と、無音声復号回路で復号される信号に聴覚的な差
が生じる場合がある。これは、無音声復号回路で、合成
フィルタの励振信号の加算割合を、そのRMSが伝送され
たRMSの平滑化値と同じになるという条件のみで計算し
ているためである。
【0076】本発明においては、この加算割合を、入力
信号の性質を考慮して決定することにより、前記聴覚的
な差による復号音質の劣化を削減することができる。考
慮の仕方としては、例えば、平均RMSが小さい時は主に
乱数的な雑音を使用し、平均RMSが大きい時、あるいは
フィルタ係数から計算したスペクトルが平坦でない場合
は、主にパルス性信号あるいはピッチ信号を使用する。
【0077】
【実施例】上記した本発明の実施の形態についてさらに
詳細に説明すべく、本発明の実施例について図面を参照
して以下に説明する。以下に説明する本発明の実施例に
おける符号化装置は、その基本構成が図8に示したもの
と同一のものが用いられる。また本発明の一実施例にお
ける復号装置の基本構成は、図9に示したものと同一と
される。
【0078】図1は、本発明の第1の実施例の復号装置
における無音声部復号回路の構成を示すブロック図であ
る。図1を参照すると、本発明の第1の実施例における
無音声部復号回路が、図10に示した無音声部復号回路
34と相違する点は、平滑化回路64をさらに備えているこ
とである。以下では、主に従来の装置との相違点につい
て説明し、同一部分の説明は適宜省略する。
【0079】パラメータ復号回路54は、入力端子52から
入力した信号符号列から求めたフィルタ係数とRMSをそ
れぞれ平滑化回路64と平滑化回路66に渡す。
【0080】平滑化回路64は、パラメータ復号回路54か
ら渡されたフィルタ係数を平滑化し、合成回路68に渡
す。但し、入力端子50から入力されたDTX判定符号で信
号符号列が伝送されないことが示された場合は、前フレ
ームのフィルタ係数を用いて平滑化を行なう。
【0081】各無音声区間中の先頭から数えてnフレー
ム目で使用する平滑化フィルタ係数F(n,i),(i=1,...,M)
は、nフレーム目に入力されたフィルタ係数 f(n,i),(i
=1,...,M)を用いて次式(4)で計算する。但し、何も
伝送されてこないフレームでは、f(n,i)の代わりに直前
に伝送されたフィルタ係数を用いて次式(4)を計算す
る。
【0082】 F(n,i) = (1−β)F(n−1,i) + βf(n,i) …(4)
【0083】ここで、βは平滑化の程度を決定する平滑
化係数である。また、F(−1,i)=0,(i=1,...,M)である。
【0084】Mはフィルタの次数である。合成回路68
は、混合回路61から渡される励振信号を、平滑回路64か
ら渡されるフィルタ係数で構成するフィルタに入力する
ことにより、信号を復号し、出力端子70から出力する。
【0085】図2は、本発明の第2の実施例における復
号装置の構成を示す図である。本発明の第2の実施例
が、図9に示した従来の復号装置と相違する点は、無音
声部復号回路35の構成が相違することと、平滑化制御回
路36を備えていることである。以下では、主に従来の装
置との相違点について説明し、同一部分の説明は適宜省
略する。
【0086】ビット列分解回路26は、入力端子24から入
力したビット列をVAD判定符号、DTX判定符号及び信号符
号列に分解し、VAD判定符号を平滑化制御回路36と切り
替え回路28に渡し、信号符号列を切り替え回路28に渡
し、DTX判定符号を無音声部復号回路35に渡す。
【0087】切り替え回路28は、ビット列分解回路26か
ら渡されたVAD判定符号で入力信号が音声区間とされた
場合はビット列分解回路26から渡された信号符号列を音
声部復号回路30に渡し、VAD判定符号で入力信号が無音
声区間とされた場合は無音声部復号回路35に渡す。
【0088】平滑化制御回路36は、ビット列分解回路26
から渡されるVAD判定符号の変化に応じた平滑化係数α
(n)とβ(n)を無音声部復号回路35に渡す。ここで nは
各無音声区間中の先頭から数えたフレーム番号である。
【0089】例えば、VAD判定符号が無音声区間をある
ことを示す場合、最初の特定フレーム数又は特定時間長
で、平滑化係数α(n)とβ(n)を1とすることにより、無
音声区間における先頭部分に残っている直前の有音声部
による影響を除去することができる。また、同様に伝送
されたフィルタ係数やRMS等が特定の条件を満たす間、
平滑化係数α(n)とβ(n)を1とすることにより、無音声
区間における先頭部分に残っている直前の有音声部によ
る影響を除去することができる。条件の例としては、RM
Sが直前の有音声区間の影響を受けていることを検出す
るための方法として、「RMSが予め定めた閾値以上であ
る」又は「RMSとその無音区間における先頭サブフレー
ムのRMSとが予め定めた閾値以下である」がある。ま
た、フィルタ係数が音声区間の平均スペクトルに類似し
ていることを検出するために、「フィルタ係数が予め定
めた標準フィルタ係数との距離(例えば二乗距離)が予
め定めた閾値以下である」等がある。
【0090】更に、直前の音声区間の長さが一定フレー
ム数あるいは一定時間長よりも短い場合は、その音声区
間の直前の無音声区間と入力信号の性質が類似している
と考えて、フィルタ係数とRMSの平滑化値を計算する時
の初期値P(-1)、F(−1,i),(i=1,...,M)として、直前の
無音声区間の最終フレームでの平滑化値を用いることが
できる。
【0091】無音声部復号回路35は、平滑化制御回路36
から渡された平滑化係数α(n)とβ(n)、ビット列分解回
路26から渡されたDTX判定符号、及び切り替え回路28か
ら渡された信号符号列を用いて無音声区間の信号を復号
し、出力端子32から出力する。
【0092】図3は、本発明の第2の実施例における無
音声部復号回路35の構成を示す図である。本発明の第2
の実施例が、前記第1の実施例における無音声部復号回
路と相違する点は、平滑化回路49と平滑化回路51の構成
である。
【0093】パラメータ復号回路54は、入力端子52で入
力した信号符号列から求めたフィルタ係数とRMSをそれ
ぞれ平滑化回路49と平滑化回路51に渡す。
【0094】平滑化回路49は、パラメータ復号回路54か
ら渡されたフィルタ係数を、入力端子65から入力した平
滑化係数β(n)を用いて平滑化し、合成回路68に渡す。
但し、入力端子50から入力されたDTX判定符号で信号符
号列が伝送されないことが示された場合は、前フレーム
のフィルタ係数を繰り返し使用する。
【0095】各無音声区間中の先頭から数えてnフレー
ム目で使用する平滑化フィルタ係数F(n,i),(i=1,...,M)
は、nフレーム目に入力されたフィルタ係数 f(n,i),(i
=1,...,M)を用いて、上式(4)と同様の次式(5)で計
算する。
【0096】 F(n,i) = (1−β(n))・F(n−1,i) + β(n)・f(n,i) …(5) ここで、β(n)は、各無音声区間中の先頭からの経過フ
レーム数に応じて変化する値であり、経過フレーム数が
少ない時には過去のフレームからの影響を忘却するよう
に1付近の値を取る。例えば、β(1)=β(2)=1.0、β(3)=
β(4)=… =β(L)= 0.7 とすることできる。Lは各無音
声区間のフレーム数である。
【0097】平滑化回路51は、パラメータ復号回路54か
ら渡されたRMSを平滑化し、混合回路61に渡す。但し、
入力端子50から入力されたDTX判定符号で信号符号列が
伝送されないことが示された場合は、直前に伝送された
RMSを用いて平滑化を行なう。各無音声区間中の先頭か
ら数えてnフレーム目で使用する平滑化RMS P(n)は、n
フレーム目に入力されたRMS p(n) を用いて、上式(1)
と同様の次式(6)で計算する。
【0098】 P(n) = (1−α(n))・P(n−1) + α(n)・p(n) …(6) ここで、α(n)は、β(n)と同様に、各無音声区間中の
先頭からの経過フレーム数に応じて変化する値であり、
経過フレーム数が少ない時には過去のフレームからの影
響を忘却するように1付近の値を取る。例えば、α(1)=
α(2)=1.0、α(3)=α(4)=… =α(L)= 0.7 とすることで
きる。Lは各無音声区間のフレーム数である。
【0099】なお、平滑化回路49と平滑化回路51の処理
のいずれか一方の処理のみを行なうこともできる。その
場合は、パラメータ復号回路54から受け渡されるフィル
タ係数あるいはRMSを、直接合成回路68又は混合回路61
に渡すことになる。
【0100】混合回路61では、平滑化回路51から渡され
る平滑化RMSを用いて、乱数回路56から渡された乱数信
号r(i)とパルス回路53から渡されたパルス列信号p(i)と
ピッチ回路58から渡されたピッチ信号q(i)との線形和処
理を行なうことにより、合成フィルタの励振信号x(i)を
計算し、合成回路68に渡す。
【0101】合成回路68は、混合回路61から渡される励
振信号を、平滑化回路49から渡されるフィルタ係数で構
成するフィルタに入力することにより、信号を復号し、
出力端子70から出力する。
【0102】図4は、本発明の第3の実施例における復
号装置の構成を示す図である。本発明の第3の実施例の
復号装置が、従来の復号装置と相違する点は、無音声部
検定回路38と無音声部復号回路37である。
【0103】ビット列分解回路26は、入力端子24から入
力したビット列をVAD判定符号とDTX判定符号及び信号符
号列に分解し、VAD判定符号と信号符号列を切り替え回
路28に渡し、DTX判定符号を無音声部復号回路37に渡
す。
【0104】切り替え回路28は、ビット列分解回路26か
ら渡された信号符号列を、ビット列分解回路26から渡さ
れたVAD判定符号で入力信号が音声区間とされた場合に
は音声部復号回路30に渡し、VAD判定符号で入力信号が
無音声区間とされた場合には無音声部復号回路37に渡
す。
【0105】無音声部検定回路38は、無音声部復号回路
37から渡されたフィルタ係数とRMSを用いて、図5にお
ける混合回路62で用いる線形和の結合係数を調整する設
定パラメータを決定し、無音声部復号回路37に渡す。こ
の調整パラメータの計算に関しては、混合回路62での処
理と合わせて後述する。
【0106】無音声部復号回路37は、ビット列分解回路
26から渡されたDTX判定符号、及び切り替え回路28から
渡された信号符号列を用いて無音声区間の信号を復号
し、出力端子32から出力する。
【0107】図5は、本発明の第3の実施例における無
音声部復号回路37の構成を示す図である。本発明の第3
の実施例における無音声部復号回路37が、前記第1の実
施例における無音声部復号回路35と相違する点は、混合
回路62及びパラメータ復号回路54の出力先である。以下
では、主に従来の装置との相違点について説明し、同一
部分の説明は適宜省略する。
【0108】パラメータ復号回路54は、入力端子52で入
力した信号符号列からフィルタ係数とRMSを求め、フィ
ルタ係数を平滑化回路64と出力端子23に渡し、RMSを平
滑化回路66と出力端子25に渡す。
【0109】平滑化回路66は、パラメータ復号回路54か
ら渡されたRMSを平滑化し、混合回路62に渡す。但し、
入力端子50から入力されたDTX判定符号で信号符号列が
伝送されないことが示された場合は、直前に伝送された
RMSを用いて平滑化を行なう。また、この場合、平滑化
の係数α(n)やβ(n)を零とすることで平滑化したRMSを
更新しないように制御することもできる。
【0110】乱数回路56は、乱数を生成し、混合回路62
に渡す。
【0111】パルス回路53は、乱数で生成した位置と振
幅を持つパルスから成るパルス列信号を生成し、混合回
路62に渡す。ピッチ回路58は、前述の適応コードベクト
ルからなるピッチ信号を生成し、混合回路62に渡す。
【0112】混合回路62は、入力端子60から入力した設
定パラメータと平滑化回路66から渡された平滑化RMSを
用いて、前述の線形和の結合係数を計算する。
【0113】また、この結合係数を用いて、乱数回路56
から渡された乱数信号とパルス回路53から渡されたパル
ス列信号とピッチ回路53から渡されたピッチ信号との線
形和信号を計算し、合成回路68に渡す。
【0114】合成回路68は、混合回路62から渡される励
振信号を、平滑化回路64から渡されるフィルタ係数で構
成するフィルタに入力することにより、信号を復号し、
出力端子70から出力する。
【0115】無音声部検定回路38と混合回路62について
説明する。
【0116】無音声部検定回路38において無音声部にお
ける背景雑音の性質を決定し、この性質に従って、混合
回路62におけるピッチ信号、パルス列信号及び乱数信号
の結合係数の計算方法を変更する。変更する設定パラメ
ータとしては、結合係数を決定する順番や、結合係数γ
がある。
【0117】無音性部検定回路38が、無音声部における
背景雑音の性質を検定するための情報としては、例え
ば、RMSとフィルタ係数がある。
【0118】この情報から前記設定パラメータを操作す
る方法として、例えば、前記RMSが予め定めた閾値より
も小さく、背景雑音がないと見なした場合や、フィルタ
係数から計算した入力信号のスペクトル傾きが平坦な白
色雑音と見なした場合は、乱数信号の寄与を大きくする
方法がある。これは、結合係数の計算順番はそのままで
γを小さくすることと等価である。
【0119】なお、この無音声信号の設定パラメータを
信号符号列に含めて伝送することもできる。
【0120】図6は、本発明の第4の実施例における復
号装置の構成を示す図である。本発明の第4の実施例に
おける復号装置が、前記第2の実施例における復号装置
と相違する点は、無音声部検定回路38と無音声部復号回
路39である。
【0121】ビット列分解回路26は、入力端子24から入
力したビット列をVAD判定符号とDTX判定符号及び信号符
号列に分解し、VAD判定符号を平滑化制御回路36と切り
替え回路28に渡し、信号符号列を切り替え回路28に渡
し、DTX判定符号を無音声部復号回路39に渡す。
【0122】切り替え回路28は、ビット列分解回路26か
ら渡されたVAD判定符号で入力信号が音声区間とされた
場合にはビット列分解回路26から渡された信号符号列を
音声部復号回路30に渡し、VAD判定符号で入力信号が無
音声区間とされた場合には無音声部復号回路39に渡す。
無音声部検定回路38と無音声部復号回路39に信号符号列
を渡す。
【0123】平滑化制御回路36は、ビット列分解回路26
から渡されるVAD判定符号の変化に応じた前記平滑化係
数α(n)とβ(n)を無音声部復号回路39に渡す。
【0124】無音声部検定回路38は、無音声部復号回路
39から渡された平滑化RMSを用いて、図7における混合
回路62で使用する線形和の結合係数を調整する設定パラ
メータを決定し、無音声部復号回路39に渡す。
【0125】無音声部検定回路39での設定パラメータの
決定処理はRMSを平滑化RMSに置き換えることで、前述し
た無音声部検定回路38と同様の処理を適用できる。
【0126】無音声部復号回路39は、ビット列分解回路
26から渡されたDTX判定符号、及び切り替え回路28から
渡された信号符号列、平滑化制御回路36から渡された平
滑化係数α(n)とβ(n)、及び無音声部検定回路38から渡
された設定パラメータを用いて無音声区間の信号を復号
し、出力端子32から出力する。
【0127】また、図7の平滑化回路50で計算された平
滑化RMSと、平滑化回路64で計算された平滑化フィルタ
係数を無音声部検定回路38に渡す。
【0128】図7は、本発明の第4の実施例における無
音声部復号回路39の構成を示す図である。本発明の本発
明の第4の実施例における無音声部復号回路39が、前記
第2の実施例における無音声部復号回路と相違する点
は、平均化回路50と平滑化回路64からの出力が出力端子
69及び出力端子63から出力される構成とされていること
である。
【0129】上記各実施例では、合成フィルタの励振信
号を計算する時にピッチ信号とパルス列信号と乱数信号
全てを用いているが、いずれかを省く構成としてもよ
い。
【0130】本発明は、従来の技術の欄にて説明した符
号化装置とともに、掲題無線端末や無線基地局に搭載し
て、音声信号圧縮技術を用いた無線音声通信システムを
容易に構築することができる。また、既に説明した復号
方法を実行するためのプログラムをフロッピィディスク
等の記録媒体に格納しておき、スピーカー等が接続され
たパーソナルコンピュータにこのプログラムをロードす
ることにより、音声端末を構築することも容易にでき
る。
【0131】
【発明の効果】以上説明したように、本発明によれば下
記記載の効果を奏する。
【0132】本発明の第1の効果は、復号装置におい
て、無音声区間を復号する際に使用するフィルタ係数が
不連続に変化することによる、復号音質の劣化を低減す
る、ということである。
【0133】その理由は、本発明においては、間欠的に
伝送されるフィルタ係数を平滑化処理した後に用いてい
るためである。
【0134】本発明の第2の効果は、復号装置におい
て、無音声区間の先頭部分で直前の有音声区間による影
響を受けることによる復号音質の劣化を低減する、とい
うことである。
【0135】その理由は、本発明においては、無音声区
間の先頭部分では、特徴パラメータの平滑化処理を行な
わないように平滑化係数を設定している、ためである。
【0136】本発明の第3の効果は、復号装置におい
て、音声区間と無音声区間の切り替わりにより生じる聴
覚的な不連続を低減する、ということである。
【0137】その理由は、本発明においては、無音声区
間において再生フィルタの励振信号を生成する時に、乱
数成分に対するパルス成分とピッチ成分の比を入力信号
の性質に応じて変更するためである。
【図面の簡単な説明】
【図1】本発明の第1の実施例における無音声部復号回
路の構成を示す図である。
【図2】本発明の第2の実施例における復号装置の構成
を示す図である。
【図3】本発明の第2の実施例における無音声部復号回
路の構成を示す図である。
【図4】本発明の第3の実施例における復号装置の構成
を示す図である。
【図5】本発明の第3の実施例における無音声部復号回
路の構成を示す図である。
【図6】本発明の第4の実施例における復号装置の構成
を示す図である。
【図7】本発明の第4の実施例における無音声部復号回
路の構成を示す図である。
【図8】従来及び本発明の実施例に係る符号化装置の構
成を示す図である。
【図9】従来の復号装置の構成を示す図である。
【図10】従来の復号装置における無音声部復号回路の
構成を示す図である。
【符号の説明】
10、24、50、52、65、67、60、63 入
力端子 12 音声部符号化回路 14 無音声部符号化回路 18、28 切り替え回路 20 ビット列生成回路 22、23、25、32、70 出力端子 26 ビット列分割回路 30 音声部復号回路 34、35、37、39 無音声部復号回路 36 平滑化制御回路 38 無音声部検定回路 49、51、64、66 平滑化回路 53 パルス回路 54 パラメータ復号回路 56 乱数回路 58 ピッチ回路 61、62 混合回路 68 合成回路

Claims (47)

    【特許請求の範囲】
  1. 【請求項1】音声信号が音声区間であるか無音声区間で
    あるかに従って、受信した特徴パラメータから音声信号
    を復号する音声復号装置において、 前記無音声区間の音声信号の復号を、その無音声区間の
    少なくとも一部において、前記特徴パラメータの中で前
    記復号信号のスペクトル包絡特性を表す特徴パラメータ
    から過去に計算した平滑値と現フレームで受信した特徴
    パラメータとの重み付け加算で得た平滑値を用いて復号
    する手段を用いることを特徴とする音声復号装置。
  2. 【請求項2】音声信号が音声区間であるか無音声区間で
    あるかに従って、受信した特徴パラメータから音声信号
    を復号する音声復号装置において、 前記無音声区間の音声信号の復号を、その無音声区間の
    少なくとも一部において、前記特徴パラメータの中で前
    記復号信号のスペクトル包絡特性を表す特徴パラメータ
    から過去に計算した平滑値Xpreと現フレームで受信
    した特徴パラメータYnとの重み付けaとbとを用いた
    加算により得た平滑値Xn=aXpre+bYnを用い
    て復号する手段を用いることを特徴とする音声復号装
    置。
  3. 【請求項3】復号信号が音声区間であるか無音声区間で
    あるかに従って、受信した特徴パラメータから信号を復
    号する音声復号装置において、 前記特徴パラメータの内少なくとも1つを平滑化するた
    めの係数を、音声区間から無音声区間に切り替わってか
    らの時間経過に応じて変更し、変更された係数値を用い
    て、前記特徴パラメータの内少なくとも1つを平滑化し
    て前記無音声区間の音声信号を復号する無音声区間復号
    器を備えたことを特徴とする音声復号装置。
  4. 【請求項4】前記無音声区間復号器は、音声区間から無
    音声区間に切り替わった直後には伝送された特徴パラメ
    ータの内少なくとも1つをそのまま使用し、それ以降
    は、前記特徴パラメータの内少なくとも1つを平滑化し
    た特徴パラメータを用いて復号することを特徴とする請
    求項3に記載の音声復号装置。
  5. 【請求項5】復号信号が音声区間であるか無音声区間で
    あるかに従って、受信した特徴パラメータから信号を復
    号する音声復号装置において、 前記特徴パラメータの内少なくとも1つを平滑化するた
    めの係数を、前記特徴パラメータに応じて変更し、変更
    された係数値を用いて、前記特徴パラメータの内少なく
    とも1つを平滑化して前記無音声区間の音声信号を復号
    する無音声区間復号器を備えたことを特徴とする音声復
    号装置。
  6. 【請求項6】前記無音声区間復号器は、前記特徴パラメ
    ータが予め定めた条件を満たす間は伝送された特徴パラ
    メータの内少なくとも1つをそのまま使用し、それ以降
    は、前記特徴パラメータの内少なくとも1つを平滑化し
    た特徴パラメータを用いて復号することを特徴とする請
    求項5に記載の音声復号装置。
  7. 【請求項7】復号信号が音声区間であるか無音声区間で
    あるかに従って、受信した特徴パラメータから信号を復
    号する音声復号装置において、 前記特徴パラメータの内少なくとも1つを平滑化するた
    めの係数を、前記特徴パラメータが伝送されたか否かを
    示す情報に応じて変更し、変更された係数値を用いて、
    前記特徴パラメータの内少なくとも1つを平滑化して前
    記無音声区間の音声信号を復号する無音声区間復号器を
    備えたことを特徴とする音声復号装置。
  8. 【請求項8】前記無音声区間復号器は、前記特徴パラメ
    ータの内少なくとも1つを平滑化するための係数を、音
    声区間から無音声区間に切り替わってからの時間経過及
    び前記特徴パラメータに応じて変更し、変更された係数
    値を用いて前記特徴パラメータの内少なくとも1つを平
    滑化し、前記無音声区間の信号を復号する無音声区間復
    号器である請求項3に記載の音声復号装置。
  9. 【請求項9】前記無音声区間復号器は、伝送された特徴
    パラメータの内少なくとも1つをそのまま使用した以降
    の無音声区間では、音声区間から無音声区間に切り替わ
    ってからの時間経過及び前記特徴パラメータの内少なく
    とも一つに応じて前記特徴パラメータの内少なくとも一
    つを平滑化した値を用いて復号する無音声区間復号器で
    ある請求項4または6に記載の音声復号装置。
  10. 【請求項10】前記無音声区間復号器は、前記復号器
    が、音声区間から無音声区間に切り替わった直後であり
    また前記特徴パラメータが予め定めた条件を満たす間
    は、伝送された特徴パラメータの内少なくとも1つをそ
    のまま使用し、それ以降は、前記特徴パラメータの内少
    なくとも1つを平滑化した値を用いて無音声区間の音声
    信号を復号する請求項3に記載の音声復号装置。
  11. 【請求項11】前記無音声区間復号器は、前記特徴パラ
    メータの内少なくとも1つを平滑化するための係数を、
    前記特徴パラメータが伝送されたか否かを示す情報の応
    じて変更し、変更された係数値を用いて、前記特徴パラ
    メータの内少なくとも1つを平滑化した特徴パラメータ
    を用いて復号することを特徴とする請求項1から6、8
    から10の内、いずれか一項に記載の音声復号装置。
  12. 【請求項12】前記無音声区間復号器は、前記特徴パラ
    メータが送信側で送信されたか否かを示す情報を受信す
    ることを特徴とする請求項11に記載の音声復号装置。
  13. 【請求項13】該無声音区間の直前にある音声区間の長
    さが予め定めた値より小さい場合は、この音声区間の直
    前にある無音声区間で最後に伝送された特徴パラメータ
    を、平滑化の初期値として使用することを特徴とする請
    求項1乃至12のいずれか一つに記載の音声復号装置。
  14. 【請求項14】前記特徴パラメータが、前記復号信号に
    対応するスペクトル包絡を表す量とパワーを表す量の少
    なくとも一つを含む、ことを特徴とする請求項1乃至1
    3のいずれか一つに記載の音声復号装置。
  15. 【請求項15】各フレームにおいて入力信号が音声区間
    であるか無音声区間であるかの判別を行い前記入力信号
    の特徴パラメータを符号化して出力する符号化装置と、
    請求項1乃至14のいずれか一つに記載の音声復号装置
    とを備えた音声符号化・復号装置。
  16. 【請求項16】請求項1乃至15の音声符号化・復号装
    置あるいは復号装置を備えることを特徴とする基地局装
    置。
  17. 【請求項17】請求項1乃至15の音声符号化・復号装
    置あるいは復号装置を備えることを特徴とする通信端末
    装置。
  18. 【請求項18】音声信号が音声区間であるか無音声区間
    であるかに従って、受信した特徴パラメータの復号動作
    を変更して音声信号を復号する音声復号方法において、 無音声区間の少なくとも一部において、前記特徴パラメ
    ータの中で、前記復号信号のスペクトル包絡特性を表す
    特徴パラメータから過去に計算した平滑値と現フレーム
    で受信した特徴パラメータとの重み付け加算で得た平滑
    値を算出する平滑化ステップと、 前記平滑化ステップで算出された平滑値を使用して前記
    無音声区間の信号を復号する無音声区間音声信号復号ス
    テップとを含むことを特徴とする音声復号方法。
  19. 【請求項19】音声信号が音声区間であるか無音声区間
    であるかに従って、受信した特徴パラメータの復号動作
    を変更して音声信号を復号する音声復号方法において、 無音声区間の少なくとも一部において、前記特徴パラメ
    ータの中で、前記復号信号のスペクトル包絡特性を表す
    特徴パラメータから過去に計算した平滑値Xpreと現
    フレームで受信した特徴パラメータYnとの重み付けa
    とbとを用いた加算で得た平滑値Xn=aXpre+b
    Ynを算出する平滑化ステップと、 前記平滑化ステップで算出された平滑値を使用して前記
    無音声区間の信号を復号する無音声区間音声信号復号ス
    テップとを含むことを特徴とする音声復号方法。
  20. 【請求項20】音声信号が音声区間であるか無音声区間
    であるかに従って、受信した特徴パラメータの復号動作
    を変更して音声信号を復号する音声復号方法において、 音声区間から無音声区間に切り替わってからの時間経過
    に応じて、前記特徴パラメータの少なくとも1つを平滑
    化する平滑化ステップと、 前記平滑化された特徴パラメータを使用して前記無音声
    区間の信号を復号する無音声区間音声信号復号ステップ
    とを含むことを特徴とする音声復号方法。
  21. 【請求項21】前記平滑化ステップは、下記(a)、
    (b)のステップからなることを特徴とする請求項20
    に記載の音声復号方法。 (a)音声区間から無音声区間に切り替わった直後の一
    定区間では伝送された特徴パラメータの少なくとも1つ
    をそのまま使用し、 (b)それ以降は前記特徴パラメータの内少なくとも1
    つを平滑化する。
  22. 【請求項22】音声信号が音声区間であるか無音声区間
    であるかに従って、受信した特徴パラメータの復号動作
    を変更して音声信号を復号する音声復号方法において、 前記特徴パラメータに応じて、前記特徴パラメータの少
    なくとも1つを平滑化する平滑化ステップと、 前記平滑化された特徴パラメータを使用して前記無音声
    区間の信号を復号する無音声区間音声信号復号ステップ
    とを含むことを特徴とする音声復号方法。
  23. 【請求項23】前記平滑化ステップは、下記(a)、
    (b)のステップからなることを特徴とする請求項22
    に記載の音声復号方法。 (a)前記特徴パラメータが予め定めた条件を満たす間
    は伝送された特徴パラメータの少なくとも1つをそのま
    ま使用し、 (b)それ以降は前記特徴パラメータの内少なくとも1
    つを平滑化する。
  24. 【請求項24】音声信号が音声区間であるか無音声区間
    であるかに従って、受信した特徴パラメータの復号動作
    を変更して音声信号を復号する音声復号方法において、 前記特徴パラメータが伝送されたか否かを示す情報に応
    じて、前記特徴パラメータの少なくとも1つを平滑化す
    る平滑化ステップと、 前記平滑化された特徴パラメータを使用して前記無音声
    区間の信号を復号する無音声区間音声信号復号ステップ
    とを含むことを特徴とする音声復号方法。
  25. 【請求項25】前記平滑化ステップは、音声区間から無
    音声区間に切り替わってからの時間経過及び前記特徴パ
    ラメータに応じて、前記特徴パラメータの少なくとも一
    つを平滑化する、 ことを特徴とする請求項20に記載の音声復号方法。
  26. 【請求項26】前記平滑化ステップが、伝送された特徴
    パラメータの少なくとも1つをそのまま使用した後は、
    音声区間から無音声区間に切り替わってからの時間経過
    及び前記特徴パラメータの内少なくとも1つに応じて前
    記特徴パラメータの内少なくとも一つを平滑化すること
    を特徴とする請求項21または23に記載の音声復号方
    法。
  27. 【請求項27】前記平滑化ステップは、下記(a)、
    (b)のステップからなることを特徴とする請求項20
    に記載の音声復号方法。 (a)音声区間から無音声区間に切り替わった直後且つ
    前記特徴パラメータが予め定めた条件を満たす間は、伝
    送された特徴パラメータの内少なくとも一つを直接使用
    し、 (b)それ以降は、前記特徴パラメータの内少なくとも
    一つについて時間方向に平滑化する。
  28. 【請求項28】前記平滑化ステップが、前記特徴パラメ
    ータの内少なくとも1つを平滑化するための係数を、前
    記特徴パラメータが伝送されたか否かを示す情報に応じ
    て変更することを特徴とする請求項19乃至23または
    25乃至26のいずれか一項に記載の音声復号方法。
  29. 【請求項29】前記特徴パラメータが伝送されたか否か
    を示す情報を受信するステップをさらに備えることを特
    徴とする請求項28に記載の音声復号方法。
  30. 【請求項30】前記特徴パラメータが、前記復号信号に
    対応するスペクトル包絡を表す量とパワーを表す量との
    少なくとも一つを含む、ことを特徴とする請求項18乃
    至29のいずれか一つに記載の音声復号方法。
  31. 【請求項31】各フレームにおいて入力信号が音声区間
    であるか無音声区間であるかの判別を行い前記入力信号
    の特徴パラメータを符号化して出力する符号化ステップ
    と、請求項18乃至29のいずれか一つに記載の音声復
    号方法を実施するステップとを組み合わせてなる音声符
    号化・復号方法。
  32. 【請求項32】音声信号が音声区間であるか無音声区間
    であるかに従って、受信した特徴パラメータの復号動作
    を変更して音声信号を復号する音声復号方法を実行する
    プログラムを記録した記録媒体において、 無音声区間の少なくとも一部において、前記特徴パラメ
    ータの中で、前記復号信号のスペクトル包絡特性を表す
    特徴パラメータから過去に計算した平滑値と現フレーム
    で受信した特徴パラメータとの重み付け加算で得た平滑
    値を算出する平滑化ステップと、 前記平滑化ステップで算出された平滑値を使用して前記
    無音声区間の信号を復号する無音声区間音声信号復号ス
    テップとを格納したことを特徴とする記録媒体。
  33. 【請求項33】音声信号が音声区間であるか無音声区間
    であるかに従って、受信した特徴パラメータの復号動作
    を変更して音声信号を復号する音声復号方法を実行する
    プログラムを記録した記録媒体において、 無音声区間の少なくとも一部において、前記特徴パラメ
    ータの中で、前記復号信号のスペクトル包絡特性を表す
    特徴パラメータから過去に計算した平滑値Xpreと現
    フレームで受信した特徴パラメータYnとの重み付けa
    とbとを用いた加算で得た平滑値Xn=aXpre+b
    Ynを算出する平滑化ステップと、 前記平滑化ステップで算出された平滑値を使用して前記
    無音声区間の信号を復号する無音声区間音声信号復号ス
    テップとを格納したことを特徴とする記録媒体。
  34. 【請求項34】音声信号が音声区間であるか無音声区間
    であるかに従って、受信した複数種の特徴パラメータの
    復号動作を変更して音声信号を復号する音声復号方法を
    実行するためのプログラムを記録した記録媒体におい
    て、 音声区間から無音声区間に切り替わってからの時間経過
    に応じて、前記特徴パラメータの少なくとも一つを平滑
    化する平滑化ステップと、 前記平滑化された特徴パラメータを使用して前記無音声
    区間の信号を復号する無音声区間音声信号復号ステップ
    とを格納したことを特徴とする記録媒体。
  35. 【請求項35】前記平滑化ステップは、下記(a)、
    (b)のステップからなることを特徴とする請求項34
    に記載の記録媒体。 (a)音声区間から無音声区間に切り替わった直後には
    伝送された特徴パラメータの少なくとも一つをそのまま
    使用し、 (b)それ以降は前記特徴パラメータの内少なくとも一
    つを平滑化する。
  36. 【請求項36】音声信号が音声区間であるか無音声区間
    であるかに従って、受信した複数種の特徴パラメータの
    復号動作を変更して音声信号を復号する音声復号方法を
    実行するためのプログラムを記録した記録媒体におい
    て、 前記特徴パラメータに応じて、前記特徴パラメータの少
    なくとも一つを平滑化する平滑化ステップと、 前記平滑化された特徴パラメータを使用して前記無音声
    区間の信号を復号する無音声区間音声信号復号ステップ
    とを格納したことを特徴とする記録媒体。
  37. 【請求項37】前記平滑化ステップは、下記(a)、
    (b)のステップからなることを特徴とする請求項36
    に記載の記録媒体。 (a)前記特徴パラメータが予め定めた条件を満たす間
    は伝送された特徴パラメータの少なくとも一つをそのま
    ま使用し、 (b)それ以降は前記特徴パラメータの内少なくとも一
    つを平滑化する。
  38. 【請求項38】音声信号が音声区間であるか無音声区間
    であるかに従って、受信した複数種の特徴パラメータの
    復号動作を変更して音声信号を復号する音声復号方法を
    実行するためのプログラムを記録した記録媒体におい
    て、 前記特徴パラメータが伝送されたか否かを示す情報に応
    じて、前記特徴パラメータの少なくとも一つを平滑化す
    る平滑化ステップと、 前記平滑化された特徴パラメータを使用して前記無音声
    区間の信号を復号する無音声区間音声信号復号ステップ
    とを格納したことを特徴とする記録媒体。
  39. 【請求項39】前記平滑化ステップは、音声区間から無
    音声区間に切り替わってからの時間経過及び前記特徴パ
    ラメータに応じて、前記特徴パラメータの少なくとも一
    つを平滑化する、ことを特徴とする請求項34に記載の
    記録媒体。
  40. 【請求項40】前記平滑化ステップが、伝送された特徴
    パラメータの少なくとも1つをそのまま使用した後は、
    音声区間から無音声区間に切り替わってからの時間経過
    及び前記特徴パラメータの内少なくとも1つに応じて前
    記特徴パラメータの内少なくとも一つを平滑化すること
    を特徴とすることを特徴とする請求項35または36に
    記載の記録媒体。
  41. 【請求項41】前記平滑化ステップが、下記(a)、
    (b)のステップからなることを特徴とする請求項34
    に記載の記録媒体。 (a)音声区間から無音声区間に切り替わった直後且つ
    前記特徴パラメータが予め定めた条件を満たす区間では
    伝送された特徴パラメータの内少なくとも一つを直接使
    用し、 (b)それ以降は、前記特徴パラメータの内少なくとも
    一つについて時間方向に平滑化する。
  42. 【請求項42】前記平滑化ステップが、前記特徴パラメ
    ータの内少なくとも1つを平滑化するための係数を、前
    記特徴パラメータが伝送されたか否かを示す情報に応じ
    て変更することを特徴とする請求項32乃至38または
    40乃至41のいずれか一項に記載の記録媒体。
  43. 【請求項43】前記特徴パラメータが伝送されたか否か
    を示す情報を受信するステップをさらに備えることを特
    徴とする請求項42に記載の記録媒体。
  44. 【請求項44】音声信号が音声区間であるか無音声区間
    であるかに従って、復号方法を変更し、受信した特徴パ
    ラメータから信号を復号する音声復号方法を実行するプ
    ログラムを記録した記録媒体であり、前記無音区間の復
    号するためのステップとして、少なくとも一部の区間に
    おいて、受信した前記特徴パラメータの少なくとも一つ
    に基づき、前記無音声区間における励振信号を複数種類
    の信号を重み付け加算して生成するための係数を決定す
    る重み付け係数決定ステップと、 決定された係数に基づいて励振信号を生成し、この励振
    信号を合成フィルタに入力することにより前記無音声区
    間の復号信号を生成するステップとを格納した記録媒
    体。
  45. 【請求項45】音声信号が音声区間であるか無音声区間
    であるかに従って、復号方法を変更し、受信した特徴パ
    ラメータから信号を復号する音声復号方法を実行するプ
    ログラムを記録した記録媒体であり、前記無音区間の復
    号のためのステップとして、 少なくとも一部の区間において、受信した特徴パラメー
    タを平滑化し、平滑化されたパラメータを計算するステ
    ップと、 前記計算した平滑化されたパラメータの少なくとも一つ
    に基づき、前記無音声区間における励振信号を複数種類
    の信号を重み付け加算して生成するための係数を決定す
    る重み付け係数決定ステップと、決定された係数を用い
    て励振信号を生成し、この励振信号を合成フィルタに入
    力することにより前記無音声区間の復号信号を生成する
    ステップとを格納した記録媒体。
  46. 【請求項46】前記特徴パラメータが、前記復号信号に
    対応するスペクトル包絡を表す量とパワーを表す量との
    少なくとも一つを含む、ことを特徴とする請求項33乃
    至45のいずれか一つに記載の記録媒体。
  47. 【請求項47】各フレームにおいて入力信号が音声区間
    であるか無音声区間であるかの判別を行い前記入力信号
    の特徴パラメータを符号化して出力する符号化ステップ
    と、請求項33乃至45のいずれか一つに記載の音声復
    号方法ステップとを組み合わせてなるプログラムを格納
    した記録媒体。
JP2003062333A 1999-05-31 2003-03-07 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 Expired - Lifetime JP3475958B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003062333A JP3475958B2 (ja) 1999-05-31 2003-03-07 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP15238099 1999-05-31
JP11-152380 1999-05-31
JP2003062333A JP3475958B2 (ja) 1999-05-31 2003-03-07 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP29879599A Division JP3451998B2 (ja) 1999-05-31 1999-10-20 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2003276599A Division JP2004004946A (ja) 1999-05-31 2003-07-18 音声復号装置

Publications (2)

Publication Number Publication Date
JP2003233398A true JP2003233398A (ja) 2003-08-22
JP3475958B2 JP3475958B2 (ja) 2003-12-10

Family

ID=27790274

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003062333A Expired - Lifetime JP3475958B2 (ja) 1999-05-31 2003-03-07 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3475958B2 (ja)

Also Published As

Publication number Publication date
JP3475958B2 (ja) 2003-12-10

Similar Documents

Publication Publication Date Title
EP1509903B1 (en) Method and device for efficient frame erasure concealment in linear predictive based speech codecs
US7203638B2 (en) Method for interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs
US7657427B2 (en) Methods and devices for source controlled variable bit-rate wideband speech coding
JP4444749B2 (ja) 減少レート、可変レートの音声分析合成を実行する方法及び装置
EP2535893B1 (en) Device and method for lost frame concealment
US7324937B2 (en) Method for packet loss and/or frame erasure concealment in a voice communication system
JP4489960B2 (ja) 音声の無声セグメントの低ビットレート符号化
JP2009134303A (ja) 音声復号化方法及び音声復号化装置
JP3602593B2 (ja) 音声エンコーダ及び音声デコーダ、並びに音声符号化方法及び音声復号化方法
US20190333529A1 (en) Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
JPH06222798A (ja) 音声信号を効率的に符号化するための方法及びこの方法を用いる符号器
JP3558031B2 (ja) 音声復号化装置
JP3451998B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP3722366B2 (ja) パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム
US7089180B2 (en) Method and device for coding speech in analysis-by-synthesis speech coders
JP3475958B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
WO2000000963A1 (fr) Codeur vocal
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP2000235400A (ja) 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体
JP2004004946A (ja) 音声復号装置
JPH028900A (ja) 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP2004061558A (ja) 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体
JPH05224698A (ja) ピッチサイクル波形を平滑化する方法及び装置
JP2004078235A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030826

R150 Certificate of patent or registration of utility model

Ref document number: 3475958

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080926

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080926

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090926

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090926

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100926

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110926

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120926

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130926

Year of fee payment: 10

EXPY Cancellation because of completion of term