JP3365346B2 - 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体 - Google Patents
音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体Info
- Publication number
- JP3365346B2 JP3365346B2 JP13789399A JP13789399A JP3365346B2 JP 3365346 B2 JP3365346 B2 JP 3365346B2 JP 13789399 A JP13789399 A JP 13789399A JP 13789399 A JP13789399 A JP 13789399A JP 3365346 B2 JP3365346 B2 JP 3365346B2
- Authority
- JP
- Japan
- Prior art keywords
- bits
- signal
- calculation
- predetermined number
- shift amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
【発明の属する技術分野】この発明は、固定小数点演算
を用いたことに基づく、演算精度不足による音質劣化
と、入力音声のレベル変動による符号化品質の劣化とを
低減した音声符号化装置及び方法並びに音声符号化プロ
グラムを記録した記憶媒体に関する。
を用いたことに基づく、演算精度不足による音質劣化
と、入力音声のレベル変動による符号化品質の劣化とを
低減した音声符号化装置及び方法並びに音声符号化プロ
グラムを記録した記憶媒体に関する。
【0002】
【従来の技術】音声符号化の次世代国際標準として、M
PEG(Motion Picture Image Coding Experts Grou
p)−4音声符号化方式の実用化が進められている。M
PEG−4音声符号化方式においては、放送,インター
ネット,電話等のアプリケーションの融合と、スケーラ
ブル性の向上を図るために、それぞれの音声圧縮符号化
方式を統合した、複数の品質の音声の符号化と復号化が
可能な、階層符号化された、高品質,高機能,低演算量
の音声コーディックを実現することが求められている。
PEG(Motion Picture Image Coding Experts Grou
p)−4音声符号化方式の実用化が進められている。M
PEG−4音声符号化方式においては、放送,インター
ネット,電話等のアプリケーションの融合と、スケーラ
ブル性の向上を図るために、それぞれの音声圧縮符号化
方式を統合した、複数の品質の音声の符号化と復号化が
可能な、階層符号化された、高品質,高機能,低演算量
の音声コーディックを実現することが求められている。
【0003】MPEG−4音声符号化方式においては、
音声符号化の方法として、CELP(Code Exited Line
ar Prediction)方式を用いる。CELP方式において
は、人体の発声器官をモデル化することによって音声を
符号化する。すなわち、CELP方式においては、人間
の声帯をモデル化した音源と、声道をモデル化したLP
(Linear Prediction)合成フィルタとを用いて音声を
合成する際の、それぞれのパラメータを符号化して伝送
する。そして復号側では、これらのパラメータに基づい
て生成した音源と、LP合成フィルタとを用いて音声を
再生する。
音声符号化の方法として、CELP(Code Exited Line
ar Prediction)方式を用いる。CELP方式において
は、人体の発声器官をモデル化することによって音声を
符号化する。すなわち、CELP方式においては、人間
の声帯をモデル化した音源と、声道をモデル化したLP
(Linear Prediction)合成フィルタとを用いて音声を
合成する際の、それぞれのパラメータを符号化して伝送
する。そして復号側では、これらのパラメータに基づい
て生成した音源と、LP合成フィルタとを用いて音声を
再生する。
【0004】図7は、CELP方式の音声符号化装置の
基本的な構成を示したものである。この従来例の音声符
号化装置は、図7に示すように、スケーリング/高域通
過フィルタ101と、LPC(Linear Prediction Coef
ficients)分析部102と、音源計算部103と、利得
計算部104と、合成フィルタ105と、聴感重み付け
誤差最小化部106とから概略構成されている。図7に
示された音声符号化装置では、入力音声信号に対して、
スケーリング/高域通過フィルタ101を適用すること
によって、低域成分を遮断するための処理と、固定少数
点演算におけるオーバーフローを回避するためのスケー
リング(信号振幅縮小)の処理とを行ったのち、LPC
分析部102において、音声信号のスペクトル包絡を表
すスペクトルパラメータを線形予測(LP)分析によっ
て求める。また、音源計算部103では、音源パルスの
位置と振幅とを計算し、利得計算部104では、音源パ
ルスに対する利得を計算することによって、生成された
音源パルスを所要の大きさで合成フィルタ105に供給
する。合成フィルタ105では、入力された音源パルス
に対して、LPC分析部102で求められた音声信号の
スペクトル成分のパラメータによって指定されるフィル
タ特性を適用することによって、再生音声信号を生成す
る。聴感重み付け誤差最小部106では、再生音声信号
に対して、人間の聴感特性に基づく重み付けを行うとと
もに、入力音声信号と再生音声信号との誤差(残差信
号)を求める。そして、この残差信号に基づいて、音源
計算部103における音源パルスの振幅等を制御し、利
得計算部104における音源パルスに対する利得を制御
することによって、入力音声信号と再生音声信号との誤
差が最小になるように制御を行う。このような制御が収
束したときの、LPC分析部102,音源計算部10
3,利得計算部104等のパラメータを、図示されない
マルチプレクサを介して多重し符号化することによっ
て、入力音声信号に対応する音声符号化信号を生成して
出力する。
基本的な構成を示したものである。この従来例の音声符
号化装置は、図7に示すように、スケーリング/高域通
過フィルタ101と、LPC(Linear Prediction Coef
ficients)分析部102と、音源計算部103と、利得
計算部104と、合成フィルタ105と、聴感重み付け
誤差最小化部106とから概略構成されている。図7に
示された音声符号化装置では、入力音声信号に対して、
スケーリング/高域通過フィルタ101を適用すること
によって、低域成分を遮断するための処理と、固定少数
点演算におけるオーバーフローを回避するためのスケー
リング(信号振幅縮小)の処理とを行ったのち、LPC
分析部102において、音声信号のスペクトル包絡を表
すスペクトルパラメータを線形予測(LP)分析によっ
て求める。また、音源計算部103では、音源パルスの
位置と振幅とを計算し、利得計算部104では、音源パ
ルスに対する利得を計算することによって、生成された
音源パルスを所要の大きさで合成フィルタ105に供給
する。合成フィルタ105では、入力された音源パルス
に対して、LPC分析部102で求められた音声信号の
スペクトル成分のパラメータによって指定されるフィル
タ特性を適用することによって、再生音声信号を生成す
る。聴感重み付け誤差最小部106では、再生音声信号
に対して、人間の聴感特性に基づく重み付けを行うとと
もに、入力音声信号と再生音声信号との誤差(残差信
号)を求める。そして、この残差信号に基づいて、音源
計算部103における音源パルスの振幅等を制御し、利
得計算部104における音源パルスに対する利得を制御
することによって、入力音声信号と再生音声信号との誤
差が最小になるように制御を行う。このような制御が収
束したときの、LPC分析部102,音源計算部10
3,利得計算部104等のパラメータを、図示されない
マルチプレクサを介して多重し符号化することによっ
て、入力音声信号に対応する音声符号化信号を生成して
出力する。
【0005】図7に示された音声符号化装置における、
各部の演算処理は、通常、固定小数点演算によって行わ
れる。これは、演算量を低減して演算処理を簡潔にする
とともに、装置構成を簡単化するためである。しかしな
がら、音声符号化装置において、各部における演算を固
定小数点方式によって行うことによって、入力音声信号
の振幅過大の場合には、各部のオーバーフローに基づく
歪み等が発生するとともに、入力音声信号の振幅が小さ
い場合には、演算精度が低下するために、符号化された
音声信号の品質が劣化するという問題が発生する。
各部の演算処理は、通常、固定小数点演算によって行わ
れる。これは、演算量を低減して演算処理を簡潔にする
とともに、装置構成を簡単化するためである。しかしな
がら、音声符号化装置において、各部における演算を固
定小数点方式によって行うことによって、入力音声信号
の振幅過大の場合には、各部のオーバーフローに基づく
歪み等が発生するとともに、入力音声信号の振幅が小さ
い場合には、演算精度が低下するために、符号化された
音声信号の品質が劣化するという問題が発生する。
【0006】図8は、固定小数点演算の特性を説明する
ものである。例えば、nビットの演算装置を用いて、n
ビット精度の数どうしの乗算を行った場合は、図8
(a)に示すように、演算結果は2nビットとなる可能
性があり、また、nビット精度の数どうしの加算を行っ
た場合は、図8(b)に示すように、演算結果はn+1
ビットとなる可能性があるため、いずれの場合も、演算
装置においてオーバーフローが発生する。CELP方式
の符号化装置では、相関値演算のために畳み込み演算を
用いることが多いが、この際2乗の次元をもつ演算が行
われるため、固定小数点演算を行う演算装置では、オー
バーフローが発生する可能性が高い。
ものである。例えば、nビットの演算装置を用いて、n
ビット精度の数どうしの乗算を行った場合は、図8
(a)に示すように、演算結果は2nビットとなる可能
性があり、また、nビット精度の数どうしの加算を行っ
た場合は、図8(b)に示すように、演算結果はn+1
ビットとなる可能性があるため、いずれの場合も、演算
装置においてオーバーフローが発生する。CELP方式
の符号化装置では、相関値演算のために畳み込み演算を
用いることが多いが、この際2乗の次元をもつ演算が行
われるため、固定小数点演算を行う演算装置では、オー
バーフローが発生する可能性が高い。
【0007】そこで、図7に示された音声符号化装置で
は、スケーリング/高域通過フィルタ101において、
入力音声信号のレベルを一定の割合で低下させるスケー
リングを施すとともに、LPC分析部102,利得計算
部104等では、所要の制御を行うために、相関値,歪
み値等の演算を行う際に飽和演算を行って、一定レベル
以上又は以下の演算結果に対しては、演算結果を最大値
又は最小値でクリップして出力するようにしている。こ
の際、スケーリングと飽和演算とを併用せずに、いずれ
か一方のみを用いる場合もある。なお、このような音声
符号化装置については、例えば、ITU(Internationa
l Telecommunication Union)のITU−T勧告G.7
29に準拠する、TTC(Telecommunication Technolo
gy Committee)のJT−G729標準に記載されてい
る。
は、スケーリング/高域通過フィルタ101において、
入力音声信号のレベルを一定の割合で低下させるスケー
リングを施すとともに、LPC分析部102,利得計算
部104等では、所要の制御を行うために、相関値,歪
み値等の演算を行う際に飽和演算を行って、一定レベル
以上又は以下の演算結果に対しては、演算結果を最大値
又は最小値でクリップして出力するようにしている。こ
の際、スケーリングと飽和演算とを併用せずに、いずれ
か一方のみを用いる場合もある。なお、このような音声
符号化装置については、例えば、ITU(Internationa
l Telecommunication Union)のITU−T勧告G.7
29に準拠する、TTC(Telecommunication Technolo
gy Committee)のJT−G729標準に記載されてい
る。
【0008】
【発明が解決しようとする課題】しかしながら、従来の
音声符号化装置では、固定小数点演算を採用した場合
に、入力音声信号の振幅過大による、各部のオーバーフ
ローに基づく歪み等が発生するのを防止するため、入力
音声信号に対してスケーリングを行うとともに、相関
値,歪み値等の演算時に飽和演算を行っているが、これ
によって、入力音声信号のレベル変動が大きい場合に、
演算精度が低下し、符号品質が劣化する、という問題が
あった。
音声符号化装置では、固定小数点演算を採用した場合
に、入力音声信号の振幅過大による、各部のオーバーフ
ローに基づく歪み等が発生するのを防止するため、入力
音声信号に対してスケーリングを行うとともに、相関
値,歪み値等の演算時に飽和演算を行っているが、これ
によって、入力音声信号のレベル変動が大きい場合に、
演算精度が低下し、符号品質が劣化する、という問題が
あった。
【0009】これは、符号化装置において、入力音声信
号をスケーリングしてから、符号化処理を行うため、小
さい音声レベルの場合の符号化品質が低下するととも
に、演算部において飽和演算を使用しているため、大き
い音声レベルの場合に、符号化品質が低下するためであ
る。
号をスケーリングしてから、符号化処理を行うため、小
さい音声レベルの場合の符号化品質が低下するととも
に、演算部において飽和演算を使用しているため、大き
い音声レベルの場合に、符号化品質が低下するためであ
る。
【0010】この発明は、上述の事情に鑑みてなされた
もので、固定小数点演算を用いた音声符号化装置におい
て、演算精度不足に基づく音質劣化と、入力音声のレベ
ル変動による符号化品質の劣化とを低減できるようにす
ることを目的としている。
もので、固定小数点演算を用いた音声符号化装置におい
て、演算精度不足に基づく音質劣化と、入力音声のレベ
ル変動による符号化品質の劣化とを低減できるようにす
ることを目的としている。
【0011】
【課題を解決するための手段】上記課題を解決するた
め、請求項1記載の発明は、入力音声信号のスペクトル
包絡を示すパラメータを線型予測によって求める第1の
手段と、音声信号の概略ピッチ周期を計算する第2の手
段と、ターゲット信号によって前記概略ピッチ周期の前
後で微小部分を計算する第3の手段と、マルチパルス音
源とピッチ周期から前記再生音声信号を生成するための
利得を計算する第4の手段とを少なくとも備え、入力音
声信号と再生音声信号との誤差が最小になるように前記
各手段において制御を行ったときの各部のパラメータを
多重して音声符号化信号を生成する音声符号化装置に係
り、前記各手段のうち少なくとも1の手段において、相
関値を求めて所定の演算を行う際に、該相関値に対して
正規化処理を行ったのち所定の演算を行う構成になされ
ていて、前記いずれか1の手段における前記正規化処理
が、前記求められた相関値を、他のいずれか1の手段に
おいて求められた正規化制御量だけシフトすることによ
って行われ、かつ、前記正規化制御量は、入力音声信号
の自己相関係数を第1の所定ビット数精度で計算して得
られたビット数が第2の所定ビット数より大きいとき
は、当該計算して得られたビット数を第2の所定ビット
数に正規化するための第1のシフト量と、該第1のシフ
ト量によって入力音声信号をスケーリングして前記第1
の所定ビット数精度で自己相関係数を計算して再び得ら
れたビット数を前記第2の所定ビット数に正規化するた
めの第2のシフト量との差のシフト量として求められる
一方、入力音声信号の自己相関係数を第1の所定ビット
数精度で計算して得られたビット数が前記第2の所定ビ
ット数より大きくないときは、当該計算して得られたビ
ット数を前記第2の所定ビット数に正規化するためのシ
フト量として求められる構成になされていることを特徴
としている。
め、請求項1記載の発明は、入力音声信号のスペクトル
包絡を示すパラメータを線型予測によって求める第1の
手段と、音声信号の概略ピッチ周期を計算する第2の手
段と、ターゲット信号によって前記概略ピッチ周期の前
後で微小部分を計算する第3の手段と、マルチパルス音
源とピッチ周期から前記再生音声信号を生成するための
利得を計算する第4の手段とを少なくとも備え、入力音
声信号と再生音声信号との誤差が最小になるように前記
各手段において制御を行ったときの各部のパラメータを
多重して音声符号化信号を生成する音声符号化装置に係
り、前記各手段のうち少なくとも1の手段において、相
関値を求めて所定の演算を行う際に、該相関値に対して
正規化処理を行ったのち所定の演算を行う構成になされ
ていて、前記いずれか1の手段における前記正規化処理
が、前記求められた相関値を、他のいずれか1の手段に
おいて求められた正規化制御量だけシフトすることによ
って行われ、かつ、前記正規化制御量は、入力音声信号
の自己相関係数を第1の所定ビット数精度で計算して得
られたビット数が第2の所定ビット数より大きいとき
は、当該計算して得られたビット数を第2の所定ビット
数に正規化するための第1のシフト量と、該第1のシフ
ト量によって入力音声信号をスケーリングして前記第1
の所定ビット数精度で自己相関係数を計算して再び得ら
れたビット数を前記第2の所定ビット数に正規化するた
めの第2のシフト量との差のシフト量として求められる
一方、入力音声信号の自己相関係数を第1の所定ビット
数精度で計算して得られたビット数が前記第2の所定ビ
ット数より大きくないときは、当該計算して得られたビ
ット数を前記第2の所定ビット数に正規化するためのシ
フト量として求められる構成になされていることを特徴
としている。
【0012】また、請求項2記載の発明は、請求項1記
載の音声符号化装置に係り、前記正規化制御量が、前記
第1の手段において、入力音声信号の自己相関係数の計
算時に、該自己相関係数を所定ビット数に正規化するた
めのシフト量として求められるものであることを特徴と
している。
載の音声符号化装置に係り、前記正規化制御量が、前記
第1の手段において、入力音声信号の自己相関係数の計
算時に、該自己相関係数を所定ビット数に正規化するた
めのシフト量として求められるものであることを特徴と
している。
【0013】また、請求項3記載の発明は、請求項1又
は2記載の音声符号化装置に係り、前記正規化制御量
が、入力音声信号レベルに応じてその値を定められるも
のであることを特徴としている。
は2記載の音声符号化装置に係り、前記正規化制御量
が、入力音声信号レベルに応じてその値を定められるも
のであることを特徴としている。
【0014】請求項4記載の発明は、入力音声信号のス
ペクトル包絡を示すパラメータを線型予測によって求め
る第1のステップと、音声信号の概略ピッチ周期を計算
する第2のステップと、ターゲット信号によって前記概
略ピッチ周期の前後で微小部分を計算する第3のステッ
プと、マルチパルス音源とピッチ周期から前記再生音声
信号を生成するための利得を計算する第4のステップと
を少なくとも備え、入力音声信号と再生音声信号との誤
差が最小になるように前記各ステップにおいて制御を行
ったときの各ステップのパラメータを多重して音声符号
化信号を生成する音声符号化方法に係り、前記各ステッ
プのうち少なくともいずれか1のステップにおいて、相
関値を求めて所定の演算を行う際に、該相関値に対して
正規化処理を行ったのち所定の演算を行うと共に、前記
正規化処理を、前記求められた相関値を、他のいずれか
1の手段において求められた正規化制御量だけシフトす
ることによって行い、かつ、前記正規化制御量を、入力
音声信号の自己相関係数を第1の所定ビット数精度で計
算して得られたビット数が第2の所定ビット数より大き
いときは、当該計算して得られたビット数を第2の所定
ビット数に正規化するための第1のシフト量と、該第1
のシフト量によって入力音声信号をスケーリングして前
記第1の所定ビット数精度で自己相関係数を計算して再
び得られたビット数を前記第2の所定ビット数に正規化
するための第2のシフト量との差のシフト量として求め
る一方、入力音声信号の自己相関係数を第1の所定ビッ
ト数精度で計算して得られたビット数が前記第2の所定
ビット数より大きくないときは、当該計算して得られた
ビット数を前記第2の所定ビット数に正規化するための
シフト量として求めることを特徴している。
ペクトル包絡を示すパラメータを線型予測によって求め
る第1のステップと、音声信号の概略ピッチ周期を計算
する第2のステップと、ターゲット信号によって前記概
略ピッチ周期の前後で微小部分を計算する第3のステッ
プと、マルチパルス音源とピッチ周期から前記再生音声
信号を生成するための利得を計算する第4のステップと
を少なくとも備え、入力音声信号と再生音声信号との誤
差が最小になるように前記各ステップにおいて制御を行
ったときの各ステップのパラメータを多重して音声符号
化信号を生成する音声符号化方法に係り、前記各ステッ
プのうち少なくともいずれか1のステップにおいて、相
関値を求めて所定の演算を行う際に、該相関値に対して
正規化処理を行ったのち所定の演算を行うと共に、前記
正規化処理を、前記求められた相関値を、他のいずれか
1の手段において求められた正規化制御量だけシフトす
ることによって行い、かつ、前記正規化制御量を、入力
音声信号の自己相関係数を第1の所定ビット数精度で計
算して得られたビット数が第2の所定ビット数より大き
いときは、当該計算して得られたビット数を第2の所定
ビット数に正規化するための第1のシフト量と、該第1
のシフト量によって入力音声信号をスケーリングして前
記第1の所定ビット数精度で自己相関係数を計算して再
び得られたビット数を前記第2の所定ビット数に正規化
するための第2のシフト量との差のシフト量として求め
る一方、入力音声信号の自己相関係数を第1の所定ビッ
ト数精度で計算して得られたビット数が前記第2の所定
ビット数より大きくないときは、当該計算して得られた
ビット数を前記第2の所定ビット数に正規化するための
シフト量として求めることを特徴している。
【0015】請求項5記載の発明は、請求項4記載の音
声符号化方法に係り、前記正規化制御量を、前記第1の
ステップにおいて、入力音声信号の自己相関係数の計算
時に、該自己相関係数を所定ビット数に正規化するため
のシフト量として求めることを特徴としている。
声符号化方法に係り、前記正規化制御量を、前記第1の
ステップにおいて、入力音声信号の自己相関係数の計算
時に、該自己相関係数を所定ビット数に正規化するため
のシフト量として求めることを特徴としている。
【0016】また、請求項6記載の発明は、コンピュー
タ読み取り可能な記憶媒体に係り、コンピュータに、請
求項4記載の音声符号化方法を実行させる音声符号化プ
ログラムを記録していることを特徴としている。
タ読み取り可能な記憶媒体に係り、コンピュータに、請
求項4記載の音声符号化方法を実行させる音声符号化プ
ログラムを記録していることを特徴としている。
【0017】
【0018】
【0019】
【0020】
【0021】
【0022】
【0023】
【作用】この発明の構成では、相関値演算を行う場合
に、正規化を行うことによって、固定小数点演算時の精
度低下を防止する。例えば、ピッチ分析部/適応コード
ブック計算部において、重み付けされた音声信号sw
(n)に対して、式(1)によって評価値C(j) を
求め、
に、正規化を行うことによって、固定小数点演算時の精
度低下を防止する。例えば、ピッチ分析部/適応コード
ブック計算部において、重み付けされた音声信号sw
(n)に対して、式(1)によって評価値C(j) を
求め、
【0024】
【数1】
【0025】jを17〜144の範囲で変化させて、評
価値C(j) が最大になるjの値を求めて、ピッチ周
期を決定する。この際、評価値C(j) の最大値を探
索するために、 cWx2/cWc→(cWx/y)2/(cWc/y) (2) としても等価となる。また、固定小数点演算において
は、式(2)の演算は、式(3)のように、表現でき
る。 (cWx>>y)2/(cWc>>y) (3) ここで>>yは、所定ビット数にするためにyビットだ
け右シフトすることを示す。このようにした場合、音声
信号sw(n)のパワーが小さいときは、誤差が大きく
なるが、この発明では、LPC分析部において、シフト
量yが、音声信号sw(n)のパワーの大きさに比例し
て大きくなるようにする。従って、音声信号sw(n)
のパワーが小さいときは、シフト量yが0になるか又は
yだけ左シフトするので、誤差が大きくなることはな
い。
価値C(j) が最大になるjの値を求めて、ピッチ周
期を決定する。この際、評価値C(j) の最大値を探
索するために、 cWx2/cWc→(cWx/y)2/(cWc/y) (2) としても等価となる。また、固定小数点演算において
は、式(2)の演算は、式(3)のように、表現でき
る。 (cWx>>y)2/(cWc>>y) (3) ここで>>yは、所定ビット数にするためにyビットだ
け右シフトすることを示す。このようにした場合、音声
信号sw(n)のパワーが小さいときは、誤差が大きく
なるが、この発明では、LPC分析部において、シフト
量yが、音声信号sw(n)のパワーの大きさに比例し
て大きくなるようにする。従って、音声信号sw(n)
のパワーが小さいときは、シフト量yが0になるか又は
yだけ左シフトするので、誤差が大きくなることはな
い。
【0026】また、利得計算部では、ターゲット信号,
適応コードブック信号,マルチパルス信号のそれぞれの
相関値から、式(4)によって、評価値E(j)を求め
て、 E(j)=zp−a(j)・zsax−b(j)・fzscl+a(j)・b( j)・ fsalscl+a(j) 2・sasa+b(j) 2・fsclscl,( j=0〜63) (4) jを0〜63の範囲で変化させて、評価値E(j) が
最小になるjの値を求めて利得を決定する。この場合
も、式(5)のように、すべての項をyで割る(yだけ
シフトする)処理を行っても、誤差が大きくなることは
ない。 E(j)=(zp>>y)−a(j)・(zsax>>y)−b(j)・(fz scl>>y)+a(j)・b(j)・(fsalscl>>y)+a(j) 2・ sasa>>y)+b(j) 2(fsclscl>>y) (5)
適応コードブック信号,マルチパルス信号のそれぞれの
相関値から、式(4)によって、評価値E(j)を求め
て、 E(j)=zp−a(j)・zsax−b(j)・fzscl+a(j)・b( j)・ fsalscl+a(j) 2・sasa+b(j) 2・fsclscl,( j=0〜63) (4) jを0〜63の範囲で変化させて、評価値E(j) が
最小になるjの値を求めて利得を決定する。この場合
も、式(5)のように、すべての項をyで割る(yだけ
シフトする)処理を行っても、誤差が大きくなることは
ない。 E(j)=(zp>>y)−a(j)・(zsax>>y)−b(j)・(fz scl>>y)+a(j)・b(j)・(fsalscl>>y)+a(j) 2・ sasa>>y)+b(j) 2(fsclscl>>y) (5)
【0027】
【発明の実施の形態】以下、図面を参照して、この発明
の実施の形態について説明する。説明は、実施例を用い
て具体的に行う。図1は、この発明の一実施例の音声符
号化装置の構成を示すブロック図、図2は、LPC分析
部の動作を示すフローチャート、図3は、LPC分析部
における自己相関係数の計算と正規化制御量の検出の手
順を示すフローチャート、図4は、ピッチ分析部/適応
コードブック計算部におけるピッチ周期の計算手順を示
すフローチャート、図5は、利得計算部の動作を示すフ
ローチャート、また、図6は、利得計算部における各種
相関係数の計算手順を示すフローチャートである。この
例の音声符号化装置は、MPEG−4/狭帯域CELP
符号化装置の構成を例示し、図1に示すように、バッフ
ァメモリ1と、LPC(Linear Prediction Coefficien
ts)分析部2と、RMS(Root Mean Square)計算部3
と、ピッチ分析部4と、ターゲット信号生成部5と、適
応コードブック計算部6と、マルチパルス音源計算部7
と、利得計算部8と、駆動信号復元部9と、合成フィル
タ10と、マルチプレクサ11とから概略構成されてい
る。
の実施の形態について説明する。説明は、実施例を用い
て具体的に行う。図1は、この発明の一実施例の音声符
号化装置の構成を示すブロック図、図2は、LPC分析
部の動作を示すフローチャート、図3は、LPC分析部
における自己相関係数の計算と正規化制御量の検出の手
順を示すフローチャート、図4は、ピッチ分析部/適応
コードブック計算部におけるピッチ周期の計算手順を示
すフローチャート、図5は、利得計算部の動作を示すフ
ローチャート、また、図6は、利得計算部における各種
相関係数の計算手順を示すフローチャートである。この
例の音声符号化装置は、MPEG−4/狭帯域CELP
符号化装置の構成を例示し、図1に示すように、バッフ
ァメモリ1と、LPC(Linear Prediction Coefficien
ts)分析部2と、RMS(Root Mean Square)計算部3
と、ピッチ分析部4と、ターゲット信号生成部5と、適
応コードブック計算部6と、マルチパルス音源計算部7
と、利得計算部8と、駆動信号復元部9と、合成フィル
タ10と、マルチプレクサ11とから概略構成されてい
る。
【0028】バッファメモリ1は、入力音声信号を保持
してフレーム化して出力する。LPC分析部2は、入力
音声信号フレームのスペクトル包絡を示すスペクトルパ
ラメータを線型予測によって求める。RMS計算部3
は、符号化対象フレームの平均パワーを計算する。ピッ
チ分析部4は、バッファメモリ1の出力音声信号におけ
るピッチ周期を計算する。ターゲット信号生成部5は、
入力音声信号と再生音声信号との残差信号に聴感重み付
けを施してターゲット信号を生成する。適応コードブッ
ク計算部6は、ターゲット信号に対して、ピッチ分析部
4で求めた整数ピッチ周期の前後で、さらに分周ピッチ
周期を計算する。マルチパルス音源計算部7は、音源と
なる複数のパルスの位置と振幅を計算する。利得計算部
8は、ターゲット信号と、適応コードブック信号とマル
チパルス音源信号とに対する利得を計算する。駆動信号
復元部9は、適応コーブック信号と、マルチパルス音源
信号と、利得計算部で求められた利得とから、再生音声
信号を合成するための駆動信号を復元する。合成フィル
タ10は、駆動信号復元部9からの駆動信号によって再
生音声信号を合成する。マルチプレクサ11は、LPC
分析部2と、RMS計算部3と、ピッチ分析部4と、適
応コードブック計算部6と、マルチパルス音源計算部7
と、利得計算部8のそれぞれで得られたパラメータを多
重して符号化信号を出力する。
してフレーム化して出力する。LPC分析部2は、入力
音声信号フレームのスペクトル包絡を示すスペクトルパ
ラメータを線型予測によって求める。RMS計算部3
は、符号化対象フレームの平均パワーを計算する。ピッ
チ分析部4は、バッファメモリ1の出力音声信号におけ
るピッチ周期を計算する。ターゲット信号生成部5は、
入力音声信号と再生音声信号との残差信号に聴感重み付
けを施してターゲット信号を生成する。適応コードブッ
ク計算部6は、ターゲット信号に対して、ピッチ分析部
4で求めた整数ピッチ周期の前後で、さらに分周ピッチ
周期を計算する。マルチパルス音源計算部7は、音源と
なる複数のパルスの位置と振幅を計算する。利得計算部
8は、ターゲット信号と、適応コードブック信号とマル
チパルス音源信号とに対する利得を計算する。駆動信号
復元部9は、適応コーブック信号と、マルチパルス音源
信号と、利得計算部で求められた利得とから、再生音声
信号を合成するための駆動信号を復元する。合成フィル
タ10は、駆動信号復元部9からの駆動信号によって再
生音声信号を合成する。マルチプレクサ11は、LPC
分析部2と、RMS計算部3と、ピッチ分析部4と、適
応コードブック計算部6と、マルチパルス音源計算部7
と、利得計算部8のそれぞれで得られたパラメータを多
重して符号化信号を出力する。
【0029】次に、図1を参照して、この例の音声符号
化装置の動作を説明する。図示されない高域ろ波器を経
て、低周波成分を除去された、ディジタル化された音声
信号は、一旦、バッファメモリ1に蓄積されたのち、一
定サンプル数からなフレームごとに分割されて出力され
る。LPC分析部2では、フレームごとに、入力音声信
号に対して、LP(線形予測)分析を行って、10次ま
でのLPC係数を求めて、その値をマルチプレクサ11
へ送る。また、RMS計算部3では、フレームごとに、
入力音声信号の平均パワーを求めて、その値をマルチプ
レクサ11へ送る。さらにピッチ分析部4では、フレー
ムごとに、入力信号から聴感特性に基づいて重み付けを
行って聴感重み付け信号を生成し、ピッチ分析を行う。
ピッチ分析部4では、ピッチ周期(整数)と有音/無音
を判定し、ピッチ周期を適応コードブック計算部6へ送
り、有音/無音情報をマルチプレクサ11へ送る。
化装置の動作を説明する。図示されない高域ろ波器を経
て、低周波成分を除去された、ディジタル化された音声
信号は、一旦、バッファメモリ1に蓄積されたのち、一
定サンプル数からなフレームごとに分割されて出力され
る。LPC分析部2では、フレームごとに、入力音声信
号に対して、LP(線形予測)分析を行って、10次ま
でのLPC係数を求めて、その値をマルチプレクサ11
へ送る。また、RMS計算部3では、フレームごとに、
入力音声信号の平均パワーを求めて、その値をマルチプ
レクサ11へ送る。さらにピッチ分析部4では、フレー
ムごとに、入力信号から聴感特性に基づいて重み付けを
行って聴感重み付け信号を生成し、ピッチ分析を行う。
ピッチ分析部4では、ピッチ周期(整数)と有音/無音
を判定し、ピッチ周期を適応コードブック計算部6へ送
り、有音/無音情報をマルチプレクサ11へ送る。
【0030】一方、ターゲット信号生成部5では、重み
付け合成フィルタの零入力応答を重み付け音声信号から
減じた信号であるターゲット信号を生成して出力する。
すなわち、ターゲット信号生成部内に、合成フィルタと
重み付けフィルタとを有し、合成フィルタの入力として
零(無入力)を入れることによって生成された信号を、
聴感重み付けフィルタに入れることによって生成された
信号を、バッファメモリ1の出力信号を重み付けフィル
タに入れて得た信号から減算して、ターゲット信号を生
成する。このターゲット信号に対して、適応コードブッ
ク計算部6では、ターゲット信号との相関が最も強い、
過去において再生した励振信号(適応コードブック信
号)を適応的に探索することによって、ピッチ分析部4
で求めた整数ピッチ周期の前後で、さらに詳細な分数ピ
ッチ周期を計算する。そして、マルチパルス音源計算部
7では、ターゲット信号と適応コードブック信号との残
差信号を求め、この残差信号に対して歪みが最小になる
パルス位置と振幅を求めて得られた複数のパルスからな
るパルス列(マルチパルス)を、マルチパルス音源信号
として出力する。
付け合成フィルタの零入力応答を重み付け音声信号から
減じた信号であるターゲット信号を生成して出力する。
すなわち、ターゲット信号生成部内に、合成フィルタと
重み付けフィルタとを有し、合成フィルタの入力として
零(無入力)を入れることによって生成された信号を、
聴感重み付けフィルタに入れることによって生成された
信号を、バッファメモリ1の出力信号を重み付けフィル
タに入れて得た信号から減算して、ターゲット信号を生
成する。このターゲット信号に対して、適応コードブッ
ク計算部6では、ターゲット信号との相関が最も強い、
過去において再生した励振信号(適応コードブック信
号)を適応的に探索することによって、ピッチ分析部4
で求めた整数ピッチ周期の前後で、さらに詳細な分数ピ
ッチ周期を計算する。そして、マルチパルス音源計算部
7では、ターゲット信号と適応コードブック信号との残
差信号を求め、この残差信号に対して歪みが最小になる
パルス位置と振幅を求めて得られた複数のパルスからな
るパルス列(マルチパルス)を、マルチパルス音源信号
として出力する。
【0031】利得計算部8では、ターゲット信号と適応
コードブック信号とマルチパルス音源信号とに対して、
減算器12における誤差パワーが最小になるように利得
を計算する。駆動信号復元部9では、適応コードブック
信号とマルチパルス音源信号とに対して、利得計算部8
で求められた利得を適用して、合成フィルタ10を駆動
するための駆動信号を生成し、これによって、合成フィ
ルタ10において再生音声信号を生成して、減算器12
に出力する。このような制御が繰り返し行われて、入力
音声信号と再生音声信号との誤差(歪み)が最小になっ
たとき、LPC分析部2と、RMS計算部3と、ピッチ
分析部4と、適応コードブック計算部6と、マルチパル
ス音源計算部7と、利得計算部8とにおいて求められた
それぞれのパラメータを、マルチプレクサ11において
多重し符号化することによって、入力音声信号に対応す
るCELP符号化信号を出力する。
コードブック信号とマルチパルス音源信号とに対して、
減算器12における誤差パワーが最小になるように利得
を計算する。駆動信号復元部9では、適応コードブック
信号とマルチパルス音源信号とに対して、利得計算部8
で求められた利得を適用して、合成フィルタ10を駆動
するための駆動信号を生成し、これによって、合成フィ
ルタ10において再生音声信号を生成して、減算器12
に出力する。このような制御が繰り返し行われて、入力
音声信号と再生音声信号との誤差(歪み)が最小になっ
たとき、LPC分析部2と、RMS計算部3と、ピッチ
分析部4と、適応コードブック計算部6と、マルチパル
ス音源計算部7と、利得計算部8とにおいて求められた
それぞれのパラメータを、マルチプレクサ11において
多重し符号化することによって、入力音声信号に対応す
るCELP符号化信号を出力する。
【0032】このような符号化の過程において、図1に
示す、LPC分析部2,ピッチ分析部4,コードブック
計算部6,利得計算部8等においては、それぞれの演算
処理中において、固定小数点演算によって相関計算が行
われるが、この際、計算結果の正規化を行うことによっ
て、限られたビット数で、精度のよい演算を行うことが
できるようにしている。以下においては、各部における
演算の概要と、その際における、相関演算の正規化の方
法とについて説明する。
示す、LPC分析部2,ピッチ分析部4,コードブック
計算部6,利得計算部8等においては、それぞれの演算
処理中において、固定小数点演算によって相関計算が行
われるが、この際、計算結果の正規化を行うことによっ
て、限られたビット数で、精度のよい演算を行うことが
できるようにしている。以下においては、各部における
演算の概要と、その際における、相関演算の正規化の方
法とについて説明する。
【0033】まず、図2を用いて、LPC分析部の動作
を説明する。LPC分析部21においては、入力音声信
号s(n)(nはフレーム中のサンプル番号。以下同
様)のフレーム化時における高調波成分の発生を防止す
るために、適当な窓関数を乗算する窓かけ処理を行う
(ステップS1)。窓処理としては、例えばハミング窓
とコサイン関数周期の窓かけとが行われる。次に、窓か
けが行われた音声信号に対して、自己相関計算が行われ
て、正規化された自己相関係数r'(k)が求められる
(ステップS2)。自己相関係数は、式(6)によって
計算される。
を説明する。LPC分析部21においては、入力音声信
号s(n)(nはフレーム中のサンプル番号。以下同
様)のフレーム化時における高調波成分の発生を防止す
るために、適当な窓関数を乗算する窓かけ処理を行う
(ステップS1)。窓処理としては、例えばハミング窓
とコサイン関数周期の窓かけとが行われる。次に、窓か
けが行われた音声信号に対して、自己相関計算が行われ
て、正規化された自己相関係数r'(k)が求められる
(ステップS2)。自己相関係数は、式(6)によって
計算される。
【0034】
【数2】
【0035】ここで、k=0,…,10は自己相関の次数
である。このとき、自己相関計算結果r(k)を所定ビ
ット数に正規化するための正規化制御量λが決定される
とともに、この正規化制御量λを適用することによっ
て、正規化された自己相関係数r'(k)が求められる。
次に、正規化された自己相関係数r'(k)に対して、レ
ビンソン・ダービンアルゴリズムによる再帰演算を行う
ことによって(ステップS3)、LPC係数αが求めら
れる。
である。このとき、自己相関計算結果r(k)を所定ビ
ット数に正規化するための正規化制御量λが決定される
とともに、この正規化制御量λを適用することによっ
て、正規化された自己相関係数r'(k)が求められる。
次に、正規化された自己相関係数r'(k)に対して、レ
ビンソン・ダービンアルゴリズムによる再帰演算を行う
ことによって(ステップS3)、LPC係数αが求めら
れる。
【0036】次に、図3を用いて、自己相関係数と正規
化制御量λを求める際の手順を詳細に説明する。図3
(a)に示すフローチャートにおいて、前述のように、
窓かけされた音声信号s'(n)に対して、40ビット精
度で0次の自己相関係数r(0)を計算する(ステップ
Q1)。 r(0)=s'(n)*s'(n) (7) 自己相関係数r(0)は、式(7)に示すように、音声
信号s'(n)どうしの畳み込み演算("*”は畳み込み
演算を表す。以下、同様)によって求められる。そし
て、r(0)>231であったときは(ステップQ
2)、次のようにして、正規化制御量λ1を求める。4
0ビットから32ビットへの正規化制御量を求めるため
に、まず、r(0)を16ビットだけ右シフトする(ス
テップQ3)。これは、演算装置が、32ビット以下の
値しか扱うことができないためである。
化制御量λを求める際の手順を詳細に説明する。図3
(a)に示すフローチャートにおいて、前述のように、
窓かけされた音声信号s'(n)に対して、40ビット精
度で0次の自己相関係数r(0)を計算する(ステップ
Q1)。 r(0)=s'(n)*s'(n) (7) 自己相関係数r(0)は、式(7)に示すように、音声
信号s'(n)どうしの畳み込み演算("*”は畳み込み
演算を表す。以下、同様)によって求められる。そし
て、r(0)>231であったときは(ステップQ
2)、次のようにして、正規化制御量λ1を求める。4
0ビットから32ビットへの正規化制御量を求めるため
に、まず、r(0)を16ビットだけ右シフトする(ス
テップQ3)。これは、演算装置が、32ビット以下の
値しか扱うことができないためである。
【0037】次に、以下のようにして、32ビットへの
正規化制御量を計算する(ステップQ4)。まず、式
(8)によって32ビットへの第1の正規化制御量λ1
を求める。 λ1=exp(r(0)) (8) ここで、exp(r(0))関数の演算は、図3(b)
に示すように、32ビットへの正規化制御量を求める演
算であり、λ1は、32ビットへの正規化制御量を表し
ている。そして、r(0)のオーバーフロー量(32ビッ
トに収まらないビット数)を計算するため、第1の正規
化制御量λ1として、式(9)に示す値を用いる。 λ1=15−λ1 (9) 次に、式(10)によって、正規化制御量λ1を2ビッ
トだけ右シフトする。r(0)は、畳み込み演算によっ
て、信号s'(n)を2乗して求めているので、r(0)を
1/4にする(2ビット右シフト)するためには、信号
s'(n)を1/2にする必要がある。 λ1=λ1>>2 (10) また、式(11)によって、正規化制御量λ1を2ビッ
トだけ左シフトする。演算量の増加を抑えるために、信
号s'(n)のスケーリング量を"2”刻みにするが、そ
のためには、λ1を4で除算してその商を用いて上記式
を実行すると、λ1は2の倍数となる。 λ1=2<<λ1 (11)
正規化制御量を計算する(ステップQ4)。まず、式
(8)によって32ビットへの第1の正規化制御量λ1
を求める。 λ1=exp(r(0)) (8) ここで、exp(r(0))関数の演算は、図3(b)
に示すように、32ビットへの正規化制御量を求める演
算であり、λ1は、32ビットへの正規化制御量を表し
ている。そして、r(0)のオーバーフロー量(32ビッ
トに収まらないビット数)を計算するため、第1の正規
化制御量λ1として、式(9)に示す値を用いる。 λ1=15−λ1 (9) 次に、式(10)によって、正規化制御量λ1を2ビッ
トだけ右シフトする。r(0)は、畳み込み演算によっ
て、信号s'(n)を2乗して求めているので、r(0)を
1/4にする(2ビット右シフト)するためには、信号
s'(n)を1/2にする必要がある。 λ1=λ1>>2 (10) また、式(11)によって、正規化制御量λ1を2ビッ
トだけ左シフトする。演算量の増加を抑えるために、信
号s'(n)のスケーリング量を"2”刻みにするが、そ
のためには、λ1を4で除算してその商を用いて上記式
を実行すると、λ1は2の倍数となる。 λ1=2<<λ1 (11)
【0038】このようにして、正規化制御量λ1が求め
られたとき、信号s'(n)のスケーリングを、式(1
2)のようにして行う(ステップQ5)。 s'(n)=s'(n)>>λ1 (12) このような演算を信号s'(n)について、繰り返して実
行して、r(0)が32ビット以下になるようにする。
られたとき、信号s'(n)のスケーリングを、式(1
2)のようにして行う(ステップQ5)。 s'(n)=s'(n)>>λ1 (12) このような演算を信号s'(n)について、繰り返して実
行して、r(0)が32ビット以下になるようにする。
【0039】一方、r(0)>231でないときは(ス
テップQ2)、式(13)によって、32ビットへの第
2の正規化制御量λ2を求める。 λ2=exp(r(0)) (13) そして、r(0)を正規化制御量λ2によって、32ビ
ットへ正規化する。式(14)は、r(0)を正規化制
御量λ2ビットだけ左シフトすることによって、32ビ
ットに正規化されることを示している。 r'(0)=r(0)<<λ2 (14)
テップQ2)、式(13)によって、32ビットへの第
2の正規化制御量λ2を求める。 λ2=exp(r(0)) (13) そして、r(0)を正規化制御量λ2によって、32ビ
ットへ正規化する。式(14)は、r(0)を正規化制
御量λ2ビットだけ左シフトすることによって、32ビ
ットに正規化されることを示している。 r'(0)=r(0)<<λ2 (14)
【0040】このようにして求められた、正規化制御量
λ1とλ2とによって、以後の演算に用いる正規化制御
量λを決定する(ステップQ8)。 λ=λ1−λ2 (15) これは、正規化制御量λ1を適用したために、スケーリ
ングが過剰になった分を、正規化制御量λ2によって補
償することによって、r'(0)を正しく32ビットに正
規化できることを示している。もしも、始めからr
(0)>231でないときは、制御制御量λは−λ2と
なるので、単純に左シフトのみによって、32ビットに
正規化された自己相関係数r'(0)が求められる。
λ1とλ2とによって、以後の演算に用いる正規化制御
量λを決定する(ステップQ8)。 λ=λ1−λ2 (15) これは、正規化制御量λ1を適用したために、スケーリ
ングが過剰になった分を、正規化制御量λ2によって補
償することによって、r'(0)を正しく32ビットに正
規化できることを示している。もしも、始めからr
(0)>231でないときは、制御制御量λは−λ2と
なるので、単純に左シフトのみによって、32ビットに
正規化された自己相関係数r'(0)が求められる。
【0041】正規化制御量が決定されたことによって、
以後、i=1,…,10についてループすることによって
(ステップQ9)、1次から10次までの自己相関係数
r'(0)〜r'(10)を求める。まず、式(16)のよう
に、40ビット精度で自己相関係数r(i)を計算する
(ステップQ10)。 r(i)=s'(n)*s'(n+i) (16) 次に、式(17)によって、自己相関係数r(i)を正
規化制御量λ2を用いて、32ビットへ正規化する(ス
テップQ11)。 r'(i)=r(i)<<λ2 (17) ここで正規化制御量としてλ2を用いるのは、一般に0
次の自己相関係数r(0)の値は最大であって、1次〜
10次の自己相関関数r(1)〜r(10)の値は、こ
れより小さい。一方、r(0)について32ビット以下
になるようにスケーリングを行っているので、この場
合、1次〜10次の自己相関係数r(i)は32ビット
以下になるためである。i=1,…,10について、ルー
プを終了したとき、自己相関係数r'(0)〜r'(10)が
求められる(ステップQ12)。
以後、i=1,…,10についてループすることによって
(ステップQ9)、1次から10次までの自己相関係数
r'(0)〜r'(10)を求める。まず、式(16)のよう
に、40ビット精度で自己相関係数r(i)を計算する
(ステップQ10)。 r(i)=s'(n)*s'(n+i) (16) 次に、式(17)によって、自己相関係数r(i)を正
規化制御量λ2を用いて、32ビットへ正規化する(ス
テップQ11)。 r'(i)=r(i)<<λ2 (17) ここで正規化制御量としてλ2を用いるのは、一般に0
次の自己相関係数r(0)の値は最大であって、1次〜
10次の自己相関関数r(1)〜r(10)の値は、こ
れより小さい。一方、r(0)について32ビット以下
になるようにスケーリングを行っているので、この場
合、1次〜10次の自己相関係数r(i)は32ビット
以下になるためである。i=1,…,10について、ルー
プを終了したとき、自己相関係数r'(0)〜r'(10)が
求められる(ステップQ12)。
【0042】次に、図4を用いて、ピッチ分析部/適応
コードブック計算部におけるピッチ周期の計算手順を説
明する。ピッチ分析部4においては、バッファメモリ1
から出力された音声信号s(n)に対して、聴感特性に
基づく聴感重み付けを行って重み付け音声信号sw
(n)を生成し、この重み付け信号からピッチ周期la
g(整数部)を計算する。また適応コードブック計算部
6においては、ターゲット信号生成部5において生成さ
れた、聴感特性に基づく聴感重み付けを行ったターゲッ
ト信号から、ピッチ周期lag(分数部)を計算する。
コードブック計算部におけるピッチ周期の計算手順を説
明する。ピッチ分析部4においては、バッファメモリ1
から出力された音声信号s(n)に対して、聴感特性に
基づく聴感重み付けを行って重み付け音声信号sw
(n)を生成し、この重み付け信号からピッチ周期la
g(整数部)を計算する。また適応コードブック計算部
6においては、ターゲット信号生成部5において生成さ
れた、聴感特性に基づく聴感重み付けを行ったターゲッ
ト信号から、ピッチ周期lag(分数部)を計算する。
【0043】ピッチ分析部4及び適応コードブック計算
部6におけるピッチ周期の計算は、図4に示すようにし
て行われる。まず、重み付けされた音声信号sw(n)
に対して、40ビット精度で、自己相関係数cWc、相
互相関係数cWxと、自己相関係数と相互相関係数との
相関値すなわち歪み量を表す評価値とを計算する(ステ
ップR1)。自己相関係数、相互相関係数、評価値は、
前述の(1)式によって、重み付けされた音声信号sw
(n)から計算される。ここで、nはフレーム中のサン
プル番号を示し、i=17,…,144は、探索する位置
(信号周期)を示している。
部6におけるピッチ周期の計算は、図4に示すようにし
て行われる。まず、重み付けされた音声信号sw(n)
に対して、40ビット精度で、自己相関係数cWc、相
互相関係数cWxと、自己相関係数と相互相関係数との
相関値すなわち歪み量を表す評価値とを計算する(ステ
ップR1)。自己相関係数、相互相関係数、評価値は、
前述の(1)式によって、重み付けされた音声信号sw
(n)から計算される。ここで、nはフレーム中のサン
プル番号を示し、i=17,…,144は、探索する位置
(信号周期)を示している。
【0044】次に、LPC分析部2において求められた
正規化制御量λを用いて、式(18),(19)によっ
て、自己相関係数cWc及び相互相関係数cWxを正規
化して、正規化された自己相関係数cWc'、相互相関
係数cWx'を求める(ステップR2)。 cWc'=cWc>>λ (18) cWx'=cWx>>λ (19) このような自己相関係数cWc'、相互相関係数cWx'
について、すべてのiの範囲で評価値を計算し、評価値
が最も大きくなるiの値を求めて、このiに対応する周
期をピッチ周期lagとする。
正規化制御量λを用いて、式(18),(19)によっ
て、自己相関係数cWc及び相互相関係数cWxを正規
化して、正規化された自己相関係数cWc'、相互相関
係数cWx'を求める(ステップR2)。 cWc'=cWc>>λ (18) cWx'=cWx>>λ (19) このような自己相関係数cWc'、相互相関係数cWx'
について、すべてのiの範囲で評価値を計算し、評価値
が最も大きくなるiの値を求めて、このiに対応する周
期をピッチ周期lagとする。
【0045】次に、図5を用いて、利得計算部における
動作を説明する。利得計算部22においては、ターゲッ
ト信号生成部5からのターゲット信号z(n)と、適応
コードブック計算部6からの適応コードブック信号fs
al(n)と、マルチパルス音源計算部7からのマルチ
パルス音源信号fscl(n)とから、声道の形状に基
づく、声道各部の反射係数を計算する(ステップU
1)。次に、ターゲット信号fz(n)とマルチパルス
音源信号fscl(n)の相互相関値と、適応コードブ
ック信号fsal(n)とマルチパルス音源信号fsc
l(n)の相互相関値と、マルチパルス音源信号fsc
l(n)の自己相関値とを計算する(ステップU2)。
動作を説明する。利得計算部22においては、ターゲッ
ト信号生成部5からのターゲット信号z(n)と、適応
コードブック計算部6からの適応コードブック信号fs
al(n)と、マルチパルス音源計算部7からのマルチ
パルス音源信号fscl(n)とから、声道の形状に基
づく、声道各部の反射係数を計算する(ステップU
1)。次に、ターゲット信号fz(n)とマルチパルス
音源信号fscl(n)の相互相関値と、適応コードブ
ック信号fsal(n)とマルチパルス音源信号fsc
l(n)の相互相関値と、マルチパルス音源信号fsc
l(n)の自己相関値とを計算する(ステップU2)。
【0046】次に、利得計算を行う(ステップU3)。
利得計算は、式(20)によって評価値E(j) を求
める。 E(j)=zp−a(j)・zsax−b(j)・fzscl+a(j)・b( j)・ fsalscl+a(j) 2・sasa+b(j) 2・fsclscl,( j=0〜63) (20) ここで、zpはターゲット信号z(n)の自己相関値、
zsaxはターゲット信号z(n)と適応コードブック
信号fsal(n)との相互相関値、fzsclは、タ
ーゲット信号z(n)とマルチパルス音源信号fscl
(n)の相互相関値、fsalsclは適応コードブッ
ク信号fsal(n)とマルチパルス音源信号fscl
(n)の相互相関値、sasaは適応コードブック信号
fsal(n)の自己相関値、fsclsclはマルチ
パルス音源信号fscl(n)の自己相関値である。a
(j),b(j)は係数であって、利得を表すテーブル
中の値を指している。利得計算は、式(20)におい
て、係数a(j),b(j)を、j=0〜63の範囲で
変化させて歪みを表す評価値E(j)が最小になるとき
のa(j),b(j)の組み合わせを求めて、このとき
のa(j),b(j)によって定まる利得を、所望の利
得値とする。
利得計算は、式(20)によって評価値E(j) を求
める。 E(j)=zp−a(j)・zsax−b(j)・fzscl+a(j)・b( j)・ fsalscl+a(j) 2・sasa+b(j) 2・fsclscl,( j=0〜63) (20) ここで、zpはターゲット信号z(n)の自己相関値、
zsaxはターゲット信号z(n)と適応コードブック
信号fsal(n)との相互相関値、fzsclは、タ
ーゲット信号z(n)とマルチパルス音源信号fscl
(n)の相互相関値、fsalsclは適応コードブッ
ク信号fsal(n)とマルチパルス音源信号fscl
(n)の相互相関値、sasaは適応コードブック信号
fsal(n)の自己相関値、fsclsclはマルチ
パルス音源信号fscl(n)の自己相関値である。a
(j),b(j)は係数であって、利得を表すテーブル
中の値を指している。利得計算は、式(20)におい
て、係数a(j),b(j)を、j=0〜63の範囲で
変化させて歪みを表す評価値E(j)が最小になるとき
のa(j),b(j)の組み合わせを求めて、このとき
のa(j),b(j)によって定まる利得を、所望の利
得値とする。
【0047】次に、図6を用いて、利得計算時におけ
る、各相関値の計算手順について説明する。ターゲット
信号z(n)と、適応コードブック信号fsal(n)
と、マルチパルス音源信号fscl(n)とから、式
(21)によって、40ビット精度で、ターゲット信号
z(n)とマルチパルス音源信号fscl(n)の相互
相関値を計算し、式(22)によって、40ビット精度
で、適応コードブック信号fsal(n)とマルチパル
ス音源信号fscl(n)の相互相関値を計算し、式
(23)によって、40ビット精度で、マルチパルス音
源信号fscl(n)の自己相関値とを計算する(ステ
ップV1)。 fzscl=z(n)*fscl(n) (21) fsalscl=fsal(n)*fscl(n) (22) fsclscl=fscl(n)*fscl(n) (23)
る、各相関値の計算手順について説明する。ターゲット
信号z(n)と、適応コードブック信号fsal(n)
と、マルチパルス音源信号fscl(n)とから、式
(21)によって、40ビット精度で、ターゲット信号
z(n)とマルチパルス音源信号fscl(n)の相互
相関値を計算し、式(22)によって、40ビット精度
で、適応コードブック信号fsal(n)とマルチパル
ス音源信号fscl(n)の相互相関値を計算し、式
(23)によって、40ビット精度で、マルチパルス音
源信号fscl(n)の自己相関値とを計算する(ステ
ップV1)。 fzscl=z(n)*fscl(n) (21) fsalscl=fsal(n)*fscl(n) (22) fsclscl=fscl(n)*fscl(n) (23)
【0048】次に、LPC分析部2で求められた正規化
制御量λによって、各相関値を32ビットに正規化する
(式(24)〜(26)、ステップV2)。 fzscl=fzscl>>λ (24) fsalscl=fsalscl>>λ (25) fsclscl=fsclscl>>λ (26)
制御量λによって、各相関値を32ビットに正規化する
(式(24)〜(26)、ステップV2)。 fzscl=fzscl>>λ (24) fsalscl=fsalscl>>λ (25) fsclscl=fsclscl>>λ (26)
【0049】このようにして正規化された各相関値を用
いたとき、式(20)に示された評価値E(j)は、式
(27)で与えられる。 E(j)=(zp>>λ)−a(j)・(zsax>>λ)−b(j)・(fz scl>>λ)+a(j)・b(j)・(fsalscl>>λ)+a(j) 2・ (sasa>>λ)+b(j) 2・(fsclscl>>λ),(j=0〜63 ) (27) これによって、固定小数点演算によって、利得計算を行
うことができる。
いたとき、式(20)に示された評価値E(j)は、式
(27)で与えられる。 E(j)=(zp>>λ)−a(j)・(zsax>>λ)−b(j)・(fz scl>>λ)+a(j)・b(j)・(fsalscl>>λ)+a(j) 2・ (sasa>>λ)+b(j) 2・(fsclscl>>λ),(j=0〜63 ) (27) これによって、固定小数点演算によって、利得計算を行
うことができる。
【0050】このように、この例の音声符号化装置で
は、符号化の初期において、LPC分析部において求め
られた正規化制御量を用いて、LPC分析部と、ピッチ
分析部及び適応コードブック計算部と、利得計算部とに
おける相関関数計算時に、求められた相関値を演算装置
のビット数に正規化して計算をを行うので、固定小数点
演算を行っても、演算精度の低下が少なくなるので、符
号化に伴う音質の低下が少ない。かつこの際の正規化制
御量は、入力音声信号のパワーの大小に応じて定められ
るので、正規化に伴う計算誤差は、入力音声信号のパワ
ーが小さい程小さくなり、従って、入力音声信号のレベ
ルが低い状態での音質劣化を少なくすることができる。
は、符号化の初期において、LPC分析部において求め
られた正規化制御量を用いて、LPC分析部と、ピッチ
分析部及び適応コードブック計算部と、利得計算部とに
おける相関関数計算時に、求められた相関値を演算装置
のビット数に正規化して計算をを行うので、固定小数点
演算を行っても、演算精度の低下が少なくなるので、符
号化に伴う音質の低下が少ない。かつこの際の正規化制
御量は、入力音声信号のパワーの大小に応じて定められ
るので、正規化に伴う計算誤差は、入力音声信号のパワ
ーが小さい程小さくなり、従って、入力音声信号のレベ
ルが低い状態での音質劣化を少なくすることができる。
【0051】以上、この発明の実施例を図面により詳述
してきたが、具体的な構成はこの実施例に限られたもの
ではなく、この発明の要旨を逸脱しない範囲の設計の変
更等があってもこの発明に含まれる。例えば、この発明
は、ハードウェア構成によって実現する場合に限らず、
ソフトウェアによって実現することもできる。この場
は、ハードウェア構成として、中央処理装置(CPU)
やディジタルシグナルプロセッサ(DSP)等の処理装
置と、CPU等とバスを介して接続された、プログラム
やデータを蓄積するための大容量の低速メモリと、CP
U等の作業領域となる高速メモリと、外部接続とデータ
の授受のための入力装置及び出力装置等を有する周知の
システムを備え、これにこの発明の方法を実行するため
のプログラムを装備することによって容易に実現され
る。さらに、このようなプログラムを、処理装置が読み
取り可能な、任意の形式の媒体に記録した状態で予め用
意することによって、同様なシステムを具備する場合
に、同一の方法を普遍的に実現することができる。
してきたが、具体的な構成はこの実施例に限られたもの
ではなく、この発明の要旨を逸脱しない範囲の設計の変
更等があってもこの発明に含まれる。例えば、この発明
は、ハードウェア構成によって実現する場合に限らず、
ソフトウェアによって実現することもできる。この場
は、ハードウェア構成として、中央処理装置(CPU)
やディジタルシグナルプロセッサ(DSP)等の処理装
置と、CPU等とバスを介して接続された、プログラム
やデータを蓄積するための大容量の低速メモリと、CP
U等の作業領域となる高速メモリと、外部接続とデータ
の授受のための入力装置及び出力装置等を有する周知の
システムを備え、これにこの発明の方法を実行するため
のプログラムを装備することによって容易に実現され
る。さらに、このようなプログラムを、処理装置が読み
取り可能な、任意の形式の媒体に記録した状態で予め用
意することによって、同様なシステムを具備する場合
に、同一の方法を普遍的に実現することができる。
【0052】
【発明の効果】以上説明したように、この発明の音声符
号化装置によれば、LPC分析部で得られた自己相関係
数の正規化制御量を用いて、ピッチ分析部,適応コード
ブック計算部,利得計算部等における相関値計算,歪み
計算等における正規化量の制御を行うので、音声符号化
処理のための演算量を減少させることができ、従って、
従来よりも低い動作周波数で装置を動作させることがで
きるので、装置を安価に構成できるとともに、消費電力
の低下を図ることができる。さらにこの発明によれば、
固定少数点演算装置を使用可能になるとともに、スケー
リング,飽和演算が不要になるので、固定小数点演算に
よる演算精度不足に基づく音質劣化を改善できるととも
に、入力音声信号のレベル変化に対して、均一の符号化
品質を得ることができる。
号化装置によれば、LPC分析部で得られた自己相関係
数の正規化制御量を用いて、ピッチ分析部,適応コード
ブック計算部,利得計算部等における相関値計算,歪み
計算等における正規化量の制御を行うので、音声符号化
処理のための演算量を減少させることができ、従って、
従来よりも低い動作周波数で装置を動作させることがで
きるので、装置を安価に構成できるとともに、消費電力
の低下を図ることができる。さらにこの発明によれば、
固定少数点演算装置を使用可能になるとともに、スケー
リング,飽和演算が不要になるので、固定小数点演算に
よる演算精度不足に基づく音質劣化を改善できるととも
に、入力音声信号のレベル変化に対して、均一の符号化
品質を得ることができる。
【図1】この発明の一実施例の音声符号化装置の構成を
示すブロック図である。
示すブロック図である。
【図2】LPC分析部の動作を示すフローチャートであ
る。
る。
【図3】LPC分析部における自己相関係数の計算と正
規化制御量の検出の手順を示すフローチャートである。
規化制御量の検出の手順を示すフローチャートである。
【図4】ピッチ分析部/適応コードブック計算部におけ
るピッチ周期の計算手順を示すフローチャートである。
るピッチ周期の計算手順を示すフローチャートである。
【図5】利得計算部の動作を示すフローチャートであ
る。
る。
【図6】利得計算部における各種相関係数の計算手順を
示すフローチャートである。
示すフローチャートである。
【図7】CELP方式の音声符号化装置の基本的な構成
を示す図である。
を示す図である。
【図8】固定小数点演算の特性を説明するための図であ
る。
る。
2 LPC分析部(第1の手段)
3 RMS計算部
4 ピッチ分析部(第2の手段)
5 ターゲット信号生成部
6 適応コードブック計算部(第3の手段)
7 マルチパルス音源計算部
8 利得計算部(第4の手段)
─────────────────────────────────────────────────────
フロントページの続き
(58)調査した分野(Int.Cl.7,DB名)
G10L 19/10
G10L 19/12
Claims (6)
- 【請求項1】入力音声信号のスペクトル包絡を示すパラ
メータを線型予測によって求める第1の手段と、音声信
号の概略ピッチ周期を計算する第2の手段と、ターゲッ
ト信号によって前記概略ピッチ周期の前後で微小部分を
計算する第3の手段と、マルチパルス音源とピッチ周期
から前記再生音声信号を生成するための利得を計算する
第4の手段とを少なくとも備え、入力音声信号と再生音
声信号との誤差が最小になるように前記各手段において
制御を行ったときの各部のパラメータを多重して音声符
号化信号を生成する音声符号化装置であって、 前記各手段のうち少なくとも1の手段において、相関値
を求めて所定の演算を行う際に、該相関値に対して正規
化処理を行ったのち所定の演算を行う構成になされてい
て、前記いずれか1の手段における前記正規化処理が、前記
求められた相関値を、他のいずれか1の手段において求
められた正規化制御量だけシフトすることによって行わ
れ、かつ、 前記正規化制御量は、 入力音声信号の自己相関係数を第1の所定ビット数精度
で計算して得られたビット数が第2の所定ビット数より
大きいときは、当該計算して得られたビット数を第2の
所定ビット数に正規化するための第1のシフト量と、該
第1のシフト量によって入力音声信号をスケーリングし
て前記第1の所定ビット数精度で自己相関係数を計算し
て再び得られたビット数を前記第2の所定ビット数に正
規化するための第2のシフト量との差のシフト量として
求められる一方、 入力音声信号の自己相関係数を第1の所定ビット数精度
で計算して得られたビット数が前記第2の所定ビット数
より大きくないときは、当該計算して得られたビット数
を前記第2の所定ビット数に正規化するためのシフト量
として求められる構成になされていることを 特徴とする
音声符号化装置。 - 【請求項2】前記正規化制御量が、前記第1の手段にお
いて、入力音声信号の自己相関係数の計算時に、該自己
相関係数を所定ビット数に正規化するためのシフト量と
して求められるものであることを特徴とする請求項1記
載の音声符号化装置。 - 【請求項3】前記正規化制御量が、入力音声信号レベル
に応じてその値を定められるものであることを特徴とす
る請求項1又は2記載の音声符号化装置。 - 【請求項4】 入力音声信号のスペクトル包絡を示すパ
ラメータを線型予測によって求める第1のステップと、
音声信号の概略ピッチ周期を計算する第2のステップ
と、ターゲット信号によって前記概略ピッチ周期の前後
で微小部分を計算する第3のステップと、マルチパルス
音源とピッチ周期から前記再生音声信号を生成するため
の利得を計算する第4のステップとを少なくとも備え、
入力音声信号と再生音声信号との誤差が最小になるよう
に前記各ステップにおいて制御を行ったときの各ステッ
プのパラメータを多重して音声符号化信号を生成する音
声符号化方法であって、前記各ステップのうち少なくともいずれか1のステップ
において、相関値を求めて所定の演算を行う際に、該相
関値に対して正規化処理を行ったのち所定の演算を行う
と共に、 前記正規化処理を、前記求められた相関値を、他のいず
れか1の手段において求められた正規化制御量だけシフ
トすることによって行い、かつ、 前記正規化制御量を、 入力音声信号の自己相関係数を第1の所定ビット数精度
で計算して得られたビット数が第2の所定ビット数より
大きいときは、当該計算して得られたビット数を第2の
所定ビット数に正規化するための第1のシフト量と、該
第1のシフト量によって入力音声信号をスケーリングし
て前記第1の所定ビット数精度で自己相関係数を計算し
て再び得られたビット数を前記第2の所定ビット数に正
規化するための第2のシフト量との差のシフト量として
求める一方、 入力音声信号の自己相関係数を第1の所定ビット数精度
で計算して得られたビット数が前記第2の所定ビット数
より大きくないときは、当該計算して得られたビット数
を前記第2の所定ビット数に正規化するためのシフト量
として求める ことを特徴とする音声符号化方法。 - 【請求項5】前記正規化制御量を、前記第1のステップ
において、入力音声信号の自己相関係数の計算時に、該
自己相関係数を所定ビット数に正規化するためのシフト
量として求めることを特徴とする請求項4記載の音声符
号化方法。 - 【請求項6】 コンピュータに、請求項4記載の音声符
号化方法を実行させる音声符号化プログラムを記録して
なることを特徴とするコンピュータ読み取り可能な記憶
媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13789399A JP3365346B2 (ja) | 1999-05-18 | 1999-05-18 | 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13789399A JP3365346B2 (ja) | 1999-05-18 | 1999-05-18 | 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000330594A JP2000330594A (ja) | 2000-11-30 |
JP3365346B2 true JP3365346B2 (ja) | 2003-01-08 |
Family
ID=15209151
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP13789399A Expired - Fee Related JP3365346B2 (ja) | 1999-05-18 | 1999-05-18 | 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3365346B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3888097B2 (ja) * | 2001-08-02 | 2007-02-28 | 松下電器産業株式会社 | ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置 |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
-
1999
- 1999-05-18 JP JP13789399A patent/JP3365346B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000330594A (ja) | 2000-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2257556C2 (ru) | Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением | |
US11721349B2 (en) | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
Giacobello et al. | Sparse linear prediction and its applications to speech processing | |
JP3167787B2 (ja) | ディジタル音声コーダ | |
JPH03211599A (ja) | 4.8kbpsの情報伝送速度を有する音声符号化/復号化器 | |
JPS63113600A (ja) | 音声信号の符号化及び復号化のための方法及び装置 | |
JPH04270400A (ja) | 音声符号化方式 | |
JP2006171751A (ja) | 音声符号化装置及び方法 | |
JP2002268686A (ja) | 音声符号化装置及び音声復号化装置 | |
JP3365346B2 (ja) | 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体 | |
JP2000132194A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JPWO2008072732A1 (ja) | 音声符号化装置および音声符号化方法 | |
JPH08305396A (ja) | 音声帯域拡大装置および音声帯域拡大方法 | |
JP2017207774A (ja) | ベクトル量子化装置及びベクトル量子化方法 | |
JPS63118200A (ja) | マルチパルス符号化装置 | |
CN104637486B (zh) | 一种数据帧的内插方法及装置 | |
US5905970A (en) | Speech coding device for estimating an error of power envelopes of synthetic and input speech signals | |
JP3552201B2 (ja) | 音声符号化方法および装置 | |
JP3194930B2 (ja) | 音声符号化装置 | |
JP3024467B2 (ja) | 音声符号化装置 | |
JPS6162100A (ja) | マルチパルス型符号化復号化装置 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JP3071800B2 (ja) | 適応ポストフィルタ | |
JP3112462B2 (ja) | 音声符号化装置 | |
JPH10105200A (ja) | 音声符号化/復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |