JP3365346B2

JP3365346B2 - 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体

Info

Publication number: JP3365346B2
Application number: JP13789399A
Authority: JP
Inventors: 伸一猪瀬
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1999-05-18
Filing date: 1999-05-18
Publication date: 2003-01-08
Anticipated expiration: 2019-05-18
Also published as: JP2000330594A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、固定小数点演算
を用いたことに基づく、演算精度不足による音質劣化
と、入力音声のレベル変動による符号化品質の劣化とを
低減した音声符号化装置及び方法並びに音声符号化プロ
グラムを記録した記憶媒体に関する。

【０００２】

【従来の技術】音声符号化の次世代国際標準として、Ｍ
ＰＥＧ（Motion Picture Image Coding Experts Grou
p）−４音声符号化方式の実用化が進められている。Ｍ
ＰＥＧ−４音声符号化方式においては、放送，インター
ネット，電話等のアプリケーションの融合と、スケーラ
ブル性の向上を図るために、それぞれの音声圧縮符号化
方式を統合した、複数の品質の音声の符号化と復号化が
可能な、階層符号化された、高品質，高機能，低演算量
の音声コーディックを実現することが求められている。

【０００３】ＭＰＥＧ−４音声符号化方式においては、
音声符号化の方法として、ＣＥＬＰ（Code Exited Line
ar Prediction）方式を用いる。ＣＥＬＰ方式において
は、人体の発声器官をモデル化することによって音声を
符号化する。すなわち、ＣＥＬＰ方式においては、人間
の声帯をモデル化した音源と、声道をモデル化したＬＰ
（Linear Prediction）合成フィルタとを用いて音声を
合成する際の、それぞれのパラメータを符号化して伝送
する。そして復号側では、これらのパラメータに基づい
て生成した音源と、ＬＰ合成フィルタとを用いて音声を
再生する。

【０００４】図７は、ＣＥＬＰ方式の音声符号化装置の
基本的な構成を示したものである。この従来例の音声符
号化装置は、図７に示すように、スケーリング／高域通
過フィルタ１０１と、ＬＰＣ（Linear Prediction Coef
ficients）分析部１０２と、音源計算部１０３と、利得
計算部１０４と、合成フィルタ１０５と、聴感重み付け
誤差最小化部１０６とから概略構成されている。図７に
示された音声符号化装置では、入力音声信号に対して、
スケーリング／高域通過フィルタ１０１を適用すること
によって、低域成分を遮断するための処理と、固定少数
点演算におけるオーバーフローを回避するためのスケー
リング（信号振幅縮小）の処理とを行ったのち、ＬＰＣ
分析部１０２において、音声信号のスペクトル包絡を表
すスペクトルパラメータを線形予測（ＬＰ）分析によっ
て求める。また、音源計算部１０３では、音源パルスの
位置と振幅とを計算し、利得計算部１０４では、音源パ
ルスに対する利得を計算することによって、生成された
音源パルスを所要の大きさで合成フィルタ１０５に供給
する。合成フィルタ１０５では、入力された音源パルス
に対して、ＬＰＣ分析部１０２で求められた音声信号の
スペクトル成分のパラメータによって指定されるフィル
タ特性を適用することによって、再生音声信号を生成す
る。聴感重み付け誤差最小部１０６では、再生音声信号
に対して、人間の聴感特性に基づく重み付けを行うとと
もに、入力音声信号と再生音声信号との誤差（残差信
号）を求める。そして、この残差信号に基づいて、音源
計算部１０３における音源パルスの振幅等を制御し、利
得計算部１０４における音源パルスに対する利得を制御
することによって、入力音声信号と再生音声信号との誤
差が最小になるように制御を行う。このような制御が収
束したときの、ＬＰＣ分析部１０２，音源計算部１０
３，利得計算部１０４等のパラメータを、図示されない
マルチプレクサを介して多重し符号化することによっ
て、入力音声信号に対応する音声符号化信号を生成して
出力する。

【０００５】図７に示された音声符号化装置における、
各部の演算処理は、通常、固定小数点演算によって行わ
れる。これは、演算量を低減して演算処理を簡潔にする
とともに、装置構成を簡単化するためである。しかしな
がら、音声符号化装置において、各部における演算を固
定小数点方式によって行うことによって、入力音声信号
の振幅過大の場合には、各部のオーバーフローに基づく
歪み等が発生するとともに、入力音声信号の振幅が小さ
い場合には、演算精度が低下するために、符号化された
音声信号の品質が劣化するという問題が発生する。

【０００６】図８は、固定小数点演算の特性を説明する
ものである。例えば、ｎビットの演算装置を用いて、ｎ
ビット精度の数どうしの乗算を行った場合は、図８
（ａ）に示すように、演算結果は２ｎビットとなる可能
性があり、また、ｎビット精度の数どうしの加算を行っ
た場合は、図８（ｂ）に示すように、演算結果はｎ＋１
ビットとなる可能性があるため、いずれの場合も、演算
装置においてオーバーフローが発生する。ＣＥＬＰ方式
の符号化装置では、相関値演算のために畳み込み演算を
用いることが多いが、この際２乗の次元をもつ演算が行
われるため、固定小数点演算を行う演算装置では、オー
バーフローが発生する可能性が高い。

【０００７】そこで、図７に示された音声符号化装置で
は、スケーリング／高域通過フィルタ１０１において、
入力音声信号のレベルを一定の割合で低下させるスケー
リングを施すとともに、ＬＰＣ分析部１０２，利得計算
部１０４等では、所要の制御を行うために、相関値，歪
み値等の演算を行う際に飽和演算を行って、一定レベル
以上又は以下の演算結果に対しては、演算結果を最大値
又は最小値でクリップして出力するようにしている。こ
の際、スケーリングと飽和演算とを併用せずに、いずれ
か一方のみを用いる場合もある。なお、このような音声
符号化装置については、例えば、ＩＴＵ（Internationa
l Telecommunication Union）のＩＴＵ−Ｔ勧告Ｇ．７
２９に準拠する、ＴＴＣ（Telecommunication Technolo
gy Committee）のＪＴ−Ｇ７２９標準に記載されてい
る。

【０００８】

【発明が解決しようとする課題】しかしながら、従来の
音声符号化装置では、固定小数点演算を採用した場合
に、入力音声信号の振幅過大による、各部のオーバーフ
ローに基づく歪み等が発生するのを防止するため、入力
音声信号に対してスケーリングを行うとともに、相関
値，歪み値等の演算時に飽和演算を行っているが、これ
によって、入力音声信号のレベル変動が大きい場合に、
演算精度が低下し、符号品質が劣化する、という問題が
あった。

【０００９】これは、符号化装置において、入力音声信
号をスケーリングしてから、符号化処理を行うため、小
さい音声レベルの場合の符号化品質が低下するととも
に、演算部において飽和演算を使用しているため、大き
い音声レベルの場合に、符号化品質が低下するためであ
る。

【００１０】この発明は、上述の事情に鑑みてなされた
もので、固定小数点演算を用いた音声符号化装置におい
て、演算精度不足に基づく音質劣化と、入力音声のレベ
ル変動による符号化品質の劣化とを低減できるようにす
ることを目的としている。

【００１１】

【課題を解決するための手段】上記課題を解決するた
め、請求項１記載の発明は、入力音声信号のスペクトル
包絡を示すパラメータを線型予測によって求める第１の
手段と、音声信号の概略ピッチ周期を計算する第２の手
段と、ターゲット信号によって前記概略ピッチ周期の前
後で微小部分を計算する第３の手段と、マルチパルス音
源とピッチ周期から前記再生音声信号を生成するための
利得を計算する第４の手段とを少なくとも備え、入力音
声信号と再生音声信号との誤差が最小になるように前記
各手段において制御を行ったときの各部のパラメータを
多重して音声符号化信号を生成する音声符号化装置に係
り、前記各手段のうち少なくとも１の手段において、相
関値を求めて所定の演算を行う際に、該相関値に対して
正規化処理を行ったのち所定の演算を行う構成になされ
ていて、前記いずれか１の手段における前記正規化処理
が、前記求められた相関値を、他のいずれか１の手段に
おいて求められた正規化制御量だけシフトすることによ
って行われ、かつ、前記正規化制御量は、入力音声信号
の自己相関係数を第１の所定ビット数精度で計算して得
られたビット数が第２の所定ビット数より大きいとき
は、当該計算して得られたビット数を第２の所定ビット
数に正規化するための第１のシフト量と、該第１のシフ
ト量によって入力音声信号をスケーリングして前記第１
の所定ビット数精度で自己相関係数を計算して再び得ら
れたビット数を前記第２の所定ビット数に正規化するた
めの第２のシフト量との差のシフト量として求められる
一方、入力音声信号の自己相関係数を第１の所定ビット
数精度で計算して得られたビット数が前記第２の所定ビ
ット数より大きくないときは、当該計算して得られたビ
ット数を前記第２の所定ビット数に正規化するためのシ
フト量として求められる構成になされていることを特徴
としている。

【００１２】また、請求項２記載の発明は、請求項１記
載の音声符号化装置に係り、前記正規化制御量が、前記
第１の手段において、入力音声信号の自己相関係数の計
算時に、該自己相関係数を所定ビット数に正規化するた
めのシフト量として求められるものであることを特徴と
している。

【００１３】また、請求項３記載の発明は、請求項１又
は２記載の音声符号化装置に係り、前記正規化制御量
が、入力音声信号レベルに応じてその値を定められるも
のであることを特徴としている。

【００１４】請求項４記載の発明は、入力音声信号のス
ペクトル包絡を示すパラメータを線型予測によって求め
る第１のステップと、音声信号の概略ピッチ周期を計算
する第２のステップと、ターゲット信号によって前記概
略ピッチ周期の前後で微小部分を計算する第３のステッ
プと、マルチパルス音源とピッチ周期から前記再生音声
信号を生成するための利得を計算する第４のステップと
を少なくとも備え、入力音声信号と再生音声信号との誤
差が最小になるように前記各ステップにおいて制御を行
ったときの各ステップのパラメータを多重して音声符号
化信号を生成する音声符号化方法に係り、前記各ステッ
プのうち少なくともいずれか１のステップにおいて、相
関値を求めて所定の演算を行う際に、該相関値に対して
正規化処理を行ったのち所定の演算を行うと共に、前記
正規化処理を、前記求められた相関値を、他のいずれか
１の手段において求められた正規化制御量だけシフトす
ることによって行い、かつ、前記正規化制御量を、入力
音声信号の自己相関係数を第１の所定ビット数精度で計
算して得られたビット数が第２の所定ビット数より大き
いときは、当該計算して得られたビット数を第２の所定
ビット数に正規化するための第１のシフト量と、該第１
のシフト量によって入力音声信号をスケーリングして前
記第１の所定ビット数精度で自己相関係数を計算して再
び得られたビット数を前記第２の所定ビット数に正規化
するための第２のシフト量との差のシフト量として求め
る一方、入力音声信号の自己相関係数を第１の所定ビッ
ト数精度で計算して得られたビット数が前記第２の所定
ビット数より大きくないときは、当該計算して得られた
ビット数を前記第２の所定ビット数に正規化するための
シフト量として求めることを特徴している。

【００１５】請求項５記載の発明は、請求項４記載の音
声符号化方法に係り、前記正規化制御量を、前記第１の
ステップにおいて、入力音声信号の自己相関係数の計算
時に、該自己相関係数を所定ビット数に正規化するため
のシフト量として求めることを特徴としている。

【００１６】また、請求項６記載の発明は、コンピュー
タ読み取り可能な記憶媒体に係り、コンピュータに、請
求項４記載の音声符号化方法を実行させる音声符号化プ
ログラムを記録していることを特徴としている。

【００１７】

【００１８】

【００１９】

【００２０】

【００２１】

【００２２】

【００２３】

【作用】この発明の構成では、相関値演算を行う場合
に、正規化を行うことによって、固定小数点演算時の精
度低下を防止する。例えば、ピッチ分析部／適応コード
ブック計算部において、重み付けされた音声信号ｓｗ
（ｎ）に対して、式（１）によって評価値Ｃ_（ｊ）を
求め、

【００２４】

【数１】

【００２５】ｊを１７〜１４４の範囲で変化させて、評
価値Ｃ_（ｊ）が最大になるｊの値を求めて、ピッチ周
期を決定する。この際、評価値Ｃ_（ｊ）の最大値を探
索するために、ｃＷｘ^２／ｃＷｃ→（ｃＷｘ／ｙ）^２／（ｃＷｃ／ｙ）（２）としても等価となる。また、固定小数点演算において
は、式（２）の演算は、式（３）のように、表現でき
る。（ｃＷｘ＞＞ｙ）^２／（ｃＷｃ＞＞ｙ）（３）ここで＞＞ｙは、所定ビット数にするためにｙビットだ
け右シフトすることを示す。このようにした場合、音声
信号ｓｗ（ｎ）のパワーが小さいときは、誤差が大きく
なるが、この発明では、ＬＰＣ分析部において、シフト
量ｙが、音声信号ｓｗ（ｎ）のパワーの大きさに比例し
て大きくなるようにする。従って、音声信号ｓｗ（ｎ）
のパワーが小さいときは、シフト量ｙが０になるか又は
ｙだけ左シフトするので、誤差が大きくなることはな
い。

【００２６】また、利得計算部では、ターゲット信号，
適応コードブック信号，マルチパルス信号のそれぞれの
相関値から、式（４）によって、評価値Ｅ_（ｊ）を求め
て、Ｅ_（ｊ）＝ｚｐ−ａ_（ｊ）・ｚｓａｘ−ｂ_（ｊ）・ｆｚｓｃｌ＋ａ_（ｊ）・ｂ_（ _ｊ）・ｆｓａｌｓｃｌ＋ａ_（ｊ） ^２・ｓａｓａ＋ｂ_（ｊ） ^２・ｆｓｃｌｓｃｌ，（ｊ＝０〜６３）（４）ｊを０〜６３の範囲で変化させて、評価値Ｅ_（ｊ）が
最小になるｊの値を求めて利得を決定する。この場合
も、式（５）のように、すべての項をｙで割る（ｙだけ
シフトする）処理を行っても、誤差が大きくなることは
ない。Ｅ_（ｊ）＝（ｚｐ＞＞ｙ）−ａ_（ｊ）・（ｚｓａｘ＞＞ｙ）−ｂ_（ｊ）・（ｆｚｓｃｌ＞＞ｙ）＋ａ_（ｊ）・ｂ_（ｊ）・（ｆｓａｌｓｃｌ＞＞ｙ）＋ａ_（ｊ） ^２・ｓａｓａ＞＞ｙ）＋ｂ_（ｊ） ^２（ｆｓｃｌｓｃｌ＞＞ｙ）（５）

【００２７】

【発明の実施の形態】以下、図面を参照して、この発明
の実施の形態について説明する。説明は、実施例を用い
て具体的に行う。図１は、この発明の一実施例の音声符
号化装置の構成を示すブロック図、図２は、ＬＰＣ分析
部の動作を示すフローチャート、図３は、ＬＰＣ分析部
における自己相関係数の計算と正規化制御量の検出の手
順を示すフローチャート、図４は、ピッチ分析部／適応
コードブック計算部におけるピッチ周期の計算手順を示
すフローチャート、図５は、利得計算部の動作を示すフ
ローチャート、また、図６は、利得計算部における各種
相関係数の計算手順を示すフローチャートである。この
例の音声符号化装置は、ＭＰＥＧ−４／狭帯域ＣＥＬＰ
符号化装置の構成を例示し、図１に示すように、バッフ
ァメモリ１と、ＬＰＣ（Linear Prediction Coefficien
ts）分析部２と、ＲＭＳ（Root Mean Square）計算部３
と、ピッチ分析部４と、ターゲット信号生成部５と、適
応コードブック計算部６と、マルチパルス音源計算部７
と、利得計算部８と、駆動信号復元部９と、合成フィル
タ１０と、マルチプレクサ１１とから概略構成されてい
る。

【００２８】バッファメモリ１は、入力音声信号を保持
してフレーム化して出力する。ＬＰＣ分析部２は、入力
音声信号フレームのスペクトル包絡を示すスペクトルパ
ラメータを線型予測によって求める。ＲＭＳ計算部３
は、符号化対象フレームの平均パワーを計算する。ピッ
チ分析部４は、バッファメモリ１の出力音声信号におけ
るピッチ周期を計算する。ターゲット信号生成部５は、
入力音声信号と再生音声信号との残差信号に聴感重み付
けを施してターゲット信号を生成する。適応コードブッ
ク計算部６は、ターゲット信号に対して、ピッチ分析部
４で求めた整数ピッチ周期の前後で、さらに分周ピッチ
周期を計算する。マルチパルス音源計算部７は、音源と
なる複数のパルスの位置と振幅を計算する。利得計算部
８は、ターゲット信号と、適応コードブック信号とマル
チパルス音源信号とに対する利得を計算する。駆動信号
復元部９は、適応コーブック信号と、マルチパルス音源
信号と、利得計算部で求められた利得とから、再生音声
信号を合成するための駆動信号を復元する。合成フィル
タ１０は、駆動信号復元部９からの駆動信号によって再
生音声信号を合成する。マルチプレクサ１１は、ＬＰＣ
分析部２と、ＲＭＳ計算部３と、ピッチ分析部４と、適
応コードブック計算部６と、マルチパルス音源計算部７
と、利得計算部８のそれぞれで得られたパラメータを多
重して符号化信号を出力する。

【００２９】次に、図１を参照して、この例の音声符号
化装置の動作を説明する。図示されない高域ろ波器を経
て、低周波成分を除去された、ディジタル化された音声
信号は、一旦、バッファメモリ１に蓄積されたのち、一
定サンプル数からなフレームごとに分割されて出力され
る。ＬＰＣ分析部２では、フレームごとに、入力音声信
号に対して、ＬＰ（線形予測）分析を行って、１０次ま
でのＬＰＣ係数を求めて、その値をマルチプレクサ１１
へ送る。また、ＲＭＳ計算部３では、フレームごとに、
入力音声信号の平均パワーを求めて、その値をマルチプ
レクサ１１へ送る。さらにピッチ分析部４では、フレー
ムごとに、入力信号から聴感特性に基づいて重み付けを
行って聴感重み付け信号を生成し、ピッチ分析を行う。
ピッチ分析部４では、ピッチ周期（整数）と有音／無音
を判定し、ピッチ周期を適応コードブック計算部６へ送
り、有音／無音情報をマルチプレクサ１１へ送る。

【００３０】一方、ターゲット信号生成部５では、重み
付け合成フィルタの零入力応答を重み付け音声信号から
減じた信号であるターゲット信号を生成して出力する。
すなわち、ターゲット信号生成部内に、合成フィルタと
重み付けフィルタとを有し、合成フィルタの入力として
零（無入力）を入れることによって生成された信号を、
聴感重み付けフィルタに入れることによって生成された
信号を、バッファメモリ１の出力信号を重み付けフィル
タに入れて得た信号から減算して、ターゲット信号を生
成する。このターゲット信号に対して、適応コードブッ
ク計算部６では、ターゲット信号との相関が最も強い、
過去において再生した励振信号（適応コードブック信
号）を適応的に探索することによって、ピッチ分析部４
で求めた整数ピッチ周期の前後で、さらに詳細な分数ピ
ッチ周期を計算する。そして、マルチパルス音源計算部
７では、ターゲット信号と適応コードブック信号との残
差信号を求め、この残差信号に対して歪みが最小になる
パルス位置と振幅を求めて得られた複数のパルスからな
るパルス列（マルチパルス）を、マルチパルス音源信号
として出力する。

【００３１】利得計算部８では、ターゲット信号と適応
コードブック信号とマルチパルス音源信号とに対して、
減算器１２における誤差パワーが最小になるように利得
を計算する。駆動信号復元部９では、適応コードブック
信号とマルチパルス音源信号とに対して、利得計算部８
で求められた利得を適用して、合成フィルタ１０を駆動
するための駆動信号を生成し、これによって、合成フィ
ルタ１０において再生音声信号を生成して、減算器１２
に出力する。このような制御が繰り返し行われて、入力
音声信号と再生音声信号との誤差（歪み）が最小になっ
たとき、ＬＰＣ分析部２と、ＲＭＳ計算部３と、ピッチ
分析部４と、適応コードブック計算部６と、マルチパル
ス音源計算部７と、利得計算部８とにおいて求められた
それぞれのパラメータを、マルチプレクサ１１において
多重し符号化することによって、入力音声信号に対応す
るＣＥＬＰ符号化信号を出力する。

【００３２】このような符号化の過程において、図１に
示す、ＬＰＣ分析部２，ピッチ分析部４，コードブック
計算部６，利得計算部８等においては、それぞれの演算
処理中において、固定小数点演算によって相関計算が行
われるが、この際、計算結果の正規化を行うことによっ
て、限られたビット数で、精度のよい演算を行うことが
できるようにしている。以下においては、各部における
演算の概要と、その際における、相関演算の正規化の方
法とについて説明する。

【００３３】まず、図２を用いて、ＬＰＣ分析部の動作
を説明する。ＬＰＣ分析部２１においては、入力音声信
号ｓ（ｎ）（ｎはフレーム中のサンプル番号。以下同
様）のフレーム化時における高調波成分の発生を防止す
るために、適当な窓関数を乗算する窓かけ処理を行う
（ステップＳ１）。窓処理としては、例えばハミング窓
とコサイン関数周期の窓かけとが行われる。次に、窓か
けが行われた音声信号に対して、自己相関計算が行われ
て、正規化された自己相関係数ｒ'(ｋ）が求められる
（ステップＳ２）。自己相関係数は、式（６）によって
計算される。

【００３４】

【数２】

【００３５】ここで、ｋ＝０,…,１０は自己相関の次数
である。このとき、自己相関計算結果ｒ（ｋ）を所定ビ
ット数に正規化するための正規化制御量λが決定される
とともに、この正規化制御量λを適用することによっ
て、正規化された自己相関係数ｒ'(ｋ）が求められる。
次に、正規化された自己相関係数ｒ'(ｋ）に対して、レ
ビンソン・ダービンアルゴリズムによる再帰演算を行う
ことによって（ステップＳ３）、ＬＰＣ係数αが求めら
れる。

【００３６】次に、図３を用いて、自己相関係数と正規
化制御量λを求める際の手順を詳細に説明する。図３
（ａ）に示すフローチャートにおいて、前述のように、
窓かけされた音声信号ｓ'(ｎ）に対して、４０ビット精
度で０次の自己相関係数ｒ（０）を計算する（ステップ
Ｑ１）。ｒ（０）＝ｓ'(ｎ）＊ｓ'(ｎ）（７）自己相関係数ｒ（０）は、式（７）に示すように、音声
信号ｓ'(ｎ）どうしの畳み込み演算（"＊”は畳み込み
演算を表す。以下、同様）によって求められる。そし
て、ｒ（０）＞２^３１であったときは（ステップＱ
２）、次のようにして、正規化制御量λ１を求める。４
０ビットから３２ビットへの正規化制御量を求めるため
に、まず、ｒ（０）を１６ビットだけ右シフトする（ス
テップＱ３）。これは、演算装置が、３２ビット以下の
値しか扱うことができないためである。

【００３７】次に、以下のようにして、３２ビットへの
正規化制御量を計算する（ステップＱ４）。まず、式
（８）によって３２ビットへの第１の正規化制御量λ１
を求める。 λ１＝ｅｘｐ（ｒ（０)）（８）ここで、ｅｘｐ（ｒ（０)）関数の演算は、図３（ｂ）
に示すように、３２ビットへの正規化制御量を求める演
算であり、λ１は、３２ビットへの正規化制御量を表し
ている。そして、ｒ(０)のオーバーフロー量（３２ビッ
トに収まらないビット数）を計算するため、第１の正規
化制御量λ１として、式（９）に示す値を用いる。 λ１＝１５−λ１（９）次に、式（１０）によって、正規化制御量λ１を２ビッ
トだけ右シフトする。ｒ(０)は、畳み込み演算によっ
て、信号ｓ'(ｎ）を２乗して求めているので、ｒ(０)を
１／４にする（２ビット右シフト）するためには、信号
ｓ'(ｎ）を１／２にする必要がある。 λ１＝λ１＞＞２（１０）また、式（１１）によって、正規化制御量λ１を２ビッ
トだけ左シフトする。演算量の増加を抑えるために、信
号ｓ'(ｎ）のスケーリング量を"２”刻みにするが、そ
のためには、λ１を４で除算してその商を用いて上記式
を実行すると、λ１は２の倍数となる。 λ１＝２＜＜λ１（１１）

【００３８】このようにして、正規化制御量λ１が求め
られたとき、信号ｓ'(ｎ）のスケーリングを、式（１
２）のようにして行う（ステップＱ５）。ｓ'(ｎ）＝ｓ'(ｎ）＞＞λ１（１２）このような演算を信号ｓ'(ｎ）について、繰り返して実
行して、ｒ（０）が３２ビット以下になるようにする。

【００３９】一方、ｒ（０）＞２^３１でないときは（ス
テップＱ２）、式（１３）によって、３２ビットへの第
２の正規化制御量λ２を求める。 λ２＝ｅｘｐ（ｒ（０））（１３）そして、ｒ（０）を正規化制御量λ２によって、３２ビ
ットへ正規化する。式（１４）は、ｒ（０）を正規化制
御量λ２ビットだけ左シフトすることによって、３２ビ
ットに正規化されることを示している。ｒ'(０)＝ｒ（０）＜＜λ２（１４）

【００４０】このようにして求められた、正規化制御量
λ１とλ２とによって、以後の演算に用いる正規化制御
量λを決定する（ステップＱ８）。 λ＝λ１−λ２（１５）これは、正規化制御量λ１を適用したために、スケーリ
ングが過剰になった分を、正規化制御量λ２によって補
償することによって、ｒ'(０)を正しく３２ビットに正
規化できることを示している。もしも、始めからｒ
（０）＞２^３１でないときは、制御制御量λは−λ２と
なるので、単純に左シフトのみによって、３２ビットに
正規化された自己相関係数ｒ'(０)が求められる。

【００４１】正規化制御量が決定されたことによって、
以後、ｉ＝１,…,１０についてループすることによって
（ステップＱ９）、１次から１０次までの自己相関係数
ｒ'(０)〜ｒ'(１０)を求める。まず、式（１６）のよう
に、４０ビット精度で自己相関係数ｒ（ｉ）を計算する
（ステップＱ１０）。ｒ（ｉ）＝ｓ'(ｎ）＊ｓ'(ｎ＋ｉ）（１６）次に、式（１７）によって、自己相関係数ｒ（ｉ）を正
規化制御量λ２を用いて、３２ビットへ正規化する（ス
テップＱ１１）。ｒ'(ｉ)＝ｒ（ｉ）＜＜λ２（１７）ここで正規化制御量としてλ２を用いるのは、一般に０
次の自己相関係数ｒ（０）の値は最大であって、１次〜
１０次の自己相関関数ｒ（１）〜ｒ（１０）の値は、こ
れより小さい。一方、ｒ（０）について３２ビット以下
になるようにスケーリングを行っているので、この場
合、１次〜１０次の自己相関係数ｒ（ｉ）は３２ビット
以下になるためである。ｉ＝１,…,１０について、ルー
プを終了したとき、自己相関係数ｒ'(０)〜ｒ'(１０)が
求められる（ステップＱ１２）。

【００４２】次に、図４を用いて、ピッチ分析部／適応
コードブック計算部におけるピッチ周期の計算手順を説
明する。ピッチ分析部４においては、バッファメモリ１
から出力された音声信号ｓ（ｎ）に対して、聴感特性に
基づく聴感重み付けを行って重み付け音声信号ｓｗ
（ｎ）を生成し、この重み付け信号からピッチ周期ｌａ
ｇ（整数部）を計算する。また適応コードブック計算部
６においては、ターゲット信号生成部５において生成さ
れた、聴感特性に基づく聴感重み付けを行ったターゲッ
ト信号から、ピッチ周期ｌａｇ（分数部）を計算する。

【００４３】ピッチ分析部４及び適応コードブック計算
部６におけるピッチ周期の計算は、図４に示すようにし
て行われる。まず、重み付けされた音声信号ｓｗ（ｎ）
に対して、４０ビット精度で、自己相関係数ｃＷｃ、相
互相関係数ｃＷｘと、自己相関係数と相互相関係数との
相関値すなわち歪み量を表す評価値とを計算する（ステ
ップＲ１）。自己相関係数、相互相関係数、評価値は、
前述の（１）式によって、重み付けされた音声信号ｓｗ
（ｎ）から計算される。ここで、ｎはフレーム中のサン
プル番号を示し、ｉ＝１７,…,１４４は、探索する位置
（信号周期）を示している。

【００４４】次に、ＬＰＣ分析部２において求められた
正規化制御量λを用いて、式（１８）,（１９）によっ
て、自己相関係数ｃＷｃ及び相互相関係数ｃＷｘを正規
化して、正規化された自己相関係数ｃＷｃ'、相互相関
係数ｃＷｘ'を求める（ステップＲ２）。ｃＷｃ'＝ｃＷｃ＞＞λ （１８）ｃＷｘ'＝ｃＷｘ＞＞λ （１９）このような自己相関係数ｃＷｃ'、相互相関係数ｃＷｘ'
について、すべてのｉの範囲で評価値を計算し、評価値
が最も大きくなるｉの値を求めて、このｉに対応する周
期をピッチ周期ｌａｇとする。

【００４５】次に、図５を用いて、利得計算部における
動作を説明する。利得計算部２２においては、ターゲッ
ト信号生成部５からのターゲット信号ｚ（ｎ）と、適応
コードブック計算部６からの適応コードブック信号ｆｓ
ａｌ（ｎ）と、マルチパルス音源計算部７からのマルチ
パルス音源信号ｆｓｃｌ（ｎ）とから、声道の形状に基
づく、声道各部の反射係数を計算する（ステップＵ
１）。次に、ターゲット信号ｆｚ（ｎ）とマルチパルス
音源信号ｆｓｃｌ（ｎ）の相互相関値と、適応コードブ
ック信号ｆｓａｌ（ｎ）とマルチパルス音源信号ｆｓｃ
ｌ（ｎ）の相互相関値と、マルチパルス音源信号ｆｓｃ
ｌ（ｎ）の自己相関値とを計算する（ステップＵ２）。

【００４６】次に、利得計算を行う（ステップＵ３）。
利得計算は、式（２０）によって評価値Ｅ_（ｊ）を求
める。Ｅ_（ｊ）＝ｚｐ−ａ_（ｊ）・ｚｓａｘ−ｂ_（ｊ）・ｆｚｓｃｌ＋ａ_（ｊ）・ｂ_（ _ｊ）・ｆｓａｌｓｃｌ＋ａ_（ｊ） ^２・ｓａｓａ＋ｂ_（ｊ） ^２・ｆｓｃｌｓｃｌ，（ｊ＝０〜６３）（２０）ここで、ｚｐはターゲット信号ｚ（ｎ）の自己相関値、
ｚｓａｘはターゲット信号ｚ（ｎ）と適応コードブック
信号ｆｓａｌ（ｎ）との相互相関値、ｆｚｓｃｌは、タ
ーゲット信号ｚ（ｎ）とマルチパルス音源信号ｆｓｃｌ
（ｎ）の相互相関値、ｆｓａｌｓｃｌは適応コードブッ
ク信号ｆｓａｌ（ｎ）とマルチパルス音源信号ｆｓｃｌ
（ｎ）の相互相関値、ｓａｓａは適応コードブック信号
ｆｓａｌ（ｎ）の自己相関値、ｆｓｃｌｓｃｌはマルチ
パルス音源信号ｆｓｃｌ（ｎ）の自己相関値である。ａ
_（ｊ）,ｂ_（ｊ）は係数であって、利得を表すテーブル
中の値を指している。利得計算は、式（２０）におい
て、係数ａ_（ｊ）,ｂ_（ｊ）を、ｊ＝０〜６３の範囲で
変化させて歪みを表す評価値Ｅ_（ｊ）が最小になるとき
のａ_（ｊ）,ｂ_（ｊ）の組み合わせを求めて、このとき
のａ_（ｊ）,ｂ_（ｊ）によって定まる利得を、所望の利
得値とする。

【００４７】次に、図６を用いて、利得計算時におけ
る、各相関値の計算手順について説明する。ターゲット
信号ｚ（ｎ）と、適応コードブック信号ｆｓａｌ（ｎ）
と、マルチパルス音源信号ｆｓｃｌ（ｎ）とから、式
（２１）によって、４０ビット精度で、ターゲット信号
ｚ（ｎ）とマルチパルス音源信号ｆｓｃｌ（ｎ）の相互
相関値を計算し、式（２２）によって、４０ビット精度
で、適応コードブック信号ｆｓａｌ（ｎ）とマルチパル
ス音源信号ｆｓｃｌ（ｎ）の相互相関値を計算し、式
（２３）によって、４０ビット精度で、マルチパルス音
源信号ｆｓｃｌ（ｎ）の自己相関値とを計算する（ステ
ップＶ１）。ｆｚｓｃｌ＝ｚ（ｎ）＊ｆｓｃｌ（ｎ）（２１）ｆｓａｌｓｃｌ＝ｆｓａｌ（ｎ）＊ｆｓｃｌ（ｎ）（２２）ｆｓｃｌｓｃｌ＝ｆｓｃｌ（ｎ）＊ｆｓｃｌ（ｎ）（２３）

【００４８】次に、ＬＰＣ分析部２で求められた正規化
制御量λによって、各相関値を３２ビットに正規化する
（式（２４）〜（２６）、ステップＶ２）。ｆｚｓｃｌ＝ｆｚｓｃｌ＞＞λ （２４）ｆｓａｌｓｃｌ＝ｆｓａｌｓｃｌ＞＞λ （２５）ｆｓｃｌｓｃｌ＝ｆｓｃｌｓｃｌ＞＞λ （２６）

【００４９】このようにして正規化された各相関値を用
いたとき、式（２０）に示された評価値Ｅ_（ｊ）は、式
（２７）で与えられる。Ｅ_（ｊ）＝（ｚｐ＞＞λ）−ａ_（ｊ）・（ｚｓａｘ＞＞λ）−ｂ_（ｊ）・（ｆｚｓｃｌ＞＞λ）＋ａ_（ｊ）・ｂ_（ｊ）・（ｆｓａｌｓｃｌ＞＞λ）＋ａ_（ｊ） ^２・（ｓａｓａ＞＞λ）＋ｂ_（ｊ） ^２・（ｆｓｃｌｓｃｌ＞＞λ），（ｊ＝０〜６３）（２７）これによって、固定小数点演算によって、利得計算を行
うことができる。

【００５０】このように、この例の音声符号化装置で
は、符号化の初期において、ＬＰＣ分析部において求め
られた正規化制御量を用いて、ＬＰＣ分析部と、ピッチ
分析部及び適応コードブック計算部と、利得計算部とに
おける相関関数計算時に、求められた相関値を演算装置
のビット数に正規化して計算をを行うので、固定小数点
演算を行っても、演算精度の低下が少なくなるので、符
号化に伴う音質の低下が少ない。かつこの際の正規化制
御量は、入力音声信号のパワーの大小に応じて定められ
るので、正規化に伴う計算誤差は、入力音声信号のパワ
ーが小さい程小さくなり、従って、入力音声信号のレベ
ルが低い状態での音質劣化を少なくすることができる。

【００５１】以上、この発明の実施例を図面により詳述
してきたが、具体的な構成はこの実施例に限られたもの
ではなく、この発明の要旨を逸脱しない範囲の設計の変
更等があってもこの発明に含まれる。例えば、この発明
は、ハードウェア構成によって実現する場合に限らず、
ソフトウェアによって実現することもできる。この場
は、ハードウェア構成として、中央処理装置（ＣＰＵ）
やディジタルシグナルプロセッサ（ＤＳＰ）等の処理装
置と、ＣＰＵ等とバスを介して接続された、プログラム
やデータを蓄積するための大容量の低速メモリと、ＣＰ
Ｕ等の作業領域となる高速メモリと、外部接続とデータ
の授受のための入力装置及び出力装置等を有する周知の
システムを備え、これにこの発明の方法を実行するため
のプログラムを装備することによって容易に実現され
る。さらに、このようなプログラムを、処理装置が読み
取り可能な、任意の形式の媒体に記録した状態で予め用
意することによって、同様なシステムを具備する場合
に、同一の方法を普遍的に実現することができる。

【００５２】

【発明の効果】以上説明したように、この発明の音声符
号化装置によれば、ＬＰＣ分析部で得られた自己相関係
数の正規化制御量を用いて、ピッチ分析部，適応コード
ブック計算部，利得計算部等における相関値計算，歪み
計算等における正規化量の制御を行うので、音声符号化
処理のための演算量を減少させることができ、従って、
従来よりも低い動作周波数で装置を動作させることがで
きるので、装置を安価に構成できるとともに、消費電力
の低下を図ることができる。さらにこの発明によれば、
固定少数点演算装置を使用可能になるとともに、スケー
リング，飽和演算が不要になるので、固定小数点演算に
よる演算精度不足に基づく音質劣化を改善できるととも
に、入力音声信号のレベル変化に対して、均一の符号化
品質を得ることができる。

【図面の簡単な説明】

【図１】この発明の一実施例の音声符号化装置の構成を
示すブロック図である。

【図２】ＬＰＣ分析部の動作を示すフローチャートであ
る。

【図３】ＬＰＣ分析部における自己相関係数の計算と正
規化制御量の検出の手順を示すフローチャートである。

【図４】ピッチ分析部／適応コードブック計算部におけ
るピッチ周期の計算手順を示すフローチャートである。

【図５】利得計算部の動作を示すフローチャートであ
る。

【図６】利得計算部における各種相関係数の計算手順を
示すフローチャートである。

【図７】ＣＥＬＰ方式の音声符号化装置の基本的な構成
を示す図である。

【図８】固定小数点演算の特性を説明するための図であ
る。

【符号の説明】

２ＬＰＣ分析部（第１の手段）３ＲＭＳ計算部４ピッチ分析部（第２の手段）５ターゲット信号生成部６適応コードブック計算部（第３の手段）７マルチパルス音源計算部８利得計算部（第４の手段）

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 19/10 G10L 19/12

Claims

(57)【特許請求の範囲】

【請求項１】入力音声信号のスペクトル包絡を示すパラ
メータを線型予測によって求める第１の手段と、音声信
号の概略ピッチ周期を計算する第２の手段と、ターゲッ
ト信号によって前記概略ピッチ周期の前後で微小部分を
計算する第３の手段と、マルチパルス音源とピッチ周期
から前記再生音声信号を生成するための利得を計算する
第４の手段とを少なくとも備え、入力音声信号と再生音
声信号との誤差が最小になるように前記各手段において
制御を行ったときの各部のパラメータを多重して音声符
号化信号を生成する音声符号化装置であって、前記各手段のうち少なくとも１の手段において、相関値
を求めて所定の演算を行う際に、該相関値に対して正規
化処理を行ったのち所定の演算を行う構成になされてい
て、前記いずれか１の手段における前記正規化処理が、前記
求められた相関値を、他のいずれか１の手段において求
められた正規化制御量だけシフトすることによって行わ
れ、かつ、前記正規化制御量は、入力音声信号の自己相関係数を第１の所定ビット数精度
で計算して得られたビット数が第２の所定ビット数より
大きいときは、当該計算して得られたビット数を第２の
所定ビット数に正規化するための第１のシフト量と、該
第１のシフト量によって入力音声信号をスケーリングし
て前記第１の所定ビット数精度で自己相関係数を計算し
て再び得られたビット数を前記第２の所定ビット数に正
規化するための第２のシフト量との差のシフト量として
求められる一方、入力音声信号の自己相関係数を第１の所定ビット数精度
で計算して得られたビット数が前記第２の所定ビット数
より大きくないときは、当該計算して得られたビット数
を前記第２の所定ビット数に正規化するためのシフト量
として求められる構成になされていることを特徴とする
音声符号化装置。
【請求項２】前記正規化制御量が、前記第１の手段にお
いて、入力音声信号の自己相関係数の計算時に、該自己
相関係数を所定ビット数に正規化するためのシフト量と
して求められるものであることを特徴とする請求項１記
載の音声符号化装置。
【請求項３】前記正規化制御量が、入力音声信号レベル
に応じてその値を定められるものであることを特徴とす
る請求項１又は２記載の音声符号化装置。
【請求項４】入力音声信号のスペクトル包絡を示すパ
ラメータを線型予測によって求める第１のステップと、
音声信号の概略ピッチ周期を計算する第２のステップ
と、ターゲット信号によって前記概略ピッチ周期の前後
で微小部分を計算する第３のステップと、マルチパルス
音源とピッチ周期から前記再生音声信号を生成するため
の利得を計算する第４のステップとを少なくとも備え、
入力音声信号と再生音声信号との誤差が最小になるよう
に前記各ステップにおいて制御を行ったときの各ステッ
プのパラメータを多重して音声符号化信号を生成する音
声符号化方法であって、前記各ステップのうち少なくともいずれか１のステップ
において、相関値を求めて所定の演算を行う際に、該相
関値に対して正規化処理を行ったのち所定の演算を行う
と共に、前記正規化処理を、前記求められた相関値を、他のいず
れか１の手段において求められた正規化制御量だけシフ
トすることによって行い、かつ、前記正規化制御量を、入力音声信号の自己相関係数を第１の所定ビット数精度
で計算して得られたビット数が第２の所定ビット数より
大きいときは、当該計算して得られたビット数を第２の
所定ビット数に正規化するための第１のシフト量と、該
第１のシフト量によって入力音声信号をスケーリングし
て前記第１の所定ビット数精度で自己相関係数を計算し
て再び得られたビット数を前記第２の所定ビット数に正
規化するための第２のシフト量との差のシフト量として
求める一方、入力音声信号の自己相関係数を第１の所定ビット数精度
で計算して得られたビット数が前記第２の所定ビット数
より大きくないときは、当該計算して得られたビット数
を前記第２の所定ビット数に正規化するためのシフト量
として求めることを特徴とする音声符号化方法。
【請求項５】前記正規化制御量を、前記第１のステップ
において、入力音声信号の自己相関係数の計算時に、該
自己相関係数を所定ビット数に正規化するためのシフト
量として求めることを特徴とする請求項４記載の音声符
号化方法。
【請求項６】コンピュータに、請求項４記載の音声符
号化方法を実行させる音声符号化プログラムを記録して
なることを特徴とするコンピュータ読み取り可能な記憶
媒体。