JPH07295597A

JPH07295597A - Ｖｓｅｌｐ符号化方法

Info

Publication number: JPH07295597A
Application number: JP6089398A
Authority: JP
Inventors: Shigetaka Motoyoshi; 成宇本吉; Michiko Tajimi; 道子多治見; Yoshiaki Asakawa; 吉章淺川
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1994-04-27
Filing date: 1994-04-27
Publication date: 1995-11-10

Abstract

(57)【要約】【目的】ラグ検索の処理量を低減したＶＳＥＬＰ音声符
号化方法を提供する。【構成】入力音声からフレーム毎に、入力音声のフレー
ムエネルギーを算出し、それが予め定められた閾値以下
ならラグ検索処理を行わずに音声を符号化する手段と、
ラグ検索を行う場合は、検索の範囲を限定し、ラグ検索
を行う手段を設ける。【効果】無声音や無音が入力音声の場合、ラグ検索処理
の低減が図れる。ラグ検索を行う場合でも、検索範囲を
限定できるので、ラグ検索処理の低減を図れる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、音声を低ビットレート
で符号化するＶＳＥＬＰ符号化方法に関する。

【０００２】

【従来の技術】ＶＳＥＬＰは、コードブックを用いて励
起（残差）信号をベクトル量子化する符号励起線形予測
符号化方法（ＣＥＬＰ）の改良版であり、電波システム
開発センター（以下ＲＣＲという）によりディジタルセ
ルラー用の音声符号化方法として標準化されている。以
下、ディジタルセルラ用の音声符号化方法の標準規格書
（ＲＣＲＳＴＤ−２７）に基づき、従来技術を説明す
る。

【０００３】ＶＳＥＬＰの音声符号化レートは６７００
bps 、１音声フレームは２０ms、さらに１音声フレーム
は４つのサブフレーム（５ms）より構成される。

【０００４】図１は、ＶＳＥＬＰ符号化方法におけるＶ
ＳＥＬＰ符号化器の構成を示したものである。このＶＳ
ＥＬＰ符号化器は、線形予測分析部１０１と、フレーム
エネルギー算出部１０２と、線形予測係数ソフト補間部
１０３と、聴覚重み付きフィルタ処理部１０４と、重み
付き合成フィルタ処理部１０５と、総重み付き誤差算出
部１０６と、長期予測ラグ選択部１０７と、コード選択
部１０８と、長期フィルタ状態１０９と、励起コードブ
ック１１０を備えている。

【０００５】線形予測分析部１０１は、入力音声１００
に基づいて線形予測係数α_iの算出を行う。フレームエ
ネルギー算出部１０２は、入力音声１００が入力される
と、各フレーム毎に、入力音声の平均信号パワーを示す
フレームエネルギーＲ₀を求めて出力する。線形予測係
数ソフト補間部１０３は、各サブフレーム毎に前記線形
予測係数α_iがソフト補間され、安定性判別を行い、入
力音声１００に基づいて算出される残差パワーにより現
フレームで使用する線形予測係数を選択する。

【０００６】聴覚重み付きフィルタ処理部１０４では、
入力音声１００が各サブフレーム毎に線形予測係数α_i
を用いた後述する聴覚重み付きフィルタによって、フィ
ルタ処理される。前記聴覚重み付きフィルタの出力を、
ｐとする。

【０００７】以下、聴覚重み付きフィルタについて、説
明する。音声符号化などの量子化に伴う残差は、通常白
色雑音に近い一定のスペクトルを持つ。復号化による再
生音声をＳ，量子化雑音をＮとする時、人間の聴覚特性
から、信号対雑音比（以下ＳＮ比という。）が大きな場
合の量子化雑音Ｎは、目立たないが、ＳＮ比が小さな場
合の量子化雑音Ｎは、目立つ傾向がある。そこで、量子
化雑音Ｎのスペクトルを再生音声Ｓのスペクトルに近い
形に成形してやると、量子化雑音Ｎのトータルパワーが
同じでも、量子化雑音が減ったように感じる。（マスキ
ング効果という。）聴覚重み付きフィルタは、このよう
な、人間の聴覚特性を利用して、残差信号に対し音声ス
ペクトル強度が小さい部分の周波数を強調するように機
能するものである。

【０００８】重み付き合成フィルタ処理部１０５では、
各サブフレーム毎に線形予測係数α_iを用いた重み付き
合成フィルタによって励起信号ｅｘの合成信号ｐ′を作
成する。

【０００９】前記聴覚重み付きフィルタ出力ｐ（ｎ）か
ら、重み付き合成フィルタ出力の合成信号ｐ′の減算を
行い、総重み付き誤差算出部１０６で、総重み付き誤差
errを算出する。前記総重み付き誤差ｅｒｒが、最小と
なるように、後述する前記長期予測ラグ（声帯の振動周
期）選択部１０７で、長期予測ラグＬを選択し、前記コ
ード（励起信号の基となる励起コードブックのインデッ
クス）選択部１０８で、コードＣｏｄｅを選択する。

【００１０】以上が、ＶＳＥＬＰ符号化器の処理概要で
ある。次に、長期予測ラグ選択について説明する。

【００１１】ＶＳＥＬＰはハイブリッド符号化である
が、線形予測分析よりスペクトル成分を処理し、適応コ
ードブックを用いた探索により残差信号を処理する。ピ
ッチ周期も後者の方法により処理され、ここでラグ検索
が用いられる。

【００１２】ラグ検索のフローチャートを図２に示す。
前記ラグ検索では閉ループ法を用いる。検索範囲は２.
５msec（４００Ｈｚ，２０サンプル）から１８.５msec
（５５Ｈｚ，１４６サンプル）まである。まずＬ_MAX，
Ｌ_MINを初期化し、前述した検索範囲について以下の処
理を実行する。まずラグＬに対する長期フィルタ状態コ
ードブックの出力であるｂ_Lを算出する（２０５）。ｂ_L
は次の数１より与えられる。

【００１３】

【数１】

【００１４】次にＺ_Lを数２より算出し(２１０）、評価
関数Ｇ_L及びＣ_Lを算出する(２１５)（２２０）。

【００１５】

【数２】

【００１６】Ｇ_LおよびＣ_Lは次の数３，数４より与えら
れる。

【００１７】

【数３】

【００１８】

【数４】

【００１９】Ｇ_L及びＣ_Lを用いて数５を計算する。

【００２０】

【数５】

【００２１】数５が成立すればＬ_MAXを更新し、この時
のＬをＬ_MINとして記憶する。

【００２２】以上の処理を繰り返して前述した全ての範
囲を検索し、最適なラグＬを得る。一旦最適なラグＬが
決定すれば、最適なラグＬに対する長期予測ベクトルｂ
_L(n)は数１で与えられる。更に、打切りを行わないイン
パルス応答ｈ(n) 用い、長期予測ベクトルｂ_L(n)の伝達
関数Ｈ(Z) に対するゼロ状態応答として重み付け長期予
測ベクトルｂ′_Lを数６より計算する。

【００２３】

【数６】

【００２４】

【発明が解決しようとする課題】ＶＳＥＬＰをディジタ
ルセルラ等の移動体無線端末に利用する場合、できるか
ぎりの端末小型化と低消費電力化が必要である。このた
めには、演算処理量を低減しなければならないが従来の
ラグ検索は、Ｌ＝２１〜１４６の範囲で全検索をおこな
っていたため、処理量が大きく問題となっていた。一
方、フレームエネルギーの小さなところではラグはみつ
からないこと、同一話者の場合は、一度ラグが探索され
ると以降はその値の付近の値、又はその値の整数倍に近
い値で見つかることが多いことが実験的に分かってい
る。

【００２５】本発明は上記の２つの事柄を利用しＶＳＥ
ＬＰの演算処理量を低減するものである。

【００２６】

【課題を解決するための手段】本発明によるＶＳＥＬＰ
音声符号化方法では、入力音声のフレームエネルギーに
よる有声音と無声音または無音を判別する閾値を設定
し、フレームエネルギーが閾値より小さい場合、ラグ検
索は行わない。フレームエネルギーが閾値より大きい場
合で、前のサブフレームにおけるラグが見つかっている
ときは、その時のラグの値(Ｌ_oldとする）を用いた長期
予測ベクトルと残差との内積が、ラグをξだけずらした
時の長期予測ベクトルと残差の内積より大きいとき、ラ
グの検索範囲をｘ＊Ｌ_old−ξからｘ＊Ｌ_old＋ξの範囲
に限定する。ここでξは予め定めた正の定数である。ま
たｘの条件は数７に示す。

【００２７】

【数７】

【００２８】内積の比較結果が逆の場合、ξをより大き
な数にして検索範囲を拡げる。ただし拡げられた検索範
囲の上限ｘ＊Ｌ_old＋ξ がｘ＊Ｌ_old＋Ｌ_old／２以上に
なった時は、従来通り全検索を行う。

【００２９】フレームエネルギーが閾値より大きく前サ
ブフレームのラグが見つかっていないときは従来通り全
検索を行う。

【００３０】

【作用】上記手段によれば、フレーム毎に入力音声のフ
レームエネルギーを設定した閾値と比較し、上回った場
合にはラグの検索を行う。閾値を下回った場合にはラグ
の検索を行わずラグの値をゼロに固定する。ラグの検索
を行う場合、前サブフレームのラグ値が見つかっている
ときは検索範囲の限定を行う。

【００３１】

【実施例】本発明の第一の実施例のブロック図を図３に
示す。本実施例は予測係数算出部３００とフレームエネ
ルギー算出部３０５と比較部３１０とラグ，長期予測ベ
クトル，重み付け長期予測ベクトルに０を代入するブロ
ック３１５とラグ検索部３２０とスイッチ３１２と３２
２を有する。更に閾値３２５を比較部３１０に入力する
ための端子を備えている。各構成要素は、信号線を介し
て接続されている。

【００３２】ここで各構成要素について説明する。予測
係数算出部３００は、音声入力信号をＡ／Ｄ変換（アナ
ログ／ディジタル変換）したディジタル音声信号１００
から線形予測分析をし、線形予測係数α_iを求める。
尚、前記Ａ／Ｄ変換を行うブロックは図示していない。

【００３３】フレームエネルギー算出部３０５は、前記
ディジタル信号１０から入力音声のパワーを測定する手
段である。

【００３４】比較部３１０は前記フレームエネルギー算
出部３０５より算出されたフレームエネルギーＲ₀と別
途に入力される閾値ＴＨとを比較し、スイッチング回路
に制御信号を出力する。

【００３５】スイッチ３１２及び３２２は比較部３１０
より出力された制御信号を入力とし、これにより予測係
数算出３００の出力結果をＹ側かＮ側、どちらに送信す
るかの切替動作を行う。

【００３６】ゼロ入力部３１５ではラグＬ，長期予測ベ
クトルｂ_L，重み付け長期予測ベクトルｂ′_Lの値を全
て０にする。

【００３７】ラグ検索部３２０では最適なラグＬの検
索，それに伴う長期予測ベクトルｂ_L，重み付き長期予
測ベクトルｂ′_Lの算出を行う。

【００３８】本実施例の処理手順を図４に示す。入力音
声の平均信号パワー（フレームエネルギー）を、有声音
と無声音または無音を判別する閾値ＴＨと比較し（４０
０）ＴＨより小さければ、ラグＬ，長期予測ベクトルｂ
_L，重み付け長期予測ベクトルｂ′_Lを０にする（４０
５）。フレームエネルギーが有声音と無声音または無音
を判別する閾値ＴＨより大きければ、以降は従来通りラ
グ検索を行う。

【００３９】本発明の第二の実施例のブロック図を図５
に示す。本実施例は前記実施例中のラグ検索３２０内の
構成に関してであり、畳み込み積分(Ｚ_L算出）部５０５
と評価関数算出部５１０と長期予測作成部５３０を有す
る。各構成要素は信号線を介して接続されている。

【００４０】ここで各構成要素について説明する。Ｚ_L
算出部はインパルス応答ｈ(n)を畳み込み積分してＺ_Lを
算出する。評価関数算出部５１０は、Ｚ_Lより評価関数
Ｇ_L，Ｃ_Lを算出する。誤差最小Ｌ選択部５１５は数５を
満たすＬを更新する。範囲決定部５２５は残差，前サブ
フレームのラグ値，予め定められた値ξだけずらした前
サブフレームのラグ値よりラグの検索範囲を決定する。
検索範囲制御部５２０は範囲決定部５２５に基づき検索
範囲を制御する。長期予測ベクトル作成部５３０は検索
されたラグより長期予測ベクトルを算出する。検索範囲
の全てのラグについて検索が完了すると、誤差最小Ｌ選
択部５１５は最終的に選択されたラグＬ_optを出力す
る。

【００４１】次に本実施例の処理手順を図６に示す。残
差信号と前サブフレームのラグ値Ｌ_oldより求められる
長期予測ベクトルの内積ＬＸを求める（６００）。次に
残差信号とξだけ変化された前サブフレームのラグ値Ｌ
_old±ξより求められる長期予測ベクトルの内積ＬＸξ+
及びＬＸξ-を求める（６０５）。ＬＸ及びＬＸξ±は
次の数８，数９により与えられる。

【００４２】

【数８】

【００４３】

【数９】

【００４４】ＬＸとＬＸξ+を比較し（６１０）、ＬＸ
の方が大きければ更にＬＸとＬＸξ-を比較し（６１
２）、ＬＸの方が大きければラグの検索範囲をｘ＊Ｌ
_old-ξからｎ＊Ｌ_old+ξまでとする（６２０）。

【００４５】ＬＸとＬＸξ+を比較し（６１０）、ＬＸ
の方が大きくても、ＬＸとＬＸξ-を比較し(６１２）、
ＬＸξ-の方が大きければξに１を足し（６１５）、数
１０を満たさないならば再びＬＸξ+及びＬＸξ-算出し
（６０５）、ＬＸと比較する（６１０）（６１２）。

【００４６】ＬＸとＬＸξ+を比較し（６１０）、ＬＸ
ξ+の方が大きければξに１を足し(６１５)、数１０を
満たさないならば再びＬＸξ+及びＬＸξ-を算出し(６
０５)、ＬＸと比較する（６１０）（６１２）。

【００４７】こうして検索範囲を探していき、ＬＸがＬ
Ｘξ+よりも大きくかつＬＸがＬＸξ-よりも大きいとき
は、検索範囲を限定する(６２０）。しかし検索範囲を
探していき数１０を満たすならば従来通りの全検索を行
う（６２５）。ラグの検索には従来技術と同じ方法を用
いる。

【００４８】

【数１０】

【００４９】本発明の第三の実施例のブロック図を図７
に示す。本実施例は第一の実施例と第二の実施例とを併
せたものである。従って図７の範囲限定ラグ検索（７０
０）の中身は図５である。

【００５０】次に本実施例の処理手順を図８に示す。

【００５１】入力音声の平均信号パワー（フレームエネ
ルギー）が、有声音と無声音または無音を判別する閾値
ＴＨと比較し（４００）、ＴＨより小さければラグＬ，
長期予測ベクトルｂL，重み付け長期予測ベクトルｂ′L
を０にする（４０５）。フレームエネルギーが有声音と
無声音または無音を判別する閾値ＴＨより大きければ、
以降は範囲限定ラグ検索を行う。

【００５２】残差信号と前サブフレームのラグ値Ｌ_old
より求められる長期予測ベクトルの内積ＬＸを求める
（６００）。次に残差信号とξだけ変化された前サブフ
レームのラグ値Ｌ_old±ξ より求められる長期予測ベク
トルの内積ＬＸξ+及びＬＸξ-を求める（６０５）。

【００５３】ＬＸとＬＸξ+を比較し（６１０）、ＬＸ
の方が大きければ更にＬＸとＬＸξ-を比較し（６１
２）、ＬＸの方が大きければラグの検索範囲をｘ＊Ｌ
_old-ξからｘ＊Ｌ_old+ξまでとする（６２０）。

【００５４】ＬＸとＬＸξ+を比較し（６１０）、ＬＸ
の方が大きくても、ＬＸとＬＸξ-を比較し（６１
２）、ＬＸξ-の方が大きければξに１を足し(６１
５）、数１０を満たさないならば再びＬＸξ+及びＬＸ
ξ-算出し（６０５）、ＬＸと比較する（６１０）（６
１２）。

【００５５】ＬＸとＬＸξ+を比較し（６１０）、ＬＸ
ξ+の方が大きければξに１を足し(６１５)、数１０を
満たさないならば再びＬＸξ+及びＬＸξ-を算出し(６
０５)、ＬＸと比較する（６１０）（６１２）。

【００５６】こうして検索範囲を探していき、ＬＸがＬ
Ｘξ+よりも大きくかつＬＸがＬＸξ-よりも大きいとき
は、検索範囲を限定する(６２０）。しかし検索範囲を
探していき数１０を満たすならば従来通りの全検索を行
う（６２５）。ラグの検索には従来技術と同じ方法を用
いる。

【００５７】

【発明の効果】本発明によるＶＳＥＬＰ符号化方法は入
力音声が無声音や無音の場合、ラグ検索を行う必要がな
く、長期予測ベクトルと重み付け長期予測ベクトルの計
算を削除できるので、ラグ検索の処理の低減が図れる。
また、入力音声が有声音の場合でも、前サブフレームの
ラグが見つかっている場合には、ラグの検索範囲を限定
できるので、ラグ検索の処理の低減が図れる。

【図面の簡単な説明】

【図１】本発明の一実施例のＶＳＥＬＰ符号器のブロッ
ク図。

【図２】本発明の一実施例のラグ検索の処理手順のフロ
ーチャート。

【図３】本発明の一実施例に係るラグ検索処理のブロッ
ク図。

【図４】本発明の一実施例に係るラグ検索の処理手順の
フローチャート。

【図５】本発明の第二の実施例に係るラグ検索処理のブ
ロック図。

【図６】本発明の第二の実施例に係るラグ検索の処理手
順のフローチャート。

【図７】本発明の第三の実施例に係るラグ検索処理のブ
ロック図。

【図８】本発明の第三の実施例に係るラグ検索の処理手
順のフローチャート。

【符号の説明】

１００…入力音声、１０１…線形予測分析部、１０２…
フレームエネルギー算出部、１０３…線形予測係数ソフ
ト補間部、１０４…聴覚重み付きフィルタ処理部、１０
５…重み付き合成フィルタ処理部、１０６…総重み付き
誤差算出部、１０７…長期予測ラグ選択部、１０８…コ
ード選択部、１０９…長期フィルタ状態、１１０…励起
コードブック、３００…予測係数算出、３０５…フレー
ムエネルギー算出、３１０…比較、３１２…スイッチ
Ａ、３１５…ゼロ入力、３２０…ラグ検索、３２２…ス
イッチＢ、３２５…閾値、５０５…Ｚ_L算出、５１０…
誤差評価、５１５…ラグ選択、５２０…検索範囲制御、
５２５…検索範囲決定、５３０…長期予測ベクトル、７
００…範囲限定ラグ検索。

Claims

【特許請求の範囲】

【請求項１】音声信号をディジタル信号に変換して符号
化するＶＳＥＬＰ符号化方法において、フレームエネル
ギー算出手段によるラグ検索手段によって算出されたフ
レームエネルギー値が予め定められた閾値よりも小さい
ときに、前記ラグ検索手段の動作を停止し、ラグの値を
予め定めた値に設定することを特徴とするＶＳＥＬＰ符
号化方法。
【請求項２】音声信号をディジタル信号に変換して符号
化するＶＳＥＬＰ符号化方法において、ラグの値を入力
して長期予測ベクトルを算出する手段と、サブフレーム
の残差を算出する手段を具備し、前のサブフレームで前
記ラグ検索手段によってラグ値が確定している場合(該
ラグ値をＬ_oldとする）、ラグＬに対する長期予測ベク
トルと現サブフレームの残差との内積値が、ξを予め定
めた正定数としてラグ(Ｌ_old＋ξ）に対する長期予測ベ
クトルと前記現サブフレームの残差との内積よりも大き
く、かつラグ(Ｌ_old−ξ）に対する長期予測ベクトルと
前記現サブフレームの残差との内積よりも大きい場合、
現サブフレームにおけるラグの検索範囲を、ｘを自然数
としてｘ＊Ｌ_old−ξからｘ＊Ｌ_old＋ξの範囲に限定す
ることを特徴とするＶＳＥＬＰ符号化方法。
【請求項３】請求項２記載のＶＳＥＬＰ符号化方法にお
いて、フレームエネルギー算出手段によるラグ検索手段
によって算出されたフレームエネルギー値が予め定めら
れた閾値よりも小さいときに、前記ラグ検索手段の動作
を停止し、ラグの値を予め定めた値に設定することを特
徴とするＶＳＥＬＰ符号化方法。