JPH07295597A - Vselp符号化方法 - Google Patents

Vselp符号化方法

Info

Publication number
JPH07295597A
JPH07295597A JP6089398A JP8939894A JPH07295597A JP H07295597 A JPH07295597 A JP H07295597A JP 6089398 A JP6089398 A JP 6089398A JP 8939894 A JP8939894 A JP 8939894A JP H07295597 A JPH07295597 A JP H07295597A
Authority
JP
Japan
Prior art keywords
lag
value
long
search
frame energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6089398A
Other languages
English (en)
Inventor
Shigetaka Motoyoshi
成宇 本吉
Michiko Tajimi
道子 多治見
Yoshiaki Asakawa
吉章 淺川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP6089398A priority Critical patent/JPH07295597A/ja
Publication of JPH07295597A publication Critical patent/JPH07295597A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】ラグ検索の処理量を低減したVSELP音声符
号化方法を提供する。 【構成】入力音声からフレーム毎に、入力音声のフレー
ムエネルギーを算出し、それが予め定められた閾値以下
ならラグ検索処理を行わずに音声を符号化する手段と、
ラグ検索を行う場合は、検索の範囲を限定し、ラグ検索
を行う手段を設ける。 【効果】無声音や無音が入力音声の場合、ラグ検索処理
の低減が図れる。ラグ検索を行う場合でも、検索範囲を
限定できるので、ラグ検索処理の低減を図れる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声を低ビットレート
で符号化するVSELP符号化方法に関する。
【0002】
【従来の技術】VSELPは、コードブックを用いて励
起(残差)信号をベクトル量子化する符号励起線形予測
符号化方法(CELP)の改良版であり、電波システム
開発センター(以下RCRという)によりディジタルセ
ルラー用の音声符号化方法として標準化されている。以
下、ディジタルセルラ用の音声符号化方法の標準規格書
(RCR STD−27)に基づき、従来技術を説明す
る。
【0003】VSELPの音声符号化レートは6700
bps 、1音声フレームは20ms、さらに1音声フレーム
は4つのサブフレーム(5ms)より構成される。
【0004】図1は、VSELP符号化方法におけるV
SELP符号化器の構成を示したものである。このVS
ELP符号化器は、線形予測分析部101と、フレーム
エネルギー算出部102と、線形予測係数ソフト補間部
103と、聴覚重み付きフィルタ処理部104と、重み
付き合成フィルタ処理部105と、総重み付き誤差算出
部106と、長期予測ラグ選択部107と、コード選択
部108と、長期フィルタ状態109と、励起コードブ
ック110を備えている。
【0005】線形予測分析部101は、入力音声100
に基づいて線形予測係数αi の算出を行う。フレームエ
ネルギー算出部102は、入力音声100が入力される
と、各フレーム毎に、入力音声の平均信号パワーを示す
フレームエネルギーR0 を求めて出力する。線形予測係
数ソフト補間部103は、各サブフレーム毎に前記線形
予測係数αi がソフト補間され、安定性判別を行い、入
力音声100に基づいて算出される残差パワーにより現
フレームで使用する線形予測係数を選択する。
【0006】聴覚重み付きフィルタ処理部104では、
入力音声100が各サブフレーム毎に線形予測係数αi
を用いた後述する聴覚重み付きフィルタによって、フィ
ルタ処理される。前記聴覚重み付きフィルタの出力を、
pとする。
【0007】以下、聴覚重み付きフィルタについて、説
明する。音声符号化などの量子化に伴う残差は、通常白
色雑音に近い一定のスペクトルを持つ。復号化による再
生音声をS,量子化雑音をNとする時、人間の聴覚特性
から、信号対雑音比(以下SN比という。)が大きな場
合の量子化雑音Nは、目立たないが、SN比が小さな場
合の量子化雑音Nは、目立つ傾向がある。そこで、量子
化雑音Nのスペクトルを再生音声Sのスペクトルに近い
形に成形してやると、量子化雑音Nのトータルパワーが
同じでも、量子化雑音が減ったように感じる。(マスキ
ング効果という。)聴覚重み付きフィルタは、このよう
な、人間の聴覚特性を利用して、残差信号に対し音声ス
ペクトル強度が小さい部分の周波数を強調するように機
能するものである。
【0008】重み付き合成フィルタ処理部105では、
各サブフレーム毎に線形予測係数αi を用いた重み付き
合成フィルタによって励起信号exの合成信号p′を作
成する。
【0009】前記聴覚重み付きフィルタ出力p(n)か
ら、重み付き合成フィルタ出力の合成信号p′の減算を
行い、総重み付き誤差算出部106で、総重み付き誤差
errを算出する。前記総重み付き誤差errが、最小と
なるように、後述する前記長期予測ラグ(声帯の振動周
期)選択部107で、長期予測ラグLを選択し、前記コ
ード(励起信号の基となる励起コードブックのインデッ
クス)選択部108で、コードCodeを選択する。
【0010】以上が、VSELP符号化器の処理概要で
ある。次に、長期予測ラグ選択について説明する。
【0011】VSELPはハイブリッド符号化である
が、線形予測分析よりスペクトル成分を処理し、適応コ
ードブックを用いた探索により残差信号を処理する。ピ
ッチ周期も後者の方法により処理され、ここでラグ検索
が用いられる。
【0012】ラグ検索のフローチャートを図2に示す。
前記ラグ検索では閉ループ法を用いる。検索範囲は2.
5msec(400Hz,20サンプル)から18.5msec
(55Hz,146サンプル)まである。まずLMAX
MINを初期化し、前述した検索範囲について以下の処
理を実行する。まずラグLに対する長期フィルタ状態コ
ードブックの出力であるbLを算出する(205)。bL
は次の数1より与えられる。
【0013】
【数1】
【0014】次にZLを数2より算出し(210)、評価
関数GL及びCLを算出する(215)(220)。
【0015】
【数2】
【0016】GLおよびCLは次の数3,数4より与えら
れる。
【0017】
【数3】
【0018】
【数4】
【0019】GL及びCLを用いて数5を計算する。
【0020】
【数5】
【0021】数5が成立すればLMAXを更新し、この時
のLをLMINとして記憶する。
【0022】以上の処理を繰り返して前述した全ての範
囲を検索し、最適なラグLを得る。一旦最適なラグLが
決定すれば、最適なラグLに対する長期予測ベクトルb
L(n)は数1で与えられる。更に、打切りを行わないイン
パルス応答h(n) 用い、長期予測ベクトルbL(n)の伝達
関数H(Z) に対するゼロ状態応答として重み付け長期予
測ベクトルb′Lを数6より計算する。
【0023】
【数6】
【0024】
【発明が解決しようとする課題】VSELPをディジタ
ルセルラ等の移動体無線端末に利用する場合、できるか
ぎりの端末小型化と低消費電力化が必要である。このた
めには、演算処理量を低減しなければならないが従来の
ラグ検索は、L=21〜146の範囲で全検索をおこな
っていたため、処理量が大きく問題となっていた。一
方、フレームエネルギーの小さなところではラグはみつ
からないこと、同一話者の場合は、一度ラグが探索され
ると以降はその値の付近の値、又はその値の整数倍に近
い値で見つかることが多いことが実験的に分かってい
る。
【0025】本発明は上記の2つの事柄を利用しVSE
LPの演算処理量を低減するものである。
【0026】
【課題を解決するための手段】本発明によるVSELP
音声符号化方法では、入力音声のフレームエネルギーに
よる有声音と無声音または無音を判別する閾値を設定
し、フレームエネルギーが閾値より小さい場合、ラグ検
索は行わない。フレームエネルギーが閾値より大きい場
合で、前のサブフレームにおけるラグが見つかっている
ときは、その時のラグの値(Loldとする)を用いた長期
予測ベクトルと残差との内積が、ラグをξだけずらした
時の長期予測ベクトルと残差の内積より大きいとき、ラ
グの検索範囲をx*Lold−ξからx*Lold+ξの範囲
に限定する。ここでξは予め定めた正の定数である。ま
たxの条件は数7に示す。
【0027】
【数7】
【0028】内積の比較結果が逆の場合、ξをより大き
な数にして検索範囲を拡げる。ただし拡げられた検索範
囲の上限x*Lold+ξ がx*Lold+Lold/2以上に
なった時は、従来通り全検索を行う。
【0029】フレームエネルギーが閾値より大きく前サ
ブフレームのラグが見つかっていないときは従来通り全
検索を行う。
【0030】
【作用】上記手段によれば、フレーム毎に入力音声のフ
レームエネルギーを設定した閾値と比較し、上回った場
合にはラグの検索を行う。閾値を下回った場合にはラグ
の検索を行わずラグの値をゼロに固定する。ラグの検索
を行う場合、前サブフレームのラグ値が見つかっている
ときは検索範囲の限定を行う。
【0031】
【実施例】本発明の第一の実施例のブロック図を図3に
示す。本実施例は予測係数算出部300とフレームエネ
ルギー算出部305と比較部310とラグ,長期予測ベ
クトル,重み付け長期予測ベクトルに0を代入するブロ
ック315とラグ検索部320とスイッチ312と32
2を有する。更に閾値325を比較部310に入力する
ための端子を備えている。各構成要素は、信号線を介し
て接続されている。
【0032】ここで各構成要素について説明する。予測
係数算出部300は、音声入力信号をA/D変換(アナ
ログ/ディジタル変換)したディジタル音声信号100
から線形予測分析をし、線形予測係数αiを求める。
尚、前記A/D変換を行うブロックは図示していない。
【0033】フレームエネルギー算出部305は、前記
ディジタル信号10から入力音声のパワーを測定する手
段である。
【0034】比較部310は前記フレームエネルギー算
出部305より算出されたフレームエネルギーR0 と別
途に入力される閾値THとを比較し、スイッチング回路
に制御信号を出力する。
【0035】スイッチ312及び322は比較部310
より出力された制御信号を入力とし、これにより予測係
数算出300の出力結果をY側かN側、どちらに送信す
るかの切替動作を行う。
【0036】ゼロ入力部315ではラグL,長期予測ベ
クトルbL ,重み付け長期予測ベクトルb′Lの値を全
て0にする。
【0037】ラグ検索部320では最適なラグLの検
索,それに伴う長期予測ベクトルbL,重み付き長期予
測ベクトルb′Lの算出を行う。
【0038】本実施例の処理手順を図4に示す。入力音
声の平均信号パワー(フレームエネルギー)を、有声音
と無声音または無音を判別する閾値THと比較し(40
0)THより小さければ、ラグL,長期予測ベクトルb
L,重み付け長期予測ベクトルb′Lを0にする(40
5)。フレームエネルギーが有声音と無声音または無音
を判別する閾値THより大きければ、以降は従来通りラ
グ検索を行う。
【0039】本発明の第二の実施例のブロック図を図5
に示す。本実施例は前記実施例中のラグ検索320内の
構成に関してであり、畳み込み積分(ZL算出)部505
と評価関数算出部510と長期予測作成部530を有す
る。各構成要素は信号線を介して接続されている。
【0040】ここで各構成要素について説明する。ZL
算出部はインパルス応答h(n)を畳み込み積分してZL
算出する。評価関数算出部510は、ZL より評価関数
L,CLを算出する。誤差最小L選択部515は数5を
満たすLを更新する。範囲決定部525は残差,前サブ
フレームのラグ値,予め定められた値ξだけずらした前
サブフレームのラグ値よりラグの検索範囲を決定する。
検索範囲制御部520は範囲決定部525に基づき検索
範囲を制御する。長期予測ベクトル作成部530は検索
されたラグより長期予測ベクトルを算出する。検索範囲
の全てのラグについて検索が完了すると、誤差最小L選
択部515は最終的に選択されたラグLoptを出力す
る。
【0041】次に本実施例の処理手順を図6に示す。残
差信号と前サブフレームのラグ値Lold より求められる
長期予測ベクトルの内積LXを求める(600)。次に
残差信号とξだけ変化された前サブフレームのラグ値L
old±ξより求められる長期予測ベクトルの内積LXξ+
及びLXξ-を求める(605)。LX及びLXξ±は
次の数8,数9により与えられる。
【0042】
【数8】
【0043】
【数9】
【0044】LXとLXξ+を比較し(610)、LX
の方が大きければ更にLXとLXξ-を比較し(61
2)、LXの方が大きければラグの検索範囲をx*L
old-ξからn*Lold+ξまでとする(620)。
【0045】LXとLXξ+を比較し(610)、LX
の方が大きくても、LXとLXξ-を比較し(612)、
LXξ-の方が大きければξに1を足し(615)、数
10を満たさないならば再びLXξ+及びLXξ-算出し
(605)、LXと比較する(610)(612)。
【0046】LXとLXξ+を比較し(610)、LX
ξ+の方が大きければξに1を足し(615)、数10を
満たさないならば再びLXξ+及びLXξ-を算出し(6
05)、LXと比較する(610)(612)。
【0047】こうして検索範囲を探していき、LXがL
Xξ+よりも大きくかつLXがLXξ-よりも大きいとき
は、検索範囲を限定する(620)。しかし検索範囲を
探していき数10を満たすならば従来通りの全検索を行
う(625)。ラグの検索には従来技術と同じ方法を用
いる。
【0048】
【数10】
【0049】本発明の第三の実施例のブロック図を図7
に示す。本実施例は第一の実施例と第二の実施例とを併
せたものである。従って図7の範囲限定ラグ検索(70
0)の中身は図5である。
【0050】次に本実施例の処理手順を図8に示す。
【0051】入力音声の平均信号パワー(フレームエネ
ルギー)が、有声音と無声音または無音を判別する閾値
THと比較し(400)、THより小さければラグL,
長期予測ベクトルbL,重み付け長期予測ベクトルb′L
を0にする(405)。フレームエネルギーが有声音と
無声音または無音を判別する閾値THより大きければ、
以降は範囲限定ラグ検索を行う。
【0052】残差信号と前サブフレームのラグ値Lold
より求められる長期予測ベクトルの内積LXを求める
(600)。次に残差信号とξだけ変化された前サブフ
レームのラグ値Lold±ξ より求められる長期予測ベク
トルの内積LXξ+及びLXξ-を求める(605)。
【0053】LXとLXξ+を比較し(610)、LX
の方が大きければ更にLXとLXξ-を比較し(61
2)、LXの方が大きければラグの検索範囲をx*L
old-ξからx*Lold+ξまでとする(620)。
【0054】LXとLXξ+を比較し(610)、LX
の方が大きくても、LXとLXξ-を比較し(61
2)、LXξ-の方が大きければξに1を足し(61
5)、数10を満たさないならば再びLXξ+及びLX
ξ-算出し(605)、LXと比較する(610)(6
12)。
【0055】LXとLXξ+を比較し(610)、LX
ξ+の方が大きければξに1を足し(615)、数10を
満たさないならば再びLXξ+及びLXξ-を算出し(6
05)、LXと比較する(610)(612)。
【0056】こうして検索範囲を探していき、LXがL
Xξ+よりも大きくかつLXがLXξ-よりも大きいとき
は、検索範囲を限定する(620)。しかし検索範囲を
探していき数10を満たすならば従来通りの全検索を行
う(625)。ラグの検索には従来技術と同じ方法を用
いる。
【0057】
【発明の効果】本発明によるVSELP符号化方法は入
力音声が無声音や無音の場合、ラグ検索を行う必要がな
く、長期予測ベクトルと重み付け長期予測ベクトルの計
算を削除できるので、ラグ検索の処理の低減が図れる。
また、入力音声が有声音の場合でも、前サブフレームの
ラグが見つかっている場合には、ラグの検索範囲を限定
できるので、ラグ検索の処理の低減が図れる。
【図面の簡単な説明】
【図1】本発明の一実施例のVSELP符号器のブロッ
ク図。
【図2】本発明の一実施例のラグ検索の処理手順のフロ
ーチャート。
【図3】本発明の一実施例に係るラグ検索処理のブロッ
ク図。
【図4】本発明の一実施例に係るラグ検索の処理手順の
フローチャート。
【図5】本発明の第二の実施例に係るラグ検索処理のブ
ロック図。
【図6】本発明の第二の実施例に係るラグ検索の処理手
順のフローチャート。
【図7】本発明の第三の実施例に係るラグ検索処理のブ
ロック図。
【図8】本発明の第三の実施例に係るラグ検索の処理手
順のフローチャート。
【符号の説明】
100…入力音声、101…線形予測分析部、102…
フレームエネルギー算出部、103…線形予測係数ソフ
ト補間部、104…聴覚重み付きフィルタ処理部、10
5…重み付き合成フィルタ処理部、106…総重み付き
誤差算出部、107…長期予測ラグ選択部、108…コ
ード選択部、109…長期フィルタ状態、110…励起
コードブック、300…予測係数算出、305…フレー
ムエネルギー算出、310…比較、312…スイッチ
A、315…ゼロ入力、320…ラグ検索、322…ス
イッチB、325…閾値、505…ZL 算出、510…
誤差評価、515…ラグ選択、520…検索範囲制御、
525…検索範囲決定、530…長期予測ベクトル、7
00…範囲限定ラグ検索。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】音声信号をディジタル信号に変換して符号
    化するVSELP符号化方法において、フレームエネル
    ギー算出手段によるラグ検索手段によって算出されたフ
    レームエネルギー値が予め定められた閾値よりも小さい
    ときに、前記ラグ検索手段の動作を停止し、ラグの値を
    予め定めた値に設定することを特徴とするVSELP符
    号化方法。
  2. 【請求項2】音声信号をディジタル信号に変換して符号
    化するVSELP符号化方法において、ラグの値を入力
    して長期予測ベクトルを算出する手段と、サブフレーム
    の残差を算出する手段を具備し、前のサブフレームで前
    記ラグ検索手段によってラグ値が確定している場合(該
    ラグ値をLoldとする)、ラグLに対する長期予測ベク
    トルと現サブフレームの残差との内積値が、ξを予め定
    めた正定数としてラグ(Lold+ξ)に対する長期予測ベ
    クトルと前記現サブフレームの残差との内積よりも大き
    く、かつラグ(Lold−ξ)に対する長期予測ベクトルと
    前記現サブフレームの残差との内積よりも大きい場合、
    現サブフレームにおけるラグの検索範囲を、xを自然数
    としてx*Lold−ξからx*Lold+ξの範囲に限定す
    ることを特徴とするVSELP符号化方法。
  3. 【請求項3】請求項2記載のVSELP符号化方法にお
    いて、フレームエネルギー算出手段によるラグ検索手段
    によって算出されたフレームエネルギー値が予め定めら
    れた閾値よりも小さいときに、前記ラグ検索手段の動作
    を停止し、ラグの値を予め定めた値に設定することを特
    徴とするVSELP符号化方法。
JP6089398A 1994-04-27 1994-04-27 Vselp符号化方法 Pending JPH07295597A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6089398A JPH07295597A (ja) 1994-04-27 1994-04-27 Vselp符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6089398A JPH07295597A (ja) 1994-04-27 1994-04-27 Vselp符号化方法

Publications (1)

Publication Number Publication Date
JPH07295597A true JPH07295597A (ja) 1995-11-10

Family

ID=13969549

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6089398A Pending JPH07295597A (ja) 1994-04-27 1994-04-27 Vselp符号化方法

Country Status (1)

Country Link
JP (1) JPH07295597A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100399419C (zh) * 2004-12-07 2008-07-02 腾讯科技(深圳)有限公司 一种检测静音帧的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100399419C (zh) * 2004-12-07 2008-07-02 腾讯科技(深圳)有限公司 一种检测静音帧的方法

Similar Documents

Publication Publication Date Title
KR100487136B1 (ko) 음성복호화방법및장치
JP3707116B2 (ja) 音声復号化方法及び装置
US5933803A (en) Speech encoding at variable bit rate
CN1307614C (zh) 合成语音的方法和装置
JP3653826B2 (ja) 音声復号化方法及び装置
JP2964344B2 (ja) 符号化/復号化装置
JP3680380B2 (ja) 音声符号化方法及び装置
US20050053130A1 (en) Method and apparatus for voice transcoding between variable rate coders
KR100452955B1 (ko) 음성부호화방법, 음성복호화방법, 음성부호화장치, 음성복호화장치, 전화장치, 피치변환방법 및 매체
JP4040126B2 (ja) 音声復号化方法および装置
JP2001005474A (ja) 音声符号化装置及び方法、入力信号判定方法、音声復号装置及び方法、並びにプログラム提供媒体
KR20010073069A (ko) 음성코딩을 위한 적응성 표준
JPH09190195A (ja) 音声信号のスペクトル形状調整方法および装置
JPH05265496A (ja) 複数のコードブックを有する音声符号化方法
US6240383B1 (en) Celp speech coding and decoding system for creating comfort noise dependent on the spectral envelope of the speech signal
JPH07225599A (ja) 音声の符号化方法
JPH07295597A (ja) Vselp符号化方法
EP0694907A2 (en) Speech coder
JP3510643B2 (ja) 音声信号のピッチ周期処理方法
JP4230550B2 (ja) 音声符号化方法及び装置、並びに音声復号化方法及び装置
JP4826580B2 (ja) 音声信号の再生方法及び装置
JP3192051B2 (ja) 音声符号化装置
JPH05165497A (ja) コード励振線形予測符号化器及び復号化器
JP2003066983A (ja) 音声合成装置および音声合成方法、並びに、プログラム記録媒体
JPH0844398A (ja) 音声符号化装置