JPH07210199A - 音声符号化方法および音声符号化装置 - Google Patents

音声符号化方法および音声符号化装置

Info

Publication number
JPH07210199A
JPH07210199A JP6004687A JP468794A JPH07210199A JP H07210199 A JPH07210199 A JP H07210199A JP 6004687 A JP6004687 A JP 6004687A JP 468794 A JP468794 A JP 468794A JP H07210199 A JPH07210199 A JP H07210199A
Authority
JP
Japan
Prior art keywords
coefficient
frame
interpolation
linear prediction
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6004687A
Other languages
English (en)
Inventor
Ayumi Koide
歩 小出
Toshiyuki Matsuda
俊幸 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP6004687A priority Critical patent/JPH07210199A/ja
Publication of JPH07210199A publication Critical patent/JPH07210199A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】入力音声の平均信号パワーの大きさによって、
有声音と、無声音(又は無音)の判定を行い、無声音
(又は無音)と判定された場合に、音声符号化における
ソフト補間処理の低減を図ること。 【構成】入力音声から、所定時間間隔(フレーム)毎
に、線形予測分析を行って線形予測係数を求める音声符
号化装置であって、音声を入力する入力部と、フレーム
毎に入力音声の平均信号パワー(フレームエネルギー)
を算出するフレームエネルギー算出部と、線形予測係数
を求める処理を少なくとも行う符号化処理部と、線形予
測係数を出力する出力手段とを備える。そして、前記符
号化処理部は、フレームエネルギーが、「有声音」と、
「無声音および無音」とを判別するための閾値以上と判
断した場合のみ、補間係数、無補間係数の両係数を使用
した逆フィルタ処理を行い、両係数のうち、残差パワー
が小さな方の係数を、現フレームのサブフレーム毎の線
形予測係数とし、前記出力手段は、前記符号化処理部に
よって求めた線形予測係数を出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自動車電話装置、携帯
電話装置を含む各種通信機器に応用される、音声符号化
方法および装置に関する。
【0002】
【従来の技術】従来の方法を、音声符号化アルゴリズム
の一例である、ベクトル和励起線形予測符号化方式(以
下「VSELP」と称する)を例にとり説明する。
【0003】VSELPは、複数種類の音源を備えてい
るコードブックを使用して、励起(残差)信号をベクト
ル量子化する符号励起線形予測符号化方式(「CEL
P」と称する)の改良方式であり、電波システム開発セ
ンター(以下「RCR」と称する)により、ディジタル
セルラー用の音声符号化方式として、標準化されてい
る。
【0004】以下、ディジタルセルラ用の音声符号化方
式の標準規格書(RCR STD−27)に基づき、従
来技術を説明する。
【0005】VSELP方式の音声符号化レートは、6
700(bps)、1音声フレームは、20(ms)で
あり、さらに、1音声フレームは、4つのサブフレーム
(5(ms))を有して構成される。
【0006】図1に、かかるVSELP符号化方式を使
用した、VSELP符号化器の構成図を示す。
【0007】このVSELP符号化器は、線形予測分析
部101と、フレームエネルギー算出部102と、線形
予測係数ソフト補間部103と、聴覚重み付きフィルタ
処理部104と、重み付き合成フィルタ処理部105
と、総重み付き誤差算出部106と、長期予測ラグ選択
部107と、コード選択部108と、長期フィルタ状態
109と、励起コードブック110を有して構成され
る。
【0008】なお、各構成要素は、例えば、CPU、R
OM、RAM、各種CMOS等の電子デバイスによって
実現される。
【0009】線形予測分析部101は、入力される入力
音声100に基づいて、線形予測係数αiの算出を行う
手段である。
【0010】フレームエネルギー算出部102は、入力
音声100が入力されると、各フレーム毎に、入力音声
の平均信号パワ−を示す、フレームエネルギー(R0
を求めて出力する手段である。
【0011】線形予測係数ソフト補間部103は、後に
説明する線形予測係数のソフト補間処理を行う手段であ
る。
【0012】聴覚重み付きフィルタ処理部104は、各
サブフレーム毎に、入力音声100を、線形予測係数α
iを用いた、後述する聴覚重み付きフィルタによって、
フィルタ処理する手段である。なお、前記聴覚重み付き
フィルタの出力をpとし、以下、かかる聴覚重み付きフ
ィルタについて説明する。
【0013】音声符号化等の量子化処理に伴う残差は、
通常、白色雑音に近い、広い周波数領域に渡って一定の
スペクトルを有する。復号化による再生音声信号を
「S」、量子化雑音を「N」とする時、人間の聴覚特性
を鑑みるに、信号対雑音比(以下、「SN比」と称す
る)が大きな場合には、量子化雑音Nは、さほど気にな
らないが、SN比が小さな場合には、量子化雑音Nは、
気になる傾向にある。
【0014】そこで、量子化雑音Nのスペクトルを、再
生音声信号Sのスペクトルに近いスペクトルを呈するよ
うに成形処理すると、量子化雑音Nのト−タルパワ−が
同じでも、量子化雑音が減少したように、聞き取れる
(かかる効果を、「マスキング効果」と称する)。
【0015】聴覚重み付きフィルタは、このように、人
間の聴覚特性を考慮して、残差信号に対し、音声スペク
トル強度が小さな周波数帯域に存在する信号を強調する
機能を有する。
【0016】次に、重み付き合成フィルタ処理部105
は、各サブフレーム毎に、線形予測係数αiを使用し、
重み付き合成フィルタによって、励起信号exの合成信
号p’を生成する。
【0017】前記聴覚重み付きフィルタの出力信号p
と、重み付き合成フィルタ出力の合成信号p’との減算
処理を行い、総重み付き誤差算出部106は、かかる減
算処理結果に基づき、総重み付き誤差errを算出す
る。
【0018】総重み付き誤差errが、最小となるよう
に、長期予測ラグ(「ラグ」とは、声帯の振動周期であ
る)選択部107によって、長期フィルタ状態109に
おける、長期予測ラグLagを選択、設定し、また、コ
ード(励起信号の信号源を備える励起コードブックの、
インデックスである)選択部108で、励起コードブッ
ク110からコード(Code)を選択する。
【0019】以上が、VSELP符号化器の構成概要で
ある。次に、ソフト補間処理について説明する。
【0020】線形予測分析を使用した音声符号化処理に
おいては、線形予測係数を求めることが必要不可欠であ
る。しかしながら、各サブフレーム毎に、サブフレ−ム
の中央を分析の中心として線形予測係数を求めると、そ
の処理量が膨大になるため、特に、各フレームにおける
第4サブフレームの中央を分析の中心として、フレーム
毎に対応する線形予測係数を求め、他のサブフレームで
は、前フレームと現フレームの線形予測係数を使用し
て、線形予測係数の補間処理を行う、いわゆるソフト補
間処理が、一般的に行われている。
【0021】ここで、VSELPのソフト補間の処理手
順のフローチャートを図2に示し、該フローチャートを
参照して、処理手順について説明する。
【0022】まず、ステップ200において、前記ソフ
ト補間では、最初に補間係数を生成する。補間係数を生
成するために、音声符号器は、フレームの第1、第2お
よび第3サブフレームに対し、第4サブフレームの線形
予測係数に基づいて、線形予測係数αiを、線形補間に
よって求める。
【0023】各サブフレームのαiに対して、補間係数
は、例えば次式で与えられる。
【0024】
【数1】
【0025】
【数2】
【0026】
【数3】
【0027】
【数4】
【0028】ただし、αiprは、前フレームにおけるi
番目のサブフレ−ムにおける線形予測係数、αiは、現
フレームにおけるi番目のサブフレ−ムにおける線形予
測係数である。また、Iは、サブフレ−ム番号である。
【0029】すなわち、第1サブフレームは前フレーム
の影響を大きく受けるので式1を、第2サブフレーム
は、前フレームと現フレームの影響が等しいので式2
を、第3サブフレームは、現フレームの影響が大きいの
で式3を使用して補間係数を定める。第4サブフレーム
は、そのフレームに対して求めた、線形予測係数αi
使用する。
【0030】次に、ステップ203において、補間され
たサブフレームに対し、フィルタの安定性(すなわち、
有界の入力に対してフィルタ出力が有界であること)の
判別のため、αIを、線形予測係数と一意に対応する係
数である、反射係数rIに変換処理する。ステップ20
3における、フィルタ安定性判別の処理の結果、フィル
タが不安定であれば(すなわち、任意の反射係数rI
絶対値が1以上の場合)、ソフト補間ビット(復号器で
補間係数を使用するか、あるいは、無補間係数を使用す
るかを判断するためのビットである)を「0」に設定し
(ステップ208)、そのサブフレームに対して、次式
で示すような無補間係数を使用する(ステップ21
0)。
【0031】
【数5】
【0032】
【数6】
【0033】
【数7】
【0034】
【数8】
【0035】
【数9】
【0036】ただし、R0prは、前フレームにおけるフ
レームエネルギーであり、また、R0は、現フレームに
おけるフレームエネルギーである。
【0037】また、ステップ201において、無補間係
数は、次のように生成される。
【0038】第1サブフレームに使用する無補間係数
は、前フレーム影響が大きいので、前フレームの線形予
測係数を採用し、式5で与えられる値を使用する。
【0039】第3サブフレームに使用する無補間係数
は、現フレームの影響が大きいので、現フレームの線形
予測係数を採用し、式8で与えられる値を使用する。
【0040】第2サブフレームは、前フレームまたは現
フレームのどちらか高いフレームエネルギーの値を有す
る方の線形予測係数を使用する。仮に、両フレームにお
けるフレームエネルギーの値が等しければ、第2サブフ
レームは、前フレームの線形予測係数を使用する。した
がって式6、7によって無補間係数が与えられる。
【0041】以上の処理によって、補間係数、無補間係
数が生成されることになる。
【0042】さて、ステップ204、205において、
1フレーム分の音声信号のサンプルは、補間係数と無補
間係数のそれぞれを使用して、逆フィルタ処理され、補
間係数、無補間係数の、それぞれに対応する残差パワー
を計算する。
【0043】そして、ステップ206において、残差パ
ワ−の比較処理を行い、より小さな残差パワーをもたら
す係数を選択する。ここで、残差パワーが同一であれ
ば、無補間係数を使用するようにしておく。
【0044】無補間係数による残差パワ−ENE_N
が、補間係数による残差パワ−ENE_Iより小さけれ
ば、ソフト補間ビットを「0」に設定し(ステップ20
8)、無補間係数の使用を決定する(ステップ21
0)。逆に、補間係数による残差パワ−ENE_Iが、
無補間係数による残差パワ−ENE_Nより小さけれ
ば、ソフト補間ビットを「1」に設定し(ステップ20
7)、補間係数の使用を決定する(ステップ209)。
かかるソフト補間ビットは、復号器に伝送され、復号化
側で、補間係数を使用するのか、あるいは、無補間係数
を使用するかを判断するためのビットとして使用され
る。以上、図2を参照して、VSELP符号器における
ソフト補間の処理手順を説明した。
【0045】
【発明が解決しようとする課題】ところで、VSELP
は、主としてディジタルセルラ等の移動体無線端末に適
用されるため、可能な限り端末小型化、低消費電力化を
図ることが要求される。
【0046】かかる要求に応えるためには、端末内の音
声処理において、演算処理を可能な限り低減する必要が
ある。
【0047】無声音や無音が入力音声として入力された
場合、ソフト補間によって無補間係数が選ばれることが
ほとんどである。従来の技術においては、どのような入
力音声に対しても、補間係数と無補間係数を演算し求め
なければならないものであった。かかる係数を求める演
算処理と同時に、補間係数、無補間係数のそれぞれを使
用した、逆フィルタ処理を行い、補間係数、無補間係数
それぞれに対応する、残差パワーを計算し、比較を行う
必要も有った。
【0048】しかしながら、電話等を使用する際、使用
中の音声信号においては、無音部が、通信期間中の大部
分を占め、前述した、補間係数の算出や逆フィルタ処
理、残差パワーの算出、比較の処理等が無駄になってし
まう。これは、携帯電話の小型化、軽量化、低消費電力
化を図る上での、重大な問題点である。
【0049】
【課題を解決するための手段】上記課題を解決するため
に、以下の手段が考えられる。
【0050】すなわち、入力音声から、所定時間間隔
(フレーム)毎に、線形予測分析を行って線形予測係数
を求める方法であって、フレーム毎に入力音声の平均信
号パワー(フレームエネルギー)を算出し、フレームエ
ネルギーが、予め定められた閾値より小さい場合、前フ
レームおよび現フレームのいずれかの線形予測係数にも
とづいて、予め定めた規則に従って定められる係数であ
る無補間係数を、現フレームのサブフレーム毎の線形予
測係数とする。また、前記フレームエネルギーが、前記
閾値以上の場合、前フレームおよび現フレームの線形予
測係数の重み付け加算値である補間係数、前記無補間係
数の両係数に対する逆フィルタ処理を、両係数の各々に
対して行い、該処理の結果の出力信号のパワーと入力音
声信号のパワーとの差分である残差パワーを、両係数の
各々に対して求め、両係数に対する残差パワーを比較
し、残差パワーが小さな方の係数を、現フレームのサブ
フレーム毎の線形予測係数とする音声符号化方法であ
る。
【0051】なお、前記予め定められた閾値は、「有声
音」と、「無声音および無音」とを判別するための閾値
であることが好ましい。
【0052】また、以下の装置も考えられる。
【0053】音声を入力する入力部と、フレーム毎に入
力音声の平均信号パワー(フレームエネルギー)を算出
するフレームエネルギー算出部と、線形予測係数を求め
る処理を少なくとも行う符号化処理部と、線形予測係数
を出力する出力手段とを備えた構成にする。
【0054】そして、前記符号化処理部は、前記フレー
ムエネルギー算出部で算出したフレームエネルギーが、
予め定められた閾値より小さいと判断した場合、前フレ
ームおよび現フレームのいずれかの線形予測係数にもと
づいて、予め定めた規則に従って定められる係数である
無補間係数を、現フレームのサブフレーム毎の線形予測
係数とし、逆に、前記フレームエネルギーが、前記閾値
以上と判断した場合、前フレームおよび現フレームの線
形予測係数の重み付け加算値である補間係数、前記無補
間係数の両係数に対する逆フィルタ処理を、両係数の各
々に対して行い、該処理の結果の出力信号のパワーと入
力音声信号のパワーとの差分である残差パワーを、両係
数の各々に対して求め、両係数に対する残差パワーを比
較し、残差パワーが小さな方の係数を、現フレームのサ
ブフレーム毎の線形予測係数とし、また、前記出力手段
は、前記符号化処理部によって求められた線形予測係数
を出力する符号化装置である。なお、前記予め定められ
た閾値は、「有声音」と、「無声音および無音」とを判
別するための閾値であることが好ましい。
【0055】
【作用】前述した課題を解決するために、入力音声のフ
レームエネルギーの大きさによって「有声音」と、「無
声音および無音」を判別する閾値を予め設定し、フレー
ムエネルギーが前記閾値より小さい場合、無補間係数を
使用し、補間係数を求めるための演算を行わないことに
した。ただし、話者の入力音声波形と比べて、背景雑音
のレベルが小さい場合には、背景雑音も、無声音又は無
音と判別される。そこで、それぞれのフレームエネルギ
ーが前記閾値より大きい場合、従来と同様に補間係数、
無補間係数をそれぞれ求め、補間係数、無補間係数のそ
れぞれを使用して、逆フィルタ処理を行い、残差パワー
の小さな方の係数を選択する。
【0056】すなわち、上記手段によれば、フレーム毎
に入力音声のフレームエネルギーの大きさを、予め設定
した閾値と比較し、フレームエネルギーが閾値を越えた
場合には、従来技術と同様の処理を行うが、閾値を越え
ない場合には、無補間係数のみを算出し、補間係数の計
算は一切行わない。
【0057】
【実施例】以下、本発明の実施例について、図面を参照
して説明する。
【0058】本発明は、従来の音声符号化システムにお
いて、線形予測係数のソフト補間を行う処理の低減を図
ることを目的としたものである。
【0059】図3は、本発明にかかる実施例における、
線形予測係数のソフト補間処理を行う手段の構成図であ
る。
【0060】本実施例は、無補間係数算出部300と、
フレームエネルギー比較部301と、補間/無補間決定
部302と、補間係数算出部303と、反射係数変換部
304と、フィルタ安定性判別部305と、残差パワー
算出部306と、残差パワー比較部307と、補間/無
補間最終決定部308を有して構成される。
【0061】なお、各構成要素は、例えば、DSP、C
PU、ROM、RAM、各種CMOS等の電子デバイス
にて実現可能である。
【0062】無補間係数算出部300は、次に述べる、
無補間係数αNの算出を行う手段である。第1サブフレ
ームの無補間係数は、前フレームの影響が大きいので、
前フレームの線形予測係数を採用し、式5に示すように
与える。第3サブフレームに使用する無補間係数は、現
フレームの影響が大きいので、現フレームにおける、線
形予測係数を使用し、式8に示すように与える。
【0063】また、第2サブフレームに使用する無補間
係数は、前フレーム、または、現フレームの、どちらか
高いフレームエネルギー値を有する方の、線形予測係数
を使用する。したがって、式6、7に示すように与え
る。なお、各フレームでは、全てのサブフレームの線形
予測係数を求めるのではなく、例えば、各フレームにお
ける第4サブフレームの中央で求めた、線形予測係数
を、当該フレームの線形予測係数とし、代表させれば良
い。このことは、従来技術で述べたことと、全く同様で
ある。したがって、式5から式9において、αiprは、
前フレームの第4サブフレームにおける、また、α
iは、現フレームの第4サブフレームにおける線形予測
係数である。
【0064】次に、フレームエネルギー比較部301
は、現フレームのフレームエネルギーと、「有声音」
と、「無声音および無音」を判別するための閾値(T
H)との比較を行い、閾値(TH)の方が大きければ、
そのフレームに対しては、補間/無補間決定部302に
よって、「無補間」である旨が決定がされる。逆に、現
フレームのフレムエネルギーの方が、閾値(TH)より
大きければ、前記補間/無補間決定部302によって、
「補間」である旨が決定がされる。
【0065】補間の決定がされた場合、補間係数算出部
303では、次に述べる、補間係数αIの算出を行う。
【0066】第1サブフレームの補間係数は、前フレー
ムの影響を大きく受けるので、式1に示すように与え
る。第2サブフレームの補間係数は、前フレームと現フ
レームの影響が等しいので、式2に示すように与える。
第3サブフレームの補間係数は、現フレームの影響が大
きいので、式3に示すように与える。第4サブフレーム
の補間係数は、現フレームの線形予測係数を使用する。
【0067】反射係数変換部304は、フィルタ安定性
の判別を行うために、線形予測係数と一意に対応する係
数である反射係数rIに、線形予測係数を変換する手段
である。
【0068】フィルタ安定性判別部305は、前記反射
係数rIの絶対値が1以上の場合、フィルタが不安定で
あると判別し、そのサブフレームに対して、無補間係数
αNを使用することを判定する手段である。
【0069】残差パワー算出部306は、補間係数
αI、無補間係数αNのそれぞれを使用して逆フィルタ処
理され求められた、補間係数αI、無補間係数αNのそれ
ぞれに対応する、残差パワーを求める手段である。
【0070】残差パワー比較部307は、補間係数αI
に対応する残差パワーENE_Iと無補間係数αNに対
応する残差パワーENE_Nとの比較を行うための手段
である。
【0071】補間/無補間最終決定部308は、補間係
数に対応する残差パワーENE_Iより、無補間係数α
Nに対応する残差パワーENE_Nの方が小さければ、
「無補間」の旨の決定をする。逆に、無補間係数αN
対応する残差パワーENE_Nより、補間係数に対応す
る残差パワーENE_Iの方が小さければ、「補間」の
旨の決定を行う手段である。
【0072】従来のVSELPのソフト補間と異なり、
現フレームの線形予測係数αiと前フレームの線形予測
係数αiprから、無補間係数算出部300で、無補間係
数αNを生成した後、フレームエネルギー比較部301
で、現フレームのフレームエネルギーR0と、「有声
音」と、「無声音および無音」を判定する、予め定めた
閾値THとの比較を行う。そして、かかる比較結果に応
じて所定の処理を行うようにしている。なお、前記閾値
は、例えば、統計的な処理に基づいて次のように設定す
る。
【0073】男女、さまざまな年齢の人間の音声データ
を収集・分析し、フレームエネルギーの平均値を算出
し、その平均値から、「有声音」と、「無声音および無
音」を判定するための閾値を決定すればよい。
【0074】補間/無補間決定部302では、フレーム
エネルギーR0が、閾値THより小さければ、無補間の
決定をする。逆に、フレームエネルギーR0が、閾値T
H以上ならば、補間係数算出部303によって、補間係
数αIを生成する。
【0075】かかる補間係数αIを生成した後、反射係
数変換部304によって、前記補間係数αIを、反射係
数rIに変換する。
【0076】フィルタ安定性判別部305では、補間さ
れたサブフレームに対し、フィルタの安定性の判別を行
い、フィルタ安定性判別の結果、フィルタが不安定であ
れば(すなわち、前記反射係数rIの絶対値が1以上の
場合)、そのサブフレームに対して、無補間の決定をす
る。フィルタが安定と判定されれば、残差パワー算出部
306によって、1フレーム分の音声サンプルが、補間
係数αI、無補間係数αNのそれぞれを使用して逆フィル
タ処理し、補間係数αI、無補間係数αNのそれぞれに対
応する、残差パワーを計算する処理を行う。
【0077】残差パワー比較部307では、補間係数α
Iによる残差パワーENE_Iと、無補間係数αNによる
残差パワーENE_Nとの比較処理を行い、補間/無補
間最終決定部308によって、低い方の残差パワーをも
たらす方の係数を採用することを決定をする。なお、残
差パワーの値が同一であれば、例えば、無補間係数を採
用する決定を行う。
【0078】無補間係数が選択されれば、ソフト補間ビ
ット(復号器で補間係数を使用するか、または、無補間
係数を使用するかを判断するビットである)を「0」に
し、また、補間係数が選択されれば、ソフト補間ビット
を「1」に設定する。
【0079】このように、入力音声が無声音や無音の場
合、補間係数を算出する必要がなく、逆フィルタ処理に
よる残差パワーの計算と比較を削除できるので、ソフト
補間の処理の低減が図れる。
【0080】次に、図4に、本発明に係る、「有声音」
と、「無声音および無音」を判別するための閾値を更新
するための処理手段の一例の構成図を示す。
【0081】本実施例である、閾値の更新処理手段は、
フレームエネルギー格納部400と、平均フレームエネ
ルギー算出部401と、閾値更新判定部402と、閾値
更新部403を有して構成される。
【0082】なお、各構成要素は、例えば、CPU、R
OM、RAM、各種CMOS等の電子デバイスにて実現
可能である。
【0083】フレームエネルギー格納部400では、第
4サブフレームの中央を中心とする、例えば、20(ms
ec)区間における、平均信号パワー(フレームエネルギ
ー)を格納する手段である。
【0084】平均フレームエネルギー算出部401で
は、過去nフレーム(n>0かつ整数である)のフレー
ムエネルギーの平均値(Rmean)を算出する手段であ
る。
【0085】閾値更新判定部402は、過去nフレーム
のフレームエネルギーの平均値Rme anと、「有声音」と
「無声音および無音」を判別する閾値(TH)の比較を
行い、その差の絶対値が、X(dB)(Xは任意の値で、
予め定めておく)以内であれば、閾値(TH)の更新は
行わない旨の判定を行う。逆に、その差の絶対値が、X
(dB)以上ならば、閾値(TH)の更新を行う旨の判定
を行う。
【0086】閾値更新部403は、閾値更新判定部40
2で閾値(TH)の更新を行うように判定された場合
に、例えば、後述する式11のように、新しい閾値が更
新される。
【0087】なお、念のため述べておくが、全実施例に
おいて、閾値(TH)は、「有声音」と「無声音および
無音(少なくとも一方でもよい)」を区別するための、
ある値である。
【0088】次に、閾値の更新処理を動作を説明する。
【0089】まず、現フレームのフレームエネルギーR
0のデータは、フレームエネルギー格納部400に格納
され、格納されたフレームエネルギーのデータを使用し
て、平均フレームエネルギー算出部401で、過去nフ
レーム(n>0かつ整数である)のフレームエネルギー
の平均値Rmeanを算出する。閾値更新判定部402で
は、例えば、次式を満足すれば、閾値の更新処理を行う
旨の判定を行うようにしておけばよい。
【0090】
【数10】
【0091】すなわち、Rmeanと、閾値(TH)との差
の絶対値がX(dB)(Xは、予め設定しておく任意の値
である)以上であれば、閾値の更新を行うように判定す
る。
【0092】Rmeanと閾値(TH)の差の絶対値がX
(dB)以内であれば、閾値の更新は行わない旨の判定を
行う。閾値の更新が行われる旨の判定が行われれば、閾
値更新部403では、例えば次式にしたがって、新しい
閾値に閾値を更新する。
【0093】
【数11】
【0094】すなわち、RmeanよりY(dB)(Yは、予
め設定しておく任意の値である)小さな値を、「有声
音」と、「無声音および無音」を判別する、新たな閾値
(TH)として更新する。(ただし、X>Yとする。) このような「有声音」と、「無声音および無音」を判別
する閾値は、上記のように自動的更新してもよいが、ユ
ーザーが、操作により設定し直すことも可能である。こ
のためには、更新値を入力する、ディップスイッチ等の
入力手段を、前記閾値更新部に備えた構成とし、さら
に、閾値更新部は、入力手段を介してユーザーが入力し
た、更新値を受け付ける処理部を備えた構成にしておけ
ば良い。なお、かかる処理部は、例えば、DSP、CP
U、ROM、RAM、各種CMOS等の電子デバイスに
て実現可能である。
【0095】このように、「有声音」と、「無声音およ
び無音」を判定する閾値を、新たに設定することで、各
ユーザーに対応して、適切な線形予測係数の補間が行え
る手段を実現できるようになる。
【0096】以上のような、本発明の実施例における更
新動作を含めた一連の処理を、図5に示すフローチャー
トを参照して説明する。
【0097】まず、ステップ500において、前フレー
ムの線形予測係数と現フレームの線形予測係数を使用し
て、式5、6、7、8で示したように、無補間係数αN
を生成する。
【0098】次に、ステップ501において、入力音声
の平均信号パワー(フレームエネルギー)が、前記閾値
(TH)より小さければ、ソフト補間ビット(復号器で
補間係数を使うか無補間係数を使うか判断するビット)
を「0」に設定して(ステップ509)、無補間係数の
使用を決定する(ステップ511)。
【0099】逆に、フレームエネルギーが、前記閾値T
Hより大きければ(ステップ501)、以降は従来技術
と同じような処理を行う。
【0100】まず、前フレームの線形予測係数と現フレ
ームの線形予測係数を使用して、式1、2、3、4のに
したがって、補間係数αIを生成する(ステップ50
2)。そして、ステップ503で、補間処理されたサブ
フレームに対し、フィルタの安定性(すなわち、有界の
入力に対してフィルタ出力が有界であること)を判別す
るため、αIを反射係数(線形予測係数と一意に対応す
る係数である)rIに、変換する。
【0101】フィルタ安定性判別(ステップ504)の
結果、フィルタが不安定であれば(すなわち、任意の反
射係数rIの絶対値が1以上の場合)、ソフト補間ビッ
トを「0」に設定して(ステップ509)、そのサブフ
レームに対して無補間係数を使用することにする(ステ
ップ511)。
【0102】ステップ505、506において、1フレ
ーム分の音声信号のサンプルは、補間係数と無補間係数
のそれぞれを使用して逆フィルタ処理し、補間係数、無
補間係数それぞれに対応する残差パワーを計算し、残差
パワーの比較を行う(ステップ507)そして、低い方
の残差パワーをもたらす係数を選択する。なお、残差パ
ワーの値が同一であれば、例えば、無補間係数を使用す
るようにしておく。
【0103】無補間係数による残差パワーENE_N
が、補間係数による残差パワーENE_Iより小さけれ
ば、ソフト補間ビットを「0」に設定し(ステップ50
9)、無補間係数の使用を決定する(ステップ51
1)。
【0104】逆に、補間係数による残差パワーENE_
Iが、無補間係数による残差パワーENE_Nより小さ
ければ、ソフト補間ビットを「1」に設定し(ステップ
508)、補間係数の使用を決定する(ステップ51
0)。
【0105】ソフト補間ビットは、復号器に伝送され、
復号化側で補間係数を使用するか、または、無補間係数
を使用するかを判断するたののビットとして使用され
る。
【0106】次に、閾値の更新処理を順に、説明する。
【0107】まず、ステップ512において、過去nフ
レーム(n>0かつ整数)のフレームエネルギーの平均
値Rmeanを算出する。
【0108】次に、ステップ513において、フレーム
エネルギーの平均値Rmeanと、前記閾値(TH)の差の
絶対値がX(dB)(Xは、予め設定された任意の値)以
上であれば、閾値の更新を行う旨の判定を行い、逆に、
フレームエネルギーの平均値Rmeanと、閾値(TH)と
の差の絶対値が、X(dB)以内であれば、閾値の更新は
行わない旨の判定を行う。
【0109】なお、ステップ513における判定は、所
定フレーム数以上、例えば5フレーム以上において、継
続して判定するようにするのが好ましい。
【0110】さらに、ステップ514において、フレー
ムエネルギーの平均値Rmeanより、Y(dB)(Yは、予
め設定した任意の値)小さな値を、新たな閾値(TH)
として更新する(ただし、X>Yとする)。
【0111】このように、新たな閾値(TH)の更新処
理により、より適切な補間処理を行うことが可能とな
る。
【0112】
【発明の効果】本発明によれば、入力音声が無声音また
は無音の場合、補間係数を算出する必要がなく、逆フィ
ルタ処理による、残差パワーの演算処理と比較処理が不
要となり、ソフト補間処理における処理量の低減が図れ
る。
【0113】また、入力音声が極端に大きい場合、小さ
い場合等には、「有声音」と、「無声音および無音」を
判定する閾値を、更新設定可能とすることで、ユーザー
ごとに適切な線形予測係数の補間処理が行える。
【図面の簡単な説明】
【図1】VSELP符号器の構成図である。
【図2】ソフト補間の処理手順のフローチャートであ
る。
【図3】本発明の実施例であるソフト補間処理手段の構
成図である。
【図4】本発明の実施例である閾値更新処理手段の構成
図である。
【図5】本発明の実施例であるソフト補間の処理手順を
示すフローチャートである。
【符号の説明】 100…入力音声、101…線形予測分析部、102…
フレームエネルギー算出部、103…線形予測係数ソフ
ト補間部、104…聴覚重み付きフィルタ処理部、10
5…重み付き合成フィルタ処理部、106…総重み付き
誤差算出部、107…長期予測ラグ選択部、108…コ
ード選択部、109…長期フィルタ状態、110…励起
コードブック、300…無補間係数算出部、301…フ
レームエネルギー比較部、302…補間/無補間決定
部、303…補間係数算出部、304…反射係数算出
部、305…フィルタ安定性判別部、306…残差パワ
ー算出部、307…残差パワー比較部、308…補間/
無補間最終決定部、400…フレームエネルギー格納
部、401…平均フレームエネルギー算出部、402…
閾値更新判定部、403…閾値更新部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】入力音声から、所定時間間隔(フレーム)
    毎に、線形予測分析を行って線形予測係数を求める方法
    であって、 フレーム毎に入力音声の平均信号パワー(フレームエネ
    ルギー)を算出し、 フレームエネルギーが、予め定められた閾値より小さい
    場合、前フレームおよび現フレームのいずれかの線形予
    測係数にもとづいて、予め定めた規則に従って定められ
    る係数である無補間係数を、現フレームのサブフレーム
    毎の線形予測係数とし、 前記フレームエネルギーが、前記閾値以上の場合、前フ
    レームおよび現フレームの線形予測係数の重み付け加算
    値である補間係数、前記無補間係数の両係数に対する逆
    フィルタ処理を、両係数の各々に対して行い、該処理の
    結果の出力信号のパワーと入力音声信号のパワーとの差
    分である残差パワーを、両係数の各々に対して求め、両
    係数に対する残差パワーを比較し、残差パワーが小さな
    方の係数を、現フレームのサブフレーム毎の線形予測係
    数とすることを特徴とする音声符号化方法。
  2. 【請求項2】請求項1において、前記予め定められた閾
    値は、有声音と、無声音および無音とを判別するための
    閾値であることを特徴とする音声符号化方法。
  3. 【請求項3】請求項1において、予め定めた条件を満足
    するとき、前記閾値を、予め用意してある値で更新する
    ことを特徴とする音声符号化方法。
  4. 【請求項4】請求項3において、前記予め定めた条件
    は、フレームエネルギーの、予め定めた値幅以上の変動
    が、所定数フレーム以上連続したことである音声符号化
    方法。
  5. 【請求項5】入力音声から、所定時間間隔(フレーム)
    毎に、線形予測分析を行って線形予測係数を求める音声
    符号化装置であって、 音声を入力する入力部と、フレーム毎に入力音声の平均
    信号パワー(フレームエネルギー)を算出するフレーム
    エネルギー算出部と、線形予測係数を求める処理を少な
    くとも行う符号化処理部と、線形予測係数を出力する出
    力手段とを備え、 前記符号化処理部は、前記フレームエネルギー算出部で
    算出したフレームエネルギーが、予め定められた閾値よ
    り小さいと判断した場合、前フレームおよび現フレーム
    のいずれかの線形予測係数にもとづいて、予め定めた規
    則に従って定められる係数である無補間係数を、現フレ
    ームのサブフレーム毎の線形予測係数とし、 逆に、前記フレームエネルギーが、前記閾値以上と判断
    した場合、前フレームおよび現フレームの線形予測係数
    の重み付け加算値である補間係数、前記無補間係数の両
    係数に対する逆フィルタ処理を、両係数の各々に対して
    行い、該処理の結果の出力信号のパワーと入力音声信号
    のパワーとの差分である残差パワーを、両係数の各々に
    対して求め、両係数に対する残差パワーを比較し、残差
    パワーが小さな方の係数を、現フレームのサブフレーム
    毎の線形予測係数とし、また、前記出力手段は、前記符
    号化処理部によって求められた線形予測係数を出力する
    ことを特徴とする音声符号化装置。
  6. 【請求項6】請求項5において、前記予め定められた閾
    値は、有声音と、無声音および無音とを判別するための
    閾値であることを特徴とする音声符号化装置。
JP6004687A 1994-01-20 1994-01-20 音声符号化方法および音声符号化装置 Pending JPH07210199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6004687A JPH07210199A (ja) 1994-01-20 1994-01-20 音声符号化方法および音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6004687A JPH07210199A (ja) 1994-01-20 1994-01-20 音声符号化方法および音声符号化装置

Publications (1)

Publication Number Publication Date
JPH07210199A true JPH07210199A (ja) 1995-08-11

Family

ID=11590814

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6004687A Pending JPH07210199A (ja) 1994-01-20 1994-01-20 音声符号化方法および音声符号化装置

Country Status (1)

Country Link
JP (1) JPH07210199A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2009008115A1 (ja) * 2007-07-09 2010-09-02 三菱電機株式会社 音声認識装置およびナビゲーションシステム
JP2017501432A (ja) * 2013-11-15 2017-01-12 オランジュ 変換コード化/復号から予測コード化/復号への遷移

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2009008115A1 (ja) * 2007-07-09 2010-09-02 三菱電機株式会社 音声認識装置およびナビゲーションシステム
JP2017501432A (ja) * 2013-11-15 2017-01-12 オランジュ 変換コード化/復号から予測コード化/復号への遷移

Similar Documents

Publication Publication Date Title
JP4659216B2 (ja) 忠実度改善のためのコンフォートノイズ変動特性に基づく音声符号化
EP0673013B1 (en) Signal encoding and decoding system
US7426465B2 (en) Speech signal decoding method and apparatus using decoded information smoothed to produce reconstructed speech signal to enhanced quality
JP3259759B2 (ja) 音声信号伝送方法及び音声符号復号化システム
JP4438127B2 (ja) 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体
KR100544731B1 (ko) 음성 코덱에서 의사 고대역 신호 추정 방법 및 시스템
KR20070001276A (ko) 신호 인코딩
JP2002533772A (ja) 可変レートスピーチコーディング
JP2004526213A (ja) 音声コーデックにおける線スペクトル周波数ベクトル量子化のための方法およびシステム
US6424942B1 (en) Methods and arrangements in a telecommunications system
KR100421648B1 (ko) 음성코딩을 위한 적응성 표준
US20100106490A1 (en) Method and Speech Encoder with Length Adjustment of DTX Hangover Period
JP2003504669A (ja) 符号化領域雑音制御
CA2293165A1 (en) Method for transmitting data in wireless speech channels
KR100688069B1 (ko) 백그라운드 잡음 재생을 이용한 음성 코딩
RU2237296C2 (ru) Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения
US6240383B1 (en) Celp speech coding and decoding system for creating comfort noise dependent on the spectral envelope of the speech signal
JPH1083199A (ja) 量子化装置及び方法
JPH07210199A (ja) 音声符号化方法および音声符号化装置
US7584096B2 (en) Method and apparatus for encoding speech
JP3050978B2 (ja) 音声符号化方法
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JPH06242796A (ja) 音声符号化装置
JP3055608B2 (ja) 音声符号化方法および装置
JP4230550B2 (ja) 音声符号化方法及び装置、並びに音声復号化方法及び装置