JPH06209262A - 駆動音源コードブックの設計法 - Google Patents

駆動音源コードブックの設計法

Info

Publication number
JPH06209262A
JPH06209262A JP5003566A JP356693A JPH06209262A JP H06209262 A JPH06209262 A JP H06209262A JP 5003566 A JP5003566 A JP 5003566A JP 356693 A JP356693 A JP 356693A JP H06209262 A JPH06209262 A JP H06209262A
Authority
JP
Japan
Prior art keywords
vector
vectors
basis vectors
learning sample
sample space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5003566A
Other languages
English (en)
Inventor
Yasuko Shinada
康子 品田
Yoshiaki Asakawa
吉章 浅川
Hidetoshi Sekine
英敏 関根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5003566A priority Critical patent/JPH06209262A/ja
Publication of JPH06209262A publication Critical patent/JPH06209262A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】 【目的】少ない処理で、確実に好適な基底ベクトルを求
める。 【構成】複数の学習サンプル空間を備える。そして、適
当な学習サンプル空間13から初期基底ベクトル14の
集合を抽出する。初期基底ベクトルは重み付け合成フィ
ルタ15で重み付けした後、重み付け長期予測ベクトル
12と直交化16する。そして、その後、直交化した基
底ベクトルを線形結合17した複数のコ−ドベクトルを
生成し、複数の重み付け入力音声11との間の距離の和
を求める。そして、求めた距離を評価し18、評価結果
に応じて、学習サンプル空間を切り替え、新たな初期基
底ベクトルの集合を抽出し、同様な処理を繰り返し、最
も重み付け入力音声との間の距離が小さい初期基底ベク
トルの集合を最終的な基底ベクトルとして選択する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、低ビットレートの音声
符号化方法に関し、特にベクトル和駆動線形予測(VS
ELP)符号化方式において用いられる駆動音源コード
ブックの設計方法に関するものである。
【0002】
【従来の技術】音声生成モデルを用いて作成した合成音
声と原音声の重み付け誤差を評価し、その誤差を最小化
するように音声生成モデルのパラメータを決定し、決定
したパラメータを符号化データとして送受する音声符号
化方式が最近提案されている。
【0003】このように音声生成モデルを用いて作成し
た合成音声と原音声の重み付け誤差を評価し、その誤差
を最小化するように音声生成モデルのパラメータを決定
する手法は、「合成による分析」と呼ばれ、この手法を
取り入れた音声符号化方式は、低ビットレートにおいて
も比較的良好な音声品質を得ることに成功している。
【0004】このような音声符号化方式の代表的なもの
としては、符号駆動線形予測符号化(CELP)方式(M.
R.Schroeder and B.S.Atal :"Codeーexcited linear pr
ediction (CELP)",Proc. ICASSP 85 (1985.3))があり、
これは、ガウス性の乱数信号からなる駆動音源コードブ
ックを用いて、音声をモデル化する方法で、4.8Kb
psで実用的な音声品質を得ている。。
【0005】また、CELP方式の改良方式も多数提案
されており、たとえば、ベクトル和駆動線形予測符号化
(VSELP)方式(I.A.Gerson and M.A.Jasiuk :"Vecto
r sum excited linear prediction (VSELP) speech cod
ing at 8kbps",Proc. ICASSP90 (1990.4))では、学習し
た複数の基底ベクトルを1またはー1の2値の係数を用
いて線形結合したものを駆動音源波形とする駆動音源コ
ードブックを用いることにより、処理量やメモリ容量を
減らしている。また、VSELP方式は、ビット誤り耐
性の点でCELPより優れている。
【0006】図5に、このVSELP方式の基本構成を
示す。
【0007】図示するように、VSELP方式では、複
数の基底ベクトル(図中ではM個)を予め学習し、各基
底ベクトルを声道モデルに対応する合成フィルタで処理
した後、これに先立ち探索した長期予測ベクトル(音源
のピッチ成分に対応する)と直交化する。そして、直交
化した各基底ベクトルを数1に従い線形結合し、コード
ベクトル(音声のランダム雑音成分に対応する)を生成
する。
【0008】
【数1】
【0009】ここで、vmはm番目の基底ベクトルを合
成フィルタでフィルタ処理した後に、重み付け長期予測
ベクトルに対し直交化したもので、Mは基底ベクトル数
を表す。UiはM個の基底ベクトルの線形結合によって
生成される2のM乗個のコードベクトルであり、iは0
から2のM乗ー1までの値を取る。線形結合の2値の係
数は、θimで表され符号語iのmビットが1ならばθim
=1、0ならばθim=ー1となる。
【0010】VSELP方式では、このようにして各i
について順次この線形結合された各コードベクトルを生
成し、原音声との距離(誤差)を求め、最も距離が小さ
いiを、音源コードブックについての最適なパラメータ
とする。
【0011】ところで、CELPやVSELPの音声品
質は、一般にこの駆動音源コードブックに左右される。
【0012】そこで、VSELP系の駆動音源コードブ
ック設計法について、従来、連立方程式を解き閉ループ
法で基底ベクトルを求める方法(I.A.Gerson :"Vector s
um Excited Linear Prediction (VSELP) speech Coding
for Japan digital cellular",信学技法 RCS90ー26 (1
990.11))や、適当な初期値を与えて閉ループ法で基底ベ
クトルを求める方法(P.ピェンチャルーン、板倉 ”
線形予測符号化における駆動音源波形コードブックの設
計”、信学技法 SP90ー53 (1990)、盛文社)等が提案さ
れている。
【0013】
【発明が解決しようとする課題】しかし、連立方程式を
解き閉ループ法で基底ベクトルを求める方法によれば、
コードブックサイズを9ビット、コードベクトルの次元
を40とすると、合成音声と原音声の誤差を最小にする
ことができる基底ベクトルを得るには、(9×40)次
の連立方程式を解かなければならない。その上、基底ベ
クトルは1またはー1で線形結合されるため、この方程
式の解が存在する保証はない。
【0014】また、従来の設計法では、コードブックの
基底ベクトルを長期予測ベクトルで直交化させていない
ため、そのコードブックを用いて符号化するときに、よ
り最適なコードベクトルが選ばれない可能性がある。ま
た、従来の設計法では、設計されたコードブックは、特
定の規則に従って選択した学習サンプルに依存してしま
うため、最適な基底ベクトルが選択されていない可能性
がある。
【0015】そこで、本発明は、より最適な基底ベクト
ルを確実に求めることができる駆動音源コードブックの
設計方法を提供することを目的とする。
【0016】
【課題を解決するための手段】前記目的達成のために、
本発明は、所定の合成フィルタによって所定の長期予測
ベクトルにフィルタ処理を施した合成フィルタ出力長期
予測ベクトルを入力音声あるいは聴覚重み付けされた入
力音声との差が最小となるように探索し、探索した合成
フィルタ出力長期予測ベクトルと、あらかじめ定めた複
数の基底ベクトルに前記合成フィルタによってフィルタ
処理を施した前記合成フィルタ出力基底ベクトルとを直
交化した後に、複数の前記基底ベクトルを所定の規則に
従いそれぞれ線形に結合した、複数の線形結合ベクトル
を出力コードベクトルとする駆動音声コードブックを備
え、前記入力音声あるいは聴覚重み付けされた入力音声
と直交化された複数の前記基底ベクトルの線形結合との
差が最小となる、前記駆動音声コードブックのコードベ
クトルを探索することにより入力音声を符号化する音声
符号化方式で用いる前記駆動音源コードブックを設計す
る方法であって、複数の学習サンプルを含む学習サンプ
ル空間を求める第1のプロセスと、学習サンプル空間か
ら、複数の学習サンプルの組を複数の仮基底ベクトルの
組として抽出するステップと、抽出した各仮基底ベクト
ルに、前記合成フィルタによりフィルタ処理を施すステ
ップと、あらかじめ定めた複数の入力リファレンス音声
あるいは聴覚重み付けされた前記複数の入力リファレン
ス音声との差が最小となるように探索した、前記合成フ
ィルタによって前記長期予測ベクトルにフィルタ処理を
施した合成フィルタ出力長期予測ベクトルと、前記フィ
ルタ処理を施した各仮基底ベクトルとを直交化するステ
ップと、前記直交化された複数の仮基底ベクトルを、前
記規則に従い、線形に結合した複数の線形結合ベクトル
を求め、各線形結合ベクトルと複数の入力リファレンス
音声あるいは聴覚重み付けされた前記複数の入力リファ
レンス音声との差のうち最小のものの、前記複数の線形
結合ベクトルについての和を求めるステップとを含む第
2のプロセスと、前記第2のプロセスを仮基底ベクトル
の複数の異なる組について繰り返し、最も、前記和が小
さかった仮基底ベクトルの組を基底ベクトルの組とする
第3のプロセスとを含むことを特徴とする駆動音源コー
ドブックの設計方法を提供する。
【0017】
【作用】本発明に係る駆動音源コードブックの設計方法
によれば、たとえば、一様乱数から成る学習サンプル空
間から、仮基底ベクトルをランダムに選ぶ。そして、該
仮基底ベクトルを合成フィルタ処理し、長期予測ベクト
ルと直交化させる。これは、符号化アルゴリズムにおい
て音源コードブックを探索する際に用いている手段であ
る。次に、該基底ベクトルを、線形結合させ、重み付け
られた入力音声と前記線形結合のベクトルとの距離(誤
差)が小さくなるように基底ベクトルを修正する。これ
により、符号化アルゴリズムに適応したコードブックの
基底ベクトルが、比較的少ない処理で確実に、得ること
ができる。または、学習サンプル空間を複数個有し、毎
回、異なった内容の学習サンプル空間から新しく仮基底
ベクトルの組を与える。このようにすれば、学習サンプ
ル空間に依存しない基底ベクトルを得ることができる。
【0018】
【実施例】以下、本発明の係る駆動音源コ−ドブックの
設計方法の実施例を説明する。
【0019】まず、第1の実施例について説明する。
【0020】図1に本第1実施例に係る基底ベクトルの
設計モデルを、図2に基底ベクトルの設計手順を示す。
【0021】本第1実施例では、まず、距離尺度の初期
値Dmin=∞、歪みしきい値ε、学習回数Jを与える
(ステップ201)。次に、一様乱数からなる特定の学
習サンプルベクトル空間{x1,x2,...}13か
ら、初期基底ベクトルの集合A0={y1,y2,・・
・,yN}14をランダムに抽出する(ステップ20
2)。
【0022】そして、学習サンプル空間13の各サンプ
ルを基底ベクトルの各要素と比較し、N個の部分集合
{Si;i=1,2,・・・,N}に分割する(ステッ
プ203)。分割は次の規則に従い行う。
【0023】すなわち、d(x,y)をxとyの距離とす
ると、すべてのtに対して、d(xj,yi)<d(xj,yt)
が成立すれば、 xj∈Siとする。
【0024】抽出した各基底ベクトルは、重み付け合成
フィルタ15で重み付けされた(ステップ204)後
に、同様に所定の重み付け合成フィルタ(図示せず)で
重み付けされた長期予測ベクトル12に対して直交化1
6する(ステップ205)。直交化は、グラム・シュミ
ットの直交化法によって行う。グラム・シュミットの直
交化法は、周知の直交化法であるので説明を省略する。
直交化は、それぞれ後述する距離D2を求める対象とな
る各聴覚重み付け入力音声との差を最小とする各重み付
け長期予測ベクトル12との間で、それぞれ行う。ここ
で、聴覚重み付け入力音声は、所定の聴覚重み付け合成
フィルタ(図示せず)で重み付けされた入力音声であ
る。
【0025】このように、基底ベクトルをそれぞれ重み
付け長期予測ベクトルに対して直交化して、以下の処理
を行うことにより、よりVSELPの符号化アルゴリズ
ムに沿った形で、より好適な基底ベクルトルを求めるこ
とができる。
【0026】ここで、重み付け合成フィルタ15の伝達
関数は数2で表すことができる。
【0027】
【数2】
【0028】αiはフィルタ係数、Npはフィルタ次
数、λは重み付けパラメ−タで通常0.8である。ここ
で、基底ベクトルをこの重み付け合成フィルタに入力す
ると出力が過去に影響されるため、通常は重み付け合成
フィルタのインパルス応答との畳み込みによって重み付
けを実現する。これを零状態応答という。
【0029】さて、次に、直交化した各基底ベクトル
を、先に示した数1式に従い2値の係数(1または−
1)で線形結合17させて(ステップ206)、複数の
コ−ドベクトルを求める。そして、求めた各コ−ドベク
トルと、直交化の対象となった重み付け長期予測ベクト
ルを求めるのに用いた重み付け入力音声との最小距離の
和D2を求める(ステップ207)。
【0030】和D2については数3で与えられる。
【0031】
【数3】
【0032】Pnは過去の影響を取り除いた重み付け音
声で、RはPのサンプル数を表している。
【0033】ここで、前述したように、一般に合成フィ
ルタの出力は過去の状態の影響を受けるるので、演算量
を削減するために、予め重み付け入力音声から過去の聴
覚重み付け合成フィルタの影響を取り除いておく。すな
わち、和D2は、聴覚重み付け合成フィルタから零入力
応答を計算し、重み付け音声から減算し、過去の影響を
取り除いた重み付け音声11との間で求める。
【0034】そして、距離の和が求まったら、数4に示
す評価式を用いて、距離の評価18を行う(ステップ2
08)。
【0035】
【数4】
【0036】そして、評価式が、真ならば、現在の基底
ベクトル集合を基底ベクトル集合候補して記憶する。ま
た、この基底ベクトル集合候補について求めた和D2
併せて記憶する。そして、再び学習サンプル空間
{x1,x2,..}13から新たな初期14をランダム
に選んで上述と同様の処理をし、基底ベクトル集合候補
について求めた距離の和D2と今回の距離の和D2を比較
し(ステップ209)、小さい方の基底ベクトル集合を
新たな基底ベクトル集合候補とする。この処理をJ回
(ステップ210,211)繰り返し、最後に残った基
底ベクトル集合候補を最終的な基底ベクトル集合とす
る。
【0037】また、ステップ298において、評価式数
4が偽ならばDmin=D2とし、先に求めた学習サンプル
空間の各部分集合の重心を新しい基底ベクトル集合とし
て、ステップ203よりの処理を行う。ここで、他の基
底ベクトルよりも基底ベクトルykに近いベクトルが部
分集合Skに含まれているいるので、距離D2が評価式を
満たさない場合に各部分集合の重心を新たな基底ベクト
ルとする処理を繰り返すことにより、学習サンプル空間
の、適当な代表点を基底ベクトルとして抽出することが
できる。
【0038】以上のように、本第1実施例によれば、符
号化アルゴリズムに適した駆動音源コ−ドブックの基底
ベクトルが比較的簡単な処理で確実に得られる。
【0039】次に、本発明の第2の実施例について説明
する。
【0040】図3に本第2実施例に係る基底ベクトルの
設計モデルを、図4に基底ベクトルの設計手順を示す。
【0041】本第2実施例が、前記第1実施例と異なる
点は、距離評価18(ステップ208)において、数4
に示した評価式が、真の場合に、学習サンプル空間を更
新し(ステップ201b)、新しい学習サンプル空間1
3から初期基底ベクトル集合14をランダムに選ぶ(ス
テップ202)点である。このように、学習サンプル空
間を更新するのは、基底ベクトルが特定の学習サンプル
空間にのみ依存することなく、各種入力音声に対して平
均的な意味で最適となるコ−ドブックを得るためである
が、これは、次のような場合に特に意義がある。
【0042】すなわち、たとえば、学習サンプル空間
を、特定の話者の音声より学習する場合、この学習サン
プル空間より当該話者についてののみ最適な基底ベクト
ルを得ることができるが、他の話者については最適な基
底ベクトルを得ることができない。そのため、この特定
の学習サンプル空間より得られた基底ベクトルは、偏っ
たものとなる可能性がある。そこで、複数の学習サンプ
ル空間を複数の話者についてそれぞれ学習し、これらの
学習サンプル空間より最適な基底ベクトルを抽出すれ
ば、複数の話者について平均的な意味で最適な基底ベク
トルを得ることができるである。
【0043】
【発明の効果】以上のように、本発明によれば、本発明
は、より最適な規定ベクトルを確実に求めることができ
る駆動音源コ−ドブック設計方法を提供することができ
る。
【図面の簡単な説明】
【図1】本発明の第1実施例で用いる設計モデルを表す
ブロック図である。
【図2】本発明の第1実施例に係る基底ベクトル設計手
順を示すフロ−チャ−トである。
【図3】本発明の第1実施例で用いる設計モデルを表す
ブロック図である。
【図4】本発明の第1実施例に係る基底ベクトル設計手
順を示すフロ−チャ−トである。
【図5】VSELPの基本構成を示したブロック図であ
る。
【符号の説明】
11 過去の影響を取り除いた重み付け音声 12 重み付け長期予測ベクトル 13 学習サンプル空間 14 初期基底ベクトル集合の決定 15 重み付け合成フィルタ 16 直交化 17 線形結合 18 距離評価 19 学習サンプルの生成

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】所定の合成フィルタによって所定の長期予
    測ベクトルにフィルタ処理を施した合成フィルタ出力長
    期予測ベクトルを入力音声あるいは聴覚重み付けされた
    入力音声との差が最小となるように探索し、探索した合
    成フィルタ出力長期予測ベクトルと、あらかじめ定めた
    複数の基底ベクトルに前記合成フィルタによってフィル
    タ処理を施した前記合成フィルタ出力基底ベクトルとを
    直交化した後に、複数の前記基底ベクトルを所定の規則
    に従いそれぞれ線形に結合した、複数の線形結合ベクト
    ルを出力コードベクトルとする駆動音声コードブックを
    備え、前記入力音声あるいは聴覚重み付けされた入力音
    声と直交化された複数の前記基底ベクトルの線形結合と
    の差が最小となる、前記駆動音声コードブックのコード
    ベクトルを探索することにより入力音声を符号化する音
    声符号化方式で用いる前記駆動音源コードブックを設計
    する方法であって、 複数の学習サンプルを含む学習サンプル空間を求める第
    1のプロセスと、 学習サンプル空間から、複数の学習サンプルの組を複数
    の仮基底ベクトルの組として抽出するステップと、 抽出した各仮基底ベクトルに、前記合成フィルタにより
    フィルタ処理を施すステップと、 あらかじめ定めた複数の入力リファレンス音声あるいは
    聴覚重み付けされた前記複数の入力リファレンス音声と
    の差が最小となるように探索した、前記合成フィルタに
    よって前記長期予測ベクトルにフィルタ処理を施した合
    成フィルタ出力長期予測ベクトルと、前記フィルタ処理
    を施した各仮基底ベクトルとを直交化するステップと、 前記直交化された複数の仮基底ベクトルを、前記規則に
    従い、線形に結合した複数の線形結合ベクトルを求め、
    各線形結合ベクトルと複数の入力リファレンス音声ある
    いは聴覚重み付けされた前記複数の入力リファレンス音
    声との差のうち最小のものの、前記複数の線形結合ベク
    トルについての和を求めるステップとを含む第2のプロ
    セスと、 前記第2のプロセスを仮基底ベクトルの複数の異なる組
    について繰り返し、 最も、前記和が小さかった仮基底ベクトルの組を基底ベ
    クトルの組とする第3のプロセスとを含むことを特徴と
    する駆動音源コードブックの設計方法。
  2. 【請求項2】請求項1記載の駆動音源コードブックの設
    計方法であって、 前記第1のプロセスは、学習サンプル空間を、一様乱数
    からなる学習サンプルを含むように求めるプロセスであ
    って、 前記学習サンプル空間から、仮基底ベクトルの組として
    抽出するステップは、学習サンプル空間から、仮基底ベ
    クトルの組をランダムに抽出するステップであることを
    特徴とする駆動音源コードブックの設計方法。
  3. 【請求項3】請求項1記載の駆動音源コードブックの設
    計方法であって、 前記第1のプロセスは、複数の学習サンプルを含む学習
    サンプル空間を複数求めるプロセスであって、 前記学習サンプル空間から、複数の学習サンプルの組を
    複数の仮基底ベクトルの組として抽出するステップは、 第1回目の前記第2のプロセスの実行時は、任意の学習
    サンプル空間から、仮基底ベクトルの組をランダムに抽
    出し、 第2回目以降の前記第2のプロセスの実行時は、前回と
    異なる学習サンプル空間から仮基底ベクトルの組をラン
    ダムに抽出するステップであることを特徴とする駆動音
    源コードブックの設計方法。
  4. 【請求項4】請求項1記載の駆動音源コードブックの設
    計方法であって、 前記第1のプロセスは、複数の学習サンプルを含む学習
    サンプル空間を複数求めるプロセスであって、 前記学習サンプル空間から、複数の学習サンプルの組を
    複数の仮基底ベクトルの組として抽出するステップは、 第1回目の前記第2のプロセスの実行時は、任意の学習
    サンプル空間から、仮基底ベクトルの組をランダムに抽
    出し、 第2回目以降の前記第2のプロセスの実行時は、前回の
    前記第2のプロセスで求められた前記和の値に応じて、
    前回と異なる学習サンプル空間から仮基底ベクトルの組
    をランダムに抽出するか、もしくは、前回抽出した各仮
    基底ベクトルに応じて学習サンプル空間を分割した各部
    分空間の、各重心の組を新たな仮基底ベクトルの組とし
    て抽出するステップであることを特徴とする駆動音源コ
    ードブックの設計方法。
  5. 【請求項5】請求項1記載の駆動音源コードブックの設
    計方法であって、 前記学習サンプル空間から、複数の学習サンプルの組を
    複数の仮基底ベクトルの組として抽出するステップは、 第1回目の前記第2のプロセスの実行時は、前記学習サ
    ンプル空間から、仮基底ベクトルの組をランダムに抽出
    し、 第2回目以降の前記第2のプロセスの実行時は、前回の
    前記第2のプロセスで求められた差の和に応じて、前記
    学習サンプル空間から仮基底ベクトルの組をランダムに
    抽出するか、もしくは、前回抽出した各仮基底ベクトル
    に応じて学習サンプル空間を分割した各部分空間の、各
    重心の組を新たな仮基底ベクトルの組として抽出するス
    テップであることを特徴とする駆動音源コードブックの
    設計方法。
  6. 【請求項6】複数の学習サンプルを含む学習サンプル空
    間を求める第1のプロセスと、 学習サンプル空間から、複数の学習サンプルの組を複数
    の仮基底ベクトルの組として抽出するステップと、 抽出した各仮基底ベクトルに、前記合成フィルタにより
    フィルタ処理を施すステップと、 あらかじめ定めた複数の入力リファレンス音声あるいは
    聴覚重み付けされた前記複数の入力リファレンス音声と
    の差が最小となるように探索した、所定の合成フィルタ
    によって所定の長期予測ベクトルにフィルタ処理を施し
    た合成フィルタ出力長期予測ベクトルと、前記フィルタ
    処理を施した各仮基底ベクトルを直交化するステップ
    と、 所定の規則に従い、それぞれ、前記直交化した複数の仮
    基底ベクトルを、線形に結合した複数の線形結合ベクト
    ルを求め、各線形結合ベクトルと複数の入力リファレン
    ス音声あるいは聴覚重み付けされた前記複数の入力リフ
    ァレンス音声との差のうち最小のものの、前記複数の線
    形結合ベクトルについての和を求めるステップとを含む
    第2のプロセスと、 前記第2のプロセスを仮基底ベクトルの複数の異なる組
    について繰り返し、 最も、前記和が小さかった仮基底ベクトルの組を基底ベ
    クトルの組とする第3のプロセスと、 前記第3のプロセスで求めた複数の基底ベクトルに前記
    合成フィルタによってフィルタ処理を施し、入力音声あ
    るいは聴覚重み付けされた入力音声との差が最小となる
    ように探索した、前記合成フィルタによって前記長期予
    測ベクトルにフィルタ処理を施した合成フィルタ出力長
    期予測ベクトルと、前記フィルタ処理を施した複数の基
    底ベクトルを直交化し、フィルタ処理を施した複数の基
    底ベクトルを前記規則に従いそれぞれ線形に結合した、
    複数の線形結合ベクトルを出力コードベクトルとする駆
    動音声コードブックを用い、前記入力音声あるいは聴覚
    重み付けされた入力音声との差が最小となる、前記駆動
    音声コードブックのコードベクトルを探索することによ
    り入力音声を符号化する第4のプロセスとを含むことを
    特徴とする音声符号化方法。
JP5003566A 1993-01-12 1993-01-12 駆動音源コードブックの設計法 Pending JPH06209262A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5003566A JPH06209262A (ja) 1993-01-12 1993-01-12 駆動音源コードブックの設計法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5003566A JPH06209262A (ja) 1993-01-12 1993-01-12 駆動音源コードブックの設計法

Publications (1)

Publication Number Publication Date
JPH06209262A true JPH06209262A (ja) 1994-07-26

Family

ID=11560991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5003566A Pending JPH06209262A (ja) 1993-01-12 1993-01-12 駆動音源コードブックの設計法

Country Status (1)

Country Link
JP (1) JPH06209262A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0854898A (ja) * 1994-08-11 1996-02-27 Nec Corp 音声符号化装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0854898A (ja) * 1994-08-11 1996-02-27 Nec Corp 音声符号化装置

Similar Documents

Publication Publication Date Title
US6785645B2 (en) Real-time speech and music classifier
Giacobello et al. Sparse linear prediction and its applications to speech processing
JP3114197B2 (ja) 音声パラメータ符号化方法
JP3094908B2 (ja) 音声符号化装置
KR100795727B1 (ko) Celp기반의 음성 코더에서 고정 코드북 검색 장치 및방법
KR100556831B1 (ko) 전역 펄스 교체를 통한 고정 코드북 검색 방법
EP1677287B1 (en) A system and method for supporting dual speech codecs
WO1996035208A1 (en) A gain quantization method in analysis-by-synthesis linear predictive speech coding
US20010001320A1 (en) Method and device for speech coding
CN113793591A (zh) 语音合成方法及相关装置和电子设备、存储介质
US20030036905A1 (en) Information detection apparatus and method, and information search apparatus and method
Riviello et al. Binary Speech Features for Keyword Spotting Tasks.
JP2002140099A (ja) 音声復号化装置
US5822721A (en) Method and apparatus for fractal-excited linear predictive coding of digital signals
JP2000112498A (ja) 音声符号化方法
KR100463559B1 (ko) 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법
JPH06209262A (ja) 駆動音源コードブックの設計法
JPH09508479A (ja) バースト励起線形予測
US5937374A (en) System and method for improved pitch estimation which performs first formant energy removal for a frame using coefficients from a prior frame
JPH0764600A (ja) 音声のピッチ符号化装置
JP3471889B2 (ja) 音声符号化方法及び装置
Kuropatwinski et al. Estimation of the short-term predictor parameters of speech under noisy conditions
EP0713208A2 (en) Pitch lag estimation system
JP3276977B2 (ja) 音声符号化装置
JP3471542B2 (ja) 音声符号化装置