JPH04264500A - 音声信号伝送方法および音声信号伝送装置 - Google Patents

音声信号伝送方法および音声信号伝送装置

Info

Publication number
JPH04264500A
JPH04264500A JP3298096A JP29809691A JPH04264500A JP H04264500 A JPH04264500 A JP H04264500A JP 3298096 A JP3298096 A JP 3298096A JP 29809691 A JP29809691 A JP 29809691A JP H04264500 A JPH04264500 A JP H04264500A
Authority
JP
Japan
Prior art keywords
vector
dictionary
audio signal
initial
vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3298096A
Other languages
English (en)
Other versions
JP3130348B2 (ja
Inventor
Francesco Renaud Di
レノウ・ダイ・フランセスコ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
France Telecom R&D SA
Original Assignee
France Telecom SA
Centre National dEtudes des Telecommunications CNET
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA, Centre National dEtudes des Telecommunications CNET filed Critical France Telecom SA
Publication of JPH04264500A publication Critical patent/JPH04264500A/ja
Application granted granted Critical
Publication of JP3130348B2 publication Critical patent/JP3130348B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、CELPコーディン
グによる音声信号の低スループット送信方法および関連
システムに関する。
【0002】
【従来の技術】CELP(Code Excited 
Linear Prediction,線形予測コード
発生)方式による音声信号のコーディング技術は、今日
実用化されており、各種の用途がある。この技術を音声
信号に対応するデジタル信号のサンプルをコーディング
するのに用いられる場合には、ハイブリッド・コーディ
ング技術が使用される。このハイブリッド・コーディン
グ技術によれば、音声信号は線形予測フィルタおよびこ
の線形予測に基づく剰余分によってモデル化される。
【0003】一般的には、図1(a)、(b)に示すよ
うなCELPコーダ100は、波形リストに含まれる全
ての要素を余すところなくテストする。そして、その信
号を最も良く合成する波形が選択され、その索引番号あ
るいは特徴アドレスがデコーダ101に供給される。こ
のテスト方法は、合成分析方法と呼ばれる。上述した波
形リストは、CELPコーダ100およびデコーダ10
1に記憶されており、「辞書」と呼ばれる。
【0004】CELPコーダ100の性能は、採用され
た辞書と、使用される線形予測フィルタの分析方法/モ
デリング方法とに大きく左右され、これら二つのパラメ
ータが二つの従属自由度の構成要素となる。この従属自
由度により、所望の用途に対して、CELPコーダを最
適に適応させることが可能となる。
【0005】上述したCELPコーディング技術は、低
スループット(4〜24 kbit/sec)のコーデ
ィング装置に用いて好適である。なお、上述した技術の
詳細については、例えば、「”A robust an
d fast CELP coder at 16 k
bit/s”, published by A.le
 Guyader, D. Massaloux an
d F. Zurcher Cnet Lannion
 France, in the jurnal Sp
eech CommunicationNo. 7, 
1988」等の文献に述べられている。
【0006】一般的に、上述したようなコーダおよびデ
コーダにあっては、分析、伝送および再現されるデジタ
ル信号は、複数のブロックあるいはフレームに分割され
る。各ブロックはL個の値を有しており、L次元空間に
おけるベクトルとして扱われる。ここで、ベクトルvか
ら構成される励起信号が、上述した波形辞書から読み出
されて出力された場合を考えると、このベクトルvは、
以下述べる方法によって、知覚される歪が最小化される
必要がある。
【0007】まず、||x−H・v||2の最小値を求
める。ここで、xは目標信号であり、元々の信号Oに知
覚力重み付け(perceptual weighti
ng)を施して成るものである。また、Hは、L×Lの
パルス応答行列であり、合成フィルタの伝達関数および
上述した知覚力重み付けにより求められる。詳細は後述
するが、この重み付けを行うことにより、周波数帯域内
のコーディングノイズおよびホワイトノイズを減少させ
るという効果が得られる。ここで、行列Hは、以下の形
式による三角行列である。
【0008】
【数2】 @
【0009】上述したコーディング手順では、各基準ベ
クトルviが、ゲイン量辞書Gから与えられたゲイン量
gkに結びつけられる。すなわち、詳細は以下述べるが
、ベクトルviと適合ゲインgkとによって、ベクトル
vk,iが形成され、これによって上述した歪の削減基
準が満足される。
【0010】L次元のベクトルに基づく数多くの数値演
算および音声信号スループットによる複雑化を減少させ
るために、基準ベクトルを用いて一定の処理を行うこと
が提案されている。まず、励振信号を出力する場合、そ
のベクトルの各成分の値を「−1」,「0」または「1
」に限定する。これにより、ベクトルの辞書を三値論理
値の辞書として構成することが可能になる。このように
、CELP型のコーディング手順において三値論理ベク
トルを使用すること自体は、ヨーロッパ特許出願(19
89年12月20日出願のEP0,347,307)に
開示されている。
【0011】
【発明が解決しようとする課題】しかし、このようなコ
ーディング技術によれば、全ての基準ベクトルが必然的
に同じエネルギー量を含むことになる。さらに、自動修
正によってそれ自体を標準化しその位置が基準ベクトル
またはシーケンスが「0」でないコンポーネントに対応
する「0」の項を列挙するような場合を除いては、最適
な基準ベクトルまたはシーケンスをサーチすることによ
って純粋なスカラ積の計算を減少させることができない
【0012】従って、このような動作モードは基準ベク
トルとして考慮に入れることが不可能である。すなわち
、基準ベクトルとしては、三値論理の全ての組合せを採
り得るのであるから、かかる技術によれば、最適化され
た歪基準を全ての場合について小さくできるわけではな
いからである。
【0013】本発明の目的の一つは、上述した不具合を
解決すること、すなわち、基準ベクトルに係る演算を単
純化することにある。ここで、基準ベクトルの辞書ある
いは指令値は、n項のベクトルについて実質的に全ての
組合せを想定している。なお、ここで「n」は奇数であ
る。
【0014】本発明の他の目的は、各基準ベクトルに所
定のゲインを印加する従来の手順よりも速く、倍率デー
タを出力することによって修正手順を実行することであ
る。また、後述する周波数スペクトラム関数によって励
振信号のエネルギーを拡散することとし、これによって
周波数帯域内でエネルギーが一様でない歪をも考慮に入
れることができる。
【0015】本発明のさらに他の目的は、低いスループ
ットでの音声信号伝送を最終的に実行することである。 ここで、音声信号においては、励振信号を構成する各基
準ベクトルをデコーダ・レベル、すなわち索引番号ある
いはアドレスで出力することを可能としている。この索
引番号あるいはアドレスは、コーダ・レベルにおいて最
小の歪基準を満足する最適な基準ベクトルを示すもので
あり、これによって上述したデコーダの構成を簡略化し
、製造コストを低減する。
【0016】
【課題を解決するための手段】上記課題を解決するため
この発明にあっては、音声をデジタル化したサンプルを
線形予測法によってコード化してコード信号を発生する
コード化過程と、発生したコード信号を伝送する伝送過
程と、コード信号をデコードするデコード過程とを有し
、前記コード化過程においては、サンプル量Lを有する
サンプルブロックによって波形が表され、各々が基準ベ
クトル(v)を構成する複数の基準波形の中から選択さ
れた一の基準波形に基づいて合成フィルタによってL次
元の初期ベクトル(o)を形成する初期ベクトル形成過
程を有し、前記初期ベクトル形成過程においては、前記
初期ベクトル(o)によって知覚力重み付けの施された
目標ベクトルをxとし、前記合成フィルタおよび前記知
覚力重み付けによる応答を示すL行L列のパルス応答行
列をHとし、前記初期ベクトル(o)と、前記基準ベク
トル(v)または前記基準波形とについての最小二乗偏
差法に基づいて、||x−H・v||2が最小値となる
基準ベクトル(v)を選択する、低スループットの音声
信号伝送方法であって、前記コード化過程は、n項形式
{−n/2,・・・,0,・・・,n/2}(ただしn
は奇数であってn/2はnを2で除算したときの整数部
である)の基礎ベクトルyiから成るL次元の初期辞書
Yに基づいて辞書を形成する過程であって、出力される
信号の周波数帯域内における励振エネルギーの分散と適
合ゲインgkから成る第2の辞書G(y)とに基づくス
ケールファクタγiによって前記基礎ベクトルyiが修
正され、これによって、各基準ベクトルvk,iがvk
,i=gk・γi・yiなる条件を満足する基準ベクト
ルまたは波形の辞書を形成する過程と、全てのスカラ積
<x|H・γi・yi>および全ての知覚エネルギー|
|H・y||2を求めることによってC(gk,γi・
yi)=2gk<x|H・γi・yi>−gk2||H
・γi・yi||2の最大値を求め、これによって||
x−gk・H・γi・yi||2の最小値を求め、さら
に前記初期ベクトル(o)を、vk*,i*=gk*・
γi*・yi*なる最適基準ベクトルvk*,i*に割
当て、||x−gk・H・γi・yi||2が最小とな
る条件を満たす最適基準ベクトルvk*,i*を索引番
号(k*,i*)で表示する過程と、を有することを特
徴としている。
【0017】
【作用】本発明において、低スループットで音声信号を
送信する方法は、コード信号を出力するために線形予測
法によって音声のデジタル・サンプルをコーディングす
るコーディング過程と、このコード信号を伝送する伝送
過程と、受信したコード信号をデコードする受信過程と
を含む。
【0018】上記コーディング過程は、L個のサンプル
値を含むサンプルブロックに表示されるとともにL次元
の初期ベクトル(o)を構成する波形を表示する表示過
程に基づいて実行される。この表示過程は、合成フィル
タに基づいて、基準波形によって行われる。
【0019】ここで、基準波形とは基準波形辞書から選
択された波形であり、この基準波形辞書においては、各
基準波形は基準ベクトル(v)を構成する。各基準ベク
トル(v)は上記初期ベクトル(o)の最小二乗偏差の
基準値と対応している。すなわち、上述した波形または
基準ベクトル(v)と、||x−H・v||2の最小値
(なお、ここでxは、初期ベクトル(o)に知覚力重み
付けをすることによって求められる目標ベクトルであり
、Hは知覚力重み付けおよび合成フィルタの出力結果に
よって求められるL×Lのパルス応答行列である)とが
対応している。
【0020】この過程においては、選択基準は、初期辞
書Yを修正することによって辞書を確立することに留意
する必要がある。すなわち、初期辞書Yは、n項形式{
−n/2,・・・,0,・・・,n/2}のL次元のベ
クトルyiによって構成されている。ここでnは奇数で
ある。これら基本ベクトルは、各々スケール・ファクタ
γiによって修正される。
【0021】ここでスケール・ファクタγiは、信号の
周波数帯域内における励振エネルギーの分散と、複数の
ゲインgkを有する第2の辞書G(y)とを考慮して設
定する。このようにして、波形または基準ベクトルの辞
書が形成される。各基準ベクトルは、vk,i=gk・
γi・yiなる関係を満足する。なお、「n/2」なる
値は、nを「2」で除算した整数部である。
【0022】次に、<x|H・γi・yi>の全てのス
カラ積と、全ての知覚エネルギー(perceptua
l energy)||H・y||2とを計算すること
によってC(gk,γi・yi)   =2gk<x|H・γi・yi>−gk2||H・
γi・yi||2の最大値を計算を行い、これによって
、最小二乗偏差値min||x−gk・H・γi・yi
||2が求まる。これにより、対応する最適基準ベクト
ルvk*,i*を初期ベクトル(o)に割当てることが
可能となる。ここで、 vk*,i*=gk*・γi*・yi*である。この最
適基準ベクトルは、min||x−gk・H・γi・y
i||2の判断基準を満足する索引番号k*,i*によ
って表される。
【0023】本発明の構成要件のうち、低スループット
で音声信号を伝送する過程は、各最適基準ベクトルvk
*,i*を、索引番号k*,i*によるコード信号とし
て送信する。
【0024】本発明の構成要件のうち、コード信号によ
って低スループットで送信された音声信号をデコードす
る過程にあっては、コード信号のデコードを確実にする
ために、コード信号を構成する索引番号k*,i*を判
別する点に特徴がある。まず、対応する基礎ベクトルy
i*を得るために、n基底から最適基準ベクトルを表示
する最適索引番号i*を分離する。
【0025】この実行過程においては、基準ベクトルv
k*,i*を再現して構成するために、対応するスケー
ルファクタγi*および対応する適合ゲインgk*の索
引番号i*に基づいて、再現された対応する基礎ベクト
ルの修正が実行される。そして、音声信号を再構成する
ために、再現された基準ベクトルvk*,i*に対して
合成フィルタ動作が行われる。
【0026】このように、コーディング、伝送、デコー
ディングの各過程を含む本発明による動作によれば、低
スループットで音声信号を伝送することが可能であるか
ら、特に、移動体相互間の通信等の用途に用いてきわめ
て好適である。
【0027】
【実施例】以下、本発明の一実施例による音声信号の低
スループット送信方法を図2(a)、(b)を参照して
説明する。図2において、本実施例の方法は、線形予測
法によって音声のデジタルサンプルをコード化するコー
ディング過程を含む。この過程により、コード信号を出
力することが可能になる。本実施例の方法は、さらに、
このコード信号を伝送する伝送過程と、受信したコード
信号をデコードするデコーディング過程とを含む。
【0028】図2においては、コーディング過程は、L
個のサンプルを有するサンプルブロックあるいはフレー
ムで示された波形に基づいてL次元の初期ベクトル(o
)を生成する処理を有している。この初期ベクトル(o
)は、基準波形によって、合成フィルタに基づいて、対
応する波形を表示するようになり、ベクトルvとなる。 このベクトルvは、基準波形辞書から選択されたもので
あり、この辞書内の各波形は上記基準ベクトルを構成し
ている。この選択動作は、上記基準波形または基準ベク
トル(v)に関係させつつ、初期ベクトル(o)に対す
る最小二乗偏差法によって行われる。すなわち、||x
−H・v||2の最小値が求められる。
【0029】ここで、xは目標ベクトルであり、初期ベ
クトル(o)に知覚力重み付けを施すことによって得ら
れる。また、Hは知覚力重み付けおよび合成フィルタの
出力結果によって求められるL×Lのパルス応答行列で
ある。本実施例による方法においては、コーディング過
程は以下のように設定される。すなわち、選択の判断基
準は、基礎ベクトルyiから成る初期辞書Yを変更して
ゆくことにより、辞書を確立する。
【0030】各基礎ベクトルは、n項形式である。すな
わち、これら基礎ベクトルの要素aj(ここでjは[0
,L−1]に含まれる)は、n種類の離散的な値を取り
得る。一般的には、各要素ajは、「1」づつインクリ
メントされた[−n/2,・・・,0,・・・,n/2
]なる集合に属する値を取り得る。ここで、nは奇数で
あり、「n/2」なる値は、nを「2」で除算した整数
部である。
【0031】本実施例による方法の特徴によれば、各基
礎ベクトルyiは、信号の周波数帯域内における励振エ
ネルギーの拡散を考慮に入れながら、スケールファクタ
γiによって修正される。
【0032】ここで、ほとんどの場合においては、スケ
ールファクタγiはデータベースに基づいて経験的に決
定される。このデータベースは、例えば、同一言語を話
す数人の発音者の意味のある長さの音声サンプルを数時
間に渡って記録することによって構成される。勿論、言
語は複数存在しても良い。経験的には、種々の言語に渡
る表現の多様性は、上述したスケールファクタγiの2
段目までによって決定できる。なお、次数L=5の三値
論理ベクトルのスケールファクタγiを記憶したテーブ
ルについて、詳細は後述する。
【0033】また、この原理によれば、連続的に繰返す
「L」の音声サンプルをデータベースから取り出す過程
が実行され、この中で各基礎ベクトルγiを識別する手
順が実行される。次に、対応する各基礎ベクトルyiに
対してスケールファクタγiが決定される。そして、上
述した基礎ベクトルyiに関連して対応するスケールフ
ァクタγiを得るために、最もマッチングの小さな係数
を検索し、識別された係数あるいはマッチングの取れた
係数の平均値uを求める。
【0034】上記処理の結果に基づいて第2の辞書が構
成され、先に述べた改定された辞書についても、この第
2の辞書を介して、同様に作成される。以下、この第2
の辞書をG(y)と表記する。この第2の辞書G(y)
は、ゲインgkの辞書によって形成される。このように
して、改定された辞書は、基準ベクトルまたは波形辞書
を構成するようになる。そして、各基準ベクトルは、v
k,i=gk・γi・yi なる関係を満たすようになる。
【0035】言うまでもないことであるが、以下の点に
留意する必要がある。すなわち、図2(a)に示すよう
に、スケールファクタγiを供給することによって行わ
れる修正動作は、各基礎ベクトルyiの要素ajに単な
る重み付けを施すことではない。すなわち、各スケール
ファクタ係数γiは、音声信号の周波数帯域における励
振エネルギーの拡散の度合いを示している。
【0036】図2(a)に例示するように、本実施例の
方法は、全てのスカラ成分<x|H・γi・yi>と、
全ての知覚エネルギー(perceptual ene
rgy)||H・y||2とについて C(gk,γi・yi)   =2gk<x|H・γi・yi>−gk2||H・
γi・yi||2なる関数を求めることによって min||x−gk・H・γi・yi||2なる最小二
乗偏差を求めることに特徴がある。
【0037】上述した演算により、初期ベクトル(o)
に対して、対応する最適基準ベクトルvk*,i*すな
わちgk*・γi*・yi*を割当てることが可能とな
る。 そして、かかる本実施例の手法によれば、この最適基準
ベクトルが、上述した min||x−gk・H・γi・yi||2の基準を満
たすk*,i*なる索引番号によって表示されることが
判る。
【0038】次に、基礎ベクトルyiのレベルにおける
さらに詳細な動作説明を行う。これらの基礎ベクトルは
、n項L次元のベクトルであり、その要素ajの取り得
る値は、「−n/2」〜「n/2」の範囲の「1」きざ
みの整数である。次に、図2(b)において、基礎ベク
トル(Basis vectors)をy0,y1,y
i,ykとする。 ここで、K=(nL−3)/2であり、「0」〜「K」
は連続番号である。
【0039】各要素の値は、n項形式のうちの何れか一
つである。次に、スケールファクタγiを用いて修正が
行われる。ここで、スケールファクタγiは、ゲインg
kと同様に単に重み付けを行うものではない。この理由
は先に述べた通りである。そして、対応するスケールフ
ァクタγiが上述したように決定され、基礎ベクトルy
iの各要素ajに印加される。図2(b)にあっては、
適合ゲインgkの適用例が示されている。すなわち、基
礎ベクトルyiの各要素ajは、gk・γiで乗算され
る。
【0040】これにより、図2(a)、(b)に示すコ
ーディング過程の実行において、最小二乗偏差値min
||x−gk・H・γi・yi||2は対応するゲイン
・エレメントgkを第2の辞書G(y)選択されること
によって求められ、これによって偏差|g−gk*|が
最小化されることが明らかに判る。ここに、gは以下の
関係を満たす。
【数3】 @
【0041】次に、辞書またはL次元の基礎ベクトルy
iの初期辞書Yを構成するための基礎ベクトルyiの配
列について、より詳細な説明を図3(a)、(b)を参
照して行う。まず、辞書Yは、n次形式[−n/2,・
・・,0,・・・,n/2]L次の基礎ベクトルyiに
よって構成されている。 そして、辞書Yは、「0」ベクトルを除いて、そのL成
分がn次形式である全ての基礎ベクトルを含む。一般的
に基礎ベクトルの索引番号iは、値[−n/2,・・・
,0,・・・,n/2]がそれぞれ対応する値(0,1
,2,・・・,n)に変換された後に、各基礎ベクトル
の基底nの値と等しくされる。 すなわち、n次形式の基礎ベクトルyiが、その索引番
号iに基づいて配列され、この索引番号iの値が各ベク
トルの基底nとして設定される。
【0042】また、換言すれば、辞書Yを構成する一群
の基礎ベクトルyiが、n/2・Lパルスベクトルから
定義される。ここに、パルスベクトルはシングルコンポ
ーネントの要素aj(ここでjは[0,L−1]に含ま
れる)から成り、「−1」,「−2」,・・・「−n/
2」に等しい。各パルスベクトルは対応する基礎ベクト
ルと関係付けられる。すなわち、各基礎ベクトルはq≦
jなる同一数の複数の要素を有し、各ベクトルがランク
qのパルスベクトルと関係付けられる。ここで、ajが
「0」でない場合にはq=jである。このように、j=
qなるパルスベクトルとパルス、あるいは、より高いラ
ンクのj=q’なるベクトルによる線形な関係がパルス
ベクトルに付される。
【0043】以下、三値論理を例として、基礎ベクトル
yiの辞書を出力する場合の動作、および、これら基礎
ベクトルを出力する動作のより詳細な説明を図3(a)
および(b)を参照して行う。なお、本発明の範囲を逸
脱することなく、同様の方法によってn項L次元形式の
ベクトルを発生させることができることは勿論である。 図3(a)および(b)において、オペレータ・セルは
、それぞれ対応する符号が付されており、対応するパル
スベクトルと関連するベクトルとから構成された副辞書
と、上述したパルスベクトルとに基づいて、全ての副辞
書を結合して完全な辞書を出力することが可能である。
【0044】図3(a)における各演算回路は、“R”
の符号が付された遅延回路を含む。この遅延回路の伝達
関数は、一般のZ変換の表記方法に従って、「Z+1」
と示される。また、各オペレータは、“Sy”の符号を
付した対称化演算子を含む。この演算子の関数は、入力
されたベクトルの全ての要素に対して、「+1」,「0
」および「−1」を乗算する。そして、“S”の符号が
付された回路は加算器であり、遅延回路Rの出力信号が
供給されるとともに、“F”の位置にあるスイッチIを
介してと対称化演算子Syの出力信号が供給される。一
方、スイッチIが“O”の位置にある場合には、L次元
の「0」ベクトル[0,0,0,0]が供給される。図
3(a)(1),(2),(3)における各演算回路は
、辞書Yの各基礎ベクトルyiを出力する一連の処理手
順のうち、各々異なるステップにおける動作を示してい
る。
【0045】以下、それぞれの図について説明するが、
本明細書においては、文字の上にオーバーラインを付す
べきところを、例えば“ ̄(a)”のように表示し、ま
た、文字の上に“^”マークを付すべきところを、例え
ば“^(a)”のように表示することがある。
【0046】図3(a)(1)に、基礎ベクトルyiを
出力する初期段階における動作を示す。図において初期
パルスあるいはパルスベクトルδL−1は、遅延回路R
の入力端に供給される。次に、対称化演算子Syに対し
て、副辞書 ̄(DO)が供給される。この副辞書 ̄(D
O)は、初期状態においては、上述したパルスベクトル
δL−1から構成されている。これにより、対称化演算
子Syは、対称化された副辞書 ̄(DO)を出力する。 この様子を図3(b)に示す。次に、加算器Sには、遅
延回路Rからランクq=L−2のパルスベクトルδL−
2が供給され、あるいは「0」ベクトルが供給される。 また、加算器Sには、対称化された副辞書 ̄(DO)が
供給される。これにより、加算器Sは、基礎ベクトルy
1,y2,y3から成る辞書D1を出力する。
【0047】言うまでもないことであるが、図3(b)
に示すように、パルスベクトルδL−2は基礎ベクトル
y1,y2,y3から成る副辞書D1と結合する。そし
て、パルスベクトルδL−1は、基礎ベクトルy0は勿
論のこと、「0」ベクトルをも形成する。
【0048】また、同図(2)に示すような帰還動作を
行う場合にあっては、演算回路は基礎ベクトルyiを出
力することが可能になっている。すなわち、遅延回路R
の出力レベルでパルスベクトルδL−mを受信し、対称
化演算子Syのレベルで辞書Dm−1を受信する。この
辞書Dm−1は、辞書D1と同様に帰還動作によって得
られるものである。次に、同図(2)における加算器S
は、遅延回路Rから出力されたパルスベクトルδL−m
−1あるいは「0」ベクトルと、副辞書 ̄(Dm−1)
とから副辞書Dmを出力する。
【0049】このように、上述した動作によれば、パル
スベクトルが供給されると、配列されたベクトルと対応
した副辞書とに基づいて帰還動作あるいは反復動作が繰
返され、最終的に完全な辞書を出力することが可能とな
る。なお、図3(b)において、“*”マークは「−n
/2」ないし「n/2]の値を取り得る。この値につい
てのその他の条件は既に述べた通りである。
【0050】ここで、三値論理辞書の全体について、以
下の点に留意する必要がある。すなわち、中間レベルm
〜Lの全ての副辞書を結合した結果により、各要素aj
が正値または負値に設定されるのであるが、この状態に
至って初めて対称化演算子Syにおける対称化処理に辞
書全体を使用することが可能となる。
【0051】これは、t=L−1の瞬間における一部の
応答の演算についても同様である。すなわち、パルスベ
クトルδL−1が発生する瞬間においては、システムH
は合成フィルタおよび知覚力ウエイティング・フィルタ
において、上述した動作に沿って、三値論理基礎ベクト
ルyiに基づいて作成されている途中である。なお、t
=L−1の瞬間における一部の応答の演算については、
以下SL−1(yi)と表示する。
【0052】次に、図4において、初期状態における演
算レベルを「1」と表示する。この図におけるオペレー
タは、時刻0,1,2,L−1におけるシステムHのパ
ルス応答を表示している。すなわち、値h0,h1,h
L−2,hL−1が、上述したオペレータに供給されて
いる。
【0053】ここで、オペレータSL−1は、t=L−
1における全てのベクトルの部分応答についての各エレ
メントhL−m−1または「0」値の合計も表示してい
る。なお、各ベクトルは、レベルm(sic)の対称化
演算子Syによって対称化された辞書に含まれるもので
ある。
【0054】このようにして、t=L−1における複数
のベクトルDmの応答の集合たるSL−1(Dm)が得
られる。対称化演算子Syは、SL−1(Dm−1)の
各要素を「+1」,「0」,「−1」で乗算して出力す
る。これにより、離散的な要素の集合が得られる。最終
的には、図4(3)に示すように、元々「−1」に設定
されていた三値論理ベクトルyiのt=L−1における
応答を、最後のオペレータが供給することとなる。
【0055】なお、供給される三値論理値の行列Hによ
る線形システムにおける応答は、上述した構成と同様に
、この構成の各ノードについて線形変換Hが施されて出
力される。
【0056】これにより、三値論理ベクトルの知覚エネ
ルギーは、上述したt=L−1における一部の応答に基
づいて推測される。すなわち、ベクトルyiによって励
起される行列Hは、以下のように表記することができる
【0057】
【数4】 @
【0058】このようにして、t=L−1における応答
SL−1(yi)が決定される。これはHyiの「L−
1」次の座標である。しかしながら、
【数5】 @および
【数6】 @のように表記することが可能である。
【0059】ここで、y’iとy”iとは同一のノルム
を有しており、Z−1なる基本的な遅延作用素を表示し
ている。この関係式は、以下のようにして証明すること
ができる。
【数7】 @
【0060】しかしながら、仮にyiがDmに属するな
らば、Z−1・yiはDm−1に属することになる。従
って、反復処理を行うことにより、D0,D1,……,
DL−1の順で、知覚エネルギーを計算することが可能
になる。D0=δL−1についての初期値、すなわち図
3に示されたパルスベクトルは、h02である。
【0061】種々の選択判断基準から供給された実体物
に対する番号付けおよび計算処理の、本実施例に基づく
基本図を図5(a)、(b)に示す。一般的には、図5
(a)に示すように、上述した基礎ベクトルyiは、3
0=1のレートを有するベクトルの全体出力チャートか
らレベル「0」において出力される。また、ベクトルy
0,31はレベル1において出力され、ベクトルy1,
y2,y3……のように3L−1に基づいたベクトルは
レベルL−1において出力される。
【0062】パルスベクトルθ−1,θ0およびθ1に
基づいた、三重化されていない単一のセルを図5(b)
に示す。ここでは、入力された基礎ベクトルの最終座標
を更新するために、これらパルスベクトルθ−1,θ0
およびθ1の値を加算する。なお、基礎ベクトルは、+
1,0,−1の値を持つ要素から構成されている。ここ
で、図5(a)、(b)に示された構成は、三値論理チ
ャートの線形構造である。従って、n項形式に対しては
、n値論理のチャートを用いるべきであることに留意す
る必要がある。
【0063】同様に、以下説明するアナログ的な構成に
よって、 ||H・yi||2=SL−1(yi)2+||H・Z
−1yi||なる式を演算する実施例を提供することも
可能である。 この構成を図10(a)(b)を参照して説明する。な
お、これらの図においてE(i)=||H・yi||2
である。
【0064】図10(a)に示すように、エネルギーを
得るための全体出力チャートは、右から左に向って流れ
るするようになっている。また、初期エネルギーE(0
)はSL−1(0)2に等しい。図10(a)に示され
たエレメンタリーセルを同図(b)に示す。
【0065】ここで、ベクトルのナンバリング、すなわ
ち基礎ベクトルの番号「i」は、前進三値ナンバリング
あるいは後退三値ナンバリングに基づいている。三値論
理ベクトルの前進ナンバリングに属する全ての番号pは
、後退ナンバリングp’(但しp’=3L/p−1)と
の対応関係を満足している。このことから、全ての計算
が、前進ナンバリングまたは後退ナンバリングに基づい
て行われるが、後者の方が好適であることが判る。
【0066】これにより、伝送路を介して、例えば後退
番号あるいは前進番号の索引番号を伝送することが可能
になる。なお、その詳細は後述する。ここで、さらに以
下の点について留意する必要がある。すなわち、事前に
合成フィルタリングを基準ベクトルvk*,i*に施す
従来のCELP型コーディング技術は、予測レベルファ
クタ(以下、σという)によって重み付けされている点
に利点がある。この予測レベルファクタσは、励振信号
の平均エネルギーを示す。この励振信号とは、少なくと
も三の、一連の早期の励振ベクトルに基づいて予測され
たものである。
【0067】各基準ベクトルの要素ajに対してこのよ
うな演算を施す技術については、当業者に周知のことで
あるから、ここでは詳述しない。次に、<2x|H・y
i>の形式におけるスカラ成分を計算する手順の詳細を
図6を参照して説明する。ここで、全ての基礎ベクトル
yiに対してx=x/σである。ここで、予測レベルフ
ァクタσは、実際に本実施例に基づくコーディング手順
に導入され、全ての三値ベクトルyiについて<2x/
σ|H・yi>形式の解が求められる。
【0068】次に、上述した解は、行列Hの転置行列(
以下tHという)で解2x/σをフィルタリングするに
よって計算される。この解は、下式で表すことができる
【数8】 @
【0069】ここで、x’を以下のように設定する。
【数9】 @
【0070】次に、三値論理ベクトルyiについての解
<x’|yi>は、以下のようにして得られる。先ず、
下式に基づく計算を行う。
【数10】 @
【0071】この計算手順は、先に述べた部分応答SL
−1(yi)の計算と同様の手順によって、図6に示す
オペレータを用いることによって行うことが可能である
。そして、x’0,x’L−m−1,x’L−2の値が
求まり、これによって上記スカラ成分が求まる。ここで
、「0」ベクトルの場合は、「0」値に変換される。
【0072】先に述べたように、スケールファクタγi
が各基礎ベクトルyiに対して決定されて割当てられる
と、複数Nのフレームと、音声信号データベースとから
スケールファクタγiが決定される。
【0073】この基礎ベクトルyiについてのスケール
ファクタγiは、対応するフレームについてフィルタリ
ングした結果が最も小となるように選択される。ここで
、各スケールファクタγiを決定する方法としては、数
種類のものが考えられる。制限が無い例において、基礎
ベクトルが次元L=5の三値論理型であったとすると、
スケールファクタγiのリストは、以下列挙する121
個の値を有するテーブルとして与えられる。最初の値は
(−1,−1,−1,−1,−1,)を乗算するもので
あり、最後の値は(0,0,0,0,−1)を乗算する
ものである。
【0074】 1.50,1.66,1.77,1.28,1.46,
1.36,0.86,2.47,1.68,1.51,
1.12,1.04,1.38,1.86,1.51,
4.23,3.47,1.96,1.25,2.28,
0.77,2.50,3.51,0.87,1.11,
1.16,0.95,1.29,1.23,1.85,
1.34,1.55,1.60,1.51,1.44,
1.21,1.45,1.95,1.45,1.73,
4.06,1.73,1.32,1.39,2.43,
1.38,4.62,1.35,1.92,2.15,
1.44,2.20,1.95,1.07,0.88,
1.56,1.48,1.33,1.64,1.70,
1.44,3.33,1.10,1.89,0.80,
2.07,1.27,1.57,3.82,1.28,
1.31,1.34,1.94,1.86,1.25,
1.06,2.15,1.39,0.89,1.24,
1.32,1.17,1.45,0.57,1.28,
2.00,4.88,2.14,2.98,2.24,
1.23,1.66,1.41,1.82,3.44,
1.14,3.15,3.91,1.60,0.95,
1.74,1.50,1.12,2.98,1.16,
1.23,1.34,1.00,2.06,2.52,
4.52,1.93,2.89,3.21,1.39,
2.44,2.38,4.55,3.00,2.49,
3.17
【0075】索引番号k*,i*の最適値は、先に述べ
た後退番号あるいは前進番号が付与されつつ、決定され
る。また、特にコード信号たる索引番号iに関係して、
音声信号の低スループット伝送が可能となる。ここで、
各索引番号k*,i*の値は、各基準ベクトルvk*,
i*を表すものとなる。
【0076】ここで、上述した索引番号k*,i*を伝
送する限りにおいては従来の伝送技術水準においても可
能なことであり、また、伝送する信号にある程度の冗長
性を持たせ、ほとんどエラーの発生しない程度にするこ
とも知られている。ここで、索引番号i*は、前進番号
であっても後退番号であっても良いことが判る。すなわ
ち、ナンバリングを変更した場合において、その変換テ
ーブルはコーダおよびデコーダ等において既知だからで
ある。
【0077】次に、伝送された信号、すなわち上述した
方法によって生成されるコード信号をデコードする手順
の詳細を図7を参照して説明する。図7において、デコ
ーディング過程は、ステップ1000において、コード
信号に含まれる索引番号k*とi*を分離する。次に、
処理がステップ1001に進むと、索引番号i*に基づ
いて、対応する基礎ベクトルyi*を再現するために最
適基準ベクトルの基底nを求める。次に、処理がステッ
プ1002に進むと、索引番号i*に基づいて、基礎ベ
クトルyi*と、対応するスケールファクタγi*とが
再現される。また、基準ベクトルvk*,i*=γi*
・yi*を構成するために、再現された基礎ベクトルに
対して修正が施される。
【0078】上記処理に引き続いて、デコーディング過
程の処理はステップ1003に進み、基準ベクトルを合
成するために、ここでフィルタリング動作が行われる。 ここで、当然、以下の点に留意する必要がある。すなわ
ち、本実施例によるコーデイング手順においては、合成
フィルタリングが行われる前に、予測レベルファクタσ
によって各基準ベクトルvk*,i*が重み付けさる。 ここで、予測レベルファクタσは、少なくとも三の、一
連の早期の励振ベクトルに基づいて予測されたものであ
る。
【0079】なお、デコーディング過程における予測レ
ベルファクタσの決定方法については、当業者に周知の
ことであるからここでは詳述しない。低スループットで
音声信号を伝送する本実施例によるシステムのさらに詳
細を図8および図9を参照して説明する。図8によれば
、コーデイング回路は、n項形式のL次行列の基礎ベク
トルyiの初期辞書Yを出力するジェネレータ1を有し
ている。これらベクトルのコンポーネントは、上述した
通り、「−n/2」ないし「n/2」の値を取り得る。 ここで、初期辞書Yを出力するジェネレータ1は、例え
ば図3(a)(b)に示した演算回路を有する計算手段
、および/または、記憶回路から構成される。この記憶
回路は、読出し/書込みメモリであってもよく、読出し
専用メモリであってもよい。この場合、読出し専用メモ
リには、上述した前進番号または後退番号に基づいて連
続的に基礎ベクトルyiの読出しを可能とする高速シー
ケンサを設けるとよい。
【0080】さらに、図8に示すコーディング回路にあ
っては、基礎ベクトルyiとスケールファクタγiとを
修正する修正回路2を有している。この修正回路2は、
例えば読出し専用メモリから成るテーブルによって構成
される。この修正回路2は、各基礎ベクトルyiに対し
て、修正された基礎ベクトル ̄(yi)=γi・yiを
出力する。
【0081】また、図においてMUXは高速マルチプレ
クサであり、修正された基礎ベクトル ̄(yi)に関す
る値を連続して読み出し、適合ゲインgkについての第
2の辞書を出力する回路3に供給することが可能である
。適合ゲインgkについての第2の辞書G(y)を出力
する回路3は、増幅回路30を有している。増幅回路3
0は、上述した第2の辞書を構成するゲインgkのテー
ブルに接続されている。これにより、第2の辞書G(y
)を出力する回路3は、vk,i=gk・γi・yiな
る基準ベクトルを出力する。
【0082】ここで、本実施例に基づくコーディング回
路は、さらに増幅回路4を有している。増幅回路4は、
各基準ベクトルvk,iに対して、上述した予測レベル
ファクタσを適用する。さらに、本コーディング回路に
あっては、カスケード接続された合成フィルタ5と知覚
力ウエイティング・フィルタ6とを有し、ここでの伝達
関数は上述したHになる。7は加算器であり、その一入
力端において、同一構成の知覚力ウエイティング・フィ
ルタ6を介して、反転された原信号を受信する。これに
より、代数加算器たる加算器7は、入力された両信号の
差を出力する。すなわち、加算器7は、供給された信号
(sic)に対する最小歪基準を出力することが可能に
なる。
【0083】このため、このコーディング回路にあって
は、最小歪演算回路8を有している。この最小歪演算回
路8は、2gk<x/σ|H・γi・yi>なる積を計
算する第1演算回路80を有している。ここに、式<x
/σ|H・γi・yi>は、目標ベクトルxと、行列H
を介して再構成されるとともに知覚力重み付けの施され
たベクトルと、修正された基礎ベクトルγiyiとのス
カラ積である。そして、第1演算回路80は、第1の演
算結果r1を出力する。
【0084】次に、81は第2演算回路であり、再構成
されるとともに知覚力重み付けの施されたベクトルに基
づいて、gk2||H・γi・yi||2の形式を有す
るエネルギーを計算することが可能である。ここで、第
1演算回路80と第2演算回路81はプログラムモジュ
ールで構成することも可能である。このプログラムにお
ける処理の流れは、図5(a)(b)およびず10(a
)(b)に示した通りである。第2演算回路81は、第
2の演算結果r2を出力する。また、比較器83は、第
1の演算結果r1と第2の演算結果r2とを比較し、索
引番号k,iを判別することによって、最小二乗偏差基
準を満足する索引番号k*,i*を決定することを可能
としている。これら索引番号値k*,i*は、例えば図
8における検索プログラム84を実行することにより決
定可能である。
【0085】図8においては、本実施例に基づく伝送回
路(transmission circuit)も示
されている。この伝送回路は、音声信号を表す索引番号
k*,i*のコード信号を出力することが可能である。 この伝送回路は、従来技術に基づくCELPコーディン
グ方式に用いられていた物と同様であり、特筆すべき相
違点は無い。
【0086】次に、本実施例におけるデコーディング回
路の詳細を図9を参照して説明する。図においてデコー
ディング回路は、受信したコード信号から索引番号k*
,i*を判別するためのモジュールたる判別回路10を
有している。このコード信号は、当然のことながら、所
定の規約(これは本願発明の範囲外である)に基づいて
伝送される。さらに、判別回路10は、索引番号i*,
k*に対応する情報の直列・並列変換を施す。また、デ
コーディング回路は、索引番号i*の基底nを再構成す
る回路を有している。
【0087】ここで、索引番号k*は並列形式で処理さ
れることが判る。このため、図9のデコーディング回路
にあっては、索引番号k*が入力されることによって対
応する適合ゲインgk*を出力する、適合ゲインgk*
のテーブル回路11を有している。このテーブル回路1
1は、例えば適合ゲインgkを格納した読出し専用メモ
リで構成すると好適である。
【0088】また、スケールファクタγi*を出力する
回路12が設けられている。この回路は、索引番号i*
とスケールファクタγi*とを対応させる検索テーブル
を記憶した読出し専用メモリで構成すると好適である。 また、12aは乗算回路であり、上記γi*、gk*、
および予測レベルファクタσに基づいて、係数A=σ・
gk*・γi*を出力する。
【0089】また、図9において回路13は、索引番号
i*の基底nに基づいて、再構成された基礎ベクトル^
(yi*)を出力する。これにより、回路14が、索引
番号i*に基づいて、{−n/2,・・・,0,・・・
,n/2}なる値を出力する。すなわち、索引番号i*
を、基底nの索引番号i*の値に変換する。これにより
、再構成された基礎ベクトル^(yi*)と、係数Aと
に基づいて、再構成された基準ベクトルvk*,i*を
出力することが可能になる。
【0090】次に、合成フィルタ15は、この再構成さ
れた基準ベクトル^(vk*,i*)に基づいて、音声
信号を再構成する。図9に示されたデコーディング回路
の機能は、以下のようにまとめることができる。すなわ
ち、回路12の出力信号に乗算が2回施されることによ
り、A=σ・gk*・γi*なる乗算係数が出力される
【0091】仮に、後退ナンバリングに基づいて三値論
理ベクトルの索引番号i*が伝送される場合には、i’
={(3L−3)/2}−i* として、励振ベクトル
あるいは基準ベクトルvk*,i*の合成は以下のよう
にして行われる。
【0092】■現時点でのステップを(j,t)とする
。 ■jを「3」で除算した場合の余りが「0」であれば、
vk*,i*(L−1−t)=−Aとする。 ■jを「3」で除算した場合の余りが「1」であれば、
vk*,i*(L−1−t)=0とする。 ■jを「3」で除算した場合の余りが「2」であれば、
vk*,i*(L−1−t)=Aとする。
【0093】ここで、vk*,i*(L−1−t)は、
vk*,i*の(L−1−t)次の要素である。また、
「3」で除算されるjは整数部であり、tは「1」単位
で増加する。すなわち、整数に「1」が加算される。こ
こで、jおよびtは、j=i’、t=0にイニシャライ
ズされる。そして、上述したステップは、t=L−1に
至るまでの全ての数について行われる。また、仮に、索
引番号i*のナンバリングが前進番号に基づいている場
合には、i’=iとして、上述のステップと同様にして
、jを「3」で除算した場合の余りを求めるとよい。
【0094】以上、本実施例による低スループットで音
声信号を伝送する方法およびシステムについて説明した
が、これは、辞書Yをデコーダ段に記憶しておく必要が
無くなるという顕著な効果を呈する。すなわち、単に基
準ベクトルの索引番号がデコーダに伝送され、対応する
基準ベクトルを再構成するための計算がリアルタイムで
行われる。これにより、使用される各デコーダにおいて
、記憶装置の容量が大幅に削減される。
【0095】さらに、コーダ段において基礎ベクトルを
発生させる過程と、知覚エネルギーとのスカラ積を計算
する過程においては、基礎ベクトルを記憶しておく必要
が無いから、ハードウエア構成をきわめて簡略化するこ
とが可能である。
【0096】ここで、本実施例における計算アルゴリズ
ムは、演算回路によってきわめて高速に実行されるから
、特にハードウエアの簡略化が重要であることは言うま
でもない。
【0097】また、本実施例によるコード化された信号
を低スループットで音声信号を伝送する方法およびシス
テムは、n項形式の基礎ベクトルを採用したCELP型
のものであるが、「n」の値は原理上なんら限定される
ものでないことは言うまでもない。勿論、実施例におい
ては、n=3とし、基礎ベクトルは三値論理ベクトルと
して説明した。
【0098】しかしながら、上記実施例と同一の原理に
よって、nを例えば「5」にすることも可能である。こ
の場合、5種類のアルファベット符号が付されて出力さ
れ、この出力値としては、例えば「0」,「0.5」,
「1」,「−0.5」,「−1」とすることができる。 また、これらの出力値はスケールを変更することにより
、整数値にしてもよい。また、5種類の符号を付して辞
書が出力される場合においては、伝送方法およびシステ
ムは、最大24kbit/秒程度の可変スループット型
として構成することができる。
【0099】
【発明の効果】以上説明したように、この発明によれば
、基準ベクトルに係る演算を単純化し、修正手順を速や
かに実行することができるとともに、デコーダの構成を
簡略化でき、その製造コストを低減することが可能であ
る。
【図面の簡単な説明】
【図1】従来の音声信号伝送装置のブロック図である。
【図2】図2(a)は、本発明に基づくコーディング・
プロセスの処理ステップを示す図、同図(b)は、同図
(a)の処理によって基礎ベクトルに施される演算を示
す図である。
【図3】図3(a)(1)、(2)、(3)は、与えら
れた基礎ベクトルを構成するパルスベクトルの処理を行
うモジュールを示す図であり、帰還型演算処理により基
礎ベクトルの初期辞書を作成する。同図(b)は、基礎
ベクトルの初期辞書を繰返し出力するために、における
上記基礎ベクトルに対して施される一連の処理を示す図
である。特に、一例としてn=3とし、基礎ベクトルは
三値論理値になる。
【図4】図4は図3(a)、(b)と同様の手法により
、全ての三値論理ベクトルyiに対してパルス応答を計
算する処理を示す図である。ここに、三値論理ベクトル
yiは、合成フィルタおよびカスケード接続されHなる
伝達関数を有する知覚力ウエイティング・フィルタ(重
み付けフィルタ)を励起する。
【図5】図5(a)、(b)は、伝達関数Hの一部のパ
ルス応答から三値論理ベクトルの知覚エネルギー(pe
rceptual energy)を計算する処理を示
す図である。
【図6】図6はスカラ成分を計算する過程を示す図であ
る。
【図7】図7は、デコーディング過程の実行中において
、最適な索引番号k*,i*を処理するフローチャート
である。
【図8】図8は、本発明に基づく低スループット音声信
号伝送システムのコーディング回路の全体ブロック図で
ある。
【図9】図9は、本発明に基づく低スループット音声信
号伝送システムのデコーディング回路の全体ブロック図
である。
【図10】図10(a)、(b)は、伝達関数Hの一部
のパルス応答から三値論理ベクトルの知覚エネルギーを
計算する処理を示す図である。
【符号の説明】
1  ジェネレータ 2  補正回路 3  回路 4  増幅回路 5  合成フィルタ 6  知覚力ウエイティング・フィルタ7  加算器 8  最小歪演算回路 10  判別回路 11  テーブル回路 12  回路 12a  乗算回路 15  合成フィルタ 30  増幅回路 80  第1演算回路 81  第2演算回路 83  比較器 84  検索プログラム 100  CELPコーダ 101  デコーダ

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】  音声をデジタル化したサンプルを線形
    予測法によってコード化してコード信号を発生するコー
    ド化過程と、発生したコード信号を伝送する伝送過程と
    、コード信号をデコードするデコード過程とを有し、前
    記コード化過程においては、サンプル量Lを有するサン
    プルブロックによって波形が表され、各々が基準ベクト
    ル(v)を構成する複数の基準波形の中から選択された
    一の基準波形に基づいて合成フィルタによってL次元の
    初期ベクトル(o)を形成する初期ベクトル形成過程を
    有し、前記初期ベクトル形成過程においては、前記初期
    ベクトル(o)によって知覚力重み付けの施された目標
    ベクトルをxとし、前記合成フィルタおよび前記知覚力
    重み付けによる応答を示すL行L列のパルス応答行列を
    Hとし、前記初期ベクトル(o)と、前記基準ベクトル
    (v)または前記基準波形とについての最小二乗偏差法
    に基づいて、||x−H・v||2が最小値となる基準
    ベクトル(v)を選択する、低スループットの音声信号
    伝送方法であって、前記コード化過程は、n項形式{−
    n/2,・・・,0,・・・,n/2}(ただしnは奇
    数であってn/2はnを2で除算したときの整数部であ
    る)の基礎ベクトルyiから成るL次元の初期辞書Yに
    基づいて辞書を形成する過程であって、出力される信号
    の周波数帯域内における励振エネルギーの分散と適合ゲ
    インgkから成る第2の辞書G(y)とに基づくスケー
    ルファクタγiによって前記基礎ベクトルyiが修正さ
    れ、これによって、各基準ベクトルvk,iがvk,i
    =gk・γi・yiなる条件を満足する基準ベクトルま
    たは波形の辞書を形成する過程と、全てのスカラ積<x
    |H・γi・yi>および全ての知覚エネルギー||H
    ・y||2を求めることによってC(gk,γi・yi
    )=2gk<x|H・γi・yi>−gk2||H・γ
    i・yi||2の最大値を求め、これによって||x−
    gk・H・γi・yi||2の最小値を求め、さらに前
    記初期ベクトル(o)を、vk*,i*=gk*・γi
    *・yi*なる最適基準ベクトルvk*,i*に割当て
    、||x−gk・H・γi・yi||2が最小となる条
    件を満たす最適基準ベクトルvk*,i*を索引番号(
    k*,i*)で表示する過程と、を有することを特徴と
    する音声信号伝送方法。
  2. 【請求項2】  前記||x−gk・H・γi・yi|
    |2の最小値は、前記第2の辞書G(y)の対応する適
    合ゲインgkを選択することによって行われ、これによ
    って、【数1】 @なる条件を満たすgに対してg−gk*なる偏差を最
    小にすることを特徴とする請求項1に記載の音声信号伝
    送方法。
  3. 【請求項3】  n項形式{−n/2,・・・,0,・
    ・・,n/2}の基礎ベクトルyiについてのL次元の
    前記初期辞書Yは、そのL個の要素が、「0」ベクトル
    を除いて{−n/2,・・・,0,・・・,n/2}の
    うち一つを有する全ての基礎ベクトルを含み、各基礎ベ
    クトルについての索引番号i*は、{−n/2,・・・
    ,0,・・・,n/2}の値を{0,1,2,...,
    n}なる値に変換した後の各基礎ベクトルの基底nの値
    に等しいことを特徴とする請求項1に記載の音声信号伝
    送方法。
  4. 【請求項4】  前記初期辞書Yを構成する基礎ベクト
    ルyiは、(n/2)・L形式のパルスベクトルであり
    、jが[0,L−1]に含まれる前記パルスベクトルの
    単一要素ajは、「−1」,「−2」,...「−n/
    2」なる値を有するとともにq次元の各パルスベクトル
    は各基礎ベクトルに対して関係付けられ、q≦jである
    場合には各パルスベクトルと各基礎ベクトルの要素値は
    同一になり、aj≠0であってq=jの場合には、q次
    元以上のパルスベクトルと基礎ベクトルとに直線的な関
    係が付与されることを特徴とする請求項3に記載の音声
    信号伝送方法。
  5. 【請求項5】  L個の音声信号値を有する複数のNフ
    レームによってデータベースを作成し、このデータベー
    スに基づく経験的判断によって前記各基礎ベクトルyi
    に対してスケールファクタγiを対応付ける音声信号伝
    送方法であって、フィルタリングを施した後の剰余分が
    最小となるように前記各基礎ベクトルyiと各スケール
    ファクタγiとを対応付けることを特徴とする請求項1
    に記載の音声信号伝送方法。
  6. 【請求項6】  音声信号を伝送する際のスループット
    を最小にするために、前記伝送過程においては、前記基
    準ベクトルvk*,i*を示す索引番号k*,i*を伝
    送することを特徴とする請求項1に記載の音声信号伝送
    方法。
  7. 【請求項7】  コード信号のデコーディングを行うた
    めに、コード信号に含まれる索引番号k*,i*を検出
    する過程と、対応する基礎ベクトルyi*を再出力する
    ために、最適基準ベクトルの基底nを示す索引番号i*
    を再構成する過程と、前記索引番号i*と、これに対応
    するスケールファクタγi*とによって再出力された基
    礎ベクトルに修正を施し、これによって基準ベクトルv
    k*,i*を再現する過程と、前記基準ベクトルに合成
    フィルタリングを施して前記音声信号を再現する過程と
    を有するを特徴とする請求項1または請求項2に記載の
    音声信号伝送方法。
  8. 【請求項8】  合成フィルタリングを行う前に、少な
    くとも三の、一連の早期の励振ベクトルに基づいて予測
    された励振信号の予測レベルファクタσによって、各基
    準ベクトルvk*,i*に重み付けが施されることを特
    徴とする請求項1に記載の音声信号伝送方法。
  9. 【請求項9】  線形予測法に基づいて音声のデジタル
    サンプルをコード化してなるコード信号を出力するコー
    ド化回路と、前記コード信号を伝送する伝送回路と、伝
    送された信号をデコードするデコード回路とを有し、前
    記コード化回路は、基準波形辞書に記憶され各々が基準
    ベクトル(v)を構成するとともに各初期ベクトル(o
    )に最小二乗偏差法を施した結果に各々が対応する複数
    の基準波形から選択された基準波形を用いて初期ベクト
    ル(o)を有するサンプルブロックから成る波形を再構
    成する合成フィルタと、前記初期ベクトル(o)から目
    標ベクトルxを出力するために前記初期ベクトル(o)
    に知覚力重み付けを施す手段とを有し、基準ベクトル(
    v)または波形に対応する初期ベクトル(o)について
    の前記最小二乗偏差法は、前記合成フィルタおよび前記
    知覚力重み付けによる応答を示すL行L列のパルス応答
    行列をHとし、||x−H・v||2が最小値となる基
    準ベクトル(v)を設定するものである、低スループッ
    トの音声信号伝送装置であって、前記選択を実行するた
    めに前記コード化回路は、n項形式{−n/2,・・・
    ,0,・・・,n/2}の基礎ベクトルyiから成るL
    次元の初期辞書Yを出力する手段と、スケールファクタ
    γiによって前記基礎ベクトルyiを修正する手段であ
    って、前記スケールファクタγiは信号の周波数帯域に
    おける励振エネルギーの拡散の度合いに基づいて設定さ
    れたものであり、これによって各基礎ベクトルyiにつ
    いて修正された基礎ベクトル ̄(yi)=γi・yiを
    出力する修正手段と、適合ゲインgkについての第2の
    辞書G(y)を出力する手段であって、乗算手段を含み
    、これによって前記修正された基礎ベクトルyiと適合
    ゲインgkとに基づいて、vk,i=gk・γi・yi
    なる基準ベクトルを出力する手段と、<x|H・γi・
    yi>が、前記パルス応答行列Hと修正された基礎ベク
    トルγi・yiとの積に基づく出力結果であって知覚力
    重み付けが施され再構成されたベクトルと、前記目標ベ
    クトルxとのスカラ積を表示するものである場合に、積
    2gk<x|H・γi・yi>を第1の演算結果として
    出力する第1の演算手段と、知覚的重み付けが施され再
    構成されたベクトルgk2||H・γi・yi||2の
    エネルギーを計算して第2の演算結果として出力する第
    2の演算手段と、上記第1および第2の演算結果を比較
    し、これによって、索引番号i*,k*が上記最小二乗
    偏差法の条件を満足する索引番号i,kを判別し、索引
    番号i*,k*によって示されたv=gk*・γi*・
    yi*なる対応する基準ベクトルvk*,i*を判別す
    ることが可能に構成された比較手段と、を含むことを特
    徴とする音声信号伝送装置。
  10. 【請求項10】  前記伝送回路は、音声信号を示すコ
    ード信号たる索引番号i*およびk*を送信することが
    可能であることを特徴とする請求項9に記載の音声信号
    伝送装置。
  11. 【請求項11】  前記デコード回路は、受信したコー
    ド信号の索引番号i*,k*を識別する手段と、索引番
    号k*に基づいて、適合ゲインgk*についての辞書G
    (y)を出力する手段と、対応するスカラー成分たるγ
    i*を出力する手段と、i*とgk*と予測レベルファ
    クタσとに基づいて、乗算定数σ・gk*・γi*を出
    力する乗算手段と、索引番号i*の基底nを再構成する
    手段と、索引番号i*の基底nを変換することによって
    索引番号i*に基づいて再構成された基礎ベクトル^(
    yi*)を出力する手段であって、索引番号i*の基底
    nの各表示値n,...,2,1,0は、{−n/2,
    ・・・,0,・・・,n/2}の各値に対応し、これに
    よって再構成された基準ベクトルvk*,i*を出力し
    、前記合成フィルタが再構成された基準ベクトルvk*
    ,i*に基づいて音声信号を再構成することを可能にす
    る手段と、を具備することを特徴とする請求項9に記載
    の音声信号伝送装置。
  12. 【請求項12】  前記コード化回路は、少なくとも三
    の一連の早期の励振ベクトルに基づいて予測された励振
    信号の予測レベルファクタに基づいて前記合成フィルタ
    の前段に基準ベクトルvk*,i*を修正する手段を有
    し、前記デコード回路は、前記合成フィルタの前段に、
    少なくとも三の一連の早期の励振ベクトルに基づいて予
    測された励振信号の予測レベルファクタに基づいて再構
    成された基準ベクトル^(vk*,i*)を修正する手
    段を有することを特徴とする請求項9に記載の音声信号
    伝送装置。
JP03298096A 1990-10-19 1991-10-18 音声信号伝送方法および音声信号伝送装置 Expired - Fee Related JP3130348B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9012980 1990-10-19
FR9012980A FR2668288B1 (fr) 1990-10-19 1990-10-19 Procede de transmission, a bas debit, par codage celp d'un signal de parole et systeme correspondant.

Publications (2)

Publication Number Publication Date
JPH04264500A true JPH04264500A (ja) 1992-09-21
JP3130348B2 JP3130348B2 (ja) 2001-01-31

Family

ID=9401407

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03298096A Expired - Fee Related JP3130348B2 (ja) 1990-10-19 1991-10-18 音声信号伝送方法および音声信号伝送装置

Country Status (5)

Country Link
US (1) US5226085A (ja)
EP (1) EP0481895B1 (ja)
JP (1) JP3130348B2 (ja)
DE (1) DE69128407T2 (ja)
FR (1) FR2668288B1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06222796A (ja) * 1993-01-22 1994-08-12 Nec Corp 音声符号化方式
JP2007525723A (ja) * 2004-03-15 2007-09-06 インテル・コーポレーション 音声通信のためのコンフォートノイズ生成の方法

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994025959A1 (en) * 1993-04-29 1994-11-10 Unisearch Limited Use of an auditory model to improve quality or lower the bit rate of speech synthesis systems
FR2722631B1 (fr) * 1994-07-13 1996-09-20 France Telecom Etablissement P Procede et systeme de filtrage adaptatif par egalisation aveugle d'un signal telephonique numerique et leurs applications
JP3058028B2 (ja) * 1994-10-31 2000-07-04 三菱電機株式会社 画像符号化データ再符号化装置
SE504010C2 (sv) * 1995-02-08 1996-10-14 Ericsson Telefon Ab L M Förfarande och anordning för prediktiv kodning av tal- och datasignaler
DE19516106C2 (de) * 1995-05-05 2003-04-03 Philips Corp Intellectual Pty Verfahren zum Bestimmen von Referenzwerten
US5864813A (en) * 1996-12-20 1999-01-26 U S West, Inc. Method, system and product for harmonic enhancement of encoded audio signals
US6782365B1 (en) 1996-12-20 2004-08-24 Qwest Communications International Inc. Graphic interface system and product for editing encoded audio data
US6463405B1 (en) 1996-12-20 2002-10-08 Eliot M. Case Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
US6477496B1 (en) 1996-12-20 2002-11-05 Eliot M. Case Signal synthesis by decoding subband scale factors from one audio signal and subband samples from different one
US5845251A (en) * 1996-12-20 1998-12-01 U S West, Inc. Method, system and product for modifying the bandwidth of subband encoded audio data
US6516299B1 (en) 1996-12-20 2003-02-04 Qwest Communication International, Inc. Method, system and product for modifying the dynamic range of encoded audio signals
US5864820A (en) * 1996-12-20 1999-01-26 U S West, Inc. Method, system and product for mixing of encoded audio signals
FI113571B (fi) * 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
JP4993676B2 (ja) * 2006-09-01 2012-08-08 キヤノン株式会社 画像符号化装置及び画像符号化方法
CN101430879B (zh) * 2007-11-05 2011-08-10 华为技术有限公司 一种多速率语音频编码的方法
ES2686889T3 (es) 2009-12-14 2018-10-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dispositivo de cuantificación vectorial, dispositivo de codificación de voz, procedimiento de cuantificación vectorial y procedimiento de codificación de voz

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8302985A (nl) * 1983-08-26 1985-03-18 Philips Nv Multipulse excitatie lineair predictieve spraakcodeerder.
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
US4944013A (en) * 1985-04-03 1990-07-24 British Telecommunications Public Limited Company Multi-pulse speech coder
IT1195350B (it) * 1986-10-21 1988-10-12 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
US4910781A (en) * 1987-06-26 1990-03-20 At&T Bell Laboratories Code excited linear predictive vocoder using virtual searching
US5091946A (en) * 1988-12-23 1992-02-25 Nec Corporation Communication system capable of improving a speech quality by effectively calculating excitation multipulses
CA2005115C (en) * 1989-01-17 1997-04-22 Juin-Hwey Chen Low-delay code-excited linear predictive coder for speech or audio
US4980916A (en) * 1989-10-26 1990-12-25 General Electric Company Method for improving speech quality in code excited linear predictive speech coding
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06222796A (ja) * 1993-01-22 1994-08-12 Nec Corp 音声符号化方式
JP2007525723A (ja) * 2004-03-15 2007-09-06 インテル・コーポレーション 音声通信のためのコンフォートノイズ生成の方法

Also Published As

Publication number Publication date
DE69128407T2 (de) 1998-06-04
EP0481895A2 (fr) 1992-04-22
DE69128407D1 (de) 1998-01-22
JP3130348B2 (ja) 2001-01-31
FR2668288A1 (fr) 1992-04-24
EP0481895A3 (en) 1992-08-12
FR2668288B1 (fr) 1993-01-15
EP0481895B1 (fr) 1997-12-10
US5226085A (en) 1993-07-06

Similar Documents

Publication Publication Date Title
JP3112681B2 (ja) 音声符号化方式
JPH04264500A (ja) 音声信号伝送方法および音声信号伝送装置
US4868867A (en) Vector excitation speech or audio coder for transmission or storage
JP3114197B2 (ja) 音声パラメータ符号化方法
CA2159571C (en) Vector quantization apparatus
JP3143956B2 (ja) 音声パラメータ符号化方式
JP3077943B2 (ja) 信号符号化装置
JPH06236199A (ja) 音声パラメータ符号化方式
CN1989546B (zh) 语音编码装置和语音编码方法
US6397176B1 (en) Fixed codebook structure including sub-codebooks
JPH10268898A (ja) 音声・楽音符号化及び復号化装置
JP3285185B2 (ja) 音響信号符号化方法
JPH0854898A (ja) 音声符号化装置
JPH10222197A (ja) 音声合成方法およびコード励振線形予測合成装置
JPH0784600A (ja) ベクトル量子化装置
JP2943983B1 (ja) 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳
JP3233184B2 (ja) 音声符号化方法
JP3252285B2 (ja) 音声帯域信号符号化方法
JP3319551B2 (ja) ベクトル量子化装置
GB2199215A (en) A stochastic coder
JP3192051B2 (ja) 音声符号化装置
JPH02282800A (ja) 音声符号化方式
JP2947788B1 (ja) 音声および音響信号の高速な符号化方法および装置および記録媒体
JP4228630B2 (ja) 音声符号化装置および音声符号化プログラム
Mayrench et al. Low bit-rate speech coding using quantization of variable length segments

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20001010

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071117

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081117

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081117

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091117

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees