JPH04264500A - 音声信号伝送方法および音声信号伝送装置 - Google Patents
音声信号伝送方法および音声信号伝送装置Info
- Publication number
- JPH04264500A JPH04264500A JP3298096A JP29809691A JPH04264500A JP H04264500 A JPH04264500 A JP H04264500A JP 3298096 A JP3298096 A JP 3298096A JP 29809691 A JP29809691 A JP 29809691A JP H04264500 A JPH04264500 A JP H04264500A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- dictionary
- audio signal
- initial
- vectors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 119
- 239000013598 vector Substances 0.000 claims abstract description 273
- 230000008569 process Effects 0.000 claims description 51
- 230000005236 sound signal Effects 0.000 claims description 41
- 230000005540 biological transmission Effects 0.000 claims description 34
- 238000004364 calculation method Methods 0.000 claims description 23
- 230000015572 biosynthetic process Effects 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 22
- 230000005284 excitation Effects 0.000 claims description 21
- 238000003786 synthesis reaction Methods 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 14
- 230000006978 adaptation Effects 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 239000006185 dispersion Substances 0.000 claims description 3
- 238000009792 diffusion process Methods 0.000 claims description 2
- 230000008447 perception Effects 0.000 abstract 1
- 230000001360 synchronised effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 101000582320 Homo sapiens Neurogenic differentiation factor 6 Proteins 0.000 description 1
- 102100030589 Neurogenic differentiation factor 6 Human genes 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
め要約のデータは記録されません。
Description
グによる音声信号の低スループット送信方法および関連
システムに関する。
Linear Prediction,線形予測コード
発生)方式による音声信号のコーディング技術は、今日
実用化されており、各種の用途がある。この技術を音声
信号に対応するデジタル信号のサンプルをコーディング
するのに用いられる場合には、ハイブリッド・コーディ
ング技術が使用される。このハイブリッド・コーディン
グ技術によれば、音声信号は線形予測フィルタおよびこ
の線形予測に基づく剰余分によってモデル化される。
うなCELPコーダ100は、波形リストに含まれる全
ての要素を余すところなくテストする。そして、その信
号を最も良く合成する波形が選択され、その索引番号あ
るいは特徴アドレスがデコーダ101に供給される。こ
のテスト方法は、合成分析方法と呼ばれる。上述した波
形リストは、CELPコーダ100およびデコーダ10
1に記憶されており、「辞書」と呼ばれる。
た辞書と、使用される線形予測フィルタの分析方法/モ
デリング方法とに大きく左右され、これら二つのパラメ
ータが二つの従属自由度の構成要素となる。この従属自
由度により、所望の用途に対して、CELPコーダを最
適に適応させることが可能となる。
スループット(4〜24 kbit/sec)のコーデ
ィング装置に用いて好適である。なお、上述した技術の
詳細については、例えば、「”A robust an
d fast CELP coder at 16 k
bit/s”, published by A.le
Guyader, D. Massaloux an
d F. Zurcher Cnet Lannion
France, in the jurnal Sp
eech CommunicationNo. 7,
1988」等の文献に述べられている。
コーダにあっては、分析、伝送および再現されるデジタ
ル信号は、複数のブロックあるいはフレームに分割され
る。各ブロックはL個の値を有しており、L次元空間に
おけるベクトルとして扱われる。ここで、ベクトルvか
ら構成される励起信号が、上述した波形辞書から読み出
されて出力された場合を考えると、このベクトルvは、
以下述べる方法によって、知覚される歪が最小化される
必要がある。
める。ここで、xは目標信号であり、元々の信号Oに知
覚力重み付け(perceptual weighti
ng)を施して成るものである。また、Hは、L×Lの
パルス応答行列であり、合成フィルタの伝達関数および
上述した知覚力重み付けにより求められる。詳細は後述
するが、この重み付けを行うことにより、周波数帯域内
のコーディングノイズおよびホワイトノイズを減少させ
るという効果が得られる。ここで、行列Hは、以下の形
式による三角行列である。
クトルviが、ゲイン量辞書Gから与えられたゲイン量
gkに結びつけられる。すなわち、詳細は以下述べるが
、ベクトルviと適合ゲインgkとによって、ベクトル
vk,iが形成され、これによって上述した歪の削減基
準が満足される。
算および音声信号スループットによる複雑化を減少させ
るために、基準ベクトルを用いて一定の処理を行うこと
が提案されている。まず、励振信号を出力する場合、そ
のベクトルの各成分の値を「−1」,「0」または「1
」に限定する。これにより、ベクトルの辞書を三値論理
値の辞書として構成することが可能になる。このように
、CELP型のコーディング手順において三値論理ベク
トルを使用すること自体は、ヨーロッパ特許出願(19
89年12月20日出願のEP0,347,307)に
開示されている。
ーディング技術によれば、全ての基準ベクトルが必然的
に同じエネルギー量を含むことになる。さらに、自動修
正によってそれ自体を標準化しその位置が基準ベクトル
またはシーケンスが「0」でないコンポーネントに対応
する「0」の項を列挙するような場合を除いては、最適
な基準ベクトルまたはシーケンスをサーチすることによ
って純粋なスカラ積の計算を減少させることができない
。
トルとして考慮に入れることが不可能である。すなわち
、基準ベクトルとしては、三値論理の全ての組合せを採
り得るのであるから、かかる技術によれば、最適化され
た歪基準を全ての場合について小さくできるわけではな
いからである。
解決すること、すなわち、基準ベクトルに係る演算を単
純化することにある。ここで、基準ベクトルの辞書ある
いは指令値は、n項のベクトルについて実質的に全ての
組合せを想定している。なお、ここで「n」は奇数であ
る。
定のゲインを印加する従来の手順よりも速く、倍率デー
タを出力することによって修正手順を実行することであ
る。また、後述する周波数スペクトラム関数によって励
振信号のエネルギーを拡散することとし、これによって
周波数帯域内でエネルギーが一様でない歪をも考慮に入
れることができる。
ットでの音声信号伝送を最終的に実行することである。 ここで、音声信号においては、励振信号を構成する各基
準ベクトルをデコーダ・レベル、すなわち索引番号ある
いはアドレスで出力することを可能としている。この索
引番号あるいはアドレスは、コーダ・レベルにおいて最
小の歪基準を満足する最適な基準ベクトルを示すもので
あり、これによって上述したデコーダの構成を簡略化し
、製造コストを低減する。
この発明にあっては、音声をデジタル化したサンプルを
線形予測法によってコード化してコード信号を発生する
コード化過程と、発生したコード信号を伝送する伝送過
程と、コード信号をデコードするデコード過程とを有し
、前記コード化過程においては、サンプル量Lを有する
サンプルブロックによって波形が表され、各々が基準ベ
クトル(v)を構成する複数の基準波形の中から選択さ
れた一の基準波形に基づいて合成フィルタによってL次
元の初期ベクトル(o)を形成する初期ベクトル形成過
程を有し、前記初期ベクトル形成過程においては、前記
初期ベクトル(o)によって知覚力重み付けの施された
目標ベクトルをxとし、前記合成フィルタおよび前記知
覚力重み付けによる応答を示すL行L列のパルス応答行
列をHとし、前記初期ベクトル(o)と、前記基準ベク
トル(v)または前記基準波形とについての最小二乗偏
差法に基づいて、||x−H・v||2が最小値となる
基準ベクトル(v)を選択する、低スループットの音声
信号伝送方法であって、前記コード化過程は、n項形式
{−n/2,・・・,0,・・・,n/2}(ただしn
は奇数であってn/2はnを2で除算したときの整数部
である)の基礎ベクトルyiから成るL次元の初期辞書
Yに基づいて辞書を形成する過程であって、出力される
信号の周波数帯域内における励振エネルギーの分散と適
合ゲインgkから成る第2の辞書G(y)とに基づくス
ケールファクタγiによって前記基礎ベクトルyiが修
正され、これによって、各基準ベクトルvk,iがvk
,i=gk・γi・yiなる条件を満足する基準ベクト
ルまたは波形の辞書を形成する過程と、全てのスカラ積
<x|H・γi・yi>および全ての知覚エネルギー|
|H・y||2を求めることによってC(gk,γi・
yi)=2gk<x|H・γi・yi>−gk2||H
・γi・yi||2の最大値を求め、これによって||
x−gk・H・γi・yi||2の最小値を求め、さら
に前記初期ベクトル(o)を、vk*,i*=gk*・
γi*・yi*なる最適基準ベクトルvk*,i*に割
当て、||x−gk・H・γi・yi||2が最小とな
る条件を満たす最適基準ベクトルvk*,i*を索引番
号(k*,i*)で表示する過程と、を有することを特
徴としている。
送信する方法は、コード信号を出力するために線形予測
法によって音声のデジタル・サンプルをコーディングす
るコーディング過程と、このコード信号を伝送する伝送
過程と、受信したコード信号をデコードする受信過程と
を含む。
値を含むサンプルブロックに表示されるとともにL次元
の初期ベクトル(o)を構成する波形を表示する表示過
程に基づいて実行される。この表示過程は、合成フィル
タに基づいて、基準波形によって行われる。
択された波形であり、この基準波形辞書においては、各
基準波形は基準ベクトル(v)を構成する。各基準ベク
トル(v)は上記初期ベクトル(o)の最小二乗偏差の
基準値と対応している。すなわち、上述した波形または
基準ベクトル(v)と、||x−H・v||2の最小値
(なお、ここでxは、初期ベクトル(o)に知覚力重み
付けをすることによって求められる目標ベクトルであり
、Hは知覚力重み付けおよび合成フィルタの出力結果に
よって求められるL×Lのパルス応答行列である)とが
対応している。
書Yを修正することによって辞書を確立することに留意
する必要がある。すなわち、初期辞書Yは、n項形式{
−n/2,・・・,0,・・・,n/2}のL次元のベ
クトルyiによって構成されている。ここでnは奇数で
ある。これら基本ベクトルは、各々スケール・ファクタ
γiによって修正される。
周波数帯域内における励振エネルギーの分散と、複数の
ゲインgkを有する第2の辞書G(y)とを考慮して設
定する。このようにして、波形または基準ベクトルの辞
書が形成される。各基準ベクトルは、vk,i=gk・
γi・yiなる関係を満足する。なお、「n/2」なる
値は、nを「2」で除算した整数部である。
カラ積と、全ての知覚エネルギー(perceptua
l energy)||H・y||2とを計算すること
によってC(gk,γi・yi) =2gk<x|H・γi・yi>−gk2||H・
γi・yi||2の最大値を計算を行い、これによって
、最小二乗偏差値min||x−gk・H・γi・yi
||2が求まる。これにより、対応する最適基準ベクト
ルvk*,i*を初期ベクトル(o)に割当てることが
可能となる。ここで、 vk*,i*=gk*・γi*・yi*である。この最
適基準ベクトルは、min||x−gk・H・γi・y
i||2の判断基準を満足する索引番号k*,i*によ
って表される。
で音声信号を伝送する過程は、各最適基準ベクトルvk
*,i*を、索引番号k*,i*によるコード信号とし
て送信する。
って低スループットで送信された音声信号をデコードす
る過程にあっては、コード信号のデコードを確実にする
ために、コード信号を構成する索引番号k*,i*を判
別する点に特徴がある。まず、対応する基礎ベクトルy
i*を得るために、n基底から最適基準ベクトルを表示
する最適索引番号i*を分離する。
k*,i*を再現して構成するために、対応するスケー
ルファクタγi*および対応する適合ゲインgk*の索
引番号i*に基づいて、再現された対応する基礎ベクト
ルの修正が実行される。そして、音声信号を再構成する
ために、再現された基準ベクトルvk*,i*に対して
合成フィルタ動作が行われる。
ディングの各過程を含む本発明による動作によれば、低
スループットで音声信号を伝送することが可能であるか
ら、特に、移動体相互間の通信等の用途に用いてきわめ
て好適である。
スループット送信方法を図2(a)、(b)を参照して
説明する。図2において、本実施例の方法は、線形予測
法によって音声のデジタルサンプルをコード化するコー
ディング過程を含む。この過程により、コード信号を出
力することが可能になる。本実施例の方法は、さらに、
このコード信号を伝送する伝送過程と、受信したコード
信号をデコードするデコーディング過程とを含む。
個のサンプルを有するサンプルブロックあるいはフレー
ムで示された波形に基づいてL次元の初期ベクトル(o
)を生成する処理を有している。この初期ベクトル(o
)は、基準波形によって、合成フィルタに基づいて、対
応する波形を表示するようになり、ベクトルvとなる。 このベクトルvは、基準波形辞書から選択されたもので
あり、この辞書内の各波形は上記基準ベクトルを構成し
ている。この選択動作は、上記基準波形または基準ベク
トル(v)に関係させつつ、初期ベクトル(o)に対す
る最小二乗偏差法によって行われる。すなわち、||x
−H・v||2の最小値が求められる。
クトル(o)に知覚力重み付けを施すことによって得ら
れる。また、Hは知覚力重み付けおよび合成フィルタの
出力結果によって求められるL×Lのパルス応答行列で
ある。本実施例による方法においては、コーディング過
程は以下のように設定される。すなわち、選択の判断基
準は、基礎ベクトルyiから成る初期辞書Yを変更して
ゆくことにより、辞書を確立する。
わち、これら基礎ベクトルの要素aj(ここでjは[0
,L−1]に含まれる)は、n種類の離散的な値を取り
得る。一般的には、各要素ajは、「1」づつインクリ
メントされた[−n/2,・・・,0,・・・,n/2
]なる集合に属する値を取り得る。ここで、nは奇数で
あり、「n/2」なる値は、nを「2」で除算した整数
部である。
礎ベクトルyiは、信号の周波数帯域内における励振エ
ネルギーの拡散を考慮に入れながら、スケールファクタ
γiによって修正される。
ールファクタγiはデータベースに基づいて経験的に決
定される。このデータベースは、例えば、同一言語を話
す数人の発音者の意味のある長さの音声サンプルを数時
間に渡って記録することによって構成される。勿論、言
語は複数存在しても良い。経験的には、種々の言語に渡
る表現の多様性は、上述したスケールファクタγiの2
段目までによって決定できる。なお、次数L=5の三値
論理ベクトルのスケールファクタγiを記憶したテーブ
ルについて、詳細は後述する。
「L」の音声サンプルをデータベースから取り出す過程
が実行され、この中で各基礎ベクトルγiを識別する手
順が実行される。次に、対応する各基礎ベクトルyiに
対してスケールファクタγiが決定される。そして、上
述した基礎ベクトルyiに関連して対応するスケールフ
ァクタγiを得るために、最もマッチングの小さな係数
を検索し、識別された係数あるいはマッチングの取れた
係数の平均値uを求める。
成され、先に述べた改定された辞書についても、この第
2の辞書を介して、同様に作成される。以下、この第2
の辞書をG(y)と表記する。この第2の辞書G(y)
は、ゲインgkの辞書によって形成される。このように
して、改定された辞書は、基準ベクトルまたは波形辞書
を構成するようになる。そして、各基準ベクトルは、v
k,i=gk・γi・yi なる関係を満たすようになる。
留意する必要がある。すなわち、図2(a)に示すよう
に、スケールファクタγiを供給することによって行わ
れる修正動作は、各基礎ベクトルyiの要素ajに単な
る重み付けを施すことではない。すなわち、各スケール
ファクタ係数γiは、音声信号の周波数帯域における励
振エネルギーの拡散の度合いを示している。
方法は、全てのスカラ成分<x|H・γi・yi>と、
全ての知覚エネルギー(perceptual ene
rgy)||H・y||2とについて C(gk,γi・yi) =2gk<x|H・γi・yi>−gk2||H・
γi・yi||2なる関数を求めることによって min||x−gk・H・γi・yi||2なる最小二
乗偏差を求めることに特徴がある。
に対して、対応する最適基準ベクトルvk*,i*すな
わちgk*・γi*・yi*を割当てることが可能とな
る。 そして、かかる本実施例の手法によれば、この最適基準
ベクトルが、上述した min||x−gk・H・γi・yi||2の基準を満
たすk*,i*なる索引番号によって表示されることが
判る。
さらに詳細な動作説明を行う。これらの基礎ベクトルは
、n項L次元のベクトルであり、その要素ajの取り得
る値は、「−n/2」〜「n/2」の範囲の「1」きざ
みの整数である。次に、図2(b)において、基礎ベク
トル(Basis vectors)をy0,y1,y
i,ykとする。 ここで、K=(nL−3)/2であり、「0」〜「K」
は連続番号である。
つである。次に、スケールファクタγiを用いて修正が
行われる。ここで、スケールファクタγiは、ゲインg
kと同様に単に重み付けを行うものではない。この理由
は先に述べた通りである。そして、対応するスケールフ
ァクタγiが上述したように決定され、基礎ベクトルy
iの各要素ajに印加される。図2(b)にあっては、
適合ゲインgkの適用例が示されている。すなわち、基
礎ベクトルyiの各要素ajは、gk・γiで乗算され
る。
ーディング過程の実行において、最小二乗偏差値min
||x−gk・H・γi・yi||2は対応するゲイン
・エレメントgkを第2の辞書G(y)選択されること
によって求められ、これによって偏差|g−gk*|が
最小化されることが明らかに判る。ここに、gは以下の
関係を満たす。
iの初期辞書Yを構成するための基礎ベクトルyiの配
列について、より詳細な説明を図3(a)、(b)を参
照して行う。まず、辞書Yは、n次形式[−n/2,・
・・,0,・・・,n/2]L次の基礎ベクトルyiに
よって構成されている。 そして、辞書Yは、「0」ベクトルを除いて、そのL成
分がn次形式である全ての基礎ベクトルを含む。一般的
に基礎ベクトルの索引番号iは、値[−n/2,・・・
,0,・・・,n/2]がそれぞれ対応する値(0,1
,2,・・・,n)に変換された後に、各基礎ベクトル
の基底nの値と等しくされる。 すなわち、n次形式の基礎ベクトルyiが、その索引番
号iに基づいて配列され、この索引番号iの値が各ベク
トルの基底nとして設定される。
の基礎ベクトルyiが、n/2・Lパルスベクトルから
定義される。ここに、パルスベクトルはシングルコンポ
ーネントの要素aj(ここでjは[0,L−1]に含ま
れる)から成り、「−1」,「−2」,・・・「−n/
2」に等しい。各パルスベクトルは対応する基礎ベクト
ルと関係付けられる。すなわち、各基礎ベクトルはq≦
jなる同一数の複数の要素を有し、各ベクトルがランク
qのパルスベクトルと関係付けられる。ここで、ajが
「0」でない場合にはq=jである。このように、j=
qなるパルスベクトルとパルス、あるいは、より高いラ
ンクのj=q’なるベクトルによる線形な関係がパルス
ベクトルに付される。
yiの辞書を出力する場合の動作、および、これら基礎
ベクトルを出力する動作のより詳細な説明を図3(a)
および(b)を参照して行う。なお、本発明の範囲を逸
脱することなく、同様の方法によってn項L次元形式の
ベクトルを発生させることができることは勿論である。 図3(a)および(b)において、オペレータ・セルは
、それぞれ対応する符号が付されており、対応するパル
スベクトルと関連するベクトルとから構成された副辞書
と、上述したパルスベクトルとに基づいて、全ての副辞
書を結合して完全な辞書を出力することが可能である。
の符号が付された遅延回路を含む。この遅延回路の伝達
関数は、一般のZ変換の表記方法に従って、「Z+1」
と示される。また、各オペレータは、“Sy”の符号を
付した対称化演算子を含む。この演算子の関数は、入力
されたベクトルの全ての要素に対して、「+1」,「0
」および「−1」を乗算する。そして、“S”の符号が
付された回路は加算器であり、遅延回路Rの出力信号が
供給されるとともに、“F”の位置にあるスイッチIを
介してと対称化演算子Syの出力信号が供給される。一
方、スイッチIが“O”の位置にある場合には、L次元
の「0」ベクトル[0,0,0,0]が供給される。図
3(a)(1),(2),(3)における各演算回路は
、辞書Yの各基礎ベクトルyiを出力する一連の処理手
順のうち、各々異なるステップにおける動作を示してい
る。
本明細書においては、文字の上にオーバーラインを付す
べきところを、例えば“ ̄(a)”のように表示し、ま
た、文字の上に“^”マークを付すべきところを、例え
ば“^(a)”のように表示することがある。
出力する初期段階における動作を示す。図において初期
パルスあるいはパルスベクトルδL−1は、遅延回路R
の入力端に供給される。次に、対称化演算子Syに対し
て、副辞書 ̄(DO)が供給される。この副辞書 ̄(D
O)は、初期状態においては、上述したパルスベクトル
δL−1から構成されている。これにより、対称化演算
子Syは、対称化された副辞書 ̄(DO)を出力する。 この様子を図3(b)に示す。次に、加算器Sには、遅
延回路Rからランクq=L−2のパルスベクトルδL−
2が供給され、あるいは「0」ベクトルが供給される。 また、加算器Sには、対称化された副辞書 ̄(DO)が
供給される。これにより、加算器Sは、基礎ベクトルy
1,y2,y3から成る辞書D1を出力する。
に示すように、パルスベクトルδL−2は基礎ベクトル
y1,y2,y3から成る副辞書D1と結合する。そし
て、パルスベクトルδL−1は、基礎ベクトルy0は勿
論のこと、「0」ベクトルをも形成する。
行う場合にあっては、演算回路は基礎ベクトルyiを出
力することが可能になっている。すなわち、遅延回路R
の出力レベルでパルスベクトルδL−mを受信し、対称
化演算子Syのレベルで辞書Dm−1を受信する。この
辞書Dm−1は、辞書D1と同様に帰還動作によって得
られるものである。次に、同図(2)における加算器S
は、遅延回路Rから出力されたパルスベクトルδL−m
−1あるいは「0」ベクトルと、副辞書 ̄(Dm−1)
とから副辞書Dmを出力する。
スベクトルが供給されると、配列されたベクトルと対応
した副辞書とに基づいて帰還動作あるいは反復動作が繰
返され、最終的に完全な辞書を出力することが可能とな
る。なお、図3(b)において、“*”マークは「−n
/2」ないし「n/2]の値を取り得る。この値につい
てのその他の条件は既に述べた通りである。
下の点に留意する必要がある。すなわち、中間レベルm
〜Lの全ての副辞書を結合した結果により、各要素aj
が正値または負値に設定されるのであるが、この状態に
至って初めて対称化演算子Syにおける対称化処理に辞
書全体を使用することが可能となる。
応答の演算についても同様である。すなわち、パルスベ
クトルδL−1が発生する瞬間においては、システムH
は合成フィルタおよび知覚力ウエイティング・フィルタ
において、上述した動作に沿って、三値論理基礎ベクト
ルyiに基づいて作成されている途中である。なお、t
=L−1の瞬間における一部の応答の演算については、
以下SL−1(yi)と表示する。
算レベルを「1」と表示する。この図におけるオペレー
タは、時刻0,1,2,L−1におけるシステムHのパ
ルス応答を表示している。すなわち、値h0,h1,h
L−2,hL−1が、上述したオペレータに供給されて
いる。
1における全てのベクトルの部分応答についての各エレ
メントhL−m−1または「0」値の合計も表示してい
る。なお、各ベクトルは、レベルm(sic)の対称化
演算子Syによって対称化された辞書に含まれるもので
ある。
のベクトルDmの応答の集合たるSL−1(Dm)が得
られる。対称化演算子Syは、SL−1(Dm−1)の
各要素を「+1」,「0」,「−1」で乗算して出力す
る。これにより、離散的な要素の集合が得られる。最終
的には、図4(3)に示すように、元々「−1」に設定
されていた三値論理ベクトルyiのt=L−1における
応答を、最後のオペレータが供給することとなる。
る線形システムにおける応答は、上述した構成と同様に
、この構成の各ノードについて線形変換Hが施されて出
力される。
ルギーは、上述したt=L−1における一部の応答に基
づいて推測される。すなわち、ベクトルyiによって励
起される行列Hは、以下のように表記することができる
。
SL−1(yi)が決定される。これはHyiの「L−
1」次の座標である。しかしながら、
を有しており、Z−1なる基本的な遅延作用素を表示し
ている。この関係式は、以下のようにして証明すること
ができる。
らば、Z−1・yiはDm−1に属することになる。従
って、反復処理を行うことにより、D0,D1,……,
DL−1の順で、知覚エネルギーを計算することが可能
になる。D0=δL−1についての初期値、すなわち図
3に示されたパルスベクトルは、h02である。
に対する番号付けおよび計算処理の、本実施例に基づく
基本図を図5(a)、(b)に示す。一般的には、図5
(a)に示すように、上述した基礎ベクトルyiは、3
0=1のレートを有するベクトルの全体出力チャートか
らレベル「0」において出力される。また、ベクトルy
0,31はレベル1において出力され、ベクトルy1,
y2,y3……のように3L−1に基づいたベクトルは
レベルL−1において出力される。
基づいた、三重化されていない単一のセルを図5(b)
に示す。ここでは、入力された基礎ベクトルの最終座標
を更新するために、これらパルスベクトルθ−1,θ0
およびθ1の値を加算する。なお、基礎ベクトルは、+
1,0,−1の値を持つ要素から構成されている。ここ
で、図5(a)、(b)に示された構成は、三値論理チ
ャートの線形構造である。従って、n項形式に対しては
、n値論理のチャートを用いるべきであることに留意す
る必要がある。
よって、 ||H・yi||2=SL−1(yi)2+||H・Z
−1yi||なる式を演算する実施例を提供することも
可能である。 この構成を図10(a)(b)を参照して説明する。な
お、これらの図においてE(i)=||H・yi||2
である。
得るための全体出力チャートは、右から左に向って流れ
るするようになっている。また、初期エネルギーE(0
)はSL−1(0)2に等しい。図10(a)に示され
たエレメンタリーセルを同図(b)に示す。
ち基礎ベクトルの番号「i」は、前進三値ナンバリング
あるいは後退三値ナンバリングに基づいている。三値論
理ベクトルの前進ナンバリングに属する全ての番号pは
、後退ナンバリングp’(但しp’=3L/p−1)と
の対応関係を満足している。このことから、全ての計算
が、前進ナンバリングまたは後退ナンバリングに基づい
て行われるが、後者の方が好適であることが判る。
番号あるいは前進番号の索引番号を伝送することが可能
になる。なお、その詳細は後述する。ここで、さらに以
下の点について留意する必要がある。すなわち、事前に
合成フィルタリングを基準ベクトルvk*,i*に施す
従来のCELP型コーディング技術は、予測レベルファ
クタ(以下、σという)によって重み付けされている点
に利点がある。この予測レベルファクタσは、励振信号
の平均エネルギーを示す。この励振信号とは、少なくと
も三の、一連の早期の励振ベクトルに基づいて予測され
たものである。
うな演算を施す技術については、当業者に周知のことで
あるから、ここでは詳述しない。次に、<2x|H・y
i>の形式におけるスカラ成分を計算する手順の詳細を
図6を参照して説明する。ここで、全ての基礎ベクトル
yiに対してx=x/σである。ここで、予測レベルフ
ァクタσは、実際に本実施例に基づくコーディング手順
に導入され、全ての三値ベクトルyiについて<2x/
σ|H・yi>形式の解が求められる。
以下tHという)で解2x/σをフィルタリングするに
よって計算される。この解は、下式で表すことができる
。
<x’|yi>は、以下のようにして得られる。先ず、
下式に基づく計算を行う。
−1(yi)の計算と同様の手順によって、図6に示す
オペレータを用いることによって行うことが可能である
。そして、x’0,x’L−m−1,x’L−2の値が
求まり、これによって上記スカラ成分が求まる。ここで
、「0」ベクトルの場合は、「0」値に変換される。
が各基礎ベクトルyiに対して決定されて割当てられる
と、複数Nのフレームと、音声信号データベースとから
スケールファクタγiが決定される。
ファクタγiは、対応するフレームについてフィルタリ
ングした結果が最も小となるように選択される。ここで
、各スケールファクタγiを決定する方法としては、数
種類のものが考えられる。制限が無い例において、基礎
ベクトルが次元L=5の三値論理型であったとすると、
スケールファクタγiのリストは、以下列挙する121
個の値を有するテーブルとして与えられる。最初の値は
(−1,−1,−1,−1,−1,)を乗算するもので
あり、最後の値は(0,0,0,0,−1)を乗算する
ものである。
1.36,0.86,2.47,1.68,1.51,
1.12,1.04,1.38,1.86,1.51,
4.23,3.47,1.96,1.25,2.28,
0.77,2.50,3.51,0.87,1.11,
1.16,0.95,1.29,1.23,1.85,
1.34,1.55,1.60,1.51,1.44,
1.21,1.45,1.95,1.45,1.73,
4.06,1.73,1.32,1.39,2.43,
1.38,4.62,1.35,1.92,2.15,
1.44,2.20,1.95,1.07,0.88,
1.56,1.48,1.33,1.64,1.70,
1.44,3.33,1.10,1.89,0.80,
2.07,1.27,1.57,3.82,1.28,
1.31,1.34,1.94,1.86,1.25,
1.06,2.15,1.39,0.89,1.24,
1.32,1.17,1.45,0.57,1.28,
2.00,4.88,2.14,2.98,2.24,
1.23,1.66,1.41,1.82,3.44,
1.14,3.15,3.91,1.60,0.95,
1.74,1.50,1.12,2.98,1.16,
1.23,1.34,1.00,2.06,2.52,
4.52,1.93,2.89,3.21,1.39,
2.44,2.38,4.55,3.00,2.49,
3.17
た後退番号あるいは前進番号が付与されつつ、決定され
る。また、特にコード信号たる索引番号iに関係して、
音声信号の低スループット伝送が可能となる。ここで、
各索引番号k*,i*の値は、各基準ベクトルvk*,
i*を表すものとなる。
送する限りにおいては従来の伝送技術水準においても可
能なことであり、また、伝送する信号にある程度の冗長
性を持たせ、ほとんどエラーの発生しない程度にするこ
とも知られている。ここで、索引番号i*は、前進番号
であっても後退番号であっても良いことが判る。すなわ
ち、ナンバリングを変更した場合において、その変換テ
ーブルはコーダおよびデコーダ等において既知だからで
ある。
方法によって生成されるコード信号をデコードする手順
の詳細を図7を参照して説明する。図7において、デコ
ーディング過程は、ステップ1000において、コード
信号に含まれる索引番号k*とi*を分離する。次に、
処理がステップ1001に進むと、索引番号i*に基づ
いて、対応する基礎ベクトルyi*を再現するために最
適基準ベクトルの基底nを求める。次に、処理がステッ
プ1002に進むと、索引番号i*に基づいて、基礎ベ
クトルyi*と、対応するスケールファクタγi*とが
再現される。また、基準ベクトルvk*,i*=γi*
・yi*を構成するために、再現された基礎ベクトルに
対して修正が施される。
程の処理はステップ1003に進み、基準ベクトルを合
成するために、ここでフィルタリング動作が行われる。 ここで、当然、以下の点に留意する必要がある。すなわ
ち、本実施例によるコーデイング手順においては、合成
フィルタリングが行われる前に、予測レベルファクタσ
によって各基準ベクトルvk*,i*が重み付けさる。 ここで、予測レベルファクタσは、少なくとも三の、一
連の早期の励振ベクトルに基づいて予測されたものであ
る。
ベルファクタσの決定方法については、当業者に周知の
ことであるからここでは詳述しない。低スループットで
音声信号を伝送する本実施例によるシステムのさらに詳
細を図8および図9を参照して説明する。図8によれば
、コーデイング回路は、n項形式のL次行列の基礎ベク
トルyiの初期辞書Yを出力するジェネレータ1を有し
ている。これらベクトルのコンポーネントは、上述した
通り、「−n/2」ないし「n/2」の値を取り得る。 ここで、初期辞書Yを出力するジェネレータ1は、例え
ば図3(a)(b)に示した演算回路を有する計算手段
、および/または、記憶回路から構成される。この記憶
回路は、読出し/書込みメモリであってもよく、読出し
専用メモリであってもよい。この場合、読出し専用メモ
リには、上述した前進番号または後退番号に基づいて連
続的に基礎ベクトルyiの読出しを可能とする高速シー
ケンサを設けるとよい。
っては、基礎ベクトルyiとスケールファクタγiとを
修正する修正回路2を有している。この修正回路2は、
例えば読出し専用メモリから成るテーブルによって構成
される。この修正回路2は、各基礎ベクトルyiに対し
て、修正された基礎ベクトル ̄(yi)=γi・yiを
出力する。
クサであり、修正された基礎ベクトル ̄(yi)に関す
る値を連続して読み出し、適合ゲインgkについての第
2の辞書を出力する回路3に供給することが可能である
。適合ゲインgkについての第2の辞書G(y)を出力
する回路3は、増幅回路30を有している。増幅回路3
0は、上述した第2の辞書を構成するゲインgkのテー
ブルに接続されている。これにより、第2の辞書G(y
)を出力する回路3は、vk,i=gk・γi・yiな
る基準ベクトルを出力する。
路は、さらに増幅回路4を有している。増幅回路4は、
各基準ベクトルvk,iに対して、上述した予測レベル
ファクタσを適用する。さらに、本コーディング回路に
あっては、カスケード接続された合成フィルタ5と知覚
力ウエイティング・フィルタ6とを有し、ここでの伝達
関数は上述したHになる。7は加算器であり、その一入
力端において、同一構成の知覚力ウエイティング・フィ
ルタ6を介して、反転された原信号を受信する。これに
より、代数加算器たる加算器7は、入力された両信号の
差を出力する。すなわち、加算器7は、供給された信号
(sic)に対する最小歪基準を出力することが可能に
なる。
は、最小歪演算回路8を有している。この最小歪演算回
路8は、2gk<x/σ|H・γi・yi>なる積を計
算する第1演算回路80を有している。ここに、式<x
/σ|H・γi・yi>は、目標ベクトルxと、行列H
を介して再構成されるとともに知覚力重み付けの施され
たベクトルと、修正された基礎ベクトルγiyiとのス
カラ積である。そして、第1演算回路80は、第1の演
算結果r1を出力する。
されるとともに知覚力重み付けの施されたベクトルに基
づいて、gk2||H・γi・yi||2の形式を有す
るエネルギーを計算することが可能である。ここで、第
1演算回路80と第2演算回路81はプログラムモジュ
ールで構成することも可能である。このプログラムにお
ける処理の流れは、図5(a)(b)およびず10(a
)(b)に示した通りである。第2演算回路81は、第
2の演算結果r2を出力する。また、比較器83は、第
1の演算結果r1と第2の演算結果r2とを比較し、索
引番号k,iを判別することによって、最小二乗偏差基
準を満足する索引番号k*,i*を決定することを可能
としている。これら索引番号値k*,i*は、例えば図
8における検索プログラム84を実行することにより決
定可能である。
路(transmission circuit)も示
されている。この伝送回路は、音声信号を表す索引番号
k*,i*のコード信号を出力することが可能である。 この伝送回路は、従来技術に基づくCELPコーディン
グ方式に用いられていた物と同様であり、特筆すべき相
違点は無い。
路の詳細を図9を参照して説明する。図においてデコー
ディング回路は、受信したコード信号から索引番号k*
,i*を判別するためのモジュールたる判別回路10を
有している。このコード信号は、当然のことながら、所
定の規約(これは本願発明の範囲外である)に基づいて
伝送される。さらに、判別回路10は、索引番号i*,
k*に対応する情報の直列・並列変換を施す。また、デ
コーディング回路は、索引番号i*の基底nを再構成す
る回路を有している。
れることが判る。このため、図9のデコーディング回路
にあっては、索引番号k*が入力されることによって対
応する適合ゲインgk*を出力する、適合ゲインgk*
のテーブル回路11を有している。このテーブル回路1
1は、例えば適合ゲインgkを格納した読出し専用メモ
リで構成すると好適である。
回路12が設けられている。この回路は、索引番号i*
とスケールファクタγi*とを対応させる検索テーブル
を記憶した読出し専用メモリで構成すると好適である。 また、12aは乗算回路であり、上記γi*、gk*、
および予測レベルファクタσに基づいて、係数A=σ・
gk*・γi*を出力する。
i*の基底nに基づいて、再構成された基礎ベクトル^
(yi*)を出力する。これにより、回路14が、索引
番号i*に基づいて、{−n/2,・・・,0,・・・
,n/2}なる値を出力する。すなわち、索引番号i*
を、基底nの索引番号i*の値に変換する。これにより
、再構成された基礎ベクトル^(yi*)と、係数Aと
に基づいて、再構成された基準ベクトルvk*,i*を
出力することが可能になる。
れた基準ベクトル^(vk*,i*)に基づいて、音声
信号を再構成する。図9に示されたデコーディング回路
の機能は、以下のようにまとめることができる。すなわ
ち、回路12の出力信号に乗算が2回施されることによ
り、A=σ・gk*・γi*なる乗算係数が出力される
。
理ベクトルの索引番号i*が伝送される場合には、i’
={(3L−3)/2}−i* として、励振ベクトル
あるいは基準ベクトルvk*,i*の合成は以下のよう
にして行われる。
。 ■jを「3」で除算した場合の余りが「0」であれば、
vk*,i*(L−1−t)=−Aとする。 ■jを「3」で除算した場合の余りが「1」であれば、
vk*,i*(L−1−t)=0とする。 ■jを「3」で除算した場合の余りが「2」であれば、
vk*,i*(L−1−t)=Aとする。
vk*,i*の(L−1−t)次の要素である。また、
「3」で除算されるjは整数部であり、tは「1」単位
で増加する。すなわち、整数に「1」が加算される。こ
こで、jおよびtは、j=i’、t=0にイニシャライ
ズされる。そして、上述したステップは、t=L−1に
至るまでの全ての数について行われる。また、仮に、索
引番号i*のナンバリングが前進番号に基づいている場
合には、i’=iとして、上述のステップと同様にして
、jを「3」で除算した場合の余りを求めるとよい。
声信号を伝送する方法およびシステムについて説明した
が、これは、辞書Yをデコーダ段に記憶しておく必要が
無くなるという顕著な効果を呈する。すなわち、単に基
準ベクトルの索引番号がデコーダに伝送され、対応する
基準ベクトルを再構成するための計算がリアルタイムで
行われる。これにより、使用される各デコーダにおいて
、記憶装置の容量が大幅に削減される。
発生させる過程と、知覚エネルギーとのスカラ積を計算
する過程においては、基礎ベクトルを記憶しておく必要
が無いから、ハードウエア構成をきわめて簡略化するこ
とが可能である。
ムは、演算回路によってきわめて高速に実行されるから
、特にハードウエアの簡略化が重要であることは言うま
でもない。
を低スループットで音声信号を伝送する方法およびシス
テムは、n項形式の基礎ベクトルを採用したCELP型
のものであるが、「n」の値は原理上なんら限定される
ものでないことは言うまでもない。勿論、実施例におい
ては、n=3とし、基礎ベクトルは三値論理ベクトルと
して説明した。
よって、nを例えば「5」にすることも可能である。こ
の場合、5種類のアルファベット符号が付されて出力さ
れ、この出力値としては、例えば「0」,「0.5」,
「1」,「−0.5」,「−1」とすることができる。 また、これらの出力値はスケールを変更することにより
、整数値にしてもよい。また、5種類の符号を付して辞
書が出力される場合においては、伝送方法およびシステ
ムは、最大24kbit/秒程度の可変スループット型
として構成することができる。
、基準ベクトルに係る演算を単純化し、修正手順を速や
かに実行することができるとともに、デコーダの構成を
簡略化でき、その製造コストを低減することが可能であ
る。
プロセスの処理ステップを示す図、同図(b)は、同図
(a)の処理によって基礎ベクトルに施される演算を示
す図である。
れた基礎ベクトルを構成するパルスベクトルの処理を行
うモジュールを示す図であり、帰還型演算処理により基
礎ベクトルの初期辞書を作成する。同図(b)は、基礎
ベクトルの初期辞書を繰返し出力するために、における
上記基礎ベクトルに対して施される一連の処理を示す図
である。特に、一例としてn=3とし、基礎ベクトルは
三値論理値になる。
、全ての三値論理ベクトルyiに対してパルス応答を計
算する処理を示す図である。ここに、三値論理ベクトル
yiは、合成フィルタおよびカスケード接続されHなる
伝達関数を有する知覚力ウエイティング・フィルタ(重
み付けフィルタ)を励起する。
ルス応答から三値論理ベクトルの知覚エネルギー(pe
rceptual energy)を計算する処理を示
す図である。
る。
、最適な索引番号k*,i*を処理するフローチャート
である。
号伝送システムのコーディング回路の全体ブロック図で
ある。
号伝送システムのデコーディング回路の全体ブロック図
である。
のパルス応答から三値論理ベクトルの知覚エネルギーを
計算する処理を示す図である。
Claims (12)
- 【請求項1】 音声をデジタル化したサンプルを線形
予測法によってコード化してコード信号を発生するコー
ド化過程と、発生したコード信号を伝送する伝送過程と
、コード信号をデコードするデコード過程とを有し、前
記コード化過程においては、サンプル量Lを有するサン
プルブロックによって波形が表され、各々が基準ベクト
ル(v)を構成する複数の基準波形の中から選択された
一の基準波形に基づいて合成フィルタによってL次元の
初期ベクトル(o)を形成する初期ベクトル形成過程を
有し、前記初期ベクトル形成過程においては、前記初期
ベクトル(o)によって知覚力重み付けの施された目標
ベクトルをxとし、前記合成フィルタおよび前記知覚力
重み付けによる応答を示すL行L列のパルス応答行列を
Hとし、前記初期ベクトル(o)と、前記基準ベクトル
(v)または前記基準波形とについての最小二乗偏差法
に基づいて、||x−H・v||2が最小値となる基準
ベクトル(v)を選択する、低スループットの音声信号
伝送方法であって、前記コード化過程は、n項形式{−
n/2,・・・,0,・・・,n/2}(ただしnは奇
数であってn/2はnを2で除算したときの整数部であ
る)の基礎ベクトルyiから成るL次元の初期辞書Yに
基づいて辞書を形成する過程であって、出力される信号
の周波数帯域内における励振エネルギーの分散と適合ゲ
インgkから成る第2の辞書G(y)とに基づくスケー
ルファクタγiによって前記基礎ベクトルyiが修正さ
れ、これによって、各基準ベクトルvk,iがvk,i
=gk・γi・yiなる条件を満足する基準ベクトルま
たは波形の辞書を形成する過程と、全てのスカラ積<x
|H・γi・yi>および全ての知覚エネルギー||H
・y||2を求めることによってC(gk,γi・yi
)=2gk<x|H・γi・yi>−gk2||H・γ
i・yi||2の最大値を求め、これによって||x−
gk・H・γi・yi||2の最小値を求め、さらに前
記初期ベクトル(o)を、vk*,i*=gk*・γi
*・yi*なる最適基準ベクトルvk*,i*に割当て
、||x−gk・H・γi・yi||2が最小となる条
件を満たす最適基準ベクトルvk*,i*を索引番号(
k*,i*)で表示する過程と、を有することを特徴と
する音声信号伝送方法。 - 【請求項2】 前記||x−gk・H・γi・yi|
|2の最小値は、前記第2の辞書G(y)の対応する適
合ゲインgkを選択することによって行われ、これによ
って、【数1】 @なる条件を満たすgに対してg−gk*なる偏差を最
小にすることを特徴とする請求項1に記載の音声信号伝
送方法。 - 【請求項3】 n項形式{−n/2,・・・,0,・
・・,n/2}の基礎ベクトルyiについてのL次元の
前記初期辞書Yは、そのL個の要素が、「0」ベクトル
を除いて{−n/2,・・・,0,・・・,n/2}の
うち一つを有する全ての基礎ベクトルを含み、各基礎ベ
クトルについての索引番号i*は、{−n/2,・・・
,0,・・・,n/2}の値を{0,1,2,...,
n}なる値に変換した後の各基礎ベクトルの基底nの値
に等しいことを特徴とする請求項1に記載の音声信号伝
送方法。 - 【請求項4】 前記初期辞書Yを構成する基礎ベクト
ルyiは、(n/2)・L形式のパルスベクトルであり
、jが[0,L−1]に含まれる前記パルスベクトルの
単一要素ajは、「−1」,「−2」,...「−n/
2」なる値を有するとともにq次元の各パルスベクトル
は各基礎ベクトルに対して関係付けられ、q≦jである
場合には各パルスベクトルと各基礎ベクトルの要素値は
同一になり、aj≠0であってq=jの場合には、q次
元以上のパルスベクトルと基礎ベクトルとに直線的な関
係が付与されることを特徴とする請求項3に記載の音声
信号伝送方法。 - 【請求項5】 L個の音声信号値を有する複数のNフ
レームによってデータベースを作成し、このデータベー
スに基づく経験的判断によって前記各基礎ベクトルyi
に対してスケールファクタγiを対応付ける音声信号伝
送方法であって、フィルタリングを施した後の剰余分が
最小となるように前記各基礎ベクトルyiと各スケール
ファクタγiとを対応付けることを特徴とする請求項1
に記載の音声信号伝送方法。 - 【請求項6】 音声信号を伝送する際のスループット
を最小にするために、前記伝送過程においては、前記基
準ベクトルvk*,i*を示す索引番号k*,i*を伝
送することを特徴とする請求項1に記載の音声信号伝送
方法。 - 【請求項7】 コード信号のデコーディングを行うた
めに、コード信号に含まれる索引番号k*,i*を検出
する過程と、対応する基礎ベクトルyi*を再出力する
ために、最適基準ベクトルの基底nを示す索引番号i*
を再構成する過程と、前記索引番号i*と、これに対応
するスケールファクタγi*とによって再出力された基
礎ベクトルに修正を施し、これによって基準ベクトルv
k*,i*を再現する過程と、前記基準ベクトルに合成
フィルタリングを施して前記音声信号を再現する過程と
を有するを特徴とする請求項1または請求項2に記載の
音声信号伝送方法。 - 【請求項8】 合成フィルタリングを行う前に、少な
くとも三の、一連の早期の励振ベクトルに基づいて予測
された励振信号の予測レベルファクタσによって、各基
準ベクトルvk*,i*に重み付けが施されることを特
徴とする請求項1に記載の音声信号伝送方法。 - 【請求項9】 線形予測法に基づいて音声のデジタル
サンプルをコード化してなるコード信号を出力するコー
ド化回路と、前記コード信号を伝送する伝送回路と、伝
送された信号をデコードするデコード回路とを有し、前
記コード化回路は、基準波形辞書に記憶され各々が基準
ベクトル(v)を構成するとともに各初期ベクトル(o
)に最小二乗偏差法を施した結果に各々が対応する複数
の基準波形から選択された基準波形を用いて初期ベクト
ル(o)を有するサンプルブロックから成る波形を再構
成する合成フィルタと、前記初期ベクトル(o)から目
標ベクトルxを出力するために前記初期ベクトル(o)
に知覚力重み付けを施す手段とを有し、基準ベクトル(
v)または波形に対応する初期ベクトル(o)について
の前記最小二乗偏差法は、前記合成フィルタおよび前記
知覚力重み付けによる応答を示すL行L列のパルス応答
行列をHとし、||x−H・v||2が最小値となる基
準ベクトル(v)を設定するものである、低スループッ
トの音声信号伝送装置であって、前記選択を実行するた
めに前記コード化回路は、n項形式{−n/2,・・・
,0,・・・,n/2}の基礎ベクトルyiから成るL
次元の初期辞書Yを出力する手段と、スケールファクタ
γiによって前記基礎ベクトルyiを修正する手段であ
って、前記スケールファクタγiは信号の周波数帯域に
おける励振エネルギーの拡散の度合いに基づいて設定さ
れたものであり、これによって各基礎ベクトルyiにつ
いて修正された基礎ベクトル ̄(yi)=γi・yiを
出力する修正手段と、適合ゲインgkについての第2の
辞書G(y)を出力する手段であって、乗算手段を含み
、これによって前記修正された基礎ベクトルyiと適合
ゲインgkとに基づいて、vk,i=gk・γi・yi
なる基準ベクトルを出力する手段と、<x|H・γi・
yi>が、前記パルス応答行列Hと修正された基礎ベク
トルγi・yiとの積に基づく出力結果であって知覚力
重み付けが施され再構成されたベクトルと、前記目標ベ
クトルxとのスカラ積を表示するものである場合に、積
2gk<x|H・γi・yi>を第1の演算結果として
出力する第1の演算手段と、知覚的重み付けが施され再
構成されたベクトルgk2||H・γi・yi||2の
エネルギーを計算して第2の演算結果として出力する第
2の演算手段と、上記第1および第2の演算結果を比較
し、これによって、索引番号i*,k*が上記最小二乗
偏差法の条件を満足する索引番号i,kを判別し、索引
番号i*,k*によって示されたv=gk*・γi*・
yi*なる対応する基準ベクトルvk*,i*を判別す
ることが可能に構成された比較手段と、を含むことを特
徴とする音声信号伝送装置。 - 【請求項10】 前記伝送回路は、音声信号を示すコ
ード信号たる索引番号i*およびk*を送信することが
可能であることを特徴とする請求項9に記載の音声信号
伝送装置。 - 【請求項11】 前記デコード回路は、受信したコー
ド信号の索引番号i*,k*を識別する手段と、索引番
号k*に基づいて、適合ゲインgk*についての辞書G
(y)を出力する手段と、対応するスカラー成分たるγ
i*を出力する手段と、i*とgk*と予測レベルファ
クタσとに基づいて、乗算定数σ・gk*・γi*を出
力する乗算手段と、索引番号i*の基底nを再構成する
手段と、索引番号i*の基底nを変換することによって
索引番号i*に基づいて再構成された基礎ベクトル^(
yi*)を出力する手段であって、索引番号i*の基底
nの各表示値n,...,2,1,0は、{−n/2,
・・・,0,・・・,n/2}の各値に対応し、これに
よって再構成された基準ベクトルvk*,i*を出力し
、前記合成フィルタが再構成された基準ベクトルvk*
,i*に基づいて音声信号を再構成することを可能にす
る手段と、を具備することを特徴とする請求項9に記載
の音声信号伝送装置。 - 【請求項12】 前記コード化回路は、少なくとも三
の一連の早期の励振ベクトルに基づいて予測された励振
信号の予測レベルファクタに基づいて前記合成フィルタ
の前段に基準ベクトルvk*,i*を修正する手段を有
し、前記デコード回路は、前記合成フィルタの前段に、
少なくとも三の一連の早期の励振ベクトルに基づいて予
測された励振信号の予測レベルファクタに基づいて再構
成された基準ベクトル^(vk*,i*)を修正する手
段を有することを特徴とする請求項9に記載の音声信号
伝送装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9012980 | 1990-10-19 | ||
FR9012980A FR2668288B1 (fr) | 1990-10-19 | 1990-10-19 | Procede de transmission, a bas debit, par codage celp d'un signal de parole et systeme correspondant. |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04264500A true JPH04264500A (ja) | 1992-09-21 |
JP3130348B2 JP3130348B2 (ja) | 2001-01-31 |
Family
ID=9401407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP03298096A Expired - Fee Related JP3130348B2 (ja) | 1990-10-19 | 1991-10-18 | 音声信号伝送方法および音声信号伝送装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5226085A (ja) |
EP (1) | EP0481895B1 (ja) |
JP (1) | JP3130348B2 (ja) |
DE (1) | DE69128407T2 (ja) |
FR (1) | FR2668288B1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06222796A (ja) * | 1993-01-22 | 1994-08-12 | Nec Corp | 音声符号化方式 |
JP2007525723A (ja) * | 2004-03-15 | 2007-09-06 | インテル・コーポレーション | 音声通信のためのコンフォートノイズ生成の方法 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1994025959A1 (en) * | 1993-04-29 | 1994-11-10 | Unisearch Limited | Use of an auditory model to improve quality or lower the bit rate of speech synthesis systems |
FR2722631B1 (fr) * | 1994-07-13 | 1996-09-20 | France Telecom Etablissement P | Procede et systeme de filtrage adaptatif par egalisation aveugle d'un signal telephonique numerique et leurs applications |
JP3058028B2 (ja) * | 1994-10-31 | 2000-07-04 | 三菱電機株式会社 | 画像符号化データ再符号化装置 |
SE504010C2 (sv) * | 1995-02-08 | 1996-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för prediktiv kodning av tal- och datasignaler |
DE19516106C2 (de) * | 1995-05-05 | 2003-04-03 | Philips Corp Intellectual Pty | Verfahren zum Bestimmen von Referenzwerten |
US5864813A (en) * | 1996-12-20 | 1999-01-26 | U S West, Inc. | Method, system and product for harmonic enhancement of encoded audio signals |
US6782365B1 (en) | 1996-12-20 | 2004-08-24 | Qwest Communications International Inc. | Graphic interface system and product for editing encoded audio data |
US6463405B1 (en) | 1996-12-20 | 2002-10-08 | Eliot M. Case | Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband |
US6477496B1 (en) | 1996-12-20 | 2002-11-05 | Eliot M. Case | Signal synthesis by decoding subband scale factors from one audio signal and subband samples from different one |
US5845251A (en) * | 1996-12-20 | 1998-12-01 | U S West, Inc. | Method, system and product for modifying the bandwidth of subband encoded audio data |
US6516299B1 (en) | 1996-12-20 | 2003-02-04 | Qwest Communication International, Inc. | Method, system and product for modifying the dynamic range of encoded audio signals |
US5864820A (en) * | 1996-12-20 | 1999-01-26 | U S West, Inc. | Method, system and product for mixing of encoded audio signals |
FI113571B (fi) * | 1998-03-09 | 2004-05-14 | Nokia Corp | Puheenkoodaus |
JP4993676B2 (ja) * | 2006-09-01 | 2012-08-08 | キヤノン株式会社 | 画像符号化装置及び画像符号化方法 |
CN101430879B (zh) * | 2007-11-05 | 2011-08-10 | 华为技术有限公司 | 一种多速率语音频编码的方法 |
ES2686889T3 (es) | 2009-12-14 | 2018-10-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dispositivo de cuantificación vectorial, dispositivo de codificación de voz, procedimiento de cuantificación vectorial y procedimiento de codificación de voz |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8302985A (nl) * | 1983-08-26 | 1985-03-18 | Philips Nv | Multipulse excitatie lineair predictieve spraakcodeerder. |
NL8500843A (nl) * | 1985-03-22 | 1986-10-16 | Koninkl Philips Electronics Nv | Multipuls-excitatie lineair-predictieve spraakcoder. |
US4944013A (en) * | 1985-04-03 | 1990-07-24 | British Telecommunications Public Limited Company | Multi-pulse speech coder |
IT1195350B (it) * | 1986-10-21 | 1988-10-12 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
US4910781A (en) * | 1987-06-26 | 1990-03-20 | At&T Bell Laboratories | Code excited linear predictive vocoder using virtual searching |
US5091946A (en) * | 1988-12-23 | 1992-02-25 | Nec Corporation | Communication system capable of improving a speech quality by effectively calculating excitation multipulses |
CA2005115C (en) * | 1989-01-17 | 1997-04-22 | Juin-Hwey Chen | Low-delay code-excited linear predictive coder for speech or audio |
US4980916A (en) * | 1989-10-26 | 1990-12-25 | General Electric Company | Method for improving speech quality in code excited linear predictive speech coding |
CA2010830C (en) * | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
-
1990
- 1990-10-19 FR FR9012980A patent/FR2668288B1/fr not_active Expired - Fee Related
-
1991
- 1991-10-17 EP EP91402774A patent/EP0481895B1/fr not_active Expired - Lifetime
- 1991-10-17 DE DE69128407T patent/DE69128407T2/de not_active Expired - Fee Related
- 1991-10-18 US US07/779,310 patent/US5226085A/en not_active Expired - Lifetime
- 1991-10-18 JP JP03298096A patent/JP3130348B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06222796A (ja) * | 1993-01-22 | 1994-08-12 | Nec Corp | 音声符号化方式 |
JP2007525723A (ja) * | 2004-03-15 | 2007-09-06 | インテル・コーポレーション | 音声通信のためのコンフォートノイズ生成の方法 |
Also Published As
Publication number | Publication date |
---|---|
DE69128407T2 (de) | 1998-06-04 |
EP0481895A2 (fr) | 1992-04-22 |
DE69128407D1 (de) | 1998-01-22 |
JP3130348B2 (ja) | 2001-01-31 |
FR2668288A1 (fr) | 1992-04-24 |
EP0481895A3 (en) | 1992-08-12 |
FR2668288B1 (fr) | 1993-01-15 |
EP0481895B1 (fr) | 1997-12-10 |
US5226085A (en) | 1993-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3112681B2 (ja) | 音声符号化方式 | |
JPH04264500A (ja) | 音声信号伝送方法および音声信号伝送装置 | |
US4868867A (en) | Vector excitation speech or audio coder for transmission or storage | |
JP3114197B2 (ja) | 音声パラメータ符号化方法 | |
CA2159571C (en) | Vector quantization apparatus | |
JP3143956B2 (ja) | 音声パラメータ符号化方式 | |
JP3077943B2 (ja) | 信号符号化装置 | |
JPH06236199A (ja) | 音声パラメータ符号化方式 | |
CN1989546B (zh) | 语音编码装置和语音编码方法 | |
US6397176B1 (en) | Fixed codebook structure including sub-codebooks | |
JPH10268898A (ja) | 音声・楽音符号化及び復号化装置 | |
JP3285185B2 (ja) | 音響信号符号化方法 | |
JPH0854898A (ja) | 音声符号化装置 | |
JPH10222197A (ja) | 音声合成方法およびコード励振線形予測合成装置 | |
JPH0784600A (ja) | ベクトル量子化装置 | |
JP2943983B1 (ja) | 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳 | |
JP3233184B2 (ja) | 音声符号化方法 | |
JP3252285B2 (ja) | 音声帯域信号符号化方法 | |
JP3319551B2 (ja) | ベクトル量子化装置 | |
GB2199215A (en) | A stochastic coder | |
JP3192051B2 (ja) | 音声符号化装置 | |
JPH02282800A (ja) | 音声符号化方式 | |
JP2947788B1 (ja) | 音声および音響信号の高速な符号化方法および装置および記録媒体 | |
JP4228630B2 (ja) | 音声符号化装置および音声符号化プログラム | |
Mayrench et al. | Low bit-rate speech coding using quantization of variable length segments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20001010 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071117 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081117 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081117 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091117 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |