JPS6046440B2 - 音声処理方法とその装置 - Google Patents
音声処理方法とその装置Info
- Publication number
- JPS6046440B2 JPS6046440B2 JP57209489A JP20948982A JPS6046440B2 JP S6046440 B2 JPS6046440 B2 JP S6046440B2 JP 57209489 A JP57209489 A JP 57209489A JP 20948982 A JP20948982 A JP 20948982A JP S6046440 B2 JPS6046440 B2 JP S6046440B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frame
- audio
- excitation
- processing device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000003672 processing method Methods 0.000 title 1
- 230000005284 excitation Effects 0.000 claims abstract description 80
- 238000012545 processing Methods 0.000 claims description 63
- 230000004044 response Effects 0.000 claims description 16
- 238000012546 transfer Methods 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 abstract description 6
- 238000003786 synthesis reaction Methods 0.000 abstract description 3
- 230000005236 sound signal Effects 0.000 description 17
- 230000000875 corresponding effect Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 6
- 238000000034 method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 230000033458 reproduction Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
- Analogue/Digital Conversion (AREA)
Description
【発明の詳細な説明】
本発明は音声処理に関し、特にデジタル音声符号化装置
に関する。
に関する。
音声蓄積や音声応答機能を持つデジタル音声通信システ
ムは信号圧縮を用いて蓄積や伝送に必要なビットレート
を減少させる。
ムは信号圧縮を用いて蓄積や伝送に必要なビットレート
を減少させる。
当業者には公知のように、音声パタンは、その明瞭度品
質には本質的でない冗長性を含んでいる。音声パタンか
ら冗長成分を除去することにより、音声の複製を構成す
るのに必要なデジタルコードの数を大幅に低減すること
ができる。しかし、複製音声の主観的な品質は圧縮及び
符号化の技術によつて変化する。米国特許第36243
0汚に示されている公知の1つのデジタル音声符号化シ
ステムは、入力音声信号の線形予測解析を行う。音声信
号は一連の間隔に分割され、間隔内の音声を表わす一群
のパラメータが作られる。このパラメータ群は、間隔内
の音声のスペクトル包絡線を表わす線形予測係数信号と
、音声励起に対応するピッチ及び有声音信号とを含んで
いる。これらのパラメータ信号は、音声信号波形自体よ
りもはるかに遅いビットレートで符号化される。入力音
声信号の複製がパラメータ信号コードから合成によつて
作られる。合成装置は一般に声道のモデルを含み、その
中で励起パルスが全ボール予測フィルタによりスペクト
ル包絡線表示予測係数によつて修正される。従来のピッ
チ励起形線形予測符号化は非常に効率が良い。
質には本質的でない冗長性を含んでいる。音声パタンか
ら冗長成分を除去することにより、音声の複製を構成す
るのに必要なデジタルコードの数を大幅に低減すること
ができる。しかし、複製音声の主観的な品質は圧縮及び
符号化の技術によつて変化する。米国特許第36243
0汚に示されている公知の1つのデジタル音声符号化シ
ステムは、入力音声信号の線形予測解析を行う。音声信
号は一連の間隔に分割され、間隔内の音声を表わす一群
のパラメータが作られる。このパラメータ群は、間隔内
の音声のスペクトル包絡線を表わす線形予測係数信号と
、音声励起に対応するピッチ及び有声音信号とを含んで
いる。これらのパラメータ信号は、音声信号波形自体よ
りもはるかに遅いビットレートで符号化される。入力音
声信号の複製がパラメータ信号コードから合成によつて
作られる。合成装置は一般に声道のモデルを含み、その
中で励起パルスが全ボール予測フィルタによりスペクト
ル包絡線表示予測係数によつて修正される。従来のピッ
チ励起形線形予測符号化は非常に効率が良い。
しかし、生成される音声の複製は、開き取りが困難であ
るような合成品質しか持たないことがしばしばある。一
般に、このような低品質性は、音声パタンと使用される
線形予測モデルの適合の悪さに由来する。ピッチコード
の誤り、あるいは音声間隔が有声音か無声音かの決定の
誤りにより、音声の複製は乱れたり不自然なものとなる
。同様の問題は音声のフオルマイン符号化についても存
在する。例えば、ADPCMやAPCのように、予測の
あとの剰余から音声励起が得られる別の符号化方式では
、励起が不正確なモデルの影響を受けないために、大き
な改善が見られる。しかし、これらのシステムの励起ビ
ットレートは、線形予測モデルよりも少くとも1桁大き
い。剰余形のシステムで励起ビットレートを小さくしよ
うと試みると、音声品質が劣化してしまう。本発明の目
的は剰余形符号化方式よりも小さなビットレートで高品
質の改善された音質符号化方式を提供することにある。
本発明の要旨 本発明は順次パタン処理装置に関し、この順次パタンは
一連の時間間隔に分割される。
るような合成品質しか持たないことがしばしばある。一
般に、このような低品質性は、音声パタンと使用される
線形予測モデルの適合の悪さに由来する。ピッチコード
の誤り、あるいは音声間隔が有声音か無声音かの決定の
誤りにより、音声の複製は乱れたり不自然なものとなる
。同様の問題は音声のフオルマイン符号化についても存
在する。例えば、ADPCMやAPCのように、予測の
あとの剰余から音声励起が得られる別の符号化方式では
、励起が不正確なモデルの影響を受けないために、大き
な改善が見られる。しかし、これらのシステムの励起ビ
ットレートは、線形予測モデルよりも少くとも1桁大き
い。剰余形のシステムで励起ビットレートを小さくしよ
うと試みると、音声品質が劣化してしまう。本発明の目
的は剰余形符号化方式よりも小さなビットレートで高品
質の改善された音質符号化方式を提供することにある。
本発明の要旨 本発明は順次パタン処理装置に関し、この順次パタンは
一連の時間間隔に分割される。
各時間間隔において、間隔の順次パタン信号及び人工パ
タン信号を表わす信号が作られる。間隔内の順次パタン
及び人工パタン信号に応動して、順次パタンと人工パタ
ンとの差を小さくするコード信号が順次パタンを表わす
ために作られる。本発明の1つの特徴に従えば、音声パ
タンは一連の時間間隔に分割される。
タン信号を表わす信号が作られる。間隔内の順次パタン
及び人工パタン信号に応動して、順次パタンと人工パタ
ンとの差を小さくするコード信号が順次パタンを表わす
ために作られる。本発明の1つの特徴に従えば、音声パ
タンは一連の時間間隔に分割される。
各間隔において、間隔の音声パタンが表示する信号が人
工音声表示信号とともに作られる。間隔の音声表示信号
と人工音声表示信号との差に対応する信号が作られ、さ
らに差に対応する信号が小さくなるように人工音声表示
信号を修正するための信号が作られる。本発明の一実施
例では、一群の予測パラメータ信号が各時間フレームに
ついて音声信号から作られる。予測剰余信号が時間フレ
ーム音声信号と時間フレーム予測パラメータとに応動し
て作られる。予測剰余信号は第1の予測フィルタに通さ
れ・てこの時間フレームに対する音声表示信号になる。
またこの時間フレームに対する人工音声表示信号が第2
の予測フィルタにおいてフレーム予測パラメータから作
られる。この時間フレームの音声表示信号と人工音声表
示信号とに応動して、励l起コード信号が形成さ、これ
が該第2の予測フィルタに印加されて、フレーム音声表
示信号と人工音声表示信号との重みづけ平均2乗誤差を
最小にする。励起コード信号と予測パラメータ信号はこ
の時間フレームの音声パタンの複製を作るのに用いられ
る。詳細な説明 第1図は本発明の一実施例てある音声処理装置の一般的
なブロック図を示す。
工音声表示信号とともに作られる。間隔の音声表示信号
と人工音声表示信号との差に対応する信号が作られ、さ
らに差に対応する信号が小さくなるように人工音声表示
信号を修正するための信号が作られる。本発明の一実施
例では、一群の予測パラメータ信号が各時間フレームに
ついて音声信号から作られる。予測剰余信号が時間フレ
ーム音声信号と時間フレーム予測パラメータとに応動し
て作られる。予測剰余信号は第1の予測フィルタに通さ
れ・てこの時間フレームに対する音声表示信号になる。
またこの時間フレームに対する人工音声表示信号が第2
の予測フィルタにおいてフレーム予測パラメータから作
られる。この時間フレームの音声表示信号と人工音声表
示信号とに応動して、励l起コード信号が形成さ、これ
が該第2の予測フィルタに印加されて、フレーム音声表
示信号と人工音声表示信号との重みづけ平均2乗誤差を
最小にする。励起コード信号と予測パラメータ信号はこ
の時間フレームの音声パタンの複製を作るのに用いられ
る。詳細な説明 第1図は本発明の一実施例てある音声処理装置の一般的
なブロック図を示す。
第1図で、話されたメッセージのような音声パタンがマ
イクロホン101で受信される。対応するアナログ音声
信号が予測解析器110のフィルタ・サンプラ回路11
3で帯域炉波され、一連のパルスサンプルに変換される
。フィルタは、4.0kHz以上の音声信号成分を除去
し、当業者には公知のようにサンプリングは、8.0k
Hzで行うことができる。サンプリングのタイミングは
クロック発生器103からのサンプリングクロックSC
によつて行われる。回路113からのサンプルの各々は
アナログデジタル変換器115におて、振幅を表わすデ
ジタルコードに変換される。音声サンプル列は予測パラ
メータ計算機119に供給され、この計算機は当業質に
は公知のように、音声信号を10乃至20msの間隔に
分割し、一群線形予測係数信号Ak..k=1、2、3
、pを発生する。
イクロホン101で受信される。対応するアナログ音声
信号が予測解析器110のフィルタ・サンプラ回路11
3で帯域炉波され、一連のパルスサンプルに変換される
。フィルタは、4.0kHz以上の音声信号成分を除去
し、当業者には公知のようにサンプリングは、8.0k
Hzで行うことができる。サンプリングのタイミングは
クロック発生器103からのサンプリングクロックSC
によつて行われる。回路113からのサンプルの各々は
アナログデジタル変換器115におて、振幅を表わすデ
ジタルコードに変換される。音声サンプル列は予測パラ
メータ計算機119に供給され、この計算機は当業質に
は公知のように、音声信号を10乃至20msの間隔に
分割し、一群線形予測係数信号Ak..k=1、2、3
、pを発生する。
この信号は各間隔におけるN>PであるNケの音声サン
プルの予測短時間スペクトルを表わす。油変換器115
からの音声サンプルは、信号A,の形成のための時間を
与えるために遅延117で遅延される。遅延されたサン
プルは予測剰余発生器118の入力に印加される。予測
剰余発生器は、当業者には公知のように、遅延された音
声サンプルと予測パラメータAkとに応動して、これら
の差に対応する信号を形成する。予測解析器110で行
れる。各フレームについての予測パラメータ及び予測剰
余信号の形成は、197坪6月19日のビイー・エス・
アターノレ(B.S.Atal)に付与された米国特許
第3740476号又は当業者に公知の他の装置によつ
て実現できる。予測パラメータ信号Akは短時間音声ス
ペクトルを効率良く表わすことができるが、剰余信号は
一般に音声間隔によつて大きく変化し、また高いビット
速度を示すために、多くの分野で応用に適していない。
ピッチ励起形ボコーダの場合は、剰余信号のピークのみ
がピッチパルス●コードとして伝送される。しかし、そ
れで得られる音の品質は一般に貧弱である。第7図の波
形701は2・時間フレームにわたる典型的な音声パタ
ンを示している。波形703は、波形701のパタン及
びこのフレームの予測パラメータから抽出した予測剰余
信号を表わしている。すぐわかるように、波形703は
比較的複雑であり、そのピークに対応するピッチパルス
を符号化しても予測剰余信号の適切な近似にはならない
。本発明に従えば、励起コード処理装置120はフレー
ムの剰余信号Dk及び予測パラメータA,を受信し、予
め定めたビット数からなる間隔励起コードを発生する。
この励起コードは波形705に示され、ほぼ一定の比較
的遅いビット速度を持つ。フレームのこの励起コードと
予測パラメータとから作られる波形701の音声パタン
の複製を波形707に示す。波形701及び707を比
較すると、比較的遅いビット速度で、適応予測符号化に
おける高品質の音声特性が実現されていることがわかる
。一連のフレームの各々の予測剰余信号Dkと予測パラ
メータ信号Akとは、相い続くフレームの開始時におい
て回路110から励起信号形成回路120に印加される
。
プルの予測短時間スペクトルを表わす。油変換器115
からの音声サンプルは、信号A,の形成のための時間を
与えるために遅延117で遅延される。遅延されたサン
プルは予測剰余発生器118の入力に印加される。予測
剰余発生器は、当業者には公知のように、遅延された音
声サンプルと予測パラメータAkとに応動して、これら
の差に対応する信号を形成する。予測解析器110で行
れる。各フレームについての予測パラメータ及び予測剰
余信号の形成は、197坪6月19日のビイー・エス・
アターノレ(B.S.Atal)に付与された米国特許
第3740476号又は当業者に公知の他の装置によつ
て実現できる。予測パラメータ信号Akは短時間音声ス
ペクトルを効率良く表わすことができるが、剰余信号は
一般に音声間隔によつて大きく変化し、また高いビット
速度を示すために、多くの分野で応用に適していない。
ピッチ励起形ボコーダの場合は、剰余信号のピークのみ
がピッチパルス●コードとして伝送される。しかし、そ
れで得られる音の品質は一般に貧弱である。第7図の波
形701は2・時間フレームにわたる典型的な音声パタ
ンを示している。波形703は、波形701のパタン及
びこのフレームの予測パラメータから抽出した予測剰余
信号を表わしている。すぐわかるように、波形703は
比較的複雑であり、そのピークに対応するピッチパルス
を符号化しても予測剰余信号の適切な近似にはならない
。本発明に従えば、励起コード処理装置120はフレー
ムの剰余信号Dk及び予測パラメータA,を受信し、予
め定めたビット数からなる間隔励起コードを発生する。
この励起コードは波形705に示され、ほぼ一定の比較
的遅いビット速度を持つ。フレームのこの励起コードと
予測パラメータとから作られる波形701の音声パタン
の複製を波形707に示す。波形701及び707を比
較すると、比較的遅いビット速度で、適応予測符号化に
おける高品質の音声特性が実現されていることがわかる
。一連のフレームの各々の予測剰余信号Dkと予測パラ
メータ信号Akとは、相い続くフレームの開始時におい
て回路110から励起信号形成回路120に印加される
。
回路120は各フレームに対して予め定めたビット数を
持つ多要素フレーム励起コードECを発生する。各励起
コードは、フレームの励起機能を表わす1≦i≦Iのパ
ルス列に対応する。フレーム内における各パルスの振幅
β汲び位置Miは、フレームの励起信号及び予測パラメ
ータ信号からフレームの音声信号の複製が構成できるよ
うに励起信号形成回路で決定される。山及びMi信号は
コータ131で符号化され、マルチプレクサ135でフ
レームの予測パラメータ信号と多重化されてフレームの
音声パタンに対応するデジタル信号になる。励起信号形
成回路120において、1フレームの予測剰余信号市及
び予測パラメータ信号A,はそれぞれゲート122及び
124を介してフィルタ121に印加される。
持つ多要素フレーム励起コードECを発生する。各励起
コードは、フレームの励起機能を表わす1≦i≦Iのパ
ルス列に対応する。フレーム内における各パルスの振幅
β汲び位置Miは、フレームの励起信号及び予測パラメ
ータ信号からフレームの音声信号の複製が構成できるよ
うに励起信号形成回路で決定される。山及びMi信号は
コータ131で符号化され、マルチプレクサ135でフ
レームの予測パラメータ信号と多重化されてフレームの
音声パタンに対応するデジタル信号になる。励起信号形
成回路120において、1フレームの予測剰余信号市及
び予測パラメータ信号A,はそれぞれゲート122及び
124を介してフィルタ121に印加される。
各フレームの開始時において、フレームクロック信号F
Cがゲート122及び124を開き、Dk信号をフィル
タ121に印加するとともに暉信号をフィルタ121及
び123に印加する。フィルタ121は誤差信号の量子
化スペクトルがそのフオルマント領域に集中″するよう
に信号市を修正するよう構成されている。197(S1
月9日にビイー・エス・アターノレ(B.S.Atal
)等に付与された米国特許第4133976号に示され
ているように、このフィルタ構成はスペクトルの高信号
エネルギー部分をマスクする働きがある。
Cがゲート122及び124を開き、Dk信号をフィル
タ121に印加するとともに暉信号をフィルタ121及
び123に印加する。フィルタ121は誤差信号の量子
化スペクトルがそのフオルマント領域に集中″するよう
に信号市を修正するよう構成されている。197(S1
月9日にビイー・エス・アターノレ(B.S.Atal
)等に付与された米国特許第4133976号に示され
ているように、このフィルタ構成はスペクトルの高信号
エネルギー部分をマスクする働きがある。
フィルタ121の伝達関数は、Z変換信号によりとかけ
る。
る。
ただしB(Z)はフレーム予測パラメータA,によつて
制御される。予測フィルタ123は計算機119からの
フレーム予測パラメータ信号と、励起信号処理装置12
7からの人工励起信号ECとを受信する。
制御される。予測フィルタ123は計算機119からの
フレーム予測パラメータ信号と、励起信号処理装置12
7からの人工励起信号ECとを受信する。
フィルタ123は式1の伝達関数を持つている。フィル
タ121が予測剰余信号Dkに応じて重みづけフレーム
音声信号yを形成するのに対し、フィルタ123は信号
処理装置127からの励起信号に応動して重みづけ人工
音声信号父を発生する。重みづけフレーム音声信号yは
、音声パタンを連続するフレーム間隔に分割したものに
対応する第1のフレーム間隔音声パタン対応信号であり
、人工音声信号9は人工的な第2のフレーム間隔音声パ
タン対応信号である。信号y及びyは相関処理装置12
5て相関がとられ、これらの間の重みづけた差に対応す
る信号Eが作られる。信号Eは、フィルタ121からの
重みづけ音声表示信号とフィルタ123からの重みづけ
人工音声表示信号との差を小さくするように励起?号E
Cを調整するために信号処理装置127に印加される。
励起信号は1≦i≦Iのパルス列である。
タ121が予測剰余信号Dkに応じて重みづけフレーム
音声信号yを形成するのに対し、フィルタ123は信号
処理装置127からの励起信号に応動して重みづけ人工
音声信号父を発生する。重みづけフレーム音声信号yは
、音声パタンを連続するフレーム間隔に分割したものに
対応する第1のフレーム間隔音声パタン対応信号であり
、人工音声信号9は人工的な第2のフレーム間隔音声パ
タン対応信号である。信号y及びyは相関処理装置12
5て相関がとられ、これらの間の重みづけた差に対応す
る信号Eが作られる。信号Eは、フィルタ121からの
重みづけ音声表示信号とフィルタ123からの重みづけ
人工音声表示信号との差を小さくするように励起?号E
Cを調整するために信号処理装置127に印加される。
励起信号は1≦i≦Iのパルス列である。
各パルスは振幅β,と位M,とを持つ。処理装置127
はフィルタ121からの重みづけフレーム音声表示信号
とフィルタ123からの重みづけ人工表示信号との間の
差を小さくするように順次β1及びM,を形成する。重
みづけフレーム音声表示信号は K−11−K で与えられ、フレームの重みづけ人工音声表示信号はで
与えられる。
はフィルタ121からの重みづけフレーム音声表示信号
とフィルタ123からの重みづけ人工表示信号との間の
差を小さくするように順次β1及びM,を形成する。重
みづけフレーム音声表示信号は K−11−K で与えられ、フレームの重みづけ人工音声表示信号はで
与えられる。
ただし、Hnはフィルタ121又は123のインパルス
応答である。回路120で形成される励起信号は要素β
,,M,、i=1、2、 Iを持つコード信号であ
る。
応答である。回路120で形成される励起信号は要素β
,,M,、i=1、2、 Iを持つコード信号であ
る。
β,はフレーム内のパルスの振幅であり、M,はパルス
の位置である。相関信号発生回路125は各要素の相関
信号を順次発生する。各要素はフレーム内の時間1≦q
≦Qに位置する。この結果、相関処理回路は、式4に従
い、要素1に対してQケの可能な侯補を形成する。ただ
し、 である。
の位置である。相関信号発生回路125は各要素の相関
信号を順次発生する。各要素はフレーム内の時間1≦q
≦Qに位置する。この結果、相関処理回路は、式4に従
い、要素1に対してQケの可能な侯補を形成する。ただ
し、 である。
励起信号発生器127は相関信号発生回路からのC,q
信号を受信し、最大の絶対値を持つClq信号を選択し
、コード信号のi番目の要素を形成する。ただし、q*
は最大の絶対値を持つ相関信号の位置である。次にイン
デックスiがi+1に増分され、予測フィルタ123の
出力における信号9.が修正される。式4、5及び6に
従つて処理が繰返されて、要素β,+1、Mi+1が形
成される。要素β,及びM,が形成された後、要素β0
m01β2m2、・ ・・、β!MIを持つ信号がコー
タ131に印加される。当業者には公知のように、コー
タ131はβ,m1要素を量子化し、通信網140に伝
送するのに適したコード信号を形成する。第1図のフィ
ルタ121及び123の各々は前述の米国特許第413
3976号に述べられているトランスバーサルフィルタ
を用いることができる。
信号を受信し、最大の絶対値を持つClq信号を選択し
、コード信号のi番目の要素を形成する。ただし、q*
は最大の絶対値を持つ相関信号の位置である。次にイン
デックスiがi+1に増分され、予測フィルタ123の
出力における信号9.が修正される。式4、5及び6に
従つて処理が繰返されて、要素β,+1、Mi+1が形
成される。要素β,及びM,が形成された後、要素β0
m01β2m2、・ ・・、β!MIを持つ信号がコー
タ131に印加される。当業者には公知のように、コー
タ131はβ,m1要素を量子化し、通信網140に伝
送するのに適したコード信号を形成する。第1図のフィ
ルタ121及び123の各々は前述の米国特許第413
3976号に述べられているトランスバーサルフィルタ
を用いることができる。
処理装置125及び127の各々はC.S.P.社のマ
クロアリスメテイツクプロセツサシステム100やその
他の処理装置のような、式4及び6に必要な処理を行う
ことのできる当業者には公知の処理装置の1つを用いる
ことができる。処理装置125は、当業者には公知のよ
うに式4に従つてC,q信l号の形成を制御するための
プログラム命令を氷久に蓄えた読出し専用メモリを含ん
でおり、処理装置127は式6に従つてβ,及びM,信
号要素を選択するためのプログラム命令を永久に蓄えた
読出し専用メモリを含んでいる。処理装置125内のプ
ログラム命令はフオートラン(FORTRAN)言語の
形式で付録Aで示されており、処理装置127内のプロ
グラム命令はフオートラン(FORTRAN)言語の形
式で付録Bに示されている。
クロアリスメテイツクプロセツサシステム100やその
他の処理装置のような、式4及び6に必要な処理を行う
ことのできる当業者には公知の処理装置の1つを用いる
ことができる。処理装置125は、当業者には公知のよ
うに式4に従つてC,q信l号の形成を制御するための
プログラム命令を氷久に蓄えた読出し専用メモリを含ん
でおり、処理装置127は式6に従つてβ,及びM,信
号要素を選択するためのプログラム命令を永久に蓄えた
読出し専用メモリを含んでいる。処理装置125内のプ
ログラム命令はフオートラン(FORTRAN)言語の
形式で付録Aで示されており、処理装置127内のプロ
グラム命令はフオートラン(FORTRAN)言語の形
式で付録Bに示されている。
第3図は各時間フレームについての処理装置125及び
127の動作を表わす流れ図を示している。
127の動作を表わす流れ図を示している。
第3図で、Hkインパルス応答信号が、式1の伝達関係
に対してフレーム予測パラメータに応じてブロック30
5で作られる。これは、持ち合せブロック303で示し
たように、クロック103からのFC信号の受信の後で
行われる。要素インデックスi及び励起パルス位置イン
デックスqはブロック307におて1に初期化される。
予測フィルタ121及び123からの信号Yn及び9、
,−1が受信されると、ブロック309で信号C,9が
作られる。位置インデックスqがブロック311で増分
され、次の位置のCIq信号の形成が開始される。処理
装置125で励起信号要素1に対するCiQ信号が形成
されると、処理装置127が付勢される。
に対してフレーム予測パラメータに応じてブロック30
5で作られる。これは、持ち合せブロック303で示し
たように、クロック103からのFC信号の受信の後で
行われる。要素インデックスi及び励起パルス位置イン
デックスqはブロック307におて1に初期化される。
予測フィルタ121及び123からの信号Yn及び9、
,−1が受信されると、ブロック309で信号C,9が
作られる。位置インデックスqがブロック311で増分
され、次の位置のCIq信号の形成が開始される。処理
装置125で励起信号要素1に対するCiQ信号が形成
されると、処理装置127が付勢される。
処理装置127におけるqインデックスがブロック31
5で1に初期化され、iインデックスと処理装置125
で作られたClq信号とが処理装置127に転送される
。最大の絶対値を持つC,q信号を表わす信号C,q*
とその位置q*とがブロック317でゼ狛にセットされ
る。ブロック319,321,323及び325を含む
ループにおいて、Ciq信号の絶対値が信号Ciq*と
比較され、これらの大きい方が信号Ci,*として蓄え
られる。処理装置125からのC,Q信号が処理された
後、ブロック325からブロック327へ移る。励起コ
ード要素の位置M,はq*にセットされ、励起コード要
素β,は式6に従つて作られる。β,M,要素はブロッ
ク328で予測フィルタ123に出力され、インデック
スiはブロック329で増分される。フレームのβ!m
!要素が形成されると、判定ブロック331から持ち合
せブロック303へ再び制御が移る。この結果処理装置
125及び127は持ち状態になり、次のフレームのF
Cフレームクロックパルスを持ち合わせる。処理装置1
27内の励起コードはコータ131にも供給される。こ
のコータは処理装置127からの励起コードを回路網1
40で用いるのに適した形式に変換する。このフレーム
に対する予測パラメータ信号Akは遅延133を介して
マルチプレクサ135の1つの入力に印加される。コー
タ131からの励起コード信号ECはマルチプレクサの
他の入力に印加される。フレームの多重化された励起及
び予測パラメータコードは次に回路網140に送られる
。回路網140は、通信システム、音声蓄積装置゛のメ
ッセージメモリ、あるいは音声合成で用いるためのたと
えば語や音素のような予め定めたメッセージ単位のメッ
セージや語量を蓄える装置等である。
5で1に初期化され、iインデックスと処理装置125
で作られたClq信号とが処理装置127に転送される
。最大の絶対値を持つC,q信号を表わす信号C,q*
とその位置q*とがブロック317でゼ狛にセットされ
る。ブロック319,321,323及び325を含む
ループにおいて、Ciq信号の絶対値が信号Ciq*と
比較され、これらの大きい方が信号Ci,*として蓄え
られる。処理装置125からのC,Q信号が処理された
後、ブロック325からブロック327へ移る。励起コ
ード要素の位置M,はq*にセットされ、励起コード要
素β,は式6に従つて作られる。β,M,要素はブロッ
ク328で予測フィルタ123に出力され、インデック
スiはブロック329で増分される。フレームのβ!m
!要素が形成されると、判定ブロック331から持ち合
せブロック303へ再び制御が移る。この結果処理装置
125及び127は持ち状態になり、次のフレームのF
Cフレームクロックパルスを持ち合わせる。処理装置1
27内の励起コードはコータ131にも供給される。こ
のコータは処理装置127からの励起コードを回路網1
40で用いるのに適した形式に変換する。このフレーム
に対する予測パラメータ信号Akは遅延133を介して
マルチプレクサ135の1つの入力に印加される。コー
タ131からの励起コード信号ECはマルチプレクサの
他の入力に印加される。フレームの多重化された励起及
び予測パラメータコードは次に回路網140に送られる
。回路網140は、通信システム、音声蓄積装置゛のメ
ッセージメモリ、あるいは音声合成で用いるためのたと
えば語や音素のような予め定めたメッセージ単位のメッ
セージや語量を蓄える装置等である。
メッセージ単位が何であれ、回路゛120で得られたフ
レームコード列は回路網140から音声合成器150へ
送られる。合成器は回路120からのフレーム励起コー
ドとフレーム予測パラメータを用いて音声パタンを複製
を作る。合成器150内のデマルチプレクサ152はフ
レームの励起コードECをその予測パラメータAkと分
離させる。
レームコード列は回路網140から音声合成器150へ
送られる。合成器は回路120からのフレーム励起コー
ドとフレーム予測パラメータを用いて音声パタンを複製
を作る。合成器150内のデマルチプレクサ152はフ
レームの励起コードECをその予測パラメータAkと分
離させる。
励起コードは、デコーダ153で励起パルス列に復号さ
れた後、音声合成フィルタ154の励起入力に印加され
る。A,コードはフィルタ154のパラメータ入力に印
加さる。フィルタ154は励起及び予測パラメータ信号
に応動して当業者には公知のようにフレーム音声信号の
符号化された複製を作る。DA変換器156は符号化さ
れた複製をアナログ信号に変換し、この信号は低域フィ
ルタ158を通過した後変換器160によつて音声パタ
ンに変換される。回路120において励起コードを形成
を行う別の方法として、信号Ynと父。
れた後、音声合成フィルタ154の励起入力に印加され
る。A,コードはフィルタ154のパラメータ入力に印
加さる。フィルタ154は励起及び予測パラメータ信号
に応動して当業者には公知のようにフレーム音声信号の
符号化された複製を作る。DA変換器156は符号化さ
れた複製をアナログ信号に変換し、この信号は低域フィ
ルタ158を通過した後変換器160によつて音声パタ
ンに変換される。回路120において励起コードを形成
を行う別の方法として、信号Ynと父。
との間の重みづけ平均2乗誤差に基づくものがある。i
番目の励起信号パルスのβ汲びM,を形成した時の重み
づけ平均2乗誤差はで与えらヤる。
番目の励起信号パルスのβ汲びM,を形成した時の重み
づけ平均2乗誤差はで与えらヤる。
ただし、−Hnはインパルス応答H(Z)のn番目のサ
ンプルであり、M,は励起コード信号のj番目のパルス
の位置であり、β,はj番目のパルスが振幅である。パ
ルスの位置と振幅は順の作り出される。
ンプルであり、M,は励起コード信号のj番目のパルス
の位置であり、β,はj番目のパルスが振幅である。パ
ルスの位置と振幅は順の作り出される。
励起信号のi番目の要素は式7のE,を最小化すること
によつて決定される。式7は次のように書きかえること
ができる。よつて、β,、M,に先行する既知の励起コ
ード要素は第1項にしか現れない。
によつて決定される。式7は次のように書きかえること
ができる。よつて、β,、M,に先行する既知の励起コ
ード要素は第1項にしか現れない。
公知のように、E,を最小化するβ,は式8をβ,微分
してと置くことによつて得られる。
してと置くことによつて得られる。
これにより、β,の最適値は、ただし
11−r【
は予測フィルタのインパルス応答信号Hkの自己相関係
数である。
数である。
式10のβ,はパルス位置の関数であり、その可能な各
値から決定できる。
値から決定できる。
可能なパルス位置についてのlβ口の最大値が選択され
る。β,及びM,の値が得られた後、同様の方法で式1
0を解くことによりβ,+1、Mi+1の値が決定され
る。式10の第1の項、すなわち E【−1111
五1 は予測フィルタ121の出力におけるフレームの音声表
示信号に対応している。
る。β,及びM,の値が得られた後、同様の方法で式1
0を解くことによりβ,+1、Mi+1の値が決定され
る。式10の第1の項、すなわち E【−1111
五1 は予測フィルタ121の出力におけるフレームの音声表
示信号に対応している。
式10の第2の項、すなわちは、予測フィルタ123の
出力におけるフレームの人工音声表示信号に対応してい
る。
出力におけるフレームの人工音声表示信号に対応してい
る。
β,は、位置M,における励起パルスの振幅であり、第
1項と第2項との差を最小にするものである。第2図に
示したデータ処理回路は、第1の励起信号形成回路12
0の別の構成方法を示すものである。
1項と第2項との差を最小にするものである。第2図に
示したデータ処理回路は、第1の励起信号形成回路12
0の別の構成方法を示すものである。
第2図の回路は、式10に従い、フレーム予測剰余信号
市及びフレーム予測パラメータ信号Akに応動して音声
パタンの各フレームについての励起コードを発生するも
のであり、前述のC.S.P社のマクロ・アリスメテイ
ツク・プロセッサ・システム100又は当業者には公知
の他の処理装置で実現できる。第2図において、処理装
置210は音声パタンの一連のフレームの各々の予測パ
ラメータ信号A,及び予測剰余信号Dnを回路110か
らメモリ218を介して受信する。
市及びフレーム予測パラメータ信号Akに応動して音声
パタンの各フレームについての励起コードを発生するも
のであり、前述のC.S.P社のマクロ・アリスメテイ
ツク・プロセッサ・システム100又は当業者には公知
の他の処理装置で実現できる。第2図において、処理装
置210は音声パタンの一連のフレームの各々の予測パ
ラメータ信号A,及び予測剰余信号Dnを回路110か
らメモリ218を介して受信する。
この処理装置は、予測フィルタサブルーチン用読出し専
用メモリ201及び励起処理サブルーチン用読出し専用
メモリ205に氷久に蓄えられた命令の制御の下で励起
コード信号要素β19m19β29m2919β!9m
1を形成するように動作する。ROM2Olの予測フィ
ルタサブルーチンは付録Cに示され、励起処理サブルー
チンは付録Dに示されている。処理装置210は、共通
バス225、データメモリ230、中央処理装置240
、演算処理装置250、制御器インターフェイス220
及び入出力インターフェイス260を含んでいる。
用メモリ201及び励起処理サブルーチン用読出し専用
メモリ205に氷久に蓄えられた命令の制御の下で励起
コード信号要素β19m19β29m2919β!9m
1を形成するように動作する。ROM2Olの予測フィ
ルタサブルーチンは付録Cに示され、励起処理サブルー
チンは付録Dに示されている。処理装置210は、共通
バス225、データメモリ230、中央処理装置240
、演算処理装置250、制御器インターフェイス220
及び入出力インターフェイス260を含んでいる。
。当業者には公知のように、中央処理装置240は制御
器215からのコード命令に応動して、処理装置210
内の他の装置の一連の動作を制御するように構成されて
いる。演算処理装置250は中央処理装置240からの
制御信号に応動してデータメモリ230からのコード信
号に対する演算処理に行うよう構成されている。データ
メモリ230は中央処理装置240によつて指定された
信号を蓄え、この信号を演算処理装置250及び入出カ
イ”ンターフエイス260に供給する。制御器インター
フェイス220は、ROM2Ol及びROM2O5内の
プログラム命令が制御器215を介して中央処理装置2
40へ入力されるための通信リンクであり、入出力イン
ターフェイス260は、D,・及びAk信号をデータメ
モリ230へ印加するとともに、出力信号β,及びM,
をデータメモリから第1図のコータ131へ供給する。
第2図の回路の動作は、第4図のフィルタパラメータ処
理流れ図、第5図の励起コード処理流れノ図、及び第6
図のタイミング図に示されている。
器215からのコード命令に応動して、処理装置210
内の他の装置の一連の動作を制御するように構成されて
いる。演算処理装置250は中央処理装置240からの
制御信号に応動してデータメモリ230からのコード信
号に対する演算処理に行うよう構成されている。データ
メモリ230は中央処理装置240によつて指定された
信号を蓄え、この信号を演算処理装置250及び入出カ
イ”ンターフエイス260に供給する。制御器インター
フェイス220は、ROM2Ol及びROM2O5内の
プログラム命令が制御器215を介して中央処理装置2
40へ入力されるための通信リンクであり、入出力イン
ターフェイス260は、D,・及びAk信号をデータメ
モリ230へ印加するとともに、出力信号β,及びM,
をデータメモリから第1図のコータ131へ供給する。
第2図の回路の動作は、第4図のフィルタパラメータ処
理流れ図、第5図の励起コード処理流れノ図、及び第6
図のタイミング図に示されている。
音声信号の開始時において、第4図のブロック405か
らブロック410に入り、クロック発生器103からの
単一パルスSTによつてフレーム計数値rが第1フレー
ムにセットされる。第6図は2つの相い続くフレームに
おける第1図及び第2図の回路の動作を示している。第
1フレームの時刻T。(5t7の間において、予測解析
器110は、波形601のサンプリングクロックパルス
の制御の下で、波形605のようにフレームr+2の音
声パタンサンプルを形成する。解析器110は波形60
7で示すように、時間T。乃至T3においてフレームr
+1に対するA,信号を発生し、時間ち乃至T6におい
て予測剰余信号Dkを発生する。信号FC(波形603
)は時間T。乃至t1に生じる。剰余信号発生器118
から送られ、先行するフレーム中にメモリ218に蓄え
られていた信号,は、中央処理装置240の制御の下に
入出力インターフェイス260及び共通バス225を介
してデータメモリ230に入れられる。第4図の動作ブ
ロック415で示されているように、これらの処理はフ
レームクロック信号FCに応動して行われる。予測パラ
メータ計算機119から送られ先行するフレームにおい
てメモリ218に蓄えられていたフレーム予測パラメー
タ信号Akもブロック420に示したようにメモリ23
0に入えられる。これらの動作は第6図の時刻T。とt
1の間に行われる。フレームの市及びAk信号がメモリ
230に入れられた後、ブロック425に入り、式1の
伝達関数に対応する予測フィルタ係数Bkが演算処理装
置250で作註て、データメモリ250に入れられる。
らブロック410に入り、クロック発生器103からの
単一パルスSTによつてフレーム計数値rが第1フレー
ムにセットされる。第6図は2つの相い続くフレームに
おける第1図及び第2図の回路の動作を示している。第
1フレームの時刻T。(5t7の間において、予測解析
器110は、波形601のサンプリングクロックパルス
の制御の下で、波形605のようにフレームr+2の音
声パタンサンプルを形成する。解析器110は波形60
7で示すように、時間T。乃至T3においてフレームr
+1に対するA,信号を発生し、時間ち乃至T6におい
て予測剰余信号Dkを発生する。信号FC(波形603
)は時間T。乃至t1に生じる。剰余信号発生器118
から送られ、先行するフレーム中にメモリ218に蓄え
られていた信号,は、中央処理装置240の制御の下に
入出力インターフェイス260及び共通バス225を介
してデータメモリ230に入れられる。第4図の動作ブ
ロック415で示されているように、これらの処理はフ
レームクロック信号FCに応動して行われる。予測パラ
メータ計算機119から送られ先行するフレームにおい
てメモリ218に蓄えられていたフレーム予測パラメー
タ信号Akもブロック420に示したようにメモリ23
0に入えられる。これらの動作は第6図の時刻T。とt
1の間に行われる。フレームの市及びAk信号がメモリ
230に入れられた後、ブロック425に入り、式1の
伝達関数に対応する予測フィルタ係数Bkが演算処理装
置250で作註て、データメモリ250に入れられる。
8kHzのサンプリング速度に対して、pは普通16で
あり、αは普通0.85である。
あり、αは普通0.85である。
次に予測フィルタインパルス応答信号HklK−1〜
乙) ”−”■
!10ノが演算処理装置250て作られて
データメモリ230に蓄えられる。インパルス応答信号
Hkが蓄えられると、ブロック435に入り、式11の
予測フィルタ自己相関信号が作られて蓄えられる。第6
図の時刻T2において、制御器215はROM2Olを
インターフェイス220から切り離し、励起処理サブル
ーチン用ROM2O5を該イターフエイスに接続する。
これにより、第5図に示した励起パルスコードβ,,M
,の生が開始される。第6図の時静2とT4の間におい
て、励起パルス列が形成される。ブロック505におい
て、励起パルスインデックスiが1に初期化され、位置
インデックスqが1にセットされる。ブロック510で
β1がゼロにセットされ、動作ブロック515に入つて
βIq=β11が決定される。β11はこのフレームの
位置q=1における最適励起パルスである。次に判定ブ
ロック520において、β11の絶対値が予め蓄えられ
ていたβ1と比較される。最初β1はゼロであるため、
ブロック525においてM,コードはq=1にセットさ
れ、β,コードはβ11にセットされる。次にブロック
530において位置インデックスが増分され、判定ブロ
ック535からブロック515に入つて信号β1。
乙) ”−”■
!10ノが演算処理装置250て作られて
データメモリ230に蓄えられる。インパルス応答信号
Hkが蓄えられると、ブロック435に入り、式11の
予測フィルタ自己相関信号が作られて蓄えられる。第6
図の時刻T2において、制御器215はROM2Olを
インターフェイス220から切り離し、励起処理サブル
ーチン用ROM2O5を該イターフエイスに接続する。
これにより、第5図に示した励起パルスコードβ,,M
,の生が開始される。第6図の時静2とT4の間におい
て、励起パルス列が形成される。ブロック505におい
て、励起パルスインデックスiが1に初期化され、位置
インデックスqが1にセットされる。ブロック510で
β1がゼロにセットされ、動作ブロック515に入つて
βIq=β11が決定される。β11はこのフレームの
位置q=1における最適励起パルスである。次に判定ブ
ロック520において、β11の絶対値が予め蓄えられ
ていたβ1と比較される。最初β1はゼロであるため、
ブロック525においてM,コードはq=1にセットさ
れ、β,コードはβ11にセットされる。次にブロック
530において位置インデックスが増分され、判定ブロ
ック535からブロック515に入つて信号β1。
が作られる。ブロック515,525,530及び53
5を含むループがすべてのパルス位置1≦q≦Qについ
て繰返えされる。Q番目の繰返しの後、第1の励起パル
ス振幅β1=β,q*及びフレーム内のその位置m1=
q*がメモリ230に蓄えられる。この方法により、1
個の励起パルスの最初のものが決定される。第7図の波
形705においてフレームrは時刻T。とちの間にある
。このフレームに対する励起コードは8個のパルスであ
る。振幅β1で位置m1の第1パルスは時刻T..lで
生じているが、これは第5図の流れ図でi=1に対して
決定されたものである。ブロック545においてインデ
ックスiが次の励起パルスに増分され、ブロック550
及び510を介してブロック515に入る。
5を含むループがすべてのパルス位置1≦q≦Qについ
て繰返えされる。Q番目の繰返しの後、第1の励起パル
ス振幅β1=β,q*及びフレーム内のその位置m1=
q*がメモリ230に蓄えられる。この方法により、1
個の励起パルスの最初のものが決定される。第7図の波
形705においてフレームrは時刻T。とちの間にある
。このフレームに対する励起コードは8個のパルスであ
る。振幅β1で位置m1の第1パルスは時刻T..lで
生じているが、これは第5図の流れ図でi=1に対して
決定されたものである。ブロック545においてインデ
ックスiが次の励起パルスに増分され、ブロック550
及び510を介してブロック515に入る。
ブロック510と550との間のループの各繰返しが終
了するごとに、励起信号が修正されて式7の信号がさら
に小さくなる。2回目の繰返しが終了すると、パルスβ
2,m2(波形705では時刻Tm2)が形・成される
。
了するごとに、励起信号が修正されて式7の信号がさら
に小さくなる。2回目の繰返しが終了すると、パルスβ
2,m2(波形705では時刻Tm2)が形・成される
。
インデックスiが増分されるにつれて、励起パルスβ3
m3(時刻T..3)、β4m4(時刻Tj,4)、β
5m5(時刻T,n5)、β6m6(時刻T..6)、
β7m7(時刻T..7)、及びβ8n18(時刻T.
.8)が作られる。ノI番目の繰返しの後(波形609
のT4)、ブロック550からブロック555に入り、
現在のフレームの励起コードβ1m1,β2m2,・・
,β,MOが作られる。
m3(時刻T..3)、β4m4(時刻Tj,4)、β
5m5(時刻T,n5)、β6m6(時刻T..6)、
β7m7(時刻T..7)、及びβ8n18(時刻T.
.8)が作られる。ノI番目の繰返しの後(波形609
のT4)、ブロック550からブロック555に入り、
現在のフレームの励起コードβ1m1,β2m2,・・
,β,MOが作られる。
ブロック560でフレームインデックスが増分され、次
のフレームに対する第4図の予測フィルタ動作が第6図
の時刻T7において、ブロック415で開始される。次
のフレームのクロック信号FCが第6図のT7で生じる
と、フレームr+3の予測パラメータ信号が作られ、(
波形605の時刻T7とTl4の間)、Ak及びDk信
号がフレームr+2のために作られ(波形607の時刻
賜とTl3の間)、フレームr+1のための励起コード
が作られる(波形609の時刻ちとTl2の間)。第2
図の処理装置からのフレーム励起コードは、当業者には
公知のように、入出力インターフェイス260を介して
第1図のコータ131に供給される。コータ131は前
述のように動作し、励起コードの量子化と書式化を行つ
て回路網140に印加する。フレームのAk予測パラメ
ータ信号は遅延133を介してマルチプレクサ135の
1つの入力に印加され、コータ131からのフレーム励
起コードはこれと正しく多重化される。本発明について
一実施例を参照して説明した。当業者には公知のように
、本発明の範囲と精神を逸脱することなく種々の変形が
可能であることは明らかである。たとえば、ここで述べ
た実施例で線形予測パラメータと予測剰余とを用いてい
る。線形予測パラメータはフオルマントパラメータ又は
当業者に公知の他の音声パラメータで置きかえることが
できる。このとき、予測フィルタは使用する音声パラメ
ータと音声信号とに応動するよう構成され、第1図の回
路120で作られる励起信号は、音声パラメータ信号と
組合せて使われて、本発明に従つてフレームの音声パタ
ン複製を形成する。本発明の復号装置は生物的及び地質
的パタンのような順次パタンに拡張してその効率のよい
表示を得ることができる。従つて、本願で゜゜音声パタ
ゾ゛というときは、音声による信号パタンに限定される
ものでなく本発明の適用において等価な他の信号パタン
を含むものであり又゜゜励起゛も音声に必ずしも対応す
る用語ではないと理解すべきである。
のフレームに対する第4図の予測フィルタ動作が第6図
の時刻T7において、ブロック415で開始される。次
のフレームのクロック信号FCが第6図のT7で生じる
と、フレームr+3の予測パラメータ信号が作られ、(
波形605の時刻T7とTl4の間)、Ak及びDk信
号がフレームr+2のために作られ(波形607の時刻
賜とTl3の間)、フレームr+1のための励起コード
が作られる(波形609の時刻ちとTl2の間)。第2
図の処理装置からのフレーム励起コードは、当業者には
公知のように、入出力インターフェイス260を介して
第1図のコータ131に供給される。コータ131は前
述のように動作し、励起コードの量子化と書式化を行つ
て回路網140に印加する。フレームのAk予測パラメ
ータ信号は遅延133を介してマルチプレクサ135の
1つの入力に印加され、コータ131からのフレーム励
起コードはこれと正しく多重化される。本発明について
一実施例を参照して説明した。当業者には公知のように
、本発明の範囲と精神を逸脱することなく種々の変形が
可能であることは明らかである。たとえば、ここで述べ
た実施例で線形予測パラメータと予測剰余とを用いてい
る。線形予測パラメータはフオルマントパラメータ又は
当業者に公知の他の音声パラメータで置きかえることが
できる。このとき、予測フィルタは使用する音声パラメ
ータと音声信号とに応動するよう構成され、第1図の回
路120で作られる励起信号は、音声パラメータ信号と
組合せて使われて、本発明に従つてフレームの音声パタ
ン複製を形成する。本発明の復号装置は生物的及び地質
的パタンのような順次パタンに拡張してその効率のよい
表示を得ることができる。従つて、本願で゜゜音声パタ
ゾ゛というときは、音声による信号パタンに限定される
ものでなく本発明の適用において等価な他の信号パタン
を含むものであり又゜゜励起゛も音声に必ずしも対応す
る用語ではないと理解すべきである。
第1図は本発明の一実施例である音声処理装置回路のブ
ロック図を示し、第2図は第1図の回路で用いることの
できる励起信号形成処理装置のブロック図を示し、第3
は第1図の励起信号形成回路の動作を示す流れ図を示し
、第4図及び第5図は第2図の回路の回路の動作を示す
流れ図を示し、第6図は第1図及び第2図の励起信号形
成回路の動作を示すタイミング図を示し、第7図は本発
明の音声処理を説明するための波形図を示している。 〔図面の主要部分の説明〕、人工音声表示信号を発生す
る手段・・・・・・第1図の予測フィルタ123、差に
対応する信号を発生する手段・・・・・・第1図の相関
信号発生器125、修正するよう構成された信号を発生
する手段・・・・・・第1図の励起信号発生器127、
音声パラメータ信号を発生する手段・・・・・・第1図
の予測パラメータ計算機119、音声表示信号を発生す
る手段・・・・・・第1図の予測フィルタ121、第1
の信号を発生する手段・・・・・・第1図の励起信号発
生器127、線形予測パラメータを発生する手段・・・
・・・第1図の予測パラメータ計算機119、予測剰余
信号を形成する手段・・・・・・第1図の剰余信号発生
器118。
ロック図を示し、第2図は第1図の回路で用いることの
できる励起信号形成処理装置のブロック図を示し、第3
は第1図の励起信号形成回路の動作を示す流れ図を示し
、第4図及び第5図は第2図の回路の回路の動作を示す
流れ図を示し、第6図は第1図及び第2図の励起信号形
成回路の動作を示すタイミング図を示し、第7図は本発
明の音声処理を説明するための波形図を示している。 〔図面の主要部分の説明〕、人工音声表示信号を発生す
る手段・・・・・・第1図の予測フィルタ123、差に
対応する信号を発生する手段・・・・・・第1図の相関
信号発生器125、修正するよう構成された信号を発生
する手段・・・・・・第1図の励起信号発生器127、
音声パラメータ信号を発生する手段・・・・・・第1図
の予測パラメータ計算機119、音声表示信号を発生す
る手段・・・・・・第1図の予測フィルタ121、第1
の信号を発生する手段・・・・・・第1図の励起信号発
生器127、線形予測パラメータを発生する手段・・・
・・・第1図の予測パラメータ計算機119、予測剰余
信号を形成する手段・・・・・・第1図の剰余信号発生
器118。
Claims (1)
- 【特許請求の範囲】 1 音声パタンを連続するフレーム間隔に分割したフレ
ーム間隔音声パタンに対応する第1の信号を生成する手
段:該フレーム間隔音声パタンを表示するパラメータの
組と所定の形式を有する励起信号とに応答した第2のフ
レーム間隔音声パタン対応信号を生成する手段:該第1
と第2のフレーム間隔音声パタン対応信号との間に相当
する信号を発生する手段:及び該相応信号に応答して該
差相当信号を減少させるような該励起信号を発生する手
段とからなる音声処理装置。 2 特許請求の範囲第1項に記載に音声処理装置におい
て、該第1の信号生成手段は、その伝達特性が該フレー
ム間隔音声パタン表示パラメータakにより制御される
フィルタ121を含み、該フィルタは音声パタンサンプ
ルと該フレーム間隔音声パタン表示パラメータとの差に
相当する予測剰余信号dkを受信して該第1の信号を生
成しているものである音声処理装置。 3 特許請求の範囲第1項に記載の音声処理装置におい
て、該パラメータakの組は該フレーム間隔音声パター
ンの予測短時間スペクトルを表わす線形予測係数の組で
ある音声処理装置。 4 特許請求の範囲第1項に記載の音声処理装置におい
て、該励起信号は1フレーム中のパルスの最大数が予じ
め定められているパルス列であり、フレーム中のパルス
各々の振幅βiと位置miは該第2のフレーム間隔音声
パタン対応信号生成手段123において該励起信号と該
フレーム間隔音声パタン表示パラメータとからフレーム
間隔音声パタンの複製を構成するように決定されている
ものである音声処理信号。 5 特許請求の範囲第1項に記載の音声処理装置におい
て、該差相当信号発生手段125は該第1と第2のフレ
ーム間隔音声パタン対応信号との間の相関を発生してい
るものである音声処理装置。 6 特許請求の範囲第1項に記載の音声処理装置におい
て、該差相当信号発生手段は該第1と第2のフレーム間
隔音声パタン対応信号との間の平均2乗差を発生してい
る手段からなる音声処理装置。 7 特許請求の範囲第1項に記載の音声処理装置におい
て、該励起信号と該フレーム間隔音声パタン表示パラメ
ータとを多重化する手段135を含む音声処理装置。 8 特許請求の範囲第7項に記載の音声処理装置におい
て、該励起信号は多重化前に符号化されている音声処理
装置。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US06/326,371 US4472832A (en) | 1981-12-01 | 1981-12-01 | Digital speech coder |
| US326371 | 1981-12-01 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS58105300A JPS58105300A (ja) | 1983-06-23 |
| JPS6046440B2 true JPS6046440B2 (ja) | 1985-10-16 |
Family
ID=23271926
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57209489A Expired JPS6046440B2 (ja) | 1981-12-01 | 1982-12-01 | 音声処理方法とその装置 |
| JP60163090A Expired - Lifetime JPH0650437B2 (ja) | 1981-12-01 | 1985-07-25 | 音声処理装置 |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60163090A Expired - Lifetime JPH0650437B2 (ja) | 1981-12-01 | 1985-07-25 | 音声処理装置 |
Country Status (8)
| Country | Link |
|---|---|
| US (1) | US4472832A (ja) |
| JP (2) | JPS6046440B2 (ja) |
| CA (1) | CA1181854A (ja) |
| DE (1) | DE3244476A1 (ja) |
| FR (1) | FR2517452B1 (ja) |
| GB (1) | GB2110906B (ja) |
| NL (1) | NL193037C (ja) |
| SE (2) | SE456618B (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7366600B2 (en) | 2003-05-29 | 2008-04-29 | Mitsubishi Heavy Industries, Ltd. | Distributed control system for forklift |
Families Citing this family (59)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4720863A (en) * | 1982-11-03 | 1988-01-19 | Itt Defense Communications | Method and apparatus for text-independent speaker recognition |
| JPS59153346A (ja) * | 1983-02-21 | 1984-09-01 | Nec Corp | 音声符号化・復号化装置 |
| EP0119033B1 (en) * | 1983-03-11 | 1987-04-15 | Prutec Limited | Speech encoder |
| US4667340A (en) * | 1983-04-13 | 1987-05-19 | Texas Instruments Incorporated | Voice messaging system with pitch-congruent baseband coding |
| US4731846A (en) * | 1983-04-13 | 1988-03-15 | Texas Instruments Incorporated | Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal |
| US4638451A (en) * | 1983-05-03 | 1987-01-20 | Texas Instruments Incorporated | Microprocessor system with programmable interface |
| CA1219079A (en) * | 1983-06-27 | 1987-03-10 | Tetsu Taguchi | Multi-pulse type vocoder |
| US4669120A (en) * | 1983-07-08 | 1987-05-26 | Nec Corporation | Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses |
| NL8302985A (nl) * | 1983-08-26 | 1985-03-18 | Philips Nv | Multipulse excitatie lineair predictieve spraakcodeerder. |
| CA1236922A (en) * | 1983-11-30 | 1988-05-17 | Paul Mermelstein | Method and apparatus for coding digital signals |
| CA1223365A (en) * | 1984-02-02 | 1987-06-23 | Shigeru Ono | Method and apparatus for speech coding |
| US4701954A (en) * | 1984-03-16 | 1987-10-20 | American Telephone And Telegraph Company, At&T Bell Laboratories | Multipulse LPC speech processing arrangement |
| EP0163829B1 (en) * | 1984-03-21 | 1989-08-23 | Nippon Telegraph And Telephone Corporation | Speech signal processing system |
| US4709390A (en) * | 1984-05-04 | 1987-11-24 | American Telephone And Telegraph Company, At&T Bell Laboratories | Speech message code modifying arrangement |
| JPS60239798A (ja) * | 1984-05-14 | 1985-11-28 | 日本電気株式会社 | 音声信号符号化/復号化装置 |
| US4872202A (en) * | 1984-09-14 | 1989-10-03 | Motorola, Inc. | ASCII LPC-10 conversion |
| EP0186196B1 (en) * | 1984-12-25 | 1991-07-17 | Nec Corporation | Method and apparatus for encoding/decoding image signal |
| US4675863A (en) | 1985-03-20 | 1987-06-23 | International Mobile Machines Corp. | Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels |
| NL8500843A (nl) * | 1985-03-22 | 1986-10-16 | Koninkl Philips Electronics Nv | Multipuls-excitatie lineair-predictieve spraakcoder. |
| FR2579356B1 (fr) * | 1985-03-22 | 1987-05-07 | Cit Alcatel | Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation |
| US4944013A (en) * | 1985-04-03 | 1990-07-24 | British Telecommunications Public Limited Company | Multi-pulse speech coder |
| US4890328A (en) * | 1985-08-28 | 1989-12-26 | American Telephone And Telegraph Company | Voice synthesis utilizing multi-level filter excitation |
| US4912764A (en) * | 1985-08-28 | 1990-03-27 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech coder with different excitation types |
| US4720861A (en) * | 1985-12-24 | 1988-01-19 | Itt Defense Communications A Division Of Itt Corporation | Digital speech coding circuit |
| USRE34247E (en) * | 1985-12-26 | 1993-05-11 | At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
| US4827517A (en) * | 1985-12-26 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
| US4935963A (en) * | 1986-01-24 | 1990-06-19 | Racal Data Communications Inc. | Method and apparatus for processing speech signals |
| CA1323934C (en) * | 1986-04-15 | 1993-11-02 | Tetsu Taguchi | Speech processing apparatus |
| US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
| US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
| US4890327A (en) * | 1987-06-03 | 1989-12-26 | Itt Corporation | Multi-rate digital voice coder apparatus |
| US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
| US4896361A (en) * | 1988-01-07 | 1990-01-23 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
| US5285520A (en) * | 1988-03-02 | 1994-02-08 | Kokusai Denshin Denwa Kabushiki Kaisha | Predictive coding apparatus |
| JP2625998B2 (ja) * | 1988-12-09 | 1997-07-02 | 沖電気工業株式会社 | 特徴抽出方式 |
| SE463691B (sv) * | 1989-05-11 | 1991-01-07 | Ericsson Telefon Ab L M | Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen |
| US5261027A (en) * | 1989-06-28 | 1993-11-09 | Fujitsu Limited | Code excited linear prediction speech coding system |
| US5263119A (en) * | 1989-06-29 | 1993-11-16 | Fujitsu Limited | Gain-shape vector quantization method and apparatus |
| JPH0332228A (ja) * | 1989-06-29 | 1991-02-12 | Fujitsu Ltd | ゲイン―シェイプ・ベクトル量子化方式 |
| JPH0365822A (ja) * | 1989-08-04 | 1991-03-20 | Fujitsu Ltd | ベクトル量子化符号器及びベクトル量子化復号器 |
| US5235669A (en) * | 1990-06-29 | 1993-08-10 | At&T Laboratories | Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec |
| SE467806B (sv) * | 1991-01-14 | 1992-09-14 | Ericsson Telefon Ab L M | Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare |
| US5301274A (en) * | 1991-08-19 | 1994-04-05 | Multi-Tech Systems, Inc. | Method and apparatus for automatic balancing of modem resources |
| US5659659A (en) * | 1993-07-26 | 1997-08-19 | Alaris, Inc. | Speech compressor using trellis encoding and linear prediction |
| US5546383A (en) | 1993-09-30 | 1996-08-13 | Cooley; David M. | Modularly clustered radiotelephone system |
| US5602961A (en) * | 1994-05-31 | 1997-02-11 | Alaris, Inc. | Method and apparatus for speech compression using multi-mode code excited linear predictive coding |
| AU696092B2 (en) * | 1995-01-12 | 1998-09-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
| SE508788C2 (sv) * | 1995-04-12 | 1998-11-02 | Ericsson Telefon Ab L M | Förfarande att bestämma positionerna inom en talram för excitationspulser |
| JP3137176B2 (ja) * | 1995-12-06 | 2001-02-19 | 日本電気株式会社 | 音声符号化装置 |
| DE19643900C1 (de) * | 1996-10-30 | 1998-02-12 | Ericsson Telefon Ab L M | Nachfiltern von Hörsignalen, speziell von Sprachsignalen |
| US5839098A (en) | 1996-12-19 | 1998-11-17 | Lucent Technologies Inc. | Speech coder methods and systems |
| US5832443A (en) * | 1997-02-25 | 1998-11-03 | Alaris, Inc. | Method and apparatus for adaptive audio compression and decompression |
| US6003000A (en) * | 1997-04-29 | 1999-12-14 | Meta-C Corporation | Method and system for speech processing with greatly reduced harmonic and intermodulation distortion |
| US6182033B1 (en) * | 1998-01-09 | 2001-01-30 | At&T Corp. | Modular approach to speech enhancement with an application to speech coding |
| US7392180B1 (en) | 1998-01-09 | 2008-06-24 | At&T Corp. | System and method of coding sound signals using sound enhancement |
| US5963897A (en) * | 1998-02-27 | 1999-10-05 | Lernout & Hauspie Speech Products N.V. | Apparatus and method for hybrid excited linear prediction speech encoding |
| US6516207B1 (en) * | 1999-12-07 | 2003-02-04 | Nortel Networks Limited | Method and apparatus for performing text to speech synthesis |
| US7295614B1 (en) | 2000-09-08 | 2007-11-13 | Cisco Technology, Inc. | Methods and apparatus for encoding a video signal |
| EP2595146A1 (en) * | 2011-11-17 | 2013-05-22 | Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO | Method of and apparatus for evaluating intelligibility of a degraded speech signal |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3346695A (en) * | 1963-05-07 | 1967-10-10 | Gunnar Fant | Vocoder system |
| US3624302A (en) * | 1969-10-29 | 1971-11-30 | Bell Telephone Labor Inc | Speech analysis and synthesis by the use of the linear prediction of a speech wave |
| US3740476A (en) * | 1971-07-09 | 1973-06-19 | Bell Telephone Labor Inc | Speech signal pitch detector using prediction error data |
| DE2435654C2 (de) * | 1974-07-24 | 1983-11-17 | Gretag AG, 8105 Regensdorf, Zürich | Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache |
| JPS5246642A (en) * | 1975-10-09 | 1977-04-13 | Mitsubishi Metal Corp | Swimming pool |
| JPS5343403A (en) * | 1976-10-01 | 1978-04-19 | Kokusai Denshin Denwa Co Ltd | System for analysing and synthesizing voice |
| US4130729A (en) * | 1977-09-19 | 1978-12-19 | Scitronix Corporation | Compressed speech system |
| US4133976A (en) * | 1978-04-07 | 1979-01-09 | Bell Telephone Laboratories, Incorporated | Predictive speech signal coding with reduced noise effects |
| US4184049A (en) * | 1978-08-25 | 1980-01-15 | Bell Telephone Laboratories, Incorporated | Transform speech signal coding with pitch controlled adaptive quantizing |
| JPS5648690A (en) * | 1979-09-28 | 1981-05-01 | Hitachi Ltd | Sound synthesizer |
-
1981
- 1981-12-01 US US06/326,371 patent/US4472832A/en not_active Ceased
-
1982
- 1982-11-18 CA CA000415816A patent/CA1181854A/en not_active Expired
- 1982-11-22 SE SE8206641A patent/SE456618B/sv not_active IP Right Cessation
- 1982-11-25 FR FR8219772A patent/FR2517452B1/fr not_active Expired
- 1982-11-29 GB GB08233923A patent/GB2110906B/en not_active Expired
- 1982-11-30 NL NL8204641A patent/NL193037C/nl not_active IP Right Cessation
- 1982-12-01 JP JP57209489A patent/JPS6046440B2/ja not_active Expired
- 1982-12-01 DE DE19823244476 patent/DE3244476A1/de active Granted
-
1985
- 1985-07-25 JP JP60163090A patent/JPH0650437B2/ja not_active Expired - Lifetime
-
1987
- 1987-10-27 SE SE8704178A patent/SE467429B/sv not_active IP Right Cessation
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7366600B2 (en) | 2003-05-29 | 2008-04-29 | Mitsubishi Heavy Industries, Ltd. | Distributed control system for forklift |
Also Published As
| Publication number | Publication date |
|---|---|
| FR2517452A1 (fr) | 1983-06-03 |
| GB2110906B (en) | 1985-10-02 |
| DE3244476A1 (de) | 1983-07-14 |
| JPS58105300A (ja) | 1983-06-23 |
| CA1181854A (en) | 1985-01-29 |
| DE3244476C2 (ja) | 1988-01-21 |
| SE456618B (sv) | 1988-10-17 |
| GB2110906A (en) | 1983-06-22 |
| NL193037C (nl) | 1998-08-04 |
| JPS6156400A (ja) | 1986-03-22 |
| SE8704178L (sv) | 1987-10-27 |
| SE467429B (sv) | 1992-07-13 |
| SE8704178D0 (sv) | 1987-10-27 |
| SE8206641D0 (sv) | 1982-11-22 |
| NL8204641A (nl) | 1983-07-01 |
| NL193037B (nl) | 1998-04-01 |
| SE8206641L (sv) | 1983-06-02 |
| US4472832A (en) | 1984-09-18 |
| FR2517452B1 (fr) | 1986-05-02 |
| JPH0650437B2 (ja) | 1994-06-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS6046440B2 (ja) | 音声処理方法とその装置 | |
| CA1222568A (en) | Multipulse lpc speech processing arrangement | |
| US4709390A (en) | Speech message code modifying arrangement | |
| USRE32580E (en) | Digital speech coder | |
| US6041297A (en) | Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations | |
| US6006174A (en) | Multiple impulse excitation speech encoder and decoder | |
| EP0342687B1 (en) | Coded speech communication system having code books for synthesizing small-amplitude components | |
| JPH10187196A (ja) | 低ビットレートピッチ遅れコーダ | |
| JPS5936275B2 (ja) | 残留励起予測音声符号化方式 | |
| JPH0728495A (ja) | 音声信号の組み込み式コード化システム | |
| US5295224A (en) | Linear prediction speech coding with high-frequency preemphasis | |
| EP0232456A1 (en) | Digital speech processor using arbitrary excitation coding | |
| EP1103953B1 (en) | Method for concealing erased speech frames | |
| US5235670A (en) | Multiple impulse excitation speech encoder and decoder | |
| JP2853170B2 (ja) | 音声符号化復号化方式 | |
| JPH0411040B2 (ja) | ||
| JP2853126B2 (ja) | マルチパルス符号化装置 | |
| WO2001009880A1 (en) | Multimode vselp speech coder | |
| JP2560486B2 (ja) | マルチパルス符号化装置 | |
| JPH1185198A (ja) | ボコーダ符号化復号装置 | |
| JPH077275B2 (ja) | 音声信号符号化方式とその装置 | |
| JPH09297597A (ja) | 高能率音声伝送方法及び高能率音声伝送装置 | |
| JPH0675599A (ja) | 音声符号化法及び音声復号化法並びに音声符復号化装置 | |
| JPH043876B2 (ja) | ||
| JPH0683149B2 (ja) | 音声帯域信号符号化・復号化装置 |