JPH0650437B2 - 音声処理装置 - Google Patents

音声処理装置

Info

Publication number
JPH0650437B2
JPH0650437B2 JP60163090A JP16309085A JPH0650437B2 JP H0650437 B2 JPH0650437 B2 JP H0650437B2 JP 60163090 A JP60163090 A JP 60163090A JP 16309085 A JP16309085 A JP 16309085A JP H0650437 B2 JPH0650437 B2 JP H0650437B2
Authority
JP
Japan
Prior art keywords
signal
frame
excitation
speech
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60163090A
Other languages
English (en)
Other versions
JPS6156400A (ja
Inventor
サループ アタル ビシユニユ
リチヤード レムデ ジヨエル
Original Assignee
ウエスタ−ン エレクトリツク カムパニ−,インコ−ポレ−テツド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ウエスタ−ン エレクトリツク カムパニ−,インコ−ポレ−テツド filed Critical ウエスタ−ン エレクトリツク カムパニ−,インコ−ポレ−テツド
Publication of JPS6156400A publication Critical patent/JPS6156400A/ja
Publication of JPH0650437B2 publication Critical patent/JPH0650437B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Analogue/Digital Conversion (AREA)

Description

【発明の詳細な説明】 本発明は音声処理に関し、特にデジタル音声符号化装置
に関する。
音声蓄積や音声応答性能を持つデジタル音声通信システ
ムは信号圧縮を用いて蓄積や伝送に必要なビツトレート
を減少させる。当業者には公知のように、音声パタン
は、その明瞭度品質には本質的でない冗長性を含んでい
る。音声パタンから冗長成分を除去することにより、音
声の複製を構成するのに必要なデジタルコードの数を大
幅に低減することができる。しかし、複製音声の主観的
な品質は圧縮及び符号化の技術によつて変化する。
米国特許第3,624,302号に示されている公知の
1つのデジタル音声符号化システムは、入力音声信号の
線形予測解析を行う。音声信号は一連の間隔に分割さ
れ、間隔内の音声を表わす一群のパラメータが作られ
る。このパラメータ群は、間隔内の音声のスペクトル包
絡線を表わす線形予測係数信号と、音声励起に対応する
ピツチ及び有声音信号とを含んでいる。これらのパラメ
ータ信号は、音声信号波形自体よりもはるかに遅いビツ
トレートで符号化される。入力音声信号の複製がパラメ
ータ信号コードから合成によつて作られる。合成装置は
一般に声道のモデルを含み、その中で励起パルスが全ポ
ール予測フイルタによりスペクトル包絡線表示予測係数
によつて修正される。
従来のピツチ励起形線形予測符号化は非常に効率が良
い。しかし、生成される音声の複製は、聞き取りが困難
であるような合成品質しか持たないことがしばしばあ
る。一般に、このような低品質性は、音声パタンと使用
される線形予測モデルの適合の悪さに由来する。ピツチ
コードの誤り、あるいは音声間隔が有声音が無声音かの
決定の誤りにより、音声の複製は乱れたり不自然なもの
となる。同様の問題は音声のフオルマント符号化につい
ても存在する。例えば、ADPCMやAPCのように、
予測のあとの剰余から音声励起が得られる別の符号化方
式では、励起が不正確なモデルの影響を受けないため
に、大きな改善が見られる。しかし、これらのシステム
の励起ビツトレートは、線形予測モデルよりも少なくと
も1桁大きい。余剰形のシステムで励起ビツトレートを
小さくしようと試みると、音声品質が劣化しまう。本発
明の目的は余剰形符号化方式よりも小さなビツトレート
で高品質の改善された音声符号化方式を提供することに
ある。
本発明の要旨 本発明は順次パタン処理装置に関し、この順次パタンは
一連の時間間隔に分割される。各時間間隔において、間
隔の順次パタン信号及び人工パタン信号を表わす信号が
作られる。間隔内の順次パタン及び人工パタン信号に応
動して、順次パタンと人工パタンとの差を小さくするコ
ード信号が順次パタンを表わすために作られる。
本発明の1つの特徴に従えば、音声パタンは一連の時間
間隔に分割される。各間隔において、間隔の音声パタン
を表示する信号が人工音声表示信号とともに作られる。
間隔の音声表示信号と人工音声表示信号との差に対応す
る信号が作られ、さらに差に対応する信号が小さくなる
ように人工音声表示信号を修正するための信号が作られ
る。
本発明の一実施例では、一群の予測パラメータ信号が各
時間フレームについて音声信号から作られる。予測余剰
信号が時間フレーム音声信号と時間フレーム予測パラメ
ータとに応動して作られる。予測余剰信号は第1の予測
フイルタに通されてこの時間フレームに対する音声表示
信号になる。またこの時間フレームに対する人工音声表
示信号が第2の予測フイルタにおいてフレーム予測パラ
メータから作られる。この時間フレームの音声表示信号
と人工音声表示信号とに応動して、励起コード信号が形
成され、これが該第2の予測フイルタに印加されて、フ
レーム音声表示信号と人工音声表示信号との重みづけ平
均2乗誤差を最小にする。励起コード信号と予測パラメ
ータ信号はこの時間フレームの音声パタンの複製を作る
のに用いられる。
詳細な説明 第1図は本発明の一実施例である音声処理装置の一般的
なブロツク図を示す。第1図で、話されたメツセージの
ような音声パタンがマイクロホン101で受信される。
対応するアナログ音声信号が予測解析器110のフイル
タ・サンプラ回路113で帯域波され、一連のパルス
サンプルに変換される。フイルタは、4.0kHz以上の
音声信号成分を除去し、当業者には公知のようにサンプ
リングは、8.0kHzで行うことができる。サンプリン
グのタイミングはクロツク発生器103からのサンプリ
ングクロツクSCによつて行われる。回路113からの
サンプルの各々はアナログデジタル変換器115におい
て、振幅を表わすデジタルコードに変換される。
音声サンプル列は予測パラメータ計算機119に供給さ
れ、この計算機は当業者には公知のように、音声信号を
10乃至20msの間隔に分割し、一群線形予測係数信
号a、k=1、2、3、…pを発生する。この信号は
各間隔における>>PであるNケの音声サンプルの予測
短時間スペクトルを表わす。AD変換器115からの音
声サンプルは、信号aの形成のための時間を与えるた
めに遅延117で遅延される。遅延されたサンプルは予
測剰余発生器118の入力に印加される。予測剰余発生
器は、当業者には公知のように、遅延された音声サンプ
ルと予測パラメータaとに応動して、これらの差に対
応する信号を形成する。予測解析器110で行われる。
各フレームについての予測パラメータ及び予測剰余信号
の形成は、1973年6月19日のビイー・エイ・アタ
ール(B.S.Atal)に付与された米国特許第3,740,
476号又は当業者に公知の他の装置によつて実現でき
る。
予測パラメータ信号aは短時間音声スペクトルを効率
良く間等わすことができるが、剰余信号は一般に音声間
隔によつて大きく変化し、また高いビツト速度を示すた
めに、多くの分野で応用に適していない。ピツチ励起形
ボコーダの場合は、剰余信号のピークのみがピツチパル
ス・コードとして伝送される。しかし、それで得られる
音の品質は一般に貧弱である。第7図の波形701は2
・時間フレームにわたる典型的な音声パタンを示してい
る。波形703は、波形701のパタン及びこのフレー
ムの予測パラメータから抽出した予測剰余信号を表わし
ている。すぐわかるように、波形703は比較的複雑で
あり、そのピークに対応するピツチパルスを符号化して
も予測剰余信号の適切な近似にはならない。本発明に従
えば、励起コード処理装置120はフレームの余剰信号
及び予測パラメータaを受信し、予め定めたビツ
ト数からなる間隔励起コードを発生する。この励起コー
ドは波形705に示され、ほぼ一定の比較的遅いビツト
速度を持つ。フレームのこの励起コードと予測パラメー
タとから作られる波形701の音声パタンの複製を波形
707に示す。波形701及び707を比較すると、比
較的遅いビツト速度で、適応予測符号化における高品質
の音声特性が実現されていることがわかる。
一連のフレームの各々の予測剰余信号dと予測パラメ
ータ信号aとは、相い続くフレームの開始時において
回路110から励起信号形成回路120に印加される。
回路120は各フレームに対して予め定めたビツト数を
持つ多要素フレーム励起コードECを発生する。各励起
コードは、フレームの励起機能を表わす1≦i≦Iのパ
ルス列に対応する。
フレーム内における各パルスの振幅β及び位置m
は、フレームの励起信号及び予測パラメータ信号から
フレームの音声信号の複製が構成できるように励起信号
形成回路で決定される。β及びm信号はコーダ13
1で符号化され、マルチプレクサ135でフレームの予
測パラメータ信号と多重化されてフレームの音声パタン
に対応するデジタル信号になる。
励起信号形成回路120において、1フレームの予測剰
余信号d及び予測パラメータ信号aはそれぞれゲー
ト122及び124を介してフイルタ121に印加され
る。各フレームの開始時において、フレームクロツク信
号FCがゲート122及び124を開き、d信号をフ
イルタ121に印加するとともにa信号をフイルタ1
21及び123に印加する。フイルタ121は誤差信号
の量子化スペクトルがそのフオルマント領域に集中する
ように信号dを修正するように構成されている。19
79年1月9日にビイー・エス・アタール(B.S.Atal)
等に付与された米国特許第4,133,976号に示さ
れているように、このフイルタ構成はスペクトルの高信
号エネルギー部分をマスクする働きがある。
フイルタ121の伝達関数は、Z変換信号により とかける。ただしB(Z)はフレーム予測パラメータa
によつて制御される。
予測フイルタ123は計算機119からのフレーム予測
パラメータ信号と、励起信号処理装置127からの人工
励起信号ECとを受信する。フイルタ123は式1の伝
達関数を持つている。フイルタ121が予測剰余信号d
に応じて重みづけフレーム音声信号yを形成するのに
対し、フイルタ123は信号処理装置127からの励起
信号に応動して重みづけ人工音声信号 を発生する。重みづけフレーム音声信号yは、音声パタ
ンを連続するフレーム間隔に分割したものに対応する第
1のフレーム間隔音声パタン対応信号であり、人工音声
信号 は人工的な第2のフレーム間隔音声パタン対応信号であ
る。信号y及び は相関処理装置125で相関がとられ、これらの間の重
みづけた差に対応する信号Eが作られる。信号Eは、フ
イルタ121からの重みづけ音声表示信号とフイルタ1
23からの重みづけ人工音声表示信号との差を小さくす
るように励起信号ECを調整するために信号処理装置1
27に印加される。
励起信号は1≦i≦Iのパルス列である。各パルスは振
幅βと位置mとを持つ。処理装置127はフイルタ
121からの重みづけフレーム音声表示信号とフイルタ
123からの重みづけ人工音声表示信号との間の差を小
さくするように順次β及びmを形成する。重みづけ
フレーム音声表示信号は で与えられ、フレームの重みづけ人工音声表示信号は で与えられる。ただし、hはフイルタ121又は12
3のインパルス応答である。
回路120で形成される励起信号は要素β、m、i
=1、2、…、Iを持つコード信号である。βはフレ
ーム内のパルスの振幅であり、mはパルスの位置であ
る。相関信号発生回路125は各要素の相関信号を順次
発生する。各要素はフレーム内の時間1≦q≦Qに位置
する。この結果、相関処理回路は、式4に従い、要素i
に対してQケの可能な候補を形成する。
ただし、 である。励起信号発生器127は相関信号発生回路から
のCiq信号を受信し、最大の絶対値を持つCiq信号を選
択し、コード信号のi番目の要素 を形成する。ただし、qは最大の絶対値を持つ相関信
号の位置である。次にインデツクスiがi+1に増分さ
れ、予測フイルタ123の出力における信号yが修正
される。式4、5及び6に従つた処理が繰返されて、要
素βi+1、mi+1が形成される。要素β及びm
が形成された後、要素β、β、…、β
を持つ信号がコーダ131に印加される。当業者には
公知のように、コーダ131はβ要素を量子化
し、通信網140に伝送するのに適したコード信号を形
成する。
第1図のフイルタ121及び123の各々は前述の米国
特許第4,133,976号に述べられているトランス
バーサルフイルタを用いることができる。処理装置12
5及び127の各々はC.S.P.社のマクロアリスメテイツ
クプロセツサシステム100やその他の処理装置のよう
な、式4及び6に必要な処理を行うことのできる当業者
には公知の処理装置の1つを用いることができる。処理
装置125は、当業者には公知のように式4に従つてC
iq信号の形成を制御するためのプログラム命令を永久に
蓄えた読出し専用メモリを含んでおり、処理装置127
は式6に従つてβ及びm信号要素を選択するための
プログラム命令を永久に蓄えた読出し専用メモリを含ん
でいる。処理装置125内のプログラム命令はフオート
ラン(FORTRAN)言語の形式で付録Aに示されて
おり、処理装置127内のプログラム命令はフオートラ
ン(FORTRAN)言語の形式で付録Bに示されてい
る。
第3図は各時間フレームについての処理装置125及び
127の動作を表わす流れ図を示している。第3図で、
インパルス応答信号が、式1の伝達関数に対してフ
レーム予測パラメータに応じてブロツク305で作られ
る。これは、待ち合せブロツク303で示したように、
クロツク103からのFC信号の受信の後で行われる。
要素インデツクスi及び励起パルス位置インデツクスq
はブロツク307において1に初期化される。予測フイ
ルタ121及び123からの信号y及び が受信されると、ブロツク309で信号Ciqが作られ
る。位置インデツクスqがブロツク311で増分され、
次の位置のCiq信号の形成が開始される。
処理装置125が励起信号要素iに対するCiQ信号が形
成されると、処理装置127が付勢される。処理装置1
27におけるqインデツクスがブロツク315で1に初
期化され、iインデツクスと処理装置125で作られた
iq信号とが処理装置127に転送される。最大の絶対
値を持つCiq信号を表わす信号 とその位置qとがブロツク317でゼロにセツトされ
る。ブロツク319、321、323及び325を含む
ループにおいて、Ciq信号の絶対値が信号 と比較され、これらの大きい方が信号 として蓄えられる。
処理装置125からのCiQ信号が処理された後、ブロツ
ク325からブロツク327へ移る。励起コード要素の
位置mはqにセツトされ、励起コード要素βは式
6に従つて作られる。β要素はブロツク328で
予測フイルタ123に出力され、インデツクスiはブロ
ツク329で増分される。フレームのβ要素が形
成されると、判定ブロツク331から待ち合せブロツク
303へ再び制御が移る。この結果処理装置125及び
127は待ち状態になり、次のフレームのFCフレーム
クロツクパルスを待ち合わせる。
処理装置127内の励起コードはコーダ131にも供給
される、このコードは処理装置127からの励起コード
を回路綱140で用いるのに適した形式に変換する。こ
のフレームに対する予測パラメータ信号aは遅延13
3を介してマルチプレクサ135の1つの入力に印加さ
れる。コーダ131からの励起コード信号ECはマルチ
プれクサの他の入力に印加される。フレームの多重化さ
れた励起及び予測パラメータコードは次に回路綱140
に送られる。
回路綱140は、通信システム、音声蓄積装置のメツセ
ージメモリ、あるいは音声合成で用いるためのたとえば
語や音素のような予め定めたメツセージ単位のメツセー
ジや語彙を畜える装置等である。メツセージ単位が何で
まれ、回路120で得られたフレームコード列は回路網
140から音声合成器150へ送られる。合成器は回路
120からのフレーム励起コードとフレーム予測パラメ
ータを用いて音声パタンの複製を作る。
合成器150内のデマルチプレクサ152はフレームの
励起コードECをその予測パラメータaと分離させ
る。励起コードは、デコーダ153で励起パルス列に復
号された後、音声合成フイルタ154の励起入力に印加
される。aコードはフイルタ154のパラメータ入力
に印加される。フイルタ154は励起及び予測パラメー
タ信号に応動して当業者には公知のようにフレーム音声
信号の符号化された複製を作る。DA変換器156は符
号化された複製をアナログ信号に変換し、この信号は低
域フイルタ158を通過した後変換器160によつて音
声パタンに変換される。
回路120において励起コードを形成を行う列の方法と
して、信号yとの間の重みづけ平均2乗誤差に基づくものがある。i
番目の励起信号パルスのβ及びmを形成した時の重
みづけ平均2乗誤差は で与えられる。ただし、hはインパルス応答H(Z)の
n番目のサンプルであり、mは励起コード信号のj番
目のパルスの位置であり、βはj番目のパルスの振幅
である。
パルスの位置と振幅は順に作り出される。励起信号のi
番目の要素は式7のEを最小化することによつて決定
される。式7は次のように書きかえることができる。
よつて、β、mに先行する既知の励起コード要素は
第1項にしか現れない。
公知のように、Eを最小化するβは式8をβで微
分して と置くことによつて得られる。これより、βの最適値
は、 ただし は予測フイルタのインパルス応答信号hの自己相関係
数である。
式10のβはパルス位置の関数であり、その可能な各
値から決定できる。可能なパルス位置についての|β
|の最大値が選択される。β及びmの値が得られた
後、同様の方法で式10を解くことによりβi+1、m
i+1の値が決定される。式10の第1の項、すなわち は予測フイルタ121の出力におけるフレームの音声表
示信号に対応している。式10の第2の項、すなわち は、予測フイルタ123の出力におけるフレームの人工
音声表示信号に対応している。βは、位置mにおけ
る励起パルスの振幅であり、第1項と第2項との差を最
小にするものである。
第2図に示したデータ処理回路は、第1の励起信号形成
回路120の別の構成方法を示すものである。第2図の
回路は、式10に従い、フレーム予測剰余信号d及び
フレーム予測パラメータ信号aに応動して音声パタン
の各フレームについての励起コードを発生するものであ
り、前述のC.S.P.社のマクロ・アリスメテイツク・プロ
セツサ・システム100又は当業者には公知の他の処理
装置で実現できる。
第2図において、処理装置210は音声パタンの一連の
フレームの各々の予測パラメータ信号a及び予測剰余
信号dを回路110からメモリ218を介して受信す
る。この処理装置は、予測フイルタサブルーチン用読出
し専用メモリ201及び励起処理サブルーチン用読出し
専用メモリ205に永久に蓄えられた命令の制御の下で
励起コード信号要素β、m、β、m、…、
β、mを形成するように動作する。ROM201の
予測フイルタサブルーチンは付録Cに示され、励起処理
サブルーチンは付録Dに示されている。
処理装置210は、共通バス225、データメモリ23
0、中央処理装置240、演算処理装置250、制御器
インターフエイス220及び入出力インターフエイス2
60を含んでいる。当業者には公知のように、中央処理
装置240は制御器215からのコード命令に応動し
て、処理装置210内の他の装置の一連の動作を制御す
るよう構成されている。演算処理装置250は中央処理
装置240からの制御信号に応動してデータメモリ23
0からのコード信号に対する演算処理を行うよう構成さ
れている。データメモリ230は中央処理装置240に
よつて指定された信号を蓄え、この信号を演算処理装置
250及び入出力インターフエイス260に供給する。
制御器インターフエイス220は、ROM201及びR
OM205内のプログラム命令が制御器215を介して
中央処理装置240へ入力されるための通信リンクであ
り、入出力インターフエイス260は、d及びa
号をデータメモリ230へ印加するとともに、出力信号
β及びmをデータメモリから第1図のコーダ131
へ供給する。
第2図の回路の動作は、第4図のフイルタパラメータ処
理流れ図、第5図の励起コード処理流れ図、及び第6図
のタイミング図を示されている。音声信号の開始時にお
いて、第4図のブロツク405からブロツク410に入
り、クロツク発生器103からの単一パルスSTによつ
てフレーム係数値rが第1フレームにセツトされる。第
6図は2つの相い続くフレームにおける第1図及び第2
図の回路の動作を示している。第1フレームの時刻t
とtの間において、予測解析器110は、波形601
のサンプリングクロツクパルスの制御の下で、波形60
5のようにフレームr+2の音声パタンサンプルを形成
する。解析器110は波形607で示すように、時間t
乃至tにおいてフレームr+1に対するa信号を
発生し、時間t乃至tにおいて予測剰余信号d
発生する。信号FC(波形603)は時間t乃至t
に生じる。剰余信号発生器118から送られ、先行する
フレーム中にメモリ218に蓄えられていた信号d
は、中央処理装置240の制御の下に入出力インター
フエイス260及び共通バス225を介してデータメモ
リ230に入れられる。第4図の動作ブロツク415で
示されているように、これらの処理はフレームクロツク
信号FCに応動して行われる。予測パラメータ計算機1
19から送られ先行するフレームにおいてメモリ218
に蓄えられていたフレーム予測パラメータ信号aもブ
ロツク420に示したようにメモリ230に入れられ
る。これらの動作は第6図の時刻tとtの間に行わ
れる。
フレームのd及びa信号がメモリ230に入れられ
た後、ブロツク425に入り、式1の伝達関数に対応す
る予測フイルタ係数b=α h=1、2、…、p (12) が演算処理装置250で作られて、データメモリ250
に入れられる。8kHzのサンプリング速度に対して、p
は普通16であり、αは普通0.85である。次に予測
フイルタインパルス応答信号hが演算処理装置250で作られてデータメモリ230に
蓄えられる。インパルス応答信号hが蓄えられると、
ブロツク435に入り、式11の予測フイルタ自己相関
信号が作られて蓄えられる。
第6図の時刻tにおいて、制御器215はROM20
1をインターフエイス220から切り離し、励起処理サ
ブルーチン用ROM205を該インターフエイスに接続
する。これにより、第5図に示した例示パルスコードβ
、mの生成が開始される。第6図の時刻tとt
の間において、励起パルス列が形成される。ブロツク5
05において、励起パルスインデツクスiが1に初期化
され、位置インデツクスqが1にセツトされる。ブロツ
ク510でβがゼロにセツトされ、動作ブロツク51
5に入つてβiq=β11が決定される。β11はこのフレー
ムの位置q=1における最適励起パルスである。次に判
定ブロツク520において、β11の絶対値が予め蓄えら
れていたβと比較される。最初βはゼロであるた
め、ブロツク525においてmコードはq=1にセツ
トされ、βコードはβ11にセツトされる。
次にブロツク530において位置インデツクスが増分さ
れ、判定ブロツク535からブロツク515に入つて信
号β12が作られる。ブロツク515、525、530及
び535を含むループがすべてのパルス位置1≦q≦Q
について繰返えされる。Q番目の繰返しの後、第1の励
起パルス振幅 及びフレーム内のその位置m=qがメモリ230に
蓄えられる。この方法により、I個の励起パルスの最初
のものが決定される。第7図の波形705においてフレ
ームrは時刻tとtの間にある。このフレームに対
する励起コードは8個のパルスである。振幅βで位置
の第1パルスは時刻tm1で生じているが、これは第
5図の流れ図でi=1に対して決定されたものである。
ブロツク545においてインデツクスiが次の励起パル
スに増分され、ブロツク550及び510を介してブロ
ツク515に入る。ブロツク510と550との間のル
ープの各繰返しが終了するごとに、励起信号が修正され
て式7の信号がさらに小さくなる。2回目の繰返しが終
了すると、パルスβ、m(波形705では時刻
m2)が形成される。インデツクスiが増分されるにつ
れて、励起パルスβ(時刻tm3)、β(時
m4)、β(時刻tm5)、β(時刻
m6)、β(時刻tm7)、及びβ(時刻t
m8)が作られる。
I番目の繰返しの後(波形609のt)、ブロツク5
50からブロツク555に入り、現在のフレームの励起
コードβ、β、…、βが作られる。
ブロツク560でフレームインデツクスが増分され、次
のフレームに対する第4図の予測フイルタ動作が第6図
の時刻tにおいて、ブロツク415で開始される。次
のフレームのクロツク信号FCが第6図のtで生じる
と、フレームr+3の予測パラメータ信号が作られ(波
形605の時刻tとt14の間)、a及びd信号が
フレームr+2のために作られ(波形607の時刻t
とt13の間)、フレームr+1のための励起コードが作
られる(波形609の時刻tとt12の間)。
第2図の処理装置からのフレーム励起コードは、当業者
には公知のように、入出力インターフエイス260を介
して第1図のコーダ131に供給される。コーダ131
は前述のように動作し、励起コードの量子化と書式化を
行つて回路網140に印加する。フレームのa予測パ
ラメータ信号は遅延133を介してマルチプレクサ13
5の1つの入力に印加され、コーダ131からのフレー
ム励起コードはこれと正しく多重化される。
本発明について一実施例を参照して説明した。当業者に
は公知のように、本発明の範囲と精神を逸脱することな
く種々の変化が可能であることは明らかである。たとえ
ば、ここで述べた実施例は線形予測パラメータと予測剰
余とを用いている。線形予測パラメータはフオルマント
パラメータ又は当業者に公知の他の音声パラメータで置
きかえることができる。このとき、予測フイルタは使用
する音声パラメータと音声信号とに応動するよう構成さ
れ、第1図の回路120で作られる励起信号は、音声パ
ラメータ信号と組合せて使われて、本発明に従つてフレ
ームの音声パタン複数を形成する。本発明の復号装置は
生物的及び地質的パタンのような順次パタンに拡張して
その効率のよい表示を得ることができる。従つて、本願
で“音声パタン”というときは、音声による信号パタン
に限定されるものではなく本発明の適用において等価な
他の信号パタンを含むものであり又“励起”も音声に必
ずしも対応する用語ではないと理解すべきである。
【図面の簡単な説明】
第1図は本発明の一実施例である音声処理装置回路のブ
ロツク図を示し、 第2図は第1図の回路で用いることのできる励起信号形
成処理装置のブロツク図を示し、 第3図は第1図の励起信号形成回路の動作を示す流れ図
を示し、 第4図及び第5図は第2図の回路の回路の動作を示す流
れ図を示し、 第6図は第1図及び第2図の励起信号形成回路の動作を
示すタイミング図を示し、 第7図は本発明の音声処理を説明するための波形図を示
している。 <主要部分の符号の説明> 音声メツセジフレーム間隔信号系列を受信する手段……
152 変換手段……153 音声パタン発生手段……154

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】出力音声パターンを発生するための音声処
    理装置であって、 音声パターンパラメータを表わす複数の信号および励起
    信号の符号化表示を含む入力信号系列を受信するための
    手段(例えば152)を含み、該励起信号は、複数の候
    補励起信号の中から (i)入力音声パターンと該複数の音声パターンパラメー
    タにもとづいた予測信号の間の差を反映する信号と (ii)候補励起信号を反映する信号、 との間の差であって周波数重みづけされた差を減少する
    ように選択されたものであり、更に 該励起信号の符号化表示をパルス系列に変換するための
    変換手段(例えば153)、および 該音声パターンパラメータを表わす信号と該変換手段の
    出力の両方に応動して該入力音声パターンに対応する該
    出力音声パターンを発生するための手段(例えば15
    4)を含むことを特徴とする音声処理装置。
JP60163090A 1981-12-01 1985-07-25 音声処理装置 Expired - Lifetime JPH0650437B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US326371 1981-12-01
US06/326,371 US4472832A (en) 1981-12-01 1981-12-01 Digital speech coder

Publications (2)

Publication Number Publication Date
JPS6156400A JPS6156400A (ja) 1986-03-22
JPH0650437B2 true JPH0650437B2 (ja) 1994-06-29

Family

ID=23271926

Family Applications (2)

Application Number Title Priority Date Filing Date
JP57209489A Expired JPS6046440B2 (ja) 1981-12-01 1982-12-01 音声処理方法とその装置
JP60163090A Expired - Lifetime JPH0650437B2 (ja) 1981-12-01 1985-07-25 音声処理装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP57209489A Expired JPS6046440B2 (ja) 1981-12-01 1982-12-01 音声処理方法とその装置

Country Status (8)

Country Link
US (1) US4472832A (ja)
JP (2) JPS6046440B2 (ja)
CA (1) CA1181854A (ja)
DE (1) DE3244476A1 (ja)
FR (1) FR2517452B1 (ja)
GB (1) GB2110906B (ja)
NL (1) NL193037C (ja)
SE (2) SE456618B (ja)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4720863A (en) * 1982-11-03 1988-01-19 Itt Defense Communications Method and apparatus for text-independent speaker recognition
JPS59153346A (ja) * 1983-02-21 1984-09-01 Nec Corp 音声符号化・復号化装置
DE3463192D1 (en) * 1983-03-11 1987-05-21 Prutec Ltd Speech encoder
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4731846A (en) * 1983-04-13 1988-03-15 Texas Instruments Incorporated Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal
US4638451A (en) * 1983-05-03 1987-01-20 Texas Instruments Incorporated Microprocessor system with programmable interface
CA1219079A (en) * 1983-06-27 1987-03-10 Tetsu Taguchi Multi-pulse type vocoder
US4669120A (en) * 1983-07-08 1987-05-26 Nec Corporation Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses
NL8302985A (nl) * 1983-08-26 1985-03-18 Philips Nv Multipulse excitatie lineair predictieve spraakcodeerder.
CA1236922A (en) * 1983-11-30 1988-05-17 Paul Mermelstein Method and apparatus for coding digital signals
CA1223365A (en) * 1984-02-02 1987-06-23 Shigeru Ono Method and apparatus for speech coding
US4701954A (en) * 1984-03-16 1987-10-20 American Telephone And Telegraph Company, At&T Bell Laboratories Multipulse LPC speech processing arrangement
EP0163829B1 (en) * 1984-03-21 1989-08-23 Nippon Telegraph And Telephone Corporation Speech signal processing system
US4709390A (en) * 1984-05-04 1987-11-24 American Telephone And Telegraph Company, At&T Bell Laboratories Speech message code modifying arrangement
JPS60239798A (ja) * 1984-05-14 1985-11-28 日本電気株式会社 音声信号符号化/復号化装置
US4872202A (en) * 1984-09-14 1989-10-03 Motorola, Inc. ASCII LPC-10 conversion
CA1249061A (en) * 1984-12-25 1989-01-17 Takashi Mochizuki Method and apparatus for encoding/decoding image signal
US4675863A (en) 1985-03-20 1987-06-23 International Mobile Machines Corp. Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
FR2579356B1 (fr) * 1985-03-22 1987-05-07 Cit Alcatel Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation
US4944013A (en) * 1985-04-03 1990-07-24 British Telecommunications Public Limited Company Multi-pulse speech coder
US4912764A (en) * 1985-08-28 1990-03-27 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech coder with different excitation types
US4890328A (en) * 1985-08-28 1989-12-26 American Telephone And Telegraph Company Voice synthesis utilizing multi-level filter excitation
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
USRE34247E (en) * 1985-12-26 1993-05-11 At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
US4827517A (en) * 1985-12-26 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
CA1323934C (en) * 1986-04-15 1993-11-02 Tetsu Taguchi Speech processing apparatus
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
US5285520A (en) * 1988-03-02 1994-02-08 Kokusai Denshin Denwa Kabushiki Kaisha Predictive coding apparatus
JP2625998B2 (ja) * 1988-12-09 1997-07-02 沖電気工業株式会社 特徴抽出方式
SE463691B (sv) * 1989-05-11 1991-01-07 Ericsson Telefon Ab L M Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen
US5261027A (en) * 1989-06-28 1993-11-09 Fujitsu Limited Code excited linear prediction speech coding system
US5263119A (en) * 1989-06-29 1993-11-16 Fujitsu Limited Gain-shape vector quantization method and apparatus
JPH0332228A (ja) * 1989-06-29 1991-02-12 Fujitsu Ltd ゲイン―シェイプ・ベクトル量子化方式
JPH0365822A (ja) * 1989-08-04 1991-03-20 Fujitsu Ltd ベクトル量子化符号器及びベクトル量子化復号器
US5235669A (en) * 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
SE467806B (sv) * 1991-01-14 1992-09-14 Ericsson Telefon Ab L M Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare
US5301274A (en) * 1991-08-19 1994-04-05 Multi-Tech Systems, Inc. Method and apparatus for automatic balancing of modem resources
US5659659A (en) * 1993-07-26 1997-08-19 Alaris, Inc. Speech compressor using trellis encoding and linear prediction
US5546383A (en) 1993-09-30 1996-08-13 Cooley; David M. Modularly clustered radiotelephone system
US5602961A (en) * 1994-05-31 1997-02-11 Alaris, Inc. Method and apparatus for speech compression using multi-mode code excited linear predictive coding
AU696092B2 (en) * 1995-01-12 1998-09-03 Digital Voice Systems, Inc. Estimation of excitation parameters
SE508788C2 (sv) * 1995-04-12 1998-11-02 Ericsson Telefon Ab L M Förfarande att bestämma positionerna inom en talram för excitationspulser
JP3137176B2 (ja) * 1995-12-06 2001-02-19 日本電気株式会社 音声符号化装置
DE19643900C1 (de) * 1996-10-30 1998-02-12 Ericsson Telefon Ab L M Nachfiltern von Hörsignalen, speziell von Sprachsignalen
US5839098A (en) 1996-12-19 1998-11-17 Lucent Technologies Inc. Speech coder methods and systems
US5832443A (en) * 1997-02-25 1998-11-03 Alaris, Inc. Method and apparatus for adaptive audio compression and decompression
US6003000A (en) * 1997-04-29 1999-12-14 Meta-C Corporation Method and system for speech processing with greatly reduced harmonic and intermodulation distortion
US7392180B1 (en) 1998-01-09 2008-06-24 At&T Corp. System and method of coding sound signals using sound enhancement
US6182033B1 (en) * 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US5963897A (en) * 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
US6516207B1 (en) * 1999-12-07 2003-02-04 Nortel Networks Limited Method and apparatus for performing text to speech synthesis
US7295614B1 (en) 2000-09-08 2007-11-13 Cisco Technology, Inc. Methods and apparatus for encoding a video signal
JP4209257B2 (ja) 2003-05-29 2009-01-14 三菱重工業株式会社 分散型コントローラとその動作方法、及び、分散型コントローラを備えるフォークリフト
EP2595146A1 (en) * 2011-11-17 2013-05-22 Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating intelligibility of a degraded speech signal

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3346695A (en) * 1963-05-07 1967-10-10 Gunnar Fant Vocoder system
US3624302A (en) * 1969-10-29 1971-11-30 Bell Telephone Labor Inc Speech analysis and synthesis by the use of the linear prediction of a speech wave
US3740476A (en) * 1971-07-09 1973-06-19 Bell Telephone Labor Inc Speech signal pitch detector using prediction error data
DE2435654C2 (de) * 1974-07-24 1983-11-17 Gretag AG, 8105 Regensdorf, Zürich Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache
JPS5246642A (en) * 1975-10-09 1977-04-13 Mitsubishi Metal Corp Swimming pool
JPS5343403A (en) * 1976-10-01 1978-04-19 Kokusai Denshin Denwa Co Ltd System for analysing and synthesizing voice
US4130729A (en) * 1977-09-19 1978-12-19 Scitronix Corporation Compressed speech system
US4133976A (en) * 1978-04-07 1979-01-09 Bell Telephone Laboratories, Incorporated Predictive speech signal coding with reduced noise effects
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
JPS5648690A (en) * 1979-09-28 1981-05-01 Hitachi Ltd Sound synthesizer

Also Published As

Publication number Publication date
FR2517452A1 (fr) 1983-06-03
SE456618B (sv) 1988-10-17
US4472832A (en) 1984-09-18
SE8704178D0 (sv) 1987-10-27
SE8206641D0 (sv) 1982-11-22
JPS6156400A (ja) 1986-03-22
FR2517452B1 (fr) 1986-05-02
NL193037C (nl) 1998-08-04
JPS58105300A (ja) 1983-06-23
JPS6046440B2 (ja) 1985-10-16
NL8204641A (nl) 1983-07-01
SE467429B (sv) 1992-07-13
NL193037B (nl) 1998-04-01
DE3244476C2 (ja) 1988-01-21
SE8704178L (sv) 1987-10-27
GB2110906B (en) 1985-10-02
GB2110906A (en) 1983-06-22
CA1181854A (en) 1985-01-29
SE8206641L (sv) 1983-06-02
DE3244476A1 (de) 1983-07-14

Similar Documents

Publication Publication Date Title
JPH0650437B2 (ja) 音声処理装置
EP0175752B1 (en) Multipulse lpc speech processing arrangement
US4220819A (en) Residual excited predictive speech coding system
USRE32580E (en) Digital speech coder
US4709390A (en) Speech message code modifying arrangement
US3624302A (en) Speech analysis and synthesis by the use of the linear prediction of a speech wave
KR100264863B1 (ko) 디지털 음성 압축 알고리즘에 입각한 음성 부호화 방법
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
US6345248B1 (en) Low bit-rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
US6041297A (en) Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations
EP0360265B1 (en) Communication system capable of improving a speech quality by classifying speech signals
JPH05197400A (ja) 低ビット・レート・ボコーダ手段および方法
EP0232456A1 (en) Digital speech processor using arbitrary excitation coding
US4791670A (en) Method of and device for speech signal coding and decoding by vector quantization techniques
US4945565A (en) Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
EP0855699B1 (en) Multipulse-excited speech coder/decoder
EP0361432B1 (en) Method of and device for speech signal coding and decoding by means of a multipulse excitation
JP2648138B2 (ja) 音声パターンを圧縮する方法
JP2898641B2 (ja) 音声符号化装置
JPH09297597A (ja) 高能率音声伝送方法及び高能率音声伝送装置
JPH1185198A (ja) ボコーダ符号化復号装置
JPH0414813B2 (ja)
WO2001009880A1 (en) Multimode vselp speech coder
Morikawa et al. A speech analysis-synthesis system based on the ARMA model and its evaluation