JPS6156400A - 音声処理装置 - Google Patents

音声処理装置

Info

Publication number
JPS6156400A
JPS6156400A JP60163090A JP16309085A JPS6156400A JP S6156400 A JPS6156400 A JP S6156400A JP 60163090 A JP60163090 A JP 60163090A JP 16309085 A JP16309085 A JP 16309085A JP S6156400 A JPS6156400 A JP S6156400A
Authority
JP
Japan
Prior art keywords
signal
frame
excitation
audio
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60163090A
Other languages
English (en)
Other versions
JPH0650437B2 (ja
Inventor
ビシユニユ サループ アタル
ジヨエル リチヤード レムデ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Technologies Inc filed Critical AT&T Technologies Inc
Publication of JPS6156400A publication Critical patent/JPS6156400A/ja
Publication of JPH0650437B2 publication Critical patent/JPH0650437B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は音声処理に関し、特にデジタル音声符号化装置
に関する。
音声蓄積や音声応答機能を持つデジタル音声通信システ
ムは信号圧縮を用いて蓄積や伝送に必要なビットレート
を減少させる。自業者には公知のように、音声パタンは
、その明瞭度品質には本質的でない冗長荏を含んでいる
。音声パタンから冗長成分を除去することにより、音声
の複製を構成するのに必要なデジタルコードの数を大幅
に低減することができる。しかし、複製音声の主、睨的
な品質は圧縮及び符号化の技術によって変化する。
米国特許第3,624,302号に示されている公知の
1つのデジタル音声符号化システムは、入力音声信号の
線形予測解析を行う。音声信号は一連の間隔に分割され
、間隔内の音声と表わす一群のパラメータが作られる。
このパラメータ群は、間1%内の音声のスペクトル包絡
蔵を表わす線形予測係数信号と、音声励起に対応するピ
ッチ及び有声音信号とを含んでいる。これらのパラメー
タ1言号は、音声信号波形自体よりもはるかに遅いビッ
トレ−トで符号化される。入力音声店号の復製がパラメ
ータ言号コードから合成によって作られる。合成装置は
一般に声道のモデルを含み、その中で励起パルスが全ポ
ール予測フィルタによりスペクトル包、路線表示予」り
係故によって修正される。
従来のピッチ励起形線形予測符号化は非常に効率が良い
。しかし、生成される音声の複製は、聞き取りが困遣で
あるようなき成品質しか持たないことがしばしばある。
一般に、このような低品質性は、音声パタンと使用され
る線形予測モデルの適合の悪さに由来する。
ピッチコードの・誤り、あるいは音声間隔が有声音か無
声音かの決定の誤シによシ、音声の復製は乱れたり不自
然なものとなる。同様の問題は音声のフォルマント符号
化についても存在する。例えば、ADPCMやAPCの
ように、予測のあとの剰余から音声励起が得られる別の
符号化方式では、励起が不正確なモデルの影響を受けな
いために、大きな改善が見られる。しかし、これらのシ
ステムの励起ビットレートは、線形予測モデルよりも少
くとも1桁大きい。剰余形のシステムで励起ビットレー
トを小さくしようと試みると、音声品質が劣化しまう。
本発明の目的Cd剰余、杉符号化方式よシも小さなビッ
トレートで高品質の改善された音声符号化方式を提供す
ることにある。
本発明の要旨 本発明は順次パタン処理装置K関し、この、順次パタン
は一連の時間間隔に分割される。
各時間間隔((おいて、間隔の1順次パタン言号及び人
工パタンは号を表わす信号が作られる。
間隔内の順次パタン及び人工パタン信号に応動して、順
次パタンと人工パタンとの差を小さくするコード信号が
順次パタンを表わすだめに作られる。
本発″A″1′″″特徴に従えば・音声夕′     
1は一連の時間間隔に分割される。各間隔において、間
隔の音声パタンを表示する信号が人工音声表示信号とと
もに作られる。間隔の音声表示信号と人工音声表示信号
との差に対応する信号が作られ、さらに差に対応する信
号が小さくなるように人工音声表示信号を修正するため
の信号が作られる。
本発明の一実施ツリでは、一群の予測パラメータ信号が
各時間フレームについて音声信号から作られる。予測剰
余信号が時間フレーム音声信号と時間フレーム予測パラ
メータとに応動して作られる。予測剰余信号は第1の予
」リフィルタに通されてこの時間フレームに対する音声
表示信号になる。まだこの時間フレームに対する人工音
声表示信号が第2の予測フィルタにおいてフレーム予測
パラメータから作られる。この時間フレームの音声表示
信号と人工音声表示信号とに応動して、励起コード信号
が形成され、これが該第2の予測フィルタに印加されて
、フレーム音声表示信号と人工音声表示信号との重みづ
け平均2乗誤差を最小にする。励起コード信号と予測パ
ラメータ信号はこの時間フレームの音声パタンの複製を
作るの釦用いられる。
詳細な説明 第1図は本発明の一実施例でるる音声処理装置の一般的
なブロック図を示す。第1図で、話されたメツセージの
ような音声パタンかマイクロホン101で受信される。
対応するアナログ音声信号が予測解析器110のフィル
タ・サンプラ回路113で帯域戸波され、一連のパルス
サンプルに変換される。フィルタは、4.0kHz以上
の音声言号成分を除去し、当業者には公知のようにサン
プリングは、8.0kHzで行うことができる。サンプ
リングのタイミングはクロック発生器103からのサン
プリングクロックSCによって行われる。回路113か
らのサンプルの各々はアナログデジタル変換器115に
おいて、振・嘔を表わすデジタルコードに変換される。
音声サンプル列は予測パラメータ計算機119に供給さ
れ、この計算機は当業者には公知のようと、音声信号を
10乃至20msのi間隔に分割し、一群線形予測係故
信号ak。
k=1.2.3、・・・pを発生する。この信号は各間
隔におけるN)PであるNヶの音声サンプルの予」り短
時間スペクトルを表わす。
AD変換器115からの音声サンプルは、信号ak の
形成のための時間を与えるために遅延117で遅延され
る。遅延されたサンプルは予測剰余発生器118の入力
に印加される。
予測ji!J余発生器は、当業者には公知のように1遅
延された音声サンプルと予測パラメータakとに応動し
て、これらの差に対応する信号を形成す′る。予測解析
器110で行われる。
各フレームについての予測パラメータ及び予屓11租j
余言号の形成は、1973年6月19日のビイ−・ニス
・アタール(B、 S、 Atal )に付与された米
国特許第3,740,476号又は当業者に公知の他の
装置によって実現できる。
予測パラメータ信号akは短時間音声スペクトルを効率
良く表わすことができるが、剰余信号は一般に音声間隔
によって大きく変化し、また高いビット速度を示すため
に、多くの分野で応用に適していない。ピッチ励起形ボ
コーダの場合は、剰余信号のピークのみがピッチパルス
・コードとして伝送される。しかし、それで得られる音
の品質は一般て貧弱である。第7図の波形701は2・
時間フレームにわたる典型的な音声パタンを示している
。波形703は、波形γ01のパタン及びこのフレーム
の予測パラメータから抽出した予測剰余信号を表わして
いる。すぐわかるように、波形703は比較的複雑であ
り、そのピークに対応するピッチパルスを符号化しても
予測剰余信号の適切な近1J:Lにはならない。
本発明に従えば、励起コード処理装置120はフレーム
の剰余信号dk及び予測パラメータakを受信し、予め
定めたビット数からなる間隔励起コードを発生する。こ
の励起コーWu、# 705 Kyy<8ic、?’s
 F! −2(D Jis * ’a    ’遅いビ
ット速度を持つ。フレームのこの励起コードと予測パラ
メータとから作られる波形101の音声パタンの復製を
波形707に示す。波形701及び70γを比較すると
、比較的遅いビット速度で、適応予測符号化忙おける高
品質の音声特性が実現されていることがわかる。
一連のフレームの各々の予測剰余信号dkと予測パラメ
ータ信号akとは、相い続くフレームの開始時において
回路110から励起信号形成回路120に印加される。
回路120は各フレームに対して予め定めたビット数を
持つ多要素フレーム励起コードECを発生する。各励起
コードは、フレームの励起機能を表わす1≦i≦IOパ
ルス列に対応する。
フレーム内における各パルスの振幅β、及び位置m は
、フレームの励起信号及び予測パラメータ信号からフレ
ームの音声信号の複製が構成できるように励起信号形成
回路で決定される。β 及びm 信号はコーグ131で
符号化され、マルチプレクサ135でフレームの予I1
1パラメータは号と多重化されてフレームの音声パタン
に対応するデジタル信号になる。
励起信号形成回路120において、lフレームの予測剰
余信号d、及び予測パラメータ信号akはそれぞれゲー
ト122及び124を介してフィルタ121に印う1口
される。各フレームの開始時において、フレームクロッ
ク信号FCがゲート122及び124を開き、dk倍信
号フィルタ121に印加するとともにak倍信号フィル
タ121及び123に印加する。フィルタ121は誤差
信号の量子化スペクトルがそのフォルマント頭載に集中
するように信号dkを修正するように構成されている。
1979年1月9日にビイ−・ニス・アタール(B、 
S、 Atal )等に付与された米国特許第4,13
3,976号に示されているように、このフィルタ溝底
はスペクトルの高1言号エネルギ一部分をマスクする動
きがある。
フィルタ121の伝達関数は、Z変換記号により H儲)=−一二一−(1) 1−B(Z) とかける。ただしB■)はフレーム予測パラメータak
によって制御される。
予測フィルタ123は計算機11’9からのフレーム予
測パラメータ信号と、励起信号処理装置127からの人
工励起信号ECとを受信する。フィルタ123は式1の
伝達関数を持っている。フィルタ121が予」1j剰余
信号dkに応じて重みづけフレーム音声信号yを形成す
るのに対し、フィルタ123は信号処理装置127から
の励起信号に応動して重みづけ人工音声信号仝を発生す
る。重みづけフレーム音声信号yは、音声パタンを連続
するフレーム間隔に分割したものに対応する第1のフレ
ーム間隔音声パタン対応信号であシ1、     人工
励起信号小は人工的な第2のフレーム間隔音声パタン対
応信号である。信号y及び小は相関処理装置125で相
関がとられ、これらの間の重みづけた差に対応する信号
Eが作られる。信号Eは、フィルター21からのコみづ
け音声表示信号とフィルター23からの重みづけ人工音
声信号言号との差を小さくするよう【励起信号ECを調
整するために信号処理装置12γに印加される。
励起信号v′i1≦i≦■のパルス列である。
各パルスは振惺β と位置m とを持つ。処理装置12
7はフィルター21からの重みづけフレーム音声表示信
号とフィルター23からの重みづけ人工音声表示信号と
の間の差を小さくするように順次β、及びm を形成す
る。重みづけフレーム音声表示信号は y= Σ dh(1≦n≦N)  (2)n k=o−
k k n−に で与えられ、フレームの重みづけ人工音声表示信号は ↑ で与えられる。ただし、h はフィルター21又は12
3のインパルス応答である。
回路120で形成される励起信号は要素β。、m、、i
=1.2、・・、■を持つコード信号1      ! である。β はフレーム内のパルスの振幅であシ、m 
はパルスの位置である。相関信号発生回路125は各要
素の相関信号を順次発生する。各要素はフレーム内の時
間1≦q≦Qに位置する。この結果、相関処理回路は、
式4に従い、要素lに対してQヶの町aヒな候補を形成
する。
ただし、 である。励起信号発生器127は相関信号発生回路から
のC信号を受信し、最大の絶対q 値を持つC1信号を選択し、コード信号の1q 番目の要素 ※ m:q を形成する。ただし、qlは最大の絶対直を持つ相関信
号の位置である。次にインデックスlが1+1 に増分
され、予ヨー]フィルター23の出力における信号y 
が修正される。式4.5及び6に従った処理が繰返され
て、要素β、 、    が形成される。要素β1及び
z+1    1+1 m が形成された後、要素β1m1、β2m2、工 ・・・、βI”Iを持つ信号がニーダ131に印加され
る。当業者には公知のようK、ニーダ131はβ m、
要素を量子化l−1通信網140に伝送するのに適した
コード信号を形成する。
第1図のフィルター21及び123の各々は前述の米国
特許第4,133,976号に述べられているトランス
バーサルフィルタを用いることかできる。処P[!’+
J置1装25及び12γの各々はc、 s、 p、社の
マクロアリスメチイックプロセッサシステム100やそ
の他の処理装置のような、式4及び6に必要な処理を行
うことのできる当業者には公知の処理装置の1つを用い
ることができる。処理装置125ば、当業者には公知の
ように式4に従ってC信号の形成を制御するだめのプロ
グラムq 命令を永久に蓄えた読出し専用メモリを含んでお9、処
理装置127は弐6に従ってβ。
及びm、信号要素を選択するだめのプログラム命令を永
久に蓄えた読出し専用メモリを含んでいる。処理装置1
25内のプログラム命令はフォートラン(FORTRA
N )言語の形式で付録Aに示されており、処理装置1
27内のプログラム命令はフォートラン(FORTRA
N )言語の形式で付録Bに示されている。
第3図は各時間フレームについての処理装置125及び
127の動作を表わす流れ図を示している。第3図で、
h インパルス応答に 信号が、式1の伝達、関致に対してフレーム予測パラメ
ータ/ミニ応じてブロック305で作られる。これは、
待ち合せブロック303で示したように、クロック10
3からのFC1C10受這の後で行われる。要素インデ
ックスi及び励起パルス位置インデックスqはブロック
307において1に初期化される。予測フィルタ121
及び123からの信号y 及び小、    が受信され
ると、ブロック309n   1−1 で信号Cが作られる。位置インデックスqq がブロック311で増分され、次の位置のC信号の形成
が開始される。
q 処理装置125で励起信号要素iに対するC iQ倍信
号形成されると、処理装置127が付勢される。処理装
置12γにおけるqインデックスがブロック315で1
に初期化され、”イ′デ7り8と処理装置125で作ら
れた     (C9信号とが処理装置127に転送さ
れる。
q 最大の絶対値を持つC3信号を表わす信号q C※とその位置 ※とがブロック31γでゼIq   
           9 口にセットされる。ブロック319.321.323及
び325を含むループにおいて、Cq 信号の絶対値が信号C※ と比較され、これq らの大きい方が信号C1※ として蓄えられる。
q 処理装置125からのCi Q信号が処理されだ後、ブ
ロック325からブロック327へ移る。励起コード要
素の位置m、はq′にセットされ、励起コード要素β 
は弐6に従つて作られる。β1m、要素はブロック32
8でI 予測フィルター23に出力され、インデックスlはブロ
ック329で増分される。フレームのβ工mI要素が形
成されると、判定ブロック331から待ち合せブロック
303へ再びi[flJ +卸が移る。この結果処理!
!125及び127は待ち状態になシ、次のフレームの
FCフレームクロックパルスを待ち合わせる。
処理装置127内の励起コードはコーグ131にも供給
される。このコードは処理装置121からの励起コード
を回路網140で用いるのに適した形式に変換する。こ
のフレームに対する予測パラメータ1言号akは遅逝1
33を介してマルチプレクサ135の1つの入力に印加
される。コーグ131からの励起コード信号ECはマル
チプレクサの他の入力に印加される。フレームの多重化
された励起及び予測パラメータコードは次に回路11利
140に送られる。 ゛ 回路網140は、通信システム、音声蓄、漬装置のメツ
セージメモリ、あるいは音声合成で用いるためのたとえ
ば語や音素のような予め定めたメツセージ単位のメツセ
ージや居食を蓄える装置等である。メツセージ単位が何
であれ、回路120で得られたフレームコード列は回路
網140から音声合成器150へ送られる。合成器は回
路120からのフレーム励起コードとフレーム予測パラ
メータを用いて音声パタンの複製を作る。
合成器150内のデマルチプレクサ152はフレームの
励起コードECをそ9予測パラメータakと分離させる
。励起コードニーi、デコーグ153で励起パルス列に
復号さねた後、音声合成フィルター54の励起入力に印
加される。akコードはフィルター54のパラメータ入
力に印加される。フィルター54は励起及び予測パラメ
ータ信号に応動して当業者には公知のようにフレーム音
声信号の符号化された複製を作る。DA変換器156は
符号化された複製をアナログ信号に変換し、この信号は
低域フィルタ158を通過した後変換器160によって
音声パタンに変換される。
回路120において励起コードを形成を行う列の方法と
して、信号y と小 との間のn       n 重みづけ平均2乗誤差に基づくものがある。
i番目の励起信号パルスのβ、及びm、を形成した時の
重みづけ平均2乗誤差は で与えられる。ただし、h はインパルス応答H(Z)
のn番目のサンプルであシ、m、は励コ 起コード信号の3番目のパルスの位置であり、β、は3
番目のパルスの撮・君である。
パルスの位置と振幅は順に作り出される。
励起信号のi番目の要素は式70E を最小化すること
によって決定される。式7は次のように書きかえること
ができる。
よって、β1、m に先行する既知の励起コード要素は
第1項にしか現れない。
公知のように、E を最小化するβ は式1式% 8をβ、で微分して と置くことによって得られる。これよシ、β。
の最適直は、 φ。
ただし は予測フィルタのインパルス応答信号り、の自己相関係
数である。
式10のβ はパルス位置の関数であシ、その可能な各
直から決定できる。可能なパルス位置についての1β、
1の最大値が選択される。β 及びm、の値が得られた
後、同様の+           1 方法で式10を解くことによシβi+1’  l+1の
値が決定される。式10の第1の項、すなわち は予測フィルター21の出力におけるフレームの音声表
示信号に対応している。式10の第2の項、すなわち は、予測フィルター23の出力におけるフレームの人工
音声表示信号に対応している。β。
は、位置m、における励起パルスの振幅であシ、第1項
と第2項との差を最小にするものである。
第2図に示したデータ処理回路は、第1の励起信号形成
回路120の別の構成方法を示すものである。第2図の
回路は、式10に従い、フレーム予測剰余信号d、及び
フレーム予測パラメータ入力号akに応動して音声パタ
ンの各フレームについての励起コードを発生するもので
あシ、前述のc、 s、 p、社のマクロ・アリスメテ
イツク・プロセッサ・システム100又は当業者には公
知の他の処理装置で実現でさる。
第2図において、処理装置210は音声パタンの一連の
フレームの各々の予測パラメータ信号ak及び予測剰余
信号dnを回路110からメモリ218を介して受信す
る。この処理装置は、予測フィルタサブルーチン用読出
し専用メモリ201及び励起処理サブルーチン用読出し
専用メモリ205に永久に蓄えられた命令の制御の下で
励起コード信号要素β1、ml、β2、m2、・・・、
β工、ml を形成するように動作する。ROM201
の予測フィルタサブルーチンは付録Cに示され、励起処
理サブルーチンは付録りに示されている。
処理装置21C1:、共通バス225、データメモリ2
30、中央処理装置240、演算処理装置 25 Q、
制御器インターフェイス220及び入出力インターフェ
イス260を含んでいる。当業者には公知のように、中
央処理装置240は制御器215からのコード命令に応
動して、処理装置210内の他の装置の一連の動作を割
1即するよう構成されている。演算処理装置こ250は
中央処理妄1〆240からの制御信号に応動してデータ
メモリ230からのコード信号Iて対する演算処理と賢
うよう構成されている。データメモリ230は中央処理
装置240によって指定された信号と蓄え、この信号を
演算処理装置δ250及び入出力インターフェイス26
0に供、@する。制御部器インターフェイス220は、
ROM 201及びROM205内のプログラム命令が
制御器215を介して中央処理装置240へ入力される
ための通信リンクであり、入出力インターフェイス26
0は、dk及びak倍信号データメモリ230へ印加す
るとともに、出力信号β 及びm をデータメモリから
第1図のコーグ131へ供、治する。
第2図の回路の動作は、第4図のフィルタパラメータ処
理流れ図、第5図の励起コード処理流れ図、及び第6図
のタイミング図に示されている。音声信号の開始時にお
いて、第4図のブロック405からブロック410に入
り、クロック発生器103からの単一パルスSTによっ
てフレーム計a値r が第1フレームにセットされる。
第6図は2つの相い吠くフレームにおける第1図及び第
2図の回路の動作を示している。第1フレームの時刻1
0とt7の間において、予測解析器110は、波形60
1のサンプリングクロックパルスのかj御の下で、波形
605のようにフレームr + 2の音声パタンサンプ
ルを形成する。
解析5110は波形607で示すように、時間10乃至
t3においてフレームr + 1に対するa 信号を発
生し、時間t3乃至t6VCおいて予測剰余信号dkを
発生する。信号FC(波形603)は時間t 乃至t1
に生じる。剰余信号発生器118から送られ、先行する
フレーム中にメモリ218に蓄えられていた信号dkは
、中央処理装置240の制御の下に入出力インターフェ
イス260及び共通バス225を介してデータメモリ2
30に入れられる。第4図の動作ブロック415で示さ
れているように、これらの処理はフレームクロック信号
FCに応動して行われる。予測パラメータ計算機119
から送られ先行するフレームにおいてメモリ218に蓄
えられていたフレーム予測パラメータ信号a もブに ロック420に示したようにメモリ230に入れられる
。これらの動作は第6図の時刻toとtlの間に行:F
)れる。
フレームのdk及びak倍信号メモリ230に入れられ
た後、ブロック425に入シ、式1の伝達関数に対応す
る予測フィルタ係数bkb =α a     h =
 1.2、・・・、p    (12)k      
  k が演算処理装置250で作られて、データメモリ250
に入れられる。8 kHzのサンプリング速度に対して
、pは普、616であシ、αは普通0.85である。次
に予測フィルタインパルス応答信号h1 に h   =1 min(k−1、p) h =  Σ     bh    、、に=1.2、
・・・K  (13)k、kk−1 +=1 が演算処理装置250で作られてデータメモリ230に
蓄えられる。インパルス応答信号hkが蓄えられると、
ブロック435に入シ、式11の予測フィルタ自己相関
信号が作られて蓄えられる。
第6図の時刻L2において、制御器215はROM20
1をインターフェイス220から切fi 、<i L 
、励起処理サブルーチン用ROM205を該インターフ
ェイスに接続する。これによシ、第5図に示した励起パ
ルスコードβ 、m の生成が開始される。第6図の時
刻t2とβ4の間(でおいて、励起パルス列が形成され
る。ブロック505において、励起パルスインデックス
lが1に初期化され、位置インデックスqが1にセット
される。ブロック510でβ1がゼロにセットされ、動
作ブロック515に入ってβ1.=β1□が決定される
。β1、はこのフレームの位a q = 1における最
適励起パルスである。次に判定ブロック520において
、β の絶対直が予め蓄えられていたβ と比較される
。最初β1はゼロであるため、ブロック525において
mコードはq=lにセットされ、β コードはβ1□に
セットされる。
次にブロック530において位置インデックスが増分さ
れ、判定ブロック535からブロック515に入って信
号β1゜が作られる。
ブロック515.525.530及び535を含むルー
プがすべてのパルス位置l≦q≦Qについて繰返えされ
る。Q番目の繰返しの後、第1の励起パルス振幅β1=
β1.※及びフレーム内のその位置m1=q※がメモリ
230に蓄えられ机00方法に19・ 1個0励起″!
ルスの濃初のものが決定される。第7図の波形γ05に
おいてフレームrは時刻10とtlの間にある。このフ
レームに対する励起コードは8個のパルスである。振幅
β□で位置m の第1パルスは時刻’mlで生じている
が、これは第5図の流れ図でi=1に対して決定された
ものである。
ブロック545においてインデックスiが次の励起パル
スに増分され、ブロック550及び510を介してブロ
ック515に入る。
ブロック510と550との間のループの各繰返しが終
了するごとに、励起信号が修正されて式7の信号がさら
に小さくなる。2回目の繰返しが終了すると、パルスβ
 、m (波形705では時刻tm2)が形成される。
インデックス1が増分されるにつれて、励起パルスβm
(時刻t  )、β m (時刻tm4)、33   
 m3  44 β m (時刻t )、β m (時刻tm6)、5 
5     m5   6 6 β m (時刻t )、及びβ8m8(時刻tm8)7
m7 が作られる。
工番目の繰返しの後(波形609のβ4)、ブロック5
50からブロック555に入シ、現在のフレームの励起
コードβ1m1、β2 ”2、・・・、β工m1が作ら
れる。ブロック560でフレームインデックスが増分さ
れ、次のフレームに対する第4図の予」リフィルタ動作
が第6図の時刻t7において、ブロック415で開始さ
れる。次のフレームのクロック信号FCが第6図のtl
で生じると、フレームr +3の予測パラメータ信号が
作られ(波形605の時刻t7とβ14の間)、a、及
びdk倍信号フレームr + 2のために作られ(波形
607の時刻t7とtl3の間)、フレームr + 1
のだめの励起コードが作られる(波形609の時刻t7
とtl。の間)。
第2図の処理装置からのフレーム励起コードは、当業者
には公知のように、入出力インターフェイス260を介
して第1図のコーグ131に供給される。コーグ131
は前述のように動作し、励起コードの量子化と書式化を
行って回路網140に印加する。フレームのak予測パ
ラメータ1言号は遅延133を介してマルチプレクサ1
3501つの入力に印加され、コーグ131からのフレ
ーム励起コードはこれと正しく多重化される。
本発明について一実施例を参照して説明した。当業者に
は公知のように1本発明の範囲と精神を逸脱することな
く種々の変形が可能であることは明らかである。たとえ
ば、ここで述べた実施例は線形予測パラメータと予測剰
余とを用いている。線形予測パラメータはフォルマント
パラメータ又は当業者に公知の他の音声パラメータで置
きかえることができる。このとき、予測フィルタは使用
する音声パラメータと音声信号とに応動するよ6構成さ
れ、第1図の回路120で作られる励起信号は、音声パ
ラメータ信号と組合せて使われて、本発明に従ってフレ
ームの音声パタン複製を形成する。本発明の復号装置は
生物的及び地質的パタンのような順次パタンに拡張して
その効率のよい表示を得ることができる。
従って、本願で“音声パタン°°というときは、音声に
よる信号パタンに限定されるものでなく本発明の適用に
おいて等:1.11iな也の信号パタンを含むものであ
p又゛励起″も音声に必ずしも対応する用語ではないと
理解すべきである。
【図面の簡単な説明】
第1図は本発明の一実施例である音声処理装置回路のブ
ロック図を示し、 第2図は第1図の回路で用いることのできる励起信号形
成処理装置のブロック図を示し、第3図は第1図の励起
信号形成回路の動作を示す流れ図を示し、 第4図及び第5図は第2図の回I各の回路の動作を示す
流れ図を示し、 第6図は第1図及び第2図の励起信号形成回路の動作を
示すタイミング図を示し、第7図は本発明の音声処理を
説明するための波形図を示している。 く主要部分の符号の説明〉 音声メッセジフレーム間隔信号系列を受信する手段・・
・152 変換手段・・・153

Claims (1)

  1. 【特許請求の範囲】 音声メッセジを生成する音声処理装置であ って、該装置は; フレーム間隔に関する複数の音声パタンパ ラメータ表示信号と複数の振幅と位置の符号とからなる
    励起符号信号とから構成されている音声メッセジフレー
    ム間隔信号の系列を受信する手段、 該音声メッセジフレーム間隔信号における 該振幅と位置の符号を該振幅と位置とに従ってパルス系
    列に変換してフレーム励起信号を形成する変換手段、及
    び 該フレーム間隔音声パタンパラメータ表示 信号と該変換手段の出力とに応答して音声パタンを発生
    する手段とからなる音声処理装置。
JP60163090A 1981-12-01 1985-07-25 音声処理装置 Expired - Lifetime JPH0650437B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US326371 1981-12-01
US06/326,371 US4472832A (en) 1981-12-01 1981-12-01 Digital speech coder

Publications (2)

Publication Number Publication Date
JPS6156400A true JPS6156400A (ja) 1986-03-22
JPH0650437B2 JPH0650437B2 (ja) 1994-06-29

Family

ID=23271926

Family Applications (2)

Application Number Title Priority Date Filing Date
JP57209489A Expired JPS6046440B2 (ja) 1981-12-01 1982-12-01 音声処理方法とその装置
JP60163090A Expired - Lifetime JPH0650437B2 (ja) 1981-12-01 1985-07-25 音声処理装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP57209489A Expired JPS6046440B2 (ja) 1981-12-01 1982-12-01 音声処理方法とその装置

Country Status (8)

Country Link
US (1) US4472832A (ja)
JP (2) JPS6046440B2 (ja)
CA (1) CA1181854A (ja)
DE (1) DE3244476A1 (ja)
FR (1) FR2517452B1 (ja)
GB (1) GB2110906B (ja)
NL (1) NL193037C (ja)
SE (2) SE456618B (ja)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4720863A (en) * 1982-11-03 1988-01-19 Itt Defense Communications Method and apparatus for text-independent speaker recognition
JPS59153346A (ja) * 1983-02-21 1984-09-01 Nec Corp 音声符号化・復号化装置
DE3463192D1 (en) * 1983-03-11 1987-05-21 Prutec Ltd Speech encoder
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4731846A (en) * 1983-04-13 1988-03-15 Texas Instruments Incorporated Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal
US4638451A (en) * 1983-05-03 1987-01-20 Texas Instruments Incorporated Microprocessor system with programmable interface
CA1219079A (en) * 1983-06-27 1987-03-10 Tetsu Taguchi Multi-pulse type vocoder
US4669120A (en) * 1983-07-08 1987-05-26 Nec Corporation Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses
NL8302985A (nl) * 1983-08-26 1985-03-18 Philips Nv Multipulse excitatie lineair predictieve spraakcodeerder.
CA1236922A (en) * 1983-11-30 1988-05-17 Paul Mermelstein Method and apparatus for coding digital signals
CA1223365A (en) * 1984-02-02 1987-06-23 Shigeru Ono Method and apparatus for speech coding
US4701954A (en) * 1984-03-16 1987-10-20 American Telephone And Telegraph Company, At&T Bell Laboratories Multipulse LPC speech processing arrangement
EP0163829B1 (en) * 1984-03-21 1989-08-23 Nippon Telegraph And Telephone Corporation Speech signal processing system
US4709390A (en) * 1984-05-04 1987-11-24 American Telephone And Telegraph Company, At&T Bell Laboratories Speech message code modifying arrangement
JPS60239798A (ja) * 1984-05-14 1985-11-28 日本電気株式会社 音声信号符号化/復号化装置
US4872202A (en) * 1984-09-14 1989-10-03 Motorola, Inc. ASCII LPC-10 conversion
CA1249061A (en) * 1984-12-25 1989-01-17 Takashi Mochizuki Method and apparatus for encoding/decoding image signal
US4675863A (en) 1985-03-20 1987-06-23 International Mobile Machines Corp. Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
FR2579356B1 (fr) * 1985-03-22 1987-05-07 Cit Alcatel Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation
US4944013A (en) * 1985-04-03 1990-07-24 British Telecommunications Public Limited Company Multi-pulse speech coder
US4912764A (en) * 1985-08-28 1990-03-27 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech coder with different excitation types
US4890328A (en) * 1985-08-28 1989-12-26 American Telephone And Telegraph Company Voice synthesis utilizing multi-level filter excitation
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
USRE34247E (en) * 1985-12-26 1993-05-11 At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
US4827517A (en) * 1985-12-26 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
CA1323934C (en) * 1986-04-15 1993-11-02 Tetsu Taguchi Speech processing apparatus
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
US5285520A (en) * 1988-03-02 1994-02-08 Kokusai Denshin Denwa Kabushiki Kaisha Predictive coding apparatus
JP2625998B2 (ja) * 1988-12-09 1997-07-02 沖電気工業株式会社 特徴抽出方式
SE463691B (sv) * 1989-05-11 1991-01-07 Ericsson Telefon Ab L M Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen
US5261027A (en) * 1989-06-28 1993-11-09 Fujitsu Limited Code excited linear prediction speech coding system
US5263119A (en) * 1989-06-29 1993-11-16 Fujitsu Limited Gain-shape vector quantization method and apparatus
JPH0332228A (ja) * 1989-06-29 1991-02-12 Fujitsu Ltd ゲイン―シェイプ・ベクトル量子化方式
JPH0365822A (ja) * 1989-08-04 1991-03-20 Fujitsu Ltd ベクトル量子化符号器及びベクトル量子化復号器
US5235669A (en) * 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
SE467806B (sv) * 1991-01-14 1992-09-14 Ericsson Telefon Ab L M Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare
US5301274A (en) * 1991-08-19 1994-04-05 Multi-Tech Systems, Inc. Method and apparatus for automatic balancing of modem resources
US5659659A (en) * 1993-07-26 1997-08-19 Alaris, Inc. Speech compressor using trellis encoding and linear prediction
US5546383A (en) 1993-09-30 1996-08-13 Cooley; David M. Modularly clustered radiotelephone system
US5602961A (en) * 1994-05-31 1997-02-11 Alaris, Inc. Method and apparatus for speech compression using multi-mode code excited linear predictive coding
AU696092B2 (en) * 1995-01-12 1998-09-03 Digital Voice Systems, Inc. Estimation of excitation parameters
SE508788C2 (sv) * 1995-04-12 1998-11-02 Ericsson Telefon Ab L M Förfarande att bestämma positionerna inom en talram för excitationspulser
JP3137176B2 (ja) * 1995-12-06 2001-02-19 日本電気株式会社 音声符号化装置
DE19643900C1 (de) * 1996-10-30 1998-02-12 Ericsson Telefon Ab L M Nachfiltern von Hörsignalen, speziell von Sprachsignalen
US5839098A (en) 1996-12-19 1998-11-17 Lucent Technologies Inc. Speech coder methods and systems
US5832443A (en) * 1997-02-25 1998-11-03 Alaris, Inc. Method and apparatus for adaptive audio compression and decompression
US6003000A (en) * 1997-04-29 1999-12-14 Meta-C Corporation Method and system for speech processing with greatly reduced harmonic and intermodulation distortion
US7392180B1 (en) 1998-01-09 2008-06-24 At&T Corp. System and method of coding sound signals using sound enhancement
US6182033B1 (en) * 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US5963897A (en) * 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
US6516207B1 (en) * 1999-12-07 2003-02-04 Nortel Networks Limited Method and apparatus for performing text to speech synthesis
US7295614B1 (en) 2000-09-08 2007-11-13 Cisco Technology, Inc. Methods and apparatus for encoding a video signal
JP4209257B2 (ja) 2003-05-29 2009-01-14 三菱重工業株式会社 分散型コントローラとその動作方法、及び、分散型コントローラを備えるフォークリフト
EP2595146A1 (en) * 2011-11-17 2013-05-22 Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating intelligibility of a degraded speech signal

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5246642A (en) * 1975-10-09 1977-04-13 Mitsubishi Metal Corp Swimming pool
JPS5343403A (en) * 1976-10-01 1978-04-19 Kokusai Denshin Denwa Co Ltd System for analysing and synthesizing voice
JPS5648690A (en) * 1979-09-28 1981-05-01 Hitachi Ltd Sound synthesizer

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3346695A (en) * 1963-05-07 1967-10-10 Gunnar Fant Vocoder system
US3624302A (en) * 1969-10-29 1971-11-30 Bell Telephone Labor Inc Speech analysis and synthesis by the use of the linear prediction of a speech wave
US3740476A (en) * 1971-07-09 1973-06-19 Bell Telephone Labor Inc Speech signal pitch detector using prediction error data
DE2435654C2 (de) * 1974-07-24 1983-11-17 Gretag AG, 8105 Regensdorf, Zürich Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache
US4130729A (en) * 1977-09-19 1978-12-19 Scitronix Corporation Compressed speech system
US4133976A (en) * 1978-04-07 1979-01-09 Bell Telephone Laboratories, Incorporated Predictive speech signal coding with reduced noise effects
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5246642A (en) * 1975-10-09 1977-04-13 Mitsubishi Metal Corp Swimming pool
JPS5343403A (en) * 1976-10-01 1978-04-19 Kokusai Denshin Denwa Co Ltd System for analysing and synthesizing voice
JPS5648690A (en) * 1979-09-28 1981-05-01 Hitachi Ltd Sound synthesizer

Also Published As

Publication number Publication date
FR2517452A1 (fr) 1983-06-03
SE456618B (sv) 1988-10-17
US4472832A (en) 1984-09-18
SE8704178D0 (sv) 1987-10-27
SE8206641D0 (sv) 1982-11-22
FR2517452B1 (fr) 1986-05-02
NL193037C (nl) 1998-08-04
JPS58105300A (ja) 1983-06-23
JPS6046440B2 (ja) 1985-10-16
NL8204641A (nl) 1983-07-01
SE467429B (sv) 1992-07-13
NL193037B (nl) 1998-04-01
DE3244476C2 (ja) 1988-01-21
SE8704178L (sv) 1987-10-27
GB2110906B (en) 1985-10-02
JPH0650437B2 (ja) 1994-06-29
GB2110906A (en) 1983-06-22
CA1181854A (en) 1985-01-29
SE8206641L (sv) 1983-06-02
DE3244476A1 (de) 1983-07-14

Similar Documents

Publication Publication Date Title
JPS6156400A (ja) 音声処理装置
JPH0668680B2 (ja) 改善された多パルス線形予測符号化音声処理装置
EP0140777B1 (en) Process for encoding speech and an apparatus for carrying out the process
JPH0353300A (ja) 音声符号化装置
JPH10187196A (ja) 低ビットレートピッチ遅れコーダ
JPH0728495A (ja) 音声信号の組み込み式コード化システム
USRE32580E (en) Digital speech coder
EP0232456A1 (en) Digital speech processor using arbitrary excitation coding
US6826527B1 (en) Concealment of frame erasures and method
EP0415675B1 (en) Constrained-stochastic-excitation coding
TW521265B (en) Relative pulse position in CELP vocoding
JP2000214900A (ja) 音声符号化/復号化方法
EP1103953B1 (en) Method for concealing erased speech frames
JP2001265397A (ja) 入力信号をボコーディングする方法と装置
JPH10222197A (ja) 音声合成方法およびコード励振線形予測合成装置
JP3232701B2 (ja) 音声符号化方法
JP2853170B2 (ja) 音声符号化復号化方式
JP3296411B2 (ja) 音声符号化方法および復号化方法
JP3071800B2 (ja) 適応ポストフィルタ
JP3274451B2 (ja) 適応ポストフィルタ及び適応ポストフィルタリング方法
JP3271966B2 (ja) 符号化装置及び符号化方法
JPH1185198A (ja) ボコーダ符号化復号装置
KR100221186B1 (ko) 음성 부호화 및 복호화 장치와 그 방법
JPH0473700A (ja) 音声符号化方法
JPH0291699A (ja) 音声符号化復号化方式