JPH02502857A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH02502857A
JPH02502857A JP1501163A JP50116389A JPH02502857A JP H02502857 A JPH02502857 A JP H02502857A JP 1501163 A JP1501163 A JP 1501163A JP 50116389 A JP50116389 A JP 50116389A JP H02502857 A JPH02502857 A JP H02502857A
Authority
JP
Japan
Prior art keywords
pulse
pulses
encoding device
amplitude
speech encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1501163A
Other languages
English (en)
Other versions
JP2992045B2 (ja
Inventor
ホッジス マーチン・ロジャー・レスター
Original Assignee
ブリティシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GB888800120A external-priority patent/GB8800120D0/en
Priority claimed from GB888801998A external-priority patent/GB8801998D0/en
Application filed by ブリティシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニ filed Critical ブリティシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニ
Publication of JPH02502857A publication Critical patent/JPH02502857A/ja
Application granted granted Critical
Publication of JP2992045B2 publication Critical patent/JP2992045B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 音声符号化装置 〔技術分野〕 本発明は音声符号化に関する。特に、駆動信号源(excitationsou rce)の出力を合成フィルタに通過させ、これにより音声信号を発生する装置 に関する。このような装置では、符号化のために、入力音声から所望の駆動信号 を発生させることと、フィルタのパラメータ設定とが問題となる。フィルタのパ ラメータについては、線形予測分析(LPC%1inear predicti ve coding)法により導くことができ、この技術はすでに確立されてい る。本発明は駆動信号源に関する。
〔従来の技術〕
雑音源と繰り返しパルス源とを切り替えて入力音声の有声と無声とを判定する装 置は、音声出力の質が不自然となる傾向がある。そこで、パルスシーケンスを発 生する「マルチパルス」駆動信号源の使用が提案されている。この場合に、マル チパルスの発生シーケンスについては、初期状態では何も設定されない。この方 法は、・数パルス(例えばIQmsのフレームに対して8個のパルス)を利用す るだけで、十分な結果が得られる。これについては、エイタル、レムデ、「ア・ 二ニー・モデル・オブLPCエクサイテイション・フォー・フロデューシング・ ナチュラルサウンディング・スピーチ・アト・ロウ・ビット・レイン」、ブロシ ーデインダス・オブIEEII: ICASSP 。
パリ、第614頁、1982年(B、S、Atal and J、R,Remd e : ”A New Modelof  LPCExcitation  f or   producing Natural−sounding 5pee ch   atLow [lit Rates”、 Proc、 IEEE I CASSP、 Paris、 pp、614.1982)に詳しく説明されてい る。
〔発明の開示〕
本発明によると、入力音声信号から合成フィルタのパラメータを導出する手段と 、音声標本に比較して少ない数のパルスを時間フレーム内に含む駆動信号を符号 化する手段と、駆動信号を構成するパルスを導出するときに導出部に依存する因 子をそのパルスに乗算する手段と、この手段により得られる積を量子化する後方 適応量子化回路とを備えた音声符号化装置が提供される。符号化する手段は、動 作時に、入力音声信号と上記フィルタの駆動信号に対する応答との差が削減され るように、パルスの振幅およびタイミングを選択する。これは、駆動信号を表す 第一のパルスの振幅およびタイミングを導出し、この第一のパルスおよびこの第 一のパルスとの間に存在するパルスとを組み合わせて上記差が削減されるような 駆動信号を表す一以上のパルスを連続して導出することにより行われる。
いくつかの実施例について添付図面を参照して説明する。
〔図面の簡単な説明〕
第1図は本発明第一実施例の符号化装置を示すブロック構成図。
第2図は第1図の符号化装置と共に用いる復号化装置のブロック構成図。
第3図は本発明第二実施例の符号化装置を示すブロック構成図。
[発明を実施するための最良の形態] 第1図に示す符号化装置において、入力10入力音声信号は標本化された形態( 望ましくはディジタル)の信号である。この信号は予測回路2により処理され、 その出力(例えばフィルタ係数の組)により、合成フィルタのスペクトル応答を 音声信号と同等になるように設定する。予測回路2による解析には、従来からの LPG (予測線形符号化)音声符号化装置を用いることにより実施できる。こ の解析は、このような装置で一般的に行われるように、入力標本が分割された音 声フレームに対して行う。フレームの長さは典型的には20ミリ秒であり、係数 の組が20ミリ秒毎に生成される。この係数の組は、信号線3を経由して出力マ ルチプレクサ4に供給される。
フィルタの設定値とともに、符号化装置は駆動信号源の設定値を生成する。この 設定値は、元の音声を近似するするために合成フィルタを駆動することから、符 号化装置で生成する必要がある。第1図に示した符号化装置はマルチパルス導出 部5を備え、入力音声標本とLPC係数とから、上述した「マルチパルス」駆動 信号のフレームに含まれるパルスの振幅(出力6)および位置(出カフ)を導き 出す。典型的なサブブロック(LPCフレームの部分)は10ミリ秒の大きさで あり8個のパルスを含むのに対し、第1図の実施例は、3個のパルスを含む4ミ リ秒のサブブロックを用いる。これは、符号化プロセスに導入される遅延が少な いので、望ましいことである。
マルチパルス導出の課題は、復号化された合成音声と元の音声との間の誤りを最 小化するパルス位置および振幅を見つけることである。
サブブロックがn個の音声標本で構成されると仮定し、n個の入力音声標本を5 0〜Sh−+、n個の合成標本をSo’〜S、、−+’とする。これらの標本を ベクトルs、s’で表す。駆動信号は振幅a。
のパルスを含む。これらのパルスは、フレーム内のn個の可能な時点のうちどこ で発生してもよいが、その数は制限されている(これをに個とする)。したがっ て、駆動信号はa0〜a、−1の成分を含むn次元ベクトルiとして表されるが 、80〜a、−のうちのに個だけが零以外の値をもつ。このとき、 e” = (s −s’ ) ”             −−−−(1)で 表される誤差を最小とする2に個の未知数(k個が振幅、k個がパルス位置)を 見つけることが問題となる。
この問題を解くために必要な計算量は膨大であり、エイタル、レムデの提案した 方法は以下の通りである。
(1)−個のパルスだけについて、誤差が最小となるような振幅および位置を見 ゛〕ける。
(2)二つ目のパルスについて、最初のパルスに組み合わせて誤差が最小となる ような振幅および位置を見つける。このとき、以前に判断したパルスの振幅およ び位置については固定しておく。
(3)  これを他のパルスに対して繰り返す。
この方法は第1図に示したマルチパルス導出部5で用いられ、第1図の帰還路8 .9により、最初に導出したパルスを考慮してサブブロック内の後続のパルスを 導出することを示す。導出されるパルスの順序は、サブブロック内の実際の位置 とは無関係である。
パルス振幅aJO値は後方適応量子化回路9に供給される。ただし、最初に統計 的な因子flが(乗算器10により)乗算される。現実には、導出された最初の パルスが一般に最も大きく、少なくとも最初の数パルスについては、続いて導出 されたパルスが徐々に小さくなる傾向がある。パルスの大きさが変化しても、ト レーニング・シーケンスを統計的に解析すると平均的にこの傾向がある。そこで 、この因子を乗算器10に供給し、導出シーケンス内のどのパルスであるかに無 関係に、乗算器の出力におけるパルス振幅が平均的に同一になるようにする。三 つのパルスを用いる場合には、因子として、導出される最初のパルスf0=1 導出される第二のパルスf+=8/s 導出される第三のパルスf2=8/3 (六つのパルスを用いる場合には、第四ないし第六のパルスにそれぞれ8/3. 8/3および4) を用いる。このステップの目的は、適応量子化の有効性を高め、量子化雑音また 振幅の符号化に用いるビット数の一方(または双方)を削減できるようにするも のである。
多数のパルスを使用する場合には、音声の標本シーケンスを解析することにより 適当な因子を導出することができ、最初に導出されたパルスの振幅に対する平均 振幅を見つけることができる。このとき、その逆数を乗算器の因子とする。この 場合の単純な(最適化されていないが)方法は、最初に導出されたパルスに因子 「1」を乗算し、他のパルスには「2Jを乗算する。
後方適応量子化回路9は3ビツト・ジャヤント量子化回路(Jayantqua nt 1ser)であり、最適非線形最大値量子化回路11を備える。この最適 非線形最大値量子化回路11の特性を第1表に示す。
第1表 出力符号は単に三つの出力ビットの値を表すものであり、「/」の前の数字は正 負を表す符号ビットであり、これに続く1〜4の数字は二進数00〜11を表す 。
スケーリング部12は、量子化回路の入力に設けられた除算器13にスケール因 子を供給する。スケール因子S(初期状態では「1」)は変数であり、入力され たパルス振幅の値に対する量子化回路の符号語出力に依存し、現在の値から次の パルス振幅のために使用する新しい値へと増加または減少するように変化する。
式で表すと、Sk m   =   S k−+  mk−+である。kが与え られたときのmの値を第2表に示す。
第2表 この因子はジャヤントが提案したものと異なっている。また、このスケール因子 は、サブブロックまたはフレームの終了時にもリセットされない。
適応動作の高速化のための付加的手段として、二つの連続的な出力符号が「4」 になったときに、二つ目の出力によりスケール因子を2.25倍(1,5が二回 )に増加させる手段が設けられる。この手段は、第1図において遅延回路14お よび「4・4」検出器15として表される。
後方適応量子化回路9からの量子化された振幅と、マルチパルス導出部5からの 位置情報とは、LPC係数とともに出力マルチプレクサ4に入力される。出力マ ルチプレクサは、これらの入力を一つの出力16に結合する。
第2図に示す復号化装置では、デマルチプレクサ26により係数、振幅および位 置情報を分離し、合成フィルタ30を更新するための係数を供給する。パルス振 幅の符号語は「逆量子化回路」21に供給され、量子化回路11により導入され た非線形性が除去される。すなわち、受信符号語が第1表の出力の欄に示した値 に変換される。スケーリング因子Sについては、第1図の回路部12.14.1 5とそれぞれ同等な回路部22.24.25により、振幅符号語から導くことが できる。
乗算器31では、このスケーリング因子Sを逆量子化回路の出力に乗算する。こ のとき因子f+が除算器32に供給される。除算器32の出力は元の振幅(ただ し量子化誤りを含む)を表し、パルス位置情報とともに、駆動信号発生器33に 供給される。
駆動信号発生器33の出力はフィルタ31により濾波され、復号化された音声信 号として出力端子34に出力される。
上述したように、マルチパルス導出部は、新しいパルスを導出するときに、帰還 路8.9により前に導出したパルスの影響を考慮する。これらのパルスの実際の 影響を符号化装置で考慮することが望ましく、このループ内に量子化回路を含む ことが望ましい。このような符号化装置を第3図に示す。この図に示した符号化 装置では、出力されたパルス振幅が局部符号器40を介して帰還される。局部符 号器40は逆量子化回路21′、乗算器31′および除算器32′を含む。
スケール因子は、当然、後方適応量子化回路9から得られる。第2図の復号化装 置をこの符号器に利用することもできる。
パルスを順に導出する技術を用いたマルチパルス符号化では、再最適化ステップ を含むものがある。これは、初期に導出したパルスが後に導出されるパルスの特 性を参照していないことを考慮したものであり、そのパルスの振幅およびまたは 位置を修正することにより、結果を改善できる。これについては、例えば本願出 願人による英国特許出願第8608031号および第8720604号(アメリ カ合衆国特許出願第846854号、PCT/GB87100612 (特開平 1−500696) )に示されている。
第1図の場合に、どのような従来技術を付加してもよい。第2図の場合に、必要 な場合には位置再最適化を用いることもできる。しかし第3図の場合には、ルー プ内の量子化にこれを用いるので、パルスiの量子化をパルスi+1が導出され る前に行い、パルスiをさらに調整することは、量子化プロセスに重大な影響を 与えることなしには不可能である。
国際調査報告

Claims (6)

    【特許請求の範囲】
  1. 1.入力音声信号から合成フィルタのパラメータを導出する手段と、駆動信号を 表す第一のパルスの振幅およびタイミングを導出し、この第一のパルスおよびこ の第一のパルスとの間に存在するパルスに組み合わせて入力音声信号と上記フィ ルタの駆動信号に対する応答との差が削減されるような駆動信号を表す−以上の パルスを連続して導出することによりパルスの振幅およびタイミングを選択して 、音声標本に比較して少ない数のパルスを時間フレーム内に含む駆動信号を符号 化する手段と、 駆動信号を構成するパルスを導出するときにその導出順に依存する因子をそのパ ルスに乗算する手段と、この乗算する手段により得られた積を量子化する後方適 応量子化回路と を備えた音声符号化装置。
  2. 2.少なくとも三つのパルスを導出する請求項1記載の音声符号化装置。
  3. 3.因子は最初のパルスに対して「1」であり、これに続くパルスにはそれぞれ 「1」より大きく以前に導出されたパルスに対して使用した値以上である請求項 2記載の音声符号化装置。
  4. 4.最初の三つのパルスに対する因子は、導出順にそれぞれ実質的に1、8/5 および8/3である請求項3記載の音声符号化装置。
  5. 5.導出手段はさらに別のパルスを導出する構成であり、最初およびどの関連す るパルスの振幅の値を用い、局部復号器を介して量子化回路の出力からの振幅の 値を用いる請求項1ないし請求項4のいずれかに記載の音声符号化装置。
  6. 6.添付図面の第1図または第2図を参照して説明した音声符号化装置。
JP1501163A 1988-01-05 1988-12-29 音声符号化装置 Expired - Lifetime JP2992045B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
GB888800120A GB8800120D0 (en) 1988-01-05 1988-01-05 Speech coding
GB8800120 1988-01-29
GB8801998 1988-01-29
GB888801998A GB8801998D0 (en) 1988-01-29 1988-01-29 Speech coding

Publications (2)

Publication Number Publication Date
JPH02502857A true JPH02502857A (ja) 1990-09-06
JP2992045B2 JP2992045B2 (ja) 1999-12-20

Family

ID=26293268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1501163A Expired - Lifetime JP2992045B2 (ja) 1988-01-05 1988-12-29 音声符号化装置

Country Status (11)

Country Link
US (1) US5058165A (ja)
EP (1) EP0324283B1 (ja)
JP (1) JP2992045B2 (ja)
AU (1) AU608944B2 (ja)
CA (1) CA1334690C (ja)
DE (2) DE3879664T4 (ja)
DK (1) DK172908B1 (ja)
ES (1) ES2039655T3 (ja)
HK (1) HK130196A (ja)
NO (1) NO301097B1 (ja)
WO (1) WO1989006418A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2729244B1 (fr) * 1995-01-06 1997-03-28 Matra Communication Procede de codage de parole a analyse par synthese

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE32580E (en) * 1981-12-01 1988-01-19 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech coder
US4724535A (en) * 1984-04-17 1988-02-09 Nec Corporation Low bit-rate pattern coding with recursive orthogonal decision of parameters
JPS61134000A (ja) * 1984-12-05 1986-06-21 株式会社日立製作所 音声分析合成方式
CA1252568A (en) * 1984-12-24 1989-04-11 Kazunori Ozawa Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
US4944013A (en) * 1985-04-03 1990-07-24 British Telecommunications Public Limited Company Multi-pulse speech coder
JPH0650439B2 (ja) * 1986-07-17 1994-06-29 日本電気株式会社 マルチパルス駆動形音声符号化器
GB8621932D0 (en) * 1986-09-11 1986-10-15 British Telecomm Speech coding

Also Published As

Publication number Publication date
NO893532L (no) 1989-09-04
EP0324283B1 (en) 1993-03-24
AU2921989A (en) 1989-08-01
AU608944B2 (en) 1991-04-18
CA1334690C (en) 1995-03-07
DK425689D0 (da) 1989-08-29
US5058165A (en) 1991-10-15
EP0324283A1 (en) 1989-07-19
DE3879664T2 (de) 1993-07-01
DK172908B1 (da) 1999-09-27
ES2039655T3 (es) 1993-10-01
WO1989006418A1 (en) 1989-07-13
DE3879664T4 (de) 1993-10-07
NO301097B1 (no) 1997-09-08
HK130196A (en) 1996-07-26
NO893532D0 (no) 1989-09-04
DK425689A (da) 1989-08-29
DE3879664D1 (de) 1993-04-29
JP2992045B2 (ja) 1999-12-20

Similar Documents

Publication Publication Date Title
US7013270B2 (en) Determining linear predictive coding filter parameters for encoding a voice signal
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JPH1091194A (ja) 音声復号化方法及び装置
JP2000155597A (ja) デジタル音声符号器において使用するための音声符号化方法
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP3308764B2 (ja) 音声符号化装置
JP2658816B2 (ja) 音声のピッチ符号化装置
JP3353852B2 (ja) 音声の符号化方法
JPH0854898A (ja) 音声符号化装置
JP3583945B2 (ja) 音声符号化方法
JPH02502857A (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
JP2956068B2 (ja) 音声符号化復号化方式
JP3299099B2 (ja) 音声符号化装置
JP3166697B2 (ja) 音声符号化・復号装置及びシステム
JP3578933B2 (ja) 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体
JP2853170B2 (ja) 音声符号化復号化方式
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3024467B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3103108B2 (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置
JP3071800B2 (ja) 適応ポストフィルタ
JP3984021B2 (ja) 音声/音響信号の符号化方法及び電子装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071015

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081015

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091015

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091015

Year of fee payment: 10