JPH01296300A - 音声信号符号化方法 - Google Patents

音声信号符号化方法

Info

Publication number
JPH01296300A
JPH01296300A JP63316618A JP31661888A JPH01296300A JP H01296300 A JPH01296300 A JP H01296300A JP 63316618 A JP63316618 A JP 63316618A JP 31661888 A JP31661888 A JP 31661888A JP H01296300 A JPH01296300 A JP H01296300A
Authority
JP
Japan
Prior art keywords
term
short
signal
residual signal
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63316618A
Other languages
English (en)
Inventor
Francoise Bottau
フランソワ・ボトー
Claude Galand
クロード・ギヤラン
Jean Menez
シヤン・ムネ
Michele Rosso
ミシエール・ロツソ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH01296300A publication Critical patent/JPH01296300A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0003Backward prediction of gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/09Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being zero crossing rates

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 本発明は音声信号の符号化、特に低いビット速度の符号
化に関する。
B、従来技術 音声信号をディジタル符号化する。即ち音声信号をサン
プリングし、サンプルの流れを、該サンプルの2進符号
を表わすビットの流れに変換する多数の方法が知られて
いる。これは符号化された信号をその最終目的に提供す
る前に最初のアナログ形式に再変換する手段が利用可能
であるものと仮定する。符号化動作及び復号動作はどち
らも歪み又は雑音を発生するので、それらを最小にして
符号化プロセスを最適化する。
明らかに、音声信号の符号化に割当てられるビット数、
即ちピッ1−速度が大きければ大きいほど、符号化は良
好となる。あいにく、例えば送信チャンネルの費用のよ
うな費用効率の要求により、別々のユーザーの原始音声
信号を多重化動作によって同じ送信チャンネルに集中す
ることが必要となる。その結果、各音声符号化に割当て
られるビット速度が低ければ低いほど、すぐれたシステ
ムとなる。よって、所望のビット速度で符号化の品質及
び効率を最適化することが必要となる。符号化/復号品
質の最適化を可能にする。換言すれば、所与の速度で符
号化雑音の最小化を可能にする符号化方法の開発に多大
の努力が払われている。
1つの方法が、M、5chroeder & B、At
al、 ”Code−Excited   Linea
r   Prediction   (CELP)  
;   lligh−quality  5peech
  at  very  low  bit  rat
es”。
at ICASSP 1985によって発表された。基
本的には。
前記方法は符号化されたデータ(コードワード)の多く
のセットをコードブック内の既知の参照位置に事前に記
憶することを含む、符号化すべき音声信号のサンプルの
流れは連続するサンプルのブロックに分割され、各ブロ
ックはそれに最もよく一致するコードワードの参照符に
より表わされる。
この方法の主な欠点は計算に高度の複雑さを含むことで
ある。
該方法は、J、l’、Adoul et al、”Fa
st CELP codingbased on al
gebraic codes″、 ICASSI) 1
987で更に改善され、″関連する莫大な計算量”の削
減を可能にした。しかしながら、それでもなお前記計算
には逆フィルタリング、即ち符号化すべき信号サンプル
のブロック毎に検査されるコードブック・コードワード
毎にかなり大きい計算力を消費する動作が含まれる。
C0発明が解決しようとする問題点 本発明の1つの目的は、最小のフィルタ動作が。
コードワードで行われるコード励起による予測(コード
に基づいてコードを予測する)の研究に基づいた音声符
号化システムを提供することである。
本発明のもう1つの目的は、コード励起された符号化動
作が、音声信号の限定されたぜIF域部分で行われる音
声符号化システムを提供することである。
本発明の更にもう1つの目的は、コードブックの大きさ
を最小にするコードブック概念を提供することである。
D0問題点を解決するための手段 最初の音声信号又は少なくともその限定された帯域部分
が、そこから(デエンファシスされた)短期残差信号を
取出すように処理される。取出された信号は、長期残差
信号のCELr’符号化により実行される合成動作によ
る解析及び長期選択コードワードの合成によって長期残
差信号を取出すように処理される。
E、実施例 第1図は本発明を実現するトランシーバ(符号器/復号
器を含む送/受信装置)で用いられる基本素子のブロッ
ク図である。
送信すべき音声信号は、8にhzでサンプリングされ、
在来のアナログ/ディジタル変換器(図示せず)でサン
プル当り12ビットでディジタルPCM符号化され、サ
ンプル5(n)を供給する。これらのサンプルは先ずP
RE−EMP装置(10)でプレエンファシスされ1次
に相関装置(12)で処理され、短期予測 (STI’
)フィルタ(13)を調整するのに用いられる部分的な
自己相関派生係数(1’ARcOR派生)a、のセット
が取出される。STPフィルタ(13)は5(n)をフ
ィルタし第1の残差信号r(、)、即ち短期残差信号を
供給する1次に前記短・期成差信号が処理され、所定の
長期遅延Hだけ遅延され利得係数すを乗じた合成信号r
’ (n)をr(n)から引き去ることにより第2の、
即ち長期残差信号e(n)が取出される。
前記す及び阿の値は計算装置(9)で計算される。
本発明の目的のためブロック符号化手法が160サンプ
ル長のサンプル・ブロックr(n)で用いられる。パラ
メータb及びには8oサンプル毎に評価される。残差信
号サンプルe(n)の流れはこのように所定の長さ1.
の連続サンプルのブロックに分割され、次いで前記ブロ
ックの各々は、Lサンプルのにシーケンスが正規化され
たコードワードとして使用可能になるコード励起線形予
測(CELP)符号器(14)で処理される。そして、
低速度でe(n>を記録することは、該考慮されたe(
n)シーケンスに最もよく一致するコードワードを選択
し前記e(n)シーケンスをコードワード参照番号kに
より置換えることを必要とする。事前記憶されたコード
ワードは正規化されているものとすると、利得係数Gも
決定され検査されなければならない、160サンプルの
各シーケンスについて、N = 160/L対(k、G
)及び2つの対(b、M)が得られる。
kが決定されると、後に利得係数Gを乗する該選択され
たに番目のコードワードCBk−合成長期残差信号e’
 (n)を表わす−は加算機48(1B)を介して長期
予測ループ(15)に供給される。そのもう1つの入力
は装置(15)の出力5換言すれば、該遅延され加重合
成された短期残差信号により供給される。その結果、加
算機構(16)は合成短期残差信号r’ (n)を供給
する。
最後に、最初の信号は、G、 k、 b、 Mデータ、
例えば160 s(ロ)サンプルのブロック当たりN対
の(G。
k)及び2対の(b、M)、並びにPARCOR係数に
、の、またはPARCOR関連係数a、のセットを含む
低いビット速度のデータの流れに変換され、全てマルチ
プレクサ旧)X(17)により多重化され、受信装置/
復号器に送信される。
復号は先ずDMPXで受取ったデータ・フレームをデマ
ルチプレクシングし、G、 k、 b、 M及びa、を
互いに分離することを必要とする。ブロック毎に。
kの値を用いて事前記録されたテーブル(19)からコ
ードワードCBkを選択し、続いて対応する利得係数G
t&CBkに乗じて、しサンプル・ブロックの合成され
たe’ (n)を回復する0次いで、各e′(n)で逆
長期予測が実行され、遅延におよび利得すに調整された
遅延素子、並びに加算機構を含む装置(20)を用いて
合成された短期残差r’ (n)を回復する。最後に、
 r’(n)は係数a、により調整された逆短期ディジ
タル・フィルタ(21)に供給され1合成された音声信
号s’ (n)を供給する。
第2図の流れ図は第1図の装置の動作のシーケンスの概
略である。 A(z)により表示された2定義域で転送
機能を有するディジタル・フィルタ(13)により5(
n)で実行される、プレエンファシスされた短期解析は
r(n)を供給する0次に、長期解析がr(n)、残留
信号e(n)及びその合成表示に対して実行され、下式
が計算され供給される: e(n)  =r(n)  −b−r’(n−M)r’
(n) :e’(n)÷b−r’(n−M)e(n)は
コードワード参照番号k及び利得係数Gで符号化された
CELPである。
受信装置側では、信号合成はコードワードの選択及びそ
の増幅を含み、下式により合成される:、e’(n) 
= G−Cal (k、n)次いで、2つの逆フイルタ
リング動作−1つは長期合成(LTP)動作のため1/
B(z)により、他の1つは短期動作のため11^(Z
)により指定される−によってs’ (n)が合成され
る。
第2図の上部の2つのブロックに関連する動作の詳細を
第3図に示す。
先ず、プレエンファシスはプレエンファシスされたPA
RCOR派生の係数a、の取得を可能にする0次に、前
期プレエンファシスされたa、は短期ディジタル・フィ
ルタをセット(調整)するのに用いられ、下式が引出さ
れる: 記号Σは合計動作を示し、 r’ARcORのセットの
合計は8つの係数を含めて行なわれ、該フィルタは・8
つの反復タップを有するディジタル・フィルタである。
前期フィルタリング手法はディジタル信号処理分野の当
業者にはよく知られている。それは多重入力加算機構、
8タツプのシフト・レジスタ及びタップ・インバータを
用いるハードウェアで実現し、又はマイクロプログラム
で作動されるプロセッサを用いて実現することができる
残差信号r(n)は80サンプル毎に評価される長期パ
ラメータb及びにを決定するのに用いられる。
次に、これらのパラメータは長期フィルタ装置(15)
−第1図参照−をセットするのに使用され、下式を計算
する: c(n)  =r(n)  −b ・r’(n−M)r
’(n)   =  e’(n)   +  b  −
r’(n−M)b及びNの値を計算するための多くの方
法が利用可能である0例えば、1つの方法はB、S、 
Atal。
”Predicting  Coding  of  
5peech  at  low  BitRate”
、IEEE  Transactions  on  
Communication。
Vol、 C0M−30,April 1982 ;ま
たは[1,5,Atal &M、R,5chroede
r、”Adaptive  predictive  
codingof  5peech  signals
”、Be1l  5yste+s  Technica
lJournal、 Vol、49.1970による。
−殻内に、阿はピッチの値又はその倍音であり。
その計算方法は当業者にはよく知られている。
非常に有効な方法が欧州特許出願第87430006.
4号にも記載されている。
前期出願により: O b及び阿は80のサンプル及びそれらの80の先行サン
プルを用いる160サンプルの各ブロックで2度決定さ
れる。
そこで、阿の値、即ちピッチに関連した値が2ステツプ
のプロセスに基づいて計算される。第1のステップでは
粗ピツチに関連したHの値の概略決定をuJ能にし、続
いて第2のステップで限定数の値に自己相関法を用いて
(精密な)Mの値が調整される。
(1)第1ステップ: 概略決定は可変しきい値及びO交差検出を含む非線形手
法の使用に基づく、更に詳細に説明すれば、この第1ス
テツプは下記を含む: ・変数Hを0ないしは所定の値し、又は前の精密なHに
初期設定する; ・現在のサブ・ブロックの80サンプル、及び前の80
サンプルを含む160サンプルのブロック・ベクトルを
ロードする; ・前期160サンプルの正(Vmax)及び負(Vmi
n)のピークを検出する; ・下記しきい値を計算する: 正のしきい値Th” =α・Vmax 負のしきい値Th−=α・Vmin αは経験的に選択された値(例えば、α= o、5)で
ある。
・下式により現在のサブ・ブロックを表わす新しいベク
トルX(n)をセットする; もしr(n) −Thなら、X(n)=1もしr (n
) = Th−なら、X(n)=−1さもなければ、 
    X(n)=0−1.0又は1の値だけを含むこ
の新しいベクトルは”クリーン・ベクトル”と呼ばれる
;・2つのクリーン・ベクトル値間の重要な0交差(即
ち、符号遷移)、即ち互いに接近しているO交差を検出
する: ・連続的に検出されたO交差の間のr(n)サンプル間
隔の数を表わすH′の値を計算する;・ΔM=1M’−
Mlを計算してM′とその前の粗いHとを比較し、ΔH
が所定の値D(例えば、D=5)よりも大きい場合にそ
のに′を落す;(2)第2ステップ: 精密なNの決定は該ピッチのパルスの近くに位置するサ
ンプルのまわりで取得されたサンプルにだけ行なわれる
自己相関法の使用に基づく。
第2ステツプは下記を含む: ・計算されたばかりの粗いHの値−〇ではないものと仮
定するーに等しくなるようにHの値を初期設定するか、
さもなければHの値をその前に測定した精密なHに等し
くする: ・粗いピッチの周りのクリーン・バク1−ル、即ち所定
サンプル数の自己相関領域を見つける。
・下式により一組のIt(に′)値を計算する:R(k
’) =Σ r(n) ・r’ (n−に’)n=1 に′はクリーン・ベクトル・サンプルの指標であり1選
択された自己相関領域の下限Mn+inから上限MIl
axまで変化する。自己相関領域は1例えば。
Mmin = L、 Mmax = 120の限界を有
する。
・探している精密なM値を限定するとき、最大のR(k
’)、即ち自己相関ピークを見つける。
前記アルゴリズムの実行により、いったん装置(9)で
b及び阿が計算されると1Mは遅延線(15)の長さを
それに応じて調整するのに用いられ、その結果、加算機
構(16)のr’ (n)出方を遅延させてr’ (n
−M)を供給する0次に、bはr’(n−M) ニ乗じ
て装置(15)の出力でb−r’(n−M)を取得する
のに使われる。
第4図の流れ図はプレエンファシス及びPARCOR関
連の計算に含まれた詳細な動作を示す、160信号サン
プル5(n)の各ブロックが先ず処理され、信号自己相
関関数の2つの最初の値を下式から引出す: 次に、プレエンファシス係数Iが下式により計算され: R= R2/R1 160サンプル5(n)の最初のセットが下式によりプ
レエンファシスされたセラl” sρ(n)に変換され
る: 5p(n)==  5(n)−R05(n−1)プレエ
ンファシスされたパラメータa、は、従来(7) LE
ROUX−GUEGEN法を用いてプレエンファシスさ
れた信号5p(n)から引出されたいわゆるPARCO
R係数k(i)からステップアップ手Jlliにより引
出される。
k、係数はIN/’/ANGアルゴリズムを用いて28
ビットにより符号化することができる。これらの方法及
びアルゴリズムについては下記文献を参照されたい: e  J、  Leroux   &   C,Guc
gcn  :   A   fixedpoint  
computation  of  partia、]
  correlationcoefficients
″IEEE Transactions on ASS
P pp 257−259. June 1977゜−
c、に、 On & S、C,Yang :Piece
wise 1inearquantization o
r LI’Creflexion  coeffici
ents″Proc、 Int、 Conf、 on 
ASSP l1artford 、May 1977゜
・J、 D、 Markel  &  A、 +1. 
Gray  :  ”l、1nearpredicti
on of 5peech″Springer  Vc
rlag  1976゜5tep−up proced
ure pp 9/1−95゜・European p
atent 0002998 (1j5 counte
rpart短期フィルタ(13)は下式により短期残差
信号サンプルを引出す: 1=1 次に、サンプルr(n)のシーケンスはサブ・シーケン
ス・ブロックLに分割され、e(n)を引出して低いビ
ット速度で符号化し、コードワード参照符k及び利得係
数G(k)にするのに用いられる=コードワード及び利
得係数選択は平均二乗誤差基準の検討に基づく、即ち下
式に示す項を最小化するように選択される: E=[e(n)−G(n) ・CB(k、n)]” [
e(n)−G(k)・CB(k、n)]・・・・・(1
) ■は数学的な転置操作を表わす、 C11(k、n)は
第1図の符号器(14)内のテーブルである。換言すれ
ば、Eは2つのL成分ベクトル−Lは各コードワードC
Bののサンプル数−のスカラー積である。
Eを最小にする最適スケール係数G(k)は下式により
決定される: E □=O G 等式G(k)の分母は正規化係数−、1【前記憶された
テーブル内のコードワードを事前に正規化することによ
り回避することができる−である。
式(1)は下記のように変形することができる:最適コ
ードワードは等式(2)の最後の項を最大にするkを見
つけることにより得られる。
CB(k)はl C11(k、n) If 2を表わし
、 5ll(k)はスカラー積e1(n)・0口(k、
n)を表わすものとすると、先ず、下記の項を最大にす
るkを見つけなければならない: 5P(k)2 0口2(k) 次に、下記の項からG(k)の値を決定する:前記動作
を実行するためのアルゴリズムは第5図に示す。
最初の2つの指標カウンタiおよびjはi=1及びj=
1にセットされる。テーブルは順次に走査される。コー
ドワードC11(1,n)はテーブルから読出される。
最初のスカラー積は下式により計算される:5P(1)
 ”Σ CII(1,n) ・e(n)      (
3)n=1 この値は二乗されて5P2(1)となり、対応するコー
ドワードの二乗値[即ち、 cn2(1)]により除さ
れる1次に、iは1だけ増訂数され、前記動作はi=k
になるまで反復される。にはコードブックにあるコード
ワードの数である0次にシーケンス:5P2(i)/C
B2(i)  −ただし、i = 1. 、、、、k 
 −の範囲内で5P2(k)/CB2(k)を最大にす
る最適コードワードCD(k)が選択される。この動作
はテーブル参照番号にの検出を可能にする。
いったんkが選択されると、利得係数は下式を用いて計
算されるニ ジ−ケンスe(n)内のサンプル数をLの倍数になるよ
うに選択するものとすると、前記シーケンスe(n)は
それぞれがLサンプルの長さのJLウィンドーに再分割
され、次いで、jは1だけ増訂数され。
前記プロセスはj = JLになるまで反復される。
註:もしピッチの値MがMmin = Lにより低く制
限されるなら、全てのCE / L T PループはL
サンプル毎に適用され、 CE/LTP適用毎にJL 
= 1が得られる。 LTI’パラメータは80 r(
n)サンプルCE/LTP処理の後にだけ再計算される
前記説明とは別に下記のように表現することができる: (cn)−ただし、 n =1.2. 、、、、L  
−は符号化すべきe(n)サンプルのシーケンスを表わ
し、(Y )−ただし、n = 1.2. 、、、 、
k = 1.2. 、、。
−はしサンプルそれぞれのにコードラードを含むに×1
.テーブルを表わすものとすると、CE L I)符号
化は下記のようになる。
・下式により相関積を計算する: ただし、 k = 1. 、、、、に ・下式を導く kの最適値を選択する:Ekopt =
 Max (Ek) ただし、 k = 1. 、、、、 K・対応する利得
は: G(k) = Ekkpt ・(en)シーケンスを下記のブロックに変換する=C
ビット” log2 Kビット + G(k)符号化ビット この方法はテーブルを記憶するのにかなり大きい記憶容
量を必要とする。に:256の場合には、に×しはたぶ
ん40 Kb程度となる。
本明細書では別の方法が推奨される。システムの初期設
定で、残留する原始信号のL+にサンプルの最初のブロ
ック、例えばe(n)がテーブルY(n)。
(n=1.L+K)に記憶される0次いで、各々の後続
するLワード長のシーケンス(en)が、下式により、
(en)シーケンスを1つのサンプル位置からその次の
サンプル位置にシフトすることによって (L+K)長
のテーブルのシーケンスと相関される;Ek  =Σ 
 en  −Y(n+に−1)n=ま ただし、 k = 1. 、、、、に この方法は、 K = 256の場合に、テーブルに必
要な記憶サイズを2 Kbにまで減少することを可能に
する。
第1図に関連して述べたように、受信装置即ち音声合成
動作は、に、G(k)、 b、 M及びa、データを互
いに分離するため、先ず受信データをマルチプレクシン
グする必要がある。にはテーブルから対応するコードワ
ードCB(k、n)を選択するのに使用される。前記コ
ードワードにG(k)を乗すると、下式のように合成信
号が合成される: e’ (n) =C(k) ・C[l(k、n)パラメ
ータb及び阿は受信装置で使用され、遅延素子b−r″
(n−M)の調整を可能にし、下式の合成短期残差信号
を引出す: r’(n) = e’(n) + b r’(n−M)
最後に、a、係数は下式を用いて音声信号を合成するた
め短期残留フィルタ(21)を調整するのに使用される
: 只 本発明の低いビット速度の符号化プロセスは、C,Ga
1and、  ”Voice  Excited  P
redictive  Coding(VEPC)”、
 IBM  Journal  of  Re5ear
ch  andDevelopment、 Vow、 
29. No、2 March 1985が適用される
と更に省力が可能になる。この場合、コード励起線形予
測符号化はベースバンド信号により実行され、バンドは
例えば第6図に示すようなシステム用いて300= 1
00011zに制限される。
この場合、信号r(n)は完全な(300〜34001
1z)バンド信号からはそれ以上引出されず、むしろ低
域フィルタ (60)により供給された低い(300〜
100011z)バンド信号から引出される。原始信号
から低い帯域幅信号を取除くだけで得られる高い帯域幅
信号(1000〜340011z)は装置(62)で処
理され、前記高い周波数帯域幅に含まれたエネルギーに
関連した情報を引出す、高い周波数エネルギーは符号化
されて係数Eのセット(例えば2つのE)となり、受信
装置/シンセサイザに向けて多重化される。さもなけれ
ば、残る全ての動作は第3図〜第5図に関連した前記説
明のように実行される。
合成動作では、ベースバンド残留信号r”(n)が第1
図及び第2図に関連して説明したように合成されると、
高い周波数帯域幅成分が付加されなければならない、そ
のために、ベースバンド・スペクトルが非線形歪み装置
(70)の手法(余波整流)−ピッチ周律により倍音構
造を4にllzにまで拡大する−により展開される。非
音声音の場合。
特に摩擦音では、ベースバンド・スペク1−ルはあまり
に乏しく高周波信号を正確に生成できないことがある。
これは、雑音発生装置(71)を非常に低いレベルで使
用し両者を加えることにより補償される。展開された帯
域幅は (1000〜340011z)の帯域幅を保持
するようにllr’F(72)でフィルタされる。
そのエネルギー内容は、処理中のサンプルのブロックの
受信されたE係数に基づいて最初の高い周波数のスペク
トルに一致するように、調整装置(73)で調整される
。このようにして得られた高いバンドの残差信号は、装
置(70)、(72)及び(73)に関連する処理によ
る遅延を考慮して遅延装置(74)で遅延された該合成
されたベースバンド残差信号に加えられ、該合成された
短期残差信号r’ (n)が得られる。 r’(n)は
短期予測フィルタ (75)でフィルタされ1合成され
た音声s’ (n)が得られる。
【図面の簡単な説明】
第1図は本発明に従って構成された送信装置及び受信装
置の双方の基本素子のブロック図、第2図及び第3図は
第1図の装置によって実行される動作の流れ図、 第4図及び第5図は本発明に関連する動作の流れ図、 第6図及び第7図は本発明を実現するもう1つの装置を
示す図である。 9・・・・計算装置、 10・・・・PIIE−EMP
装置、12・・・・相関装置、13・・・・STP、 
14・・・・符号器、15・・・・長期予測フィルタ、
16・・・・加算機構、17・・・・Ml”X、  1
8・・・・DMPX、 19・・・・テーブル、20・
・・・逆長期予測装置、21・・・・STP、60・・
・・LPF、62・・・・HI’E、64・・・・符号
器、70・・・・歪み装置、71・・・・雑音発生装置
、72・・・・1IPF、73・・・・調整装置、74
・・・・遅延装置、75・・・・STr’。 出願人  インター亥ショナル・ビジネス・マシーンズ
・コーポレーション 復代理人  弁理士  澤  1) 俊  夫第2図 入力 : e(nl 第5図

Claims (1)

  1. 【特許請求の範囲】 符号化すべき音声信号s(n)のサンプル・ブロックの
    各々に対し少なくとも1個のテーブル・アドレスにおよ
    びこのテーブル・アドレスに関連する利得Gを生成する
    コード励起符号化によって低ビット速度で音声信号s(
    n)を符号化する方法において、 音声信号s(n)から導出された部分相関係数の組によ
    り調整された短期予測フィルタを用いて音声信号s(n
    )をフィルタ処理し、上記短期予測フィルタから短期残
    差r(n)を取り出すステップと、重み付けし、遅延さ
    せて得た合成短期残差を上記短期残差r(n)から差し
    引いて長期残差e(n)を導出するステップと、 上記長期残差e(n)を分割して継続したブロックを生
    成するステップと、 上記長期残差e(n)の各ブロックをコード励起符号化
    処理し、少なくとも1個のテーブル・アドレスおよび1
    個の利得を生成するステップとを有することを特長とす
    る音声信号符号化方法。
JP63316618A 1988-03-08 1988-12-16 音声信号符号化方法 Pending JPH01296300A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP88480006.1 1988-03-08
EP88480006A EP0331857B1 (en) 1988-03-08 1988-03-08 Improved low bit rate voice coding method and system

Publications (1)

Publication Number Publication Date
JPH01296300A true JPH01296300A (ja) 1989-11-29

Family

ID=8200488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63316618A Pending JPH01296300A (ja) 1988-03-08 1988-12-16 音声信号符号化方法

Country Status (4)

Country Link
US (1) US4933957A (ja)
EP (1) EP0331857B1 (ja)
JP (1) JPH01296300A (ja)
DE (1) DE3871369D1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992005541A1 (fr) * 1990-09-14 1992-04-02 Fujitsu Limited Systeme de codage de la parole

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE68914147T2 (de) * 1989-06-07 1994-10-20 Ibm Sprachcodierer mit niedriger Datenrate und niedriger Verzögerung.
US5097508A (en) * 1989-08-31 1992-03-17 Codex Corporation Digital speech coder having improved long term lag parameter determination
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
JPH03123113A (ja) * 1989-10-05 1991-05-24 Fujitsu Ltd ピッチ周期探索方式
IL95753A (en) * 1989-10-17 1994-11-11 Motorola Inc Digits a digital speech
DE9006717U1 (de) * 1990-06-15 1991-10-10 Philips Patentverwaltung GmbH, 22335 Hamburg Anrufbeantworter für die digitale Aufzeichnung und Wiedergabe von Sprachsignalen
US5528629A (en) * 1990-09-10 1996-06-18 Koninklijke Ptt Nederland N.V. Method and device for coding an analog signal having a repetitive nature utilizing over sampling to simplify coding
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
KR930006476B1 (ko) * 1990-09-29 1993-07-16 삼성전자 주식회사 영상처리 시스템의 데이타 변복조방법
JP3077944B2 (ja) * 1990-11-28 2000-08-21 シャープ株式会社 信号再生装置
JPH04264597A (ja) * 1991-02-20 1992-09-21 Fujitsu Ltd 音声符号化装置および音声復号装置
JP3254687B2 (ja) * 1991-02-26 2002-02-12 日本電気株式会社 音声符号化方式
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
EP0588932B1 (en) * 1991-06-11 2001-11-14 QUALCOMM Incorporated Variable rate vocoder
US5255339A (en) * 1991-07-19 1993-10-19 Motorola, Inc. Low bit rate vocoder means and method
US5657418A (en) * 1991-09-05 1997-08-12 Motorola, Inc. Provision of speech coder gain information using multiple coding modes
US5253269A (en) * 1991-09-05 1993-10-12 Motorola, Inc. Delta-coded lag information for use in a speech coder
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
GB2282943B (en) * 1993-03-26 1998-06-03 Motorola Inc Vector quantizer method and apparatus
BE1007617A3 (nl) * 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
TW271524B (ja) * 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5497337A (en) * 1994-10-21 1996-03-05 International Business Machines Corporation Method for designing high-Q inductors in silicon technology without expensive metalization
EP0732687B2 (en) * 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
JP3064947B2 (ja) * 1997-03-26 2000-07-12 日本電気株式会社 音声・楽音符号化及び復号化装置
KR100510399B1 (ko) 1998-02-17 2005-08-30 모토로라 인코포레이티드 고정 코드북내의 최적 벡터의 고속 결정 방법 및 장치
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US20070239294A1 (en) * 2006-03-29 2007-10-11 Andrea Brueckner Hearing instrument having audio feedback capability
US11714127B2 (en) 2018-06-12 2023-08-01 International Business Machines Corporation On-chip spread spectrum characterization
US11146307B1 (en) * 2020-04-13 2021-10-12 International Business Machines Corporation Detecting distortion in spread spectrum signals
US11693446B2 (en) 2021-10-20 2023-07-04 International Business Machines Corporation On-chip spread spectrum synchronization between spread spectrum sources

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS542050A (en) * 1977-06-07 1979-01-09 Nec Corp Block coding and decoding system
EP0070948B1 (fr) * 1981-07-28 1985-07-10 International Business Machines Corporation Procédé de codage de la voix et dispositif de mise en oeuvre dudit procédé
EP0093219B1 (fr) * 1982-04-30 1986-04-02 International Business Machines Corporation Procédé de codage numérique et dispositif de mise en oeuvre dudit procédé
CA1252568A (en) * 1984-12-24 1989-04-11 Kazunori Ozawa Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992005541A1 (fr) * 1990-09-14 1992-04-02 Fujitsu Limited Systeme de codage de la parole
US5323486A (en) * 1990-09-14 1994-06-21 Fujitsu Limited Speech coding system having codebook storing differential vectors between each two adjoining code vectors

Also Published As

Publication number Publication date
EP0331857B1 (en) 1992-05-20
DE3871369D1 (de) 1992-06-25
US4933957A (en) 1990-06-12
EP0331857A1 (en) 1989-09-13

Similar Documents

Publication Publication Date Title
JPH01296300A (ja) 音声信号符号化方法
CA2347667C (en) Periodicity enhancement in decoding wideband signals
US6202046B1 (en) Background noise/speech classification method
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
US4868867A (en) Vector excitation speech or audio coder for transmission or storage
US5873059A (en) Method and apparatus for decoding and changing the pitch of an encoded speech signal
EP0331858B1 (en) Multi-rate voice encoding method and device
US5495555A (en) High quality low bit rate celp-based speech codec
EP0379587B1 (en) Encoder/decoder apparatus
EP0770989B1 (en) Speech encoding method and apparatus
EP0763818B1 (en) Formant emphasis method and formant emphasis filter device
US6119082A (en) Speech coding system and method including harmonic generator having an adaptive phase off-setter
US6078880A (en) Speech coding system and method including voicing cut off frequency analyzer
US6081776A (en) Speech coding system and method including adaptive finite impulse response filter
US6098036A (en) Speech coding system and method including spectral formant enhancer
US6138092A (en) CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency
JP4097699B2 (ja) 複雑さが軽減された信号送信システム
JPH08179796A (ja) 音声符号化方法
JP2003512654A (ja) 音声の可変レートコーディングのための方法およびその装置
US5295224A (en) Linear prediction speech coding with high-frequency preemphasis
JPH09127989A (ja) 音声符号化方法及び音声符号化装置
WO2001020595A1 (en) Voice encoder/decoder
JPS63223799A (ja) ピツチ検出方法
JPH10124094A (ja) 音声分析方法、音声符号化方法および装置
WO2006120931A1 (ja) 符号化装置、復号化装置及びこれらの方法