JP3112681B2 - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JP3112681B2
JP3112681B2 JP03515016A JP51501691A JP3112681B2 JP 3112681 B2 JP3112681 B2 JP 3112681B2 JP 03515016 A JP03515016 A JP 03515016A JP 51501691 A JP51501691 A JP 51501691A JP 3112681 B2 JP3112681 B2 JP 3112681B2
Authority
JP
Japan
Prior art keywords
vector
code
vectors
delta
codebook
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03515016A
Other languages
English (en)
Inventor
智彦 谷口
ジョンソン マーク
恭士 大田
秀明 栗原
良紀 田中
良広 坂井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP3127669A external-priority patent/JPH04352200A/ja
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Application granted granted Critical
Publication of JP3112681B2 publication Critical patent/JP3112681B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • G10L2019/0014Selection criteria for distances
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 〔技術の分野〕 本発明音声信号の情報圧縮を行うための音声符号化方
式に関し、特に4〜16Kbpsの伝送速度で符号化を行うた
めのAnalysis−by−Synthesis(A−b−S)形ベクト
ル量子化を用いた、すなわち合成による分析を行うベク
トル量子化を用いた音声符号化方式に関する。
〔背景技術〕
A−b−S形ベクトル量子化を用いる音声符号器、例
えばCode−Excited Linear Prediction(CELP)符号
器は、近年、企業内通信システム、ディジタル移動無線
システムなどにおいて、音声信号をその品質を保持しつ
つ情報圧縮する音声符号器として有望視されている。こ
のベクトル量子化音声符号器(以下、単に符号器)にお
いては、符号帳(コードブック)の各コードベクトルに
予測重み付けを施して再生信号を作り、再生信号と入力
音声信号との間の誤差電力を評価して最も誤差の少ない
コードベクトルの番号(インデックス)を決定して受信
側に送信するものである。
上記のA−b−S形ベクトル量子化方式による符号器
は、前記符号帳に格納された約1000パターンの音源信号
のベクトルの1つ1つに対して、線形予測合成フィルタ
処理を施し、再生された各音声信号と、符号化すべき入
力音声信号との間の誤差が最も小さくなる1つのパター
ンをその約1000のパターンの中から探索するという処理
を行う。
ところで符号器は通話の即時性が要求されるので、上
記の探索処理をリアルタイムで行う必要がある。そうす
ると、その探索処理を行うのに、例えば5msという短い
時間間隔で、通話の間連続して行わなければならない。
しかしながら後述する如く、この探索処理の中にフィ
ルタ演算や相関演算という複雑な演算操作が含まれてい
て、これらの演算操作に要する演算量は、例えば数100M
乗算・加算/秒という膨大なものになる。これに対応す
るには、現在、最高速とされるDigital Signal Proce
ssor(DSP)をもってしても、数チップを必要とし、例
えば携帯電話に適用しようとする場合、その小形化なら
びに低消費電力化が困難になるという問題がある。
〔発明の開示〕
本発明は上記問題点に鑑み、高品質・高能率というA
−b−S形ベクトル量子化符号器の特質をそのまま維持
しつつ、上記演算量を飛躍的に減少させることのできる
音声符号化方式を提供することを目的とするものであ
る。
本発明は上記目的を達成するために、上記符号帳の各
コードベクトルの間に、前のコードベクトル に対し差分ベクトル(以下、デルタベクトルと称す) を加えることで次のコードベクトル が生成されるようなコードベクトル群を、該符号帳に格
納する。ここにnはコードベクトル群の順番を表す。
〔図面の簡単な説明〕
本発明を添付の図面を参照しながら以下に説明する。
第1図は音声発生のメカニズムを説明するための図、 第2図はA−b−S形ベクトル量子化音声符号器の一
般的な構成を表すブロック図、 第3図は第2図の構成において符号帳探索処理の部分
を具体的に示すブロック図、 第4図は本発明の基本的な考え方を表す図、 第5図は本発明に基づく第1実施例の概念を単純に表
す図、 第6図は第1実施例のもとでの符号帳探索処理の部分
を具体的に示すブロック図、 第7図は第1実施例のもとでの符号帳探索処理の部分
を別の例をもって具体的に示すブロック図、 第8図は自己相関演算部の他の実現列を示す図、 第9図は第1実施例のもとでの符号帳探索処理の部分
をさらに別の例をもって具体的に示すブロック図、 第10図は自己相関演算部の他の実現例を示す図、 第11図は本発明に基づく第2実施例の原理構成を表す
図、 第12図は第11図の第2実施例を具体的に表す図、 第13図は第2実施例の特徴をなす木構造状配列のデル
タベクトルについて説明するための図、 第14A,14Bおよび14C図は符号帳内に仮想的に形成され
るコードベクトルの分布(モードA、モードBおよびモ
ードC)をそれぞれ表す図、 第15A,15Bおよび15C図は変形第2実施例に基づくベク
トルの並べ替えを説明するための図、 第16図は変形第2実施例に基づく符号帳探索処理の部
分の一例を示す図、 第17図は逐次最適化CELP形の符号器を示す図、 第18図は同時最適化CELP形の符号器を示す図、 第19図は第17図におけるアルゴリズムを表す図、 第20図は第18図におけるアルゴリズムを表す図、 第21A図は逐次最適化CELP方式の場合におけるゲイン
最適化動作を図解的に表すベクトル図、 第21B図は同時最適化CELP方式の場合におけるゲイン
最適化動作を図解的に表すベクトル図、 第21C図はピッチ直交変換最適化CELP方式の場合にお
けるゲイン最適化動作を図解的に表すベクトル図、 第22図はピッチ直交変換最適化CELP形の符号器を示す
図、 第23図は第1実施例のもとでの符号帳探索処理の部分
をさらに別の例をもって具体的に示す図、 第24Aおよび24B図はハウス・ホルダー直交変換を説明
するためのベクトル図、 第25図は本発明に係る第1実施例によって演算量を減
少させることができることを示す図、 第26図は本発明に係る第2実施例によって演算量を減
少させると共にメモリ量を削減できることを示す図であ
る。
〔発明を実現する最良の形式〕
第1図は音声発生のメカニズムを説明するための図で
ある。
音声には有声音と無声音があり、有声音は声帯の振動
によるパルス音源が基となって発生し、個人個人のノド
や口の声道特性が付加されて声になる。また、無声音は
声帯を振るわせないで出す音で、単なるガウス性の雑音
列が音源となって声道を通って声となる。したがって、
音声発生メカニズムは第1図に示すように、有声音の元
となるパルス音源PSGと無声音の元となる雑音源NSGと、
各音源(PSG,NSG)から出力される信号に声道特性を付
加する線形予測合成フィルタLPCFによりモデル化でき
る。なお、人の声は周期性を有し、該周期はパルス音源
PSGから出力されるパルスの周期性に対応するから、人
や話の内容によって異なる。
以上から、入力音声に対応するパルス音源のパルス周
期と雑音源の雑音列を特定することができれば、これら
パルス周期と雑音源の雑音列とを識別する符号(デー
タ)により入力音声を符号化することができる。
そこで、適応符号帳を用いて入力音声信号の周期性に
基づいてパルス音源のパルス周期を同定し、該周期を備
えたパルス列を線形予測合成フィルタに入力してフィル
タ演算処理を施し、得られたフィルタ演算結果を入力音
声信号から減算して周期成分を除去する。ついで、予め
複数の雑音列(各雑音列はN次元の予め定めたコードベ
クトルで表現されている)を用意しておき、各コードベ
クトルに合成フィルタ処理を施した再生信号ベクトルと
周期成分が除去された入力信号ベクトル(N次元ベクト
ル)との誤差が最小となるような1つのコードベクトル
を求めれば、前記周期とコードベクトルを特定する符号
(データ)により音声を符号化することができる。そし
てこのデータが受信側に送信され、原音声(入力音声信
号)が再生される。このデータは高い圧縮がかけられた
情報である。
第2図はA−b−S形ベクトル量子化音声符号器の一
般的な構成を表すブロック図である。本図において、参
照番号1はランダムに発生した複数の例えば1024種類の
雑音列 (各雑音列はN次元のコードベクトルで表現されてい
る)を記憶する雑音符号帳、2はゲインgの増幅部、3
は増幅部出力に声道特性を模擬した合成フィルタの演算
処理を施す線形予測合成フィルタ、4は線形予測合成フ
ィルタ3から出力される再生信号ベクトルと入力信号ベ
クトルの誤差を出力する誤差発生部、5は誤差を評価
し、該誤差が最小となる雑音列(コードベクトル)を求
める誤差電力評価部である。
A−b−Sによるベクトル量子化では通常のベクトル
量子化と異なり、雑音符号帳1の各コードベクトル に最適のゲインgを掛けた後、線形予測合成フィルタ3
でフィルタ処理を施し、フィルタ処理により得られる再
生信号ベクトル との間の誤差信号 を誤差発生部4で求め、誤差電力評価部5で誤差信号の
電力を評価関数(距離尺度)として雑音符号帳1の探索
を行い、誤差電力が最小となる雑音列(コードベクト
ル)を求め、該雑音列(コードベクトル)を特定する符
号により入力音声信号を符号化する。Aは聴覚重み付け
マトリクスである。
上記の誤差電力は次式 により与えられる。最適なコードベクトル およびゲインgは、この(1)式に示す誤差電力を最小
化するものとして決定される。なお、声の大きさにより
パワーが異なるので、ゲインgを最適化して再生信号 のパワーを入力音声信号 のパワーに合わせる。最適ゲインは(1)式をgで偏微
分して0とおくことにより求めることができる。すなわ
ち、 より、gは で与えられる。このgを(1)式に代入すると、 となる。入力信号 と合成フィルタ出力 の相互相関をRXC、合成フィルタ出力 の自己相関をRccとすれば、相互相関、自己相関は次式 により表現される。なお、Tは転置(transpose)マト
リクスを表す。
(3)式の誤差電力 は同式の右辺第2項を最大にするものであるから、該コ
ードベクトル は次式 と表現でき、最適のゲインは(6)式を満たす相互相関
および自己相関を用いて(2)式より g=RXC/Rcc (7) で与えられる。
第3図は第2図の構成において符号帳探索処理の部分
を具体的に示すブロック図である。つまり、誤差電力が
最小となる雑音列(コードベクトル)を求めて入力信号
を符号化する雑音符号帳探索処理部分の構成図である。
参照番号1はM種類(サイズM)の雑音列 (各雑音列はN次元のコードベクトルで表現されてい
る)を記憶する雑音符号帳、3は声道特性を模擬したフ
ィルタ演算処理を施す分析次数NPの線形予測合成フィル
タ(LPCフィルタ)である。なお、第2図の増幅部2は
記載を省略した。
参照番号6は相互相関 を演算する乗算部、7は相互相関RXCの二乗を演算する
二乗演算部、8は自己相関 を演算する自己相関演算部、9はRXC 2/Rccを演算する除
算部、10はRXC 2/Rccが最大となる、換言すれば誤差電力
が最小となる雑音列(コードベクトル)を決定して、該
コードベクトルを特定する符号を出力する誤差電力評価
決定部である。これらの構成要素6,7,8,9および10が、
第2図の誤差電力評価部5に対応する。
上述した従来の符号帳探索処理では、既に述べたよう
な問題が生ずる。これについて説明する。
従来の符号帳探索処理のうちで主なものは、(1)コ
ードベクトル に対するフィルタ処理、(2)相互相関RXCの算出処理
および(3)自己相関Rccの算出処理の3つである。こ
こでLPCフィルタ3の次数をNP、ベクトル量子化(コー
ドベクトル)の次元をNとすると、1つのコードベクト
ルに対して、上記(1)〜(3)項のそれぞれに要する
演算量はNP・N,NおよびNである。したがって、1つの
コードベクトル当り、符号帳探索に要する演算量は(NP
+2)・Nとなる。通常用いられている雑音符号帳1
は、40次元・符号帳サイズ1024(N=40,M=1024)程度
のものであり、LPCフィルタ3の分析次数NPが10次程度
であるため、1回の符号帳探索に (10+2)・40・1024=480K の積和算を要する。但し、K=103である。
このような符号帳探索を、音声符号化のサブフレーム
(5msec)毎に行うためには、96Mops(メガオペレーシ
ョン/秒)という膨大な処理能力が必要となり、現在最
高速のデジタル・シグナル・プロセッサ(許容演算量20
〜40Mops)をもってしても、その実時間処理には数チッ
プを要してしまう。これが問題点である。以下、この問
題点を解決するいくつかの実施例を説明する。
第4図は本発明の基本的な考え方を表す図である。本
図の雑音符号帳1には各々がN次元のM個の雑音列がコ
ードベクトル として格納されている。通常これらのコードベクトル相
互間には何の関連性もない。このため従来は、第3図の
探索処理を行うのに、m個のコードベクトルの1つ1つ
について全く独立に誤差電力の評価のための演算を行っ
ていた。
ところが、コードベクトルに対する見方を変えると、
第4図に表すようにデルタベクトル によって相互間を関連付けることができる。これを数式
で表すと次のとおりである。
いて更新するための演算量との間に余り差がなくなって
しまうからである。
第5図は本発明に基づく第1実施例の概念を単純に表
す図であり、次のコードベクトル、例えばi番目のコー
ドベクト N次元コードベクトルのときN個(Nサンプル)であ
り、雑音列の波形の各サンプル点に相当する。各コード
ベクトルが例えば40サンプル(N=40)からなるとき、
各欄の黒丸の数は40個になる。第5図では、デルタベク
トル としてわずか4個の有意義サンプルデータΔ1,Δ2,Δ3
およびΔ4からなる例を示しており、きわめてシンプル
である。
逆に言えば、雑音符号帳1の中に例えば1024(M=10
24)パターンのコードベクトルを格納してテーブルとす
るとき、どのようにこれらコードベクトルを配列するか
は全く任意であるから、前後のコードベクトル の間の差をとったときに、その差分ベクトル がなるべくシンプルになるように雑音符号帳1のコード
ベクトルを並べ換えればよい。つまり、隣接するどの2
つのコードベクトル をとっても、両者間のデルタベクトル が第5図のように数サンプルデータのシンプルなベクト
ルとなるように、各コードベクトルを並べてオリジナル
テーブルにする。
このようにすると、上記(8)式で示したように初期
ベク ばよいことになる。
なお、第5図のコードベクトル としては既にスパース化された、すなわちサンプル値が
零であるコードを多く含むように予め処理されたコード
ベクトルを用いた例を示している。ただし、コードベク
トルのスパース化技術は公知である。
具体的には、隣接する任意の2つのコードベクトル になるようなデルタベクトル群を順次、デルタベクトル
符号帳11(後述)に格納するようにする。
第6図は第1実施例のもとでの符号帳探索処理の部分
を具体的に示すブロック図である。基本的には、前述し
た第3図の構成に対応するが、第6図は周知の逐次最適
化CELP形の音声符号器に適用した例を示す。したがっ
て、入力音声信号 (第3図)に代えて、聴覚重み付けしたピッチ予測誤差
信号ベクトル が示されているが、本発明を説明する上で何ら影響はな
い。また、演算手段19が示されているが、これは線形予
測合成フィルタ3を第3図に示した位置から、第6図に
示す位置に移し替えたことに伴う前処理手段であって、
本発明を理解する上で重要な要素ではない。
第3図の相互相関RXCを生成する部分に対応するの
が、第6図の相互相関演算部12であり、第3図の自己相
関Rccを生成する部分に対応するのが、第6図の自己相
関演算部13である。この相互相関演算部12内に、本発明
を実現する巡回加算手段20が、加算部14および遅延部15
として示されている。同じく自己相関演算部13内に本発
明を実現する上記の巡回加算手段20が、加算部16および
遅延部17として示されている。
最も注目すべき点は、第6図のデルタベクトル符号帳
11であり、第3図の雑音符号帳1のように各コードベク
トル 果は遅延部15(遅延部17についても同じ)に保持され、
フィードバックされて、次に来るデルタベクトル に加算部14(加算部16についても同じ)で巡回的に加算
される。以下、同様であり、結果的に、引き続くコード
ベクトル について個別に演算していた従来法と等価な処理をした
ことになる。
以下、詳細に説明する。聴覚重み付けしたピッチ予測
誤差信号ベクトル を演算手段19で に変換しておき、デルタベクトル符号帳11のデルタベク
トル をそのまま相互相関演算部12に与えて乗算すると共に前
回の相関値 という演算により今回の相関値 が生成されて誤差電力評価部5に与えられることにな
る。
また第6図に示すように自己相関演算部13において
は、 したがって、相互相関演算部12および自己相関演算部13
においては、スパース化されたデルタベクトルの乗算で
済むので演算量を削減することができる。
第7図は第1実施例のもとでの符号帳探索処理の部分
を別の例をもって具体的に示すブロック図であり、周知
の同時最適化CELP形の音声符号器に適用した場合を示
す。この場合も本発明は何の支障もなく適用される。本
図でも、第1および第2の演算手段19−1および19−2
は本発明に直接関係しない。なお、相互相関演算部(1
2)は、入力音声系とピッチP(既述の周期)系とに分
けて並行して処理されるので、第1および第2の相互相
関演算部12−1および12−2としている。
で、デルタベクトルの分だけの演算量で済むことにな
る。
第8図は自己相関演算部の他の実施例を示す図であ
り、第6図および第7図に示した自己相関演算部13は他
の構成でも実現することができる。ここに示す演算器21
は、第6図および第7図において、合成フィルタ3と自
己相関演算部8においてそれぞれ必要であった乗算を1
回の乗算で済ますようにしたものである。
という演算に従い、相関値ATAおよび前回のコードベク
トル が生成されて評価部5に与えることができる。
こうすれば、ATAと との乗算だけになり、前述したように第6図や第7図の
ように2度の乗算を行う必要が無くなり、その分、演算
量を削減することができる。
第9図は第1実施例のもとでの符号帳探索処理の部分
をさらに別の例をもって具体的に示すブロック図であ
り、基本的には、前述した第3図の構成に対応するが、
第9図はピッチ直交変換最適化CELP形の音声符号器に適
用した例を示す。
第9図において、演算手段19′の後段に置かれたブロ
ック22は、時間反転直交変換部であり、演算手段19′
で、 するものである。ただし、これら演算手段19′や時間反
転直交変換部22は、本発明の本質とは直接関係がない。
相互相関演算部12では、第6図および第7図の場合と
同様、デルタベクトル との乗算および巡回的加算とを行って なる相関値を評価部5に与える。Hは直交変換を表すマ
トリクスである。
このときの演算は、 となる。
一方、自己相関演算部13では、デルタベクトル符号帳
したがって、ピッチ直交変換最適化を行う場合にも同
様にしてデルタベクトルによる演算量の削減が可能とな
る。
第10図は自己相関演算部の他の実現例を示す図であ
り、第9図に示した自己相関演算部13は他の構成でも実
現することができる。これは前述した第8図の構成に対
応する。
ここに示す演算器23は、第9図において、合成フィル
タ(AH)3′と自己相関演算部8においてそれぞれ必要
であった乗算を1回の乗算で済ますようにしたものであ
る。
この演算器23において、前回のコードベクトル および直交変換した聴覚重み付けマトリクスAHの相関値
(AH)TAHを記憶しておき、デルタベクトル との演算を行うと共に、加算部16と遅延部17で巡回的に
加算することにより、 なる自己相関値を求めることができ、演算量を削減する
こと ば40サンプル中の任意の4サンプルを有意義データ(サ
ンプル値が零でないサンプルデータ)とし、スパース化
を図っている。しかしこの点を除いては各デルタベクト
ルの設定に当っては特別な規則付けはなされていない。
次に述べる第2実施例は、デルタベクトル群を特別の
規則のもとで生成することにより、符号帳探索処理に要
する演算量の大幅な削減を図るものである。また、この
第2実施例は、デルタベクトル符号帳11内のメモリ容量
を大幅に削減できるという利点も有する。以下、この第
2実施例について説明する。
第11図は本発明に基づく第2実施例の原理構成を表す
図である。第2実施例の概念は第11図の上半分に図解的
に示されており、仮想的に形成される例えば1024個のパ
ターンのコードベクトルを生成するためのデルタベクト
ルは、+−の極性をもって一定の規則で木構造状に配列
されている。これにより、フィルタ演算や相関演算をわ
ずか(L−1)個(Lは例えば10)のデルタベクトルに
対する演算に帰着させることができ、演算量を飛躍的に
減少させることができる。
第11図において、参照番号11は、1つの基準雑音列で
ある初期ベクトル と(L−1)種類の差分雑音列であるデルタベクトル (Lは木構造の階層の数でL=10)を格納するデルタベ
クトル符号帳、3は声道特性を模擬したフィルタ演算処
理を施す既述の線形予測合成フィ 憶する記憶部、12は相互相関 を演算する既述の相互相関演算部、13は自己相関 を演算する既述の自己相関演算部、10はRXC 2/Rccが最大
となる、換言すれば誤差電力が最小となる雑音列(コー
ドベクトル)を決定する既述の誤差電力評価決定部、30
は誤差電力が最小となる雑音列(コードベクトル)を特
定するデータ(符号)で入力音声信号を符号化する音声
符号化部である。この符号器の動作は次のとおりであ
る。
格納しておくだけで、次々と2L−1(=210−1=M
−1)種類のコードベクトルまたは2L(=210=M)種
類のコードベクトルを生成することができ、デルタベク
トル符号帳11の記憶容量をL・N(=10・N)とするこ
とができ、従来の雑音符号帳1の記憶容量M・N(=10
24・N)に比べて著しく減少することができる。
せることができ、従来、フィルタ処理に Np・N・M(=1024・Np・N) 回の積和算が必要であったものを Np・N・L(=10・Np・N) 回の積和算に減少できる。
さらに、誤差電力評価決定部10で誤差電力が最小とな
る雑音列(コードベクトル)を決定し、音声符号化部30
で該コードベクトルを特定する符号を出力することで音
声符号化すると共に、誤差電力が最小となるコードベク
トルを求める処理を、合成フィルタ演算出力 と入力音声信号ベクトル の二乗と合成フィルタ出力の自己相関 の比が最大となるコードベクトルを求めることに帰着 のように漸化式で表現することにより、相互相関RXC
(2K+2),RXC (2K+2)を次式 に示すように漸化式で表現し、相互相関演算部12で1階
層前の相互相関RXC (k)を用いて今回の相互相関RXC
(2k+1),RXC (2k+2)を演算するようにする。このようにす
れば、右辺第2項の相互相関演算を行うだけで全コード
ベクトルのフィルタ出力と入力音声信号 との間の相互相関を演算できる。すなわち、従来相互相
関を求めるのにM・N(=1024・N)回の積和算が必要
であったものが、L・N(=10・N)回の積和算で済ま
すことが可能となり、演算回数を著しく減少できる。
また、自己相関演算部13は、1階層前の自己相関Rcc
(k)を用いて今回の相互相関Rcc (2k+1),Rcc (2k+2)を演算
するようにする。このようにすれば、自己相関Rccを初
期ベクト /2通りの相互相関を用いて演算できる。すなわち、従来
自己相関を求めるのにM・N(=1024・N)回の積和算
が必要であったものが、L(L+1)・N/2(=55・
N)回の積和算で済ますことが可能となり、演算回数を
著しく減少できる。
第12図は第11図の第2実施例を具体的に表す図であ
り、前述のように、11は1つの基準雑音列を表現する初
期ベク 表現されている。すなわち、初期ベクトルおよびデルタ
ベクトルは時系列的に発生するN個のサンプリングされ
た雑音の振幅をそれぞれコード化したN次元のベクトル
である。3は声道特性を模擬したフィルタ演算処理を施
す前述の線形予測合成フィルタ(LPCフィルタ)であ
り、次数NpのIIR(Infinite Impulse Response)型フ
ィルタで構成され、N×Nの正方マトリクスAとコード
ベクトル のマトリクス演算を行って、コードベクトル に合成フィルタ処理を施す。IIR型フィルタのNp個の係
数は入力音声信号 に基づいて変化し、その都度周知の方法で決定される。
すなわち、入力音声信号の隣接サンプルには相関が存在
するから、サンプル間の相関係数を求め、該相関係数か
らパーコール係数と称せられる偏自己相関係数を求め、
該パーコール係数からIIRフィルタのアルファ係数を決
定し、当該フィルタのインパルス応答列を用いてN×N
の正方 記憶部、12は相互相関 を演算する相互相関演算部、13は自己相関 を演算する自己相関演算部、38は相互相関を二乗したも
のと自己相関との比を演算する演算部である。
誤差電力 は前記(3)式で表現されるから、誤差電力を最小にす
るコードベクトル は(3)式の右辺第2項を最大にするものである。した
がって、演算部38は二乗演算部7と除算部9を備え、次
を演算する。
10は既述のように、RXC 2/Rccが最大となる、換言すれ
ば誤差電力が最小となる雑音列(コードベクトル)を決
定する誤差電力評価決定部、30は誤差電力が最小となる
雑音列(コードベクトル)を特定する符号で入力音声信
号を符号化する音声符号化部である。
第13図は第2実施例の特徴をなす木構造配列のデルタ
ベクトルについて説明するための図である。デルタベク
トル符号帳11には、1つの初期ベクトル と(L−1)種類 ようにすれば、各コードベクトルの間の関係が次式 (Iは第1階層、IIは第2階層、IIIは第3階層…XXは
第10階層) により表現され、一般的に のように漸化式で表現できる。すなわち、デルタベクト
ル符号帳11に初期ベクトル と(L−1)種類のデルタベクトル (L=10)を格納しておくだけで、次々と2L(=210
種類の任意の雑音列のコードベクトルを仮想的に生成す
ることができ、デルタベクトル符号帳11の記憶容量をL
・N(=10・N)とすることができ、従来の雑音符号帳
1の記憶容量M・N(=1024・N)に比べて著しく減少
することができる。
上記(16)式および(17)式に一般的に表現されたコ
ードベクトル に対する線形予測合成フィルタ(A)(第12図のフィル
タ3)でのフィルタ処理について次に説明する。
(L=10)とを求めて記憶部31に記憶しておけば、以下
のごとく全雑音列のコードベクトルに対するフィルタ処
理を再帰的に行うことができる。
ることにより2L(=210)の全雑音列のコードベクトル
に対するフィルタ出力を発生できる。
すなわち、本発明の木構造状のデルタベクトル符号帳
11を用いると、上記(18),(19)式より各コードベク
トルに対するフィルタ処理を再帰的に行うことが可能と
なり、 おくだけで、それらを極性(+,−)を切り替えながら
加えあわせて行くことで全ての雑音列のコードベクトル
に対するフィルタ処理が得られる。
実際には、後述するように第2実施例のデルタベクト
ル符号帳11の場合、相互相関RXC、自己相関Rccの演算に
あって、全コードベクトルに対するフィルタ演算出力は
不要であ に帰着させることができる。このため、従来、フィルタ
処理に Np・N・M(=1024・Np・N) 回の積和算が必要であったものを本実施例において N・N・L(=10・Np・N) 回の積和算に減少できる。
次に相互相関RXCの算出について説明する。
に漸化式で表現すると、相互相関RXC (2k+1),RXC (2k+2)
は次式 に示すように漸化式で表現できる。したがって、相互相
関演算部12で1階層前の相互相関RXC (k)を用いて今回の
相互相関RXC (2k+1),RXC (2k+2)を演算することができ
る。このようにすれば、上記(20),(21)式の右辺第
2項の相互相関演算を行うだけで全雑音列のコードベク
トルに対するフィルタ出力と入力音声信号 との間の相互相関を演算できる。すなわち、従来相互相
関を演算するのに M・N(=1024・N) 回の積和算が必要であったものが、第2実施例によれ
ば、 L・N(=10・N) 回の積和算で済ますことが可能となり、演算回数を著し
く減少できる。
なお、第12図において、参照番号6は上記(20),
(21)式の右辺第2項 を演算する乗算部、35は+1,−1を発生する極性付与
部、36は極性±1を乗算してその右辺第2項に極性を付
与する乗算部、15は1つ前の相互相関RXC (k)(右辺第1
項)を所定時間記憶遅延する既述の遅延部、14は上記
(20),(21)式の右辺第1項と第2項の加算を行って
今回の相互相関RXC (2k+1),RXC (2k+2)を出力する既述の
加算部である。
次に自己相関Rccの算出について説明する。
ように漸化式で表現すると、各雑音列のコードベクトル
に対する自己相関Rccは次式で表現される。すなわち、 と表現され、一般に と表現できる。
極性(+,−)を切り替えながら加え合わせることによ
り相互相関Rcc (2k+1),Rcc (2k+2)を演算できる。このよ
うにす 演算できる。すなわち、従来自己相関を演算するのに M・N(=1024・N) 回の積和算が必要であったものが、 L(L+1)・N/2(=55・N) 回の積和算で済ますことが可能となり、演算回数を著し
く減少できる。なお、第12図において、32は上記(2
3),(24)式の右辺第2項の自己相関 を演算する自己相関演算器、33は該(23),(24)式に
おける各相互相関を演算する相互相関演算器、34は各相
互相関を、所定の極性(+,−)を付して加算する相互
相関合成部、16は1階層前の自己相関Rcc (k)と自己相関 および相互相関を加算して(23),(24)式の演算を行
う既述の加算部、17は1階層前の自己相関Rcc (k)を所定
時間記憶して遅延する既述の遅延部である。
最後に第12図の回路全体の動作について説明する。
1に記憶する。
かかる状態で、i=0とし、相互相関演算部12で相互
相関 を演算し、自己相関演算部13で自己相関 としてFmaxを更新すると共に、Fmaxを与える1つのコー
ドベクトルを特定する符号(インデックス)をもってそ
れ迄の符号を更新する。
2i(=20)個のコードベクトルに対して上記処理を行
えばi=1とし、上記(20)式(但し、k=0,i=1)
に従って相互相関を演算し、上記(23)式に従って自己
相関を演算し、これら相互相関と自己相関を用いて演算
部38で上記(14)式を演算する。
としてFmaxを更新すると共に、該Fmaxを与える1つのコ
ードベクトルを特定する符号(インデックス)をもって
それ迄の符号を更新する。
ついで、上記(21)式(但し、k=0,i=1)に従っ
て相互相関を演算し、(24)式に従って自己相関を演算
し、これら相互相関と自己相関を用いて演算部38で上記
(14)式を演算する。
FmaxとしてFmaxを更新すると共に、該Fmaxを与える1
つのコードベクトルを特定する符号(インデックス)を
もってそれ迄の符号を更新する。
2i(=21)個のコードベクトルに対して上記処理を行
えばi=2とし、以上と同様の処理を繰返し、210個の
全コードベクトルに対して上記処理を行えば、音声符号
化部30は誤差電力評価決定部10に記憶されている最新の
符号(インデックス)を入力音声信号に対する音声符号
化情報として出力する。
次に前述した第2実施例の変形に相当する変形第2実
施例について説明する。前述した第2実施例では、初期
ベクトル を保持しておくだけで仮想的に全てのコードベクトルが
再生されるので演算量の減少、さらには符号帳のメモリ
容量の削減に有効である。
ところが、デルタベクトル符号帳11の各ベクトルの成
分について見てみると、上記(15)式で示すように、初
期ベクトルである の成分が全てのベクトルに含まれるのに対し、最下位の
階層の成分である第9番目のデルタベクトル の成分はその半分の512本のベクトルにしか含まれない
(第13図参照)。すなわち、各デルタベクトルが符号帳
11の構成に与える寄与は均等でなく、木構造の配列の上
位の階層を構成するデルタベクトル、例えば、初期ベク
トル 等ほど、多くのコードベクトルにその成分として含ま
れ、符号帳の分布のモードを決定しているといえる。
第14A、14Bおよび14C図は符号帳内に仮想的に形成さ
れるコードベクトルの分布(モードA、モードBおよび
モードC)をそれぞれ表す図である。例えば3つのベク
トル、すなわち について考察すると、これらのベクトルの分布は6通り
(モードA〜モードF)存在する。このうちモードA〜
モードCについてそれぞれ第14A図〜第14C図に表す。図
中、 は、三次元を構成するx軸、y軸およびz軸の各方向の
単位ベクトルをそれぞれ表す。残りのモードD,Eおよび
Fは、各ベクトルに対し次のように単位ベクトルを割り
当てたときに相当する かくして、デルタベクトルとして与えるベクトルの順番
によって、異なるモードの分布を持ったデルタベクトル
符号帳11が存在することが分かる。つまり、デルタベク
トルの順番を、第13図に示すように常に固定的に割り付
けたとすると、常に一定のモードに片寄ったコードベク
トルしか再生できないことになり、ベクトル量子化の対
象となる入力音声信号 に対して必ずしも最適な音声符号化を行っているという
保証はない。すなわち、量子化歪みが増大してしまうお
それがある。
そこで本発明の変形第2実施例では、初期ベクトル およびデルタベクトル として与える合計L本のベクトルの順番を並べ替えるこ
とによって、符号帳11内に仮想的に形成されるコードベ
クトルの分布のモードを調整するようにする。つまり符
号帳の性質を変化させる。
さらに上記のコードベクトルの分布のモードを、符号
化すべき入力音声信号の特性に合わせて調整する。これ
により、再生音声の品質は一層改善される。
この場合、線形予測合成(LPC)フィルタ3の特性に
応じて、フレーム毎にベクトルの並べ替えを行う。この
ようにすると、音声符号化データを受信した側、すなわ
ち復号器側では、符号器側から特別な調整情報を送るこ
となしに、符号器側で行ったのと全く同じ調整(ベクト
ルの並べ替え)をすることができる。
上記のベクトルの並べ替えを行うに当り、初期ベクト
ルおよび各デルタベクトルに対し線形予測合成フィルタ
処理を施して得られるベクトルのフィルタ出力のパワー
を評価し、このパワーがそのフィルタ処理前のパワーに
比べて最も増大しているベクトルから順次、初期ベクト
ル、第1デルタベクトル、第2デルタベクトル…という
順番に並べ替えをするのが具体的な一例である。
上記の並べ替えにおいて、初期ベクトルおよび各デル
タベクトルが線形予測合成フィルタ処理した後に相互に
直交するように、予めこれらベクトルを変換しておく。
これにより符号帳11内に仮想的に形成される各ベクトル
を、超平面(Hyper Prane)上に均一に分布させること
ができる。
また上記の並べ替えにおいて、初期ベクトルおよび各
デルタベクトルのパワーを正規化(normalize)してお
くのが好ましい。これにより各ベクトルのフィルタ出力
が有するパワーを単純に比較するだけで、その並べ換え
ができる。
そして、受信側へ音声符号化情報を送出するに際し、
木構造状のベクトル配列のうち上位の階層に属するベク
トル間の符号間距離(ベクトルのユークリッド距離)の
方が、下位の階層に属するベクトル間の符号間距離の方
よりも大きくなるように、該音声符号化情報の符号を割
り付ける。これは、上位の階層に属するベクトル(初期
ベクトルおよび第1デルタベクトル等)程、受信側で復
号して得た再生音声の品質に大きな影響を与えることに
着目したものである。これにより、受信側に至る伝送路
上で伝送エラーが生じても、再生音声の品質の劣化が小
さく抑えることができる。
第15A、15Bおよび15C図は変形第2実施例に基づくベ
クトルの並べ替えを説明するための図である。第15A図
において、座標の原点を中心とする球体(ハッチング)
けられたとすると、これによって規定される平面は、上
記球体上のC0点における法線を含む平面となる。これは
モードA(第14A図)に相当する。
一様ではなくなり、ある歪みを有する。この様子を示
したのが第15B図であり、同図中の下側に示すような不
等式が成立する場合のベクトル分布を示している。つま
り、線形予測合成フィルタ3を通すことによってある歪
をもった増幅が行われる。
このように線形予測合成フィルタ3の特性Aが、デル
タベクトル符号帳11の構成要素である各ベクトルに対し
て異なる振幅増幅特性を示すので、符号帳11内に仮想的
に形成される全ベクトルをベクトル空間全体に亘って均
等に分布させるよりも不均一にした方がよい。そこで、
どの方向のベクトル成分が最も大きく増幅されるかを調
べ、その方向のベクトル成分の分布を増やしてやれば、
符号帳11に効率よくベクトルを格納することができ、結
果として音声信号の量子化特性が改善されることにな
る。
既に述べたように、木構造のデルタベクトルの分布に
は片寄りがあるが、デルタベクトルの順番を並べ換える
ことで、符号帳11の性質が変えられる。
第15C図を参照すると、第15B図に示すようにフィルタ
処理後のパワーの増幅率が片寄っていた場合、パワーの
大きいデルタベクトル から順に並べ替えを行い、その後、改めて木構造状の配
列に従って、符号帳ベクトルを生成する。このようにし
てできたデルタベクトル符号帳11を用いて符号化を行う
ことにより、前述した第2実施例のように固定的にデル
タベクトルを割り付けて配列するのに比べて再生音声の
品質改善が図れる。
第16図は変形第2実施例に基づく符号帳探索処理の部
分の一例を示す図であり、第15A、15Bおよび15C図に表
した並べ替えを行う一例を示す。これは前述の第12図
(第2変実施例)の構成に変形を加えたものに相当し、
第12図の構成に比べ、第16図ではパワー評価部41とソー
ティング部42が記憶部31に対して共働的に付加されてい
る。パワー評価部41は、線形予測合成フィルタ3でフィ
ルタ処理を施した後の初期ベクトルおよび各デルタベク
トルのパワーを評価する。この評価の結果得られた各ベ
クトルの振幅増幅率の大小に基づいて、ソーティング部
42において、各ベクトルの順番を並べ替える。これらパ
ワー評価部41とソーティング部42を、前述の第14A〜14C
図および第15A図〜第15C図に即して説明すると次のとお
りである。
パワー評価部41 デルタベクトル符号帳11に格納されている各ベクトル に対して線形予測合成フィルタ処理を施して得たベクト
のパワー(電力)を算出する。この際、前述したよう
に、各ベクトルのパワーを予め正規化しておけば(下記
(1)参照)、フィルタ処理後のパワーを直接比較する
ことが、そのまま各ベクトルに対する振幅増幅率の比較
をすることになる(下記(2)参照)。
ソーティング部42 各ベクトルの合成フィルタ(A)による振幅増幅率を
パワー評価部41から受け、増幅率の大きい順に並べ替え
(ソーティング)を行う。この並べ替えにより、増幅率
の大きいものから順に というように新たなデルタベクトルが設定される。以降
の符号化処理は、得られたデルタベクトルによって構成
される木構造状デルタ符号帳11を用いて、第12図の木構
造状デルタ符号帳の場合と全く同様に行われる。以下
に、第15A〜15C図で示した場合についてのソーティング
処理を示す。
上述した第2実施例および変形第2実施例は、既述の
第1実施例の場合と同様、逐次最適化CELP形の音声符号
器および同時最適化CELP形の音声符号器あるいはピッチ
直交変換最適化CELP形の音声符号器等のいずれにも適用
できる。適用の仕方は、第1実施例で詳しく説明した巡
回加算手段20(14,15;16,17;14−1,15−1;14−2,15−
2)を用いるのと同じ手法である。
以下、参考のために上述した各種の形式の音声符号器
について説明しておく。
第17図は逐次最適化CELP形の符号器を示す図、第18図
は同時最適化CELP形の符号器を示す図である。なお、既
に述べた構成要素と同等のものには同一の参照番号ある
いは記号を付して示す。
第17図において、適応符号帳101には1サンプルずつ
ピッチ周期が遅延されたNサンプルに対応するN次元の
ピッチ予測残差ベクトルが格納されており、また符号帳
1には前述のとおり同様のNサンプルに対応するN次元
の雑音列を用いて生成したコードベクトルが2mパターン
だけ予め設定されている。好ましくは、各コードベクト
ルのサンプルデータのうち、その振幅が一定の閾値以下
のサンプルデータ(例えばNサンプルのうちのN/4サン
プル)は0で置き換えられている。このような符号帳を
スペース(間引き)符号帳と呼ぶ。
まず、適応符号帳101の各ピッチ予測残差ベクトル にA=1/A′(z)(但し、A′(z)は聴覚重み付け
線形予測分析フィルタを示す)で示される聴覚重み付け
線形予測合成フィルタ103で聴覚重み付けして生成され
たピッチ予測 により最小の値になるように評価部5がフレーム毎に符
号帳1の中から最適なコードベクトル を選択すると共に最適なゲインgを選択する。
なお、適応符号帳101の適応化は、 を加算部112で求め、これを聴覚重み付け線形予測分析
フィルタ(A′(z))113で に分析し、さらに遅延器114で1フレーム分遅延させた
ものを次のフレームの適応符号帳(ピッチ予測符号帳)
として格納することにより行われる。
このように、第17図に示した逐次最適化CELP形符号器
では、ゲインbとgが別々に制御されるのに対し、第18 すると共に最適なゲインbとgを同時に選択制御するも
のである。
この場合には、上記の(25),(26)式より、 となる。
なお、この場合の適応符号帳101の適応化は、第17図
の加算部112の出力に相当する に対して同様にして行われる。
以上の第17図及び第18図に概念的に示されたゲインb,
gは実際には、第19図および第20に示すようにそれぞれ
のCELP方式において符号帳1のコードベクトル について最適化を行う。
すなわち、第17図の場合には、上記の(26)式におい
て、ベクトル の電力を最小にするためのゲインgを偏微分により求め
ると、 となる。
そこで第19図においては、ピッチ予測誤差信号ベクト
択する。
なお、上記の(26)式を最小とするように各コードベ
クトル に対してゲインgが求められ、このゲインに対する量子
化がオープン・ループで行われるなら、次式、 を最大にすることと等価になる。
また、第18図の場合には、上記の(27)式において、
ベクトル の電力を最小にするためのゲインb,gを偏微分により求
めると、 となる。但し、 である。
そこで第20図においては、聴覚重み付けされた入力音
この場合も、ベクトル の電力を最小にすることは、相関値の比率、 を最大にすることと等価である。
このように、逐次最適化CELP方式の場合には、同時最
適化CELP方式に比べて全体の演算量が少なくて済むが、
符号化された音声の品質は劣化したものとなる。
第21A図は逐次最適化CELP方式の場合におけるゲイン
最適化動作を図解的に表すベクトル図、第21B図は同時
最適化CELP方式の場合におけるゲイン最適化動作を図解
的に表すベクトル図、第21C図はピッチ直交変換最適化C
ELP方式の場合におけるゲイン最適化動作を図解的に表
すベクトル図である。
第21A図の逐次最適化方式の場合には、最適化された
ベクトル を得るには比較的少ない演算量で済むが、このベクトル とは誤差が生じ易く音声の再生品質が悪くなる。
また、第21B図の同時最適化方式は、二次元の場合に
は図示のように となることから、一般に同時最適化方式は逐次最適化方
式に比べて音声の再生品質は良くなるが、上記の(29)
式に示すように演算量が多くなってしまうという問題が
ある。
そこで、本出願人は、このような逐次最適化/同時最
適化CELP形の各音声符号化方式の長所を生かして音声の
再生品質と演算量の両者において満足の行く符号化・復
号化を実現するため、第22図に示すような符号器を既に
特許出願している(特開平4−51199号)。
すなわち、ピッチ周期については従来と同様にピッチ
予測 直交交換すれば第21A図の逐次最適化CELP方式において
も量子化誤差を同時最適化方式と同程度まで減少させる
ことが出来る。
コードベクトルを評価部5が符号帳1から選択し、ゲイ
ンgを選択している。
なお、符号帳探索時のフィルタ演算量を削減するため
に、符号帳として白色雑音の雑音列からなり、サンプル
値としてゼロを多く挿入したスパース化雑音符号帳を用
いるのが好ましい。この他にも、コードベクトル同士が
オーバーラップしているオーバーラップ符号帳等を用い
ることができる。
第23図は第1実施例のもとでの符号帳探索処理の部分
をさらに別の例をもって具体的に示す図であり、上述し
たピッチ直交交換最適化CELP形の音声符号器に適用した
場合を示す。この場合にも本発明は何の支障もなく適用
される。
この第23図は、第9図に示した構成に第10図の自己相
関演算部13を組み合わせた一例を示している。また第9
図に示した演算手段19′は第6図の演算手段19と同様に
転置マトリクスATにより構成することができるが、この
例では時間反転型のフィルタで構成されている。
本図の自己相関演算部60は、演算部60a〜60eで構成さ
れており、演算部60aでは演算手段19′と同様にして入
力信号である最適時の聴覚重み付けされたピッチ予測残 ここで、変換部71における時間反転したハウス・ホルダ
ー変換HTについて説明する。
まず、第24A図および第24B図を用いてハウス・ホル となる。
この(30)式において、 とすると、 となる。
一方、 であるから、(31)式は、 となる。したがって、 となり、これはHと同じである。
したがって、変換部71の入力ベクトル を例えば と置くと、 となり、図示のような演算構成となる。なお、図中、○
で示した箇所はベクトル演算を表し、△で示した箇所は
スカラー演算を表している。
直交変換方法としては、この他にグラム・シュミット
法等も既に知られている手法である。
そして、このベクトル に符号帳11からのデルタベクトル を乗算部65で乗算すると、 なる相関値が得られ、これを巡回加算部67(巡回加算手
段20)で巡回的に加算することにより が評価部5に送られることになる。
これに対し、演算部60cでは、入力ベクトル から直交変換マトリクスHおよび時間反転直交変換マト
リクスHTを求め、これにさらにFinite Impulse Respons
e(FIR)聴覚重み付けフィルタマトリクスAを組み込ん
で演算手段70と変換部71とによる時間反転聴覚重み付け
直交変換マトリクスAHの自己相関マトリクスG=(AH)
TAHをフレーム毎に生成しておく。
そして、このようにして求めた自己相関マトリクスG
=(AH)TAHを第10図に示したように演算部60dに記憶し
ておき、この演算部60dに符号帳11からのデルタベクト
が与えられたときに、 が得られ、これを巡回加算部60e(巡回加算手段20)で 関値を求めることができ、評価部5に送られる。
このように評価部5に送られる2つの相関値に基づい
て最適なデルタベクトルとゲインとを選択することがで
きる。
最後に、本発明の第1実施例および第2実施例によっ
て得られる利益について数値例をもって説明する。
第25図は本発明に係る第1実施例によって演算量を減
少させることができることを示す図である。同図の
(a)欄は逐次最適化CELP形の符号器の場合であって、
雑音符号帳として (1)従来の4/5スパース符号帳、 (2)従来のオーバーラップ符号帳、 (3)本発明に係る第1実施例に基づくデルタベクトル
符号帳、 をそれぞれ用いた場合の演算量を示している。
第25図中のNはサンプル数、Npはフィルタ3の次数で
ある。また、演算量を算出する対象は種々あるが、符号
器の中で極めて膨大な演算を必要とする、フィルタ処
理演算、相互相関演算および自己相関演算の3種の
みを対象として示す。
具体的にサンプル数NをN=10とすると、合計演算量
は同図の右端に示すように、従来例(1)で432K積和
算、従来例(2)で84K積和算である。これに対し、第
1実施例によれば28K積和算と大幅に減少している。
第25図の(b)欄および(c)欄はそれぞれ同時最適
化CELP形の符号器およびピッチ直交変換最適化CELP形の
符号器の場合であり、(a)欄の場合と全く同様に3種
の符号帳を用いた各ケースについて演算量を算出してい
る。いずれにしても本発明に係る第1実施例を適用した
場合には、30K積和算あるいは28K積和算と大幅に演算量
が減少していることが分かる。
第26図は本発明に係る第2実施例によって演算量を減
少させると共にメモリ量を削減できることを示す図であ
る。本図の(a)欄は演算量について、(b)欄は雑音
符号帳のメモリー量についてそれぞれ示す。
各コードベクトルのサンプル数Nは標準的なN=40と
する。また符号帳のサイズMとしては、従来方式におい
て標準的なM=1024とし、これに対して本発明の第2実
施例ではサイズMがM=Lに減少し、具体的にはL=10
とした、このLは第11図の上方に示した階層の数1,2,3
…Lと同じである。
いずれにしても演算量の合計で見ると、従来方式が48
0K積和算(96Mops)を要するに対し、本発明の第2実施
例では6.6K積和算(1.3Mops)と約1/70に激減してい
る。
さらに第26図のメモリー量((b)欄)について見る
と、1/100に激減している。
また前記の変形第2実施例においても、演算量の大半
を占めるフィルタ処理演算、自己相関演量および相互相
関演算の総演算量は第26図に示した値と同様激減する。
かくのごとく、本発明の第1実施例によれば、雑音符
号帳が格納すべきコードベクトルとして、隣接コードベ
クトル間の差分ベクトル(デルタベクトル)を採用す
る。この結果、演算量は従来よりも一層減少する。
そして本発明の第2実施例では、上記第1実施例にさ
らに改良を加えており、 (i)従来、フィルタ処理にNp・N・M(=1024・Np
N)回の積和算が必要であったものをN・N・L(=10
・Np・N)回の積和算に減少でき、 (ii)容易に誤差電力が最小となるコードベクトルを求
めることができ、 (iii)従来相互相関を演算するのにM・N(=1024・
N)回の積和算が必要であったものが、L・N(=10・
N)回の積和算で済ますことが可能となって、演算回数
を著しく減少でき、 (iv)従来自己相関を演算するのにM・N(=1024・
N)回の積和算が必要であったものが、L(L+1)・
N/2(=55・N)回の積和算で済ますことが可能となっ
て、演算回数を著しく減少でき、 (v)メモリー容量を大幅に削減できる。
また変形第2実施例によれば、さらに加えて再生音声
の品質を向上できる。
〔産業上の利用分野〕
例えば携帯電話や自動車電話における送信系、特に入
力音声をディジタルデータとして受信系に送信するため
音声符号器に応用することができる。
フロントページの続き (51)Int.Cl.7 識別記号 FI // G10L 101:10 (72)発明者 大田 恭士 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 栗原 秀明 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 田中 良紀 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 坂井 良広 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (56)参考文献 特開 平5−158500(JP,A) 米国特許5323486(US,A) 欧州特許500961(EP,B1) Proceedings of IE EE 1992 Internationa l Conference on Ac oustics,Speech and Signal Processin g,Vol.1,T.Taniguch i et al,”Tree−Stru ctured Delta Codeb ook for an Efficie nt Implementation of CELP”p.I−325〜I− 328,March 23−26,1992 Proceedings of 1991 IEEE Internationa l Symposium on Cir cuits and Systems, Vol.1,T.Taniguchi et al,”Improving t he Performance of CELP−Based Speech Coding at Low Bit Rates”,p.590−593,11−14 June 1991 Proceedings of IE EE 1991 Internationa l Conference on Ac oustics,Speech and Signal Processin g,Vol.1,T.Taniguch i et al,”Pitch Sha rpening for Percep tually Improved CE LP,and the Sparse− Delta Codebook for Reduced Computati on”p.241−244,May 14−17, 1991 (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 13/08 G10L 19/00 - 21/06 INSPEC(DIALOG) JICSTファイル(JOIS)

Claims (18)

    (57)【特許請求の範囲】
  1. 【請求項1】複数の雑音列をコードベクトル として格納する雑音符号帳を記憶する記憶手段と、該記
    憶手段から順次読み出した各該コードベクトルに対し声
    道特性を模擬した線形予測合成フィルタ処理を施して得
    られた再生信号と、入力音声信号との間の誤差が最小と
    なるような1つのコードベクトルを求めるための評価演
    算を行う評価演算手段と、を有し、当該コードベクトル
    を特定する符号を用いてその入力音声信号を符号化する
    音声符号化方式において、 前記記憶手段に記憶される前記雑音符号帳を、初期ベク
    トル と、隣接する前記コードベクトル間の差分ベクトルを全
    てのコードベクトルについて求めることによって得た複
    数のデルタベクトル と、を格納するデルタベクトル符号帳(11)によって構
    成すると共に、 前記デルタベクトルを巡回的に加算することによって、
    仮想的に前記コードベクトル を再生する巡回加算手段(20)を設けることを特徴とす
    る音声符号化方式。
  2. 【請求項2】各前記デルタベクトルが、N(Nは2以上
    の自然数)個の時系列的なサンプルデータからなるN次
    元ベクトルであって、N個の該サンプルデータのうち数
    個のサンプルデータが有意義データ(Δ1,Δ2,Δ3,Δ
    4)であって、残りは全てデータ零からなるスペース化
    ベクトルである請求項1に記載の音声符号化方式。
  3. 【請求項3】前記記憶手段に記憶される前記雑音符号帳
    内の前記スペース化ベクトルは、前記コードベクトル を、隣接するコードベクトル間の差分ベクトルが小さく
    なるように並べ替え、並べ替えた該コードベクトルにつ
    いて、各隣接するコードベクトル間の差分ベクトルを求
    めることにより得られたスペース化ベクトルである請求
    項2に記載の音声符号化方式。
  4. 【請求項4】前記巡回加算手段(20)を、前記評価演算
    手段の一部として設ける請求項1に記載の音声符号化方
    式。
  5. 【請求項5】前記巡回加算手段(20)が、演算データを
    加算する加算部(14,14−1,14−2)と、該加算部の出
    力に遅延を与えて該加算部の1つの入力に戻す遅延部
    (16,16−1,16−2)とからなり、該遅延部に前回の演
    算結果を保持しておいて、次に与えられる前記デルタベ
    クトルを入力として、該演算結果を累積的に更新する請
    求項4に記載の音声符号化方式。
  6. 【請求項6】複数の前記デルタベクトル を、木構造状に配列された(L−1)種類のデルタベク
    トルによって表し、ここにLは、前記初期ベクトル を頂点とする該木構造を構成する階層の総数である請求
    項1に記載の音声符号化方式。
  7. 【請求項7】再生される前記コードベクトルは、前記
    (L−1)種類のデルタベクトルを、前記階層毎に、前
    記初期ベクトル から順次、加え合わせまたは差し引いて仮想的に得た
    (2L−1)種類のコードベクトルである請求項6に記載
    の音声符号化方式。
  8. 【請求項8】前記雑音符号帳に格納された2L種類の前記
    コードベクトルと同数のコードベクトルを再現するため
    に、前記(2L−1)種類のコードベクトルに零ベクトル
    を付加する請求項7に記載の音声符号化方式。
  9. 【請求項9】前記雑音符号帳に格納された2L種類の前記
    コードベクトルと同数のコードベクトルを再現するため
    に、前記(2L−1)種類のコードベクトルに、前記初期
    ベクトル を付加する請求項7に記載の音声符号化方式。
  10. 【請求項10】前記巡回加算手段(20)を、前記評価演
    算手段の一部として設ける請求項6に記載の音声符号化
    方式。
  11. 【請求項11】前記評価演算手段での前記評価演算に、
    相互相関演算と、線形予測合成フィルタ演算とを含み、
    その合成フィルタ演算出力 を、1階層前の合成フィルタ演算出力と今回のデルタベ
    クトルとを用いて漸化式で表現することにより、前記相
    互相関演算を漸化式で表現して演算する請求項10に記載
    の音声符号化方式。
  12. 【請求項12】前記評価演算に自己相関演算を含み、前
    記合成フィルタ演算出力 を、1階層前の合成フィルタ演算出力と今回のデルタベ
    クトルとを用いて漸化式で表現することにより、前記自
    己相関演算を、前記初期ベクトル の合成フィルタ演算出力と、前記(L−1)種類のデル
    タベクトルのフィルタ演算出力の合計L通りの自己相関
    と、各前記合成フィルタ演算出力間の(L2−1)/2通り
    の相互相関を用いて演算する請求項11に記載の音声符号
    化方式。
  13. 【請求項13】前記初期ベクトル および前記(L−1)種類の各デルタベクトル の、前記木構造状の配列における順番を、前記入力音声
    信号の特性に合わせて変更し、該初期ベクトルおよびデ
    ルタベクトルの並べ替えを行う請求項6に記載の音声符
    号化方式。
  14. 【請求項14】前記評価演算の1つである線形予測合成
    フィルタ演算を行うためのフィルタ(3)の特性に応じ
    て、フレーム毎に、前記初期ベクトルおよびデルタベク
    トルの並べ替えを行う請求項13に記載の音声符号化方
    式。
  15. 【請求項15】前記フィルタ(3)から得られる前記再
    生信号のパワーを前記評価演算において評価し、そのパ
    ワーが当該フィルタ処理の前におけるパワーに比べて最
    も増大しているベクトルから順次、 という順番で、前記のベクトルの並べ替えを行う請求項
    14に記載の音声符号化方式。
  16. 【請求項16】前記初期ベクトル が、前記フィルタ処理の後に相互に直交するように予め
    変換し、前記デルタベクトル符号帳(11)内の全てのベ
    クトルを超平面上に均一に分布せしめる請求項15に記載
    の音声符号化方式。
  17. 【請求項17】前記パワーを正規化して得た正規化パワ
    ーによって、前記のパワーの大小比較を行う請求項15に
    記載の音声符号化方式。
  18. 【請求項18】前記コードベクトルを特定する前記符号
    を割り付けるに際し、前記木構造状のベクトル配列にお
    いて上位の前記階層に属する符号間距離の方が、下位の
    前記階層に属する符号間距離の方よりも大きくなるよう
    に、該符号を割り付ける請求項13に記載の音声符号化方
    式。
JP03515016A 1990-09-14 1991-09-17 音声符号化方式 Expired - Fee Related JP3112681B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP24417490 1990-09-14
JP2-244174 1990-09-14
JP3-127669 1991-05-30
JP3127669A JPH04352200A (ja) 1991-05-30 1991-05-30 音声符号化方式
PCT/JP1991/001235 WO1992005541A1 (fr) 1990-09-14 1991-09-17 Systeme de codage de la parole

Publications (1)

Publication Number Publication Date
JP3112681B2 true JP3112681B2 (ja) 2000-11-27

Family

ID=26463564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03515016A Expired - Fee Related JP3112681B2 (ja) 1990-09-14 1991-09-17 音声符号化方式

Country Status (6)

Country Link
US (1) US5323486A (ja)
EP (1) EP0500961B1 (ja)
JP (1) JP3112681B2 (ja)
CA (1) CA2068526C (ja)
DE (1) DE69129329T2 (ja)
WO (1) WO1992005541A1 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3077944B2 (ja) * 1990-11-28 2000-08-21 シャープ株式会社 信号再生装置
DE69131779T2 (de) * 1990-12-21 2004-09-09 British Telecommunications P.L.C. Sprachcodierung
US5671327A (en) * 1991-10-21 1997-09-23 Kabushiki Kaisha Toshiba Speech encoding apparatus utilizing stored code data
US5864650A (en) * 1992-09-16 1999-01-26 Fujitsu Limited Speech encoding method and apparatus using tree-structure delta code book
IT1257431B (it) * 1992-12-04 1996-01-16 Sip Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi
CA2102080C (en) * 1992-12-14 1998-07-28 Willem Bastiaan Kleijn Time shifting for generalized analysis-by-synthesis coding
JP2591430B2 (ja) * 1993-06-30 1997-03-19 日本電気株式会社 ベクトル量子化装置
JP2626492B2 (ja) * 1993-09-13 1997-07-02 日本電気株式会社 ベクトル量子化装置
US5462879A (en) * 1993-10-14 1995-10-31 Minnesota Mining And Manufacturing Company Method of sensing with emission quenching sensors
EP0657874B1 (en) * 1993-12-10 2001-03-14 Nec Corporation Voice coder and a method for searching codebooks
JPH07168913A (ja) * 1993-12-14 1995-07-04 Chugoku Nippon Denki Software Kk 文字認識システム
JP3119063B2 (ja) * 1994-01-11 2000-12-18 富士通株式会社 符号情報処理方式並びにその符号装置及び復号装置
JP2956473B2 (ja) * 1994-04-21 1999-10-04 日本電気株式会社 ベクトル量子化装置
US5704003A (en) * 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
EP0856185B1 (en) * 1995-10-20 2003-08-13 America Online, Inc. Repetitive sound compression system
AU767779B2 (en) * 1995-10-20 2003-11-27 Facebook, Inc. Repetitive sound compression system
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
JP3680380B2 (ja) * 1995-10-26 2005-08-10 ソニー株式会社 音声符号化方法及び装置
JP3970327B2 (ja) * 1996-02-15 2007-09-05 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴイ 複雑さが軽減された信号送信システム
TW317051B (ja) * 1996-02-15 1997-10-01 Philips Electronics Nv
US6038528A (en) * 1996-07-17 2000-03-14 T-Netix, Inc. Robust speech processing with affine transform replicated data
US6192336B1 (en) * 1996-09-30 2001-02-20 Apple Computer, Inc. Method and system for searching for an optimal codevector
US6161086A (en) * 1997-07-29 2000-12-12 Texas Instruments Incorporated Low-complexity speech coding with backward and inverse filtered target matching and a tree structured mutitap adaptive codebook search
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US6556966B1 (en) * 1998-08-24 2003-04-29 Conexant Systems, Inc. Codebook structure for changeable pulse multimode speech coding
US6173257B1 (en) * 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6714907B2 (en) 1998-08-24 2004-03-30 Mindspeed Technologies, Inc. Codebook structure and search for speech coding
US6823303B1 (en) * 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6212496B1 (en) 1998-10-13 2001-04-03 Denso Corporation, Ltd. Customizing audio output to a user's hearing in a digital telephone
US6850884B2 (en) * 2000-09-15 2005-02-01 Mindspeed Technologies, Inc. Selection of coding parameters based on spectral content of a speech signal
US6842733B1 (en) 2000-09-15 2005-01-11 Mindspeed Technologies, Inc. Signal processing system for filtering spectral content of a signal for speech coding
CN1202514C (zh) * 2000-11-27 2005-05-18 日本电信电话株式会社 编码和解码语音及其参数的方法、编码器、解码器
US7693707B2 (en) * 2003-12-26 2010-04-06 Pansonic Corporation Voice/musical sound encoding device and voice/musical sound encoding method
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61237519A (ja) * 1985-04-12 1986-10-22 Mitsubishi Electric Corp フレ−ム間適応ベクトル量子化符号化装置
JPS63240600A (ja) * 1987-03-28 1988-10-06 松下電器産業株式会社 ベクトル量子化方法
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
EP0331857B1 (en) * 1988-03-08 1992-05-20 International Business Machines Corporation Improved low bit rate voice coding method and system
JPH0365822A (ja) * 1989-08-04 1991-03-20 Fujitsu Ltd ベクトル量子化符号器及びベクトル量子化復号器
US5144671A (en) * 1990-03-15 1992-09-01 Gte Laboratories Incorporated Method for reducing the search complexity in analysis-by-synthesis coding

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Proceedings of 1991 IEEE International Symposium on Circuits and Systems,Vol.1,T.Taniguchi et al,"Improving the Performance of CELP−Based Speech Coding at Low Bit Rates",p.590−593,11−14 June 1991
Proceedings of IEEE 1991 International Conference on Acoustics,Speech and Signal Processing,Vol.1,T.Taniguchi et al,"Pitch Sharpening for Perceptually Improved CELP,and the Sparse−Delta Codebook for Reduced Computation"p.241−244,May 14−17,1991
Proceedings of IEEE 1992 International Conference on Acoustics,Speech and Signal Processing,Vol.1,T.Taniguchi et al,"Tree−Structured Delta Codebook for an Efficient Implementation of CELP"p.I−325〜I−328,March 23−26,1992

Also Published As

Publication number Publication date
CA2068526C (en) 1997-02-25
DE69129329D1 (de) 1998-06-04
WO1992005541A1 (fr) 1992-04-02
CA2068526A1 (en) 1992-03-15
EP0500961A4 (ja) 1995-01-11
DE69129329T2 (de) 1998-09-24
US5323486A (en) 1994-06-21
EP0500961A1 (en) 1992-09-02
EP0500961B1 (en) 1998-04-29

Similar Documents

Publication Publication Date Title
JP3112681B2 (ja) 音声符号化方式
US5327519A (en) Pulse pattern excited linear prediction voice coder
US5717824A (en) Adaptive speech coder having code excited linear predictor with multiple codebook searches
US4868867A (en) Vector excitation speech or audio coder for transmission or storage
CA2430111C (en) Speech parameter coding and decoding methods, coder and decoder, and programs, and speech coding and decoding methods, coder and decoder, and programs
WO2001020595A1 (en) Voice encoder/decoder
KR19980080463A (ko) 코드여기 선형예측 음성코더내에서의 벡터 양자화 방법
JPH04264500A (ja) 音声信号伝送方法および音声信号伝送装置
JPH0771045B2 (ja) 音声符号化方法、音声復号方法、およびこれらを使用した通信方法
US5864650A (en) Speech encoding method and apparatus using tree-structure delta code book
JP3531935B2 (ja) 音声符号化方法及び装置
KR100465316B1 (ko) 음성 부호화기 및 이를 이용한 음성 부호화 방법
US20040039567A1 (en) Structured VSELP codebook for low complexity search
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JPH0784600A (ja) ベクトル量子化装置
JP2943983B1 (ja) 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳
JP3071012B2 (ja) 音声伝送方式
Xydeas et al. Theory and Real Time Implementation of a CELP Coder at 4.8 and 6.0 kbits/second Using Ternary Code Excitation
JP3233184B2 (ja) 音声符号化方法
JP3192051B2 (ja) 音声符号化装置
JP3489748B2 (ja) 音声符号化装置及び音声復号化装置
JP2947788B1 (ja) 音声および音響信号の高速な符号化方法および装置および記録媒体
GB2199215A (en) A stochastic coder
Atal Speech coding: recognizing what we do not hear in speech
JP4228630B2 (ja) 音声符号化装置および音声符号化プログラム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080922

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080922

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090922

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees