JP2979943B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP2979943B2
JP2979943B2 JP5342140A JP34214093A JP2979943B2 JP 2979943 B2 JP2979943 B2 JP 2979943B2 JP 5342140 A JP5342140 A JP 5342140A JP 34214093 A JP34214093 A JP 34214093A JP 2979943 B2 JP2979943 B2 JP 2979943B2
Authority
JP
Japan
Prior art keywords
speech
signal
code
impulse response
autocorrelation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5342140A
Other languages
English (en)
Other versions
JPH07168596A (ja
Inventor
慶一 舟木
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP5342140A priority Critical patent/JP2979943B2/ja
Priority to EP94119543A priority patent/EP0658877A2/en
Priority to CA002137880A priority patent/CA2137880A1/en
Publication of JPH07168596A publication Critical patent/JPH07168596A/ja
Application granted granted Critical
Publication of JP2979943B2 publication Critical patent/JP2979943B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声符号化方式に関
し、より詳細には、音声信号を低いビットレート、特に
8〜4kb/s程度で高品質に符号化するための音声符号化
装置に関する。
【0002】
【従来の技術】近時、無線を媒介にした自動車電話やコ
ードレス電話のディジタル化が急がれている。無線では
使用できる周波数帯域が少ないため、音声信号を低ビッ
トレートで、すなわち少ないビット数に圧縮して、高品
質且つ高能率に符号化する方式の開発は重要である。
【0003】音声信号を8〜4kb/s程度の低いビットレ
ートで符号化する方式として、例えば、米国のアタル(A
tal)らによるアイキャスプ(ICASSP)プロシーディング
記載の「コードエキサイテッド リニア プレディクシ
ョン:ハイクオリティ スピーチ アト ロー ビット
レーツ」(M. Schroeder and B. S. Atal, “C
ode-excited liear prediction: High quality speec
h at low bit rates”, ICASSP proc.85, pp.937
-940, 1985)と題された論文(以下「文献1」という)
等に記載されるCELP(Code Excited LPC Cod
ing)が知られている。
【0004】この方法において、送信側では次の手順で
符号化処理が行われる。先ずフレーム毎(例えば20m
s)に音声信号から音声の周波数特性を表すスペクトル
パラメータを抽出する(短期予測)。
【0005】次にフレームをさらに小区間のサブフレー
ム(例えば5ms)に分割する。サブフレーム毎に過去の
音源信号から長区間相関(ピッチ相関)を表すピッチパ
ラメータを抽出し、ピッチパラメータによりそのサブフ
レームの音声信号を長期予測する。
【0006】次に、予め用意された種類の量子化符号で
ある雑音信号(コードベクトル)から抽出したコードベ
クトルによる合成信号と、長期予測により求められた残
差信号との誤差電力が最小になるコードベクトルとゲイ
ンを決定する。そして、決定されたコードベクトルの種
類を表すインデクスとゲイン、及びスペクトルパラメー
タとピッチパラメータが伝送される。
【0007】具体的な量子化符号の探索法は次の手順で
行われる。先ず、入力された音声信号x[n]に対し聴感上
の重み付け、及び過去の影響信号の減算を行った信号z
[n]を算出する。
【0008】次に、短期予測で求められ、量子化、逆量
子化されたスペクトルパラメータで構成される合成フィ
ルタHを量子化符号jのコードベクトルej[n]により駆
動した合成信号Hej[n]を算出する。
【0009】そして信号z[n]と合成信号Hej[n]の誤差
エネルギーを表す次式のEjが最小になる量子化符号j
を求める。
【0010】
【数1】
【0011】ここに、Nsはサブフレーム長を、Hは合
成フィルタを実現する行列を表す。実際には式(1)は、
次式のように展開される。
【0012】
【数2】
【0013】上式(2)の第2項の分子Cjは相互相関、分
母Gjは自己相関であり、それぞれ次式(3),(4)で算出
される。
【0014】
【数3】
【0015】上記自己相関と相互相関は、合成フィルタ
の駆動すなわちフィルタリングによりHej[n]を算出し
た後に計算される。この場合、フィルタリング処理をコ
ードブックサイズ分だけ実行する。このため、処理する
1フレームに対する演算量(積和の回数)は次式のよう
に膨大なものとなる。
【0016】(M・N+N+N)・2B
(5)
【0017】ここに、Mは合成フィルタの次数、Nはフ
レーム長、Bは音源のビット数を表す。
【0018】そこで、演算量を低減化してコードを求め
る方法として、例えば、米国のトランスコとアタルによ
るアイキャスプ(ICASSP)プロシーディング記載の「エ
フィシエント プロセジャーズ フォー ファインディ
ング ザ オプチマム イノベーション イン ストキ
ャステック コーダーズ」(I.M.Transco, B.S Atal,
“EFFICIENT PROCEDURES FOR FINDING THE OPTIMUM INN
OVATION IN STOCASTIC CODERS”, ICASSP, pp.2375, 19
86)と題した論文(以下「文献2」という)等に記載さ
れている、逆方向フィルタリングによる相互相関の算
出、自己相関近似法による自己相関の算出による方法が
よく知られている。
【0019】この方法では、相互相関と自己相関を次の
ように求めている。相互相関を算出する場合、先ず最初
に、次式で表される値を算出する。この処理を逆方向フ
ィルタリングという。
【0020】
【数4】
【0021】ここに、h[n]は合成フィルタのインパルス
応答を表す。相互相関は上式(6)の値を用いて次式(7)で
算出される。
【0022】
【数5】
【0023】この場合、フィルタリング処理は合成フィ
ルタのインパルス応答の算出と上式(6)で1回行うのみ
であり、相互相関算出の積和演算量はフレーム当たり次
式(8)のようになる。
【0024】
【数6】
【0025】また、自己相関関数は、文献2に記載され
ているように次式の近似式により算出される。
【0026】
【数7】
【0027】ここに、hh[i]は合成フィルタのインパル
ス応答のi次の自己相関関数、Rj[i]はコードベクトル
ej[n]のi次自己相関関数で、Iは合成フィルタのイン
パルス応答の次数である。
【0028】次数Iは合成フィルタのインパルス応答の
減衰を考慮して21程度の値に設定される。なお、合成フ
ィルタの伝達関数は一般に1/A(Z)の全極型で表わ
されるが、演算量の削減のため有限次数のインパルス応
答(例えば次数21)で近似されている。また、sfはサブ
フレーム数を表す。
【0029】予めインパルス応答の自己相関関数を算出
し、各音源毎に自己相関関数をデータROMとして格納
しておくことにより、フィルタリング処理を行なうこと
なく低演算量で自己相関関数の算出が可能になる。この
方法では自己相関は次の積和演算量で算出される。
【0030】
【数8】
【0031】したがって、上式(7),(9)により積和演算
量は次式(11)のようになる。
【0032】
【数9】
【0033】フレーム長N=240、サブフレーム長Ns
60、サブフレーム数sf=4、インパルス応答長I=21、
合成フィルタリングの次数M=10、コードブックサイズ
をB=7ビットにすると、上式(5)で表される従来の積
和演算量と、相互相関と自己相関が上式(8)と上式(10)
で表される文献2の方法による積和演算量は表1のよう
になる。
【0034】
【表1】
【0035】ここに、MOPSとは、Million Operat
ions Per Secondを表し、一秒間当たりの積和演算の
演算量(100万回を単位とする)を示している。
【0036】表1に示すように、文献2の近似方法によ
れば、積和演算量は従来のものと比較して相当(すなわ
ち一桁近く)低減されていることがわかる。
【0037】
【発明が解決しようとする課題】しかし、上記の方法で
演算量を低減化してもまだ演算量は多く、このような多
量の演算を実時間処理ができるプロセッサは限られてく
る。
【0038】また、音源の自己相関関数をデータROM
内に格納した音源コードブックを探索する場合、上記の
方法で演算量は少なくなるが、適応コードブックのよう
に符号化するサブフレーム毎に音源が変化するコードブ
ックの場合、コード毎に自己相関関数を算出しなければ
ならないため、次式で表される積和演算回数が更に必要
とされる。
【0039】
【数10】
【0040】この上式(12)は、表1と同じ条件で、17.9
2MOPS必要になり、従来のコードベクトル毎にフィ
ルタリングを行なう方法よりも演算量が多くなってしま
う。このため、文献2の近似法を用いることはできず、
実時間処理は困難である。
【0041】従って、本発明の目的は、上述した問題点
を解決し、4kb/sでも良好な音質の音声符号化方式を低
演算量で実現することにある。
【0042】
【課題を解決するための手段】前記目的を達成するた
め、本発明は、第1の視点において、音声信号の一定区
間毎に該音声信号の周波数特性を表す短期予測パラメー
タの符号を決定する音声分析部と、前記短期予測パラメ
ータより生成される音声合成フィルタのインパルス応答
を算出するインパルス応答算出部と、前記音声信号を前
記インパルス応答を用いて逆方向にフィルタリングする
逆方向フィルタ部と、過去の音声符号化区間で生成され
た前記音声合成フィルタの入力信号を蓄積する適応コー
ドブックと、前記適応コードブックより音声信号のピッ
チ相関を表す長期予測音源を生成する長期予測音源生成
部と、前記音声信号と前記長期予測音源を入力とする音
声合成フィルタの出力信号の相互相関を算出する相互相
関演算部と、前記音声合成フィルタのインパルス応答の
自己相関関数を前記インパルス応答長未満の次数Ismal
lまで算出するインパルス応答の自己相関関数算出部
と、前記長期予測音源の自己相関関数を前記音声合成フ
ィルタのインパルス応答長未満の次数Ismallまで算出
する長期予測音源の自己相関関数算出部と、前記2種類
の自己相関関数から前記インパルス応答長未満の次数I
smallで前記出力信号の自己相関を算出する自己相関算
出部と、前記自己相関と前記相互相関を用いて誤差エネ
ルギーを算出する評価関数算出部と、前記評価関数に基
づき最適な長期予測符号を決定する最適コード決定部
と、長期予測後の残差信号を示す量子化符号と音源信号
からなる音源コードブックと、前記音源コードブックか
ら最適な量子化符号を決定する音源コードブック探索部
と、を有することを特徴とする音声符号化装置を提供す
る。
【0043】本発明は、第2の視点において、音声信号
の一定区間毎に該音声信号の周波数特性を表す短期予測
パラメータの符号を決定する音声分析部と、過去の音声
符号化区間で生成された前記音声合成フィルタの入力信
号を蓄積する適応コードブックと、前記適応コードブッ
クより最適な符号を決定する適応コードブック探索部
と、前記短期予測パラメータより生成される音声合成フ
ィルタのインパルス応答を算出するインパルス応答算出
部と、前記音声合成フィルタのインパルス応答の自己相
関関数をインパルス応答長未満の次数Ismallまで算出
するインパルス応答の自己相関関数算出部と、長期予測
後の残差信号を示す量子化符号と音源信号からなる音源
コードブックと、前記音源コードブックよりコードベク
トルを生成するコードベクトル生成部と、前記コードベ
クトルの自己相関関数を前記インパルス応答長未満の次
数Ismallまで求めるコードベクトルの自己相関関数生
成部と、前記音声信号を前記インパルス応答を用いて逆
方向にフィルタリングする逆方向フィルタ部と、前記音
声信号と前記コードベクトルを入力とする音声合成フィ
ルタの出力信号の相互相関を算出する相互相関算出部
と、前記2種類の自己相関関数から前記インパルス応答
長未満の次数Ismallで前記出力信号の自己相関を算出
する自己相関算出部と、前記自己相関と前記相互相関を
用いて誤差エネルギーを算出する評価関数の算出部と、
前記評価関数を用いて最適なコードベクトルを決定する
最適コード決定部と、を有することを特徴とする音声符
号化装置を提供する。
【0044】本発明は、第3の視点において、音声信号
の一定区間毎に該音声信号の周波数特性を表す短期予測
パラメータの符号を決定する音声分析部と、前記短期予
測パラメータより生成される音声合成フィルタのインパ
ルス応答を算出するインパルス応答算出部と、前記音声
信号を前記インパルス応答を用いて逆方向にフィルタリ
ングする逆方向フィルタ部と、過去の音声符号化区間で
生成された前記音声合成フィルタの入力信号を蓄積する
適応コードブックと、前記適応コードブックより音声信
号のピッチ相関を表す長期予測音源を生成する長期予測
音源生成部と、前記音声信号と前記長期予測音源を入力
とする前記音声合成フィルタの出力信号の相互相関を算
出する相互相関演算部と、前記相互相関を用いて最適な
長期予測符号を決定する最適コード決定部と、長期予測
後の残差信号を示す量子化符号と音源信号からなる音源
コードブックと、前記音源コードブックから最適な量子
化符号を決定する音源コードブック探索部と、を有する
ことを特徴とする音声符号化装置を提供する。
【0045】本発明は、第4の視点において、音声信号
の一定区間毎に該音声信号の周波数特性を表す短期予測
パラメータの符号を決定する音声分析部と、過去の音声
符号化区間で生成された前記音声合成フィルタの入力信
号を蓄積する適応コードブックと、前記適応コードブッ
クより最適な符号を決定する適応コードブック探索部
と、前記短期予測パラメータより生成される音声合成フ
ィルタのインパルス応答を算出するインパルス応答算出
部と、長期予測後の残差信号を示す量子化符号と音源信
号からなる音源コードブックと、前記音源コードブック
よりコードベクトルを生成するコードベクトル生成部
と、前記音声信号を前記インパルス応答を用いて逆方向
にフィルタリングする逆方向フィルタ部と、前記音声信
号と前記コードベクトルを入力とする音声合成フィルタ
の出力信号の相互相関を算出する相互相関算出部と、前
記相互相関を用いて最適なコードベクトルを決定する最
適コード決定部と、を有することを特徴とする音声符号
化装置を提供する。
【0046】本発明は、上記第1、第2の視点におい
て、自己相関を算出する次数Ismallを符号化する音声
信号区間に応じて決定する近似次数決定部から構成され
る音声符号化装置を提供する。
【0047】
【発明の概要】前記した自己相関近似法では、近似次数
を合成フィルタのインパルス応答長であるIに設定して
いるが、近似次数は必ずしも合成フィルタのインパルス
応答長Iに一致させる必要はなく、極めて小さい値Ism
allでも自己相関を十分な精度で近似できるという知見
に基づき本発明は完成されるに至った。
【0048】すなわち、本発明では、自己相関近似数を
合成フィルタのインパルス応答長Iより小さい値Ismal
lに設定することにより、音源ならびにインパルス応答
の自己相関関数、合成信号の自己相関の演算量を低減化
している。さらに、本発明によれば、インパルス応答と
音源の自己相関関数のメモリ容量の低減化も可能として
いる。
【0049】本発明においては、近似次数Ismallは1
とした場合、相互相関のみにより評価関数が算出され、
自己相関の算出に要する積和演算量を削減している。
【0050】また、本発明においては、近似次数Ismal
lは符号化される音声信号の性質に基づき適応的に可変
に制御される。
【0051】
【実施例】図面を参照して、本発明の実施例について説
明する。図1は本発明の各実施例全てに共通する音声符
号化、復号化処理の構成図を示している。図中、図示左
側の構成(1)は符号化処理(エンコーダ)を、図示右側
の構成(2)は復号化処理(デコーダ)をそれぞれ表して
いる。最初に各構成モジュールを説明する。
【0052】入力端子100はエンコーダの音声入力端子
である。バッファ回路110は音声信号を記憶する回路で
ある。LPC分析回路120は音声のスペクトルパラメー
タであるLPC係数を抽出する回路である。パラメータ
量子化回路130はLPC係数を量子化する回路である。
重み付け回路140は音声信号に対し聴感重み付けを行う
回路である。適応コードブック150は、過去の音源を蓄
えておく回路である。適応コードブック探索回路160
は、長期予測パラメータを探索する回路である。
【0053】音源コードブック170は、長期予測残差を
表すサブフレーム長のコードベクトルが蓄えられたコー
ドブックであり、雑音コードブックでも、あるいはベク
トル量子化(VQ)アルゴリズムにより学習された学習
コードブックでも構わない。前者は文献1にその詳細が
開示され、後者は、特願平2−22955及び特願平2
−22956等に提案されている。
【0054】音源コードブック探索回路180は、音源コ
ードブック170から最適なコードベクトルを決定する回
路である。ゲインコードブック190は、長期予測音源と
コードベクトルのゲイン項を表すパラメータが格納され
ているコードブックである。ゲインコードブック探索回
路200は、長期予測音源とコードベクトルの量子化ゲイ
ンをゲインコードブックから決定する回路である。
【0055】マルチプレクサ210は、符号系列を組み合
わせて出力する回路である。デマルチプレクサ220は、
符号化されたコードを符号系列にデコードする回路であ
る。合成フィルタ230は、生成された音源と音声合成フ
ィルタより音声信号を再生する回路である。出力端子24
0はデコーダーの音声出力端子である。
【0056】この実施例の処理の流れを説明する。まず
(1)のエンコーダ処理では、入力ポート100より、音声信
号が入力されバッファ110に保存される。
【0057】バッファ110に蓄えられた一定サンプルの
音声信号を用いてLPC分析回路120で短期予測分析さ
れ、音声信号のスペクトル特性を表すLPC係数が算出
される。
【0058】LPC分析により求められたスペクトルパ
ラメータ(LPC係数)は、パラメータ量子化回路130
で量子化され、LPC係数の量子化コードがマルチプレ
クサ210に送られると共に、該量子化コードは逆量子化
され、以後の符号化処理に用いられる。
【0059】バッファ110に蓄えられた音声信号は、量
子化/逆量子化されたLPC係数を用いて重み付け回路
140で聴感上の重み付けが為され、以降のコードブック
探索に用いられる。
【0060】適応コードブック150、音源コードブック1
70、ゲインコードブック190ではそれぞれコードブック
探索が行なわれる。
【0061】まず、最初に適応コードブック探索回路16
0で長期予測を行い、ビッチ相関を表す長期予測パラメ
ータを決定し、そのコードをマルチプレクサ210に転送
すると共に、長期予測音源の生成を行なう。
【0062】次に、求められた長期相関を表す音源の影
響を減算後、音源コードブック探索回路180で音源コー
ドブック探索を行い、音源コードを決定し、コードベク
トルを生成すると共に、音源コードをマルチプレクサ21
0に転送する。
【0063】長期予測信号とコードベクトルが求められ
た後、ゲインコードブック探索回路200にて、2つの音
源のゲインを算出し、各ゲインコードをマルチプレクサ
に転送する。
【0064】マルチプレクサ210では、各コードを組み
合わせて伝送コードに変換し、出力する。
【0065】図1における(2)のデコーダ処理では、デ
マルチプレクサ220で、入力された伝送コードを各コー
ドに分解する。LPC係数を表すコードよりフィルタを
生成し、合成フィルタ230に転送する。
【0066】長期予測パラメータを表すコードより適応
コードブック150を用いて長期予測音源を生成し、音源
コードより音源コードブック170を用いてコードベクト
ルを生成し、ゲインコードから適応コードブック150と
音源コードブック170のコードベクトルのゲインを算出
し、各音源にゲイン項を掛け合わせて合成フィルタの入
力信号を生成する。最後に入力信号を用いて合成フィル
タ230で音声信号の合成を行なう。
【0067】
【実施例1】図2に本発明の第1の視点に対応する実施
例を示す。図2は、図1に示した適応コードブック探索
回路160の処理手順を表わしている。最初に各構成モジ
ュールを説明する。
【0068】(a)は音声合成フィルタのインパルス応答
を0次からI−1次まで算出する回路である。
【0069】(o)はインパルス応答の自己相関関数を0
次からIsmall−1次まで算出する回路である。Ismall
はI>Ismallに設定される。
【0070】(b)はインパルス応答を用いて音声信号を
逆方向にフィルタリングする回路である(上式(6)参
照)。
【0071】(c)は音源を探索する範囲を設定する回路
である。
【0072】(d1)は適応コードブック150を用いて各コ
ードに対応する長期予測音源を生成する回路である。
【0073】(e1)は生成された長期予測音源の自己相関
関数を0次からIsmall−1次まで算出する回路であ
る。
【0074】(f)は上式(9)の近似式を用いてIsmall次
の近似自己相関を算出する回路である。
【0075】(g)は上式(7)により相互相関を算出する回
路である。
【0076】(h1)は上式(2)の評価関数を算出する回路
である。
【0077】(i)は評価関数が最小となる最適コードを
決定する回路である。
【0078】次に、実施例の処理の流れを説明する。ま
ず最初に、(a)で合成フィルタのインパルス応答h[0]〜h
[I-1]を算出し、(o)でその自己相関関数を0次からIsm
all−1次まで算出する。次に(b)で逆方向フィルタリン
グを行う。
【0079】(c)でコードブックの探索範囲を設定し、
各探索コード毎に(d1)から(h1)の処理を行う。なお、コ
ードブックの探索範囲を設定するのは、例えば音源のビ
ット数B=7ビットの場合、128コードについて(d1)か
ら(h1)の処理を行なうと多大な処理量となるため、(c)
でコードブックの探索を予め所定の範囲に限定してい
る。
【0080】(d1)では、各コード(例えばj)に対応す
る長期予測音源(ej[n])を適応コードブックから生成
する。
【0081】(e1)では、生成された音源(ej[n])を用
いて音源の自己相関関数を0次からIsmall−1次まで
算出する(Rj[i];i=0〜Ismall)。
【0082】(f)では、(e1)で求められた音源の自己相
関関数(Rj[i])と合成フィルタリングの自己相関関数
(hh[i])を用いて自己相関近似法、すなわち上式(9)に
より自己相関Gjを算出する。
【0083】この場合、自己相関Gjは、演算量を低減
化するために、インパルス応答長Iまで算出することな
く、より低い次数Ismallまで算出する(上式(9)におい
て、IはIsmall)。Ismallを低い次数に設定すること
により、自己相関Gjの演算量が低減化するだけでな
く、(a)のインパルス応答の自己相関関数、(e1)の音源
の自己相関関数の演算量が低減され、更にRAM領域が
低減される。
【0084】次に(g)で逆方向フィルタリングの出力を
用いて相互相関Cjを算出する。求められた自己相関、
相互相関より(h1)にて上式(2)の評価関数を算出し、(i)
で評価関数を最小にするコードを最適コードとして決定
する。
【0085】
【実施例2】図3に本発明の第2の実施例を示す。同図
は、本実施例における音源コードブック探索回路180
(図1参照)の処理手順を表している。まず、各構成モ
ジュールの説明を行う。
【0086】(d2)は音源コードブック170を用いて各コ
ードに対応するコードベクトルを生成する回路である。
【0087】(e2)は音源自己相関関数生成回路であり、
音源自己相関コードブック175からテーブルルックアッ
プにより、探索コードに対応する自己相関関数を求め
る。その他は、図2に示した前記第1の実施例と同一の
モジュールを用いている。
【0088】次に、本実施例の処理の流れを説明する。
【0089】まず最初に(a)で合成フィルタのインパル
ス応答を算出し、(o)でその自己相関関数を0次からIs
mall−1次まで算出する。次に(b)で逆方向フィルタリ
ングを行う。(c)でコードブックの探索範囲を設定し、
各探索コード毎に(d1)から(h1)の処理を行う。
【0090】(d2)では各コードに対応するコードベクト
ルを音源コードブック170より生成される。
【0091】(e2)ではコードベクトルの自己相関関数を
0次からIsmall−1次まで算出される。適応コードブ
ックと異なり、音源コードブックは値が決まっているた
め、予めコードベクトルの自己相関値を音源自己相関コ
ードブック175に蓄えておき、コードベクトルの自己相
関関数はこの音源自己相関コードブック175を参照する
ことにより求められる。
【0092】音源の自己相関関数と合成フィルタの自己
相関関数を用いて自己相関近似法により自己相関Gjを
算出する。この場合、演算量を低減化するために、イン
パルス応答長Iまで算出するのではなく、より低い次数
Ismallまで算出する。Ismallを低い次数に設定するこ
とにより、自己相関Gjの演算量が低減化するだけでな
く、(a)のインパルス応答の自己相関関数が減少し、音
源自己相関コードブック175のROMのメモリ容量が低
減する。
【0093】次に(g)で逆方向フィルタの出力を用いて
相互相関Cjを算出する。求められた自己相関、相互相
関より(h1)で評価関数を算出し、評価関数を最小にする
コードを最適コードとして(i)で決定する。
【0094】
【実施例3】図4に、本発明の第3の実施例を示す。同
図は、本実施例における適応コードブック探索回路160
(図1参照)の処理手順を表している。
【0095】まず、構成モジュールの説明を行なう。(h
2)は相互相関のみを用いて評価関数を算出する回路であ
る。その他の構成モジュールは、それぞれ前記第1の実
施例のものと同じである。
【0096】本実施例と前記第1の実施例との相違点
は、本実施例では評価関数を相互相関のみで表している
ことであり、これにより、インパルス応答の自己相関関
数の算出、音源の自己相関関数の算出、及び自己相関の
算出が不要になるため、演算量が少なくなる。本実施例
は第1の実施例において次数Ismallを1に設定した場
合に相当する。
【0097】
【実施例4】図5に本発明の第4の実施例を示す。同図
は、図1の音源コードブック探索回路180の処理手順を
表している。本実施例と前記第2の実施例との相違点
は、評価関数を相互相関のみで表していることであり、
これにより、インパルス応答の自己相関関数の算出、音
源の自己相関関数のコードブック、及び自己相関の算出
が不要になるため、演算量、メモリ容量が少なくなる。
【0098】本実施例は前記第2の実施例において、次
数Imallを1に設定した場合に相当する。このように次
数Imallを1に設定し、自己相関の算出を行なわなくて
も、符号化される音声信号に特別な劣化が生じないこと
が実験により確かめられている。
【0099】
【実施例5】図6、及び図7に本発明の第5の実施例を
示す。図6及び図7は、図1の適応コードブック探索回
路160の処理手順を表している。本実施例は、前記第
1、又は第2の実施例にモジュール(m)が付加された
ものである。
【0100】モジュール(m)は自己相関の近似次数I
smallを決定する回路であり、符号化を行なう音声信号
の性質に応じてIsmallの値を設定する。Ismallの値は
コードブック探索のための変数であり、伝送する必要は
ない。本実施例では、符号化される音声信号の性質、例
えば有声/無声に応じて近似次数Ismallを適応的に可
変される。
【0101】なお、上記各実施例では、本発明をLPC
分析回路を用いて説明を行ったが、スペクトルパラメー
タを抽出するBURG法等の他の分析法においても同様
の効果が得られる。
【0102】また、上記各実施例ではLPC係数を用い
て説明したが、本発明は、PARCOR係数やLSP係
数のような他のスペクトルパラメータでも同様な効果が
得られることは明らかである。さらに、上記各実施例で
は音源コードブック探索回路を1段構成にしたが、多段
構成にしても同様の効果が得られることは勿論である。
【0103】以上述べたように、本発明によれば、CE
LP方式において、自己相関近似次数Ismallをインパ
ルス応答長Iより小さくすることにより、上式(10)は次
式(13)のようになる。
【0104】
【数11】
【0105】また、上式(12)のコード毎の自己相関関数
の積和演算量は次式(14)のようになる。
【0106】
【数12】
【0107】ここに、Ismall=1、Ismall=0として
表1と同じ条件で積和演算量を算出すると、表2のよう
になる。
【0108】
【表2】
【0109】表2に示すように、本発明によれば、例え
ば近似次数Ismall=1で適応コードブック探索回路にお
ける積和演算量は、文献2の近似法と比較して、大幅に
低減されている。
【0110】以上、本発明を各種実施例について説明し
たが、本発明はこれらの実施態様にのみ限定されるもの
ではなく、本発明の原理に準ずる各種実施態様を含むこ
とは勿論である。
【0111】
【発明の効果】以上述べたように、本発明によれば、C
ELP方式において、自己相関近似次数Ismallを合成
フィルタのインパルス応答長Iより小さくすることによ
り、自己相関の積和演算量の大幅な低減を達成し、コー
ド毎の自己相関の積和演算量を低減化を実現できると共
に、音質の劣化も抑えることができる。
【0112】また、本発明によれば、音源コードブック
の自己相関値を音源自己相関コードブックに予め格納し
ておくことにより、コードベクトルの自己相関関数はこ
の音源自己相関コードブックをテーブル参照することに
より高速に求められると共に、自己相関近似次数をイン
パルス応答より低い次数Ismallで算出し、自己相関の
演算量を低減化すると共に、合成フィルタのインパルス
応答の自己相関関数が減少し、且つ音源自己相関コード
ブックのROMのメモリ容量を低減するという効果を有
する。
【0113】さらに、本発明によれば、自己相関近似次
数Ismallを1として、評価関数を相互相関のみで表
し、音声を劣化させることなく、上記表2に示すように
演算量を大幅に削減している。
【0114】そして、本発明によれば、自己相関近似次
数Ismallを近似次数決定回路により符号化を行なう音
声信号の性質に応じて適応的に可変に制御することによ
り、自己相関の積和演算量を低減すると共に、音声の劣
化を効率的に抑止した音声符号化装置を実現している。
【図面の簡単な説明】
【図1】本発明に係る音声符号化装置の全体構成図であ
る。
【図2】本発明の第1の実施例の構成図である。
【図3】本発明の第2の実施例の構成図である。
【図4】本発明の第3の実施例の構成図である。
【図5】本発明の第4の実施例の構成図である。
【図6】本発明の第5の実施例の構成図である。
【図7】本発明の第5の実施例の別の構成図である。
【符号の説明】
100 音声入力ポート 110 バッファ回路 120 LPC分析回路 130 パラメータ量子化回路 140 重み付け回路 150 適応コードブック 160 適応コードブック探索回路 170 音源コードブック 175 音源自己相関コードブック 180 音源コードブック探索回路 190 ゲインコードブック 200 ゲインコードブック探索回路 210 マルチプレクサ 220 デマルチプレクサ 230 合成フィルタ 240 音声出力端子 (a) インパルス応答算出回路 (b) 逆方向フィルタ回路 (c) 探索範囲設定回路 (d1) 長期予測音源の生成回路 (d2) コードベクトルの生成回路 (e1) 長期予測音源の自己相関関数生成回路 (e2) コードベクトルの自己相関関数生成回路 (f) 自己相関近似法による自己相関の算出回路 (g) 逆方向フィルタを用いた相互相関の算出回路 (h1) 評価関数の算出回路 (h2) 評価関数の算出回路 (i) 最適コードの決定回路 (m) 近似次数決定回路 (o) インパルス応答の自己相関関数算出回路
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平5−210399(JP,A) 国際公開92/16930(WO,A1) 電子情報通信学会1994年春季大会講演 論文集(A−281 低演算量低メモリ量 4kb/s音声符号化方式) (58)調査した分野(Int.Cl.6,DB名) G10L 9/08,9/14,9/18

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】音声信号の一定区間毎に該音声信号の周波
    数特性を表す短期予測パラメータの符号を決定する音声
    分析部と、 前記短期予測パラメータより生成される音声合成フィル
    タのインパルス応答を算出するインパルス応答算出部
    と、 前記音声信号を前記インパルス応答を用いて逆方向にフ
    ィルタリングする逆方向フィルタ部と、 過去の音声符号化区間で生成された前記音声合成フィル
    タの入力信号を蓄積する適応コードブックと、 前記適応コードブックより前記音声信号のピッチ相関を
    表す長期予測音源を生成する長期予測音源生成部と、 前記音声信号と前記長期予測音源を入力とする前記音声
    合成フィルタの出力信号との相互相関を算出する相互相
    関演算部と、 前記音声合成フィルタのインパルス応答の自己相関関数
    を前記インパルス応答長未満の次数Ismallまで算出す
    るインパルス応答の自己相関関数算出部と、 前記長期予測音源の自己相関関数を前記インパルス応答
    長未満の次数Ismallまで算出する長期予測音源の自己
    相関関数算出部と、 前記2種類の自己相関関数から前記インパルス応答長未
    満の次数Ismallで前記出力信号の自己相関を算出する
    自己相関算出部と、 前記自己相関と前記相互相関を用いて誤差エネルギーを
    算出する評価関数算出部と、 前記評価関数を用いて最適な長期予測符号を決定する最
    適コード決定部と、 長期予測後の残差信号を示す量子化符号と音源信号から
    なる音源コードブックと、 前記音源コードブックから最適な量子化符号を決定する
    音源コードブック探索部と、を有することを特徴とする
    音声符号化装置。
  2. 【請求項2】音声信号の一定区間毎に該音声信号の周波
    数特性を表す短期予測パラメータの符号を決定する音声
    分析部と、 過去の音声符号化区間で生成された音声合成フィルタの
    入力信号を蓄積する適応コードブックと、 前記適応コードブックより最適な符号を決定する適応コ
    ードブック探索部と、 前記短期予測パラメータより生成される前記音声合成フ
    ィルタのインパルス応答を算出するインパルス応答算出
    部と、 前記音声合成フィルタのインパルス応答の自己相関関数
    をインパルス応答長未満の次数Ismallまで算出するイ
    ンパルス応答の自己相関関数算出部と、 長期予測後の残差信号を示す量子化符号と音源信号から
    なる音源コードブックと、 前記音源コードブックよりコードベクトルを生成するコ
    ードベクトル生成部と、 前記コードベクトルの自己相関関数を前記インパルス応
    答長未満の次数Ismallまで求めるコードベクトルの自
    己相関関数生成部と、 前記音声信号を前記インパルス応答を用いて逆方向にフ
    ィルタリングする逆方向フィルタ部と、 前記音声信号と前記コードベクトルを入力とする前記音
    声合成フィルタの出力信号の相互相関を算出する相互相
    関算出部と、 前記2種類の自己相関関数から前記インパルス応答長未
    満の次数Ismallで前記出力信号の自己相関を算出する
    自己相関算出部と、 前記自己相関と前記相互相関を用いて誤差エネルギーを
    算出する評価関数の算出部と、 前記評価関数を用いて最適なコードベクトルを決定する
    最適コード決定部と、を有することを特徴とする音声符
    号化装置。
  3. 【請求項3】音声信号の一定区間毎に該音声信号の周波
    数特性を表す短期予測パラメータの符号を決定する音声
    分析部と、 前記短期予測パラメータより生成される音声合成フィル
    タのインパルス応答を算出するインパルス応答算出部
    と、 前記音声信号を前記インパルス応答を用いて逆方向にフ
    ィルタリングする逆方向フィルタ部と、 過去の音声符号化区間で生成された前記音声合成フィル
    タの入力信号を蓄積する適応コードブックと、 前記適応コードブックより前記音声信号のピッチ相関を
    表す長期予測音源を生成する長期予測音源生成部と、 前記音声信号と前記長期予測音源を入力とする前記音声
    合成フィルタの出力信号の相互相関を算出する相互相関
    演算部と、 前記相互相関を用いて最適な長期予測符号を決定する最
    適コード決定部と、 長期予測後の残差信号を示す量子化符号と音源信号から
    なる音源コードブックと、 前記音源コードブックから最適な量子化符号を決定する
    音源コードブック探索部と、を有することを特徴とする
    音声符号化装置。
  4. 【請求項4】音声信号の一定区間毎に該音声信号の周波
    数特性を表す短期予測パラメータの符号を決定する音声
    分析部と、 過去の音声符号化区間で生成された音声合成フィルタの
    入力信号を蓄積する適応コードブックと、 前記適応コードブックより最適な符号を決定する適応コ
    ードブック探索部と、 前記短期予測パラメータより生成される前記音声合成フ
    ィルタのインパルス応答を算出するインパルス応答算出
    部と、 長期予測後の残差信号を示す量子化符号と音源信号から
    なる音源コードブックと、 前記音源コードブックよりコードベクトルを生成するコ
    ードベクトル生成部と、 前記音声信号を前記インパルス応答を用いて逆方向にフ
    ィルタリングする逆方向フィルタ部と、 前記音声信号と前記コードベクトルを入力とする前記音
    声合成フィルタの出力信号の相互相関を算出する相互相
    関算出部と、 前記相互相関を用いて最適なコードベクトルを決定する
    最適コード決定部と、を有することを特徴とする音声符
    号化装置。
  5. 【請求項5】自己相関を算出する次数Ismallを符号化
    する音声信号区間に応じて決定する近似次数決定部を有
    することを特徴とする請求項1又は2記載の音声符号化
    装置。
  6. 【請求項6】前記コードベクトルの自己相関値を格納し
    た音源自己相関コードブックを備え、前記コードベクト
    ルの自己相関関数生成部が、前記コードベクトル生成部
    より生成されたコードベクトルに基づき前記音源自己相
    関関数コードブックをテーブル参照して自己相関関数を
    生成することを特徴とする請求項2又は4記載の音声符
    号化装置。
  7. 【請求項7】前記コードブックを探索する範囲を所定の
    範囲に設定する手段を備えたことを特徴とする請求項1
    ないし5のいずれか一に記載の音声符号化装置。
JP5342140A 1993-12-14 1993-12-14 音声符号化装置 Expired - Fee Related JP2979943B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP5342140A JP2979943B2 (ja) 1993-12-14 1993-12-14 音声符号化装置
EP94119543A EP0658877A2 (en) 1993-12-14 1994-12-09 Speech coding apparatus
CA002137880A CA2137880A1 (en) 1993-12-14 1994-12-12 Speech coding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5342140A JP2979943B2 (ja) 1993-12-14 1993-12-14 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH07168596A JPH07168596A (ja) 1995-07-04
JP2979943B2 true JP2979943B2 (ja) 1999-11-22

Family

ID=18351440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5342140A Expired - Fee Related JP2979943B2 (ja) 1993-12-14 1993-12-14 音声符号化装置

Country Status (3)

Country Link
EP (1) EP0658877A2 (ja)
JP (1) JP2979943B2 (ja)
CA (1) CA2137880A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3616432B2 (ja) * 1995-07-27 2005-02-02 日本電気株式会社 音声符号化装置
JP3157116B2 (ja) * 1996-03-29 2001-04-16 三菱電機株式会社 音声符号化伝送システム
US5745872A (en) * 1996-05-07 1998-04-28 Texas Instruments Incorporated Method and system for compensating speech signals using vector quantization codebook adaptation
TW419645B (en) * 1996-05-24 2001-01-21 Koninkl Philips Electronics Nv A method for coding Human speech and an apparatus for reproducing human speech so coded
US6789059B2 (en) 2001-06-06 2004-09-07 Qualcomm Incorporated Reducing memory requirements of a codebook vector search

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI98104C (fi) * 1991-05-20 1997-04-10 Nokia Mobile Phones Ltd Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子情報通信学会1994年春季大会講演論文集(A−281 低演算量低メモリ量4kb/s音声符号化方式)

Also Published As

Publication number Publication date
EP0658877A2 (en) 1995-06-21
CA2137880A1 (en) 1995-06-15
JPH07168596A (ja) 1995-07-04

Similar Documents

Publication Publication Date Title
JP2940005B2 (ja) 音声符号化装置
EP0957472B1 (en) Speech coding apparatus and speech decoding apparatus
WO2001020595A1 (en) Voice encoder/decoder
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JPH08272395A (ja) 音声符号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
EP0810584A2 (en) Signal coder
JPH0944195A (ja) 音声符号化装置
JP2979943B2 (ja) 音声符号化装置
JP3174733B2 (ja) Celp型音声復号化装置、およびcelp型音声復号化方法
JPH08292797A (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3360545B2 (ja) 音声符号化装置
JP3249144B2 (ja) 音声符号化装置
JPH0830299A (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3230380B2 (ja) 音声符号化装置
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP3024467B2 (ja) 音声符号化装置
JP3092436B2 (ja) 音声符号化装置
JP3065638B2 (ja) 音声符号化方式
JP2853170B2 (ja) 音声符号化復号化方式
JP3174782B2 (ja) Celp型音声復号化装置及びcelp型音声復号化方法
JP3174779B2 (ja) 拡散音源ベクトル生成装置及び拡散音源ベクトル生成方法
JP3174783B2 (ja) Celp型音声符号化装置及びcelp型音声符号化方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990817

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080917

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080917

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090917

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090917

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100917

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees