JP3362534B2 - ベクトル量子化による符号化復号方式 - Google Patents

ベクトル量子化による符号化復号方式

Info

Publication number
JP3362534B2
JP3362534B2 JP30985594A JP30985594A JP3362534B2 JP 3362534 B2 JP3362534 B2 JP 3362534B2 JP 30985594 A JP30985594 A JP 30985594A JP 30985594 A JP30985594 A JP 30985594A JP 3362534 B2 JP3362534 B2 JP 3362534B2
Authority
JP
Japan
Prior art keywords
codebook
vector
change
contents
initialization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30985594A
Other languages
English (en)
Other versions
JPH08147000A (ja
Inventor
彰利 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP30985594A priority Critical patent/JP3362534B2/ja
Priority to US08/512,311 priority patent/US5797118A/en
Publication of JPH08147000A publication Critical patent/JPH08147000A/ja
Application granted granted Critical
Publication of JP3362534B2 publication Critical patent/JP3362534B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、コートブックを用い
て音声や画像等を高能率に圧縮して伝送又は記録するた
めのベクトル量子化による符号化復号方式に関する。
【0002】
【従来の技術】従来より、音声や画像を高能率に圧縮し
て伝送又は記録するためのベクトル量子化が知られてい
る。ベクトル量子化では、量子化すべき信号波形を一定
区間について切り出し、この区間の波形パターンを1つ
の符号(インデックス)で表現する。このため予め種々
の波形パターンを蓄えておき、各波形パターンにインデ
ックスを付加しておく。種々の波形パターンは、サンプ
ル数の次元数で表現されたベクトル情報であり、これら
のベクトル情報をコードベクトル、これらのコードベク
トルとインデックスとの対応表をコードブックと呼ぶ。
【0003】例えば音声の符号化方式の一つとして知ら
れているCELP("Code-ExcitedLinear Prediction :
High Quality Speech at Very low Bit Rate" M.R.Sch
roeder, B.S.Atal ICASSP,1985 )では、音声の予測残
差成分をサブフレームと呼ばれる40サンプル程のデー
タに分割し、この各サブフレームに対してベクトル量子
化を適用している。しかし、このベクトル量子化に使用
されるコードブックは、多数の話者の平均的なものとな
るので、特定の個人向けには最適化されていない。この
ため、量子化されるベクトルとコードブックのベクトル
との誤差が大きく、良質の音声を伝送することができな
い。コードブックとして蓄えられるコードベクトルの数
が多ければ、音質は向上するが、反面、コードブックの
量が大きくなりコストアップになると共に、インデック
スの情報量も増すために伝送量も増す。また、コードブ
ックのサーチに時間がかかるという問題もある。
【0004】そこで、少ないコードブックの情報量で量
子化歪の発生を極力抑えるようにした学習ベクトル量子
化器(LVQ)が、特開平2−186836号に開示さ
れている。この学習ベクトル量子化器は、ベクトル量子
化時の最小歪が所定値よりも大きい場合に、その被量子
化ベクトルを復号装置側にも送信して、コードブック中
の最も過去に選択された量子化代表ベクトル(コードベ
クトル)と書き換えることにより、コードブックの内容
を被量子化ベクトルの特性に応じて適応的に更新するも
のである。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
た従来の学習ベクトル量子化による符号化復号装置で
は、平均的な多くの話者にまんべんなく合致するように
作成された元のコードブックを、特定の話者に特化して
いくように順次更新していくように構成されている。従
って、話者が変わった場合、交替前の話者に特化されて
いたコードブックが災いし、ベクトル量子化誤差が増大
し、復号音声の悪化をもたらすという問題がある。
【0006】この発明は、このような問題点に鑑みなさ
れたもので、話者に特化していくようにコードブックの
内容を更新していく学習ベクトル量子化において、話者
が変化した場合でも、ベクトル量子化誤差が極端に増大
することがないベクトル量子化による符号化復号方式を
提供することを目的とする。
【0007】
【課題を解決するための手段】この発明に係るベクトル
量子化による符号化復号方式は、所定区間内のいくつか
の代表的な信号パターンを示すコードベクトルとそれら
のコードベクトルをそれぞれ特定するインデックスとの
対応表を記憶してなるコードブックを、符号化装置及び
復号装置の双方に設け、前記符号化装置では、符号化対
象信号に基づく量子化すべき被量子化ベクトルと最もマ
ッチングする前記コードブック内のコードベクトルを選
択してそのインデックスを出力し、前記復号装置では、
前記符号化装置側で得られたインデックスに対応するコ
ードベクトルを前記コードブックを参照して求めること
により前記被量子化ベクトルを復号すると共に、前記符
号化装置での前記被量子化ベクトルと前記コードベクト
ルとのマッチング結果に基づいて前記コードブックの内
容を適応的に更新するコードブック書換手段を前記符号
化装置及び復号装置の双方に設けたベクトル量子化によ
る符号化復号方式において、初期状態の前記コードブッ
クの内容を保持した初期化コードブックを前記符号化装
置及び復号装置の双方に設けると共に、前記符号化装置
は、前記符号化対象信号の特徴パラメータを抽出する特
徴抽出手段と、この特徴抽出手段で抽出された特徴パラ
メータの変化を検出する特徴変化検出手段とを備え、前
記コードブック書換手段は、前記特徴変化検出手段で前
記特徴パラメータの変化が検出された場合には、前記コ
ードブックの内容を前記初期化コードブックの内容に初
期化するものであることを特徴とする。
【0008】また、この発明の更に好ましい態様によれ
ば、前記コードブックの初期化に先立って前記コードブ
ックの内容及び特徴パラメータを一時的に記憶する一時
記憶手段を更に備え、前記コードブック書換手段は、前
記特徴変化検出手段で前記特徴パラメータの変化が検出
された場合に、先ず前記特徴抽出手段で抽出された特徴
パラメータと前記一時記憶手段に記憶された特徴パラメ
ータとを比較して、両者が近似している場合には、前記
コードブックの内容を前記一時記憶手段に記憶されたコ
ードブックの内容に書換え、前記両特徴パラメータが近
似していない場合には、前記コードブックの内容を前記
一時記憶手段に退避したのちに前記初期化コードブック
の内容に初期化するものであることを特徴とする。
【0009】なお、前記符号化装置は、コードブックの
内容が初期化コードブックの内容に書き換えられたこと
を示す初期化情報を前記復号装置へ供給し、前記復号装
置は、供給された前記初期化情報に基づいてコードブッ
クの内容を初期化コードブックの内容に初期化するもの
でもよいし、前記符号化装置は、出力する符号化結果を
一旦復号し、この復号結果に対して前記特徴抽出手段に
よる特徴パラメータの抽出を実行し、抽出された特徴パ
ラメータの変化が検出されたときに前記コードブックの
内容を初期化コードブックの内容に初期化するものであ
り、前記復号装置は、入力された符号化結果を復号し、
この復号結果に対して前記特徴抽出手段による特徴パラ
メータの抽出を実行し、抽出された特徴パラメータの変
化が検出されたときに前記コードブックの内容を初期化
コードブックの内容に初期化するものでもよい。
【0010】また、前記符号化対象信号が音声信号であ
る場合、前記特徴変化検出手段は、前記特徴抽出手段か
ら出力される前記音声信号の有音/無音の変化、ピッチ
変化、特徴係数の変化、スペクトラム包絡線情報の変
化、及びゲイン変化、並びに前記符号化装置内での符号
化の過程で出力される前記音声信号の有音/無音の変
化、ピッチ変化、特徴係数の変化、ゲイン変化、及びベ
クトル量子化誤差の変化の少なくとも一つに基づいて前
記コードブック書換手段を制御するものでよい。
【0011】
【作用】この発明によれば、被量子化ベクトとコードベ
クトルとのマッチング結果に基づいてコードブックの内
容を適応的に更新する学習ベクトル量子化による符号化
復号方式において、符号化対象信号の特徴パラメータの
変化を検出し、この変化が検出された場合には話者が変
わったものと判断して、コードブックの内容を初期化す
るようにしているので、話者交替後のコードブックの内
容を不特定話者向けの平均的な内容とすることができ、
ベクトル量子化誤差の増大を防ぐことができる。
【0012】なお、電話においては、ほんの少しの間だ
け別の話者が電話に出たり、一時的にメロディー等の別
の音が入ることが良くある。このような場合、話者が変
化したことを検出して、その度にコードブックを初期化
するのは効率的でない。そこで、コードブックの初期化
に先立って、コードブックの内容及び特徴パラメータを
一時的に記憶しておく一時記憶手段を設け、特徴パラメ
ータの変化が検出された場合には、まず、その特徴パラ
メータと一時記憶手段に退避してある特徴パラメータと
を比較する。そして、両者が近似している場合には、前
回の話者に戻ったと判断して、コードブックの内容を一
時記憶手段に記憶された内容に書き換え、近似していな
い場合には、全く別人であるとしてコードブックを初期
化する。これにより、一時的に別の話者が電話に出たよ
うな場合には、前回の学習結果が反映されたコードブッ
クを再び使用することができ、正確なベクトル量子化を
図ることができる。
【0013】また、コードブックの初期化は、符号化装
置と復号装置の双方で行われる必要があるが、符号化装
置から復号装置へ初期化情報を供給することにより、符
号化装置に同期した復号装置でのコードブックの初期化
が可能である。更に、符号化装置と復号装置とで同一の
アルゴリズムに従って、コードブックの初期化を行うよ
うに設定すると、上記のような初期化情報を復号装置側
に供給しなくても、符号化装置と復号装置とで初期化タ
イミングの同期をとることができる。例えば、符号化装
置内では、符号化結果を一旦復号し(局部復号)、この
復号結果に対して特徴抽出を行ってその変化を検出す
る。また、復号装置でも、受信された符号化結果を復号
し、この復号結果に対して特徴抽出を行ってその変化を
検出する。このように、同一の情報に対して同一のアル
ゴリズムを適用することにより、符号化装置と復号装置
とで同期したコードブックの初期化処理が可能になる。
【0014】
【実施例】以下、図面を参照して、この発明の実施例を
説明する。図1は、この発明の一実施例に係るCELP
方式によるベクトル量子化を含む音声信号の符号化装
置、図2は同じく復号化装置を示すブロック図である。
図1において、符号化装置に入力される符号化対象信号
である音声信号は、A/D変換器1でA/D変換された
のち、長期予測器2及び特徴抽出部11に供給される。
長期予測器2では、入力されたディジタル音声信号を、
例えば160サンプル毎のフレームに分割し、各フレー
ム毎に分析して、パーコール係数、ゲイン、ピッチ等の
長期予測係数を多重化部3に出力する。また、長期予測
器2は、入力されたディジタル音声信号から長期予測係
数によって線形予測された信号を差し引いて長期予測残
差成分を求め、これをフレーム分割部4に出力する。フ
レーム分割部4では、フレームタイマを用いて、この1
60サンプルの長期予測残差成分を、例えば40サンプ
ル毎のサブフレームに分割し、40次元の予測残差ベク
トルとしてベクトル量子化部5に出力する。CELPで
は、この予測残差ベクトルがベクトル量子化すべき被量
子化ベクトルとなる。ベクトル量子化部5は、予測残差
ベクトルをベクトルの大きさが1となるように正規化す
ると共に、正規化後の予測残差ベクトルと最も距離的に
近いコードベクトルをコードブック6から検索し、その
インデックスIDXと正規化係数とを多重化部3に出力
する。
【0015】また、この符号化装置には、コードブック
6の他に、コードブック6を初期化する際の内容を保持
した初期化コードブック7が設けられている。コードブ
ック6は、書換制御部8によって順次その内容を更新さ
れる。このため、コードブック6は、書き換え可能なR
AM等のメモリから構成される。これに対し、初期化コ
ードブック7の内容は固定的なものであるため、ROM
等のメモリにより構成される。
【0016】ベクトル量子化部5に入力される予測残差
ベクトルと、ベクトル量子化によって選択されたコード
ベクトルとの誤差は、減算器9によって計算される。減
算器9からの誤差ベクトルは、誤差量検出部10に与え
られている。誤差量検出部10は、誤差ベクトルの大き
さが所定値よりも大きいときには、誤差送信フラグ
“1”にして、このフラグと誤差ベクトルとを更新情報
として書換制御部8及び多重化部3に供給する。これに
より、書換制御部8が制御され、コードブック6の内容
が更新される。また、誤差量検出部10は、誤差ベクト
ルの大きさが所定量よりも小さいときには、誤差送信フ
ラグを“0”にして、これを書換制御部8及び多重化部
3に供給する。
【0017】また、音声特徴抽出部11に供給された音
声信号は、音声特徴抽出部11によって特徴パラメータ
を抽出される。この特徴パラメータは、音声信号の有音
/無音の変化、ピッチ変化、特徴係数の変化、スペクト
ラム包絡線情報の変化、及びゲイン変化等、話者に特有
の情報である。これらの特徴パラメータは、話者変化検
出部12に供給されている。話者変化検出部12は、特
徴パラメータの変化を検出すると、話者が変化したと認
識して初期化フラグを“1”にする。この初期化フラグ
も書換制御部8に供給されており、書換制御部8は、初
期化フラグが“1”のときに、コードブック6の内容を
初期化コードブック7の内容に初期化する。多重化部3
は、長期予測係数、IDX、その正規化係数、更新情報
及び初期化フラグを符号化及び多重化して伝送路に送信
又は記録媒体に記録する。
【0018】一方、復号化装置側では、図2に示すよう
に、受信又は読み出した信号は、逆多重化部21に供給
され、逆符号化・逆多重化されることにより、長期予測
係数及び正規化係数と、インデックスIDXと、更新情
報と、初期化フラグとに分割される。長期予測係数及び
正規化係数は、長期予測合成部22に供給される。ま
た、復号化装置側にも符号化装置と同一内容のコードブ
ック24及び初期化コードブック25が備えられてお
り、ベクトル逆量子化部23は、供給されたインデック
スIDXからコードブック24を参照することにより、
コードベクトルを選択する。これによりコードブック2
4から出力されるコードベクトルは、長期予測合成部2
2に供給される。長期予測合成部22は、コードベクト
ルを正規化係数によって元の信号レベルに戻し、この信
号と長期予測係数から線形予測して求められた信号とを
合成する。この合成信号がD/A変換器26でD/A変
換されて復号された音声信号として出力される。また、
逆多重化部21で分離された更新情報及び初期化フラグ
は、書換制御部27に供給されている。書換制御部27
は、符号化装置の書換制御部8と同様の機能を有するも
ので、更新情報に基づいてコードブック24の内容を更
新し、初期化フラグに基づいてコードブック24の内容
を初期化コードブック25の内容に初期化する。
【0019】次に、このように構成された符号化復号シ
ステムの動作について説明する。音声が入力されると、
その特徴的な部分、即ち、パーコール係数、ピッチ、ゲ
イン等は、長期予測部2及び特徴抽出部11により抽出
されることになるが、その残りの残差成分は、コードブ
ック6,24により、符号化及び復号されることにな
る。図3は、コードブック6,24の内容を示す図であ
る。コードブック6,24には、初期化時には、不特定
のあらゆる話者に対応可能なように、多種の言語、人種
及び性別等から選択された例えば512種類の代表的な
予測残差成分のコードベクトルが予め格納されている。
また、コードブック6,24には、各コードベクトルと
対応する形で、そのコードベクトルを特定するインデッ
クスIDXが格納されている。また、この他、各コード
ベクトルの書換可否を示すフラグや、各コードベクトル
の選択優先度の重み付けの情報等を追加するようにして
もよい。
【0020】コードベクトルの数が多ければ、量子化誤
差が少なくなり、高品質の符号化・復号化が実現できる
が、反面、メモリの記憶容量を増さなくてはならずコス
トアップとなると共に、サーチにも時間がかかる。ま
た、例えば512種類のコードベクトルであれば、イン
デックスIDXとして9ビットの情報を伝送すれば良い
が、コードベクトルの種類が増えると、伝送すべきビッ
ト数も増える。
【0021】コードブック6,24を構成するパターン
ベクトルを簡単のために2次元のベクトルとして2次元
平面に表現すると、図4(a)の黒丸のようになる。こ
こで、黒丸に併記された数値は各コードベクトルのイン
デックスである。いま、量子化すべき予測残差ベクトル
として図中“×”で示すベクトルVi がベクトル量子化
部5に入力されると、このベクトルVi はベクトルV12
に最も近いので、インデックス12がベクトル量子化部
5での量子化結果として選択されることになる。
【0022】ベクトル量子化部5に入力される残差成分
の傾向は話者毎に特有であるため、コードブック6,2
4は、学習によって内部のコードベクトルを最良の内容
に更新していく必要がある。そこで、符号化装置の誤差
量検出部10において、特定のコードベクトルについて
の量子化誤差が連続的に一定値を越えたことが検出され
た場合に、コードブック6で選択されたコードベクトル
と、量子化誤差の平均値とを加算したベクトルを新たな
コードベクトルとし、元のコードベクトルと置き換える
ことにより、コードブック6の内容を更新する。また、
このとき、誤差送信フラグ“1”と共に前記量子化誤差
の平均値を復号装置側にも転送して、コードブック24
の内容を更新する。図4(b)は、同図(a)のコード
ベクトルV12と、その量子化誤差から新たに生成された
コードベクトルとを置き換えた例を示している。このと
き、新たなコードベクトルと所定時間当たりの最も選択
頻度の低いコードベクトルとを置き換えるようにしても
よい。この場合、ベクトル空間の外縁に存在するプリミ
ティブなベクトルについては、置き換えを禁止するフラ
グを設定するようにしてもよい。なお、コードブック2
4の更新処理を、このようなコードベクトルの書換とせ
ずに、各コードベクトルの重み付けを変化させる処理と
してもよい。
【0023】このようなコードブック6,24の更新に
よってコードブックの内容を話者の特性に応じて適応的
に変化させることができるが、電源投入時や、話者が変
わって音声入力の特性が急変したような場合には、学習
されたコードブックの内容では、かえって都合が悪い場
合がある。この場合には、コードブック6,24の内容
を当初の内容に初期化することが望ましい。そこで、音
声特徴抽出部11で音声信号から話者の特徴パラメータ
を抽出し、話者変化検出部12で話者の特徴パラメータ
が変化したことを検出する。話者の特徴パラメータとし
ては、次のものが考えられる。
【0024】(a)有音/無音 有音/無音の割合は話者毎に異なる。また、無音部が一
般の喋り言葉に含まれる平均よりも長く発生した場合に
は、話者が変化する可能性が高い。 (b)音声のピッチ 音声のピッチは、声帯の振動周波数、ひいては声の高さ
であるので、その周波数の分布(時間平均、分散等)は
個人の特性を反映する。 (c)音声の特徴係数 音声の特徴係数には、声道を全極型フィルタで表現した
パーコール係数(反射係数)があるが、これらの時間平
均、その分散等は話者毎に異なる。 (d)スペクトラム包絡線 音声を周波数分析し、そのスペクトラム包絡線の形状、
その時間的変化率及び変化の分散についても(c)と同
様の傾向がある。 (e)音声のゲイン 音声のゲインは、話者のくせによって異なる。また、ゲ
インの変動率(分散)も、抑揚の付け方等に応じて変化
するので、個人判別に使用することができる。 (f)ベクトル量子化誤差 第1話者に特化したコードブックができあがっていると
きに、話者が変化すると、当然、量子化誤差も増大す
る。従って、この量子化誤差の変化を監視することによ
っても話者変化を判別することができる。
【0025】なお、以上の各特徴パラメータは、特徴パ
ラメータ抽出部11で抽出されたものでもよいし、ベク
トル量子化の過程で求められたものでもよい。例えば、
CELP方式の符号化においては、ピッチ、パーコール
係数、ゲイン、有音/無音フラグ等を、CELPのアル
ゴリズム内で発生させるので、これを利用することがで
ある。また、スペクトル分析を行って、その包絡線情報
を用いて情報を圧縮する形式の符号化復号方式では、
(d)のスペクトル包絡線パラメータをそのまま利用す
ることが可能である。
【0026】これらのパラメータが話者変化検出部12
に入力されると、話者変化検出部12は、先ず、話者の
話し方などに起因した量子化誤差等の一時的な増大や、
例えば口笛を吹いた場合等のピッチや特徴係数等の一時
的な変化を、話者の変化であると検出しないように、入
力パラメータにLPF(ローパス・フィルタ)等の前処
理を施す。そして、例えば以下のような判定式に基づい
て総合評価値etotalを求める。
【0027】
【数1】etotal =ka Pa +kb Pb +kc Pc +k
d Pd +ke Pe +kf Pf Pa 〜Pf :各パラメータ ka 〜kf :各パラメータの評価の重み付け係数
【0028】このようにして求められた総合評価値eto
tal に対し、更に後処理としてLPFをかけたのち、所
定のしきい値と比較して、しきい値を超えるようであれ
ば話者が変化したと判別すればよい。
【0029】話者変化検出部12が話者の変化を検出し
た場合には、初期化フラグが“1”になり、書換制御部
8がコードブック6の内容を初期化コードブック7の内
容に初期化する。初期化フラグは、送信又は記録される
ので、復号装置においても、同様のコードブック24の
初期化が行われることになる。このとき、コードブック
6,24は、全ての内容が書き換えられるようにしても
よいが、書き換えの効率を考慮すると、例えば個人情報
のあまり入らないプリミティブなコードベクトルには、
書き換え禁止フラグ等を付与しておくことにより、書き
換えすべきデータ量を削減するようにしても良い。ま
た、初期化フラグと共に、例えばピッチ情報等の特徴パ
ラメータを書換制御部8に供給し、このパラメータを参
照して男声/女声判別を行う。そして、その判別結果に
基づいてコードブックの初期値を男声の典型例、又は女
声の典型例で初期化すれば、話者変化後のベクトル量子
化誤差を減少させることができる。
【0030】なお、前述したように、初期化コードブッ
ク7,25をROMで構成して、全ての初期化データを
格納しておくようにしても良いが、初期化コードブック
7,25を書換可能なメモリで構成して、書き換えられ
たベクトル情報のみを格納しておくようにしてもよい。
また、初期化コードブック7,25に全初期化データが
格納されている場合でも、コードブック6,24の書き
換えは、書き換えられたデータについてのみ行うことに
より、書き換え時間を短縮するようにしてもよい。
【0031】図5は、この発明の他の実施例に係る符号
化復号方式における符号化装置を示すブロック図であ
る。この実施例のシステムが前述した実施例のシステム
と異なる点は、コードブック及び特徴パラメータの一時
退避用の一時記憶用メモリ31と、その退避時間を計測
するタイマ32とを設けた点にある。
【0032】即ち、電話においては、「ちょっと代わる
ね」といって、ほんの少しの間だけ話者が代わることが
ある。そこで、初期化フラグが“1”になったら、書換
制御部8は、前話者の特徴パラメータと書き換え前のコ
ードブック6の内容とを一時記憶用メモリ31に退避し
たのちに、タイマ32を起動して、コードブック6の内
容を初期化する。タイマ32を例えば数分に設定してお
き、タイムアウトが生ずる前に初期化フラグが“1”に
なったときには、一時記憶用メモリ31に退避されてい
る特徴パラメータと、今回抽出された特徴パラメータと
を比較して、両者が近似している場合には、前の話者に
戻ったものと判断して、コードブック6に一時記憶用メ
モリ31に退避されているコードブックの内容をコード
ブック6に書き戻す。話者が切り替わった際にタイムア
ウトが生じていた場合には、前の話者が話す確率は低い
と考え、コードブック6の内容及び特徴パラメータを退
避後、コードブック6を初期化する。また、話者が切り
替わったときに、今回の特徴パラメータと退避されてい
た特徴パラメータとが近似していない場合には、全く別
の話者に代わったものと判断してコードブック6の内容
及び特徴パラメータを退避後、コードブック6を初期化
する。パラメータが近似しているかどうかは、次のよう
な判別式を用いて判別すれば良い。
【0033】
【数2】 dperson=√[ka'(Pma−Pa )2 +kb'(Pmb−Pb )2 + …… …… +kf'(Pmf−Pf )2 ] dperson :パラメータが近似しているかの評価値 Pma〜Pmf:一時記憶しておいたパラメータ Pa 〜Pf :話者が切り替わった後に得られたパラメー
タ ka'〜kf':各パラメータに対する判定重み付け係数
【0034】パラメータPma〜Pmf、Pa 〜Pf につい
ては、この場合にもLPF等の前処理を施しておくのが
望ましい。符号化装置と復号装置のコードブック6,2
4の整合を図るためには、一時記憶用メモリ31の内容
が復活したことを示す復活フラグを、初期化フラグに加
えて符号化装置から送信又は記録すれば良い。復号装置
は、復活フラグ及び初期化フラグに基づいてコードブッ
ク24の内容を復活又は初期化させる。
【0035】なお、以上の実施例では、初期化フラグや
復活フラグを符号化装置から復号装置に供給したが、符
号化装置及び復号装置で全く同一のアルゴリズムによっ
てこれらの情報を生成するようにすれば、これらの情報
転送は不要となる。図6及び図7は、このようなシステ
ムの例を示す図で、図6は符号化装置、図7は復号装置
のブロック図である。例えばCELP方式のように分析
合成手法を用いている場合、符号化装置の内部で一旦合
成音声が作成される。以下、この合成音声を局部復号デ
ータと呼ぶ。長期予測部2で予測残差ベクトルを求める
際には、長期予測部2の内部で局部復号データを得てい
る。この局部復号データは、復号装置の復号処理によっ
て合成される復号データと一致する。そこで、符号化装
置では、この局部復号データから音声特徴抽出部11で
特徴パラメータを抽出し、この抽出された特徴パラメー
タと長期予測部2で求められた特徴係数、ピッチ等を話
者変化検出部12に供給して特徴パラメータの変化を検
出する。ディレイ部41は、ベクトル量子化での処理の
遅れを補償するための遅延手段である。
【0036】一方、復号装置でも、全く同様に、長期予
測合成部22で合成された復号データから音声特徴抽出
部51で特徴パラメータを抽出し、この抽出された特徴
パラメータを話者変化検出部52に供給すると共に、受
信又は読み出された特徴係数、ピッチ等の情報をディレ
イ部53を介して話者変化検出部52に供給する。これ
により、符号化装置と全く同一のデータ、同一のアルゴ
リズムにて話者変化を検出することができるので、符号
化装置と復号装置との間で初期化フラグを供給する必要
がない。このため、データの送信又は記憶容量を削減す
ることができる。
【0037】なお、以上の実施例では、音声信号の予測
残差ベクトルのベクトル量子化を例にとったが、音声信
号そのもの、又は画像信号等のベクトル量子化にも同様
に適用可能であることはいうまでもない。
【0038】
【発明の効果】以上述べたように、この発明によれば、
被量子化ベクトとコードベクトルとのマッチング結果に
基づいてコードブックの内容を適応的に更新する学習ベ
クトル量子化による符号化復号方式において、符号化対
象信号の特徴パラメータの変化を検出し、この変化が検
出された場合には話者が変わったものと判断して、コー
ドブックの内容を初期化するようにしているので、話者
交替後のコードブックの内容を不特定話者向けの平均的
な内容とすることができ、ベクトル量子化誤差の増大を
防ぐことができる。
【図面の簡単な説明】
【図1】 この発明の一実施例に係るベクトル量子化に
よる符号化装置のブロック図である。
【図2】 同ベクトル量子化による復号装置のブロック
図である。
【図3】 同符号化装置及び復号化装置におけるコード
ブックの内容を説明するための図である。
【図4】 同コードブックの更新前及び更新後のコード
ベクトルの内容を模式的に示す図である。
【図5】 この発明の他の実施例に係るベクトル量子化
による符号化装置のブロック図である。
【図6】 この発明の更に他の実施例に係るベクトル量
子化による符号化装置のブロック図である。
【図7】 同復号装置のブロック図である。
【符号の説明】
1…A/D変換器、2…長期予測部、3…多重化部、4
…フレーム分割部、5…ベクトル量子化部、6,24…
コードブック、7,25…初期化コードブック、8,2
7…書換制御部、9…減算器、10…誤差量検出部、1
1,51…音声特徴抽出部、12,52…話者変化検出
部、21…逆多重化部、22…長期予測合成部、23…
ベクトル逆量子化部、26…D/A変換器、31…一時
記憶用メモリ、32…タイマ、41,53…ディレイ。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平2−186836(JP,A) 特開 平7−295599(JP,A) 特開 平5−232996(JP,A) 特開 平5−181499(JP,A) 特開 平4−355500(JP,A) 特開 平3−288899(JP,A) 特開 昭60−200295(JP,A) 特開 平6−59698(JP,A) 特開 平5−289698(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/12

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 所定区間内のいくつかの代表的な信号パ
    ターンを示すコードベクトルとそれらのコードベクトル
    をそれぞれ特定するインデックスとの対応表を記憶して
    なるコードブックを、符号化装置及び復号装置の双方に
    設け、前記符号化装置では、符号化対象信号に基づく量
    子化すべき被量子化ベクトルと最もマッチングする前記
    コードブック内のコードベクトルを選択してそのインデ
    ックスを出力し、前記復号装置では、前記符号化装置側
    で得られたインデックスに対応するコードベクトルを前
    記コードブックを参照して求めることにより前記被量子
    化ベクトルを復号すると共に、前記符号化装置での前記
    被量子化ベクトルと前記コードベクトルとのマッチング
    結果に基づいて前記コードブックの内容を適応的に更新
    するコードブック書換手段を前記符号化装置及び復号装
    置の双方に設けたベクトル量子化による符号化復号方式
    において、 初期状態の前記コードブックの内容を保持した初期化コ
    ードブックを前記符号化装置及び復号装置の双方に設け
    ると共に、 前記符号化装置は、 前記符号化対象信号の特徴パラメータを抽出する特徴抽
    出手段と、 この特徴抽出手段で抽出された特徴パラメータの変化を
    検出する特徴変化検出手段とを備え、 前記コードブック書換手段は、前記特徴変化検出手段で
    前記特徴パラメータの変化が検出された場合には、前記
    コードブックの内容を前記初期化コードブックの内容に
    初期化するものであることを特徴とするベクトル量子化
    による符号化復号方式。
  2. 【請求項2】 前記コードブックの初期化に先立って前
    記コードブックの内容及び特徴パラメータを一時的に記
    憶する一時記憶手段を更に備え、 前記コードブック書換手段は、前記特徴変化検出手段で
    前記特徴パラメータの変化が検出された場合に、先ず前
    記特徴抽出手段で抽出された特徴パラメータと前記一時
    記憶手段に記憶された特徴パラメータとを比較して、両
    者が近似している場合には、前記コードブックの内容を
    前記一時記憶手段に記憶されたコードブックの内容に書
    換え、前記両特徴パラメータが近似していない場合に
    は、前記コードブックの内容を前記一時記憶手段に退避
    したのちに前記初期化コードブックの内容に初期化する
    ものであることを特徴とする請求項1記載のベクトル量
    子化による符号化復号方式。
  3. 【請求項3】 前記符号化装置は、コードブックの内容
    が初期化コードブックの内容に書き換えられたことを示
    す初期化情報を、前記復号装置へ供給し、 前記復号装置は、供給された前記初期化情報に基づいて
    コードブックの内容を初期化コードブックの内容に初期
    化するものであることを特徴とする請求項1又は2記載
    のベクトル量子化による符号化復号方式。
  4. 【請求項4】 前記符号化装置は、出力する符号化結果
    を一旦復号し、この復号結果に対して前記特徴抽出手段
    による特徴パラメータの抽出を実行し、抽出された特徴
    パラメータの変化が検出されたときに前記コードブック
    の内容を初期化コードブックの内容に初期化するもので
    あり、 前記復号装置は、入力された符号化結果を復号し、この
    復号結果に対して前記特徴抽出手段による特徴パラメー
    タの抽出を実行し、抽出された特徴パラメータの変化が
    検出されたときに前記コードブックの内容を初期化コー
    ドブックの内容に初期化するものである請求項1又は2
    記載のベクトル量子化による符号化復号方式。
  5. 【請求項5】 前記符号化対象信号は、音声信号であ
    り、 前記特徴変化検出手段は、前記特徴抽出手段から出力さ
    れる前記音声信号の有音/無音の変化、ピッチ変化、特
    徴係数の変化、スペクトラム包絡線情報の変化、及びゲ
    イン変化、並びに前記符号化装置内での符号化の過程で
    出力される前記音声信号の有音/無音の変化、ピッチ変
    化、特徴係数の変化、ゲイン変化、及びベクトル量子化
    誤差の変化の少なくとも一つに基づいて前記コードブッ
    ク書換手段を制御することを特徴とする請求項1乃至4
    のいずれか1項記載のベクトル量子化による符号化復号
    方式。
  6. 【請求項6】 所定区間内のいくつかの代表的な信号パ
    ターンを示すコードベクトルとそれらのコードベクトル
    をそれぞれ特定するインデックスとの対応表を記憶して
    なるコードブックと、 符号化対象信号に基づく量子化すべき被量子化ベクトル
    と最もマッチングする前記コードブック内のコードベク
    トルを選択してそのインデックスを出力するベクトル量
    子化手段と、 前記被量子化ベクトルと前記コードベクトルとのマッチ
    ング結果に基づいて前記コードブックの内容を適応的に
    更新するコードブック書換手段と、 初期状態の前記コードブックの内容を保持した初期化コ
    ードブックと、 前記符号化対象信号の特徴パラメータを抽出する特徴抽
    出手段と、 この特徴抽出手段で抽出された特徴パラメータの変化を
    検出する特徴変化検出手段とを備え、 前記コードブック書換手段は、前記特徴変化検出手段で
    前記特徴パラメータの変化が検出された場合には、前記
    コードブックの内容を前記初期化コードブックの内容に
    初期化するものであることを特徴とするベクトル量子化
    による符号化装置。
  7. 【請求項7】 所定区間内のいくつかの代表的な信号パ
    ターンを示すコードベクトルとそれらのコードベクトル
    をそれぞれ特定するインデックスとの対応表を記憶して
    なるコードブックと、 受信されたインデックスに対応するコードベクトルを前
    記コードブックを参照して求めることにより被量子化ベ
    クトルを復号するベクトル逆量子化手段と、 受信された更新情報に基づいて前記コードブックの内容
    を更新するコードブック書換手段と、 初期状態の前記コードブックの内容を保持した初期化コ
    ードブックとを備え、 前記コードブック書換手段は、符号化対象信号の特徴パ
    ラメータの変化に基づいて受信される初期化フラグに基
    づいて前記コードブックの内容を前記初期化コードブッ
    クの内容に初期化するものであることを特徴とするベク
    トル量子化による復号装置。
JP30985594A 1994-08-09 1994-11-18 ベクトル量子化による符号化復号方式 Expired - Fee Related JP3362534B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP30985594A JP3362534B2 (ja) 1994-11-18 1994-11-18 ベクトル量子化による符号化復号方式
US08/512,311 US5797118A (en) 1994-08-09 1995-08-08 Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30985594A JP3362534B2 (ja) 1994-11-18 1994-11-18 ベクトル量子化による符号化復号方式

Publications (2)

Publication Number Publication Date
JPH08147000A JPH08147000A (ja) 1996-06-07
JP3362534B2 true JP3362534B2 (ja) 2003-01-07

Family

ID=17998108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30985594A Expired - Fee Related JP3362534B2 (ja) 1994-08-09 1994-11-18 ベクトル量子化による符号化復号方式

Country Status (1)

Country Link
JP (1) JP3362534B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE514792C2 (sv) 1997-12-22 2001-04-23 Ericsson Telefon Ab L M Förfarande och anordning för avkodning vid kanaloptimerad vektorkvantisering
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
CN100583241C (zh) * 2003-04-30 2010-01-20 松下电器产业株式会社 音频编码设备、音频解码设备、音频编码方法和音频解码方法
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP2008170588A (ja) * 2007-01-10 2008-07-24 Kenwood Corp 音声記録装置及び音声記録方法
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
JP2011090031A (ja) * 2009-10-20 2011-05-06 Oki Electric Industry Co Ltd 音声帯域拡張装置及びプログラム、並びに、拡張用パラメータ学習装置及びプログラム
EP2466580A1 (en) * 2010-12-14 2012-06-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Encoder and method for predictively encoding, decoder and method for decoding, system and method for predictively encoding and decoding and predictively encoded information signal
JP7380188B2 (ja) * 2019-12-24 2023-11-15 富士通株式会社 更新プログラム、更新方法および情報処理装置

Also Published As

Publication number Publication date
JPH08147000A (ja) 1996-06-07

Similar Documents

Publication Publication Date Title
EP0718820B1 (en) Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
CA2177421C (en) Pitch delay modification during frame erasures
EP1353323B1 (en) Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
US5867814A (en) Speech coder that utilizes correlation maximization to achieve fast excitation coding, and associated coding method
JPH08179796A (ja) 音声符号化方法
JP2006502426A (ja) ソース制御された可変ビットレート広帯域音声の符号化方法および装置
JPH10187196A (ja) 低ビットレートピッチ遅れコーダ
JP3357795B2 (ja) 音声符号化方法および装置
JP3362534B2 (ja) ベクトル量子化による符号化復号方式
US5797118A (en) Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns
CA2440820A1 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JPH10124089A (ja) 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法
Lee et al. Applying a speaker-dependent speech compression technique to concatenative TTS synthesizers
JP3050978B2 (ja) 音声符号化方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP2001318698A (ja) 音声符号化装置及び音声復号化装置
JPH05232996A (ja) 音声符号化装置
JPH09244695A (ja) 音声符号化装置及び復号化装置
JPH09179593A (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3828170B2 (ja) ベクトル量子化による符号化復号化方式
JP3192051B2 (ja) 音声符号化装置
JPH0786952A (ja) 音声の予測符号化方法
JP3700310B2 (ja) ベクトル量子化装置及びベクトル量子化方法
JPH08211895A (ja) ピッチラグを評価するためのシステムおよび方法、ならびに音声符号化装置および方法

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071025

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081025

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091025

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101025

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101025

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111025

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees