JP3091828B2 - ベクトル量子化装置 - Google Patents

ベクトル量子化装置

Info

Publication number
JP3091828B2
JP3091828B2 JP07230856A JP23085695A JP3091828B2 JP 3091828 B2 JP3091828 B2 JP 3091828B2 JP 07230856 A JP07230856 A JP 07230856A JP 23085695 A JP23085695 A JP 23085695A JP 3091828 B2 JP3091828 B2 JP 3091828B2
Authority
JP
Japan
Prior art keywords
vector
codebook
likelihood
distribution
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07230856A
Other languages
English (en)
Other versions
JPH0981196A (ja
Inventor
崎 正 米
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP07230856A priority Critical patent/JP3091828B2/ja
Publication of JPH0981196A publication Critical patent/JPH0981196A/ja
Application granted granted Critical
Publication of JP3091828B2 publication Critical patent/JP3091828B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル電話やディ
ジタル録音器で必要な音声情報圧縮において使用される
ベクトル量子化装置に関するものである。
【0002】
【従来の技術】近年、データを伝送または蓄積する媒体
が有限であることから、高圧縮率かつ高音声品質を可能
とする音声情報圧縮技術の実現が望まれている。特に、
複数のサンプルからなるベクトルを単位として量子化す
るベクトル量子化は、高能率圧縮の要素技術として用い
られており、歪みの少ないベクトル量子化装置の実現が
望まれている。
【0003】以下、従来のベクトル量子化装置につい
て、図6に示すブロック図を用いて説明する。図6にお
いて、401は音声を分析し、分析パラメータを抽出す
る音声分析器である。402は符号器で、抽出されたパ
ラメータ群(以下、ベクトルと記す)に最も近いベクト
ルを符号帳403から選択し、その符号番号を伝送路4
07へ送出する。403は符号帳で、予め、学習サンプ
ル音声を分析して求めたベクトルが格納されている。以
上が符号化側の構成である。次に復号化側の構成を示
す。404は復号器で、伝送路407から伝送されてき
た符号から符号帳406を用いて、再生ベクトルを求め
る。405は音声合成器で、復号された再生ベクトルを
用いて音声合成を行う。406は復号化側の符号帳で、
符号化側の符号帳に対応した再生ベクトルが格納されて
いる。407は符号化側の装置と復号化側の装置を結ぶ
伝送路である。
【0004】以上のように構成されたベクトル量子化装
置について、以下、その動作について説明する。まず、
音声分析器401で音声を分析し、分析モデルに応じて
ベクトルが求められる。このベクトルは、符号器402
でベクトル量子化される。ベクトル量子化に際しては、
予め、学習サンプル音声を分析して得られた学習ベクト
ルを統計処理して求められる符号ベクトルで構成される
符号帳403を用いて、符号化時に分析されたベクトル
が最も近い符号ベクトルに量子化し、その符号番号を伝
送路407へ送出する。以上が符号化側の動作である。
復号化側では、復号器404が伝送路407を経て得た
符号番号の符号ベクトルを符号帳406から再生ベクト
ルとして選択する。符号帳406は、符号帳403と同
様に、予め学習サンプル音声を用いて求められる再生ベ
クトルで構成したものである。このようにして得られた
再生ベクトルを用いて音声合成器405で音声が合成さ
れる。
【0005】
【発明が解決しようとする課題】しかしながら、上記の
ような従来のベクトル量子化装置では、分析により得ら
れたベクトルと再生ベクトルの間に生じる誤差を考慮し
ていないため、量子化歪みが生じてしまうという問題を
有していた。
【0006】本発明は、上記従来の問題を解決するもの
で、学習サンプル音声を分析して得られる学習ベクトル
を用いて作成される符号帳として、再生ベクトルだけで
なくその再生ベクトルにクラスタリングされる学習ベク
トルの分布を持つことにより、ベクトル量子化歪みを小
さくすることのできるベクトル量子装置を提供すること
を目的とする。
【0007】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明の第1の構成は、音声符号化における量子
化装置において、符号化側に、音声を分析してパラメー
タを抽出する音声分析器と、分析されたパラメータをベ
クトル量子化する符号器と、ベクトル量子化をするため
の符号ベクトルを格納している符号帳を備え、復号化側
に、符号化側の符号帳に対応した再生ベクトルを格納し
ている符号帳と、伝送路から得た符号から符号帳を用い
て再生ベクトルを求める復号器と、再生ベクトルにクラ
スタリングされるベクトルの分布を格納している分布符
号帳と、再生ベクトルと分布符号帳を用いて求めたベク
トルの生起確率分布および前フレームで得られた復号ベ
クトルとの相関から、パラメータ空間内の尤度関数を算
出する尤度算出器と、算出された尤度を最大とするベク
トルを復号ベクトルとして求める最大尤度検出器と、得
られた復号ベクトルを用いて音声を合成する音声合成器
とを備えたものである。
【0008】本発明の第2の構成は、上記第1の構成に
加え、復号化側に、伝送路の符号誤りを検出する誤り検
出器と、検出された誤りに応じて尤度算出器で算出され
る尤度に重み付けをする重み切替器とを備えたものであ
る。
【0009】本発明の第3の構成は、上記第1の構成に
加え、復号化側に、伝送路の符号誤りを検出する誤り検
出器と、検出された誤りに応じて分布符号帳から得られ
るベクトルの生起確率分布を調整する分布調整器とを備
えたものである。
【0010】
【作用】本発明は、上記第1の構成により、復号ベクト
ルを求める際に再生ベクトルに対する復号ベクトルの生
起確率分布と前フレームからの連続性を考慮することに
より、聴感上の量子化歪みを小さくすることができる。
また上記第2の構成により、伝送路誤りに応じて尤度を
算出する際に、再生ベクトルまたは前フレームとの相関
の尤度に対する重み付けを切り替えることにより、伝送
路での符号誤り時の合成音声品質の劣化を低減すること
ができる。また、本発明の第3の構成により、伝送路誤
りに応じて、再生ベクトルの分布を変化させることによ
り、誤った再生ベクトルで音声を合成することを避ける
ことができ、伝送路での符号誤り時の合成音声品質の劣
化を低減することができる。
【0011】
【実施例】
(実施例1)以下、本発明のベクトル量子化装置の実施
例について、図面を参照しながら説明する。図1は本発
明の第1の実施例におけるベクトル量子化装置のブロッ
ク図を示すものである。図1において、101は音声を
分析してパラメータを抽出する音声分析器である。10
2は符号器で、分析されたパラメータをベクトル量子化
する。103は符号帳で、ベクトル量子化をするための
符号ベクトルを格納している。以上が符号化側の構成で
ある。次に復号化側の構成について説明する。104は
復号器で、伝送路110から得た符号から再生ベクトル
を求める。105は尤度算出器で、得られた再生ベクト
ルと復号ベクトルの生起確率分布および前フレームで得
られた復号ベクトルから、ベクトル空間上の全ての点に
対して尤度を算出する。106は最大尤度検出器で、算
出された尤度を最大とするベクトルを復号ベクトルとし
て求める。107は音声合成器で、このようにして得ら
れた復号ベクトルを用いて音声合成を行う。108は符
号帳で、符号化側の符号帳103に対応した再生ベクト
ルを格納している。109は分布符号帳で、符号帳10
8の再生ベクトルにクラスタリングされる学習ベクトル
の分布が格納されている。110は符号化側の装置と復
号化側の装置を結ぶ伝送路である。
【0012】図2はこれらの符号帳について、2次元の
ベクトル空間上での例を示す。Li(i=1,…,4)
の4つの学習ベクトルが同じクラスタにクラスタリング
されているとき、ベクトルが各軸で独立に正規分布する
と仮定すると、x軸に対して分散は1/2{12 +(−
1)2 }=1、y軸に対して分散は1/2{22 +(−
2)2 }=4となる。したがって、再生ベクトルとして
平均(0,0)が符号帳108に、それに対応する分布
として(1,4)が分布符号帳109に格納される。こ
のような分布符号帳109を用いることで、x、yは独
立なので、再生ベクトル(0,0)に対して復号ベクト
ルの生起確率分布p(x,y)が次式で求められる。
【数1】 また、このようなモデル化をせず、符号帳作成時に学習
ベクトルの分布をテーブルとして蓄積し、生起確率分布
としてもよい。
【0013】以上のように構成されたベクトル量子化装
置について、以下その動作を説明する。まず、音声分析
器101によって分析されたベクトルは、符号帳103
を用いて符号器102で符号化される。この符号を伝送
路110を通じて得た復号器104は、符号帳108を
用いて再生ベクトルを生成する。尤度算出器105で
は、再生ベクトルに対応する生起確率分布を分布符号帳
109を用いて取得し、これと、前フレームの復号ベク
トルから次式を用いてベクトル空間上の点vに対して、
次式で尤度l(v)を求める。
【数2】 このようにして算出された尤度から、最大尤度検出器1
06で尤度が最大となるベクトルを復号ベクトルとして
復号する。以上の復号処理により得られた復号ベクトル
を用いて音声合成器107で音声を合成する。
【0014】このように、本実施例によれば、フレーム
間のつながりを考慮し、聴感上の量子化歪みを低減させ
ることが可能となり、効率良いベクトル量子化が実現で
きる。
【0015】(実施例2)図3は本発明の第2の実施例
におけるベクトル量子化装置のブロック図を示すもので
ある。図3において、201は音声を分析してパラメー
タを抽出する音声分析器である。202は符号器で、分
析されたパラメータをベクトル量子化する。203は符
号帳で、ベクトル量子化をするための符号ベクトルを格
納している。以上が符号化側の構成である。次に復号化
側の構成について説明する。204は復号器で、伝送路
212から得た符号から再生ベクトルを求める。205
は尤度算出器で、得られた再生ベクトルと分布符号帳2
09から得られる生起確率分布および前フレームで得ら
れた復号ベクトルから、重み切替器211による尤度重
みを考慮して、ベクトル空間上の点に対して尤度を算出
する。206は最大尤度検出器で、算出された尤度を最
大とするベクトルを復号ベクトルとして求める。207
は音声合成器で、このようにして得られた復号ベクトル
を用いて復号音声を合成する。208は符号帳で、符号
化側の符号帳203に対応した再生ベクトルを格納して
いる。209は分布符号帳で、符号帳208の再生ベク
トルに対するクラスタリングされる学習ベクトルの分布
が格納されている。210は誤り検出器で、伝送路21
2での符号誤りを検出する。211は重み切替器で、検
出された誤りに応じて尤度計算器205で算出される尤
度に重み付けをする。212は符号化側の装置と復号化
側の装置を結ぶ伝送路である。
【0016】以上のように構成されたベクトル量子化装
置について、以下その動作を説明する。まず、実施例1
と同様、音声分析器201によって求められたパラメー
タは、符号器202で符号帳203を用いて符号化され
る。この符号を伝送路212を通じて受けとった復号器
204は、符号帳208を用いて再生ベクトルを求め
る。尤度算出器205では、再生ベクトルと復号ベクト
ルの生起確率分布および前フレームで復号された復号ベ
クトルから(2)式を用いて尤度を算出する。このと
き、(2)式のパラメータαは、重み切替器211によ
って決定する。最大尤度検出器206では、算出された
尤度が最大となるベクトルを復号ベクトルとして求め、
この復号ベクトルを用いて音声合成器207で音声を合
成する。一方、誤り検出器210で伝送路212での符
号誤りが検出されたとき、重み切替器211はαを1に
近付け、尤度算出において前フレームの復号ベクトルと
の相関に重みを付け、誤って再生された再生ベクトルの
尤度への影響を小さくする。
【0017】このように、本実施例によれば、伝送路で
符号誤りが生じた時に誤りを考慮して最尤復号すること
が可能となり、誤りによる合成音声品質の劣化を低減す
ることができる。
【0018】(実施例3)図4は本発明の第3の実施例
におけるベクトル量子化装置のブロック図を示すもので
ある。図4において、301は音声を分析してパラメー
タを抽出する音声分析器である。302は符号器で、分
析されたパラメータをベクトル量子化する。303は符
号帳で、ベクトル量子化をするための符号ベクトルを格
納している。以上が符号化側の構成である。次に復号化
側の構成について説明する。304は復号器で、伝送路
312から得た符号から再生ベクトルを求める。305
は尤度算出器で、得られた再生ベクトルと分布調整器3
11で得られる生起確率分布および前フレームで得られ
た復号ベクトルから、ベクトル空間上の点に対して尤度
を算出する。306は最大尤度検出器で、算出された尤
度を最大とするベクトルを復号ベクトルとして求める。
307は音声合成器で、このようにして得られた復号ベ
クトルを用いて復号音声を合成する。308は符号帳
で、符号化側の符号帳303に対応した再生ベクトルを
格納している。309は分布符号帳で、符号帳308の
再生ベクトルにクラスタリングされる学習ベクトルの分
布が格納されている。310は誤り検出器で、伝送路3
12での符号誤りを検出する。311は分布調整器で、
誤りが検出された際に分布符号帳309から得られる生
起確率分布を変化させる。312は符号化側の装置と復
号化側の装置を結ぶ伝送路である。
【0019】以上のように構成されたベクトル量子化装
置について、以下その動作を説明する。まず、実施例1
と同様、音声分析器301によって求められたパラメー
タは、符号器302で符号帳303を用いて符号化され
る。この符号を伝送路312を通じて受けとった復号器
304は、符号帳308を用いて再生ベクトルを求め
る。尤度算出器305では、再生ベクトルと分布調整器
311から得られた生起確率分布および前フレームで復
号された復号ベクトルから(2)式を用いて尤度を算出
する。最大尤度検出器306では、算出された尤度が最
大となるベクトルを復号ベクトルとして求め、この復号
ベクトルを用いて音声合成器307で音声を合成する。
一方、誤り検出器310で伝送路312での符号誤りが
検出されたとき、分布調整器311は、分布符号帳30
9で得られる分布を調整する。
【0020】ここで、分布調整器311における生起確
率分布の調整例について、図5を用いて説明する。ただ
し、図5では1次元ベクトル空間上での例である。図5
において、伝送路誤りがないときの生起確率は、符号帳
中の隣接ベクトルとの距離の2等分点を境に0となる。
これは、2等分点を境に距離が近い方のベクトル量子化
されるために、復号ベクトルは2等分点より再生ベクト
ルに近い点に存在していることを示している。一方、誤
りが検出された時、隣接ベクトルとの2等分点に関係な
く復号ベクトルが存在する可能性があるので、図のよう
に2等分点以遠のベクトルも存在するような生起確率分
布を与える。
【0021】このように、本実施例によれば、実施例2
と同様に、伝送路で符号誤りが生じた時に誤りを考慮し
て最尤復号することが可能となり、誤りによる合成音声
品質の劣化を低減することができる。
【0022】
【発明の効果】以上のように、本発明によれば、ベクト
ル量子化された符号の復号に際し、各符号ベクトルに対
してどのような確率で復号ベクトルが分布しているかと
いうことと、前フレームからの相関を考慮することによ
り、歪みを低減することができる。また、伝送路で符号
誤りが生じたときに算出される尤度を調整することによ
り、合成音声品質の劣化を低減することができる。
【図面の簡単な説明】
【図1】実施例1におけるベクトル量子化装置のブロッ
ク図
【図2】各実施例における復号側の符号帳構成法の模式
【図3】実施例2におけるベクトル量子化装置のブロッ
ク図
【図4】実施例3におけるベクトル量子化装置のブロッ
ク図
【図5】実施例3における確率分布の調整法の模式図
【図6】従来例におけるベクトル量子化装置のブロック
【符号の説明】
101、201、301 音声分析器 102、202、302 符号器 103、203、303 符号帳 104、204、304 復号器 105、205、305 尤度算出器 106、206、306 最大尤度検出器 107、207、307 音声合成器 108、208、308 符号帳 109、209、309 分布符号帳 110、212、312 伝送路 210、310 誤り検出器 211 重み切替器 311 分布調整器
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06 H03M 7/30 H04B 14/04 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声符号化におけるベクトル量子化装置
    において、符号化側に、音声を分析してパラメータを抽
    出する音声分析器と、分析されたパラメータをベクトル
    量子化する符号器と、ベクトル量子化をするための符号
    ベクトルを格納している符号帳を備え、復号化側に、符
    号化側の符号帳に対応した再生ベクトルを格納している
    符号帳と、伝送路から得た符号から符号帳を用いて再生
    ベクトルを求める復号器と、再生ベクトルにクラスタリ
    ングされるベクトルの分布を格納している分布符号帳
    と、再生ベクトルと分布符号帳を用いて求めたベクトル
    の生起確率分布および前フレームで得られた復号ベクト
    ルとの相関から、パラメータ空間内の尤度関数を算出す
    る尤度算出器と、算出された尤度を最大とするベクトル
    を復号ベクトルとして求める最大尤度検出器と、得られ
    た復号ベクトルを用いて音声を合成する音声合成器とを
    備えたベクトル量子化装置。
  2. 【請求項2】 復号化側に、伝送路の符号誤りを検出す
    る誤り検出器と、検出された誤りに応じて尤度算出器で
    算出される尤度に重み付けをする重み切替器とを備えた
    請求項1記載のベクトル量子化装置。
  3. 【請求項3】 復号化側に、伝送路の符号誤りを検出す
    る誤り検出器と、検出された誤りに応じて分布符号帳か
    ら得られるベクトルの生起確率分布を調整する分布調整
    器とを備えた請求項1記載のベクトル量子化装置。
JP07230856A 1995-09-08 1995-09-08 ベクトル量子化装置 Expired - Fee Related JP3091828B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07230856A JP3091828B2 (ja) 1995-09-08 1995-09-08 ベクトル量子化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07230856A JP3091828B2 (ja) 1995-09-08 1995-09-08 ベクトル量子化装置

Publications (2)

Publication Number Publication Date
JPH0981196A JPH0981196A (ja) 1997-03-28
JP3091828B2 true JP3091828B2 (ja) 2000-09-25

Family

ID=16914379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07230856A Expired - Fee Related JP3091828B2 (ja) 1995-09-08 1995-09-08 ベクトル量子化装置

Country Status (1)

Country Link
JP (1) JP3091828B2 (ja)

Also Published As

Publication number Publication date
JPH0981196A (ja) 1997-03-28

Similar Documents

Publication Publication Date Title
KR100487943B1 (ko) 음성 코딩
JP3241978B2 (ja) 符号化システムの性能を改善する方法
KR100898323B1 (ko) 음성 코더용 스펙트럼 크기 양자화 방법
US5490230A (en) Digital speech coder having optimized signal energy parameters
US5432884A (en) Method and apparatus for decoding LPC-encoded speech using a median filter modification of LPC filter factors to compensate for transmission errors
EP1204968B1 (en) Method and apparatus for subsampling phase spectrum information
US5666350A (en) Apparatus and method for coding excitation parameters in a very low bit rate voice messaging system
US6006178A (en) Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits
EP1020848A2 (en) Method for transmitting auxiliary information in a vocoder stream
JPH10177398A (ja) 音声符号化装置
JP2002530704A (ja) 分散音声認識プロセスにおけるエラーの軽減方法および装置
JP3091828B2 (ja) ベクトル量子化装置
JP2982637B2 (ja) スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置
JP3047761B2 (ja) 音声符号化装置
JP3107620B2 (ja) 音声符号化方法
JP3700310B2 (ja) ベクトル量子化装置及びベクトル量子化方法
JPH08179800A (ja) 音声符号化装置
JPH1049200A (ja) 音声情報圧縮蓄積方法及び装置
JPH09120300A (ja) ベクトル量子化装置
JP2582072B2 (ja) 符号化復号化方法
JPH0854900A (ja) ベクトル量子化による符号化復号化方式
KR20180088807A (ko) 비디오 정보를 이용한 오디오 인코딩
JPH11134000A (ja) 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees