JPH04271400A - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JPH04271400A
JPH04271400A JP3103268A JP10326891A JPH04271400A JP H04271400 A JPH04271400 A JP H04271400A JP 3103268 A JP3103268 A JP 3103268A JP 10326891 A JP10326891 A JP 10326891A JP H04271400 A JPH04271400 A JP H04271400A
Authority
JP
Japan
Prior art keywords
vector
sound source
representative
stage
searcher
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3103268A
Other languages
English (en)
Inventor
Masahiro Serizawa
昌宏 芹沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3103268A priority Critical patent/JPH04271400A/ja
Publication of JPH04271400A publication Critical patent/JPH04271400A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声信号を低いビットレ
ート、特に8kbps以下で高品質に符号化するための
音声符号化方式に関するものである。
【0002】
【従来の技術】従来の音声符号化方式としては、例えば
、M.Schroeder氏とB.Atal氏による“
Code−exited  linear  pred
iction:  High  quality  s
peech  at  verylow  bit  
rates”(IEEE  Proc.  ICASS
P−85,pp937−940,1985)と題した論
文(文献1)等に記載されているCELP(Code 
 Excited  LPC  Coding)が知ら
れている。この方式では、送信側で、音声信号に線形予
測分析を施して得られる線形予測残差をk次元毎にブロ
ック化し、過去に定めた音源信号を用いて、ブロック化
した線形予測残差から長時間相関(ピッチ相関)成分を
減算することにより音源ベクトルを得る。次に予め作成
した音源コードブックから、音源ベクトルとの2乗距離
が最小となる音源コードベクトルを選択し、その音源コ
ードベクトルに対する最適なゲインを計算する。そして
選択された適応コードベクトル,音源コードベクトル,
それらのゲイン及び線形予測係数を表すインデクスを伝
送する。受信側ではこれらのインデクスを基に音声信号
を再生する。以上の従来方式では、音源コードブックの
ビット数が大きいとき或いはそのコードベクトルの次元
が大きいときに演算量が膨大になるという問題があった
【0003】音源コードブック探索の計算量削減法とし
て、木構造コードブックが知られている。これは例えば
、R.M.Gray氏とH.Abut氏による“Ful
lsearch  and  tree  searc
hed  vector  quantization
  of  speech  waveforms”(
IEEE  Proc.  ICASSP−82,pp
.593−595,1982)(文献2)等を参照でき
る。CELP用に木構造の音源コードブックを作成する
場合、まずトレーニング用の音声信号に線形予測分析を
施して得られる線形予測残差をk次元毎にブロック化し
、過去に定めた音源信号を用いて、ブロック化した線形
予測残差から長時間相関(ピッチ相関)成分を減算し、
音源ベクトルを求める。更に同じ手順で多数の音源ベク
トルを作成する。次にこれらの音源ベクトルで生成され
たk次元信号空間を段階的に繰り返し分割し、分割毎に
各節点でk次元の代表ベクトルを求め、最終段の代表ベ
クトルを符号化におけるコードベクトルとすることによ
りコードブックを作成する。木構造音源コードブックを
探索する場合は、入力された音源ベクトルと各段で分岐
する節点の持つ代表ベクトルとの2乗距離を比較し、距
離の近い方の枝を選択し、次の段の選択された枝へ探索
を進める。これを最終段まで繰り返すことによって、音
源コードベクトルが選択される。
【0004】
【発明が解決しようとする課題】しかしながら従来の探
索法では、入力された音源ベクトルと最終段で選択され
る音源コードベクトルとの距離が最小となる保証がなく
、再生信号の劣化が生じていた。
【0005】本発明の目的は、上述した問題を解決し、
音源信号をより効率的にベクトル量子化するための音源
コードブック探索方式を有する音声符号化方式を提供す
ることにある。
【0006】
【課題を解決するための手段】本発明は、線形予測分析
部と、木構造の各節点に代表ベクトルが付随している音
源コードブックとを有する音声符号化方式において、前
記木構造音源コードブックの根から最終段に至る前記各
節点の代表ベクトルを用いて前記最終段の代表ベクトル
の一つを探索していく過程で、前記最終段を除く少なく
とも一つの段で複数個の節点の代表ベクトルを用いるこ
とを特徴とする。
【0007】
【作用】本発明による音声符号化方式の作用を説明する
。本発明では、まず線形予測した音声信号の線形予測残
差をブロック化し、ブロック化した線形予測残差から適
応コードブックによる予測信号またはピッチ予測信号を
減算し、音源ベクトルを得る。適応コードブックの詳細
は、W.B.Kleijn氏らによる“Improve
d  speech  quality  and  
efficientvector  quantiza
tion  in  SELP”(Proc.ICAS
SP,pp.155−158)と題した論文(文献3)
等を参照できる。次に音源ベクトルに対して、木構造音
源コードブックの探索を行う。図1は、木構造音源コー
ドブックの探索の一例を説明するための図である。ここ
で木構造の深さ2、各節点の枝数3、初段で候補を2個
出すものとしている。各節点の数字は節点の番号である
。括弧内の数字は入力された音源ベクトルに対する各節
点の代表ベクトルの最適度を表す数値であり、ここでは
例として重み付き2乗距離
【数1】
【0008】
【0009】を用いている。ここでxは入力された音源
ベクトル、Hは音源ベクトルxに対応した線形予測係数
から計算された聴感重み付けインパルス応答からなる重
み付け行列、ciはi番目のコードベクトル、γはxの
聴感重み付け再生信号Hxに対するciの最適ゲインで
ある。tは行列,ベクトルの転置を示す。図1における
探索法は以下のようである。まず根に入力した入力ベク
トルと第1段目の各節点(000,001,002)の
代表ベクトルとの距離を求め、距離が小さい方から2個
の節点の候補(001,002)を探す。次に入力ベク
トルと前記2個の候補の節点に属する第2段目の各節点
(110,111,112,120,121,122)
の代表ベクトルとの距離を計算し、距離の最も小さい節
点(120)を探す。最後に、選ばれた節点(120)
の代表ベクトルを出力する。従来法、即ち候補を出さな
い場合は、例えば図1の場合、最終段で歪が最小でない
節点(110)が選ばれるのに対して、本発明では歪が
最小の代表ベクトルを持つ節点を選ぶことができる。こ
れにより再生音声の音質を向上できる。
【0010】
【実施例】図2は第1の発明による音声符号化方式を実
施する符号化装置の一例を示すブロック図である。入力
端子100より音声信号を入力し、1フレーム(例えば
20msec)の音声信号をLPC分析器110とサブ
フレーム分割器130へ送る。LPC分析器110はL
PC分析を行い、LPCパラメータを重み付けフィルタ
140、影響信号減算器150、適応コードブック探索
器160、重み付け再生フィルタ170、木構造コード
ブック候補/音源探索器180、重み付け再生フィルタ
190へ出力する。サブフレーム分割器130は、入力
した1フレーム分の音声信号を例えば4つのサブフレー
ムに分割し、重み付けフィルタ140へ出力する。重み
付けフィルタ140は、LPC分析器110からLPC
パラメータを、サブフレーム分割器130から音声信号
を入力し、聴感重み付けを行う。聴感重み付けの詳細は
前記文献1,3を参照できる。影響信号減算器150は
、重み付けフィルタ140から入力した重み付け信号か
ら、重み付け再生フィルタ190から入力した前サブフ
レームの終わりのLPC次数分の重み付け再生信号によ
る影響信号を減算する。適応コードブック探索器160
は、過去の音源によって作られる適応コードブック中か
ら、影響信号減算器150より入力した信号と2乗距離
が最小であるコードベクトルを選択し、そのコードベク
トルのインデクスをマルチプレクサ165に出力し、そ
のコードベクトルに最適ゲインをかけた信号を出力する
。重み付け再生フィルタ170は、適応コードブック探
索器160からの入力信号を聴感重み付け再生する。 減算器175は、影響信号減算器150の出力から重み
付け再生フィルタ170の出力を減算した信号を出力す
る。木構造コードブック候補/音源探索器180は、減
算器175の出力を入力し、音源コードブック探索を行
い、選択した音源コードベクトルのインデクスをマルチ
プレクサ165に出力し、その最適音源コードベクトル
に最適ゲインをかけた信号を出力する。加算器185は
、適応コードブック探索器160と木構造コードブック
候補/音源探索器180の各出力の和を出力する。重み
付け再生フィルタ190は、加算器185の出力を入力
し、その入力信号の聴感重み付け再生信号を影響信号減
算器150へ出力する。
【0011】図3は、図2における木構造コードブック
候補/音源探索器180において、木構造の深さを3、
各段で選ばれる候補数を2とした場合の一例を示すブロ
ック図である。入力端子200は、図2の減算器175
の出力を入力し、第1段目代表ベクトル探索器210、
第2段目代表ベクトル探索器220及び出力音源コード
ベクトル探索器230へ送る。入力端子205は、図2
のLPC分析器110の出力を入力し、第1段目代表ベ
クトル探索器210、第2段目代表ベクトル探索器22
0及び出力音源コードベクトル探索器230に送る。第
1段目代表ベクトル探索器210は、入力端子205か
ら入力したLPC係数を用いて、木構造の第1段目の節
点にある代表ベクトルを含む第1段目コードブック21
5から入力する代表ベクトルと入力端子200から入力
した音源ベクトルとの重み付き2乗距離を計算し、重み
付き2乗距離の小さい2つの代表ベクトルのインデクス
を出力する。第2段目代表ベクトル探索器220は、第
2段目コードブック225から、第1段目代表ベクトル
探索器210で選ばれたインデクスが示す節点に対応す
る代表ベクトルと入力端子200からの入力音源ベクト
ルとの前記LPC係数を用いた重み付き2乗距離を計算
し、重み付き2乗距離の小さい2つの代表ベクトルのイ
ンデクスを出力する。出力音源コードベクトル探索器2
30は、第2段目代表ベクトル探索器220で選ばれた
インデクスが示す節点に対応する各代表ベクトルと入力
端子200からの入力音源ベクトルとの前記LPC係数
を用いた重み付き2乗距離を計算し、その内重み付き2
乗距離が最小である代表ベクトルを出力端子240に、
その代表ベクトルのインデクスを出力端子245に出力
する。
【0012】尚、以上の代表ベクトル探索器或はコード
ベクトル探索器で出力される代表ベクトルを選ぶ際に用
いる距離尺度は、重み付き2乗だけでなく任意のものが
使用可能である。また各代表ベクトル探索器での代表ベ
クトルの選び方は距離が小さいものから順に選ぶという
他に、任意の選択の仕方が可能である。更に各段での候
補数は異なってもよい。
【0013】また、段数の増加につれて候補の種類及び
探索回数が指数的に増加するので、各段毎に候補数をあ
らかじめ定められた個数に枝刈りしてもよい。このよう
にすると探索に必要な演算量を低減化できる。
【0014】
【発明の効果】以上に述べたように、本発明によれば、
木構造音源コードブック探索において、各段において複
数個の候補をあげて探索を行うことにより、従来の候補
を出さない場合に比べて良好な音質の音声が得られると
いう大きな効果がある。
【図面の簡単な説明】
【図1】符号化及び音源コードブック作成用のトレーニ
ング信号を作成の際に使用する木構造の音源コードブッ
ク探索の一例を示す図である。
【図2】本発明による音声符号化方式を実施する符号化
装置の一例を示すブロック図である。
【図3】図2の木構造コードブック候補/音源探索器に
おいて、木構造の深さを3とした場合の一例を示すブロ
ック図である。
【符号の説明】
100  入力端子 110  LPC分析器 120  LSP量子化器 130  サブフレーム分割器 140  重み付けフィルタ 150  影響信号減算器 160  適応コードブック器 165  マルチプレクサ 170  重み付け再生フィルタ 175  減算器 180  木構造コードブック候補/音源探索器185
  加算器 190  重み付け再生フィルタ 195  出力端子 200,205  入力端子 210  第1段目代表ベクトル探索器215  第1
段目コードブック 220  第2段目代表ベクトル探索器225  第2
段目コードブック 230  出力音源コードベクトル探索器235  出
力音源コードブック 240,245  出力端子

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】線形予測分析部と、木構造の各節点に代表
    ベクトルが付随している音源コードブックとを有する音
    声符号化方式において、前記木構造音源コードブックの
    根から最終段に至る前記各節点の代表ベクトルを用いて
    前記最終段の代表ベクトルの一つを探索していく過程で
    、前記最終段を除く少なくとも一つの段で複数個の節点
    の代表ベクトルを用いることを特徴とする音声符号化方
    式。
JP3103268A 1991-02-26 1991-02-26 音声符号化方式 Pending JPH04271400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3103268A JPH04271400A (ja) 1991-02-26 1991-02-26 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3103268A JPH04271400A (ja) 1991-02-26 1991-02-26 音声符号化方式

Publications (1)

Publication Number Publication Date
JPH04271400A true JPH04271400A (ja) 1992-09-28

Family

ID=14349675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3103268A Pending JPH04271400A (ja) 1991-02-26 1991-02-26 音声符号化方式

Country Status (1)

Country Link
JP (1) JPH04271400A (ja)

Similar Documents

Publication Publication Date Title
KR100415356B1 (ko) 다중 채널 신호 인코딩 및 디코딩 방법 및 장치
JP3094908B2 (ja) 音声符号化装置
JP3114197B2 (ja) 音声パラメータ符号化方法
RU2005137320A (ru) Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи
JPH04363000A (ja) 音声パラメータ符号化方式および装置
JP3143956B2 (ja) 音声パラメータ符号化方式
JP3254687B2 (ja) 音声符号化方式
KR100194775B1 (ko) 벡터양자화장치
US6330531B1 (en) Comb codebook structure
JP3064947B2 (ja) 音声・楽音符号化及び復号化装置
JP2970407B2 (ja) 音声の励振信号符号化装置
JPH10240299A (ja) 音声符号化及び復号装置
JP2658816B2 (ja) 音声のピッチ符号化装置
JP3238063B2 (ja) ベクトル量子化方法および音声符号化方法
Kroon et al. Experimental evaluation of different approaches to the multi-pulse coder
JPH04271400A (ja) 音声符号化方式
CA2054849C (en) Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
JP3144194B2 (ja) 音声符号化装置
JP3102017B2 (ja) 音声符号化方法
JPH06186998A (ja) 音声符号化装置のコードブック探索方式
JP3192051B2 (ja) 音声符号化装置
JP3335650B2 (ja) 音声符号化方式
JPH05289700A (ja) 音声符号化装置
KR100550002B1 (ko) 음성부호화기에서 적응 코드북 검색기 및 그 방법
JP2808841B2 (ja) 音声符号化方式