JP3428595B2 - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JP3428595B2
JP3428595B2 JP2002161346A JP2002161346A JP3428595B2 JP 3428595 B2 JP3428595 B2 JP 3428595B2 JP 2002161346 A JP2002161346 A JP 2002161346A JP 2002161346 A JP2002161346 A JP 2002161346A JP 3428595 B2 JP3428595 B2 JP 3428595B2
Authority
JP
Japan
Prior art keywords
codebook
distortion
code
sound source
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002161346A
Other languages
English (en)
Other versions
JP2003008446A (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2002161346A priority Critical patent/JP3428595B2/ja
Publication of JP2003008446A publication Critical patent/JP2003008446A/ja
Application granted granted Critical
Publication of JP3428595B2 publication Critical patent/JP3428595B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は音声信号を低いビッ
トレート、特に8kb/s以下で高品質に符号化するた
めの音声符号化方式に関する。 【0002】 【従来の技術】音声信号を8kb/s以下の低いビット
レートで符号化する方式としては、例えば、M.Sch
roeder and B.Atal氏による“Cod
e−excited linear predicti
on: Highquality speech at
very low bit rates”(Pro
c.ICASSP,pp.937−940,1985
年)と題した論文(文献1)や、Kleijn氏らによ
る“Improved speech quality
and efficient vector qua
ntizationin SELP”(Proc.IC
ASSP,pp.155−158,1988年)と題し
た論文(文献2)等に記載されているCELP(Cod
eExcited LPC Coding)が知られて
いる。この方法では、送信側では、フレーム毎(例えば
20ms)に音声信号から音声信号のスペクトル特性を
表すスペクトルパラメータを抽出し、フレームをさらに
サブフレーム(例えば5ms)に分割し、サブフレーム
毎に過去の音源信号をもとに適応コードブックにおける
パラメータ(遅延パラメータとゲインパラメータ)を抽
出し、適応コードブックによりサブフレームの音声信号
をピッチ予測し、ピッチ予測して求めた残差信号に対し
て、予め定められた種類の雑音信号からなる音源コード
ブックから最適音源コードベクトルを選択し最適なゲイ
ンを計算する。音源コードベクトルの選択の仕方は、選
択した雑音信号により合成した信号と、残差信号との誤
差電力を最小化するように一種類の雑音信号を選択す
る。そして選択されたコードベクトルの種類を表すイン
デクスとゲインならびに、前記スペクトルパラメータと
適応コードブックのパラメータを伝送する。受信側の説
明は省略する。 【0003】 【発明が解決しようとする課題】上述した文献1,2の
従来方式では、良好な音質を得るためには音源コードブ
ックのサイズが十分大きい(例えば10ビット)必要が
あった。このため、音源コードブックの探索に膨大な演
算量を必要とした。さらにメモリ量も膨大であり(例え
ば10ビット40次元の場合は、40kワードのメモリ
量)、ハードウェアをコンパクトに実現するのが困難で
あった。また、ビットレートを低減するために、フレー
ム長,サブフレーム長を増大し、コードブックのビット
数を低減せずに次元数を増大すると演算量はきわめて顕
著に増加するという問題点があった。 【0004】コードブックのサイズを低減する方法とし
て、例えばB.Juang氏らによる“Multipl
e stage vector quantizati
onfor speech coding”(Pro
c.ICASSP,pp.597−600,1982
年)と題した論文(文献3)等に記載されているよう
に、コードブックを多段に分割して構成し、各コードブ
ックを独立に探索する多段ベクトル量子化法が知られて
いる。この方法では、コードブックが複数段に分割され
ているので、1段あたりのコードブックのサイズは例え
ば、B/Lビット(ここでBは全体のビット数、Lは段
数)に低減されるため、コードブック探索に要する演算
量は、L段全体でも、Bビット1段に比べ、L×2B/L
に低減される。また、コードブック格納に必要なメモリ
量も同様に低減される。しかし、この方法では、各段の
コードブックを独立に学習,探索しているので、Bビッ
ト1段に比べ、性能は大きく低下するという問題点があ
った。 【0005】本発明の目的は、上述した問題点を解決
し、比較的少ない演算量及びメモリ量により、8kb/
s以下、特に4.8kb/s以下で音質の良好な音声符
号化方式を提供することにある。 【0006】 【課題を解決するための手段】本発明は、入力した音声
信号を予め定められた時間長のフレームに分割し、前記
音声信号のスペクトル包絡を表すスペクトルパラメータ
を求め、前記フレームを予め定められた時間長のサブフ
レームに分割し、前記サブフレーム毎に過去の音源信号
をもとにして適応コードブックにおけるパラメータを求
め、予め構成された音源コードブックから最適なコード
ベクトルを探索して前記音声信号を量子化する音声符号
化方式において、前記音源コードブックが複数のコード
ブックの多段縦続接続で構成され、少なくとも一つの段
では量子化歪の小さい順にコードベクトルを復数候補出
力し、予め定められた段数全体で歪を累積して求めた累
積歪あるいは最終段の量子化歪を最小化する候補の組を
出力することにより前記音声信号を量子化することを特
徴とする。 【0007】本発明による音声符号化方式の作用を示
す。 【0008】図1は、本発明の構成を示すブロック図で
ある。 【0009】図において、音声信号をフレーム(例えば
30ms)に分割し、スペクトルパラメータ計算部15
0において、周知のLPC分析によりスペクトルパラメ
ータとして、LPCパラメータを求める。さらにフレー
ムの音声をサブフレーム(例えば7.5ms)に分割す
る。 【0010】次に、適応コードブック部160では、サ
ブフレーム毎の音声信号に対して、過去のサブフレーム
で計算した音源信号をもとにパラメータとして遅延T,
ゲインβを求める。適応コードブックのパラメータの計
算法は、前記文献1,2等を参照できる。そして下式に
より適応コードブックによる予測値を減算する。 【0011】 【数1】 【0012】本発明の特徴は、音源コードブックが複数
個の異なるコードブックの多段縦続接続により構成さ
れ、少なくとも一つの段において歪の小さい順に複数個
のコードブック候補を出力することにある。以下では、
簡単のために、2段のコードブックの縦続接続により音
源コードブックが構成されるとする。音源コードブック
探索部170は、あらかじめ学習して構成したコードブ
ック1801,1802を用いて、ew(n)を表すコー
ドベクトルの候補を出力する。この動作を以下で説明す
る。以下では初段においてM種類のコードベクトル候補
を出力するものとする。まず、初段ではコードブック1
を用いて下式により量子化歪を求める。 【0013】 【数2】 【0014】ここでγ1j,c1j(n),hw(n),N
はそれぞれ、最適ゲイン,コードブック1のj番目のコ
ードベクトル(j=1〜2B1:B1はコードブック1の
ビット数),スペクトルパラメータから求めた聴感重み
付けインパルス応答,サブフレーム長を表すサンプル数
である。ここで聴感重み付けインパルス応答の求め方は
前記文献1,2等を参照できる。記号*は畳み込み積分
を示す。Nはサブフレーム長を示すサンプル数である。
初段では、数2の量子化歪の小さい順に複数種類(例え
ばM種類)のコードベクトルを求め、このときの各候補
の量子化歪を記憶する。また、各候補に対して下式によ
り誤差信号を計算する。 【0015】 【数3】 【0016】ここでew′k(n)は、k番目の候補に対
して計算した誤差信号を示す。 【0017】次に2段目では、コードブック1802
用いて初段の各候補に対して下式を最小化する最適コー
ドベクトルを求め、そのときの量子化歪を、対応する初
段での候補の歪に加算して累積歪を求める。 【0018】 【数4】 【0019】ただし、l=1〜2B2:B2はコードブッ
ク2のビット数を示す。また、B=B1+B2:Bは2
段のコードブック全体のビット数である。 【0020】次に、前記累積歪を最小化する初段,2段
目の候補の組合せを選択し、選択されたコードベクトル
を出力する。 【0021】なお、候補の組合せの選択の尺度には、累
積歪以外にも、数4で示される2段目の量子化歪を最小
化する候補の組合せを選択してもよい。また、縦続接続
の段数は任意に設定できる。 【0022】なお、コードブック1,2としては、前記
文献1,2のようにガウス乱数信号から構成してもよい
し、あらかじめ多量のトレーニング信号を用いて学習し
て構成してもよい。後者の構成法については、例えば特
願平2−42956号明細書(文献4)等を参照でき
る。以上で本発明の作用の説明を終える。 【0023】さらに性能を改善するためには、複数種類
の候補を出力するという条件でコードブック全体で最適
になるように、各段のコードブックを学習してもよい。 【0024】次に、本発明に関連する発明の作用を図2
を用いて説明する。図2において図1と同一の番号を付
した構成要素は、同一の動作を行うので説明は省略す
る。第2の発明では、音源コードブックの構成と探索法
が本発明と異なるので、この点について説明する。音源
コードブックの次元数はサブフレーム長よりも短くす
る。以下では一例として、次元数はサブフレーム長Nの
1/2のN/2とする。従って、コードブック210
1 ,コードブック2102 の次元数はN/2とする。ま
た、縦続接続の段数は以下では一例として2とする。 【0025】まず、サブフレームの前半N/2サンプル
に対して、初段ではコードブック1を用いて下式により
量子化歪を求める。 【0026】 【数5】 【0027】ここでγ1j,c1j(n),hw(n)はそ
れぞれ、最適ゲイン,コードブック1のj番目のコード
ベクトル(j=1〜2B1:B1はコードブック1のビッ
ト数),スペクトルパラメータから求めた聴感重み付け
インパルス応答である。初段では、数5の量子化歪の小
さい順に複数種類(例えばM種類)のコードベクトルを
求め、このときの各候補の量子化歪を記憶する。また、
各候補に対して下式により誤差信号を計算する。 【0028】 【数6】 【0029】次に2段目では、コードブック2102
用いて初段の各候補に対して下式を最小化する最適コー
ドベクトルを求め、そのときの量子化歪を、対応する初
段での候補の歪に加算して累積歪を求める。 【0030】 【数7】 【0031】ただし、l=1〜2B2:B2はコードブッ
ク2のビット数を示す。また、B/2=B1+B2:B
はサブフレーム全体のビット数である。 【0032】次に、サブフレーム後半のN/2サンプル
に対して、上記で求まったコードベクトルの各候補に対
して下式を計算する。 【0033】 【数8】 【0034】ここでswk(n)は前記コードベクトルの
k番目の候補について、サブフレーム後半に及ぼす影響
信号である。 【0035】次に、コードブック1を用いて下式の量子
化歪の小さい順にM種の候補を出力し、そのときの量子
化歪を累積する。 【0036】 【数9】 【0037】また、各候補に対して下式により誤差信号
を計算する。 【0038】 【数10】 【0039】次に2段目では、コードブック2102
用いて初段の各候補に対して下式を最小化する最適コー
ドベクトルを求め、そのときの量子化歪を、対応する初
段での候補の歪に加算して累積歪を求める。 【0040】 【数11】 【0041】次に、サブフレーム全体での累積歪を求
め、前記累積歪を最小化するサブフレーム全体での候補
の組合せを選択し、選択されたコードベクトルを出力す
る。前述の説明では、サブフレームの前半と後半で同一
のコードブックを用いたが、前半と後半で異なるコード
ブックを用いることもできる。 【0042】以上で本発明に関係する発明の作用の説明
を終える。 【0043】 【発明の実施の形態】図3は本発明による音声符号化方
式を実施する音声符号化装置の一例を示すブロック図で
ある。 【0044】図において、送信側では、入力端子400
から音声信号を入力し、1フレーム分(例えば30m
s)の音声信号をバッファメモリ410に格納する。 【0045】LPC分析回路430は、フレームの音声
信号のスペクトル特性を表すパラメータとして、LSP
パラメータを前記フレームの音声信号から周知のLPC
分析を行い予め定められた次数Pだけ計算する。この具
体的な計算法については、Sugamura氏らによる
“Quantizer design in LSPs
peech analysis−synthesis”
と題した論文(文献5)等を参照することができる。 【0046】次にLSP量子化回路440は、LSPパ
ラメータを予め定められた量子化ビット数で量子化し、
得た符号lkをマルチプレクサ560へ出力するととも
に、これを復号化してさらに線形予測係数ai′(i=
1〜P)に変換して重み付け回路500,インパルス応
答計算回路470へ出力する。LSPパラメータの符号
化,LSPパラメータから線形予測係数への変換の方法
については、前記文献5等を参照できる。また、LSP
をより効率的に符号化するためにベクトル−スカラ量子
化やベクトル量子化を用いることもできる。前者の具体
的な方法としては、例えばMoriya氏らによる“T
ransform codingofspeech u
sing a weighted vector qu
antizer”と題した論文(IEEE J.Se
l.Areas Commun.,pp.425−43
1,1988年)(文献6)等を参照できる。 【0047】サブフレーム分割回路450は、フレーム
の音声信号をサブフレームに分割する。ここで例えばサ
ブフレーム長は7.5msとする。 【0048】重み付け回路500は、サブフレームに分
割した信号に対して前記文献1,2に記載の方法を用い
て聴感重み付けを行う。 【0049】減算器490は、聴感重み付けされた信号
から合成フィルタ581の出力を減算して出力する。 【0050】インパルス応答計算回路470は、聴感重
み付けした合成フィルタのインパルス応答hw(n)
を、予め定められたサンプル数Lだけ計算する。具体的
な計算法は、前記文献1,2,3等を参照できる。 【0051】適応コードブック510は、合成フィルタ
581の入力信号v(n)を入力し、さらにインパルス
応答出力回路470から重み付けインパルス応答h
w(n)、減算器490から重み付け信号を入力し、長
期相関にもとづくピッチ予測を行い、ピッチパラメータ
として遅延Mとゲインβを計算する。適応コードブック
の次数は1とする。1次の適応コードブックにおける遅
延M,ゲインβの計算法は、前記文献2等を参照でき
る。 【0052】また、数1に従い残差信号を計算し出力す
る。数1でv(n)は過去の音源信号で、合成フィルタ
581の入力信号である。hw(n)はインパルス応答
計算回路470で求めた重み付けインパルス応答であ
る。 【0053】音源コードブックは、ここでは2種類の異
なるコードブック5401と5402の2段縦続接続で表
せるものとする。音源コードブック探索回路530の動
作を図4に示す。図4において、数2の量子化歪計算回
路605は、端子600から信号ew(n)を入力し、
端子602から重み付けインパルス応答hw(n)を入
力し、コードブック5401を用いて、数2の量子化歪
を計算する。ここで数2を直接計算しても良いし、数2
を変形して相関演算により計算してもよい。後者の方法
は前記文献4等を参照できる。 【0054】次にM候補選択回路610では、数2の量
子化歪の小さい順にコードベクトルをM候補選択し減算
器615へ出力すると共に、各候補の量子化歪を累積歪
計算回路625へ出力する。 【0055】減算器615は、数3を用いて、各候補に
対して誤差信号e′kw(n)を計算する。 【0056】数4の量子化歪計算回路620は、各候補
に対する誤差信号に対して、コードブック2を用いて数
4を用いて、最適なコードベクトルを求め、このときの
量子化歪を累積歪計算回路625へ出力する。 【0057】累積歪計算回路625は、2段全体で累積
した量子化歪あるいは、2段目の量子化歪を最小化する
コードベクトルの候補の組合せを選択して出力する。 【0058】音源コードブックは、課題を解決するため
の手段の項に述べたように、ガウス正の乱数信号から構
成(乱数コードブック)してもよいし、トレーニング信
号に対して予め学習して構成(学習コードブック)して
もよい。また、学習コードブックと乱数コードブックの
両方を用いて構成してもよい。 【0059】図3にもどって、ゲインコードブック55
0は、適応コードブック510と音源コードブック53
0のゲインをベクトル量子化する。ここで、ゲインコー
ドブック555において、下式を最小化するゲインコー
ドベクトルを選択し、出力する。 【0060】 【数12】 【0061】ここでβ′,γ1′,γ2′は、それぞれ適
応コードブックのゲイン、コードブック1のゲイン、コ
ードブック2のゲインに対応したゲインコードベクトル
である。またゲインコードブック550は下式により音
源信号を計算し、合成フィルタ581へ出力する。 【0062】 【数13】 【0063】合成フィルタ581は、v(n)を入力
し、下式により聴感重み付け合成音声を1サブフレーム
分求め、さらにもう1サブフレーム分は0の系列をフィ
ルタに入力して重み付け応答信号系列を求め、1サブフ
レーム分の重み付け応答信号系列を減算器490に出力
する。 【0064】 【数14】 【0065】ただし 【0066】 【数15】【0067】ここでδは聴感重み付けの程度を決める係
数であり、0<γ<1に選ぶ。 【0068】マルチプレクサ560は、LSP量子化器
440,適応コードブック510,音源コードブック探
索回路530,ゲインコードブック550の出力符号系
列を組み合わせて出力する。 【0069】以上で本発明の実施の形態の説明を終え
る。 【0070】本発明に関連する発明では、音源コードブ
ック探索回路及び、コードブック1,コードブック2の
動作が本発明と異なるので、これらについて説明する。
図5は、本発明に関連する発明における音源コードブッ
ク探索回路の構成を説明したブロック図である。音源コ
ードブックの次元数はサブフレーム長よりも短くする。
以下では一例として、次元数はサブフレーム長Nの1/
2のN/2とする。従って、コードブック7401,コ
ードブック7402の次元数はN/2とする。また、縦
続接続の段数は以下では一例として2とする。図におい
て、端子700からサブフレームの前半N/2のサンプ
ルを入力する。このとき、スイッチ703は下側に倒
す。数5式の量子化計算回路705は、コードブック1
を用いて数5により量子化歪を求める。M候補選択回路
710では、量子化歪の小さい順に複数種類(例えばM
種類)のコードベクトルを求め、このときの各候補の量
子化歪を累積歪計算回路725に出力する。 【0071】減算器715は、各候補に対して数6によ
り誤差信号を計算する。 【0072】次に、数7の量子化歪計算回路720で
は、コードブック7402を用いて、各候補に対して数
7を最小化するコードベクトルを選択し、このときの量
子化歪を累積歪計算回路725へ出力する。 【0073】累積歪計算回路725は各候補ごとに2段
累積した量子化歪を求める。 【0074】次に、減算器704では、サブフレーム後
半のN/2サンプルを端子701から入力し、上記で求
まったコードベクトルの各候補に対して数8を計算す
る。スイッチ703は上側に倒し、サブフレーム後半の
N/2サンプルに対して、量子化歪計算回路705,M
候補選択回路710,量子化歪計算回路720,累積歪
計算回路725は上記の動作を繰り返し、累積歪計算回
路725において、サブフレーム全体の累積歪を計算
し、累積歪を最小化するコードベクトルの組合せを求
め、端子730から出力する。 【0075】音源コードブックは、作用の項に述べたよ
うに、ガウス性の乱数信号から構成(乱数コードブッ
ク)してもよいし、トレーニング信号に対して予め学習
して構成(学習コードブック)してもよい。また、学習
コードブックと乱数コードブックの両方を用いて構成し
てもよい。 【0076】以上で本発明に関連する発明の説明を終え
る。 【0077】音源コードブックの縦続接続の段数は、2
段以上の任意の段数を用いることができる。 【0078】また、音源コードブックの学習は、トレー
ニング信号を用いて、1段毎に行っても良いし、複数段
での歪を最小化するように、同時に最適化するように学
習してもよい。さらに、各段で複数種類の候補を出力す
ることを考慮して学習してもよい。例えば、2段のとき
は、1段目を最適化した後に、1段目と共に2段目を最
適化し、これらの最適化を歪の低減が飽和するまで繰り
返す。 【0079】また、コードブック1,2は全探索型のコ
ードブックでもよいし、探索に要する演算量をさらに低
減するために、木探索型のコードブックでもよい。木探
索型のコードブックの構成法は、例えばR.Gray
“Vector quantization”と題した
論文(IEEE ASSP Magazine,pp.
4−29,1984年)(文献7)等を参照できる。 【0080】また、本発明に関連する発明では、サブフ
レームの前半では、コードブック2でのコードベクトル
選択においても複数種類の候補を選択し累積歪を計算す
るようにしてもよい。また、サブフレーム前半と後半
は、異なるコードブックを用いてもよい。 【0081】上述の実施の形態では、適応コードブック
のゲイン、第1,第2のコードブックのゲインには同時
最適化を施さなかったが、適応コードブック,第1のコ
ードブック,第2のコードブックのゲインについて、同
時最適化を行うことにより、さらに特性が改善される。
この同期最適化は、コードブック1,コードブック2の
コードベクトルを選択するときに適用するときわめて効
果的である。同時最適化の方法としては、例えば、適応
コードブックの遅延,ゲインβを求めた後に、コードブ
ック1のコードベクトルc1j(n)、ゲインγ1を探索
するときに、各コードベクトル毎に、次式を最小化する
ように解いてβとγ1 を同時最適化する。 【0082】 【数16】【0083】次に、コードブック2のコードベクトルを
選択するときに、各コードベクトル毎に次式を最小化す
るように適応コードブックのゲイン、コードブック1,
コードブック2のゲインを同時最適化する。 【0084】 【数17】 【0085】また、演算量を低減化するためには、コー
ドブック1,2の探索のときにはゲインの同時最適化を
行わずに、コードブック1でM候補選択した後に、選択
した候補に対してのみ数16から適応コードブックとの
間でゲインの同時最適化を行い、次にコードブック2で
コードベクトルを選択した後に、数17から、適応コー
ドブック、コードブック1との間でゲインの同時最適化
を行う構成をとることもできる。 【0086】また、さらに演算量を低減化するために
は、累積歪計算回路において、累積歪を最小化するコー
ドブック1,2のコードベクトルの組が選択された後
に、適応コードブックのゲインβと、第1,第2のコー
ドブックのゲインγ1,γ2の3種を数17から同時に最
適化するような構成とすることもできる。 【0087】また、ゲインの同期最適化を行うための別
の方法として、コードブック1の探索のときにコードベ
クトルを適応コードブックに直交化させた後に探索し、
コードブック2の探索のときには、コードベクトルを適
応コードブック及びコードブック1で選択されたコード
ベクトルに直交化させて探索する構成とすることもでき
る。直交化の方法としては、例えば、I.Gerson
氏らによる“Vector sum excited
linear prediction(VSELP)s
peech coding at 8kb/s”と題し
た論文(Proc.ICASSP,pp.461−46
4,1990年)(文献8)等を参照できる。 【0088】実施の形態では、各段のコードブック毎に
最適ゲインを求めたが、複数段のコードブックをまとめ
て1つのゲインとしてもよいし、全段のコードブックを
まとめて1つのゲインとすることもできる。このように
すると、ゲインを伝送するときのビット数を低減できる
ので、さらにビットレートを低減できる。 【0089】また、上記の実施例では、スペクトルパラ
メータとしてKパラメータ,LSPパラメータを符号化
し、その分析法としてLPC分析を用いたが、スペクト
ルパラメータとしては他の周知なパラメータ、例えばL
PCケプストラム,ケプストラム,改良ケプストラム,
一般化ケプストラム,メルケプストラムなどを用いるこ
ともできる。また各パラメータに最適な分析法を用いる
ことができる。 【0090】また、フレームで求めたLPC係数をLS
P上や線形予測係数上でサブフレーム毎に線形、あるい
は非線形に補間し、補間した係数を用いて適応コードブ
ック、コードブック1,2の探索を行う構成としてもよ
い。このような構成とすることにより、音質がさらに改
善される。 【0091】また、LSP係数は周知の方法により、ベ
クトル量子化、あるいはベクトル−スカラ量子化、さら
には複数のサブフレームのLSPをまとめてマトリクス
量子化することにより、さらに効率的に符号化すること
ができる。ベクトル−スカラ量子化の方法については例
えば前記文献4等を参照できる。 【0092】また、演算量を低減するために、重み付け
回路500をサブフレーム分割回路450の前に配置さ
せ、合成フィルタ581では下式により重み付け合成信
号を計算するようにしてもよい。 【0093】 【数18】 【0094】ここでδは聴感重み付けの程度を決める重
み付け係数である。 【0095】また、実施の形態では、適応コードブック
のパラメータは音源コードブックを探索する前に1種類
に決定していたが、例えば遅延パラメータについて、複
数種類の候補を出力し、遅延パラメータの各候補に対し
て音源コードブックを探索し、適応コードブックと音源
コードブックとの累積歪を最小化する適応コードブック
と音源コードベクトルとの組合せをサブフレーム毎に選
択する構成とすることもできる。このようにすると演算
量は増加するが、性能は改善される。 【0096】また、さらに性能を改善するために、LS
P係数,適応コードブックのパラメータ,音源コードブ
ックのコードベクトル,ゲインコードブックの少なくと
も1つをサブフレームで一意に決定するのではなく、デ
レイドデシジョン(遅延決定法)を取り入れることもで
きる。例えば、適応コードブックのパラメータと音源コ
ードブックのコードベクトルに対してデレイドデシジョ
ンを行うときは、サブフレームでは適応コードブックと
音源コードブックで複数種類の候補を求め、各候補の組
合せに対して複数サブフレーム(例えばLサブフレー
ム)にわたり累積歪を計算し、Lサブフレーム全体で累
積歪を最小化する適応コードブックのパラメータと音源
コードベクトルの組合せを選択する構成とすることもで
きる。このような構成とすると、演算量はさらに増大す
るが性能はさらに改善される。 【0097】 【発明の効果】以上述べたように、本発明によれば、音
源コードブックが複数のコードブックの多段縦続接続で
構成され、少なくとも一つの段では量子化歪の小さい順
にコードベクトルを複数候補出力し、予め定められた段
数全体で歪を累積して求めた累積歪あるいは最終段の量
子化歪を最小化する候補の組を出力することにより前記
音声信号を量子化するために、各段のコードブックのビ
ット数は従来方式の1/段数でよいので、コードブック
探索の演算量を大幅に低減化し、コードブック蓄積のた
めのメモリ量を低減化できる。この場合、少なくとも1
つの段では複数種類の候補出力し累積歪を最小化するよ
うに候補の組合せを求めるので、従来多段構成に比べ、
性能を改善できる。またこのときに、ゲインの同時最適
化等と組み合わせることにより、さらに良好な音質の再
生音声を得ることができる。
【図面の簡単な説明】 【図1】本発明による音声符号化方式の作用を説明する
ためのブロック図である。 【図2】本発明に関連する発明による音声符号化方式の
作用を説明するためのブロック図である。 【図3】本発明による音声符号化方式を実施する装置の
一例を示すブロック図である。 【図4】本発明による音源コードブック探索回路の構成
を示すブロック図である。 【図5】本発明に関連する発明による音源コードブック
探索回路の構成を示すブロック図である。 【符号の説明】 150 スペクトルパラメータ計算部 160 適応コードブック部 170,200 音源コードブック探索部 1801,2101 コードブック1 1802,2102 コードブック2 410 バッファメモリ 430 LP分析算回路 440 LSP量子化回路 450 サブフレーム分割回路 470 インパルス応答計算回路 490,615,704,715 減算器 500 重み付け回路 510 適応コードブック 530 音源コードブック探索回路 5401,7401 コードブック1 5402,7402 コードブック2 550 ゲインコードブック 560 マルチプレクサ 605 数2の量子化歪計算回路 610,710 M候補選択回路 620 数4の量子化歪計算回路 625,725 累積歪計算回路 703 スイッチ 705 数5の量子化歪計算回路 720 数7の量子化歪計算回路
フロントページの続き (56)参考文献 特開 平1−205638(JP,A) 特開 昭64−74883(JP,A) 特開 平1−218280(JP,A) 特開 昭62−188575(JP,A) 特開 昭63−227141(JP,A) 特開 昭61−174824(JP,A) 特開 平1−194756(JP,A) 特開 平1−144598(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 G10L 19/12 H03M 7/36

Claims (1)

  1. (57)【特許請求の範囲】 【請求項1】入力した音声信号を予め定められた時間長
    のフレームに分割し、前記音声信号のスペクトル包絡を
    表すスペクトルパラメータを求め、前記フレームを予め
    定められた時間長のサブフレームに分割し、前記サブフ
    レーム毎に過去の音源信号をもとにして適応コードブッ
    クにおけるパラメータを求め、予め構成された音源コー
    ドブックから最適なコードベクトルを探索して前記音声
    信号を量子化する音声符号化方式において、 前記音源コードブックが複数のコードブックの多段縦続
    接続で構成され、少なくとも一つの段では量子化歪の小
    さい順にコードベクトルを複数候補出力し、最終段の量
    子化歪を最小化する候補の組を出力することにより前記
    音声信号を量子化することを特徴とする音声符号化方
    式。
JP2002161346A 2002-06-03 2002-06-03 音声符号化方式 Expired - Lifetime JP3428595B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002161346A JP3428595B2 (ja) 2002-06-03 2002-06-03 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002161346A JP3428595B2 (ja) 2002-06-03 2002-06-03 音声符号化方式

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP15656591A Division JP3335650B2 (ja) 1991-06-27 1991-06-27 音声符号化方式

Publications (2)

Publication Number Publication Date
JP2003008446A JP2003008446A (ja) 2003-01-10
JP3428595B2 true JP3428595B2 (ja) 2003-07-22

Family

ID=19194956

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002161346A Expired - Lifetime JP3428595B2 (ja) 2002-06-03 2002-06-03 音声符号化方式

Country Status (1)

Country Link
JP (1) JP3428595B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1279684C (en) * 1984-10-02 1991-01-29 Takahiro Sakakino Pressure sensitive switch
RU2013111526A (ru) * 2010-09-17 2014-10-27 Панасоник Корпорэйшн Устройство квантования и способ квантования

Also Published As

Publication number Publication date
JP2003008446A (ja) 2003-01-10

Similar Documents

Publication Publication Date Title
JP3114197B2 (ja) 音声パラメータ符号化方法
JP2746039B2 (ja) 音声符号化方式
EP0443548B1 (en) Speech coder
JP3151874B2 (ja) 音声パラメータ符号化方式および装置
JP3196595B2 (ja) 音声符号化装置
JP3094908B2 (ja) 音声符号化装置
JP3143956B2 (ja) 音声パラメータ符号化方式
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JPH0353300A (ja) 音声符号化装置
JP2800618B2 (ja) 音声パラメータ符号化方式
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JP3089769B2 (ja) 音声符号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP2624130B2 (ja) 音声符号化方式
JP3148778B2 (ja) 音声の符号化方法
JP3428595B2 (ja) 音声符号化方式
KR20130112869A (ko) 양자화 장치 및 양자화 방법
JP3360545B2 (ja) 音声符号化装置
JP3256215B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3194930B2 (ja) 音声符号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JP3335650B2 (ja) 音声符号化方式
JP3299099B2 (ja) 音声符号化装置
JP3144194B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030415

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090516

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100516

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 9

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 9