JPH1069297A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH1069297A
JPH1069297A JP8261121A JP26112196A JPH1069297A JP H1069297 A JPH1069297 A JP H1069297A JP 8261121 A JP8261121 A JP 8261121A JP 26112196 A JP26112196 A JP 26112196A JP H1069297 A JPH1069297 A JP H1069297A
Authority
JP
Japan
Prior art keywords
pulse
sound source
pulses
output
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8261121A
Other languages
English (en)
Other versions
JP3360545B2 (ja
Inventor
Kazunori Ozawa
小澤一範
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP26112196A priority Critical patent/JP3360545B2/ja
Priority to CA002301994A priority patent/CA2301994C/en
Priority to CA002301995A priority patent/CA2301995C/en
Priority to CA002213909A priority patent/CA2213909C/en
Priority to US08/917,713 priority patent/US5963896A/en
Priority to DE69725945T priority patent/DE69725945T2/de
Priority to DE69727256T priority patent/DE69727256T2/de
Priority to EP97114753A priority patent/EP0834863B1/en
Priority to EP01119628A priority patent/EP1162604B1/en
Priority to EP01119627A priority patent/EP1162603B1/en
Priority to DE69732384T priority patent/DE69732384D1/de
Publication of JPH1069297A publication Critical patent/JPH1069297A/ja
Application granted granted Critical
Publication of JP3360545B2 publication Critical patent/JP3360545B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】低ビットレートでも良好な音質を得る。 【解決手段】音声符号化装置の音源量子化部360にお
いて、音源信号を個数Mの非零のパルスから構成し、ス
ペクトルパラメータを用いて前記パルスの位置を探索す
る際に、Mより小さい個数毎にゲインを変化させながら
パルスの位置を探索し、出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を低いビ
ットレートで高品質に符号化するための音声符号化装置
に関するものである。
【0002】
【従来の技術】音声信号を高能率に符号化する方式とし
ては、例えば、M.Schroeder and B.Atal氏による”Code
-excited linear prediciton: High quality speech at
verylow bit rates”(Proc. ICASSP, pp. 937-940,19
85年)と題した論文(文献1)や、Kleijn氏らによる”
Improved speech quality and efficeint vector quant
ization in SELP”(Proc. ICASSP, pp. 155-158,1988
年)と題した論文(文献2)などに記載されているCE
LP(Code Excited Linear Predictive Coding)が知
られている。この従来例では、送信側では、フレーム毎
(例えば20ms)に音声信号から線形予測(LPC)
分析を用いて、音声信号のスペクトル特性を表すスペク
トルパラメータを抽出する。フレームをさらにサブフレ
ーム(例えば5ms)に分割し、サブフレーム毎に過去
の音源信号を基に適応コードブックにおけるパラメータ
(ピッチ周期に対応する遅延パラメータとゲインパラメ
ータ)を抽出し、適応コードブックにより前記サブフレ
ームの音声信号をピッチ予測する。ピッチ予測して求め
た音源信号に対して、予め定められた種類の雑音信号か
らなる音源コードブック(ベクトル量子化コードブッ
ク)から最適な音源コードベクトルを選択し、最適なゲ
インを計算することにより、音源信号を量子化する。音
源コードベクトルの選択の仕方は、選択した雑音信号に
より合成した信号と、前記残差信号との誤差電力を最小
化するように行う。そして、選択されたコードベクトル
の種類を表すインデクスとゲインならびに、前記スペク
トルパラメータと適応コードブックのパラメータをマル
チプレクサ部により組み合わせて伝送する。受信側の説
明は省略する。
【0003】
【発明が解決しようとする課題】前記従来法では、音源
コードブックから最適な音源コードベクトルを選択する
のに多大な演算量を要するという問題があった。これ
は、文献1や2の方法では、音源コードベクトルを選択
するのに、各コードベクトルに対して一旦フィルタリン
グもしくは畳み込み演算を行ない、この演算をコードブ
ックに格納されているコードベクトルの個数だけ操り返
すことに起因する。例えば、コードブックのビット数が
Bビットで、次元数がNのときは、フィルタリングある
いは畳み込み演算のときのフィルタあるいはインパルス
応答長をKとすると、演算量は1秒当たり、N×K×2
B×8000/Nだけ必要となる。一例として、B=1
0、N=40、k=10とすると、1秒当たり81,9
20,000回の演算が必要となり、極めて膨大である
という問題点があった。
【0004】音源コードブック探索に必要な演算量を低
減する方法として、種々のものが提案されている。例え
ば、ACELP(Argebraic Code Excited Linear Pred
iction)方式が提案されている。これは、例えば、C.La
flammeらによる“16 kbps wideband speech coding tec
hnique based on algebraic CELP”と題した論文(Pro
c. ICASSP, pp. 13-16,1991)(文献3)等を参照する
ことができる。文献3の方法によれば、音源信号を複数
個のパルスで表し、各パルスの位置を予め定められたビ
ット数で表し伝送する。ここで、各パルスの振幅は+
1.0もしくは−1.0に限定されているため、パルス
探索の演算量を大幅に低減化できる。
【0005】文献3の従来法では、演算量を大幅に低減
化することが可能となるが、音質も充分ではないという
問題点があった。この理由としては、各パルスが正負の
極性のみしか有しておらず、絶対値振幅はパルスの位置
によらず常に1.0であるため、振幅を極めて粗く量子
化したことになり、このために音質が劣化していた。
【0006】さらに、前記文献1−3の方法では、音源
コードブックやパルスを探索する際に、音源信号に乗ず
るゲインを一定であると想定して探索を行なっていた。
従って、ビットレートを低減し音源コードブックのサイ
ズが小さい場合やパルスの個数が少ない場合には、性能
が低下していた。
【0007】本発明の目的は、上述の間題を解決し、ビ
ットレートが低い場合にも、比較的少ない演算量で音質
の劣化の少ない音声符号化方式を提供することにある。
【0008】
【課題を解決するための手段】第1の発明の音声符号化
装置は、入力した音声信号からスペクトルパラメータを
求めて量子化するスペクトルパラメータ計算部と、前記
音声信号の音源信号が個数Mの非零のパルスから構成さ
れ、前記スペクトルパラメータを用いて前記パルスの位
置を探索する際にMよりも小さい個数ごとにゲインを変
化させながらパルスの位置を探索し出力する音源量子化
部とを有することを特徴とする。
【0009】第2の発明の音声符号化装置は、第1の発
明の音源量子化部において、複数個のパルスの振幅もし
くは極性をまとめて量子化するためのコードブックを有
することを特徴とする。
【0010】第3の発明の音声符号化装置は、入力した
音声信号からスペクトルパラメータを求めて量子化する
スペクトルパラメータ計算部と、前記音声信号の音源信
号が個数Mの非零のパルスから構成され、前記スペクト
ルパラメータを用いて前記パルスの位置を探索する際に
Mより小さい個数M1ごとにゲインを変化させながらパ
ルスの位置を探索し出力する第1の音源量子化部と、前
記スペクトルパラメータを用いて予め定められた個数の
パルスの位置を探索して出力する第2の音源量子化部
と、前記第1の音源量子化部と前記第2の音源量子化部
の出力を用いて前記音声との歪みを計算し前記歪みが小
さい音源量子化部を選択することを特徴とする。
【0011】第4の発明の音声符号化装置は、第3の発
明の音源量子化部において、複数個のパルスの振幅もし
くは極性をまとめて量子化するためのコードブックを有
することを特徴とする。
【0012】第5の発明の音声符号化装置は、第3の発
明もしくは第4の発明において、入力した音声信号から
特徴量を求め、前記特徴量から複数種のモードを判別し
モード情報を出力するモード判別回路と、前記モード情
報に応じて前記第1の音源量子化部を用いるか前記第2
の音源量子化部を用いるかを切替えることを特徴とす
る。
【0013】第6の発明の音声符号化装置は、入力した
音声信号からスペクトルパラメータを求めて量子化する
スペクトルパラメータ計算部と、前記スペクトルパラメ
ータからインパルス応答を求めるインパルス応答計算部
と、前記音声信号と前記インパルス応答との相関を計算
する第1の相関計算部と、前記インパルス応答同士の相
関を計算する第2の相関計算部と、前記第1の相関計算
部と前記第2の相関計算部の出力を用いて第1のパルス
を計算する第1のパルス計算部と、前記第1のパルス計
算部の出力を用いて、前記第1の相関計算部の出力を修
正する第3の相関計算部と、前記第3の相関計算部の出
力と前記第2の相関計算部の出力を用いて第2のパルス
を計算する第2のパルス計算部と、前記修正操作とパル
スの計算を予め定められた段数だけ繰り返しながらパル
スを計算することを特徴とする。
【0014】
【発明の実施の形態】図1は本発明による音声符号化装
置の第1の実施の形態を示すブロック図である。図にお
いて、入力端子100から音声信号を入力し、フレーム
分割回路110では音声信号をフレーム(例えば10m
s)毎に分割し、サブフレーム分割回路120では、フ
レームの音声信号をフレームよりも短いサブフレーム
(例えば5ms)に分割する。
【0015】スペクトルパラメータ計算回路200で
は、少なくとも一つのサブフレームの音声信号に対し
て、サブフレーム長よりも長い窓(例えば24ms)を
かけて音声を切り出してスペクトルパラメータを予め定
められた次数(例えば、P=10次)計算する。ここで
スペクトルパラメータの計算には、周知のLPC分析
や、Burg分析等を用いることができる。ここでは、
Burg分析を用いることとする。Burg分析の詳細
については、中溝著による”信号解析とシステム同定”
と題した単行本(コロナ社1988年刊)の82〜87
頁(文献4)等に記載されているので説明は略する。
【0016】さらに、スペクトルパラメータ計算部で
は、Burg法により計算された線形予測係数αi(i
=1,…,10)を量子化や補間に適したLSPパラメ
ータに変換する。ここで、線形予測係数からLSPへの
変換は、菅村他による”線スペクトル対(LSP)音声
分析合成方式による音声情報圧縮”と題した論文(電子
通信学会論文誌、J64−A、pp.599−606、
1981年)(文献5)を参照することができる。例え
ば、第2サブフレームでBurg法により求めた線形予
測係数を、LSPパラメータに変換し、第1サブフレー
ムのLSPを直線補間により求めて、第1サブフレーム
のLSPを逆変換して線形予測係数に戻し、第1,2サ
ブフレームの線形予測係数αiι(i=1,…,10,
ι=1,…,2)を聴感重み付け回路230に出力す
る。また、第2サブフレームのLSPをスペクトルパラ
メータ量子化回路210へ出力する。
【0017】スペクトルパラメータ量子化回路210で
は、予め定められたサブフレームのLSPパラメータを
コードブック220を用いて効率的に量子化し、下式の
歪みを最小化する量子化値を出力する。
【数1】
【0018】ここで、LSP(i),QLSP
(i)j,W(i)はそれぞれ、量子化前のi次目のL
SP、コードブック220に格納されたj番目のコード
ベクトル、重み係数である。
【0019】以下では、量子化法として、ベクトル量子
化を用いるものとし、第2サブフレームのLSPパラメ
ータを量子化するものとする。LSPパラメータのベク
トル量子化の手法は周知の手法を用いることができる。
具体的な方法は例えば、特開平4−171500号公報
(特願平2−297600号)(文献6)や特開平4−
363000号公報(特願平3−261925号)(文
献7)や、特開平5−6199号公報(特願平3−15
5049号)(文献8)や、T.Nomura et al.,による”
LSP Coding Using VQ-SVQWith Interpolation in 4.075
kbps M-LCELPSpeech Coder”と題した論文(Proc. Mob
ile Multimedia Communications, pp.B.2.5,1993)(文
献9)等を参照できるのでここでは説明は略する。
【0020】また、スペクトルパラメータ量子化回路2
10では、第2サブフレームで量子化したLSPパラメ
ータをもとに、第1サブフレームのLSPパラメータを
復元する。ここでは、現フレームの第2サブフレームの
量子化LSPパラメータと1つ過去のフレームの第2サ
ブフレームの量子化LSPを直線補間して、第1サブフ
レームのLSPを復元する。ここで、量子化前のLSP
と量子化後のLSPとの誤差電力を最小化するコードベ
クトルを1種類選択した後に、直線補間により第1サブ
フレームのLSPを復元できる。
【0021】以上により復元した第1サブフレームのL
SPと第2サブフレームの量子化LSPをサブフレーム
毎に線形予測係数αiι'(i=1,…,10,ι=1,
…,2)に変換し、インパルス応答計算回路310へ出
力する。また、第2サブフレームの量子化LSPのコー
ドベクトルを表すインデクスをマルチプレクサ400に
出力する。
【0022】聴感重み付け回路230は、スペクトルパ
ラメータ計算回路200から、各サブフレーム毎に量子
化前の線形予測係数αi(i=1,…,P)を入力し、
前記文献1にもとづき、サブフレームの音声信号に対し
て聴感重み付けを行い、聴感重み付け信号を出力する。
【0023】応答信号計算回路240は、スペクトルパ
ラメータ計算回路200から、各サブフレーム毎に線形
予測係数αiを入力し、スペクトルパラメータ量子化回
路210から、量子化、補間して復元した線形予測係数
αi'をサブフレーム毎に入力し、保持されているフィル
タメモリの値を用いて、入力信号を零d(n)=0とし
た応答信号を1サブフレーム分計算し、減算器235へ
出力する。ここで、応答信号χz(n)は下式で表され
る。
【数2】 但し、n−i≦0のときは
【数3】
【数4】 ここで、Nはサブフレーム長を示す。γは、聴感重み付
け量を制御する重み係数であり、下記の式(6)と同一
の値である。sw(n)、p(n)は、それぞれ、重み
付け信号計算回路の出力信号、後述の式(6)における
右辺第1項のフィルタの分母の項の出力信号をそれぞれ
示す。
【0024】減算器235は、下式により、聴感重み付
け信号から応答信号を1サブフレーム分減算し、xw'
(n)を適応コードブック回路300へ出力する。
【数5】
【0025】インパルス応答計算回路310は、z変換
が下式で表される聴感重み付けフィルタのインパルス応
答hw(n)を予め定められた点数Lだけ計算し、適応
コードブック回路300、音源量子化回路350へ出力
する。
【数6】
【0026】適応コードブック回路300では、重み付
け信号計算回路360から過去の音源信号v(n)を、
減算器235から出力信号xw'(n)を、インパルス応
答計算回路310から聴感重み付けインパルス応答hw
(n)を入力する。ピッチに対応する遅延Tを下式の歪
みを最小化するように求め、遅延を表すインデクスをマ
ルチプレクサ400に出力する。
【数7】 ここで、
【数8】 であり、記号*は畳み込み演算を表す。ゲインβを下式
に従い求める。
【数9】
【0027】ここで、女性音や、子供の声に対して、遅
延の抽出精度を向上させるために、遅延を整数サンプル
ではなく、小数サンプル値で求めてもよい。具体的な方
法は、例えば、P.Kroonらによる、“Pitch predictors
with high temporal resolution”と題した論文(Proc.
ICASSP,pp.661-664,1990年)(文献10)等を参照する
ことができる。
【0028】さらに、適応コードブック回路300では
下式に従いピッチ予測を行ない、予測残差信号z
w(n)を音源量子化回路350へ出力する。
【数10】
【0029】音源量子化回路350では、M個のパルス
をたてる。音源量子化回路350の処理フローを示す流
れ図を図2に示す。ここでは、パルスを2段に分解し、
各段で異なるゲインを乗じながらパルスの位置を探索す
る方法について説明する。なお、段数は任意の値をとる
ことができる。このとき、音源信号c(n)は以下のよ
うに表せる。
【数11】 ここで、M1,M2,sign(k),mk,G1,G2は、そ
れぞれ、1段目のパルスの個数、2段目のパルスの個
数、K番目のパルスの極性、1段目のパルスのゲイン、
2段目のパルスのゲインをそれぞれ示す。また、M1
2=Mである。
【0030】図2において、最初のブロックではz
w(n),hw(n)を入力し、下式に従い、第1の相関
関数d(n),第2の相関関数φを計算する。
【数12】
【数13】
【0031】次のブロックでは、2種の相関関数を用い
て、個数M1(M1≦M)の非零の振幅のパルス(第1の
パルス)の位置を計算する。これには、文献3と同様
に、各パルス毎に、予め定められた位置の候補につい
て、最適なパルスの位置を探索する。
【0032】例えば、各パルスの位置の候補の例は、サ
ブフレーム長をN=40,パルスの個数をM1=5とす
ると、下表のように表せる。
【表1】
【0033】各パルスについて、位置の候補の各々を調
ベ、次式を最大化する位置を最適位置として選択する。
【数14】 ここで、
【数15】
【数16】 である。M1個のパルスの位置が出力される。
【0034】次に、計算したM1個のパルス位置を用い
て、振幅は極性として相関関数d(n)を修正する。下
式に示す。
【数17】
【数18】
【0035】次に、d'(n)とφを用いて、M2個の
パルス(第2のパルス)の位置を計算する。ここで、式
(15)において、d(n)の代わりにd'(n)を使
用し、パルスの個数をM2とすればよい。
【0036】合計でM個のパルスの極性と位置を求め、
ゲイン量子化回路365に出力する。また、パルスの位
置を予め定められたビット数で量子化し、位置を表すイ
ンデクスをマルチプレクサに出力する。また、パルスの
極性をマルチプレクサ400に出力する。
【0037】ゲイン量子化回路365は、ゲインコード
ブック355からゲインコードベクトルを読みだし、選
択された位置に対して、下式を最小化するゲインコード
ベクトルを選択し、最終的に歪みを最小化する振幅コー
ドベクトルとゲインコードベクトルの組合せを選択す
る。
【0038】ここでは、適応コードブックのゲインとパ
ルスで表した音源のゲインG1,G2の3種のゲインを
同時にベクトル量子化する例について示す。
【数19】 ここで、βt'、G1t'、G2t'は、ゲインコードブック3
55に格納された3次元ゲインコードベクトルにおける
k番目の要素である。上式の計算を、ゲインコードベク
トルの各々に対して繰り返し、歪みDtを最小化するゲ
インコードベクトルを選択する。
【0039】選択されたゲインコードベクトルを表すイ
ンデクスをマルチプレクサ400に出力する。
【0040】重み付け信号計算回路360は、それぞれ
のインデクスを入力し、インデクスからそれに対応する
コードベクトルを読みだし、まず下式にもとづき駆動音
源信号v(n)を求める。
【数20】 v(n)は適応コードブック回路300に出力される。
【0041】次に、スペクトルパラメータ計算回路20
0の出力パラメータ、スペクトルパラメータ量子化回路
210の出力パラメータを用いて下式により、応答信号
w(n)をサブフレーム毎に計算し、応答信号計算回
路240へ出力する。
【数21】 以上により、第1の実施の形態の説明を終える。
【0042】第2の実施の形態を示すブロック図を図3
に示す。ここでは、音源量子化回路450の動作が図1
と異なる。音源量子化回路450では、振幅コードブッ
ク451を用いて、パルスの振幅を量子化する。
【0043】M1個のパルスに対して位置が求まった後
で、次式を最大化するように、Q個(Q≧1)の振幅コ
ードベクトル候補を出力する。
【数22】 ここで、
【数23】
【数24】 である。ここで、gkj'は、k番目のパルスのj番目の
振幅コードベクトルである。
【0044】選択されたQ個の振幅コードベクトルの各
々に対して、下式により相関関数を修正する。
【数25】
【0045】次に、Q個のd'(n)の各々に対して、
残りのM2個のパルスについて振幅コードブック451
から振幅コードベクトルを探索する。下式を最大化する
ものを選択する。
【数26】 ここで、
【数27】
【数28】
【0046】以上の処理をQ個のd'(n)だけ繰り返
し、下式による累積値を最大化する組合せを選択する。
【数29】
【0047】選択された振幅コードベクトルを表すイン
デクスをマルチプレクサ400に出力する。また、位置
の値、振幅コードベクトルの値をゲイン量子化回路46
0に出力する。
【0048】ゲイン量子化回路460では、ゲインコー
ドブック355から、下式を最小化するゲインコードベ
クトルを選択する。
【数30】 なお、本実施例では、振幅コードブックを使用したが、
かわりに、各パルスの極性を示す極性コードブックを使
用して探索してもよい。以上で第2の実施の形態の説明
を終える。
【0049】図4は、第3の実施の形態を示すブロック
図である。ここでは、第1の音源量子化回路500は、
パルスを例えば2段に分解し、パルスに乗ずるゲインを
1段目と2段目で変化させながらパルスの位置を探索す
る。ここで、段数は2に限らず、任意の値をとることが
できる。パルスの探索法自体は、図1における音源量子
化回路350と同一の方法を用いる。このときの音源信
号を下式のc1(n)とする。
【数31】 パルスの探索後に、第1の音源による歪みD1を下式か
ら計算する。
【数32】
【0050】上式の代わりに以下の式を用いることもで
きる。
【数33】 ここで、Cj,Ci,Ej,Eiには、パルスの探索が終了
した後の値を使用する。
【0051】第2の音源量子化回路510は、パルスを
分解せずに、M個のパルス全体に対して一定のゲインを
用いながらパルスを探索する。ここで、M>[M1
2]である。また、第2の音源信号c2(n)は下式の
ように表せる。
【数34】 ここで、Gは、M個のパルス全体にかかるゲインであ
る。
【0052】さらに、第2の音源による歪みD2を下式
から計算する。
【数35】
【0053】もしくは、下式から計算することもでき
る。
【数36】 ここで、Cι,Eιには、第2の音源量子化回路でのパ
ルスの探索が終了した後の値を使用する。
【0054】判別回路520は、第1の音源信号c
1(n)、第2の音源信号c2(n)、それらによる歪み
1,D2を入力し、大小判別を行ない、歪みの小さい方
の音源信号をゲイン量子化回路に出力し、判別符号をゲ
イン量子化回路530及び、マルチプレクサ400に出
力する。また、歪みの小さい方の音源信号のパルスの位
置、極性を表す符号をマルチプレクサ400に出力す
る。
【0055】ゲイン量子化回路530は、判別符号を入
力し、第1の音源信号が使用されるときは、ゲイン量子
化回路365と同一の動作を行なう。一方、第2の音源
信号が使用されるときは、ゲインコードブック540か
ら、2次元ゲインコードベクトルを読みだし、下式を最
小化するコードベクトルを探索する。
【数37】 選択されたゲインコードベクトルを表すインデクスをマ
ルチプレクサ400に出力する。以上で第3の実施の形
態の説明を終える。
【0056】図5は、第4の実施の形態を示すブロック
図である。ここでは、第1の音源量子化回路600と第
2の音源量子化回路610の動作が図4と異なる。
【0057】第1の音源量子化回路600では、振幅コ
ードブック451を用いて、音源量子化回路450と同
様に、パルスの振幅を量子化する。
【0058】M1個のパルスに対して位置が求まった後
で、次式を最大化するように、Q個(Q≧1)の振幅コ
ードベクトル候補を出力する。
【数38】 ここで、
【数39】
【数40】 である。ここで、gkj'は、k番目のパルスのj番目の
振幅コードベクトルである。
【0059】選択されたQ個の振幅コードベクトルの各
々に対して、下式により相関関数を修正する。
【数41】
【0060】次に、Q個のd'(n)の各々に対して、
残りのM2個のパルスについて振幅コードブック451
から振幅コードベクトルを探索する。下式を最大化する
ものを選択する。
【数42】 ここで、
【数43】
【数44】
【0061】以上の処理をQ個のd'(n)だけ繰り返
し、下式による累積値を最大化する組合せを選択する。
【数45】
【0062】さらに、第1の音源信号を下式により求め
る。
【数46】
【0063】さらに、第lの音源による歪みD1を下式
から計算し、判別回路520に出力する。
【数47】
【0064】第2の音源量子化回路610は、下式を最
大化するような振幅コードベクトルを探索する。
【数48】 ここで、
【数49】
【数50】
【0065】さらに、第2の音源信号を下式により求め
る。
【数51】
【0066】さらに、第2の音源による歪みD2を下式
から計算し、判別回路520に出力する。
【数52】
【0067】もしくは、下式により求めても良い。
【数53】 ここで、Cι,Eιはそれぞれ、第2の音源パルスを求
めた後の相関値である。
【0068】判別回路520は、第1の音源信号 c1'
(n)、第2の音源信号c2'(n)、それらによる歪み
1',D2'を入力し、大小判別を行ない、歪みの小さい
方の音源信号をゲイン量子化回路に出力し、判別符号を
ゲイン量子化回路530及び、マルチプレクサ400に
出力する。
【0069】図6は第5の実施の形態を示すブロック図
である。ここでは、第3の実施の形態をもとにする例に
ついて示すが、第4の実施の形態をもとにすることもで
きる。
【0070】モード判別回路900は、聴感重み付け回
路230からフレーム単位で聴感重み付け信号を受取
り、モード判別情報を音源量子化回路600へ出力す
る。ここでは、モード判別に、現在のフレームの特徴量
を用いる。特徴量としては、例えば、フレームで平均し
たピッチ予測ゲインを用いる。ピッチ予測ゲインの計算
は、例えば下式を用いる。
【数54】 ここで、Lはフレームに含まれるサブフレームの個数で
ある。Pi、Eiはそれぞれ、i番目のサブフレームでの
音声パワ、ピッチ予測誤差パワを示す。
【数55】
【数56】 ここで、Tは予測ゲインを最大化する最適遅延である。
【0071】フレーム平均ピッチ予測ゲインGを予め定
められた複数個のしきい値と比較して複数種類のモード
に分類する。モードの個数としては、例えば4を用いる
ことができる。モード判別回路900は、モード情報を
音源量子化回路700、マルチプレクサ400へ出力す
る。
【0072】音源量子化回路700は、モード情報を受
けとり、予め定められたモードの際に第1の音源量子化
回路500と同一の動作を行ない、第1の音源信号をゲ
イン量子化回路750に出力する。また、パルスの位置
と極性を表す符号をマルチプレクサ400に出力する。
上記以外のモードのときは、第2の音源量子化回路51
0と同一の動作を行ない、第2の音源信号をゲイン量子
化回路750に出力し、パルスの位置と極性を表す符号
をマルチプレクサ400に出力する。
【0073】ゲイン量子化回路750は、モード情報を
入力し、予め定められたモードのときは、ゲイン量子化
回路365と同一の動作を行なう。その他のモードのと
きは、ゲイン量子化回路530と同一の動作を行なう。
以上で第5の実施の形態の説明を終える。
【0074】上述した実施例に限らず、種々の変形が可
能である。複数パルスの振幅を量子化するためのコード
ブックを、音声信号を用いて予め学習して格納しておく
こともできる。コードブックの学習法は、例えば、Lind
e氏らによる“An algorithm for vector quantization
design,”と題した論文(IEEE Trans. Commun., pp.84-
95,January, 1980)(文献11)等を参照することがで
きる。
【0075】振幅コードブックの代わりに、パルスの個
数に等しいビット数だけ各パルスの極性の組合せを用意
した極性コードブックを有するようにしてもよい。
【0076】ゲインを変化させながらパルスを求めると
きのパルスの個数は、任意の値をとることができる。
【0077】モード情報を用いて適応コードブック回路
や、ゲインコードブックを切替える構成とすることもで
きる。
【0078】パルスの振幅を量子化する際に、L個ずつ
のパルスの各グループについて、振幅コードブック35
1から複数個のコードベクトルを予備選択し、予備選択
されたコードベクトルを用いてパルスの振幅を量子化す
るようにしても良い。この処理により、振幅量子化に要
する演算量を低減化できる。
【0079】予備選択の方法の例を次に示す。式(5
9)もしくは、式(60)を最大化する順に、振幅コー
ドベクトルを複数種類予備選択し、音源量子化回路に出
力する。
【数57】
【数58】
【0080】
【発明の効果】以上説明したように、本発明によれば、
音源量子化部において、音源がM個の振幅が非零パルス
から構成され、前記パルスの位置を探索する際に、Mよ
りも小さい個数ごとにパルスに乗ぜられるゲインを変化
させながらパルスの位置を探索することで、従来よりも
音源の精度を高めることができ性能を改善することがで
きる。
【0081】また、本発明によれば、Mよりも小さい個
数ごとにパルスに乗ぜられるゲインを変化させながらパ
ルスの位置を探索する第1の音源量子化と、ゲインを一
定としてパルスを探索する第2の音源量子化とを有し、
両者の歪みを判別し良好な方を選択することにより、音
声信号の特徴の時間変化に応じて常に良好な音源を用い
ることができるので、従来よりも性能を改善できる。
【0082】さらに、本発明によれば、入力音声から特
徴を抽出してモードを判別し、モードに応じて、第1の
音源量子化と第2の音源量子化とを切替えてパルスを求
めることができるため、より少ない演算量で、音声信号
の特徴の時間変化に応じて常に良好な音源を用いること
ができるので、従来よりも性能を改善できる。
【図面の簡単な説明】
【図1】第1の実施の形態を示す図である。
【図2】音源量子化回路350の処理フローを示す図で
ある。
【図3】第2の実施の形態を示す図である。
【図4】第3の実施の形態を示す図である。
【図5】第4の実施の形態を示す図である。
【図6】第5の実施の形態を示す図である。
【符号の説明】
110 フレーム分割回路 120 サブフレーム分割回路 200 スペクトルパラメータ計算回路 210 スペクトルパラメータ量子化回路 220 LSPコードブック 230 聴感重み付け回路 235 減算回路 240 応答信号計算回路 310 インパルス応答計算回路 350、450、500、600、700 音源量子化
回路 451 振幅コードブック 355 ゲインコードブック 360 重み付け信号計算回路 365、460、530、750 ゲイン量子化回路 400 マルチプレクサ 520 判別回路 89900 モード判別回路

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】入力した音声信号からスペクトルパラメー
    タを求めて量子化するスペクトルパラメータ計算部と、
    前記音声信号の音源信号が個数Mの非零のパルスから構
    成され、前記スペクトルパラメータを用いて前記パルス
    の位置を探索する際にMよりも小さい個数ごとにゲイン
    を変化させながらパルスの位置を探索し出力する音源量
    子化部とを有する音声符号化装置。
  2. 【請求項2】音源量子化部において、複数個のパルスの
    振幅もしくは極性をまとめて量子化するためのコードブ
    ックを有することを特徴とする請求項1に記載の音声符
    号化装置。
  3. 【請求項3】入力した音声信号からスペクトルパラメー
    タを求めて量子化するスペクトルパラメータ計算部と、
    前記音声信号の音源信号が個数Mの非零のパルスから構
    成され、前記スペクトルパラメータを用いて前記パルス
    の位置を探索する際にMより小さい個数M1ごとにゲイ
    ンを変化させながらパルスの位置を探索し出力する第1
    の音源量子化部と、前記スペクトルパラメータを用いて
    予め定められた個数のパルスの位置を探索して出力する
    第2の音源量子化部と、前記第1の音源量子化部と前記
    第2の音源量子化部の出力を用いて前記音声との歪みを
    計算し前記歪みが小さい音源量子化部を選択することを
    特徴とする音声符号化装置。
  4. 【請求項4】音源量子化部において、複数個のパルスの
    振幅もしくは極性をまとめて量子化するためのコードブ
    ックを有することを特徴とする請求項3に記載の音声符
    号化装置。
  5. 【請求項5】入力した音声信号から特徴量を求め前記特
    徴量から複数種のモードを判別しモード情報を出力する
    モード判別回路と、前記モード情報に応じて前記第1の
    音源量子化部を用いるか前記第2の音源量子化部を用い
    るかを切替えることを特徴とする請求項3または4に記
    載の音声符号化装置。
  6. 【請求項6】入力した音声信号からスペクトルパラメー
    タを求めて量子化するスペクトルパラメータ計算部と、
    前記スペクトルパラメータからインパルス応答を求める
    インパルス応答計算部と、前記音声信号と前記インパル
    ス応答との相関を計算する第1の相関計算部と、前記イ
    ンパルス応答同士の相関を計算する第2の相関計算部
    と、前記第1の相関計算部と前記第2の相関計算部の出
    力を用いて第1のパルスを計算する第1のパルス計算部
    と、前記第1のパルス計算部の出力を用いて、前記第1
    の相関計算部の出力を修正する第3の相関計算部と、前
    記第3の相関計算部の出力と前記第2の相関計算部の出
    力を用いて第2のパルスを計算する第2のパルス計算部
    と、前記修正操作とパルスの計算を予め定められた段数
    だけ繰り返しながらパルスを計算することを特徴とする
    音声符号化装置。
JP26112196A 1996-08-26 1996-08-26 音声符号化装置 Expired - Fee Related JP3360545B2 (ja)

Priority Applications (11)

Application Number Priority Date Filing Date Title
JP26112196A JP3360545B2 (ja) 1996-08-26 1996-08-26 音声符号化装置
CA002301995A CA2301995C (en) 1996-08-26 1997-08-25 High quality speech coder at low bit rates
CA002213909A CA2213909C (en) 1996-08-26 1997-08-25 High quality speech coder at low bit rates
CA002301994A CA2301994C (en) 1996-08-26 1997-08-25 High quality speech coder at low bit rates
DE69725945T DE69725945T2 (de) 1996-08-26 1997-08-26 Sprachkodierer mit niedriger Bitrate
DE69727256T DE69727256T2 (de) 1996-08-26 1997-08-26 Sprachkodierer hoher Qualität mit niedriger Bitrate
US08/917,713 US5963896A (en) 1996-08-26 1997-08-26 Speech coder including an excitation quantizer for retrieving positions of amplitude pulses using spectral parameters and different gains for groups of the pulses
EP97114753A EP0834863B1 (en) 1996-08-26 1997-08-26 Speech coder at low bit rates
EP01119628A EP1162604B1 (en) 1996-08-26 1997-08-26 High quality speech coder at low bit rates
EP01119627A EP1162603B1 (en) 1996-08-26 1997-08-26 High quality speech coder at low bit rates
DE69732384T DE69732384D1 (de) 1996-08-26 1997-08-26 Sprachkodierer hoher Qualität mit niedriger Bitrate

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26112196A JP3360545B2 (ja) 1996-08-26 1996-08-26 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH1069297A true JPH1069297A (ja) 1998-03-10
JP3360545B2 JP3360545B2 (ja) 2002-12-24

Family

ID=17357399

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26112196A Expired - Fee Related JP3360545B2 (ja) 1996-08-26 1996-08-26 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3360545B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007179071A (ja) * 2007-02-23 2007-07-12 Mitsubishi Electric Corp 音声符号化装置及び音声符号化方法
WO2008108078A1 (ja) * 2007-03-02 2008-09-12 Panasonic Corporation 符号化装置および符号化方法
JP2009134302A (ja) * 2009-01-29 2009-06-18 Mitsubishi Electric Corp 音声符号化装置及び音声符号化方法
USRE43190E1 (en) 1999-11-08 2012-02-14 Mitsubishi Denki Kabushiki Kaisha Speech coding apparatus and speech decoding apparatus
USRE43209E1 (en) 1999-11-08 2012-02-21 Mitsubishi Denki Kabushiki Kaisha Speech coding apparatus and speech decoding apparatus

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE43190E1 (en) 1999-11-08 2012-02-14 Mitsubishi Denki Kabushiki Kaisha Speech coding apparatus and speech decoding apparatus
USRE43209E1 (en) 1999-11-08 2012-02-21 Mitsubishi Denki Kabushiki Kaisha Speech coding apparatus and speech decoding apparatus
JP2007179071A (ja) * 2007-02-23 2007-07-12 Mitsubishi Electric Corp 音声符号化装置及び音声符号化方法
JP4660496B2 (ja) * 2007-02-23 2011-03-30 三菱電機株式会社 音声符号化装置及び音声符号化方法
WO2008108078A1 (ja) * 2007-03-02 2008-09-12 Panasonic Corporation 符号化装置および符号化方法
US8306813B2 (en) 2007-03-02 2012-11-06 Panasonic Corporation Encoding device and encoding method
JP2009134302A (ja) * 2009-01-29 2009-06-18 Mitsubishi Electric Corp 音声符号化装置及び音声符号化方法

Also Published As

Publication number Publication date
JP3360545B2 (ja) 2002-12-24

Similar Documents

Publication Publication Date Title
JP3094908B2 (ja) 音声符号化装置
JP3196595B2 (ja) 音声符号化装置
EP1005022B1 (en) Speech encoding method and speech encoding system
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP3266178B2 (ja) 音声符号化装置
JP3335841B2 (ja) 信号符号化装置
JP2624130B2 (ja) 音声符号化方式
JP3616432B2 (ja) 音声符号化装置
JP3360545B2 (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JP3144284B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP2001318698A (ja) 音声符号化装置及び音声復号化装置
JP3089967B2 (ja) 音声符号化装置
JP3471542B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JPH08320700A (ja) 音声符号化装置
JP3092654B2 (ja) 信号符号化装置
JP2907019B2 (ja) 音声符号化装置
JP3144244B2 (ja) 音声符号化装置
JPH09319399A (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071018

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081018

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091018

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091018

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101018

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111018

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121018

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131018

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees