JPH0844397A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH0844397A
JPH0844397A JP6194594A JP19459494A JPH0844397A JP H0844397 A JPH0844397 A JP H0844397A JP 6194594 A JP6194594 A JP 6194594A JP 19459494 A JP19459494 A JP 19459494A JP H0844397 A JPH0844397 A JP H0844397A
Authority
JP
Japan
Prior art keywords
gain
unit
filter
excitation
spectrum parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6194594A
Other languages
English (en)
Other versions
JP3192051B2 (ja
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP19459494A priority Critical patent/JP3192051B2/ja
Publication of JPH0844397A publication Critical patent/JPH0844397A/ja
Application granted granted Critical
Publication of JP3192051B2 publication Critical patent/JP3192051B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】低ビットレートでも良好な音質の得られる音声
符号化方式の提供。 【構成】適応コードブック回路(300)は、サブフレーム
毎に音声のピッチ周期を求める。フィルタ回路(320)
は、適応コードブック残差信号から、予め定められた次
数のフィルタのゲインを計算する。音源量子化回路(35
0)は、音源コードブック(330)に格納された音源コード
ベクトルの一部又は全部を前記フィルタ回路(320)に通
しながら最良のコードベクトルを選択する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声信号を低いビットレ
ート、特に4.8kb/s以下で高品質に符号化するための音
声符号化方式に関する。
【0002】
【従来の技術】音声信号を4.8kb/s以下の低いビットレ
ートで符号化する方式としては、例えば、M. Schroeder
とB. A. Atal氏による“Code-excited linear predicti
on: High quality speech at low bit rates”(Proc.
ICASSP, pp.937〜940, 1985年)と題した論文(「文献
1」という)や、Kleijn氏らによる“Improved speechq
uality and efficient vector quantization in SELP”
(Proc. ICASSP, pp.155〜158, 1988年)と題した論文
(「文献2」という)等に記載されているCELP(Code E
xcited LPC Coding)が知られている。
【0003】この方式においては、送信側では、フレー
ム毎(例えば20ms)に音声信号から線形予測(LP
C)分析を用いて、音声信号のスペクトル特性を表わす
スペクトルパラメータを抽出し、フレームをさらにサブ
フレーム(例えば5ms)に分割し、サブフレーム毎に
過去の音源信号をもとに適応コードブックにおけるパラ
メータ(遅延パラメータとゲインパラメータ)を抽出
し、適応コードブックにより前記サブフレームの音声信
号をピッチ予測し、ピッチ予測して求めた残差信号に対
して、予め定められた種類の雑音信号からなる音源コー
ドブック(ベクトル量子化コードブック)から最適な音
源コードベクトルを選択し最適なゲインを計算する。
【0004】音源コードベクトルの選択の仕方は、選択
した雑音信号により合成した信号と、前記残差信号との
誤差電力を最小化するようにして行う。
【0005】そして、選択された音源コードベクトルの
種類を表わすインデクスとゲイン、ならびに、前記スペ
クトルパラメータと適応コードブックのパラメータを伝
送する。
【0006】受信側の復号化装置では、送信側の符号化
装置から伝送された、コードベクトルのインデクスとゲ
イン、スペクトルパラメータ等の伝送符号に基づき、音
声信号を合成する。なお、復号化装置の構成は、本発明
の主題に直接関係しないため、その説明を省略する。
【0007】
【発明が解決しようとする課題】上述した文献1、2の
従来の音声符号化方式では、ビットレートを低減化する
とコードブックのサイズが小さくなり、特に女性音の音
質が急激に劣化するという問題があった。
【0008】この問題を解決するために、送信側で音源
信号に対してコムフィルタリング(「コムフィルタによ
るフィルタ処理」の意味)を行い、音源信号のピッチ性
を強調させることにより音質を改善する方法が提案され
ている。
【0009】この方法の詳細は、例えばS.Wang氏らによ
る“Improved Excitation for Phonetically-Segmented
VXC Speech Coding Below 4kb/s”(Proc. GLOBECOM,
pp.946〜950, 1990)と題した論文(「文献3」とい
う)等を参照できる。
【0010】しかしながら、文献3の方法を使用する
と、音質は改善されるものもあるが、適応コードブック
と音源コードブックの両者の探索の時に、全てのコード
ベクトルにコムフィルタリングを施しているために、演
算量が膨大となり、コムフィルタのゲインを一定値とし
ているために、コムフィルタリングにより常に効果が得
られるとは限らず、逆に劣化するものもある、等の問題
がある。
【0011】従って、本発明の目的は、上述した問題点
を解決し、比較的少ない演算量及びメモリ量により、4.
8kb/s以下で音質の良好な音声符号化方式を提供するこ
とにある。
【0012】
【課題を解決するための手段】前記目的は、本発明にお
いては、音声信号を入力し予め定められた時間長のフレ
ームに分割し、前記フレームの音声信号をフレームより
も時間的に短い複数個のサブフレームに分割し、前記音
声信号のスペクトル的特徴を表わすスペクトルパラメー
タを求めるスペクトルパラメータ計算部と、前記スペク
トルパラメータを量子化するスペクトルパラメータ量子
化部と、サブフレーム毎に音声信号のピッチ周期を求め
る適応コードブック部と、前記ピッチ周期に応じた遅延
を有する、予め定められた次数のフィルタのゲインを、
前記フレーム毎に又は前記サブフレーム毎に前記音声信
号又は適応コードブック残差信号から計算するフィルタ
部と、音源コードブックに格納されたコードベクトルの
少なくとも一部を、前記フィルタ部に通しながら、最良
のコードベクトルを選択して音源信号を量子化する音源
量子化部と、前記スペクトルパラメータ量子化部と、前
記適応コードブック部と、前記音源量子化部と、前記フ
ィルタ部と、のそれぞれの出力信号を組み合わせて出力
するマルチプレクサ部と、を有することを特徴とする音
声符号化装置(「第1の視点」という)により達成され
る。
【0013】また、本発明は、第2の視点において、音
声信号を入力し予め定められた時間長のフレームに分割
し、前記フレームの音声信号をフレームよりも時間的に
短い複数個のサブフレームに分割し、前記音声信号のス
ペクトル的特徴を表わすスペクトルパラメータを求める
スペクトルパラメータ計算部と、前記スペクトルパラメ
ータを量子化するスペクトルパラメータ量子化部と、サ
ブフレーム毎に音声信号のピッチ周期を求める適応コー
ドブック部と、前記ピッチ周期に応じた遅延を有する、
予め定められた次数のフィルタのゲインを、前記フレー
ム毎に又は前記サブフレーム毎に前記音声信号又は適応
コードブック残差信号から計算するフィルタ部と、音源
コードブックに格納されたコードベクトルから最良のコ
ードベクトルを選択した後に前記フィルタ部に通して音
源信号を量子化する音源量子化部と、前記スペクトルパ
ラメータ量子化部と、前記適応コードブック部と、前記
音源量子化部と、前記フィルタ部と、のそれぞれの出力
信号を組み合わせて出力するマルチプレクサ部と、を有
することを特徴とする音声符号化装置を提供する。
【0014】さらに、本発明は、第3の視点において、
音声信号を入力し予め定められた時間長のフレームに分
割し、前記フレームの音声信号をフレームよりも時間的
に短い複数個のサブフレームに分割し、前記音声信号の
スペクトル的特徴を表わすスペクトルパラメータを求め
るスペクトルパラメータ計算部と、前記スペクトルパラ
メータを量子化するスペクトルパラメータ量子化部と、
サブフレーム毎に音声信号のピッチ周期を求める適応コ
ードブック部と、音源コードブックに格納された音源コ
ードベクトルの少なくとも一部を、前記ピッチ周期に応
じた遅延を有する、予め定められた次数のフィルタに通
すと共に、ゲインコードブックから選択したゲインコー
ドベクトルにより前記適応コードブック部のゲイン、前
記音源コードベクトルのゲイン、及び前記フィルタのゲ
インのうち少なくとも一のゲインを量子化して、最良の
音源コードベクトル及び最良のゲインコードベクトルを
選択する音源・ゲイン量子化部と、前記スペクトルパラ
メータ量子化部と、前記適応コードブック部と、前記音
源・ゲイン量子化部と、のそれぞれの出力信号を組み合
わせて出力するマルチプレクサ部と、を有することを特
徴とする音声符号化装置を提供する。
【0015】そして、本発明は、第4の視点において、
音声信号を入力し予め定められた時間長のフレームに分
割し前記フレームの音声信号をフレームよりも時間的に
短い複数個のサブフレームに分割し前記音声信号のスペ
クトル的特徴を表わすスペクトルパラメータを求めるス
ペクトルパラメータ計算部と、前記スペクトルパラメー
タを量子化するスペクトルパラメータ量子化部と、サブ
フレーム毎に音声信号のピッチ周期を求める適応コード
ブック部と、音源コードブックに格納されたコードベク
トルから最良のコードベクトルを選択した後に、前記ピ
ッチ周期に応じた遅延を有する、予め定められた次数の
フィルタに通し、前記フィルタのゲインを計算し、ゲイ
ンコードブックを用いてゲインを量子化する音源・ゲイ
ン量子化部と、前記スペクトルパラメータ量子化部と、
前記コードブック部と、前記音源・ゲイン量子化部と、
のそれぞれの出力信号を組み合わせて出力するマルチプ
レクサ部と、を有することを特徴とする音声符号化装置
を提供する。
【0016】本発明は、第1及び第3の視点において、
前記音源コードブックに格納されたコードベクトルの全
てを前記フィルタ部に通すようにしてもよい。
【0017】また、本発明は、第3及び第4の視点にお
いて、音源・ゲイン量子化部は、好ましくは、前記適応
コードブック部から遅延を入力し、ゲインコードブック
からフィルタのゲインを読み出して、前記遅延及びゲイ
ンに基づき音源コードブックから読み出した音源コード
ベクトルに対してフィルタ処理を行なうフィルタ回路
と、前記フィルタ回路の出力を入力すると共に、ゲイン
コードブックからゲインコードベクトル、適応コードブ
ック部のゲイン、音源コードベクトルのゲインを量子化
して歪を計算する歪計算回路と、前記歪を最小化するよ
うな音源コードベクトルとゲインコードベクトルの最適
な組み合わせを選択する判別回路とから構成される。
【0018】さらに、本発明においては、前記フィルタ
が、非再帰型又は再帰型のいずれかのフィルタで構成さ
れ、好ましくは、次数が1ないし3の非再帰型フィルタ
で構成される。
【0019】
【作用】本発明に係る音声符号化装置の原理・作用を以
下に詳説する。
【0020】音声信号をフレーム(例えば40ms)に
分割し、さらにサブフレーム(例えば8ms)に分割す
る。フレーム毎に音声のスペクトル的特徴を表わすスペ
クトルパラメータを計算し量子化する。
【0021】適応コードブック部では、サブフレーム毎
に、音声のピッチ周期に対応する遅延を計算する。
【0022】フィルタ部では、適応コードブック部と同
一の遅延を有し、予め定められた次数Mのコムフィルタ
のゲインを、フレーム毎にあるいはサブフレーム毎に計
算する。
【0023】コムフィルタの構成としては、再帰型(A
R型;「AR」はAuto Regressive略)と非再帰型(MA
型;「MA」はMoving Averageの略)の2種あるが、以下
では、非再帰型(「MA型コムフィルタ」という)を用
いることにする。また、MA型コムフィルタの次数Mは
1とする。
【0024】コムフィルタのゲインは、以下では、サブ
フレーム毎に、適応コードブック部によりピッチ予測し
て求めた残差信号から計算するものとする。
【0025】音源量子化部では、音源コードブックに格
納された音源コードベクトルの一部あるいは全部につい
て、次式(1)によりコムフィルタリングを行う。
【0026】cjz(n)=cj(n)+η・cj(n−T) …(1)
【0027】上式(1)において、cj(n)はj番目の音源コ
ードベクトル、ηはMA型コムフィルタのゲインであ
る。Tは適応コードブックにおいて求められた遅延であ
る。
【0028】コムフィルタリングされた音源コードベク
トルを用いて、次式(2)の歪を最小化にする最良の音源
コードベクトルを1種類あるいは複数種類選択する。
【0029】
【数1】
【0030】上式(2)において、xw(n)は聴感重み付け
信号、βは適応コードブック部のゲイン、v(n)は適応コ
ードベクトル、γjは音源コードベクトルcj(n)の最適ゲ
イン、hw(n)は聴感重み付け合成フィルタのインパルス
応答である。上式(2)において、cjz(n)*hw(n)の演算記
号*は、cjz(n)とインパルス応答hw(n)の畳み込み演算
(コンボルーション)を表わしている。
【0031】ここで、上式(2)と等価な関係として、次
式(3)に従い音源コードベクトルを選択することもでき
る。
【0032】
【数2】
【0033】ただし、 h'w(n)=hw(n)+η・hw(n−T) …(4) である。
【0034】この場合、音源コードベクトルをコムフィ
ルタに通す処理は、インパルス応答hw(n)をh'w(n)のよ
うに修正することと等価となる。
【0035】本発明は、第2の視点において、最良の音
源コードベクトルを選択した後に、上式(2)あるいは(3)
により、音源コードベクトルをコムフィルタリングしな
がらゲインγjを計算する。
【0036】本発明は、第3の視点において、コムフィ
ルタのゲインは予め計算しておくことなく、コムフィル
タリングしながら最良の音源コードベクトルを選択する
際に、ゲインコードブックからゲインコードベクトルを
選択してゲインを量子化しながら行い、歪を最小にする
音源コードベクトル、ゲインコードベクトルの組み合わ
せを選択する。
【0037】以下では、適応コードブックのゲインと、
音源コードベクトルのゲインと、コムフィルタのゲイン
とを一括してゲインコードブックにより量子化する例に
ついて示す。選択は次式(5)に従う。
【0038】
【数3】
【0039】ここで、(β'k, γ'k, η'k)は3次元ゲ
インコードブックにおけるk番目のゲインコードベクト
ルである。ただし、k=0〜2B−1、Bはゲインコードブ
ックのビット数である。
【0040】ゲインコードベクトルと音源コードベクト
ルの組み合わせに対して上式(5)を計算し、上式(5)で求
めた歪を最小化する組み合わせを選択する。
【0041】なお、上式(5)と等価な関係にある式とし
て、次式(6)を用いて選択を行ってもよい。
【0042】
【数4】
【0043】ただし h'wk(n)=hw(n)+η'k・hw(n−T) …(7) である。
【0044】本発明は、第4の視点において、コムフィ
ルタのゲインを予め計算しておくことなく、最良の音源
コードベクトルを選択した後に、式(2)あるいは式(3)を
最小化するように、コムフィルタのゲインを計算し、そ
の後、ゲインコードブックを用いてゲインを量子化す
る。
【0045】以上のように、本発明によれば、サブフレ
ーム毎に又はフレーム毎にコムフィルタの係数を計算
し、音源コードベクトルの全て又は一部に対してコムフ
ィルタを通しながら歪を最小化する音源コードベクトル
を選択するか、音源を1種類選択した後にコムフィルタ
を通してゲインコードベクトルと音源コードベクトルの
組み合わせを選択するか、音源コードベクトルの全て又
は一部に対してコムフィルタを通してゲインコードベク
トルと音源コードベクトルの組み合わせを選択するかし
ているため、低ビットレートでも比較的少ない演算量で
音質の改善を行うことができる。
【0046】
【実施例】図面を参照して、本発明を実施例に即して以
下に説明する。
【0047】
【実施例1】図1は本発明の音声符号化方式の一実施例
の構成を示すブロック図である。
【0048】図1において、入力端子100から音声信号
を入力し、フレーム分割回路110では音声信号をフレー
ム(例えば40ms)毎に分割し、サブフレーム分割回
路120では、フレームの音声信号をフレームよりも短い
サブフレーム(例えば8ms)に分割する。
【0049】スペクトルパラメータ計算回路200では、
少なくとも一つのサブフレームの音声信号に対して、サ
ブフレーム長よりも長い窓(例えば24ms)をかけて
音声を切り出してスペクトルパラメータを予め定められ
た次数(例えばP=10次)計算する。
【0050】スペクトルパラメータは、特に、子音、母
音間での過渡区間では時間的に大きく変化するので、短
い時間毎に分析する方が望ましいが、そのようにすると
分析に必要な演算量が増大するため、ここでは、フレー
ム中のいずれかL個(L>1)のサブフレーム(例えば
L=3とし、第1、3、5サブフレーム)に対してスペ
クトルパラメータを計算することにする。
【0051】そして、分析をしなかったサブフレーム
(ここでは第2、4サブフレーム)では、それぞれ、第
1と第3サブフレーム、第3と第5サブフレームのスペ
クトルパラメータを、後述のLSP(線スペクトル対)
上で直線補間したものをスペクトルパラメータとして用
いる。
【0052】ここでスペクトルパラメータの計算には、
周知のLPC分析(線形予測符号化)や、Burg分析
等を用いることができる。
【0053】本実施例では、Burg分析を用いること
とする。なお、最大エントロピー法(MEM)に基づく
スペクトル推定法であるBurg分析の詳細について
は、中溝著による“信号解析とシステム同定”と題した
単行本(コロナ社1988年刊)の第82〜87頁(「文献4」
という)に記載されているので、説明は省略する。
【0054】スペクトルパラメータ計算回路200では、
Burg法により計算された線形予測係数αi(i=1
〜10)を量子化や補間に適したLSPパラメータに変換
する。
【0055】ここで、線形予測係数からLSPへの変換
は、菅村他による“線スペクトル対(LSP)音声分析
合成方式による音声情報圧縮”と題した論文(電子通信
学会論文誌、J64-A, pp.599〜606, 1981年)(「文献
5」という)を参照することができる。なお、LSPは
スペクトルを線スペクトル対(Line Spectrum Pair)で
求め周波数軸上での量子化効率を上げるものである。
【0056】第1、3、5サブフレームでBurg法に
より求めた線形予測係数を、LSPパラメータに変換
し、第2、4サブフレームのLSPを直線補間により求
めて、第2、4サブフレームのLSPを逆変換して線形
予測係数に戻し、第1〜5サブフレームの線形予測係数
αil(i=1〜10,l=1〜5)を聴感重み付け回路
230に出力する。また、第1〜5サブフレームのLSP
をスペクトルパラメータ量子化回路210へ出力する。
【0057】スペクトルパラメータ量子化回路210で
は、予め定められたサブフレームのLSPパラメータを
効率的に量子化する。
【0058】以下では、量子化法として、ベクトル量子
化を用いるものとし、第5サブフレームのLSPパラメ
ータを量子化するものとする。LSPパラメータのベク
トル量子化の手法は周知の手法を用いることができる。
具体的な方法は例えば、本願発明者による一連の発明、
即ち、特開平4-171500号公報(特願平2-297600号)
(「文献6」という)、特開平4-363000号公報(特願平
3-261925号)(「文献7」という)、及び特開平5-6199
号公報(特願平3-155949号)(「文献8」という)、あ
るいはT. Nomuraらによる“LSP Coding Using VQ-SVQ W
ith Interpolationin 4.075 kbps M-LCELP Speech Code
r”と題した論文(Proc. Mobile Multimedia Communica
tions, pp.B.2.5, 1993)(「文献9」という)等を参
照できるため、ここでは説明は略する。
【0059】また、スペクトルパラメータ量子化回路21
0では、第5サブフレームで量子化したLSPパラメー
タをもとに、第1〜第4サブフレームのLSPパラメー
タを復元する。
【0060】ここでは、現フレームの第5サブフレーム
の量子化LSPパラメータと1つ過去のフレームの第5
サブフレームの量子化LSPを直線補間して、第1〜第
4サブフレームのLSPを復元する。
【0061】ここで、量子化前のLSPと量子化後のL
SPとの誤差電力を最小化するコードベクトルを1種類
選択した後に、直線補間により第1〜第4サブフレーム
のLSPを復元できる。
【0062】さらに性能を向上させるためには、前記誤
差電力を最小化するコードベクトルを複数候補選択した
のちに、各々の候補について、累積歪を評価し、累積歪
を最小化する候補と補間LSPの組を選択するようにす
ることができる。詳細は、例えば、本願発明者による特
願平5-8737号明細書(「文献10」という)に記載され
ている。
【0063】以上により復元した第1〜4サブフレーム
のLSPと第5サブフレームの量子化LSPをサブフレ
ーム毎に線形予測係数α’il(i=1〜10,l=1〜
5)に変換し、インパルス応答計算回路310へ出力す
る。
【0064】また、第5サブフレームの量子化LSPの
コードベクトルを表わすインデクスをマルチプレクサ50
0に出力する。
【0065】上記において、直線補間のかわりに、LS
Pの補間パターンを予め定められたビット数(例えば2
ビット)分用意しておき、これらのパターンの各々に対
して1〜4サブフレームのLSPを復元して累積歪を最
小化するコードベクトルと補間パターンの組を選択する
ようにしてもよい。
【0066】このようにすると補間パターンのビット数
だけ伝送情報が増加するが、LSPのフレーム内での時
間的な変化をより精密に表わすことができる。
【0067】ここで、補間パターンは、トレーニング用
のLSPデータを用いて予め学習して作成してもよい
し、予め定められたパターンを格納しておいてもよい。
予め定められたパターンとしては、例えば、T. Taniguc
hiらによる“Improved CELP speech coding at 4kb/s a
nd below”と題した論文(Proc. ICSLP, pp.41〜44, 19
92)(「文献11」という)等に記載のパターンを用い
ることができる。
【0068】また、さらに性能を改善するためには、補
間パターンを選択した後に、予め定められたサブフレー
ムにおいて、LSPの真の値とLSPの補間値との誤差
信号を求め、前記誤差信号をさらに誤差コードブックで
表わすようにしてもよい。詳細は、前記文献9等を参照
できる。
【0069】聴感重み付け回路230は、スペクトルパラ
メータ計算回路200から、各サブフレーム毎に量子化前
の線形予測係数αil(i=1〜10,l=1〜5)を入
力し、前記文献10に基づき、サブフレームの音声信号
に対して聴感重み付けを行い、聴感重み付け信号xw(n)
を出力する。
【0070】応答信号計算回路240は、スペクトルパラ
メータ計算回路200から、各サブフレーム毎に線形予測
係数αilを入力し、スペクトルパラメータ量子化回路21
0から、量子化、補間して復元した線形予測係数α’il
をサブフレーム毎に入力し、保存されているフィルタメ
モリの値を用いて、入力信号d(n)=0とした応答信号を
1サブフレーム分計算し、減算器250へ出力する。ここ
で、応答信号xz(n)は次式(8)で表される。
【0071】
【数5】
【0072】ここで、γは、聴感重み付け量を制御する
重み係数であり、下記の式(9)と同一の値である。
【0073】減算器250は、次式(9)により、聴感重み付
け信号から応答信号を1サブフレーム分減算し、x'w(n)
を適応コードブック回路300へ出力する。
【0074】x'w(n)=xw(n)−xz(n) …(9)
【0075】インパルス応答計算回路310は、z変換表
示の伝達関数が次式(10)で表される重み付けフィルタの
インパルス応答hw(n)を予め定められた点数Lだけ計算
し、適応コードブック回路300、音源量子化回路350へ出
力する。
【0076】
【数6】
【0077】適応コードブック回路300は、ピッチパラ
メータを求める。詳細は前記文献2等を参照することが
できる。そして、求めたサブフレーム毎の遅延値に対応
するインデクスをマルチプレクサ500に出力する。
【0078】また、適応コードブックによりピッチ予測
を次式(11)に従って行い、適応コードブック予測算差信
号z(n)を出力する。また、遅延を表わすインデクスをマ
ルチプレクサ500に出力する。
【0079】z(n)=x'w(n)−b(n) …(11)
【0080】ここで、b(n)は、適応コードブックピッチ
予測信号であり、次式(12)で与えられる。
【0081】b(n)=β・v(n−T)*hw(n) …(12)
【0082】ここで、β、Tは、それぞれ、適応コード
ブック回路300のゲイン、遅延を示す。v(n)は適応コー
ドベクトルである。また演算記号*は畳み込み演算(コ
ンボルーション)を表わす。
【0083】フィルタ回路320は、まず、適応コードブ
ックピッチ予測算差信号z(n)を用いて、MA型コムフィ
ルタのゲインηを計算する。
【0084】具体的には、例えば、次式(13)を最小化す
るようにゲインηを計算することができる。なお、MA
型コムフィルタの次数は1とする。
【0085】
【数7】
【0086】ここに、Tは適応コードブック回路で求め
た遅延である。
【0087】音源量子化回路350では、音源コードブッ
ク330に格納された音源コードベクトルの全部あるいは
一部に対して、前記式(2)あるいは式(3)を最小化するよ
うに、最良の音源コードベクトルcj(n)を選択する。
【0088】このとき、最良のコードベクトルを1種選
択してもよいし、2種以上のコードベクトルを選んでお
いて、ゲイン量子化の際に、1種に本選択してもよい。
ここでは、2種以上のコードベクトルを選んでおくもの
とする。
【0089】なお、一部の音源コードベクトルに対して
のみ、前記式(2)あるいは式(3)を適用するときには、下
記の式(14)を最小化するように複数個の音源コードベク
トルを予め予備選択しておき、予備選択された音源コー
ドベクトルに対して、前記式(2)あるいは(3)を適用する
こともできる。
【0090】
【数8】
【0091】ゲイン量子化回路370は、ゲインコードブ
ック340からゲインコードベクトルを読み出し、選択さ
れた音源コードベクトルに対して、前記式(5)を最小化
するように、音源コードベクトルとゲインコードベクト
ルの組み合わせを選択する。
【0092】選択された音源コードベクトルとゲインコ
ードベクトルを表わすインデクスをマルチプレクサ500
に出力する。なお、式(5)と等価な関係にある式とし
て、式(6)を用いることもできる。
【0093】重み付け信号計算回路360は、スペクトル
パラメータ計算回路の出力パラメータ及び、それぞれの
インデクスを入力し、インデクスからそれに対応するコ
ードベクトルを読み出し、まず次式(15)に基づき駆動音
源信号v(n)を求める。
【0094】 v(n)=β’k・v(n−T)+γ’k・cjz(n) …(15)
【0095】次に、スペクトルパラメータ計算回路200
の出力パラメータ、スペクトルパラメータ量子化回路21
0の出力パラメータを用いて次式(16)により、重み付け
信号sw(n)をサブフレーム毎に計算し、応答信号計算回
路240へ出力する。
【0096】
【数9】
【0097】
【実施例2】本発明の第2の実施例においては、前記第
1の実施例における式(14)を最小化するように、最良の
音源コードベクトルを1種選択したのちに、式(2)ある
いは式(3)に従い音源コードベクトルのゲインγjを計算
しなおすものである。
【0098】なお、ゲインコードブックによるゲインの
量子化も含めて行うときは、式(2)、(3)の代りに、それ
ぞれ、式(5)、(6)を用いることができる。
【0099】
【実施例3】図2は、本発明の第3の実施例の構成を示
すブロック図である。図1と同一の番号を付した構成要
素は、図1と同一の動作をするのでその説明は省略し、
相違点のみを以下に説明する。
【0100】図3に、音源・ゲイン量子化回路400のブ
ロック図を示す。図3において、コムフィルタ回路410
では、ゲインは予め計算しておかず、適応コードブック
回路300からの遅延Tを入力し、音源コードブック330か
ら全ての音源コードベクトル、あるいは一部の音源コー
ドベクトルを読み出し、さらに、ゲインコードベクトル
340からコムフィルタのゲインη’kを読み出し、次式(1
7)に従ってコムフィルタリングを行い、歪計算回路420
へ出力する。ここで、ゲインコードブック340は3次元
とし、(β’k, γ’k, η’k)の値が格納されている
ものとする。
【0101】 cjz(n)=cj(n)+η’k・cj(n−T) …(17)
【0102】歪計算回路420では、さらに、ゲインコー
ドブック340からゲインコードベクトルを読み込み、適
応コードブック回路300のゲインと音源コードベクトル
のゲインを量子化しながら、前記式(5)に従い、歪Dj
計算し、判別回路430へ出力する。
【0103】判別回路430では、歪Djを最小化するよう
な音源コードベクトルとゲインコードベクトルの最良の
組み合わせを選択する。式(5)と等価な関係にある式と
して、式(5)のかわりに、式(6)を用いることもできる。
【0104】なお、一部の音源コードベクトルに対して
コムフィルタリングを行うときは、式(14)を最小化する
ように、音源コードブック330から、予め複数個のコー
ドベクトルを選択しておくこともできる。
【0105】
【実施例4】本発明の第4の実施例においては、前記第
3の実施例において、音源コードブックに格納されたコ
ードベクトルから最良の音源コードベクトルを1種選択
した後に、ゲインコードブック340を用いて、適応コー
ドブックと音源コードベクトルとコムフィルタのゲイン
を量子化しながら、音源コードベクトルとゲインコード
ベクトルの最良の組み合わせを選択する。音源コードベ
クトルとゲインコードベクトルの選択には、式(5)ある
いは式(6)を用いる。
【0106】以上本発明を上記各実施例に即して説明し
たが、本発明の意向を損なうことなく、上述した実施態
様以外にも、種々の変形が可能である。
【0107】スペクトルパラメータはLSP以外にも他
の周知なパラメータを用いることができる。
【0108】スペクトルパラメータ計算回路200では、
フレーム中で少なくとも1つのサブフレームでスペクト
ルパラメータを計算するときに、前のサブフレームとの
現在のサブフレームとのRMSの変化あるいはパワの変
化を測定し、これらの変化が大きな複数個のサブフレー
ムに対してスペクトルパラメータを計算するようにして
もよい。このようにすると、音声の変化点では必ずスペ
クトルパラメータを分析することになり、分析するサブ
フレーム数を低減しても性能の劣化を防ぐことができ
る。
【0109】スペクトルパラメータの量子化には、ベク
トル量子化、スカラ量子化、ベクトル−スカラ量子化な
ど周知な方法を用いることができる。
【0110】スペクトルパラメータ量子化回路における
補間パターンの選択には、他の周知な距離尺度を用いる
ことができる。
【0111】適応コードブック回路ならびにフィルタ回
路における遅延は、整数値でも小数値でもよい。
【0112】また、音源量子化回路において、コードブ
ックが1段の場合について説明したが、2段、あるいは
多段構成にすることもできる。
【0113】また、音源コードブックの探索、ならびに
学習のときの距離尺度は、あるいは、学習法は、他の周
知な尺度を用いることもできる。
【0114】コムフィルタ回路の次数は、高次(例えば
3次)とすることもできる。このようにすると、演算量
と伝送情報量がやや増加するが、性能はさらに改善され
る。
【0115】コムフィルタの構成としては、非再帰型
(MA型)について説明したが、再帰型(AR型)を使
用することもできる。
【0116】また、ゲインコードブックは、伝送ビット
数よりも全体で数倍大きなサイズのコードブックを予め
学習し、予め定められたモード毎に前記コードブックの
一部の領域を使用領域としてアサインしておき、符号化
するときは、モードに応じて使用領域を切り替えて使用
することもできる。
【0117】さらに、適応コードブック部ならびにコム
フィルタは、音声の母音部のみ、又はフレームの音声信
号を複数種類のモードに分類し、予め定められたモード
のみに適用することもできる。
【0118】そして、適応コードブック回路での探索、
並びに音源量子化回路での探索には、それぞれ、式(2)
〜(6)、式(12)〜(14)のように、インパルス応答hw(n)を
用いて畳み込み演算を行ったが、これは、伝達特性が式
(10)で表されるような重み付けフィルタを用いてフィル
タリング演算により行うこともできる。このようにする
と、演算量は増大するが、性能はさらに向上する。
【0119】
【発明の効果】以上述べたように、本発明によれば、サ
ブフレーム毎に又はフレーム毎にコムフィルタの係数を
計算し、全ての又は一部の音源コードベクトルに対し
て、コムフィルタを通しながら、歪を最小化する音源コ
ードベクトルを選択するものであり、低ビットレートで
も比較的少ない演算量で音質の改善を図ることができる
という効果を有する。
【0120】また、本発明によれば、音源を1種選択し
た後にコムフィルタを通してゲインコードベクトルと音
源コードベクトルの組み合わせを選択することにより、
さらに演算量を低減し、且つ音質の改善を図っている。
【0121】さらに、本発明によれば、全ての又は一部
の音源コードベクトルに対してコムフィルタを通してゲ
インコードベクトルと音源コードベクトルの最良の組み
合わせを選択することにより、低ビットレートでも演算
量を低減し、且つ音質を改善することができるという効
果がある。
【0122】また、本発明においては、音源を1種選択
した後にコムフィルタを通し、ゲインコードベクトルと
音源コードベクトルの最良の組み合わせを選択すること
により、さらに演算量を低減し、且つ音質の改善を図っ
ている。
【0123】そして、本発明においては、フィルタ回路
として好ましくは1次の非再帰型のフィルタを用いた場
合、演算量及び伝送情報量が著しく低減されると共に音
質が改善され、また次数が3次の場合には、演算量と伝
送情報量はやや増加するものの音質はさらに改善され
る。
【図面の簡単な説明】
【図1】本発明の第1の実施例の構成を示すブロック図
である。
【図2】本発明の第3の実施例の構成を示すブロック図
である。
【図3】本発明における音源・ゲイン量子化回路の構成
を示すブロック図である。
【符号の説明】
110…フレーム分割回路 120…サブフレーム分割回路 200…スペクトルパラメータ計算回路 210…スペクトルパラメータ量子化回路 220…LSPコードブック 230…重み付け回路 250…減算回路 240…応答信号計算回路 300…適応コードブック回路 310…インパルス応答計算回路 320…フィルタ回路 350…音源量子化回路 330…音源コードブック 340…ゲインコードブック 360…重み付け信号計算回路 370…ゲイン量子化回路 400…音源・ゲイン量子化回路 410…コムフィルタ回路 420…歪計算回路 430…判別回路 500…マルチプレクサ

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】音声信号を入力し予め定められた時間長の
    フレームに分割し、前記フレームの音声信号をフレーム
    よりも時間的に短い複数個のサブフレームに分割し、前
    記音声信号のスペクトル的特徴を表わすスペクトルパラ
    メータを求めるスペクトルパラメータ計算部と、 前記スペクトルパラメータを量子化するスペクトルパラ
    メータ量子化部と、 サブフレーム毎に音声信号のピッチ周期を求める適応コ
    ードブック部と、 前記ピッチ周期に応じた遅延を有する、予め定められた
    次数のフィルタのゲインを、前記フレーム毎に又は前記
    サブフレーム毎に前記音声信号又は適応コードブック残
    差信号から計算するフィルタ部と、 音源コードブックに格納されたコードベクトルの少なく
    とも一部を、前記フィルタ部に通しながら、最良のコー
    ドベクトルを選択して音源信号を量子化する音源量子化
    部と、 前記スペクトルパラメータ量子化部と、前記適応コード
    ブック部と、前記音源量子化部と、前記フィルタ部と、
    のそれぞれの出力信号を組み合わせて出力するマルチプ
    レクサ部と、 を有することを特徴とする音声符号化装置。
  2. 【請求項2】音声信号を入力し予め定められた時間長の
    フレームに分割し、前記フレームの音声信号をフレーム
    よりも時間的に短い複数個のサブフレームに分割し、前
    記音声信号のスペクトル的特徴を表わすスペクトルパラ
    メータを求めるスペクトルパラメータ計算部と、 前記スペクトルパラメータを量子化するスペクトルパラ
    メータ量子化部と、 サブフレーム毎に音声信号のピッチ周期を求める適応コ
    ードブック部と、 前記ピッチ周期に応じた遅延を有する、予め定められた
    次数のフィルタのゲインを、前記フレーム毎に又は前記
    サブフレーム毎に前記音声信号又は適応コードブック残
    差信号から計算するフィルタ部と、 音源コードブックに格納されたコードベクトルから最良
    のコードベクトルを選択した後に前記フィルタ部に通し
    て音源信号を量子化する音源量子化部と、 前記スペクトルパラメータ量子化部と、前記適応コード
    ブック部と、前記音源量子化部と、前記フィルタ部と、
    のそれぞれの出力信号を組み合わせて出力するマルチプ
    レクサ部と、 を有することを特徴とする音声符号化装置。
  3. 【請求項3】音声信号を入力し予め定められた時間長の
    フレームに分割し、前記フレームの音声信号をフレーム
    よりも時間的に短い複数個のサブフレームに分割し、前
    記音声信号のスペクトル的特徴を表わすスペクトルパラ
    メータを求めるスペクトルパラメータ計算部と、 前記スペクトルパラメータを量子化するスペクトルパラ
    メータ量子化部と、 サブフレーム毎に音声信号のピッチ周期を求める適応コ
    ードブック部と、 音源コードブックに格納された音源コードベクトルの少
    なくとも一部を、前記ピッチ周期に応じた遅延を有す
    る、予め定められた次数のフィルタに通すと共に、ゲイ
    ンコードブックから選択したゲインコードベクトルによ
    り前記適応コードブック部のゲイン、前記音源コードベ
    クトルのゲイン、及び前記フィルタのゲインのうち少な
    くとも一のゲインを量子化して、最良の音源コードベク
    トル及び最良のゲインコードベクトルを選択する音源・
    ゲイン量子化部と、 前記スペクトルパラメータ量子化部と、前記適応コード
    ブック部と、前記音源・ゲイン量子化部と、のそれぞれ
    の出力信号を組み合わせて出力するマルチプレクサ部
    と、 を有することを特徴とする音声符号化装置。
  4. 【請求項4】音声信号を入力し予め定められた時間長の
    フレームに分割し前記フレームの音声信号をフレームよ
    りも時間的に短い複数個のサブフレームに分割し前記音
    声信号のスペクトル的特徴を表わすスペクトルパラメー
    タを求めるスペクトルパラメータ計算部と、 前記スペクトルパラメータを量子化するスペクトルパラ
    メータ量子化部と、 サブフレーム毎に音声信号のピッチ周期を求める適応コ
    ードブック部と、 音源コードブックに格納されたコードベクトルから最良
    のコードベクトルを選択した後に、前記ピッチ周期に応
    じた遅延を有する、予め定められた次数のフィルタに通
    し、前記フィルタのゲインを計算し、ゲインコードブッ
    クを用いてゲインを量子化する音源・ゲイン量子化部
    と、 前記スペクトルパラメータ量子化部と、前記コードブッ
    ク部と、前記音源・ゲイン量子化部と、のそれぞれの出
    力信号を組み合わせて出力するマルチプレクサ部と、 を有することを特徴とする音声符号化装置。
  5. 【請求項5】前記音源コードブックに格納されたコード
    ベクトルの全てを前記フィルタ部に通すことを特徴とす
    る請求項1又は3記載の音声符号化装置。
  6. 【請求項6】前記音源・ゲイン量子化部が、前記適応コ
    ードブック部から遅延を入力し、ゲインコードブックか
    らフィルタのゲインを読み出して、前記遅延及びゲイン
    に基づき音源コードブックから読み出した音源コードベ
    クトルに対してフィルタ処理を行なうフィルタ回路と、 前記フィルタ回路の出力を入力すると共に、ゲインコー
    ドブックからゲインコードベクトル、適応コードブック
    部のゲイン、音源コードベクトルのゲインを量子化して
    歪を計算する歪計算回路と、 前記歪を最小化するような音源コードベクトルとゲイン
    コードベクトルの最適な組み合わせを選択する判別回路
    と、 を有することを特徴とする請求項3又は4記載の音声符
    号化装置。
  7. 【請求項7】前記フィルタが、非再帰型又は再帰型のい
    ずれかのフィルタで構成されることを特徴とする請求項
    1ないし4のいずれか一に記載の音声符号化装置。
  8. 【請求項8】前記フィルタの次数が1ないし3の非再帰
    型フィルタで構成されることを特徴とする請求項1ない
    し4のいずれか一に記載の音声符号化装置。
JP19459494A 1994-07-28 1994-07-28 音声符号化装置 Expired - Fee Related JP3192051B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19459494A JP3192051B2 (ja) 1994-07-28 1994-07-28 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19459494A JP3192051B2 (ja) 1994-07-28 1994-07-28 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH0844397A true JPH0844397A (ja) 1996-02-16
JP3192051B2 JP3192051B2 (ja) 2001-07-23

Family

ID=16327144

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19459494A Expired - Fee Related JP3192051B2 (ja) 1994-07-28 1994-07-28 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3192051B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002019319A1 (fr) * 2000-08-31 2002-03-07 Matsushita Electric Industrial Co., Ltd. Dispositif de traitement vocal et procede de traitement vocal
US7006966B2 (en) 2001-03-09 2006-02-28 Mitsubishi Denki Kabushiki Kaisha Speech encoding apparatus, speech encoding method, speech decoding apparatus, and speech decoding method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05113799A (ja) * 1991-08-30 1993-05-07 Oki Electric Ind Co Ltd コード励振線形予測符号化方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05113799A (ja) * 1991-08-30 1993-05-07 Oki Electric Ind Co Ltd コード励振線形予測符号化方式

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002019319A1 (fr) * 2000-08-31 2002-03-07 Matsushita Electric Industrial Co., Ltd. Dispositif de traitement vocal et procede de traitement vocal
GB2374265A (en) * 2000-08-31 2002-10-09 Matsushita Electric Ind Co Ltd Speech processing device and speech processing method
GB2374265B (en) * 2000-08-31 2005-01-12 Matsushita Electric Ind Co Ltd Speech processing apparatus and speech processing method
US7286980B2 (en) 2000-08-31 2007-10-23 Matsushita Electric Industrial Co., Ltd. Speech processing apparatus and method for enhancing speech information and suppressing noise in spectral divisions of a speech signal
US7006966B2 (en) 2001-03-09 2006-02-28 Mitsubishi Denki Kabushiki Kaisha Speech encoding apparatus, speech encoding method, speech decoding apparatus, and speech decoding method

Also Published As

Publication number Publication date
JP3192051B2 (ja) 2001-07-23

Similar Documents

Publication Publication Date Title
JP2746039B2 (ja) 音声符号化方式
JP3094908B2 (ja) 音声符号化装置
JP3196595B2 (ja) 音声符号化装置
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JP3266178B2 (ja) 音声符号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP2624130B2 (ja) 音声符号化方式
JP3335841B2 (ja) 信号符号化装置
JP3616432B2 (ja) 音声符号化装置
JP3308764B2 (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3360545B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3144284B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3089967B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JPH08320700A (ja) 音声符号化装置
JP3471542B2 (ja) 音声符号化装置
JP3092654B2 (ja) 信号符号化装置
JP2907019B2 (ja) 音声符号化装置
JP3144244B2 (ja) 音声符号化装置
JPH09319399A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19980331

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090525

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100525

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees