JP2686350B2 - 音声情報圧縮装置 - Google Patents
音声情報圧縮装置Info
- Publication number
- JP2686350B2 JP2686350B2 JP2183523A JP18352390A JP2686350B2 JP 2686350 B2 JP2686350 B2 JP 2686350B2 JP 2183523 A JP2183523 A JP 2183523A JP 18352390 A JP18352390 A JP 18352390A JP 2686350 B2 JP2686350 B2 JP 2686350B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- linear prediction
- parameter
- information
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
【発明の詳細な説明】 [産業上の利用分野] 本発明は、音声信号を情報圧縮して伝送又は蓄積する
音声情報圧縮装置に関する。
音声情報圧縮装置に関する。
[従来の技術] 音声信号は、近接サンプルの相関がかなり高く、近接
サンプルの信号系列によるスペクトル予測を用いて音声
信号を効率良く情報圧縮する方法が広く利用されている
(例えば、「アダプティブ・プレディクティブ・コーデ
ィング・オブ・スピーチ・シグナル(Adaptive Predict
ive Coding of Speech Signal)」,ビー・エス・アタ
ル及びエム・アール・シュレーダー(B.S.Atal and M.
R.Schroeder)共著,ベル・システム・テクニカル・ジ
ャーナル(Bell System Technical Journal),10月,197
0,1973〜1986頁,参照)。
サンプルの信号系列によるスペクトル予測を用いて音声
信号を効率良く情報圧縮する方法が広く利用されている
(例えば、「アダプティブ・プレディクティブ・コーデ
ィング・オブ・スピーチ・シグナル(Adaptive Predict
ive Coding of Speech Signal)」,ビー・エス・アタ
ル及びエム・アール・シュレーダー(B.S.Atal and M.
R.Schroeder)共著,ベル・システム・テクニカル・ジ
ャーナル(Bell System Technical Journal),10月,197
0,1973〜1986頁,参照)。
また音声信号を効率良く情報圧縮する方法において
は、音声信号の予測差分(予測残差とも称する)を算出
して予測差分により入力信号を量子化することで、通常
のパルス符号化(以後、PCMと称する)による量子化に
比べて信号対ノイズ比(以後、SNRと称する)を向上さ
せることができる。
は、音声信号の予測差分(予測残差とも称する)を算出
して予測差分により入力信号を量子化することで、通常
のパルス符号化(以後、PCMと称する)による量子化に
比べて信号対ノイズ比(以後、SNRと称する)を向上さ
せることができる。
上述の関係は、下記に示す(1)で表わされる(「デ
ジタル・コーディング・オブ・ウエーブフォームズ(Di
gital Coding of Waveforms)」,エヌ・エス・ジャイ
アント及びピー・ノル(N.S.Jayant and P.Noll)共
著,プレンティス−ホール(Prentice−Hall),259頁,
参照)。
ジタル・コーディング・オブ・ウエーブフォームズ(Di
gital Coding of Waveforms)」,エヌ・エス・ジャイ
アント及びピー・ノル(N.S.Jayant and P.Noll)共
著,プレンティス−ホール(Prentice−Hall),259頁,
参照)。
SNR(dB)= SNRpcm+10logGp ……(1) ここで、(1)式の右辺のGpを予測ゲインと呼ぶ。こ
の予測ゲインGpの大きさは、線形予測の予測次数にも影
響するが、予測次数を無限大と仮定すると、音声信号の
パワースペクトル密度関数の形状の測度であるスペクト
ルフラットネスメジャーの逆数で表される。
の予測ゲインGpの大きさは、線形予測の予測次数にも影
響するが、予測次数を無限大と仮定すると、音声信号の
パワースペクトル密度関数の形状の測度であるスペクト
ルフラットネスメジャーの逆数で表される。
音声信号の場合、予測ゲインGpは、予測次数を10次程
度にすると長時間平均値で8dB程度であるという報告が
ある(上記のエヌ・エス・ジェイアント及びピー・ノル
共著,270−271頁参照)。
度にすると長時間平均値で8dB程度であるという報告が
ある(上記のエヌ・エス・ジェイアント及びピー・ノル
共著,270−271頁参照)。
また、音声信号にはピッチによる繰り返し的な冗長性
もあり、ピッチ予測により情報圧縮の効率を更に高める
手段も広く利用されている。
もあり、ピッチ予測により情報圧縮の効率を更に高める
手段も広く利用されている。
上述した二つの線形予測の手段を用いた音声符号化の
方法としては、適応予測符号化(アダプティブ・プレデ
ィクティブ・コーディング(Adaptive Predictive Codi
ng)以後、APCと称する)方法があり、16〜9.6kbpsで高
音質な音声信号が得られる(例えば、上記のビー・エス
・アタル及びエム・アール・シュレーダー共著,1973−1
986頁参照)。
方法としては、適応予測符号化(アダプティブ・プレデ
ィクティブ・コーディング(Adaptive Predictive Codi
ng)以後、APCと称する)方法があり、16〜9.6kbpsで高
音質な音声信号が得られる(例えば、上記のビー・エス
・アタル及びエム・アール・シュレーダー共著,1973−1
986頁参照)。
APCは、二つの線形予測手段で予測できなかった予測
残差信号をサンプル当り1ビット程度のスカラー量に量
子化する。
残差信号をサンプル当り1ビット程度のスカラー量に量
子化する。
特にCELP(コード−エキサイテッド・リニア・プレデ
ィクション(Code−Excited Linear Prediction)にお
いては、予測残差信号を40サンプルの長さのベクトルと
して取り扱い、ベクトル量子化の技術を用いて更に効率
良く予測残差信号を圧縮符号化している(例えば「スト
カスティック・コーディング・オブ・スピーチ・シグナ
ルズ・アト・ヴェリー・ロウ・ビット・レイツ:ザ・イ
ンポータンス・オブ・スピーチ・パーセプション(Stoc
hastic Coding of Speech Signals at Very Low Bit Ra
tes:The Importance of Speech Perception)」,エム
・アール・シュレーダー及びビー・エス・アタル(M.R.
Shroeder and B.S.Atal),スピーチ・コミュニケーシ
ョン(Speech Communication),4,1985,ノース・ホーラ
ンド(North−Holland)155−162頁,参照)。
ィクション(Code−Excited Linear Prediction)にお
いては、予測残差信号を40サンプルの長さのベクトルと
して取り扱い、ベクトル量子化の技術を用いて更に効率
良く予測残差信号を圧縮符号化している(例えば「スト
カスティック・コーディング・オブ・スピーチ・シグナ
ルズ・アト・ヴェリー・ロウ・ビット・レイツ:ザ・イ
ンポータンス・オブ・スピーチ・パーセプション(Stoc
hastic Coding of Speech Signals at Very Low Bit Ra
tes:The Importance of Speech Perception)」,エム
・アール・シュレーダー及びビー・エス・アタル(M.R.
Shroeder and B.S.Atal),スピーチ・コミュニケーシ
ョン(Speech Communication),4,1985,ノース・ホーラ
ンド(North−Holland)155−162頁,参照)。
その結果、CELPにおいては、前述の二つの線形予測手
段及びベクトル量子化の技術を用いて4.8kbps程度まで
圧縮している。
段及びベクトル量子化の技術を用いて4.8kbps程度まで
圧縮している。
4.8kbpsの情報伝送量のうち予測残差信号の伝送が2kb
psを占め、残りの2.8kbpsがスペクトル又はピッチ予測
分析結果のパラメータの伝送に使われている。
psを占め、残りの2.8kbpsがスペクトル又はピッチ予測
分析結果のパラメータの伝送に使われている。
しかし、音声信号のうち、無声区間のようにパワース
ペクトルが平坦に近く、スペクトルフラットネスメジャ
ーの値が1に近く、スペクトル予測によるゲインが殆ど
稼げず、更にピッチ構造もなく、ピッチ予測によるゲイ
ンも殆どないような場合、4.8kbps情報伝送量のうち予
測分析結果のパラメータの伝送情報量が6割程度を占め
ており、非効率的に消費されている。
ペクトルが平坦に近く、スペクトルフラットネスメジャ
ーの値が1に近く、スペクトル予測によるゲインが殆ど
稼げず、更にピッチ構造もなく、ピッチ予測によるゲイ
ンも殆どないような場合、4.8kbps情報伝送量のうち予
測分析結果のパラメータの伝送情報量が6割程度を占め
ており、非効率的に消費されている。
[発明が解決しようとする課題] 従って上述のAPC及びCELPの音声符号化方法を用いた
従来の音声情報圧縮装置では、スペクトル又はピッチ予
測分析結果のパラメータを量子化するための情報量及び
予測残差信号を量子化するための情報量のビット数は固
定的に割り当てられており、スペクトル又はピッチ予測
で予測ゲインがあまり稼げない場合でもスペクトル又は
ピッチ予測分析結果のパラメータを伝送するために一定
の情報量が使用されており、効率的に情報を圧縮できな
いという問題点がある。
従来の音声情報圧縮装置では、スペクトル又はピッチ予
測分析結果のパラメータを量子化するための情報量及び
予測残差信号を量子化するための情報量のビット数は固
定的に割り当てられており、スペクトル又はピッチ予測
で予測ゲインがあまり稼げない場合でもスペクトル又は
ピッチ予測分析結果のパラメータを伝送するために一定
の情報量が使用されており、効率的に情報を圧縮できな
いという問題点がある。
本発明の目的は、上記従来の音声情報圧縮装置におけ
る問題点に鑑み、予測分析結果のパラメータを量子化す
るための情報量及び予測残差信号を量子化するための情
報量のビット配分を変化させることで、効率良く音声情
報を圧縮することができる音声情報圧縮装置を提供する
ことにある。
る問題点に鑑み、予測分析結果のパラメータを量子化す
るための情報量及び予測残差信号を量子化するための情
報量のビット配分を変化させることで、効率良く音声情
報を圧縮することができる音声情報圧縮装置を提供する
ことにある。
[課題を解決するための手段] 本発明の上述した目的は、音声信号の線形予測分析を
行って線形予測パラメータを出力する分析手段と、線形
予測パラメータを量子化する第1量子化手段と、予測残
差信号を量子化する第2量子化手段と、線形予測パラメ
ータ及び予測残差信号を量子化するための情報量のビッ
ト配分を変化させる情報配分手段と、過去の線形予測パ
ラメータから現在の線形予測パラメータを予測するパラ
メータ予測手段とを備えており、情報配分手段は、予測
された現在の線形予測パラメータにより現在の予測ゲイ
ンの大きさを推定し当該予測ゲインの大きさに基づいて
前記ビット配分を変化させることを特徴とする音声情報
圧縮装置によっても達成される。
行って線形予測パラメータを出力する分析手段と、線形
予測パラメータを量子化する第1量子化手段と、予測残
差信号を量子化する第2量子化手段と、線形予測パラメ
ータ及び予測残差信号を量子化するための情報量のビッ
ト配分を変化させる情報配分手段と、過去の線形予測パ
ラメータから現在の線形予測パラメータを予測するパラ
メータ予測手段とを備えており、情報配分手段は、予測
された現在の線形予測パラメータにより現在の予測ゲイ
ンの大きさを推定し当該予測ゲインの大きさに基づいて
前記ビット配分を変化させることを特徴とする音声情報
圧縮装置によっても達成される。
[作用] 本発明の音声情報圧縮装置においては、分析手段は音
声信号を線形予測分析して線形予測パラメータを出力
し、第1量子化手段は線形予測パラメータを量子化し、
第2量子化手段は予測残差信号を量子化し、パラメータ
予測手段は過去の線形予測パラメータから現在の線形予
測パラメータを予測し、情報配分手段は、予測された現
在の線形予測パラメータにより現在の予測ゲインの大き
さを推定して予測ゲインの大きさに基づいて分析結果の
パラメータを量子化するための情報量及び予測残差信号
を量子化するための情報量のビット配分を変化させる。
声信号を線形予測分析して線形予測パラメータを出力
し、第1量子化手段は線形予測パラメータを量子化し、
第2量子化手段は予測残差信号を量子化し、パラメータ
予測手段は過去の線形予測パラメータから現在の線形予
測パラメータを予測し、情報配分手段は、予測された現
在の線形予測パラメータにより現在の予測ゲインの大き
さを推定して予測ゲインの大きさに基づいて分析結果の
パラメータを量子化するための情報量及び予測残差信号
を量子化するための情報量のビット配分を変化させる。
[実施例] 以下、本発明における音声情報圧縮装置の参考例及び
実施例を図面を参照して詳述する。
実施例を図面を参照して詳述する。
第1図は本発明の音声情報圧縮装置の参考例としての
符号化器の構成を示すブロック図であり、第2図は第1
図に示す符号化器に対応する復号化器の構成を示すブロ
ック図である。
符号化器の構成を示すブロック図であり、第2図は第1
図に示す符号化器に対応する復号化器の構成を示すブロ
ック図である。
第1図に示す符号化器は、A/D変換器(以後、ADCと称
する)11、ADC11に接続された分析手段としての線形予
測分析器12、線形予測分析器12に接続された情報配分手
段としてのビット配分器14、線形予測分析器12及びビッ
ト配分器14に接続された第1量子化手段としての線形予
測パラメータ量子化器15、ビット配分器14及び線形予測
パラメータ量子化器15に接続された線形予測器16及び残
差信号量子化器17、ADC11及び線形予測器16に接続され
た加算器13、加算器13及びビット配分器14に接続された
第2量子化手段としての残差信号量子化器17、ビット配
分器14、線形予測パラメータ量子化器15及び残差信号量
子化器17に接続されたマルチプレクサ18から構成されて
いる。
する)11、ADC11に接続された分析手段としての線形予
測分析器12、線形予測分析器12に接続された情報配分手
段としてのビット配分器14、線形予測分析器12及びビッ
ト配分器14に接続された第1量子化手段としての線形予
測パラメータ量子化器15、ビット配分器14及び線形予測
パラメータ量子化器15に接続された線形予測器16及び残
差信号量子化器17、ADC11及び線形予測器16に接続され
た加算器13、加算器13及びビット配分器14に接続された
第2量子化手段としての残差信号量子化器17、ビット配
分器14、線形予測パラメータ量子化器15及び残差信号量
子化器17に接続されたマルチプレクサ18から構成されて
いる。
次に上述の符号化器の動作を説明する。
A/D変換器(以後、ADCと称する)11は、入力端子から
入力されたアナログ音声信号波形をデジタルデータに変
換し、変換されたデジタルデータを一定のサンプル長の
フレーム単位(例えば5msec)に分割して線形予測分析
器12及び加算器13にそれぞれ出力する。
入力されたアナログ音声信号波形をデジタルデータに変
換し、変換されたデジタルデータを一定のサンプル長の
フレーム単位(例えば5msec)に分割して線形予測分析
器12及び加算器13にそれぞれ出力する。
線形予測分析器12はADC11により分割されたデジタル
データを入力して線形予測分析を行う。ここで線形予測
とは、近接サンプルの信号系列によるスペクトル予測又
は一般に長期予測と呼ばれているピッチ予測の2つの予
測を表すものとする。線形予測分析器12による線形予測
分析の結果は、ビット配分器14と線形予測パラメータ量
子化器15とにそれぞれ出力される。
データを入力して線形予測分析を行う。ここで線形予測
とは、近接サンプルの信号系列によるスペクトル予測又
は一般に長期予測と呼ばれているピッチ予測の2つの予
測を表すものとする。線形予測分析器12による線形予測
分析の結果は、ビット配分器14と線形予測パラメータ量
子化器15とにそれぞれ出力される。
ビット配分器14は、線形予測分析器12から出力された
線形予測分析の結果を入力し、予測分析による予測ゲイ
ンの大きさに応じて、予測分析の結果のパラメータ(以
後、線形予測パラメータと称する)を量子化するための
情報量及び予測残差信号を量子化するための情報量のビ
ット配分情報を線形予測パラメータ量子化器15、線形予
測器16、残差信号量子化器17及びマルチプレクサ18にそ
れぞれ出力する。なお、予測ゲインの算出の方法及びビ
ット配分情報の決定の方法は後述する。
線形予測分析の結果を入力し、予測分析による予測ゲイ
ンの大きさに応じて、予測分析の結果のパラメータ(以
後、線形予測パラメータと称する)を量子化するための
情報量及び予測残差信号を量子化するための情報量のビ
ット配分情報を線形予測パラメータ量子化器15、線形予
測器16、残差信号量子化器17及びマルチプレクサ18にそ
れぞれ出力する。なお、予測ゲインの算出の方法及びビ
ット配分情報の決定の方法は後述する。
線形予測パラメータ量子化器15は、線形予測分析器12
から出力された線形予測パラメータ及びビット配分器14
から出力されたビット配分情報をそれぞれ入力して、ビ
ット配分情報に基づいて線形予測パラメータを量子化し
て線形予測器16に出力すると共にマルチプレクサ18にも
出力する。
から出力された線形予測パラメータ及びビット配分器14
から出力されたビット配分情報をそれぞれ入力して、ビ
ット配分情報に基づいて線形予測パラメータを量子化し
て線形予測器16に出力すると共にマルチプレクサ18にも
出力する。
線形予測器16は、線形予測パラメータ量子化器15から
出力された量子化された線形予測パラメータと、ビット
配分器14から出力されたビット配分情報とを入力して、
量子化された線形予測パラメータとビット配分情報とに
基づいて入力信号を線形予測して加算器13に出力する。
出力された量子化された線形予測パラメータと、ビット
配分器14から出力されたビット配分情報とを入力して、
量子化された線形予測パラメータとビット配分情報とに
基づいて入力信号を線形予測して加算器13に出力する。
加算器13は、線形予測器16から出力された線形予測さ
れた入力信号を、ADC11によりデジタルデータ化されて
出力された入力信号から減算して残差信号を算出し、算
出された残差信号を残差信号量子化器17に出力する。
れた入力信号を、ADC11によりデジタルデータ化されて
出力された入力信号から減算して残差信号を算出し、算
出された残差信号を残差信号量子化器17に出力する。
残差信号量子化器17は、加算器13から出力された残差
信号を入力し、ビット配分器14から出力されたビット配
分情報に基づいて残差信号を量子化してマルチプレクサ
18に出力する。なお、量子化の方法としては、PCM(パ
ルス符号変調)及びベクトル量子化などの方法が用いら
れる。
信号を入力し、ビット配分器14から出力されたビット配
分情報に基づいて残差信号を量子化してマルチプレクサ
18に出力する。なお、量子化の方法としては、PCM(パ
ルス符号変調)及びベクトル量子化などの方法が用いら
れる。
マルチプレクサ18は、残差信号量子化器17から出力さ
れた量子化された残差信号及び線形予測パラメータ量子
化器15から出力された線形予測パラメータを、ビット配
分器14から出力されたビット配分情報と共に伝送路19に
伝送する。
れた量子化された残差信号及び線形予測パラメータ量子
化器15から出力された線形予測パラメータを、ビット配
分器14から出力されたビット配分情報と共に伝送路19に
伝送する。
次に上述のビット配分器14における予測ゲインの算出
方法について説明する。
方法について説明する。
1次又は2次の線形予測で、最適な線形予測フィルタ
を用いた場合、最大予測ゲインの大きさは以下の(2)
式及び(3)式で求められる(前述の「デシタル・コー
ディング・オブ・ウエーブフォームズ」、第261頁及び
第263頁参照)。
を用いた場合、最大予測ゲインの大きさは以下の(2)
式及び(3)式で求められる(前述の「デシタル・コー
ディング・オブ・ウエーブフォームズ」、第261頁及び
第263頁参照)。
max{1Gp}= (1−p1 2)-1 ……(2) ここでmax{1Gp}は1次の最大予測ゲイン、max
{2Gp}は2次の最大予測ゲイン、p1及びp2は、ADC11か
ら得られる音声信号の正規化された1次及び2次の自己
相関値をそれぞれ表す。
{2Gp}は2次の最大予測ゲイン、p1及びp2は、ADC11か
ら得られる音声信号の正規化された1次及び2次の自己
相関値をそれぞれ表す。
一般に、p次の線形予測(pを任意の正の整数とし
て)では、最適な線形予測フィルタのフィルタ係数をα
k(k=1,2,…p)とすると、最大予測ゲインの大きさ
は次に示す(4)式により求められる。
て)では、最適な線形予測フィルタのフィルタ係数をα
k(k=1,2,…p)とすると、最大予測ゲインの大きさ
は次に示す(4)式により求められる。
ここで(Gp)optは、p次の最大予測ゲイン、p
(k)はADC11から得られる音声信号の正規化されたk
次の自己相関値をそれぞれ表す。なお、本参考例では、
上記(4)式に基づいて予測ゲインを算出する。
(k)はADC11から得られる音声信号の正規化されたk
次の自己相関値をそれぞれ表す。なお、本参考例では、
上記(4)式に基づいて予測ゲインを算出する。
上述のビット配分器14におけるビット配分情報の決定
の方法について以下説明する。
の方法について以下説明する。
一般に最適予測フィルタの係数は、量子化によって最
適な値からずれてしまい、予測ゲインが減少する。本実
施例では量子化により最適予測フィルタの係数が下記の
(5)式のように量子化されたものとする。
適な値からずれてしまい、予測ゲインが減少する。本実
施例では量子化により最適予測フィルタの係数が下記の
(5)式のように量子化されたものとする。
h=hopt+δ ……(5) こで、hは量子化された予測フィルタの係数ベクトル
を表し、hoptは最適予測フィルタの係数ベクトルを表
し、δは最適な値からのずれのベクトルをそれぞれ表
す。従って、上記(5)式による量子化の影響により、
予測残差信号の分散が増大する。この関係は、次式
(6)で表される。
を表し、hoptは最適予測フィルタの係数ベクトルを表
し、δは最適な値からのずれのベクトルをそれぞれ表
す。従って、上記(5)式による量子化の影響により、
予測残差信号の分散が増大する。この関係は、次式
(6)で表される。
σ2d= min{σ2d}+δTRxxδ ……(6) ここで、min{σ2d}は、最適予測が行われた場合の
予測残差信号の分散を表わす。
予測残差信号の分散を表わす。
上記(6)式により、量子化による予測フィルタの予
測ゲインの劣化が算出できる。
測ゲインの劣化が算出できる。
Rxxは、次の(7)に示すように入力信号の自己相関
値を成分とするN×Nの行列である(ここでNは任意の
正の整数であり、予測次数を表すものとする)。
値を成分とするN×Nの行列である(ここでNは任意の
正の整数であり、予測次数を表すものとする)。
予測分析した結果のパラメータを量子化するための情
報量のビット数を低減することによる符号化性能の劣化
と、予測残差信号を量子化するための情報量のビット数
を増加させることによる符号化性能の向上とのトレード
オフによりビット配分情報が決定される。
報量のビット数を低減することによる符号化性能の劣化
と、予測残差信号を量子化するための情報量のビット数
を増加させることによる符号化性能の向上とのトレード
オフによりビット配分情報が決定される。
しかし、予測分析した結果のパラメータの量子化のビ
ット感度(1ビット当りシステムの性能にどれだけ寄与
しているかを表す指標値)及び予測残差信号の量子化の
ビット感度は、用いるパラメータの種類及び量子化の方
法によって異なるのでシステム毎にビット配分情報の決
定を調整する必要がある。
ット感度(1ビット当りシステムの性能にどれだけ寄与
しているかを表す指標値)及び予測残差信号の量子化の
ビット感度は、用いるパラメータの種類及び量子化の方
法によって異なるのでシステム毎にビット配分情報の決
定を調整する必要がある。
次に最も簡単な一次の線形予測システムの場合につい
て上述の方法を説明する。
て上述の方法を説明する。
最適予測を行った場合の予測ゲインは、前述の(2)
式で与えられるが、ここで一次の線形予測フィルタの係
数h1が量子化により h1=p1+δ1 になったとする。
式で与えられるが、ここで一次の線形予測フィルタの係
数h1が量子化により h1=p1+δ1 になったとする。
この量子化の影響による予測残差信号の分散の増大
は、次の(8)式で表される。
は、次の(8)式で表される。
σ2d=(1−p2 1+δ2 1)σ2x ……(8) ここでσ2xは入力信号の分散を表す。
なお、δ1=0.2とした場合、種々の予測ゲインでの
劣化の度合を第1表に示す。
劣化の度合を第1表に示す。
第1表から理解されるように、最適予測ゲインの値が
大きいほど、量子化による影響(δ1)がゲインを大き
く劣化させる。
大きいほど、量子化による影響(δ1)がゲインを大き
く劣化させる。
従ってビット配分情報の決定には、最適予測ゲインの
値が大きい程、予測分析した結果のパラメータの量子化
に多くの情報量のビット数を割り当て、最適予測ゲイン
の値が小さいときに予測分析した結果のパラメータの量
子化に少ない情報量のビット数を割り当て、余った情報
量のビット数を予測残差信号の量子化に割り当てること
ができるようにビット配分器14を設定すればよい。
値が大きい程、予測分析した結果のパラメータの量子化
に多くの情報量のビット数を割り当て、最適予測ゲイン
の値が小さいときに予測分析した結果のパラメータの量
子化に少ない情報量のビット数を割り当て、余った情報
量のビット数を予測残差信号の量子化に割り当てること
ができるようにビット配分器14を設定すればよい。
次に、第1図に示した符号化器に対応する復号化器を
第2図を参照して説明する。
第2図を参照して説明する。
第2図に示した復号化器は、デマルチプレクサ20、デ
マルチプレクサ20に接続された残差信号逆量子化器21、
残差信号逆量子化器21及びデマルチプレクサ20に接続さ
れた合成フィルタ22、そして合成フィルタ22に接続され
たD/A変換器(以後、DACと称する)23により構成されて
いる。
マルチプレクサ20に接続された残差信号逆量子化器21、
残差信号逆量子化器21及びデマルチプレクサ20に接続さ
れた合成フィルタ22、そして合成フィルタ22に接続され
たD/A変換器(以後、DACと称する)23により構成されて
いる。
次に上述の復号化器の動作を説明する。
デマルチプレクサ20は、伝送路19から受信した信号を
線形予測パラメータ、残差信号及びビット配分情報にそ
れぞれ分解する。
線形予測パラメータ、残差信号及びビット配分情報にそ
れぞれ分解する。
残差信号逆量子化器21は、量子化された残差信号をビ
ット配分情報に基づいて逆量子化して合成フィルタ22に
出力する。
ット配分情報に基づいて逆量子化して合成フィルタ22に
出力する。
合成フィルタ22は、デマルチプレクサ20から出力され
た線形予測パラメータをビット配分情報に基づいて復元
すると共に、残差信号逆量子化器21から出力された逆量
子化された残差信号を入力して再生信号をD/A変換器23
に出力する。
た線形予測パラメータをビット配分情報に基づいて復元
すると共に、残差信号逆量子化器21から出力された逆量
子化された残差信号を入力して再生信号をD/A変換器23
に出力する。
DAC23は、合成フィルタ22から出力された再生信号を
入力してアナログ信号に変換して入力音声信号を再生す
る。
入力してアナログ信号に変換して入力音声信号を再生す
る。
上記動作手順に従って、スペクトル予測又はピッチ予
測の予測ゲインの大きさによって、予測分析結果のパラ
メータを量子化するための情報量及び予測残差信号を量
子化するための情報量のビット配分を変化させることで
効率良く音声を情報圧縮することができる。
測の予測ゲインの大きさによって、予測分析結果のパラ
メータを量子化するための情報量及び予測残差信号を量
子化するための情報量のビット配分を変化させることで
効率良く音声を情報圧縮することができる。
次に、本発明の音声情報圧縮装置の実施例を詳述す
る。
る。
第3図は本発明の音声情報圧縮装置の実施例としての
符号化器の構成を示すブロック図であり、第4図は第3
図に示す符号化器に対応する復号化器の構成を示すブロ
ック図である。
符号化器の構成を示すブロック図であり、第4図は第3
図に示す符号化器に対応する復号化器の構成を示すブロ
ック図である。
なお、第3図及び第4図において、第1図及び第2図
中における構成要素と同一のものには、同一の符号を記
して説明を省略する。
中における構成要素と同一のものには、同一の符号を記
して説明を省略する。
上述の参考例の符号化器の構成と比較して実施例の符
号化器の構成の違いは、線形予測パラメータ予測器24が
ビット配分器14、線形予測パラメータ量子化器15及び残
差信号量子化器17に接続されていることである。
号化器の構成の違いは、線形予測パラメータ予測器24が
ビット配分器14、線形予測パラメータ量子化器15及び残
差信号量子化器17に接続されていることである。
動作的に参考例の符号化器と異なるのは、予測分析結
果のパラメータを量子化するための情報量及び予測残差
信号を量子化するための情報量のビット配分情報を、過
去の線形予測パラメータから現在の線形予測パラメータ
を予測して現在の予測ゲインの大きさを推定し、推定さ
れた予測ゲインの大きさにより算出すると共に、このビ
ット配分情報を伝送路に出力しない点にある。
果のパラメータを量子化するための情報量及び予測残差
信号を量子化するための情報量のビット配分情報を、過
去の線形予測パラメータから現在の線形予測パラメータ
を予測して現在の予測ゲインの大きさを推定し、推定さ
れた予測ゲインの大きさにより算出すると共に、このビ
ット配分情報を伝送路に出力しない点にある。
これは、音声のスペクトルの動きが比較的ゆっくりで
あり、フレーム(例えば5msec)毎の予測フィルタの係
数に相関があることを利用したものである。最も簡単な
方法としては、1フレームだけ過去の線形予測パラメー
タを、現在の線形予測パラメータとして取り扱ってビッ
ト配分情報を算出する。
あり、フレーム(例えば5msec)毎の予測フィルタの係
数に相関があることを利用したものである。最も簡単な
方法としては、1フレームだけ過去の線形予測パラメー
タを、現在の線形予測パラメータとして取り扱ってビッ
ト配分情報を算出する。
以下、1次の予測を用いた場合の線形予測パラメータ
予測器24の動作について説明する。
予測器24の動作について説明する。
n及びmを任意の正の整数とし、n−1番目のフレー
ムのm次の線形予測係数のベクトルを、 xn-1={xn-1(1),xn-1(2), …,xn-1(m)}T、 と表すと、一次の予測での線形予測係数xnは次の(9)
式により求めることができる。
ムのm次の線形予測係数のベクトルを、 xn-1={xn-1(1),xn-1(2), …,xn-1(m)}T、 と表すと、一次の予測での線形予測係数xnは次の(9)
式により求めることができる。
xn=Axn-1 ……(9) ここでAは、m×mの予測行列であり、次式(10)の
予測エラーen= {en(1),en(2),…,en(m)}T のエネルギーを最小化する行列である。
予測エラーen= {en(1),en(2),…,en(m)}T のエネルギーを最小化する行列である。
en=xn−Axn-1 ……(10) 従って、過去の線形予測パラメータから現在の線形予
測パラメータを線形予測することができる。
測パラメータを線形予測することができる。
次に上述の参考例と異なる部分の説明を行う。
第3図に示す符号化器では、線形予測パラメータ予測
器24は、過去の線形予測パラメータを蓄積しており、現
在の線形予測パラメータを線形予測の方法を用いて推定
してビット配分器14に出力する。また同時に現在のビッ
ト配分情報に基づいて、線形予測パラメータ量子化器15
の出力する線形予測パラメータを蓄積し、次のフレーム
で線形予測のもとになるデータとして使用する。
器24は、過去の線形予測パラメータを蓄積しており、現
在の線形予測パラメータを線形予測の方法を用いて推定
してビット配分器14に出力する。また同時に現在のビッ
ト配分情報に基づいて、線形予測パラメータ量子化器15
の出力する線形予測パラメータを蓄積し、次のフレーム
で線形予測のもとになるデータとして使用する。
上述の符号化器に対応する復号化器を第4図に示す。
第4図の復号化器では、第2図の復号化器と比較し
て、ビット配分器26がデマルチプレクサ20に接続され、
線形予測パラメータ予測器25がデマルチプレクサ20、ビ
ット配分器26、残差信号逆量子化器21及び合成フィルタ
22に接続されている。また、第4図の復号化器において
も、線形予測パラメータ予測器25は、上述の符号化器の
場合と同様に動作する。
て、ビット配分器26がデマルチプレクサ20に接続され、
線形予測パラメータ予測器25がデマルチプレクサ20、ビ
ット配分器26、残差信号逆量子化器21及び合成フィルタ
22に接続されている。また、第4図の復号化器において
も、線形予測パラメータ予測器25は、上述の符号化器の
場合と同様に動作する。
ビット配分器26は、伝送路19から受信した信号を線形
予測パラメータ及び残差信号のデータに分解するために
デマルチプレクサ20に対してビット配分情報を出力す
る。
予測パラメータ及び残差信号のデータに分解するために
デマルチプレクサ20に対してビット配分情報を出力す
る。
上記動作手順により、本実施例の音声情報圧縮装置で
は、ビット配分情報を伝送路19に出力することなしに、
スペクトル予測又はピッチ予測による予測ゲインの大き
さによって、予測分析結果のパラメータを量子化するた
めの情報量及び予測残差信号を量子化するための情報量
のビット配分を変化させることで効率良く音声情報圧縮
することができる。なお、この予測ゲインの大きさによ
ってビット配分を行う処理は、スペクトル予測とピッチ
予測との間でも実行できる。
は、ビット配分情報を伝送路19に出力することなしに、
スペクトル予測又はピッチ予測による予測ゲインの大き
さによって、予測分析結果のパラメータを量子化するた
めの情報量及び予測残差信号を量子化するための情報量
のビット配分を変化させることで効率良く音声情報圧縮
することができる。なお、この予測ゲインの大きさによ
ってビット配分を行う処理は、スペクトル予測とピッチ
予測との間でも実行できる。
CELPを用いた音声情報圧縮装置の参考例を第5図及び
第6図に示す。
第6図に示す。
第5図は上述のCELPを用いた符号化器を示す。この符
号化器は、ADC11、線形予測分析器12、加算器13、ビッ
ト配分器14、線形予測パラメータ量子化器15、マルチプ
レクサ18、合成フィルタ27、複数の残差コードブック2
8、最小エラー選択器29により構成されている。
号化器は、ADC11、線形予測分析器12、加算器13、ビッ
ト配分器14、線形予測パラメータ量子化器15、マルチプ
レクサ18、合成フィルタ27、複数の残差コードブック2
8、最小エラー選択器29により構成されている。
以下、第5図の符号化器の動作を説明する。
ADC11は、入力端子から入力されたアナログ音声信号
波形をデジタルデータに変換し、変換されたデジタルデ
ータを一定のサンプル長のフレーム単位(例えば5mse
c)に分割して線形予測分析器12及び加算器13にそれぞ
れ出力する。
波形をデジタルデータに変換し、変換されたデジタルデ
ータを一定のサンプル長のフレーム単位(例えば5mse
c)に分割して線形予測分析器12及び加算器13にそれぞ
れ出力する。
線形予測分析器12はADC11により分割されたデジタル
データを入力して線形予測分析を行う。
データを入力して線形予測分析を行う。
線形予測分析器12による線形予測分析の結果は、ビッ
ト配分器14及び線形予測パラメータ量子化器15にそれぞ
れ出力される。
ト配分器14及び線形予測パラメータ量子化器15にそれぞ
れ出力される。
ビット配分器14は、線形予測分析器12から出力された
線形予測分析の結果を入力し、予測分析による予測ゲイ
ンの大きさに応じて、線形予測パラメータを量子化する
ための情報量及び予測残差信号をベクトル的に量子化す
るための情報量(コードブックの選択に使用される)の
ビット配分情報を線形予測パラメータ量子化器15、合成
フィルタ27、複数の残差コードブック28及びマルチプレ
クサ18にそれぞれ出力する。
線形予測分析の結果を入力し、予測分析による予測ゲイ
ンの大きさに応じて、線形予測パラメータを量子化する
ための情報量及び予測残差信号をベクトル的に量子化す
るための情報量(コードブックの選択に使用される)の
ビット配分情報を線形予測パラメータ量子化器15、合成
フィルタ27、複数の残差コードブック28及びマルチプレ
クサ18にそれぞれ出力する。
線形予測パラメータ量子化器15は、線形予測分析器12
から出力された線形予測パラメータ及びビット配分器14
から出力されたビット配分情報をそれぞれ入力して、ビ
ット配分情報に基づいて線形予測パラメータを量子化し
て合成フィルタ27に出力すると共にマルチプレクサ18に
も出力する。
から出力された線形予測パラメータ及びビット配分器14
から出力されたビット配分情報をそれぞれ入力して、ビ
ット配分情報に基づいて線形予測パラメータを量子化し
て合成フィルタ27に出力すると共にマルチプレクサ18に
も出力する。
合成フィルタ27は、線形予測パラメータ量子化器15か
ら出力された量子化された線形予測パラメータと、ビッ
ト配分器14から出力されたビット配分情報とを入力し
て、量子化された線形予測パラメータとビット配分情報
とに基づいて入力信号をフィルタリングし、現在選択さ
れたコードブックの全てのコードブックの残差信号を入
力し、複数の合成出力を得て加算器13に出力する。
ら出力された量子化された線形予測パラメータと、ビッ
ト配分器14から出力されたビット配分情報とを入力し
て、量子化された線形予測パラメータとビット配分情報
とに基づいて入力信号をフィルタリングし、現在選択さ
れたコードブックの全てのコードブックの残差信号を入
力し、複数の合成出力を得て加算器13に出力する。
加算器13は、入力信号と合成フィルタ27で合成された
複数の信号をフレーム単位で減算して最小エラー選択器
29に出力する。
複数の信号をフレーム単位で減算して最小エラー選択器
29に出力する。
最小エラー選択器29は、現在選択されたコードブック
のうち、複数の合成出力信号の中で、最小エラーとなる
コードワードを求め、そのコードワードを特定する指標
値をマルチプレクサ18に出力する。
のうち、複数の合成出力信号の中で、最小エラーとなる
コードワードを求め、そのコードワードを特定する指標
値をマルチプレクサ18に出力する。
マルチプレクサ18は、線形予測パラメータ量子化器15
から出力された線形予測パラメータ及び残差信号を表す
指標値を、ビット配分器14から出力されたビット配分情
報と共に蓄積して通信路である伝送路19に伝送する。
から出力された線形予測パラメータ及び残差信号を表す
指標値を、ビット配分器14から出力されたビット配分情
報と共に蓄積して通信路である伝送路19に伝送する。
第6図は、第5図の符号化器に対応する復号化器を示
す。
す。
第6図に示す復号化器は、デマルチプレクサ20、複数
の残差コードブック30、合成フィルタ22、DAC23により
構成されている。
の残差コードブック30、合成フィルタ22、DAC23により
構成されている。
以下、第6図の復号化器の動作を説明する。
デマルチプレクサ20は、伝送路19から受信した信号を
線形予測パラメータ、残差信号を表現する指標値及びビ
ット配分情報にそれぞれ分解する。
線形予測パラメータ、残差信号を表現する指標値及びビ
ット配分情報にそれぞれ分解する。
複数の残差コードブック30は、ビット配分情報に従っ
て使用するコードブックを選択し、残差信号を表現する
指標値のコードワードの残差信号を合成フィルタ22に出
力する。
て使用するコードブックを選択し、残差信号を表現する
指標値のコードワードの残差信号を合成フィルタ22に出
力する。
合成フィルタ22は、デマルチプレクサ20から出力され
た線形予測パラメータをビット配分情報に基づいて復元
すると共に、残差信号を入力して再生信号をDAC変換器2
3に出力する。
た線形予測パラメータをビット配分情報に基づいて復元
すると共に、残差信号を入力して再生信号をDAC変換器2
3に出力する。
DAC23は、合成フィルタ22から出力された再生信号を
入力してアナログ信号に変換して入力音声信号を再生す
る。
入力してアナログ信号に変換して入力音声信号を再生す
る。
[発明の効果] 本発明の音声情報圧縮装置によれば、音声信号の線形
予測分析を行って線形予測パラメータを出力する分析手
段と、線形予測パラメータを量子化する第1量子化手段
と、予測残差信号を量子化する第2量子化手段と、線形
予測パラメータ及び予測残差信号を量子化するための情
報量のビット配分を変化させる情報配分手段と、過去の
線形予測パラメータから現在の線形予測パラメータを予
測するパラメータ予測手段とを備えており、情報配分手
段は、予測された現在の線形予測パラメータにより現在
の予測ゲインの大きさを推定し当該予測ゲインの大きさ
に基づいてビット配分を変化させるので、ビット配分情
報を伝送することなくビット配分を独自に変化させるこ
とができ、その結果、音声の品質が向上し、効率良く音
声情報を圧縮することができる。
予測分析を行って線形予測パラメータを出力する分析手
段と、線形予測パラメータを量子化する第1量子化手段
と、予測残差信号を量子化する第2量子化手段と、線形
予測パラメータ及び予測残差信号を量子化するための情
報量のビット配分を変化させる情報配分手段と、過去の
線形予測パラメータから現在の線形予測パラメータを予
測するパラメータ予測手段とを備えており、情報配分手
段は、予測された現在の線形予測パラメータにより現在
の予測ゲインの大きさを推定し当該予測ゲインの大きさ
に基づいてビット配分を変化させるので、ビット配分情
報を伝送することなくビット配分を独自に変化させるこ
とができ、その結果、音声の品質が向上し、効率良く音
声情報を圧縮することができる。
第1図は本発明の音声情報圧縮装置の参考例としての符
号化器の構成を示すブロック図、第2図は第1図に示す
符号化器に対応する復号化器の一構成例を示すブロック
図、第3図は本発明の音声情報圧縮装置の実施例として
の符号化器の構成を示すブロック図、第4図は第3図に
示す符号化器に対応する復号化器の一構成例を示すブロ
ック図、第5図はCELPを用いた音声情報圧縮装置の参考
例における符号化器の構成を示すブロック図、第6図は
第5図に示す符号化器に対応する復号化器の一構成例を
示すブロック図である。 11……A/D変換器、12……線形予測分析器、13……加算
器、14,26……ビット配分器、15……線形予測パラメー
タ量子化器、16……線形予測器、17……残差信号量子化
器、18……マルチプレクサ、20……デマルチプレクサ、
21……残差信号逆量子化器、22……合成フィルタ、23…
…D/A変換器、24,25……線形予測パラメータ予測器。
号化器の構成を示すブロック図、第2図は第1図に示す
符号化器に対応する復号化器の一構成例を示すブロック
図、第3図は本発明の音声情報圧縮装置の実施例として
の符号化器の構成を示すブロック図、第4図は第3図に
示す符号化器に対応する復号化器の一構成例を示すブロ
ック図、第5図はCELPを用いた音声情報圧縮装置の参考
例における符号化器の構成を示すブロック図、第6図は
第5図に示す符号化器に対応する復号化器の一構成例を
示すブロック図である。 11……A/D変換器、12……線形予測分析器、13……加算
器、14,26……ビット配分器、15……線形予測パラメー
タ量子化器、16……線形予測器、17……残差信号量子化
器、18……マルチプレクサ、20……デマルチプレクサ、
21……残差信号逆量子化器、22……合成フィルタ、23…
…D/A変換器、24,25……線形予測パラメータ予測器。
Claims (1)
- 【請求項1】音声信号の線形予測分析を行って線形予測
パラメータを出力する分析手段と、前記線形予測パラメ
ータを量子化する第1量子化手段と、予測残差信号を量
子化する第2量子化手段と、前記線形予測パラメータ及
び前記予測残差信号を量子化するための情報量のビット
配分を変化させる情報配分手段と、過去の線形予測パラ
メータから現在の線形予測パラメータを予測するパラメ
ータ予測手段とを備えており、前記情報配分手段は、前
記予測された現在の線形予測パラメータにより現在の予
測ゲインの大きさを推定し当該予測ゲインの大きさに基
づいて前記ビット配分を変化させることを特徴とする音
声情報圧縮装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2183523A JP2686350B2 (ja) | 1990-07-11 | 1990-07-11 | 音声情報圧縮装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2183523A JP2686350B2 (ja) | 1990-07-11 | 1990-07-11 | 音声情報圧縮装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0470800A JPH0470800A (ja) | 1992-03-05 |
JP2686350B2 true JP2686350B2 (ja) | 1997-12-08 |
Family
ID=16137338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2183523A Expired - Fee Related JP2686350B2 (ja) | 1990-07-11 | 1990-07-11 | 音声情報圧縮装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2686350B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101091317B (zh) | 2005-01-12 | 2011-05-11 | 日本电信电话株式会社 | 用于长期预测编码和长期预测解码的方法和装置 |
RU2571561C2 (ru) * | 2011-04-05 | 2015-12-20 | Ниппон Телеграф Энд Телефон Корпорейшн | Способ кодирования, способ декодирования, кодер, декодер, программа и носитель записи |
-
1990
- 1990-07-11 JP JP2183523A patent/JP2686350B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH0470800A (ja) | 1992-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4811396A (en) | Speech coding system | |
KR100643116B1 (ko) | 개선된 음성 인코더를 구비한 전송 시스템 및 이 시스템의 운영 방법 | |
JP4101957B2 (ja) | 音声パラメータの合同量子化 | |
US5214741A (en) | Variable bit rate coding system | |
CN1235190C (zh) | 改善音频信号编码效率的方法 | |
JPS6161305B2 (ja) | ||
JPH0683395A (ja) | 合成による分析技術を利用する低遅延オーディオ信号コーダ | |
EP0375551B1 (en) | A speech coding/decoding system | |
JP2007504503A (ja) | 低ビットレートオーディオ符号化 | |
US6012026A (en) | Variable bitrate speech transmission system | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
US6792402B1 (en) | Method and device for defining table of bit allocation in processing audio signals | |
JPH11184498A (ja) | 音声符号化/復号化方法 | |
JP3684751B2 (ja) | 信号符号化方法及び装置 | |
JP2686350B2 (ja) | 音声情報圧縮装置 | |
Taniguchi et al. | Multimode coding: application to CELP | |
CA2194199C (en) | Encoding system and decoding system for audio signals | |
KR0135907B1 (ko) | 선스펙트럼쌍주파수의 벡터-스칼라 결합 양자화기(Vector and Scalar Quantizer of LSP Frequency) | |
JP2551147B2 (ja) | 音声符号化方式 | |
JP3010655B2 (ja) | 圧縮符号化装置及び方法、並びに復号装置及び方法 | |
EP1334485B1 (en) | Speech codec and method for generating a vector codebook and encoding/decoding speech signals | |
JP2633318B2 (ja) | 音声符号化装置 | |
JP3330178B2 (ja) | 音声符号化装置および音声復号化装置 | |
JPH083719B2 (ja) | 音声分析合成装置 | |
JPS62224122A (ja) | 信号符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |