JP2808841B2 - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JP2808841B2
JP2808841B2 JP2184231A JP18423190A JP2808841B2 JP 2808841 B2 JP2808841 B2 JP 2808841B2 JP 2184231 A JP2184231 A JP 2184231A JP 18423190 A JP18423190 A JP 18423190A JP 2808841 B2 JP2808841 B2 JP 2808841B2
Authority
JP
Japan
Prior art keywords
signal
codebook
audio signal
error
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2184231A
Other languages
English (en)
Other versions
JPH0473699A (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP2184231A priority Critical patent/JP2808841B2/ja
Publication of JPH0473699A publication Critical patent/JPH0473699A/ja
Application granted granted Critical
Publication of JP2808841B2 publication Critical patent/JP2808841B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声信号を低いビットレート、特に8〜4.8k
b/s程度で高品質に符号化するための音声符号化方式に
関する。
〔従来の技術〕
音声信号を8〜4.8kb/s程度の低いビットレートで符
号化する方式としては、例えば、M.Sohroeder and B.At
al氏による“Code−excited linear prediction:High q
uality speech at very low bit rates"(Proc.ICASSP,
pp.937−940,1985年)と題した論文(文献1)や,Kleij
n氏らによる“Improved speech quality and efficient
vector quantization in SELP"と題した論文(ICASSP,
pp.155−158,1988年)(文献2)等に記載されているCE
LP(Code Excited LPC Coding)方式や、B.Atal氏らに
よる“A new model of LPC excitation for producing
natural−sounding speech at low bit rates"(Proc.I
CASSP,pp614−617,1982)と題した論文(文献3)等に
記載されているマルチパルス符号化方式が知られてい
る。
文献1,2に記載の方法では、送信側では、フレーム毎
(例えば20ms)に音声信号から音声信号のスペクトル特
性を表すスペクトルパラメータを抽出し、フレームをさ
らに小区画サブフレーム(例えば5ms)に分割し、サブ
フレーム毎に、過去の音源信号をもとに再生した再生信
号と、音源信号との重み付け2乗誤差を最小化するよう
に長時間相関(ピッチ相関)を表す適応コードブックの
ピッチパラメータを抽出し、ピッチパラメータによりサ
ブフレームの音声信号を長期予測し、長期予測して求め
た残差信号に対して、予め定められた種類の雑音信号か
らなるコードブックから選択した信号により合成した信
号と、音声信号との重み付け2乗誤差を最小化するよう
に一種類の雑音信号を選択するとともに、最適なゲイン
を計算する。そして選択された雑音信号の種類を表すイ
ンデクスとゲイン、ならびに、スペクトルパラメータと
ピッチパラメータを伝送する。
〔発明が解決しようとする課題〕
上述した文献1の従来方式では、マルチパルスや、適
応コードブックや、雑音信号からなるコードブックを探
索するときは、誤差評価尺度として、入力音声信号とコ
ードブックあるいはマルチパルスにより再生した信号と
の重み付け2乗誤差を用いていた。しかし、この評価尺
度は必ずしも聴感と一致していないために、この尺度で
選択したコードベクトル、あるいは求めたマルチパルス
を用いて選択した再生音声の音質は、必ずしも十分では
ないという問題点があった。またこの問題点は特にビッ
トレートを低減しコードブックのサイズを小さくすると
顕著であった。
本発明の目的は、上記問題点を解決した音声符号化方
式を提供することにある。
〔課題を解決するための手段〕
第1の発明は、入力した離散的な音声信号を予め定め
られた時間長のフレームに分割し、前記音声信号のスペ
クトル包絡を表すスペクトルパラメータを求めて出力
し、前記フレームを予め定められた時間長の小区画に分
割し、過去の音源信号からなる適応コードブックをもと
に再生した信号が前記音声信号に近くなるようにピッチ
パラメータを求め、前記音声信号の音源信号を予め構成
した複数種類のコードベクトルからなるコードブックあ
るいはマルチパルスにより表して出力する音声符号化方
式において、 前記適応コードブックあるいは前記コードブックある
いはマルチパルスにより再生した信号と前記音声信号と
の誤差信号に対し聴覚の特性に対応するように周波数軸
を非線形変換して誤差尺度を求め、前記誤差尺度を小さ
くするように前記コードブックから最適なコードベクト
ルを求めるかあるいはマルチパルスを求めて出力するこ
とを特徴とする。
また、第2の発明(特許請求の範囲に対応する。)
は、入力した離散的な音声信号を予め定められた時間長
のフレームに分割し、前記音声信号のスペクトル包絡を
表すスペクトルパラメータを求めて出力し、前記フレー
ムを予め定められた時間長の小区画に分割し、過去の音
源信号からなる適応コードブックをもとに再生した信号
が前記音声信号に近くなるようにピッチパラメータを求
め、前記音声信号の音源信号を予め構成した複数種類の
コードベクトルからなるコードブックあるいはマルチパ
ルスにより表して出力する音声符号化方式において、 前記適応コードブックあるいは前記コードブックある
いは前記マルチパルスにより再生した前記音声信号との
誤差信号と前記音声信号をもとに、聴覚のマスキング特
性に対応するようなマスキングしきい値を求め、前記し
きい値をもとに前記誤差信号を重み付けて誤差尺度を求
め、前記誤差尺度を小さくするように前記コードブック
から最適なコードベクトルを求めるかあるいはマルチパ
ルスを求めて出力することを特徴とする。
〔作用〕
本発明による音声符号化方式の作用を説明する。
第1の発明では、フレームを分割したサブフレーム毎
に、適応コードブックの探索あるいは音源コードブック
の探索あるいはマルチパルスの計算において、適応コー
ドブックあるいはコードブックあるいはマルチパルスに
より再生した信号と、入力音声信号との誤差信号に対し
て、聴覚の特性に対応するように周波数軸を非線形変換
して誤差尺度を求めることに特徴がある。今、音源コー
ドブックの探索を例にして説明すると、下式を最小化す
るように最適音源コードベクトルを音源コードブックか
ら探索する。
ここでx(n)は適応コードブックによる長期予測信号
を除去したあとの音声信号、cj(n)は音源コードブッ
ク中のj番目のコードベクトル(但し、j=1〜2B:Bは
コードブックのビット数)、γは最適ゲインである。
h(n)はスペクトルパラメータにより構成した合成フ
ィルタのインパルス応答である。記号*は畳み込み演算
を示す。
誤差信号の周波数軸を非線形変換するためには、周波
数軸上での処理の方が演算量が少ないので、(1)式を
周波数軸上での演算に変換する。このためには、周知の
直交変換を用いるが、ここでは効率のよい離散的なコサ
イン変換(DCT)を用いる。(1)式をN点DCT変換して
次式を得る。
上式の誤差スペクトルD(k)において、周波数軸を聴
覚の特性に合うように非線形変換する。このような非線
形変換として、ここでは周知のメル変換を用いる。メル
変換によれば、下式の変換を行う。
ω=ω+2tan-1(αsinω/(1−αconω)) ・・・(3) 但しω=2πk/Nであり、標本化周波数が8kHzのときα
=0.31である。メル変換法の詳細は、例えば北村氏らに
よる“メルケプストラムを利用する音声の分析合成と合
成音声の品質”と題した論文(電子通信学界論文誌、J6
8−A,pp.957−964,1985年)(文献4)等を参照でき
る。従ってメル変換をした周波数上の誤差電力を最小に
するようなコードベクトルCj(k)を選択する。
次に、第2の発明では、適応コードブックあるいは音
源コードブックあるいはマルチパルスの探索において、
適応コードブックあるいはコードブックあるいはマルチ
パルスにより再生した信号と音声信号との誤差信号に対
して、音声信号をもとに聴覚のマスキング特性に対応す
るようなマスキングしきい値を求め、周波数軸上でマス
キングしきい値をもとに誤差信号を重み付けて誤差尺度
を求め、誤差尺度を小さくするようにコードブックから
最適なコードベクトルを求めることを特徴とする。つま
り下式のように重み付けた誤差電力を最小にする。
ここでW(k)は、聴覚のマスキングしきい値を用いて
重み付けを行う重み付け関数である。ここでマスキング
しきい値を求めるには、例えば、疑似パワスペクトル|X
(k)|2を臨界帯域フィルタあるいは聴覚モデルにより
分析して、各臨界帯域毎のパワあるいはRMSを計算し、
これらの値から各臨界帯域におけるマスキングしきい値
を求める。マスキングしきい値の求め方は、例えば聴覚
心理学実験により得られた値を用いる方法が知られてお
り、詳細は、Johnston氏による“Trans−form coding o
f audio signals using perceptual noise criteria"
(IEEE J.Sel.Areas on Commun.,pp314−323,1988)と
題した論文(文献5)や、R.Drogo de Iacovo氏らによ
る“Vector quantization and perceptual criteria in
SVD based CELP ceders"と題した論文(ICASSP,pp.33
−36,1990年)(文献6)等を参照できる。また、臨界
帯域フィルタあるいは臨界帯域分析については、例え
ば、J.Tobias氏編集による“Foundation of modern aud
itory theory"と題した単行本の第5章(文献7)等を
参照できる。また、聴覚モデルについては、例えばSene
ff氏による“A computational model for the peripher
al auditory system:Application to speech recogniti
on research"と題した論文(Proc.ICASSP,pp.1983−198
6,1986年)(文献8)等を参照できる。
次に、(4)式の誤差信号|D(k)|2に対して臨界帯
域フィルタあるいは聴覚モデルによる分析を行い、各臨
界帯域毎のパワあるいはRMSに対して、マスキングしき
い値の逆数を乗ずることにより、マスキングによる重み
付けを行い、マスキングによる重み付け誤差尺度を求め
る。そしてこの尺度を最小にするコードベクトルを選択
する。
〔実施例〕
第1図は第1の発明による音声符号化方式を実施する
音声符号化装置を示すブロック図である。
送信側では、入力端子100から音声信号を入力し、1
フレーム分(例えば20ms)の音声信号をバッファメモリ
110に格納する。
LPC分析回路130は、フレームの音声信号のスペクトル
特性を表すパラメータとして、LSPパラメータをフレー
ムの音声信号から周知のLPC分析を行い、あらかじめ定
められた次数Lだけ計算する。
次にLSP量子化回路140は、LSPパラメータを予め定め
られた量子化ビット数で量子化し、得た符号IKをマルチ
プレクサ260へ出力するとともに、これを復号化してさ
らに線形予測係数ai′(i=1〜L)に変換して、重み
付け回路200,インパルス応答計算回路170,合成フィルタ
281へ出力する。LSPパラメータの符号化、LSPパラメー
タと線形予測係数との変換の方法についてはSugamura氏
らによる“Quantizer design in LSP speech analysis
−synthesis"と題した論文(IEEE J.Sel.Areas Commu
n.,pp.432−440,1988年)(文献9)等を参照すること
ができる。またLSPパラメータをさらに効率的に量子化
するためには、ベクトル−スカラ量子化を用いることも
できる。LSPのベクトル−スカラ量子化については、Mor
iya氏らによる“Transform Coding of Speech using a
Weighted Verctor Quantizer,"と題した論文(IEEE J.S
el.Areas Commun.,pp.425−431,1988年)(文献10)
や、特願平2−42956号明細書(文献11)等を参照でき
る。
サブフレーム分割回路150は、フレームの音声信号を
サブフレームに分割する。ここで例えばサブフレーム長
は5msとする。
重み付け回路200は、サブフレームに分割した信号に
対して周知の重み付けを行う。重み付け関数の詳細は前
記文献1を参照できる。
減算器190は、重み付け信号から合成フィルタ281の出
力を減算して出力する。
適応コードブック210は、合成フィルタ281の入力信号
v(n)を遅延回路206を介して入力し、さらにインパ
ルス応答計算回路170から重み付けインパルス応答h
W(n)、減算器190から重み付け信号を入力し、長期相
関にもとづくピッチ予測を行い、ピッチパラメータとし
て遅延Mとゲインβを計算する。以下の説明では適応コ
ードブックの予測次数は1とするが、2次以上の高次と
することもできる。適応コードブックにおける遅延Mの
計算は次のように行う。
ただし GM(k)=F(v(n−M)) (6) である。ここでXW(k),G(k),HW(k)はそれぞ
れ、重み付け信号XW(n)のDCT変換、過去の音源信号
v(n−M)のDCT変換、重み付けインパルス応答h
W(n)のDCT変換である。β′は予め構成したゲイン
コードブック215のj番目のコードベクトルである。ゲ
インコードブック215は、予め多量のゲイントレーニン
グ信号を用いて学習して構成しておく。学習によるコー
ドブックの構成法は、例えばLindeらによる“An Algori
thm for Vector Quantization Design"と題した論文(I
EEE Trans.COM−28,pp.84−95,1980年)(文献12)等を
参照できる。
次に(5)式のD(k)に対して(3)式を用いて周
波数軸をメル変換する。そして、メル変換した誤差電力
を最小化する遅延Mおよびゲインコードベクトルβ′
の組合せを探索する。次にこれらを用いて次式により長
期予測による予測信号(n)を計算し、減算器205
に出力する。また遅延Mをマルチプレクサ260へ出力す
る。
(n)=β′v(n−M)*hW(n) (7) 上式でv(n−M)は過去の音源信号で、遅延回路206
の出力信号である。
遅延回路206は、合成フィルタ281の入力信号v(n)
を1サブフレーム分遅延させて適応コードブック210へ
出力する。
減算器205は、重み付け信号xW(n)から適応コード
ブック210の出力を減算し残差信号eW(n)を音源コー
ドブック探索回路230に出力する。
eW(n)=xW(n)−(n) (8) インパルス応答計算回路170は、重み付けした合成フ
ィルタのインパルス応答hW(n)を予め定められたサン
プル数Lだけ計算する。具体的な計算法は、前記文献1
等を参照できる。
音源コードブック探索回路230は、予め構成した音源
コードブック235とゲインコードブック236を用いて最適
なコードベクトルcj(k)とゲインコードベクトルγ
を探索する。ここで作用の項に記した(2),(3)式
を用いて、(2)式による誤差信号について、(3)式
により周波数軸をメル変換して、メル変換後の誤差電力
を最小化するように音源コードベクトルcj(k)、ゲイ
ンコードベクトルγを探索する。ここでゲインコード
ベクトルγは、予め学習信号を用いて文献12の方法に
よりゲインコードブック236を構成しておく。
なお、音源コードブック235としては、文献1のよう
なガウス性の乱数信号や、文献12の方法により学習して
構成したコードブック等、周知なコードブックを用いる
ことができる。
加算器290は、適応コードブック210の出力音源と音源
コードブック探索回路230の出力音源を下式により加算
し出力する。
v(n)=β′・v(n−M)+γjcj(n) (9) 合成フィルタ281は、加算器290の出力v(n)を入力
し、下式により合成音声を1フレーム分求め、さらにも
う1フレーム分は0の系列をフィルタに入力して応答信
号系列を求め、1フレーム分の応答信号系列の減算器19
0に出力する。
ただし マルチプレクサ260は、LSP量子化器140,適応コードブ
ック210,音源コードブック探索回路230の出力符号系列
を組みあわせて出力する。
以上で第1の発明の実施例の説明を終える。
第2図は、第2の発明による音声符号化方式を実施す
る音声符号化装置を示すブロック図である。図におい
て、第1図と同一の番号を付した構成要素は、第1図と
同一の動作を行うので説明を省略する。
マスキングしきい値計算回路205は、減算器190の出力
音声信号xW(n)に対してN点のDCT変換を行いスペク
トルXW(k)(k=0〜N−1)を求め、さらに疑似パ
ワスペクトル|XW(k)|2を求め、これを臨界帯域フィ
ルタあるいは聴覚モデルにより分析して、各臨界帯域毎
のパワあるいはRMSを計算する、ここでパワを計算する
には下式に従う。
ここで、bli,bhiは、それぞれi番目の臨界帯域の下
限周波数,上限周波数を示す。Rは音声信号帯域に含ま
れる臨界帯域の個数である。(12)式の値から各臨界帯
域におけるマスキングしきい値C(i)を求め出力す
る。マスキングしきい値の求め方は文献5等を参照でき
る。また、聴覚モデルについては、前記文献8等を参照
できる。臨界帯域については、前記文献7を参照でき
る。
重み付け回路220は、適応コードブック210において
(4)式に従い求めた誤差信号|D(k)|2に対して、臨
界帯域フィルタあるいは聴覚モデルによる分析を行い、
さらに前記(12)式に従い各臨界帯域毎のパワB′
(i)あるいはRMSを求める。次に、マスキングしきい
値C(i)による重み付け誤差尺度W(i)を下式に
従い各臨界帯域i毎に求める。
重み付け回路220は、重み付け誤差尺度W(i)
適応コードブック210に出力し、適応コードブック210は
次式を最小にするコードベクトルを選択する。
マスキングしきい値計算回路225は、減算器205の出力
信号eW(n)に対してN点のDCT変換を行いスペクトルE
W(k)(k=0〜N−1)を求め、さらに疑似パワス
ペクトル|E(k)|2を求め、これを臨界帯域フィルタあ
るいは聴覚モデルにより分析して、各臨界帯域毎のパワ
あるいはRMSを計算し、マスキングしきい値計算回路220
と同一の動作を行い、これらの値から各臨界帯域におけ
るマスキングしきい値Ce(i)を求め出力する。
重み付け回路240は、音源コードブック探索回路230に
おいて(4)式に従い求めた誤差信号|D(k)|2に対し
て、臨界帯域フィルタあるいは聴覚モデルによる分析を
行い、各臨界帯域毎のパワあるいはRMSに対してマスキ
ングしきい値をもとに、重み付け回路220と同一の動作
を行い、マスキングによる重み付け誤差尺度を求め音源
コードブック探索回路230へ出力する。
以上で第2の発明の実施例の説明を終える。
前記(2),(4)式において、音源コードブックcj
(n)については、予め各コードベクトルをDCT変換し
たコードブックを別に用意することにより、音源コード
ブック探索時に各コードベクトルのDCT変換が不要とな
り、音源コードブック探索に必要な演算量を低減化でき
る。
臨界帯域分析フィルタは、等価な動作を行う他の周知
な構成のフィルタを用いることができる。例えばQMFフ
ィルタ等を用いることができる。
マスキングしきい値の計算法には、他の周知な方法を
用いることができる。また、マスキングしきい値による
重み付けは実施例で述べた方法以外にも他の良好な方法
を用いることができる。例えば、前記(13)式の代わり
に(15)あるいは(16)式で求めた重み付け誤差尺度W
(i)を用いることもできる。
W(i) =B(i)B′(i)/{B(i)C(i)} (15) W(i)=B(i)B′(i)/C(i) (16) また、(5)式では、重み付け信号、重み付けインパ
ルス応答のDCT変換XW(k)、HW(k)を用いたが、重
み付けを行わない信号X(k)、インパルス応答H
(k)のDCT変換を用いてもよい。このようにすると、
重み付け回路200は不要となる。
また、DCT変換以外に他の周知な直交変換、例えばDCT
等を用いることもできる。
また、音源コードブックとしては、他の周知な構成を
用いることができる。音源コードブックの構成法につい
ては、例えばC.Laflamme氏らによる“On reducing comp
utational complexity of codebook search in CELP co
der through the use of algebraic codes"と題した論
文(Proc.ICAS SP,pp177−180,1990)(文献13)や、I.
Trancoso氏らによる“CELP:A candidate for GSM halfr
ate coding"と題した論文(Prco.ICASSP,pp.469−472,1
990年)(文献14)等を参照できる。
マスキングしきい値計算回路205において、疑似パワ
スペクトル|XW(k)|2を、LSP量子化回路140の出力で
ある復号化線形予測係数をDCT変換して計算してもよ
い。このようにすると疑似パワスペクトル包絡が求ま
る。
また、重み付け回路240において、マスキングしきい
値としては、マスキングしきい値計算回路205において
求めたマスキングしきい値を用いてもよい。このように
すると、マスキングしきい値計算回路225を省略でき
る。
音源コードブックとして、より効率のよいコードブッ
ク、例えば、マトリクス量子化,有限状態ベクトル量子
化,トレリス量子化,Delayed Decision量子化などによ
るコードブックを用いると、さらに特性を改善できる。
これらの方法の詳細は、例えばGray氏による“Vector q
uantization"(IEEE ASSP Magazine,pp.4−29,1984年)
と題した論文(文献15)等を参照できる。
また、上記実施例では、音源コードブックが1段の場
合について説明したが、音源コードブックは多段として
もよい。例えば、前記文献11に示すように2段とし、1
段目は文献11の方法により学習して構成したコードブッ
ク、2段目は乱数コードブックの構成をとることもでき
る。具体的な構成法は文献11を参照できる。このように
した方が、コードブック探索に要する演算量を低減でき
る。
また、適応コードブックのゲインと音源コードブック
のゲインは、まとめてベクトル量子化コードブックを構
成することもできる。このようにした方が、さらに少な
いビット数でゲインを量子化できる。詳細は前記文献11
や、I.Gerson氏らによる“Vector sum excited linear
prediction"(VSELP)speech coding at 8kpbs"と題し
た論文(Proc.ICASSP,pp.461−464.1990年)(文献16)
等を参照できる。
また、適応コードブックは1次としたが、2次、ある
いは、遅延を整数値ではなく小数値とすることによりさ
らに音質を改善できる。詳細は、P.Kroon氏らによる“P
itch predictors with high temporal resolution"(Pr
oc.ICASSP,pp.661−664,1990年)と題した論文(文献1
7)等を参照できる。
また、以上の説明では、適応コードブックのゲインと
音源コードブックのインデクス,ゲインには同時最適化
を施さなかったが、同時最適化を行うことにより、さら
に特性を改善できる。詳細は、前記文献16等を参照でき
る。
また、演算量を低減化するためには、音源コードブッ
クのコードベクトルが選択された後に、適応コードブッ
クのゲインβと、音源コードブックのゲインγを同時に
最適化するような構成とするこもできる。
また、上記の実施例では、スペクトルパラメータとし
てLSPパラメータを符号化し、その分析法としてLPC分析
を用いたが、スペクトルパラメータとしては他の周知な
パラメータ、例えばLPCケプストラム,ケプストラム,
改良ケプストラム,一般化ケプストラム,メルケプスト
ラムなどを用いることもできる。また各パラメータに最
適な分析法を用いることができる。
また、LSPパラメータのベクトル量子化において、LSP
パラメータに聴覚特性に対応した非線形変換を施した後
にベクトル量子化するようにしてもよい。非線形変換と
しては、例えばメル変換が知られている。
また、フレームで求めたLPC係数をLSP上や線形予測係
数上でサブフレーム毎に補間し、補間した係数を用いて
適応コードブック,音源コードブックの探索を行う構成
としてもよい。このような構成とすることにより、音質
がさらに改善される。
実施例に示した重み付け誤差尺度は、適応コードブッ
クと音源コードブックの少なくとも一方の探索に用いる
ことができる。
実施例では、コードブックの探索に重み付け誤差尺度
を用いる場合について説明したが、マルチパルスの計算
にも適用することができる。
また、受信側では、量子化雑音を整形することにより
聴覚的に聞き易くするために、ピッチとスペクトル包絡
の少なくとも1つについて動作する適応形ポストフィル
タを付加してもよい。適応型ポストフィルタの構成につ
いては、例えば、Kroon氏らによる“A Class of Analys
is−by−synthesis Predictive Coders for High Quali
ty Speech Coding at Rates between 4.8 and 16kb/s,"
(IEEE JSAC,vol.6,2,353−363,1988)(文献18)等を
参照できる。
〔発明の効果〕
以上述べたように、本発明によれば、適応コードブッ
クの探索あるいは音源コードブックの探索あるいはマル
チパルスの計算において、適応コードブックあるいは音
源コードブックあるいはマルチパルスにより再生した信
号と、入力音声信号との誤差信号に対して、聴覚の特性
に対応するように周波数軸を非線形変換して誤差尺度を
求めるか、あるいは、誤差信号に対して各臨界帯域毎に
マスキングしきい値を計算し、マスキングしきい値をも
とに誤差信号に重み付けを行った重み付け誤差尺度を用
いているので、より聴感に対応した符号化が可能とな
り、同程度の音質を保ちながら従来方式に比べよりビッ
トレートを低減することができるという大きな効果があ
る。
【図面の簡単な説明】
第1図は第1の発明による音声符号化方式を実施する音
声符号化装置を示すブロック図、 第2図は第2の発明による音声符号化方式を実施する音
声符号化装置を示すブロック図である。 110……バッファメモリ 130……LPC計算回路 140……LSP量子化回路 150……サブフレーム分割回路 170……インパルス応答計算回路 190,205……減算器 200……重み付け回路 205,225……マスキングしきい値計算回路 206……遅延回路 210……適応コードブック 215,236……ゲインコードブック 220,240……重み付け回路 230……音源コードブック探索回路 235……音源コードブック 260……マルチプレクサ 281……合成フィルタ 290……加算器

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力した離散的な音声信号を予め定められ
    た時間長のフレームに分割し、前記音声信号のスペクト
    ル包絡を表すスペクトルパラメータを求めて出力し、前
    記フレームを予め定められた時間長の小区画に分割し、
    過去の音源信号からなる適応コードブックをもとに再生
    した信号が前記音声信号に近くなるようにピッチパラメ
    ータを求め、前記音声信号の音源信号を予め構成した複
    数種類のコードベクトルからなるコードブックあるいは
    マルチパルスにより表して出力する音声符号化方式にお
    いて、 前記適応コードブックあるいは前記コードブックあるい
    は前記マルチパルスにより再生した前記音声信号との誤
    差信号と前記音声信号をもとに、聴覚のマスキング特性
    に対応するようなマスキングしきい値を求め、前記しき
    い値をもとに前記誤差信号を重み付けて誤差尺度を求
    め、前記誤差尺度を小さくするように前記コードブック
    から最適なコードベクトルを求めるかあるいはマルチパ
    ルスを求めて出力することを特徴とする音声符号化方
    式。
JP2184231A 1990-07-13 1990-07-13 音声符号化方式 Expired - Fee Related JP2808841B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2184231A JP2808841B2 (ja) 1990-07-13 1990-07-13 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2184231A JP2808841B2 (ja) 1990-07-13 1990-07-13 音声符号化方式

Publications (2)

Publication Number Publication Date
JPH0473699A JPH0473699A (ja) 1992-03-09
JP2808841B2 true JP2808841B2 (ja) 1998-10-08

Family

ID=16149671

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2184231A Expired - Fee Related JP2808841B2 (ja) 1990-07-13 1990-07-13 音声符号化方式

Country Status (1)

Country Link
JP (1) JP2808841B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160297A (ja) * 1993-12-10 1995-06-23 Nec Corp 音声パラメータ符号化方式

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01191510A (ja) * 1988-01-27 1989-08-01 Nec Corp 聴感的重み付けフィルタ

Also Published As

Publication number Publication date
JPH0473699A (ja) 1992-03-09

Similar Documents

Publication Publication Date Title
JP3196595B2 (ja) 音声符号化装置
JP2776050B2 (ja) 音声符号化方式
CA2202825C (en) Speech coder
JPH0353300A (ja) 音声符号化装置
JP3143956B2 (ja) 音声パラメータ符号化方式
JPH06222797A (ja) 音声符号化方式
EP0657874A1 (en) Voice coder and a method for searching codebooks
JP2800618B2 (ja) 音声パラメータ符号化方式
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JPH05216500A (ja) 音声符号化装置
JPH0944195A (ja) 音声符号化装置
JP3095133B2 (ja) 音響信号符号化方法
JPH0854898A (ja) 音声符号化装置
JP2808841B2 (ja) 音声符号化方式
JP3003531B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3144284B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3194930B2 (ja) 音声符号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JP3256215B2 (ja) 音声符号化装置
JP3024467B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070731

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080731

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090731

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees