JPH0473699A - 音声符号化方式 - Google Patents
音声符号化方式Info
- Publication number
- JPH0473699A JPH0473699A JP2184231A JP18423190A JPH0473699A JP H0473699 A JPH0473699 A JP H0473699A JP 2184231 A JP2184231 A JP 2184231A JP 18423190 A JP18423190 A JP 18423190A JP H0473699 A JPH0473699 A JP H0473699A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- codebook
- sound source
- error
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003044 adaptive effect Effects 0.000 claims abstract description 36
- 230000005236 sound signal Effects 0.000 claims abstract description 34
- 239000013598 vector Substances 0.000 claims abstract description 31
- 230000000873 masking effect Effects 0.000 claims description 33
- 238000000034 method Methods 0.000 claims description 31
- 230000003595 spectral effect Effects 0.000 claims description 13
- 230000009466 transformation Effects 0.000 abstract description 19
- 230000004044 response Effects 0.000 abstract description 14
- 238000004364 calculation method Methods 0.000 description 22
- 238000013139 quantization Methods 0.000 description 16
- 230000005284 excitation Effects 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 9
- 238000001228 spectrum Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 8
- 230000007774 longterm Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は音声信号を低いビットレート、特に8〜4.8
kb/s程度で高品質に符号化するための音声符号化方
式に関する。
kb/s程度で高品質に符号化するための音声符号化方
式に関する。
音声信号を8〜4.8kb/s程度の低いビットレート
で符号化する方式としては、例えば、M、5chroe
der and B、Ata1氏による”Code−e
xcited 1inearprediction:
)Iigh quality 5peech at v
ery lowbit rates” (Proc、
ICASSP、 pp、937−940.1985年)
と題した論文(文献1)や、Kleijn氏らによる’
IImproved 5peech quaIity
and efficient vector quan
tization in 5ELP″と題した論文(I
CASSP、 pp、155−158.1988年)(
文献2)等に記載されているCELP(Code Ex
cited LPCCoding)方式や、B、へta
1氏らによる“八new model of LPCe
xcitation for producing
natural−sounding 5peech
atlow bit rates” (Proc
、 ICASSr’、 pp、614−61719
82)と題した論文(文献3)等に記載されているマル
チパルス符号化方式が知られている。
で符号化する方式としては、例えば、M、5chroe
der and B、Ata1氏による”Code−e
xcited 1inearprediction:
)Iigh quality 5peech at v
ery lowbit rates” (Proc、
ICASSP、 pp、937−940.1985年)
と題した論文(文献1)や、Kleijn氏らによる’
IImproved 5peech quaIity
and efficient vector quan
tization in 5ELP″と題した論文(I
CASSP、 pp、155−158.1988年)(
文献2)等に記載されているCELP(Code Ex
cited LPCCoding)方式や、B、へta
1氏らによる“八new model of LPCe
xcitation for producing
natural−sounding 5peech
atlow bit rates” (Proc
、 ICASSr’、 pp、614−61719
82)と題した論文(文献3)等に記載されているマル
チパルス符号化方式が知られている。
文献1,2に記載の方法では、送信側では、フレーム毎
(例えば20m5)に音声信号から音声信号のスペクト
ル特性を表すスペクトルパラメータを抽出し、フレーム
をさらに小区間サブフレーム(例えば5 ms)に分割
し、サブフレーム毎に、過去の音源信号をもとに再生し
た再生信号と、音源信号との重み付け2乗誤差を最小化
するように長時間相関(ピッチ相関)を表す適応コード
ブックのピッチパラメータを抽出し、ピッチパラメータ
によりサブフレームの音声信号を長期予測し、長期予測
して求めた残差信号に対して、予め定められた種類の雑
音信号からなるコードブックから選択した信号により合
成した信号と、音声信号との重み付け2乗誤差を最小化
するように一種類の雑音信号を選択するとともに、最適
なゲインを計算する。そして選択された雑音信号の種類
を表すインデクスとゲイン、ならびに、スペクトルパラ
メータとピッチパラメータを伝送する。
(例えば20m5)に音声信号から音声信号のスペクト
ル特性を表すスペクトルパラメータを抽出し、フレーム
をさらに小区間サブフレーム(例えば5 ms)に分割
し、サブフレーム毎に、過去の音源信号をもとに再生し
た再生信号と、音源信号との重み付け2乗誤差を最小化
するように長時間相関(ピッチ相関)を表す適応コード
ブックのピッチパラメータを抽出し、ピッチパラメータ
によりサブフレームの音声信号を長期予測し、長期予測
して求めた残差信号に対して、予め定められた種類の雑
音信号からなるコードブックから選択した信号により合
成した信号と、音声信号との重み付け2乗誤差を最小化
するように一種類の雑音信号を選択するとともに、最適
なゲインを計算する。そして選択された雑音信号の種類
を表すインデクスとゲイン、ならびに、スペクトルパラ
メータとピッチパラメータを伝送する。
[発明が解決しようとする課題]
上述した文献1の従来方式では、マルチパルスや、適応
コードブックや、雑音信号からなるコードブ、りを探索
するときは、誤差評価尺度として、入力音声信号とコー
ドブ・ツクあるいはマルチパルスにより再生した信号と
の重み付け2乗誤差を用いていた。しかし、この評価尺
度は必ずしも聴感と一致していないために、この尺度で
選択したコードベクトル、あるいは求めたマルチパルス
を用いて選択した再生音声の音質は、必ずしも十分では
ないという問題点があった。またこの問題点は特にビッ
トレートを低減しコードブックのサイズを小さくすると
顕著であった。
コードブックや、雑音信号からなるコードブ、りを探索
するときは、誤差評価尺度として、入力音声信号とコー
ドブ・ツクあるいはマルチパルスにより再生した信号と
の重み付け2乗誤差を用いていた。しかし、この評価尺
度は必ずしも聴感と一致していないために、この尺度で
選択したコードベクトル、あるいは求めたマルチパルス
を用いて選択した再生音声の音質は、必ずしも十分では
ないという問題点があった。またこの問題点は特にビッ
トレートを低減しコードブックのサイズを小さくすると
顕著であった。
本発明の目的は、上記問題点を解決した音声符号化方式
を提供することにある。
を提供することにある。
第1の発明は、入力した離散的な音声信号を予め定めら
れた時間長のフレームに分割し、前記音声信号のスペク
トル包絡を表すスペクトルパラメータを求めて出力し、
前記フレームを予め定められた時間長の小区間に分割し
、過去の音源信号からなる適応コードブックをもとに再
生した信号が前記音声信号に近くなるようにピッチパラ
メータを求め、前記音声信号の音源信号を予め構成した
複数種類のコードベクトルからなるコードブックあるい
はマルチパルスにより表して出力する音声符号化方式に
おいて、 前記適応コードブックあるいは前記コードブックあるい
は前記マルチパルスにより再生した信号と前記音声信号
との誤差信号に対し聴覚の特性に対応するように周波数
軸を非線形変換して誤差尺度を求め、前記誤差尺度を小
さくするように前記コードブックから最適なコードベク
トルを求めるかあるいはマルチパルスを求めて出力する
ことを特徴とする。
れた時間長のフレームに分割し、前記音声信号のスペク
トル包絡を表すスペクトルパラメータを求めて出力し、
前記フレームを予め定められた時間長の小区間に分割し
、過去の音源信号からなる適応コードブックをもとに再
生した信号が前記音声信号に近くなるようにピッチパラ
メータを求め、前記音声信号の音源信号を予め構成した
複数種類のコードベクトルからなるコードブックあるい
はマルチパルスにより表して出力する音声符号化方式に
おいて、 前記適応コードブックあるいは前記コードブックあるい
は前記マルチパルスにより再生した信号と前記音声信号
との誤差信号に対し聴覚の特性に対応するように周波数
軸を非線形変換して誤差尺度を求め、前記誤差尺度を小
さくするように前記コードブックから最適なコードベク
トルを求めるかあるいはマルチパルスを求めて出力する
ことを特徴とする。
また、第2の発明は、入力した離散的な音声信号を予め
定められた時間長のフレームに分割し、前記音声信号の
スペクトル包絡を表すスペクトルパラメータを求めて出
力し、前記フレームを予め定められた時間長の小区間に
分割し、過去の音源信号からなる適応コードブックをも
とに再生した信号が前記音声信号に近くなるようにピッ
チパラメータを求め、前記音声信号の音源信号を予め構
成した複数種類のコードベクトルからなるコードブック
あるいはマルチパルスにより表して出力する音声符号化
方式において、 前記適応コードブックあるいは前記コードブックあるい
は前記マルチパルスにより再生した前記音声信号との誤
差信号と前記音声信号をもとに、聴覚のマスキング特性
に対応するようなマスキングしきい値を求め、前記しき
い値をもとに前記誤差信号を重み付けて誤差尺度を求め
、前記誤差尺度を小さくするように前記コードブックか
ら最適なコードベクトルを求めるかあるいはマルチパル
スを求めて出力することを特徴とする。
定められた時間長のフレームに分割し、前記音声信号の
スペクトル包絡を表すスペクトルパラメータを求めて出
力し、前記フレームを予め定められた時間長の小区間に
分割し、過去の音源信号からなる適応コードブックをも
とに再生した信号が前記音声信号に近くなるようにピッ
チパラメータを求め、前記音声信号の音源信号を予め構
成した複数種類のコードベクトルからなるコードブック
あるいはマルチパルスにより表して出力する音声符号化
方式において、 前記適応コードブックあるいは前記コードブックあるい
は前記マルチパルスにより再生した前記音声信号との誤
差信号と前記音声信号をもとに、聴覚のマスキング特性
に対応するようなマスキングしきい値を求め、前記しき
い値をもとに前記誤差信号を重み付けて誤差尺度を求め
、前記誤差尺度を小さくするように前記コードブックか
ら最適なコードベクトルを求めるかあるいはマルチパル
スを求めて出力することを特徴とする。
本発明による音声符号化方式の作用を説明する。
第1の発明では、フレームを分割したサブフレーム毎に
、適応コードブックの探索あるいは音源コードブックの
探索あるいはマルチパルスの計算において1、適応コー
ドブックあるいはコードプ。
、適応コードブックの探索あるいは音源コードブックの
探索あるいはマルチパルスの計算において1、適応コー
ドブックあるいはコードプ。
りあるいはマルチパルスにより再生した信号と、入力音
声信号との誤差信号に対して、聴覚の特性に対応するよ
うに周波数軸を非線形変換して誤差尺度を求めることに
特徴がある。今、音源コードブックの探索を例にして説
明すると、下式を最小化するように最適音源コードベク
トルを音源コードブックから探索する。
声信号との誤差信号に対して、聴覚の特性に対応するよ
うに周波数軸を非線形変換して誤差尺度を求めることに
特徴がある。今、音源コードブックの探索を例にして説
明すると、下式を最小化するように最適音源コードベク
トルを音源コードブックから探索する。
・ ・ ・(1)
ここでx (n)は適応コードブックによる長期予測信
号を除去したあとの音声信号、Cj (n)は音源コー
ドブック中のj番目のコードベクトル(但し、j=1〜
211 二Bはコードブックのビット数)、T、は最適
ゲインである。h (n)はスペクトルパラメータによ
り構成した合成フィルタのインパルス応答である。記号
率は畳み込み演算を示す。
号を除去したあとの音声信号、Cj (n)は音源コー
ドブック中のj番目のコードベクトル(但し、j=1〜
211 二Bはコードブックのビット数)、T、は最適
ゲインである。h (n)はスペクトルパラメータによ
り構成した合成フィルタのインパルス応答である。記号
率は畳み込み演算を示す。
誤差信号の周波数軸を非線形変換するためには、周波数
軸上での処理の方が演算量が少ないので、(1)式を周
波数軸上での演算に変換する。このためには、周知の直
交変換を用いるが、ここでは効率のよい離散的コサイン
変換(DCT)を用いる。(+)式をN点DCT変換し
て次式を得る。
軸上での処理の方が演算量が少ないので、(1)式を周
波数軸上での演算に変換する。このためには、周知の直
交変換を用いるが、ここでは効率のよい離散的コサイン
変換(DCT)を用いる。(+)式をN点DCT変換し
て次式を得る。
上式の誤差スペクトルD (k)において、周波数軸を
聴覚の特性に合うように非線形変換する。このような非
線形変換として、ここでは周知のメル変換を用いる。メ
ル変換によれば、下式の変換を行う。
聴覚の特性に合うように非線形変換する。このような非
線形変換として、ここでは周知のメル変換を用いる。メ
ル変換によれば、下式の変換を行う。
ω=ω+ 2 jan−’ (αsinω/ (1−α
cosω) )・ ・ ・(3) 但しω−2πに/Nであり、標本化周波数が8 kHz
のときα−0,31である。ノル変換法の詳細は、例え
ば北村氏らによる“″メルケブストラムを利用する音声
の分析合成と合成音声の品質°゛と匙した論文(電子通
信学会論文誌、J68−八、 pp、957−9641
985年)(文献4)等を参照できる。従ってメル変換
をした周波数上の誤差電力を最小にするようなコードベ
クトルC,(k)を選択する。
cosω) )・ ・ ・(3) 但しω−2πに/Nであり、標本化周波数が8 kHz
のときα−0,31である。ノル変換法の詳細は、例え
ば北村氏らによる“″メルケブストラムを利用する音声
の分析合成と合成音声の品質°゛と匙した論文(電子通
信学会論文誌、J68−八、 pp、957−9641
985年)(文献4)等を参照できる。従ってメル変換
をした周波数上の誤差電力を最小にするようなコードベ
クトルC,(k)を選択する。
次に、第2の発明では、適応コードブックあるいは音源
コードブックあるいはマルチパルスの探索において、適
応コードブックあるいはコードブックあるいはマルチパ
ルスにより再生した信号と音声信号との誤差信号に対し
て、音声信号をもとに聴覚のマスキング特性に対応する
ようなマスキングしきい値を求め、周波数軸上でマスキ
ングしきい値をもとに誤差信号を重み付けて誤差尺度を
求め、誤差尺度を小さくするようにコードブックから最
適なコードベクトルを求めることを特徴とする。つまり
下式のように重み付けた誤差電力を最小にする。
コードブックあるいはマルチパルスの探索において、適
応コードブックあるいはコードブックあるいはマルチパ
ルスにより再生した信号と音声信号との誤差信号に対し
て、音声信号をもとに聴覚のマスキング特性に対応する
ようなマスキングしきい値を求め、周波数軸上でマスキ
ングしきい値をもとに誤差信号を重み付けて誤差尺度を
求め、誤差尺度を小さくするようにコードブックから最
適なコードベクトルを求めることを特徴とする。つまり
下式のように重み付けた誤差電力を最小にする。
XIW(k)+2
ここでW (k)は、聴覚のマスキングしきい値を用い
て重み付けを行う重み付は関数である。ここでマスキン
グしきい値を求めるには、例えば、疑僚パワスペクトル
IX(k)+2をIn臨界域フィルタあるいは聴覚モデ
ルにより分析して、各臨界帯域毎のパワあるいはRMS
を計算し、これらの値から各臨界帯域におけるマスキン
グしきい値を求める。マスキングしきい値の求め方は、
例えば聴覚心理学実験により得られた値を用いる方法が
知られており、詳細は、Johns ton氏による”
Transform coding of audio
signals using perceptual
noise criteria” (IEEE
J、Se1. 八reas on Commun
、。
て重み付けを行う重み付は関数である。ここでマスキン
グしきい値を求めるには、例えば、疑僚パワスペクトル
IX(k)+2をIn臨界域フィルタあるいは聴覚モデ
ルにより分析して、各臨界帯域毎のパワあるいはRMS
を計算し、これらの値から各臨界帯域におけるマスキン
グしきい値を求める。マスキングしきい値の求め方は、
例えば聴覚心理学実験により得られた値を用いる方法が
知られており、詳細は、Johns ton氏による”
Transform coding of audio
signals using perceptual
noise criteria” (IEEE
J、Se1. 八reas on Commun
、。
pp、314−323.1988) と題した論文(文
献5)や、R,叶ogo de Iacovo氏らによ
る”Vector quantization and
perceptual criteria in S
VD basedCELP ceders”と題した論
文(ICASSP、 pp、33−36゜1990年)
(文献6)等を参照できる。また、臨界帯域フィルタあ
るいは臨界帯域分析については、例えば、J、Tobi
as氏編集による“Foundation ofmod
ern auditory theory”と題した単
行本の第5章(文献7)等を参照できる。また、聴覚モ
デルについては、例えば5eneff氏による”A c
olIlputa−tional model for
the peripheral auditory
system: Application to 5p
eech recognition research
”と題した論文(Proc、 TCASSP、 pp、
19831986、1986年)(文献8)等を参照で
きる。
献5)や、R,叶ogo de Iacovo氏らによ
る”Vector quantization and
perceptual criteria in S
VD basedCELP ceders”と題した論
文(ICASSP、 pp、33−36゜1990年)
(文献6)等を参照できる。また、臨界帯域フィルタあ
るいは臨界帯域分析については、例えば、J、Tobi
as氏編集による“Foundation ofmod
ern auditory theory”と題した単
行本の第5章(文献7)等を参照できる。また、聴覚モ
デルについては、例えば5eneff氏による”A c
olIlputa−tional model for
the peripheral auditory
system: Application to 5p
eech recognition research
”と題した論文(Proc、 TCASSP、 pp、
19831986、1986年)(文献8)等を参照で
きる。
次に、(4)式の誤差信号ID(k)12に対して臨界
帯域フィルタあるいは聴覚モデルによる分析を行い、各
臨界帯域毎のパワあるいはRMSに対して、マスキング
しきい値の逆数を乗することにより、マスキングによる
重み付けを行い、マスキングによる重み付は誤差尺度を
求める。そしてこの尺度を最小にするコードベクトルを
選択する。
帯域フィルタあるいは聴覚モデルによる分析を行い、各
臨界帯域毎のパワあるいはRMSに対して、マスキング
しきい値の逆数を乗することにより、マスキングによる
重み付けを行い、マスキングによる重み付は誤差尺度を
求める。そしてこの尺度を最小にするコードベクトルを
選択する。
第1図は第1の発明による音声符号化方式を実施する音
声符号化装置を示すブロック図である。
声符号化装置を示すブロック図である。
送信側では、入力端子100から音声信号を入力し、1
フレ一ム分(例えば20m5 )の音声信号をバッファ
メモIJIIOに格納する。
フレ一ム分(例えば20m5 )の音声信号をバッファ
メモIJIIOに格納する。
LPG分析回路130は、フレームの音声信号のスペク
トル特性を表すパラメータとして、LSPパラメータを
フレームの音声信号から周知のLPG分析を行い、あら
かしめ定められた次数したけ計算する。
トル特性を表すパラメータとして、LSPパラメータを
フレームの音声信号から周知のLPG分析を行い、あら
かしめ定められた次数したけ計算する。
次にLSP量子化回路140は、LSPパラメータを予
め定められた量子化ビット数で量子化し、得た符号I、
をマルチプレクサ260へ出力するとともに、これを復
号化してさらに線形予測係数a;’(i−1〜L)に変
換して、重み付は回路200.インパルス応答計算回路
1701合成フィルタ281へ出力する。LSPパラメ
ータの符号化、LSPパラメータと線形予測係数との変
換の方法についてはSugamura氏らによる”Qu
antizer design in LSP 5pe
echanalysis−synthesis” と題
した論文(IEEE J、Sel。
め定められた量子化ビット数で量子化し、得た符号I、
をマルチプレクサ260へ出力するとともに、これを復
号化してさらに線形予測係数a;’(i−1〜L)に変
換して、重み付は回路200.インパルス応答計算回路
1701合成フィルタ281へ出力する。LSPパラメ
ータの符号化、LSPパラメータと線形予測係数との変
換の方法についてはSugamura氏らによる”Qu
antizer design in LSP 5pe
echanalysis−synthesis” と題
した論文(IEEE J、Sel。
Areas Commun、、 pp、432−440
.1988年)(文献9)等を参照することができる。
.1988年)(文献9)等を参照することができる。
またLSPパラメータをさらに効率的に量子化するため
には、ベクトルースカラ量子化を用いることもできる。
には、ベクトルースカラ量子化を用いることもできる。
LSPのベクトルースカラ量子化については、Mori
ya氏ら二こよる”Transform Coding
of 5peech using a Weight
ed Vector Quantizer、”と題した
論文(IEEE J。
ya氏ら二こよる”Transform Coding
of 5peech using a Weight
ed Vector Quantizer、”と題した
論文(IEEE J。
Se1. 八reas、 Commun、、 p
p、425−43L 1988年)(文献1(1)や
、特願平2−42956号明細書(文献11)等を参照
できる。
p、425−43L 1988年)(文献1(1)や
、特願平2−42956号明細書(文献11)等を参照
できる。
サブフレーム分割回路150は、フレームの音声信号を
サブフレームに分割する。ここで例えばサブフレーム長
は5msとする。
サブフレームに分割する。ここで例えばサブフレーム長
は5msとする。
重み付は回路200は、サブフレームに分割した信号に
対して周知の重み付けを行う。重み付は関数の詳細は前
記文献1を参照できる。
対して周知の重み付けを行う。重み付は関数の詳細は前
記文献1を参照できる。
減算器190は、重み付けた信号から合成フィルタ28
1の出力を減算して出力する。
1の出力を減算して出力する。
適応コートブック210は、合成フィルタ281 の入
力信号v (n)を遅延回路206を介して入力し、さ
らにインパルス応答計算回路170かa重み付はインパ
ルス応答り、w(n)、減算器190から重み付は信号
を入力し、長期相関にもとづくピッチ予測を行い、ピッ
チパラメータとして遅延Mとゲインβを計算する。以下
の説明では適応コードブ7・りの予測次数は1とするが
、2次以上の高次とすることもできる。適応コードブッ
クにおける遅延Mの計算は次のように行う。
力信号v (n)を遅延回路206を介して入力し、さ
らにインパルス応答計算回路170かa重み付はインパ
ルス応答り、w(n)、減算器190から重み付は信号
を入力し、長期相関にもとづくピッチ予測を行い、ピッ
チパラメータとして遅延Mとゲインβを計算する。以下
の説明では適応コードブ7・りの予測次数は1とするが
、2次以上の高次とすることもできる。適応コードブッ
クにおける遅延Mの計算は次のように行う。
ただし
G、 (k) −F (v (n−M) )
(6)である。ここでり、(k)、G (k)、
H,(k)はそれぞれ、重み付は信号x−(n)のOC
T変換、過去の音源信号v(n−M)のDCT変換、重
み付はインパルス応答り、(n)のDCT変換である。
(6)である。ここでり、(k)、G (k)、
H,(k)はそれぞれ、重み付は信号x−(n)のOC
T変換、過去の音源信号v(n−M)のDCT変換、重
み付はインパルス応答り、(n)のDCT変換である。
β′4は予め構成したゲインコードブック215のj番
目のコードベクトルである。ゲインコードブック215
は、予め多量のゲイントレーニング信号を用いて学習し
て構成しておく。学習によるコードブックの構成法は、
例えばLindeらによる“AnA14orithm
for Vector Quantization D
esign”と題した論文(rEEE Trans、
C0M−28,pp、84−95゜1980年)(文献
12)等を参照できる。
目のコードベクトルである。ゲインコードブック215
は、予め多量のゲイントレーニング信号を用いて学習し
て構成しておく。学習によるコードブックの構成法は、
例えばLindeらによる“AnA14orithm
for Vector Quantization D
esign”と題した論文(rEEE Trans、
C0M−28,pp、84−95゜1980年)(文献
12)等を参照できる。
次に(5)式のD (k)に対して(3)弐を用いて周
波数軸をメル変換する。そして、メル変換した誤差電力
を最小化する遅延Mおよびゲインコードベクトルβ′1
の組合せを探索する。次にこれらを用いて次式により長
期予測による予測信号臭。(n)を計算し、減算器20
5Lこ出力する。また遅延Mをマルチプレクサ260へ
出力する。
波数軸をメル変換する。そして、メル変換した誤差電力
を最小化する遅延Mおよびゲインコードベクトルβ′1
の組合せを探索する。次にこれらを用いて次式により長
期予測による予測信号臭。(n)を計算し、減算器20
5Lこ出力する。また遅延Mをマルチプレクサ260へ
出力する。
9w(n)−β’・v (n M)*hw(n)
(7)上式でv(n−M)は過去の音源信号で、遅延
回路206の出力信号である。
(7)上式でv(n−M)は過去の音源信号で、遅延
回路206の出力信号である。
遅延回路206は、合成フィルタ281の入力信刊v
(n)を1サブフレ一ム分遅延させて適応コードブック
210へ出力する。
(n)を1サブフレ一ム分遅延させて適応コードブック
210へ出力する。
減算器205は、重み付は信号χ8(n)から適応コー
ドブック210の出力を減算し残差信号e、(n)を音
源コードブック探索回路230に出力する。
ドブック210の出力を減算し残差信号e、(n)を音
源コードブック探索回路230に出力する。
ew (n) −)[、(n)−x、、、(n)
(8)インパルス応答計算回路170は、重み
付けした合成フィルタのインパルス応答h1.I(n)
を予め定められたサンプル数したけ計算する。具体的な
計算法は、前記文献1等を参照できる。
(8)インパルス応答計算回路170は、重み
付けした合成フィルタのインパルス応答h1.I(n)
を予め定められたサンプル数したけ計算する。具体的な
計算法は、前記文献1等を参照できる。
音源コードブック探索回路230は、予め構成した音源
コードブック235 とゲインコードブック236を用
いて最適なコードベクトルCj (k)とゲインコード
ベクトルTJを探索する。ここで作用の項に記した(2
)、 (3)式を用いて、(2)式による誤差信号につ
いて、(3)式により周波数軸をメル変換して、ノル変
換後の誤差電力を最小化するように音源コードベクトル
c1(k)、ゲインコードベクトルT=を探索する。こ
こでゲインコードベクトルT、は、予め学習信号を用い
て文献12の方法↓こよリゲインコードブンク236を
構成しておく。
コードブック235 とゲインコードブック236を用
いて最適なコードベクトルCj (k)とゲインコード
ベクトルTJを探索する。ここで作用の項に記した(2
)、 (3)式を用いて、(2)式による誤差信号につ
いて、(3)式により周波数軸をメル変換して、ノル変
換後の誤差電力を最小化するように音源コードベクトル
c1(k)、ゲインコードベクトルT=を探索する。こ
こでゲインコードベクトルT、は、予め学習信号を用い
て文献12の方法↓こよリゲインコードブンク236を
構成しておく。
なお、音源コードブック235としては、文献1のよう
なガウス性の乱数信号や、文献12の方法により学習し
て構成したコードブ・ツク等、周知なコードブックを用
いることができる。
なガウス性の乱数信号や、文献12の方法により学習し
て構成したコードブ・ツク等、周知なコードブックを用
いることができる。
加算器290は、適応コードブック210の出力音源と
音源コードブック探索回路230の出力音源を下式によ
り加算し出力する。
音源コードブック探索回路230の出力音源を下式によ
り加算し出力する。
v (n)−β′・v (n −M) +7’JCi
(n) (9)合成フィルタ281は、加算器290
の出力v (n)を入力し、下式により合成音声を1フ
レーム分求め、さらにもう1フレ一ム分はOの系列をフ
ィルタに入力して応答信号系列を求め、■フレーム分の
応答信号系列を減算器190に出力する。
(n) (9)合成フィルタ281は、加算器290
の出力v (n)を入力し、下式により合成音声を1フ
レーム分求め、さらにもう1フレ一ム分はOの系列をフ
ィルタに入力して応答信号系列を求め、■フレーム分の
応答信号系列を減算器190に出力する。
(0くδ<1) GO)
ただし
マルチプレクサ260は、LSP量子化器140.適応
コードブック210.音源コードブック探索回路230
の出力符号系列を組みあわせて出力する。
コードブック210.音源コードブック探索回路230
の出力符号系列を組みあわせて出力する。
以上で第1の発明の詳細な説明を終える。
第2図は、第2の発明による音声符号化方式を実施する
音声符号化装置を示すブロック図である。
音声符号化装置を示すブロック図である。
図において、第1図と同一の番号を付した構成要素は、
第1図と同一の動作を行うので説明を省略する。
第1図と同一の動作を行うので説明を省略する。
マスキングしきい植針算回路205は、減算器190の
出力音声信号xI、(n)に対してN点のOCT変換を
行いスペクトルX、1(k)(k−0〜N−1)を求め
、さらに疑似パワスペクトルIX、(k)を求め、これ
を臨界帯域フィルタあるいは聴覚モデルにより分析して
、各臨界帯域毎のパワあるいはRMSを計算する。ここ
でパワを計算するには下式に従う。
出力音声信号xI、(n)に対してN点のOCT変換を
行いスペクトルX、1(k)(k−0〜N−1)を求め
、さらに疑似パワスペクトルIX、(k)を求め、これ
を臨界帯域フィルタあるいは聴覚モデルにより分析して
、各臨界帯域毎のパワあるいはRMSを計算する。ここ
でパワを計算するには下式に従う。
ここで、bl、、bh、は、それぞれi番目の臨界帯域
の下限周波数、上限周波数を示す。Rは音声信号帯域に
含まれる臨界帯域の個数である。02)式の値から各臨
界帯域におけるマスキングしきい値C(i)を求め出力
する。マスキングしきい値の求め方は文献5等を参照で
きる。また、聴覚モデルについては、前記文献8等を参
照できる。臨界帯域については、前記文献7を参照でき
る。
の下限周波数、上限周波数を示す。Rは音声信号帯域に
含まれる臨界帯域の個数である。02)式の値から各臨
界帯域におけるマスキングしきい値C(i)を求め出力
する。マスキングしきい値の求め方は文献5等を参照で
きる。また、聴覚モデルについては、前記文献8等を参
照できる。臨界帯域については、前記文献7を参照でき
る。
重み付は回路220は、適応コードブック210におい
て(4)式に従い求めた誤差信号ID(k):2に対し
て、臨界帯域フィルタあるいは聴覚モデルによる分析を
行い、さらに前記02)式に従い各臨界帯域毎のパワB
’(i)あるいはRMSを求める。
て(4)式に従い求めた誤差信号ID(k):2に対し
て、臨界帯域フィルタあるいは聴覚モデルによる分析を
行い、さらに前記02)式に従い各臨界帯域毎のパワB
’(i)あるいはRMSを求める。
次に、マスキングしきい値C(i)による重み付は誤差
尺度W(i)2を下式に従い各臨界帯域i毎に求める。
尺度W(i)2を下式に従い各臨界帯域i毎に求める。
W (i ) 2
(i = 1− R) (13)重み付は
回路220は、重み付は誤差尺度W (i ) ”を適
応コードブック210に出力し、適応コートブック21
0は次式を最小にするコードベクトルを選択する。
回路220は、重み付は誤差尺度W (i ) ”を適
応コードブック210に出力し、適応コートブック21
0は次式を最小にするコードベクトルを選択する。
マスキングしきい植針算回路225は、減算器205の
出力信号e、(n)に対してN点のOCT変換を行いス
ペクトルE、(k)(k=0〜N−1)を求め、さらに
疑似パワスペクトルIE(k)を求め、これを臨界帯域
フィルタあるいは聴覚モデルにより分析して、各臨界帯
域毎のパワあるいはRMSを計算し、マスキングしきい
植針算回路220と同一の動作を行い、これらの値から
各臨界帯域におけるマスキングしきい値C,(+)を求
め出力する。
出力信号e、(n)に対してN点のOCT変換を行いス
ペクトルE、(k)(k=0〜N−1)を求め、さらに
疑似パワスペクトルIE(k)を求め、これを臨界帯域
フィルタあるいは聴覚モデルにより分析して、各臨界帯
域毎のパワあるいはRMSを計算し、マスキングしきい
植針算回路220と同一の動作を行い、これらの値から
各臨界帯域におけるマスキングしきい値C,(+)を求
め出力する。
重み付は回路240は、音源コードブック探索回路23
0において(4)式に従い求めた誤差信号D(k):2
に対して、臨界帯域フィルタあるいは聴覚モデルによる
分析を行い、各臨界帯域毎のパワあるいはRMSに対し
てマスキングしきい値をもとに、重み付は回路220と
同一の動作を行い、マスキングによる重み付は誤差尺度
を求め音源コードブック探索回路230へ出力する。
0において(4)式に従い求めた誤差信号D(k):2
に対して、臨界帯域フィルタあるいは聴覚モデルによる
分析を行い、各臨界帯域毎のパワあるいはRMSに対し
てマスキングしきい値をもとに、重み付は回路220と
同一の動作を行い、マスキングによる重み付は誤差尺度
を求め音源コードブック探索回路230へ出力する。
以上で第2の発明の詳細な説明を終える。
前記(2)、 (4)式において、音源コードブックC
J(n)については、予め各コードベクトルをDCT変
換したコードブックを別に用意することにより、音源コ
ートブック探索時に各コードベクトルのOCT変換が不
要となり、音源コードブック探索に必要な演算量を低減
化できる。
J(n)については、予め各コードベクトルをDCT変
換したコードブックを別に用意することにより、音源コ
ートブック探索時に各コードベクトルのOCT変換が不
要となり、音源コードブック探索に必要な演算量を低減
化できる。
臨界帯域分析フィルタは、等価な動作を行う他の周知な
構成のフィルタを用いることができる。
構成のフィルタを用いることができる。
例えばQMFフィルタ等を用いることができる。
マスキングしきい値の計算法には、他の周知な方法を用
いることができる。また、マスキングしきい値による重
み付けは実施例で述べた方法以外にも他の良好な方法を
用いることができる。例えば、前記03)弐の代わりに
05)あるいはθω弐で求めた重み付は誤差尺度W (
i ) 2を用いることもできる。
いることができる。また、マスキングしきい値による重
み付けは実施例で述べた方法以外にも他の良好な方法を
用いることができる。例えば、前記03)弐の代わりに
05)あるいはθω弐で求めた重み付は誤差尺度W (
i ) 2を用いることもできる。
W (i ) ”
−B (i) B’ (i)/ (B (i) C(i
)) (15)W(i)”=B(i)B’(i)/C
(i) Oωまた、(5)式では、重み付は信号、
重み付はインパルス応答のDCT変換Xw (k) 、
Hl、 (k)を用いたが、重み付けを行わない信号X
(k)、インパルス応答H(k)のDCT変換を用いて
もよい。
)) (15)W(i)”=B(i)B’(i)/C
(i) Oωまた、(5)式では、重み付は信号、
重み付はインパルス応答のDCT変換Xw (k) 、
Hl、 (k)を用いたが、重み付けを行わない信号X
(k)、インパルス応答H(k)のDCT変換を用いて
もよい。
このようにすると、重み付は回路200は不要となる。
また、OCT変換以外に他の周知な直交変換、例えばD
FT等を用いることもできる。
FT等を用いることもできる。
また、音源コードブックとしては、他の周知な構成を用
いることができる。音源コードブックの構成法について
は、例えばC,Laflamme氏らによる”On r
educing computational com
plexity ofcodebook 5earch
in CELP coder through th
e useof algebraic codes″と
題した論文(Proc、 [CASSP、 pp、17
7−180.1990) (文献13)や、1. T
rancos。
いることができる。音源コードブックの構成法について
は、例えばC,Laflamme氏らによる”On r
educing computational com
plexity ofcodebook 5earch
in CELP coder through th
e useof algebraic codes″と
題した論文(Proc、 [CASSP、 pp、17
7−180.1990) (文献13)や、1. T
rancos。
氏らによる”CELP: A candidate f
or GSM halfrate coding’と題
した論文(Proc、 ICASSP、 pp。
or GSM halfrate coding’と題
した論文(Proc、 ICASSP、 pp。
469−472.1990年)(文献14)等を参照で
きる。
きる。
マスキングしきい植針算回路205において、疑似パワ
スヘクト/I/l X、1(k) : 2ヲ、LSP
ii子化回路140の出力である復号化線形予測係数を
OCT変換して計算してもよい。このようにすると疑似
パワスペクトル包絡が求まる。
スヘクト/I/l X、1(k) : 2ヲ、LSP
ii子化回路140の出力である復号化線形予測係数を
OCT変換して計算してもよい。このようにすると疑似
パワスペクトル包絡が求まる。
また、重み付は回路240において、マスキングしきい
値としては、マスキングしきい植針算回路205におい
て求めたマスキングしきい値を用いてもよい。このよう
にすると、マスキングしきい植針算回路225を省略で
きる。
値としては、マスキングしきい植針算回路205におい
て求めたマスキングしきい値を用いてもよい。このよう
にすると、マスキングしきい植針算回路225を省略で
きる。
音源コードブックとして、より効率のよいコードブック
、例えば、マトリクス量子化、有限状態ヘクトル量子化
、トレリス量子化、 Delayed Decisio
n量子化などによるコートブックを用いると、さらに特
性を改善できる。これらの方法の詳細は、例えばGra
y氏によるνector quantization”
(iEEEASSP Magazine、 pp、4
−29.1984年)と題した論文(文献15)等を参
照できる。
、例えば、マトリクス量子化、有限状態ヘクトル量子化
、トレリス量子化、 Delayed Decisio
n量子化などによるコートブックを用いると、さらに特
性を改善できる。これらの方法の詳細は、例えばGra
y氏によるνector quantization”
(iEEEASSP Magazine、 pp、4
−29.1984年)と題した論文(文献15)等を参
照できる。
また、上記実施例では、音源コードブックが1段の場合
について説明したが、音源コートブ、・夕は多段として
もよい。例えば、前記文献11に示すように2段とし、
1段目は文献11の方法により学習して構成したコート
ブック、2段目は乱数コドブノクの構成をとることもで
きる。具体的な構成法は文献11を参照できる。このよ
うにしだ方が、コートブック探索に要する演算量を低減
できる。
について説明したが、音源コートブ、・夕は多段として
もよい。例えば、前記文献11に示すように2段とし、
1段目は文献11の方法により学習して構成したコート
ブック、2段目は乱数コドブノクの構成をとることもで
きる。具体的な構成法は文献11を参照できる。このよ
うにしだ方が、コートブック探索に要する演算量を低減
できる。
また、適応コードブックのゲインと音源コートブックの
ゲインは、まとめてベクトル量子化コードブックを構成
することもできる。このようにした方が、さらに少ない
ビット数でゲインを量子化できる。詳細は前記文献11
や、1.Gerson氏らによる”Vector su
m excited 1inear predicti
on(VSll:LP) 5peech coding
at 8kbps ”と題した論文(Proc、 I
CASSP、 pp、461−464.1990年〕
(文献16)等を参照できる。
ゲインは、まとめてベクトル量子化コードブックを構成
することもできる。このようにした方が、さらに少ない
ビット数でゲインを量子化できる。詳細は前記文献11
や、1.Gerson氏らによる”Vector su
m excited 1inear predicti
on(VSll:LP) 5peech coding
at 8kbps ”と題した論文(Proc、 I
CASSP、 pp、461−464.1990年〕
(文献16)等を参照できる。
また、適応コートブックは1次としたが、2次、あるい
は、遅延を整数値ではなく小数値とすることによりさら
に音質を改善できる。詳細は、P、 Kroon氏らに
よる”Pitch predictors with
high teIrlporal resolutio
n (Proc、 ICASSP、 pp、661−
6641990年)と題した論文(文献17)等を参照
できる。
は、遅延を整数値ではなく小数値とすることによりさら
に音質を改善できる。詳細は、P、 Kroon氏らに
よる”Pitch predictors with
high teIrlporal resolutio
n (Proc、 ICASSP、 pp、661−
6641990年)と題した論文(文献17)等を参照
できる。
また、以上の説明では、適応コートブックのゲインと音
源コードブックのインデクス、ゲインには同時最適化を
施さなかったが、同時最適化を行うことにより、さらに
特性を改善できる。詳細は、前記文献16等を参照でき
る。
源コードブックのインデクス、ゲインには同時最適化を
施さなかったが、同時最適化を行うことにより、さらに
特性を改善できる。詳細は、前記文献16等を参照でき
る。
また、演算量を低減化するためには、音源コードブック
のコードベクトルが選択された後に、適応コードブック
のゲインβと、音源コードブックのケインTを同時に最
適化するような構成とするこもできる。
のコードベクトルが選択された後に、適応コードブック
のゲインβと、音源コードブックのケインTを同時に最
適化するような構成とするこもできる。
マタ、上記の実施例では、スペクトルパラメータとして
LSPパラメータを符号化し、その分析法としてLPG
分析を用いたが、スベク]・ルパラメータとしては他の
周知なパラメータ、例えばIPcケプストラム、ケプス
トラム、改良ケブス]・ラム一般化ケプストラム、メル
ヶブヌトラムなとを用いることもできる。また各パラメ
ータ0こ最適な分析法を用いることができる。
LSPパラメータを符号化し、その分析法としてLPG
分析を用いたが、スベク]・ルパラメータとしては他の
周知なパラメータ、例えばIPcケプストラム、ケプス
トラム、改良ケブス]・ラム一般化ケプストラム、メル
ヶブヌトラムなとを用いることもできる。また各パラメ
ータ0こ最適な分析法を用いることができる。
また、LSPパラメータのヘクトル量子化において、L
SPパラメータに聴覚特性に対応した非線形変換を施し
た後にヘクトル量子化するようにしてもよい。非線形変
換としては、例えばメル変換が知られている。
SPパラメータに聴覚特性に対応した非線形変換を施し
た後にヘクトル量子化するようにしてもよい。非線形変
換としては、例えばメル変換が知られている。
また、フレームで求めたLPG係数をLSP上や線形予
測係数上でサブフレーム毎に補間し、補間した係数を用
いて適応コートブン先音源コートフックの探索を行う構
成としてもよい。このような構成とすることにより、音
質がさらに改善される。
測係数上でサブフレーム毎に補間し、補間した係数を用
いて適応コートブン先音源コートフックの探索を行う構
成としてもよい。このような構成とすることにより、音
質がさらに改善される。
実施例に示した重み付は誤差尺度は、適応コードブック
と音源コードブ・ツクの少なくとも一方の探索に用いる
ことができる。
と音源コードブ・ツクの少なくとも一方の探索に用いる
ことができる。
実施例では、コードブックの探索に重み付は誤差尺度を
用いる場合について説明したが、マルチパルスの計算に
も適用することができる。
用いる場合について説明したが、マルチパルスの計算に
も適用することができる。
また、受信側では、量子化雑音を整形することにより聴
覚的に聞き易くするために、ビ・ンチとスペクトル包絡
の少なくとも1つについて動作する適応形ポストフィル
タを付加してもよい。適応型ポストフィルタの構成につ
いては、例えば、Kroon氏らによるllA C1a
ss of Analysis−by−synthes
isPredictive Coders for H
igh Quality SpeechCodrng
at Rates between 4.8 and
16kb/s、” (TEEEJSAC,vol、6.
2.353−363.1988) (文献18)等を参
照できる。
覚的に聞き易くするために、ビ・ンチとスペクトル包絡
の少なくとも1つについて動作する適応形ポストフィル
タを付加してもよい。適応型ポストフィルタの構成につ
いては、例えば、Kroon氏らによるllA C1a
ss of Analysis−by−synthes
isPredictive Coders for H
igh Quality SpeechCodrng
at Rates between 4.8 and
16kb/s、” (TEEEJSAC,vol、6.
2.353−363.1988) (文献18)等を参
照できる。
以上述べたように、本発明によれば、適応コードブック
の探索あるいは音源コードブックの探索あるいはマルチ
パルスの計算において、適応コードブックあるいは音源
コードブックあるいはマルチパルスにより再生した信号
と、入力音声信号との誤差信号に対して、聴覚の特性に
対応するように周波数軸を非線形変換して誤差尺度を求
めるか、あるいは、誤差信号に対して各臨界帯域毎にマ
スキングしきい値を計算し、マスキングしきい値をもと
に誤差信号に重み付けを行った重み付は誤差尺度を用い
ているので、より聴感に対応した符号化が可能となり、
同程度の音質を保ちながら従来方式に比べよりピントレ
ートを低減することができるという大きな効果がある。
の探索あるいは音源コードブックの探索あるいはマルチ
パルスの計算において、適応コードブックあるいは音源
コードブックあるいはマルチパルスにより再生した信号
と、入力音声信号との誤差信号に対して、聴覚の特性に
対応するように周波数軸を非線形変換して誤差尺度を求
めるか、あるいは、誤差信号に対して各臨界帯域毎にマ
スキングしきい値を計算し、マスキングしきい値をもと
に誤差信号に重み付けを行った重み付は誤差尺度を用い
ているので、より聴感に対応した符号化が可能となり、
同程度の音質を保ちながら従来方式に比べよりピントレ
ートを低減することができるという大きな効果がある。
第1図は第1の発明による音声符号化方式を実施する音
声符号化装置を示すブロック図、第2図は第2の発明に
よる音声符号化方式を実施する音声符号化装置を示すブ
ロンク図である。 110 ・・・・・バッファメモリ 130 ・・・・・しpc計算回路 140 ・・・・・LSP量子化回路150 ・・
・・・サブフレーム分割回路170 ・ ・ ・ 190.205・ 200 ・ ・ ・ 205.225・ 206 ・ ・ ・ 210 ・ ・ 215.236・ 220 240・ 230 ・ ・ ・ 235 ・ ・ ・ 260 ・ ・ ・ ・ 281 ・ ・ ・ ・ 290 ・ ・ ・ ・ インパルス応答計算回路 減算器 重み付は回路 マスキングしきい植針算回路 遅延回路 適応コードブック ゲインコートブック 重み付は回路 音源コードブック探索回路 音源コードブック マルチプレクサ 合成フィルタ 加算器
声符号化装置を示すブロック図、第2図は第2の発明に
よる音声符号化方式を実施する音声符号化装置を示すブ
ロンク図である。 110 ・・・・・バッファメモリ 130 ・・・・・しpc計算回路 140 ・・・・・LSP量子化回路150 ・・
・・・サブフレーム分割回路170 ・ ・ ・ 190.205・ 200 ・ ・ ・ 205.225・ 206 ・ ・ ・ 210 ・ ・ 215.236・ 220 240・ 230 ・ ・ ・ 235 ・ ・ ・ 260 ・ ・ ・ ・ 281 ・ ・ ・ ・ 290 ・ ・ ・ ・ インパルス応答計算回路 減算器 重み付は回路 マスキングしきい植針算回路 遅延回路 適応コードブック ゲインコートブック 重み付は回路 音源コードブック探索回路 音源コードブック マルチプレクサ 合成フィルタ 加算器
Claims (2)
- (1)入力した離散的な音声信号を予め定められた時間
長のフレームに分割し、前記音声信号のスペクトル包絡
を表すスペクトルパラメータを求めて出力し、前記フレ
ームを予め定められた時間長の小区間に分割し、過去の
音源信号からなる適応コードブックをもとに再生した信
号が前記音声信号に近くなるようにピッチパラメータを
求め、前記音声信号の音源信号を予め構成した複数種類
のコードベクトルからなるコードブックあるいはマルチ
パルスにより表して出力する音声符号化方式において、 前記適応コードブックあるいは前記コードブックあるい
は前記マルチパルスにより再生した信号と前記音声信号
との誤差信号に対し聴覚の特性に対応するように周波数
軸を非線形変換して誤差尺度を求め、前記誤差尺度を小
さくするように前記コードブックから最適なコードベク
トルを求めるかあるいはマルチパルスを求めて出力する
ことを特徴とする音声符号化方式。 - (2)入力した離散的な音声信号を予め定められた時間
長のフレームに分割し、前記音声信号のスペクトル包絡
を表すスペクトルパラメータを求めて出力し、前記フレ
ームを予め定められた時間長の小区間に分割し、過去の
音源信号からなる適応コードブックをもとに再生した信
号が前記音声信号に近くなるようにピッチパラメータを
求め、前記音声信号の音源信号を予め構成した複数種類
のコードベクトルからなるコードブックあるいはマルチ
パルスにより表して出力する音声符号化方式において、 前記適応コードブックあるいは前記コードブックあるい
は前記マルチパルスにより再生した前記音声信号との誤
差信号と前記音声信号をもとに、聴覚のマスキング特性
に対応するようなマスキングしきい値を求め、前記しき
い値をもとに前記誤差信号を重み付けて誤差尺度を求め
、前記誤差尺度を小さくするように前記コードブックか
ら最適なコードベクトルを求めるかあるいはマルチパル
スを求めて出力することを特徴とする音声符号化方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2184231A JP2808841B2 (ja) | 1990-07-13 | 1990-07-13 | 音声符号化方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2184231A JP2808841B2 (ja) | 1990-07-13 | 1990-07-13 | 音声符号化方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0473699A true JPH0473699A (ja) | 1992-03-09 |
JP2808841B2 JP2808841B2 (ja) | 1998-10-08 |
Family
ID=16149671
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2184231A Expired - Fee Related JP2808841B2 (ja) | 1990-07-13 | 1990-07-13 | 音声符号化方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2808841B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07160297A (ja) * | 1993-12-10 | 1995-06-23 | Nec Corp | 音声パラメータ符号化方式 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01191510A (ja) * | 1988-01-27 | 1989-08-01 | Nec Corp | 聴感的重み付けフィルタ |
-
1990
- 1990-07-13 JP JP2184231A patent/JP2808841B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01191510A (ja) * | 1988-01-27 | 1989-08-01 | Nec Corp | 聴感的重み付けフィルタ |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07160297A (ja) * | 1993-12-10 | 1995-06-23 | Nec Corp | 音声パラメータ符号化方式 |
Also Published As
Publication number | Publication date |
---|---|
JP2808841B2 (ja) | 1998-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6980951B2 (en) | Noise feedback coding method and system for performing general searching of vector quantization codevectors used for coding a speech signal | |
US6014618A (en) | LPAS speech coder using vector quantized, multi-codebook, multi-tap pitch predictor and optimized ternary source excitation codebook derivation | |
JP3196595B2 (ja) | 音声符号化装置 | |
JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JPH09127991A (ja) | 音声符号化方法及び装置、音声復号化方法及び装置 | |
JPH09127990A (ja) | 音声符号化方法及び装置 | |
JPH04171500A (ja) | 音声パラメータ符号化方法 | |
JPH10124092A (ja) | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 | |
US5598504A (en) | Speech coding system to reduce distortion through signal overlap | |
JPH05216500A (ja) | 音声符号化装置 | |
JP2002268686A (ja) | 音声符号化装置及び音声復号化装置 | |
JPH09258795A (ja) | ディジタルフィルタおよび音響符号化/復号化装置 | |
JP3095133B2 (ja) | 音響信号符号化方法 | |
JP3308764B2 (ja) | 音声符号化装置 | |
JPH0854898A (ja) | 音声符号化装置 | |
JP3252285B2 (ja) | 音声帯域信号符号化方法 | |
JP3256215B2 (ja) | 音声符号化装置 | |
JPH0473699A (ja) | 音声符号化方式 | |
JP3194930B2 (ja) | 音声符号化装置 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JP3024467B2 (ja) | 音声符号化装置 | |
JP2002221998A (ja) | 音響パラメータ符号化、復号化方法、装置及びプログラム、音声符号化、復号化方法、装置及びプログラム | |
JPH07168596A (ja) | 音声符号化装置 | |
JP2000029499A (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
JP2658794B2 (ja) | 音声符号化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070731 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080731 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090731 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |