JPH03127000A - 音声のスペクトル予測符号化方式 - Google Patents

音声のスペクトル予測符号化方式

Info

Publication number
JPH03127000A
JPH03127000A JP1265197A JP26519789A JPH03127000A JP H03127000 A JPH03127000 A JP H03127000A JP 1265197 A JP1265197 A JP 1265197A JP 26519789 A JP26519789 A JP 26519789A JP H03127000 A JPH03127000 A JP H03127000A
Authority
JP
Japan
Prior art keywords
encoding
signal
time
frequency
time domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1265197A
Other languages
English (en)
Inventor
Koji Okazaki
岡崎 晃二
Hidehira Iseda
衡平 伊勢田
Naoji Matsuo
直司 松尾
Shigeyuki Umigami
重之 海上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1265197A priority Critical patent/JPH03127000A/ja
Publication of JPH03127000A publication Critical patent/JPH03127000A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要] 音声や楽音等の符号化方式に関し、 可変窓長を用いることなく、固定窓長のままでカスタネ
ットのような打撃音に対しても、効率のよい符号化を行
うことができる音声のスペクトル予測符号化方式を提供
することを目的とし、音声信号等に対して一定時間ごと
に一定窓長の離散コサイン変換を行って時間領域から周
波数領域への変換を行う時間領域−周波数領域変換手段
と、該周波数領域の出力信号を低域または高域から順に
並べて得られる系列を時間領域の線形予測符号化手法に
よって符号化する符号化手段とを備えることによって構
成する。
また音声信号等に対して一定時間ごとに一定窓長の離散
フーリエ変換を行って時間領域から周波数領域への変換
を行う時間領域−周波数領域変換手段と、該周波数領域
の出力信号を実数部と虚数部に分けてそれぞれ低域また
は高域から順に並べて得られる系列を時間領域の線形予
測符号化手法によって符号化する符号化手段とを備える
ことによって構成する。
(産業上の利用分野〕 本発明は音声や楽音等の符号化方式に係り、特に音声等
を一定時間ごとに一定窓長の離散コサイン変換(DCT
)または離散フーリエ変換(DFT)によって周波数領
域に変換し、そのスペクトルについて予測を行って符号
化する音声のスペクトル予測符号化方式に関するもので
ある。
一般に、音声等に対して一定時間ごとに一定長の時間窓
によるDCTまたはDFTを行って周波数領域に変換し
て符号化する符号化方式では、窓は長いほど効率よく符
号化できるので、音声や楽音の定常性に合わせて20m
5ecから4Qmsec程度に取るのがよい。ところが
カスタネットのような衝撃音では音は2m5ec程度し
か持続しない。このような場合には、上述のような窓長
で符号化した音を復号化したときの品質が劣化する。
これは、音がない所では音がある所よりも雑音を感知し
やすいので、カスタネットのような場合、窓内における
音がない部分では雑音のレベルは低くなければならない
。ところが周波数領域に変換して符号化する方法では、
復号化して時間領域に戻したとき、その窓長の全体にわ
たって一定しベルの量子化雑音が生じる。このため時間
領域で音がない部分の雑音が知覚されるようになるため
である。
そこで、音声等を一定時間ごとに一定窓長のOCTまた
はDFTによって周波数領域に変換して符号化する符号
化方式において、窓長を通常の音声や楽音に適した長さ
にした場合でも、カスタネットのような衝撃音に対して
も、音がない部分の雑音が増加することなく、効率のよ
い符号化を行うことができるようにすることが要望され
る。
〔従来の技術〕
従来このような問題を解決できる符号化方式の一つとし
て、可変窓長を用いて符号化する手法が知られている。
例えば20m5ec、  10m5ec、  5m5e
cの3種類の窓長を用いた変換を行なえるようにしてお
き、2Qmsecごとに、20m5ecの窓で1回10
慴secの窓で2回、および5 m5ecの窓で4回の
変換を行って、この20IIISeCの音声を最も良好
に符号化できる変換を選択して符号化する。
(発明が解決しようとする課題〕 ところがこのように複数種類の窓を使用する場合には、
窓に隣接する前後のある範囲をオーバーラツプさせて雑
音を消去する、周知のオーバーラツプ・アンド手法を使
用することができないだけでなく、20m5ecだけが
選ばれるような音声信号に対しては、ブロック歪み雑音
が目立つようになり、長い窓長を用いた効果が低減する
。また変換を3回行わねばならないため、演算量も大き
くなることを避けられない。
本発明はこのような従来技術の課題を解決しようとする
ものであって、符号化に際して可変窓長を用いることな
(、固定窓長のままでカスタネットのような衝撃音に対
しても、効率のよい符号化を行うことができる音声のス
ペクトル予測符号化方式を提供することを目的としてい
る。
[課題を解決するための手段] 本発明は第1図(a)にその原理的構成を示すように、
時間領域−周波数領域変換手段1と、符号化手段2とを
備えたものである。
ここで、時間領域−周波数領域変換手段1は、音声信号
等に対して一定時間ごとに一定窓長の離散コサイン変換
を行って時間領域から周波数領域への変換を行うもので
あり、符号化手段2は、この周波数領域の出力信号を低
域または高域から順に並べて得られる系列を時間領域の
線形予測符号化手法によって符号化するものである。
また本発明は第1図(b)にその原理的構成を示すよう
に、時間領域−周波数領域変換手段1Aと、符号化手段
2Aとを備えたものである。
ここで、時間領域−周波数領域変換手段IAは、音声信
号等に対して一定時間ごとに一定窓長の離散フーリエ変
換を行って時間領域から周波数領域への変換を行うもの
であり、符号化手段2Aは、この周波数領域の出力信号
を実数部と虚数部に分けてそれぞれ低域または高域から
順に並べて得られる系列を時間領域の線形予測符号化手
法によって符号化するものである。
〔作用] 本発明においては、時間領域での線型予測符号化を周波
数領域に適用して音声等の符号化を行う。
時間領域での予測符号化については、従来、次のような
ことが知られている。
(1)周波数領域でのパワーの分布(パワースペクトル
)が偏っているとき、すなわち特定の周波数成分が特に
大きいときは、時間領域では線形予測器により過去の信
号から現時刻の信号をほぼ推定できる。そこで予測誤差
を符号化することによって、信号を直接符号化するより
も効率よく符号化することができる。
(2)人間の感覚では、パワーが大きい周波数に雑音が
あるときは雑音を感知しにくいが、パワーが小さい周波
数では雑音を感知しやすい。ところが予測符号化をその
まま適用すると、周波数領域での雑音の分布は一様にな
る。そこで予測符号化における雑音成形方法や、聴覚重
み付4J方法として知られる手法によって、量子化雑音
をパワーの大きい周波数に集めることができる。
時間領域と周波数領域とは、フーリエ変換等によって互
いに移行することができる。そこで時間領域について知
られている上記(1)、 (2)の結果を周波数領域か
らみると、時間と周波数とを入れ換えることによって、 (1)カスタネットの音のように、時間領域でのパワー
の分布が偏っているとき、すなわち特定の時刻付近のパ
ワーが特に大きい場合には、周波数領域では線型予測器
により、低域(または高域)(いずれを過去とみるかに
よって異なる)の信号から現周波数の信号をほぼ推定す
ることができる。
そこで予測誤差を符号化することによって、信号を直接
符号化するよりも効率よく符号化できる。
(2)人間の感覚では、パワーが大きい時刻付近に雑音
があるときは雑音を感知しにくいが、パワーが小さい時
刻付近では雑音を感知しやすい。ところが予測符号化を
そのまま適用すると、時間領域での雑音の分布は一様に
なる。そこで予測符号化における雑音成形方法や、聴覚
重み付は方法として知られる手法によって、量子化雑音
をパワーの大きい時刻付近に集めることができる。
従って、周波数領域に従来の時間領域の予測符号化手法
を導入することによって、カスタネットのような衝撃性
の音にも長い窓長で対応することができるようになる。
〔実施例〕
第2図は本発明の一実施例を示したものであって、DC
Tを用いて時間領域の信号を周波数領域の信号に変換す
る場合を示し、入力信号を符号化して送信する送信側と
、送信信号を伝送する伝送路と、受信信号を復号化して
出力信号を発生する受信側とが示されている。
送信側においては、入力信号をDCT変換するDCT部
1と、DCT部1の出力信号を符号化する符号化部2と
、符号化部2における予測器のパラメータを発生するパ
ラメータ発生部3とが示されている。
DCT部1は時間領域の人力信号をDCT変換して、周
波数領域の信号X、を生じる。ここでX、は変換されて
生じた第m番目の成分を表している。信号x6のZ変換
は次式のようにX (z−’)によって示される。
X (z−’) =ΣX、Z−’        −(
1)符号化部2は、周波数領域の信号に重み付けする重
み付はフィルタ部11と、重み付けされた信号を予測符
号化する予測符号化部12とからなっている。
重み付はフィルタ11において、111は演算式1式%
(2) によって示される白色化フィルタであって、人力信号を
時間系列的に一定化して、P(z−’)で示される予測
フィルタ出力との差をとって、予測残差の信号を発生す
る。予測フィルタP(z−’)は、次式によって示され
る。
P (z−’) =ΣPt  z−+        
−(3)ここでP、は予測係数である。
112は演算式 (4) %式%) によって示される再生フィルタであって、白色化フィル
ター11の予測残差の信号から再生信号を発生する。こ
の際、その予測フィルタに係数α(0〈α〈1)を乗し
ることによって重み付けを行って、重み付けされた再生
信号を発生する。重み付けされた予測フィルタP(αZ
−1)は、次式によって示される。
P (αZ″□′)−ΣP、αi Z−”     −
・・(5)なおここでα=1とした場合は、重み付けさ
れない再生信号が発生する。
予測符号化部12において、121は減算器であって、
重み付はフィルタ11からの重み付けされた再生信号か
ら予測値の信号を減算して、予測残差の信号を発生する
。122は量子化器(Q)であって、この予測残差の信
号を量子化して、量子化された予測残差の信号を発生ず
る。量子化器122の出力信号は、符号化部2の符号化
信号出力となる。
123は逆量子化器(Q−’)であって、量子化器12
2の出力を逆量子化して、白色化された音の信号を発生
する。124は加算器であって、逆量子化器123の出
力信号と予測値の信号とを加算して再生信号を発生する
125は演算式 %式%(6) によって示される重み付けされた予測器であって、その
予測フィルタに係数α(0〈α〈1)を乗しることによ
って重み付けを行って、重み付けされた予測値の信号を
発生する。なおこの場合、α=lとした場合は、重み付
けされない予測値の信号が発生する。
符号化部2において、係数O≦αく1は雑音成形を行う
場合に対応し、α=Iは雑音成形なしに対応している。
パラメータ発生部3は、人力信号の相関をとる相関部1
3と、相関部13で得られた相関係数から予測フィルタ
のパラメータを発生する線形予測分析部14とからなっ
ている。
相関部I3は、入力信号の相関を示す相関係数R+(i
=0〜L)を発生する。相関係数R4は次式によって示
されるものである。
Ri=ΣX、、lχ−、、−(7) 線形予測分析部14は、相関係数R8から線形予測分析
を行って、予測フィルタを定義するパラメータP(z−
’)を発生する。
伝送路4は、このようにして発生した送信側の符号化信
号と、予測フィルタのパラメータP(z)とを受信側へ
送る。
受信側においては、受信信号を復号化する復号化部5と
、復号化出力信号を逆DCT変換して時間領域の出力信
号を発生する逆DCT部((DCT)6とが示されてい
る。
復号化部5は、逆量子化器(Q−’)15と、加算器1
6と、予測器17とからなっている。
逆量子化器15は、伝送路から受信した符号化信号を逆
量子化して、予測残差の信号を復元する。
加′X器16は、復元された予測残差の信号に予測値の
信号を加算して再生信号を発生する。
予測器17は演算式 %式%) によって示される予測フィルタからなるものであって、
伝送路から送られたパラメータP(z−’)によって定
義されるものであり、再生信号から予測を行って予測値
の信号を発生する。
逆DCT部6は、再生されて生した周波数領域の信号を
逆DCT変換して、時間領域の出力信号を発生する。
なお本発明において、DCT変換されて生した周波数領
域の信号を符号化する符号化部2は、第2図の実施例に
示された構成に限るものでなく、予測符号化方式のもの
であればどのようなものでもよく、その方式によって本
発明の効果に差異を生しることはない。
第3図は本発明の他の実施例を示したものであって、D
FTを用いて時間領域の信号を周波数領域の信号に変換
する場合を示し、人力信号を符号化して送信する送信側
と、送信信号を伝送する伝送路と、受信信号を復号化し
て出力信号を発生する受信側とが示されている。この場
合、DFTスペクトルは複素数なので、これを実数部と
虚数部に分けて、それぞれ符号化と復号化とを行う。
送信側においては、人力信号をDCT変換するDFT部
IAと、DFT部IAの出力信号を符号化する符号化部
2Aと、符号化部2Aにおける予測器のパラメータを発
生するパラメータ発生部3Aとが示されている。
DFT部IAは時間領域の入力信号をDFT変換して、
実数部Xヨ′と、虚数部X、l とからなる周波数領域
の信号を発生し、これを実数部と虚数部とについてそれ
ぞれZ変換して、実数部の信号X’ (z−’) と、
虚数部の信号X’ (z−’)(!:を発生する。
符号化部2Aは、第2図の実施例に示されたものと同じ
構成の2個の符号化部2を有し、それぞれ実数部の信号
X’ (z−’)と、虚数部の信号X’ (z−’)か
ら、量子化された予測残差からなる符号化信号を発生す
る。なおこの場合、実数部ど虚数部のそれぞれの符号化
部における予測器は同一構成でよく、従って1個の予測
器を両符号化部において共通に使用することができる。
パラメータ発生部3Aは、入力信号の相関をとる相関部
13Aと、相関部13Aで得られた相関係数から予測フ
ィルタのパラメータを発生する線形予測分析部14Aと
からなっている。
相関部13Aは、複素数からなる入力信号の相関を示す
相関係数R+ (i=o〜L)を発生する。
この場合の相関係数R4は次式によって示されるもので
ある。
Ri=ΣX t* ’ X+++iir+ΣX @ ’
 X 11 + H・・−(9) 線形予測分析部14Aは、相関係数R8から線形予測分
析を行って、符号化部2Aにおける予測フィルタを定義
するパラメータP(z−’)を発生する。
なお相関係数R8は、(9)式のように実数部と虚数部
のそれぞれの相関の平均を取って符号化部2Aに共通に
与えるにしてもよく、または実数部と虚数部とをそれぞ
れ別個に求めてそれぞれの符号化部2に与えるようにし
てもよい。
伝送路4.4は、このようにして発生した送信側の符号
化信号と予測フィルタのパラメータP(z−’)とを受
信側へ送る。
受信側においては、受信信号を復号化する復号化部5,
5と、復号化出力信号を逆DFT変換して時間領域の出
力信号を発生する逆DFT部(IDFT)6Aとが示さ
れている。
復号化部5.5は、それぞれが第2図の実施例に示され
た復号化部5と同じ構成を有し、それぞれ実数部の符号
化信号と、虚数部の符号化信号とから、再生信号を発生
する。この際伝送路を介して送られた予測フィルタのパ
ラメータP (Z−1)によって定義される予測フィル
タからなる予測器によって予測を行う。
逆DFT部6Aは、再生されて生した周波数領域の信号
を逆DFT変換して、時間領域の出力信号を発生する。
この場合も、DFT変換されて生じた周波数領域の信号
を符号化する符号化部は、第3図の実施例に示された構
成に限るものでなく、予測符号化方式のものであればど
のようなものでもよく、その方式によって本発明の効果
に差異を生じることはない。
〔発明の効果〕
以上説明したように本発明によれば、音声等の時間領域
の信号を、一定時間ごとに一定窓長のDCTまたはDF
Tを用いて、周波数領域の信号に変換して、時間領域の
線形予測符号化手法によって符号化を行うようにしたの
で、符号化に際して可変窓長を用いることなく、固定窓
長のままでカスタネットのような衝撃音に対しても、効
率のよい符号化を行うことができるようになる。
【図面の簡単な説明】
第1図は本発明の原理的構成を示す図、第2図は本発明
の一実施例を示す図、第3図は本発明の他の実施例を示
す図である。 1、LAは時間領域−周波数領域変換手段、22Aは符
号化手段である。

Claims (4)

    【特許請求の範囲】
  1. (1)音声信号等に対して一定時間ごとに一定窓長の離
    散コサイン変換を行って時間領域から周波数領域への変
    換を行う時間領域−周波数領域変換手段(1)と、 該周波数領域の出力信号を低域または高域から順に並べ
    て得られる系列を時間領域の線形予測符号化手法によっ
    て符号化する符号化手段(2)とを備えることを特徴と
    する音声のスペクトル予測符号化方式。
  2. (2)音声信号等に対して一定時間ごとに一定窓長の離
    散フーリエ変換を行って時間領域から周波数領域への変
    換を行う時間領域−周波数領域変換手段(1A)と、 該周波数領域の出力信号を実数部と虚数部に分けてそれ
    ぞれ低域または高域から順に並べて得られる系列を時間
    領域の線形予測符号化手法によって符号化する符号化手
    段(2A)とを備えることを特徴とする音声のスペクト
    ル予測符号化方式。
  3. (3)前記符号化手段(2、2A)が雑音の周波数特性
    に重み付けを行う雑音成形手段を有することを特徴とす
    る請求項第1項または第2項記載の音声のスペクトル予
    測符号化方式。
  4. (4)前記符号化手段(2A)において予測を行う予測
    器が実数部と虚数部に対して共通に設けられたことを特
    徴とする請求項第2項記載の音声のスペクトル予測符号
    化方式。
JP1265197A 1989-10-13 1989-10-13 音声のスペクトル予測符号化方式 Pending JPH03127000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1265197A JPH03127000A (ja) 1989-10-13 1989-10-13 音声のスペクトル予測符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1265197A JPH03127000A (ja) 1989-10-13 1989-10-13 音声のスペクトル予測符号化方式

Publications (1)

Publication Number Publication Date
JPH03127000A true JPH03127000A (ja) 1991-05-30

Family

ID=17413889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1265197A Pending JPH03127000A (ja) 1989-10-13 1989-10-13 音声のスペクトル予測符号化方式

Country Status (1)

Country Link
JP (1) JPH03127000A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009533716A (ja) * 2006-04-10 2009-09-17 クゥアルコム・インコーポレイテッド オーディオ符号化並びに復号化における励起の処理
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009533716A (ja) * 2006-04-10 2009-09-17 クゥアルコム・インコーポレイテッド オーディオ符号化並びに復号化における励起の処理
US8392176B2 (en) 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands

Similar Documents

Publication Publication Date Title
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
Pan Digital audio compression
JP3513292B2 (ja) 雑音荷重フィルタリング方法
EP0673013B1 (en) Signal encoding and decoding system
EP0858067B1 (en) Multichannel acoustic signal coding and decoding methods and coding and decoding devices using the same
US20090204397A1 (en) Linear predictive coding of an audio signal
MXPA96004161A (en) Quantification of speech signals using human auiditive models in predict encoding systems
JP2001053617A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JPH11143499A (ja) 切替え型予測量子化の改良された方法
JP2903533B2 (ja) 音声符号化方式
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP3144009B2 (ja) 音声符号復号化装置
JPH07261800A (ja) 変換符号化方法、復号化方法
JP2002041099A (ja) マスク済み閾値表現方法、再構成方法、及びそのシステム
TW202215417A (zh) 多聲道信號產生器、音頻編碼器及依賴混合噪音信號的相關方法
JPH11504733A (ja) 聴覚モデルによる量子化を伴う予測残余信号の変形符号化による多段音声符号器
JPH03127000A (ja) 音声のスペクトル予測符号化方式
JPH1083200A (ja) 符号化,復号化方法及び符号化,復号化装置
JPH05158495A (ja) 音声符号化伝送装置
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP3163206B2 (ja) 音響信号符号化装置
JP3099876B2 (ja) 多チャネル音声信号符号化方法及びその復号方法及びそれを使った符号化装置及び復号化装置
US7295974B1 (en) Encoding in speech compression
EP1035538B1 (en) Multimode quantizing of the prediction residual in a speech coder
JPH028900A (ja) 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置