JPH1039900A - 音響信号の周波数領域変換係数の包絡推定方法 - Google Patents

音響信号の周波数領域変換係数の包絡推定方法

Info

Publication number
JPH1039900A
JPH1039900A JP8190375A JP19037596A JPH1039900A JP H1039900 A JPH1039900 A JP H1039900A JP 8190375 A JP8190375 A JP 8190375A JP 19037596 A JP19037596 A JP 19037596A JP H1039900 A JPH1039900 A JP H1039900A
Authority
JP
Japan
Prior art keywords
envelope
coefficient
samples
transform coefficient
mdct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8190375A
Other languages
English (en)
Other versions
JP3468335B2 (ja
Inventor
Takehiro Moriya
健弘 守谷
Akio Jin
明夫 神
Naoki Iwagami
直樹 岩上
Satoshi Miki
聡 三樹
Kazunaga Ikeda
和永 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP19037596A priority Critical patent/JP3468335B2/ja
Publication of JPH1039900A publication Critical patent/JPH1039900A/ja
Application granted granted Critical
Publication of JP3468335B2 publication Critical patent/JP3468335B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 MDCT係数のパワー包絡を精度よく求め
る。 【解決手段】 音響信号のサンプル列をNサンプルづつ
重複して2Nサンプルづつ取出し(12)、ハニング関
数窓をかけ(13)、フレームの初めのN/2長のサン
プルx(i)(i=0,…,N/2−1)を時間的に反
転して次のN/2のx(i),(i=N/2,…,N−
1)から引き、フレームの終りのN/2のx(i),
(i=N+N/2,…,2N−1)を時間的に反転して
その直前のN/2のx(i),(i=N,…,N+N/
2−1)に加えて、その折り返し処理結果y(i)をD
CTしてMDCT係数を得(26)、またy(i)を線
形予測分析し(24)、その予測係数のパワースペクト
ル包絡からMDCT係数の包絡とする(28)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は音声や音楽などの
音響信号を例えば量子化して符号化する方法に適用さ
れ、音響信号を重ね合わせ直交変換(LOT:Lapp
ed Orthogonal Transform)
し、かつその変換係数のパワー包絡形状を推定する方法
に関する。
【0002】
【従来の技術】音声や音楽信号を少ないビット数で符号
化する際に周波数領域で量子化する手法がよく知られて
いる。変換にはDFT(離散フーリエ変換)、DCT
(離散コサイン変換)のような通常の直交変換、MDC
T(変形離散コサイン変換)などのLOT(重ね合わせ
直交変換)が使われる。量子化の前に周波数領域の係数
を平坦化する目的で線形予測分析が有効であることも知
られている。これらの技術を組み合わせて音響信号の広
い範囲の信号に対して品質の高い符号化を実現する方法
の例として音響信号変換符号化方法および復号化方法が
(特願平7−52389)で提案されている。この処理
は図3に示される。
【0003】入力端子11からデジタル信号とされた音
響信号が入力され、フレーム分割部12でそのN入力サ
ンプルごとに過去2×Nサンプルの入力系列が抽出さ
れ、その2×N個のサンプルの系列をN個づつ重ね合わ
せ、直交変換処理用フレームとされる。このLOT処理
用フレームは時間窓掛部13で2Nの窓関数(時間窓)
が掛けられる。窓関数W(n)としては、例えば次式で
示されるハニング窓が用いられる。
【0004】 W(n)=sin(nπ/(2N)) ・・・(1) この窓関数が掛けられた信号はLOTの一種であるN次
のMDCT(Modified Discrete C
osine Transform:変形離散コサイン変
換)部14で変形離散コサイン変換されて周波数領域係
数(周波数軸上のそれぞの点におけるサンプル値)に変
換される。窓掛部13の出力は線形予測分析部15へも
供給され、ここで線形予測分析され、P次の予測係数α
0 ,…,αP が求められる。この予測係数α0 ,…,α
P は量子化部16で例えばLSPパラメータに変換され
てから量子化され、スペクトラム概形を示すインデック
スIP が得られる。線形予測係数α0 ,…,αP のパワ
ースペクトル包絡(電力伝達関数)の平方根をMDCT
係数の振幅包絡の近似とする。この例では量子化部16
よりのLSPパラメータがスペクトラム概形計算部17
へ供給され、そのパワースペクトル包絡が計算される。
この計算は例えば東海大出版、古井著「デイジタル音声
処理」の91頁に述べられている。この計算されたスペ
クトル包絡でMDCT部14よりのMDCT係数が平坦
化部18により割算される。またスペクトラム概形計算
部17で計算されたスペクトラム包絡は重み計算部19
で聴覚特性に応じた重み付け係数を計算し、この重み付
け係数を用いて、平坦化部18で平坦化されたMDCT
係数が、重み付き量子化部21で聴覚重み付き量子化が
なされ、その量子化インデックスIM が出力される。
【0005】
【発明が解決しようとする課題】MDCTはフレーム境
界雑音が出ないという利点がある。しかし、MDCT変
換操作と、その逆変換操作とで、時間領域の領域の信号
が折り返されているため、変換後の正確な包絡を求める
ことは容易でなかった。つまり従来においてはMDCT
前の時間領域信号を線形予測分析し、その予測係数か
ら、MDCT係数の包絡を近似しており、一方、MDC
T操作において時間領域で信号の折り返しが生じてお
り、この時間領域での折り返しが生じた変換係数(MD
CT係数)の包絡を、前記時間領域で折り返しのない信
号の線形予測係数から近似しても、比較的大きな近似誤
差とならざるを得ない。
【0006】この発明の目的は、音響信号の周波数領域
変換係数の包絡を線形予測係数から従来よりも高い精度
で近似することができる方法を提供することにある。
【0007】
【課題を解決するための手段】請求項1の発明によれ
ば、窓関数を掛けたサンプルに対し、重ね合わせ直交変
換により折り返されるべきサンプルを時間軸上で折り返
し、その折り返し処理したものに対し、三角関数にもと
づく直交変換を行って、重ね合わせ直交変換係数を得、
また前記折り返し処理したものを線形予測分析して、パ
ワー包絡形状を求める。
【0008】請求項3の発明によれば、入力された重ね
合わせ直交変換係数に対し、三角関数にもとづく逆直交
変換を行い、その逆直交変換結果に対して、線形予測分
析を行い、その予測係数から、前記入力された重ね合わ
せ直交変換係数のパワー包絡形状を推定する。
【0009】
【発明の実施の形態】図1に請求項1の発明における処
理手順を示し、図3と対応する部分に同一符号を付けて
ある。この発明においても、従来と同様に、入力された
音響信号のサンプル系列はフレーム分割部12で重ね合
わされて、LOT用フレームとされ、その各LOT用フ
レームに対し、窓掛部13で窓関数が掛けられる。この
窓関数としては従来用いられているものと同様のものを
用いることができる。
【0010】この発明においては、窓関数が掛けられた
サンプルに対し、重ね合わせ直交変換により折り返され
るべきサンプルを時間軸上(時間領域)で折り返し、そ
の折り返し処理したサンプルに対し、直交変換部26
で、三角関数にもとづく直交変換を行って、LOT係数
を得る。また折り返し部25で処理されたサンプルに対
し、線形予測分析部27で線形予測分析を行い、その求
めた予測係数を用いて、包絡計算部28で包絡を計算し
て、直交変換部26で得たLOT係数のパワー包絡形状
の近似値とする。
【0011】以下、この発明を、LOTとしてMDCT
を適用した場合につき、更に具体的に説明する。この場
合は図3の場合と同様に入力音響信号サンプル系列か
ら、Nサンプル(1フレーム)づつ重なった2Nサンプ
ルをLOT用フレームとし、その各2Nサンプルに対し
て窓関数をかける。次に折り返し部25で時間軸上の折
り返し処理を行うが、MDCTにより折り返されるべき
サンプルを以下により求める。即ち窓関数がかけられた
系列をx(n)とすると、このx(n)は下記に定義さ
れるMDCTを適用するとN点の係数Y(k)が得られ
る。
【0012】 Y(k) =Σi=0 2N-1 x(i)cos{π(2i+1+N)(2k+1)/(4N)}…(2) このMDCTの変換関数、つまり cos{π(2i+1+
N)(2k+1)/(4N)}は例えばN=32とする
と、k=0、k=1、k=2、k=31のそれぞれにつ
いて、図4A,B,C,Dに示すようになる。これらの
曲線の前半(0〜N,i/N=0〜1)ではN/2(i
/N=0.5)を中心とする奇対称関数であり、後半
(N〜2N,i/N=1〜2)では3N/2(i/N=
1.5)を中心に偶対称関数であり、MDCTによる時
間領域でのサンプルは、i/N=0〜0.5、i/N=
1.5〜2とそれぞれ乗算されるものである。そしてM
DCTは(2)式で示したようにx(i)との図4の関
数との積和演算であるから、各フレームの先頭からN/
2(i/N=0〜0.5)の長さのサンプルx(i),
(i=0,…,N/2−1)を時間的に反転した上で次
のN/2の長さのサンプルx(i),(i=N+N/
2,…,2N−1;i/N=0.5〜1)から引き、ま
たフレームの最後のN/nの長さのサンプルx(i),
(i=N+N/2,…,2N−1:i/N=1.5〜
2)を時間的に反転した上でその直前のN/2の長さの
サンプルx(i),(i=N,…,N+N/2−1;i
/N=1,…,1.5)に加えることにより、折り返し
部25の処理を行うことができる。
【0013】つまり折り返し部25の折り返し処理は次
式で表わせる。 y(i) =x(N/2 +i)−x(N/2 −1−i),(i=
0,…,N/2 −1) y(i) =x(N/2 +i)+x(5N/2−1−i),(i=N/
2 ,…,N−1) この折り返し処理結果y(i)に対して、直交変換部2
6で下記のN点のDCT(離散コサイン変換)を行う。
この結果は通常のMDCT係数と同一のものとなる。
【0014】 v(k) =Σi=0 N-1 y(i)cos{π(2i+1+2N)(2k+1)/(4N)}…(4) この実施例では折り返し処理結果y(i)に対して、線
形予測分析部27で線形予測分析を行なって、P次の予
測係数α1 ,…,αP を求めて、MDCT係数v(k)
の包絡を推定する。図3に示したように、予測係数
α1 ,…,αP をLSPパラメータに変換し、量子化し
た後に、包絡を計算する。
【0015】直交変換部26ではその変換処理において
時間領域での折り返しは生じない。従って、線形予測分
析部27より得た予測係数を用いてそのパワースペクト
ル包絡を求めると、直交変換部26の変換結果、つまり
LOT係数の包絡をよく近似したものが得られる。図3
中の重み付き量子化部21で比較的粗く量子化を行い、
その量子化誤差を求め、その量子化誤差を量子化すると
いうように複数段階にわたって行うことがある。その場
合は量子化部21の量子化結果を逆量子化し、それを逆
平坦化し、その逆平坦化された復号MDCT係数と、M
DCT部14のMDCT係数との差を求め、その差分M
DCT係数を量子化する。この量子化のために差分MD
CTの包絡を求めるには、従来の手法からすると、その
差分MDCTに対し逆MDCTを行って時間領域に戻
し、その戻された時間領域信号を線形予測分析して、パ
ワースペクトル包絡を求めることになる。この逆MDC
Tにおいて、時間領域での折り返しが生じるため、先の
場合と同様に、包絡の近似精度はあまりよくならない。
【0016】請求項3の発明によればこのような問題を
解決できる。請求項3の発明の実施例を図2に示す。入
力端子31から、音響信号のMDCT係数v(i)′、
例えば前記差分MDCT係数を逆DCT(逆離散コサイ
ン変換)部32を入力し、逆DCTを行う。つまり下記
の演算を行う。 z(i) =Σk=0 N-1 v′(k)cos{π(2i+1+2N)(2k+1)/(4N)}…(5) この逆DCTにより時間領域信号とされたものは入力
v′(i)を直接逆MDCTしたものから見ると折り返
し処理を行なった波形、つまり図1中の折り返し部25
の処理結果の波形と同一となっている。従って、この逆
DCTされた信号に対して線形予測分析部33で線形予
測分析を行い、その予測係数のパワースペクトルに包絡
を包絡計算部34で求めて、入力MDCT係数v′
(i)のパワー包絡の近似を得る。なお、逆直交変換部
32の出力に対して、DCTを行えば入力端子31の入
力MDCT係数となる。
【0017】上述においては、この発明をMDCT、つ
まりDCTを基礎としたLOTについて適用したが、D
ST(離散サイン変換)やDFTなどの一般の直交変換
を基礎とするLOTにも共通に利用できる。
【0018】
【発明の効果】この発明によれば、時間領域での重ね合
わせによるフレーム境界での連続性を維持するというL
OTの特徴を生かしながら、LOT係数の包絡を精度よ
く求めることができ、符号化に適用することにより量子
化歪を小さくすることができる。またLOT係数を多段
で量子化する場合に、前段で量子化されたLOT係数の
誤差の包絡を精度よく推定することができる。
【図面の簡単な説明】
【図1】請求項1の発明の実施例の処理手順を示す図。
【図2】請求項3の発明の実施例の処理手順を示す図。
【図3】従来の音響信号変換符号化法の処理手順を示す
図。
【図4】MDCTの変換係数の例を示す図。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 三樹 聡 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 池田 和永 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 複数サンプルからなるフレーム単位の入
    力音響信号の重ね合わせ直交変換係数を求めると共に、
    その変換係数のパワー包絡形状を推定する方法におい
    て、 入力音響信号に前のフレームと重複させて、フレーム更
    新の長さの整数倍の窓関数をかける第1の処理と、 上記第1の処理結果に対して、上記重ね合わせ直交変換
    により折り返されるべきサンプルを時間軸上で折り返す
    第2の処理と、 その第2の処理の結果に対し三角関数にもとづく直交変
    換を行って上記重ね合わせ直交変換係数を得る第3の処
    理と、 上記第2の処理の結果を線形予測分析して、上記パワー
    包絡形状を求める第4の処理と、 を有することを特徴とする音響信号の周波数領域変換係
    数の包絡推定方法。
  2. 【請求項2】 上記第2の処理は、フレームの更新の長
    さ(N)の2倍の窓関数をかけてx(i),(i=0,
    …,N−1)を作成し、 上記第2の処理はN/2の長さのサンプルx(i),
    (i=0,…,N/2−1)を時間的に反転した上でx
    (i),(i=N/2,…,N−1)のサンプルから引
    き、N/2の長さのサンプルx(i),(i=N+N/
    2,…,2N−1)を時間的に反転した上でx(i),
    (i=N,…,N+N/2−1)のサンプルに加えるこ
    とでN点のy(i),(i=0,…,N−1)を作成す
    る処理であり、 上記第3の処理は離散的余弦変換であることを特徴とす
    る請求項1記載の音響信号の周波数領域変換係数の包絡
    推定方法。
  3. 【請求項3】 音響信号の重ね合わせ直交変換係数が入
    力され、その重ね合わせ直交変換係数のパワーの包絡形
    状を推定する方法において、 上記重ね合わせ直交変換係数に対して、三角関数にもと
    づく逆直交変換を行う第1の処理と、 その第1の処理の結果に対して、線形予測分析して上記
    パワーの包絡形状を推定する第2の処理と、 を有することを特徴とする音響信号の周波数領域変換係
    数の包絡推定方法。
JP19037596A 1996-07-19 1996-07-19 音響信号の周波数領域変換係数の包絡推定方法 Expired - Lifetime JP3468335B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19037596A JP3468335B2 (ja) 1996-07-19 1996-07-19 音響信号の周波数領域変換係数の包絡推定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19037596A JP3468335B2 (ja) 1996-07-19 1996-07-19 音響信号の周波数領域変換係数の包絡推定方法

Publications (2)

Publication Number Publication Date
JPH1039900A true JPH1039900A (ja) 1998-02-13
JP3468335B2 JP3468335B2 (ja) 2003-11-17

Family

ID=16257139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19037596A Expired - Lifetime JP3468335B2 (ja) 1996-07-19 1996-07-19 音響信号の周波数領域変換係数の包絡推定方法

Country Status (1)

Country Link
JP (1) JP3468335B2 (ja)

Also Published As

Publication number Publication date
JP3468335B2 (ja) 2003-11-17

Similar Documents

Publication Publication Date Title
CN1838238B (zh) 一种用于增强信源解码器的设备
JP3528258B2 (ja) 符号化音声信号の復号化方法及び装置
US5787387A (en) Harmonic adaptive speech coding method and system
JP4937753B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP3483958B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JPH10307599A (ja) スプラインを使用する波形補間音声コーディング
JPS6035799A (ja) 人間の音声エンコード装置及び方法
US20070016417A1 (en) Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data
JPH10319996A (ja) 雑音の効率的分解と波形補間における周期信号波形
JP3186007B2 (ja) 変換符号化方法、復号化方法
JP3087814B2 (ja) 音響信号変換符号化装置および復号化装置
JPH07199997A (ja) 音声信号の処理システムにおける音声信号の処理方法およびその処理における処理時間の短縮方法
JP3353266B2 (ja) 音響信号変換符号化方法
JP3468335B2 (ja) 音響信号の周波数領域変換係数の包絡推定方法
JP4645869B2 (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP4274614B2 (ja) オーディオ信号復号方法
US20220148602A1 (en) Methods for phase ecu f0 interpolation split and related controller
JP3186013B2 (ja) 音響信号変換符号化方法及びその復号化方法
JP3616307B2 (ja) 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体
JPH0651800A (ja) データ数変換方法
JP3472974B2 (ja) 音響信号符号化方法および音響信号復号化方法
JP3186020B2 (ja) 音響信号変換復号化方法
JP4618823B2 (ja) 信号符号化装置及び方法
JP3384523B2 (ja) 音響信号処理方法
US12002477B2 (en) Methods for phase ECU F0 interpolation split and related controller

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070905

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080905

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080905

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090905

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090905

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100905

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100905

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110905

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120905

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130905

Year of fee payment: 10

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term