JPH03139922A - ディジタル音声データの高能率符号化方法及びディジタル音声データの復号化装置 - Google Patents

ディジタル音声データの高能率符号化方法及びディジタル音声データの復号化装置

Info

Publication number
JPH03139922A
JPH03139922A JP1278207A JP27820789A JPH03139922A JP H03139922 A JPH03139922 A JP H03139922A JP 1278207 A JP1278207 A JP 1278207A JP 27820789 A JP27820789 A JP 27820789A JP H03139922 A JPH03139922 A JP H03139922A
Authority
JP
Japan
Prior art keywords
band
frequency
block
digital data
orthogonal transformation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1278207A
Other languages
English (en)
Other versions
JP2906483B2 (ja
Inventor
Kenzo Akagiri
健三 赤桐
Masayuki Nishiguchi
正之 西口
Yoshihito Fujiwara
藤原 義仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP1278207A priority Critical patent/JP2906483B2/ja
Priority to US07/586,494 priority patent/US5115240A/en
Priority to EP90402642A priority patent/EP0420745B1/en
Priority to DE69023604T priority patent/DE69023604T2/de
Priority to KR1019900015234A priority patent/KR100242864B1/ko
Publication of JPH03139922A publication Critical patent/JPH03139922A/ja
Priority to US08/245,451 priority patent/USRE36559E/en
Application granted granted Critical
Publication of JP2906483B2 publication Critical patent/JP2906483B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、入力ディジタルデータを帯域分割して符号化
するディジタルデータの高能率符号化W〔発明の概要〕 本発明は、入力ディジタルデータを高域程帯域幅が広く
なるように複数の帯域に分割し、帯域毎に複数のサンプ
ルからなるブロックを形成し、各ブロック毎に直交変換
を行い係数データを得るようにしたものであり、また、
直交変換のブロックは各帯域とも同数のサンプルデータ
よりなることにより、人力ディジタルデータを高分解能
で符号化することができるディジタルデータの高能率符
号化装置を提供するものである。
〔従来の技量ネj] オーディオ、音声等の信号の高能率符号化においては、
オーディオ、音声等の入力信号を時間軸又は周波数軸で
複数のチャンネルに分割すると共に、各チャンネル毎の
ビット数を適応的に割当てるヒ゛ットアロケーション(
ヒ゛ソト割当て)による符号化技術がある0例えば、オ
ーディオ信号等の上記ピント割当てによる符号化技術に
は、時間軸上のオー74113号等を複数の周波数帯域
に分割して符号化する帯域分割符号化(サブ・バンド・
コーディング;5BC)や、時間軸の信号を周波数軸上
の信号に変換(直交変換)して複数の周波数帯域に分割
し各帯域毎で適応的に符号化するいわゆる適応変換符号
化(ATC)、或いは、上記SBCといわゆる適応予測
符号化(APC)とを組み合わせ、時間軸の信号を41
)酸分υ1して各帯域信号をヘースバンド(低域)に変
換した後複数次の線形予測分析を行って予測符号化する
いわゆる適応ビア)割当て(APC−AB)等が挙げら
れる。
これらの各種符号化技術の内の例えば上記適応変換符号
化においては、時間軸上のオーディオ信号等を、所定の
時間ブロック毎に高速フーリエ変1*(FFT)或いは
#数的余弦変換(DCT)等の直交変換によって、時間
軸に直交する軸(周波数軸)に変換し、その後複数の帯
域に分割して、これら分割された各帯域のFFT係数、
DCT係数等を適応的なピント割当てによって量子化(
再量子化)している。また、この適応変換符号化では、
例えば、単位時間ブロック内の信号にフーリエ変換処理
を施すと、上記FFT係数、DCT係数等が周波数軸上
に等間隔で得られ、低域側と高域側とで同じ周波数分解
能となっている。
(発明が解決しようとする課題〕 ここで、上記適応変換符号化のフーリエ変換される単位
時間ブロック長を長くした場合、その単4n時間ブロッ
ク内で信号の状態が大きく変化してしまうような場合が
発生する虞れがある0例えば、第5回に示すように、単
位時間ブロンクB内の信号が定常状態でなく、該単位時
間ブロックBの前半部が無信号で後半部に信号(エネル
ギ)が偏っているような信号となる場合がある。このよ
うな時に、tVJ位時間プロンクBのオーディオ信号を
例えば高速フーリエ変換した後、逆高速フーリエ変換す
ることで得られる信号は第6図に示すような信号となる
。すなわち、この第6図においては、高速フーリエ変換
処理を行うことにより、単位時間ブロックBの後半部の
信号によって、本来無信号であった前半部に、ノイズが
目立ってくるようになる。ここで、一般に音に対する人
間の聴覚特性には時間軸方向のマスキング(テンポラル
マスキング)効果すなわち大きな音の前後の小さな音は
マスクされて聞こえなくなるような効果が知られている
。この時、上記大きな音の後のマスキング効果は長時間
続くが、大きな音の前のマスキング効果は非常に短時間
である。したがって第6図のような場合には、フーリエ
変換される単位時間ブロック長を短くすることが必要と
なってくる。すなわち時間分解能を上げることが必要に
なる。また、一般に低域信号では定常区間が長く、高域
(3号では短いため、このようなことからも高域での時
間分解能を高める必要性がでて(る。
このようにフーリエ変換される単位時間ブロック長を短
くすることは、フーリエ変換による周波数分解能を下げ
ることになる。しかし、人間の聴覚の周波数分析能力(
周波数分解能)は、高域ではさほど高くないが低域では
高いものであるため、この低域でのフーリエ変換による
周波数分解能を確保する必要性から、現実には当該単位
時間ブロック長をあまり短くすることはできない。
そこで、本発明は、上述のような実情に鑑みて提案され
たものであり、低域では高い周波数分解能が得られ、か
つ、定常状態の短い高域では高い時間分解能を得ること
ができるディジタルデータの高能率符号化装置を提供す
ることを目的とするものである。
(課題を解決するための手段〕 本発明のディジタルデータの高能率符号化装置は、上述
の目的を達成するために提案されたものであり、入力デ
ィジタルデータを高域枠帯域幅が広くなるように複数(
n個)の帯域に分割(例えば第1図のフィルタバンク4
による分割)し、分割された帯域毎に複数のサンプルか
らなるブロックを形成し、各帯域のブロック毎に直交変
換を行い(第1図の直交変換回路51〜5.)係□数デ
ー夕を得るようにしたものである。
また、上記直交変換が行われるブロックは、各帯域とも
同数のサンプルデータよりなるものである。
C作用〕 本発明によれば、帯域分割されたデータを直交変換する
。二とで、全帯域における周波数/))解能を晶めるこ
とができるようになる。また、各帯域で同数のサンプル
を直交変換するため、低域の12I波数分解能が高くな
る。
〔実施例〕
以下、本発明を適用した実施例について図面を参照しな
がら説明する。
第1図に実施例のディジタルデータの高能率符号化装置
の概略構成例を示す。
第1図において、本実施例のディジタルデータの高能率
符号化装置は、周波数分割用のフィルタとして例えばQ
 M F (quadraturemirror fi
lter)笠のミラーフィルタで構成されたフィルタバ
ンク4と、例えば高速フーリエ変(負等の直交度IIA
(時間軸を周波数軸に変換)を行う直交変換回路5゜〜
5.と、各周波数帯域毎の割当てビット数を決定する割
当てビット数決定回路6とで構成されている。
ここで、本実施例装置の入力端子lには、例えば、オー
ディオ信号がサンプリング周波数fs=32kl(zで
サンプリングされた0〜1.6 k Hzの人力ディジ
タルデータが供給されており、この入力ディジタルデー
タがフィルタバンク4に送られる。
該フィルタバンク4は、上記入力ディジタルデータを高
域程帯域幅が広くなるように複数(n個、本実施例では
n=5としている)の帯域に分υ1しており、高域程帯
域幅が広くなるように分割されている。例えば0〜1 
kHz (CH1)、 1〜2 kHz(CH2)、2
〜4 kHz (CH3)、 4〜8に七(CH4)、
8〜16kl仕(CH3)のように大まかに5チヤンネ
ル(CH)に分割している。このような高域程帯域幅が
広くなるような分割は、いわゆる臨界帯域幅(クリティ
カルバンド)と同様に人間の聴覚特性を考慮した分割手
法である。このクリティカルバンドとは、人間の8覚特
性を考慮したものであり、ある純音の高さを含む同じ強
さの狭帯域バンドノイズによって、当該純音がマスクさ
れるとき、そのノイズのもつ帯域を言うものであり、高
域程その帯域幅が広くなっているものである。更に、直
交変換回路5.〜5Sによって、該分割された5チヤン
ネルの各チャンネル毎に複数のサンプルからなるブロッ
クすなわち単位時間ブロックを形成し、各チャンネルの
単位時間ブロック毎に直交変換(例えば高速フーリエ変
換′S−)を行い、該直交変換による係数データ(例え
ば高速フーリエ変換のFFT係数データ)を得るように
している。この各チャンネルの係数データが上記割当て
ビット数決定回路6に送られ、当該割当てビット数決定
回路6で各チャンネル毎の割当てビット数情報が形成さ
れると共に、上記各チャンネルの係数データの量子化が
行われる。このエンコード出力が出力端子2から出力さ
れ、上記割当てビ、7 ト数情報が出力端子3から出力
されるようになっている。
すなわち、上述のように、高域程バンド幅の広いチャン
ネルのデータから上記単位時間ブロックを構成すること
により、バンド幅の狭い低域チャンネルでは単位時間ブ
ロック内のサンプル数が少なく、バンド幅の広い高域チ
ャンネルでは多くなる。換言すれば、低域のチャンネル
では周波数分解能が低く、高域では高くなる。この時、
各チャンネル毎の各単位時間プロ・ンクを直交変換する
ことで、全帯域のチャンネルで該直交変換による係数デ
ータが周波数軸上に等間隔で得られ、低域側と高域側と
で同じ高い周波数分解能を得ることができる。
ところで、人間の聴覚特性を考慮すると、上記周波数分
解能は、低域では高くしなければならないが、高域では
さほど高くする必要がない。このため、本発明実施例に
おいては、上記直交変換が行われる単位時間ブロックは
、各帯域(チャンネル)とも同数のサンプルデータより
なるもとじている。換言すれば、各チャンネル毎にと記
単位時間ブロンクのブロック長が異なるものとされてお
り、低域のブロック長を長くし、高域のブロック長を短
くしている。すなわち、低域での周波数分解能を高く保
も、高域の周波数分解能は必要以にに高くしていないと
共に、高域の時間分解能を高くするようにしている。
ここで、本実施例装置においては、第2図に示すように
、CHI〜CH5で同数のサンプルのブロンクを直交変
換することにより、各チャンネルで同数の係数データ例
えば64pt(ポイント)の係数データが得られるよう
になる。この場合、各チャンネルのブロック長は、例え
ば、CHIで32m5.CI2で32 mss CH3
で16m5.、CH4で8ms、CH5で4n+sのよ
うになる。更に、上記直交変換として例えば高速フーリ
エ変換を行った場合のY′A算量は、上記第2図の例の
場合には、例えば、CHI及びCH2で641ogz6
4 、CH3で641ogz64X2 、CH4で64
1ogz64X4 、CH5で641ogz64 X 
8となる。また、全帯域での高速フーリエ変換の場合は
、サンプリング周波数f9=32kllzとして、ブロ
ック長32m5T:1024ptの時、JO241og
z1024=1024X10となるつ本実施例において
は、上述のようにすることで、人間の聴覚特性−F重要
な低域では高い周波数分解能が得られ、同時に、第5図
のような高い周波数成分の多い過渡的な信号で必要な高
い時間分解能を満足することができるようになる。更に
、本実施例においては、フィルタバンク、直交変換回路
等は従来より用いられているものを使用できるため、安
価で筒車な構成とすることができ、且つ装置の各回路に
おける遅延時間を短くすることができる。
ここで、上記フィルタバンク4の具体的構成を第3図に
示す。この第3図において、上記入力フィルタバンク4
の入力端子40には、例えばサンプリング周波数rs=
32kHz、0−16kHzの入ツノディジクルデータ
が供給されている。この入力ディジタルデータは、先ず
QMF41に供給される。該QMF41では、上記O〜
16kHzの入力ディジタルデータが2分割されて、0
〜8kHzと8〜16 k Hzの2つの出力が得られ
、上記8〜16に七の出力は低域変換回路45.に送ら
れる。
この低域変換回路45.では、上記8〜16kHzを更
にベースバンドにダウンサンプリングして0〜8kHz
のデータが得られ、出力端子49.から出力されるよう
になっている。また、該QMz1のO〜8 k Hzの
出力は、QMF42に伝送される。該QMF42でも2
分割が行われることで、0〜4k)Izと4〜8 k 
Hzの2つの出力が得られ、4〜8kHzの出力は低域
変換回路45.に、0〜4に七の出力はQMF43に伝
送され、該低域変換回路45.からはベースバンドに変
換された0kHz〜4kHzのデータが得られ、出力端
子494から出力されるようになっている。以下、QM
F43からは0〜2 k Hzと2〜4kllzが、Q
MF44からはO〜】k七と1kHz〜2kl仕が得ら
れ、以下同様に低域変換回路・15.〜45+で低域変
換処理が行われて、各出力が出力端子49.〜491か
ら出力される。これら各出力が上rq(5C+II〜C
H5として上記直交変換回路5.〜5.に送られている
。なお、上記低域変換回路451は省略できる。
第4図に復号化装置の構成を示す。この第4図において
、入力端子22には上記エンコード出力が供給され、入
力端子23には上記割当てビット数情報が供給されてい
る。これらのデータは、チャンネル情報発生回路26に
伝送される。当該チャンネル情報発生回路26では、」
−記エンコード出力のデータが上記割当てビット数↑n
報に基づいて各チャンネルの係数データに復元される。
この復元された係数データは、それぞれ逆直交変換回路
25.〜25.に伝送される。各逆直交変換回路25.
〜25.では、上記直交変換回路5.〜5、とは逆の処
理が行われることで、周波数軸が時間軸に変換されたデ
ータが得られる。この時間軸の各チャンネルのデータは
、合成フィルタ24によって復号化された後、出力端子
21からデコーダ出力として出力される。
なお、第1図のυl当てビット数決定回路6における各
チャンネル毎の割当てビット情報を形成する際には、例
えば、信号の許容可能なノイズレベルを設定し、この許
容ノイズレベルの設定の際にはマスキング効果を考慮し
て、上記高い周波数のバンド枠間−のエネルギに対する
許容ノイズレベルを高く設定するようにすることで、各
バンド毎の割当てピント数を決定することができる。こ
こで、上記マスキング効果には、時間軸上の信号に対す
るマスキング効果と周波数軸上の信号に対するマスキン
グ効果とがある。すなわち、該周波数軸のマスキング効
果により、マスキングされる部分にノイズがあったとし
ても、このノイズは聞こえないことになる。このため、
実際のオーディオ信号では、該周波数軸でマスキングさ
れる部分内のノイズは許容可能なノイズとされる。した
がって、オ・−ディオデータ等の量子化の際には、該許
容ノイズレベル分の割当てピント数を減らずことができ
るようになる。
本発明のディジタルデータの高能率符号化装置において
は、入力ディジタルデータを高域程帯域幅が広くなるよ
うに複数の帯域に分割し、帯域毎に複数のサンプルから
なるブロックを形成し、各ブロック毎に直交変換を行い
係数データを得るようにすることにより、高い周波数分
解能で符号化を行うことができるようになる。また、本
発明においては、直交変換のブロックは各帯域とも同数
のサンプルデータよりなることにより、低い周波数帯域
で必要な高い周波数分解能を得ることができると共に、
高い周波数成分の多い過渡的な信号で必要な高い時間分
解能をも満足させることができる。
したがって、人間の聴寛特性に応じた効率的な符号化を
行うことが可能となる。更に、本発明を実現するための
構成は、従来より用いられているものを使用できるため
、安価で簡単な構成とすることができる。
〔発明の効果]
【図面の簡単な説明】
第1図は本発明実施例の符号化装置の概略構成を示すブ
ロック回路図、第2図はチャンネル及びブロックを示す
図、第3図はフィルタバンクの一興体例を示すブロック
回路図、第4図は復号化装置の概略構成を示すブロック
回路図、第5図は高速フーリエ変換前の波形図、第6図
は高速フーリエ変換に伴うノイズの発生した波形図であ
る。 4・・・・・・・・・・フィルタバンク51〜5.・・
直交変換回路 6・・・・・・・・・・割当てピント数決定回路高速フ
ーリエ変刊り白の近汗吟図 第5図

Claims (2)

    【特許請求の範囲】
  1. (1)入力ディジタルデータを高域程帯域幅が広くなる
    ように複数の帯域に分割し、分割された帯域毎に複数の
    サンプルからなるブロックを形成し、各帯域のブロック
    毎に直交変換を行い係数データを得るようにしたことを
    特徴とするディジタルデータの高能率符号化装置。
  2. (2)上記直交変換が行われるブロックは、各帯域とも
    同数のサンプルデータよりなることを特徴とする請求項
    (1)記載のディジタルデータの高能率符号化装置。
JP1278207A 1989-09-26 1989-10-25 ディジタル音声データの高能率符号化方法及びディジタル音声データの復号化装置 Expired - Lifetime JP2906483B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP1278207A JP2906483B2 (ja) 1989-10-25 1989-10-25 ディジタル音声データの高能率符号化方法及びディジタル音声データの復号化装置
US07/586,494 US5115240A (en) 1989-09-26 1990-09-21 Method and apparatus for encoding voice signals divided into a plurality of frequency bands
EP90402642A EP0420745B1 (en) 1989-09-26 1990-09-25 Digital signal encoding apparatus
DE69023604T DE69023604T2 (de) 1989-09-26 1990-09-25 Digitalsignalkodiergerät.
KR1019900015234A KR100242864B1 (ko) 1989-09-26 1990-09-26 디지탈 신호 부호화 장치 및 방법
US08/245,451 USRE36559E (en) 1989-09-26 1994-05-18 Method and apparatus for encoding audio signals divided into a plurality of frequency bands

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1278207A JP2906483B2 (ja) 1989-10-25 1989-10-25 ディジタル音声データの高能率符号化方法及びディジタル音声データの復号化装置

Publications (2)

Publication Number Publication Date
JPH03139922A true JPH03139922A (ja) 1991-06-14
JP2906483B2 JP2906483B2 (ja) 1999-06-21

Family

ID=17594090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1278207A Expired - Lifetime JP2906483B2 (ja) 1989-09-26 1989-10-25 ディジタル音声データの高能率符号化方法及びディジタル音声データの復号化装置

Country Status (1)

Country Link
JP (1) JP2906483B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994028633A1 (fr) * 1993-05-31 1994-12-08 Sony Corporation Appareil et procede de codage ou decodage de signaux, et support d'enregistrement
US5765126A (en) * 1993-06-30 1998-06-09 Sony Corporation Method and apparatus for variable length encoding of separated tone and noise characteristic components of an acoustic signal
US5832424A (en) * 1993-09-28 1998-11-03 Sony Corporation Speech or audio encoding of variable frequency tonal components and non-tonal components

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994028633A1 (fr) * 1993-05-31 1994-12-08 Sony Corporation Appareil et procede de codage ou decodage de signaux, et support d'enregistrement
US5717821A (en) * 1993-05-31 1998-02-10 Sony Corporation Method, apparatus and recording medium for coding of separated tone and noise characteristic spectral components of an acoustic sibnal
US5765126A (en) * 1993-06-30 1998-06-09 Sony Corporation Method and apparatus for variable length encoding of separated tone and noise characteristic components of an acoustic signal
US5832424A (en) * 1993-09-28 1998-11-03 Sony Corporation Speech or audio encoding of variable frequency tonal components and non-tonal components

Also Published As

Publication number Publication date
JP2906483B2 (ja) 1999-06-21

Similar Documents

Publication Publication Date Title
US4972484A (en) Method of transmitting or storing masked sub-band coded audio signals
JP3343962B2 (ja) 高能率符号化方法及び装置
US5634082A (en) High efficiency audio coding device and method therefore
JP3278900B2 (ja) データ符号化装置及び方法
KR970007663B1 (ko) 신호 양자화 장치 및 방법
JPS61112433A (ja) 周波数領域音声符号化方法および装置
JP3186292B2 (ja) 高能率符号化方法及び装置
JPH0435123A (ja) ディジタル信号符号化装置
US6415251B1 (en) Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one
JP3765622B2 (ja) オーディオ符号化復号化システム
JP3277682B2 (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
JP2001343997A (ja) デジタル音響信号符号化装置、方法及び記録媒体
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
Johnston et al. AT&T perceptual audio coding (PAC)
JP3557674B2 (ja) 高能率符号化方法及び装置
KR100303580B1 (ko) 송신기,엔코딩장치및송신방법
JP2776300B2 (ja) 音声信号処理回路
JPH06242797A (ja) 変換符号化装置のブロックサイズ決定法
JPH03139922A (ja) ディジタル音声データの高能率符号化方法及びディジタル音声データの復号化装置
Fielder et al. AC-2: A family of low complexity transform-based music coders
JPH03263925A (ja) デイジタルデータの高能率符号化方法
JP2006146247A (ja) オーディオ復号装置
JP3336619B2 (ja) 信号処理装置
JP3751225B2 (ja) オーディオ帯域拡張装置
US6064698A (en) Method and apparatus for coding

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080402

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090402

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100402

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100402

Year of fee payment: 11