JP2001343997A - デジタル音響信号符号化装置、方法及び記録媒体 - Google Patents

デジタル音響信号符号化装置、方法及び記録媒体

Info

Publication number
JP2001343997A
JP2001343997A JP2000160999A JP2000160999A JP2001343997A JP 2001343997 A JP2001343997 A JP 2001343997A JP 2000160999 A JP2000160999 A JP 2000160999A JP 2000160999 A JP2000160999 A JP 2000160999A JP 2001343997 A JP2001343997 A JP 2001343997A
Authority
JP
Japan
Prior art keywords
value
audio signal
absolute
digital audio
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000160999A
Other languages
English (en)
Other versions
JP4021124B2 (ja
Inventor
Sadafumi Araki
禎史 荒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000160999A priority Critical patent/JP4021124B2/ja
Priority to US09/865,496 priority patent/US6772111B2/en
Publication of JP2001343997A publication Critical patent/JP2001343997A/ja
Application granted granted Critical
Publication of JP4021124B2 publication Critical patent/JP4021124B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】入力音響データに応じた絶対可聴閾値の設定を
可能とすることにより音質を改善したデジタル音響信号
符号化装置、方法及び記録媒体を提供することを目的と
する。 【解決手段】 デジタル音響信号に所定の処理を施して
当該音響信号を複数の帯域に分割し、人間の絶対可聴閾
値を用いて各分割帯域での許容誤差強度を算出して符号
化ビットの割り当てを行うデジタル音響信号符号化装置
において、フレーム毎の入力音響信号を周波数領域に変
換した際の周波数領域における値の分布に基づいて、適
応的に絶対可聴閾値を変動させる変動手段を設ける。そ
の変動手段は、周波数領域での値の強度の対数値を表す
グラフに直線を配置し、前記強度の対数値を表す曲線と
当該直線とに挟まれた部分の面積が所定の値より大きい
場合は絶対可聴閾値を高く、小さい場合は絶対可聴閾値
を低く、それぞれ設定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はデジタル音響信号符
号化方法、装置及び記録媒体に関し、特に例えばDV
D、デジタル放送等に利用するデジタル音響信号の圧縮
・符号化技術に関する。
【0002】
【従来の技術】従来より、デジタル音響信号の高品質圧
縮・符号化においては、人間の聴覚心理特性が利用され
る。その特性は、小さな音が大きな音によってマスキン
グされて聴こえなくなるというものである。即ち、ある
周波数で大きな音が発生すると、その近傍の周波数の小
さな音はマスクされて人間の耳には感知されなくなる。
ここで、マスクされて聴こえなくなる限界の強度をマス
キング閾値という。一方、人間の耳はマスキングとは無
関係に、4kHz付近の音に対して最も感度が良く、そ
れより上下の帯域になればなるほど次第に感度が悪くな
っていくという性質もある。この性質は、静寂な状況で
音を感知しうる限界の強度として表され、これを絶対可
聴閾値という。
【0003】図15によりこれらを説明する。太い実線
が音響信号の強度分布、点線がこの音響信号に対するマ
スキング閾値、そして、細い実線が絶対可聴閾値を、そ
れぞれ表す。すなわち、人間の耳には、点線及び細い実
線よりも大きな強度の音のみ感知できる。従って、太い
実線の中で、点線及び細い実線よりも大きな部分の情報
のみを取り出しても、聴覚的には元の音響信号と同じよ
うに感じられるのである。
【0004】このことは、符号化においては図15の斜
線で示した部分のみに符号化ビットを割り当てることと
等価である。ただし、ここでのビット割り当ては、音響
信号の全帯域を複数の小帯域に分割して、その分割帯域
の単位で行っている。各斜線領域の横幅は、その分割帯
域幅に相当する。
【0005】各分割帯域で、斜線領域の下限の強度以下
の音は耳に聴こえない。よって、原音と符号/復号化音
の強度の誤差がこの下限を超えなければ両者の差を感知
できない。その意味で、この下限の強度を許容誤差強度
と呼ぶ。音響信号を量子化して圧縮するに際し、原音に
対する符号/復号化音の量子化誤差強度が許容誤差強度
以下になるように量子化すれば、原音の音質を損なわず
に音響信号を圧縮できる。
【0006】以上より、図15の斜線領域のみに符号化
ビットを割り当てるということは、各分割帯域での量子
化誤差強度がちょうど許容誤差強度になるように量子化
することと等価である。
【0007】さて、音響信号の符号化方式としては、M
PEG AudioやDolbyDigital等があ
るが、いずれもここで説明したような性質を用いてい
る。その中で、現在最も符号化効率がよいとされている
のが、ISO/IEC13818−7にて標準化されて
いるMPEG−2 Audio AAC(Advanc
ed Audio Coding)という方式である。
【0008】図16にAACにおける符号化装置の基本
的なブロック図を示す。聴覚心理モデル部1にて時間軸
に沿ってフレーム化された入力音響信号の各分割帯域毎
に許容誤差強度を算出する。一方、同じくフレーム化さ
れた入力信号に対して、ゲインコントロール2ではゲイ
ンコントロール、フィルタバンク3のフィルタバンクで
はMDCT(Modified Discrete C
osine Transform)による周波数領域へ
の変換、TNS4ではTNS(Temporal No
ise Shaping)、インテンシティ/カップリ
ングステレオ部5ではインテンシティ/カップリングス
テレオ、予測器6では予測符号化、M/Sステレオ部7
ではM/Sステレオ(Middle Side Ste
reo)の処理を、それぞれ行う。その後、ブロック8
で正規化係数を決定し、量子化器9でその正規化係数を
基に音響信号を量子化する。この正規化係数は図15の
許容誤差強度に対応するもので、各分割帯域毎に定めら
れる。
【0009】量子化後、ノイズレスコーディング部10
にて予め定められたハフマン符号表に基づいて、正規化
係数と量子化値にそれぞれハフマン符号を与えてノイズ
レスコーディングを行い、最後にマルチプレクサ11に
て符号ビットストリームを形成する。
【0010】さて、フィルタバンク3でのMDCTと
は、図17に示すように時間軸に沿って変換領域を50
%ずつオーバーラップさせながらDCTを施すものであ
る。これによって、各変換領域の境界部での歪みの発生
が抑えられる。また、生成されるMDCT係数の数は変
換領域のサンプル数の半分である。AACでは入力音響
信号フレームに対して、2048サンプルの長い変換領
域(ロングブロック)、または、各256サンプルの8
個の短い変換領域(ショートブロック)のいずれかを適
用する。MDCT係数の数はロングの場合は1024、
ショートでは128となる。ショートブロックは常に8
ブロックを連続して適用することにより、ロングブロッ
クを用いた場合とMDCT係数の数を合わせるようにな
っている。一般に、図18のように信号波形の変化の少
ない定常的な部分にはロングブロックを、図19のよう
に変化の激しいアタック部にはショートブロックを用い
る。
【0011】この両者の使い分けは重要で、もし図19
のような信号にロングブロックを適用すると、本来のア
タックの前にプリエコーとよばれるノイズが発生する。
また、図18に示す部分にショートブロックを適用する
と、周波数領域での解像度の不足から適切なビット割り
当てがなされずに符号化効率が低下し、やはりノイズが
発生する。
【0012】さて、以上のように、符号化に際しては、
分割帯域毎の許容誤差の算出やロング/ショートブロッ
クの適切な判定を行うことが重要になる。これらを行う
のが図16の聴覚心理モデル部1である。ISO/IE
C13818−7では、聴覚心理モデル部1における、
各着目フレームにおける分割帯域毎の許容誤差強度の算
出方法や、ロング/ショートの判定方法の一例が示され
ている。その処理の概要を以下に説明する(この処理の
詳細については、ISO/IEC13838−7のB.
2.1.4節(p.93)を参照することができる)。
【0013】ステップ1) 音響信号の再構築 ロングブロック用に1024サンプル(ショートブロッ
ク用には128サンプル)を新たに読み込み、前フレー
ムにて既に読み込んでいる1024サンプル(128サ
ンプル)と合わせて2048サンプル(256サンプ
ル)の信号系列を再構築する。
【0014】ステップ2) ハン窓の掛け合わせとFF
T ステップ1にて構築した2048サンプル(256サン
プル)の音響信号にハン窓を掛け合わせ、さらに、FF
T(Fast Fourier Transform)
を施して1024個(128個)のFFT係数を算出す
る。
【0015】ステップ3) FFT係数の予測値の計算 先行する2フレーム分のFFT係数の実数部と虚数部か
ら、現在着目しているフレームのFFT係数の実数部と
虚数部を予測し、それぞれ1024個(128個)の予
測値を算出する。
【0016】ステップ4) 非予測可能性値の計算 ステップ2にて算出した各FFT係数の実数部と虚数部
と、ステップ3にて算出した各FFT係数の実数部と虚
数部の予測値から、それぞれの非予測可能性値を算出す
る。ここで、非予測可能性値は0から1の間の値をと
り、0に近いほど音響信号の純音性が強く、1に近いほ
ど雑音性が強いことを示す。
【0017】ステップ5) 各分割帯域での音響信号の
強度と非予測可能性値の計算 ここでの分割帯域は、図15で示したものに相当する。
各分割帯域毎に、ステップ2にて算出した各FFT係数
を基にして音響信号の強度を算出する。さらに、ステッ
プ4にて算出した非予測可能性値を強度で重み付けし
て、各分割帯域毎の非予測可能性値を算出する。
【0018】ステップ6) 広がり関数を掛けた強度と
非予測可能性値の畳み込み 各分割帯域における他の分割帯域の音響信号強度、及
び、非予測可能性値の影響を広がり関数で求め、それぞ
れを畳み込んで正規化する。
【0019】ステップ7) 純音性指標の計算 各分割帯域bにおいて、ステップ6にて算出した畳み込
み非予測可能性値(cb(b))を基に、[数1]に基
づいて純音性指標(tb(b))を算出する。
【数1】 さらに、純音性指標を0から1の間に制限する。ここ
で、指標が1に近いほど音響信号の純音性が強く、0に
近いほど雑音性が強いことを示す。
【0020】ステップ8) S/N比の計算 各分割帯域において、ステップ7にて算出した純音性指
標を基に、S/N比を算出する。ここで、一般に雑音成
分のほうが純音成分よりもマスキング効果が大きいとい
う性質を利用する。
【0021】ステップ9) 強度比の計算 各分割帯域において、ステップ8にて算出したS/N比
を基に、畳み込み音響信号強度とマスキング閾値の比を
算出する。
【0022】ステップ10) 許容誤差強度の計算 各分割帯域において、ステップ6にて算出した畳み込み
音響信号強度と、ステップ9にて算出した音響信号強度
とマスキング閾値の比を基に、マスキング閾値を算出す
る。
【0023】ステップ11) プリエコー調整と絶対可
聴閾値の考慮 各分割帯域において、ステップ10にて算出したマスキ
ング閾値を、前ブロックでの許容誤差強度を用いてプリ
エコー調整する。さらに、この調整値と絶対可聴閾値の
大きい方の値を、現フレームでの許容誤差強度とする。
【0024】ステップ12) 知覚エントロピーの計算 ロングブロック用とショートブロック用のそれぞれにつ
いて、[数2]で定義される知覚エントロピー(Per
ceptual Entropy(PE))を算出す
る。
【0025】
【数2】 ただし、W(b)は分割帯域bの幅、nb(b)はステ
ップ11にて算出した分割帯域bにおける許容誤差強
度、e(b)はステップ5にて算出した分割帯域bにお
ける音響信号の強度、をそれぞれ示す。ここで、PEは
図15におけるビット割り当て領域(斜線領域)の面積
の総和に対応する。
【0026】 ステップ13) ロング/ショートブロックの決定 ステップ12にて算出したロングブロック用のPEの値
が、予め定められた定数(switch_pe)より大
きい場合は、着目フレームをショートブロックと判定
し、小さい場合はロングブロックと判定する。ここで、
switch_peはアプリケーションに依存して決め
られる値である。
【0027】以上が、ISO/IEC13818−7に
て記載された分割帯域毎の許容誤差強度の算出法とロン
グ/ショートの判定法である。
【0028】
【発明が解決しようとする課題】上記の判定法におい
て、絶対可聴閾値を用いているのはステップ11であ
り、そこでは、各分割帯域においてプリエコー調整され
たマスキング閾値と絶対可聴閾値の大きい方をそこでの
許容誤差強度としている。そして、原音の強度が絶対可
聴閾値より小さい分割帯域では、原音が聴こえないと見
なされ、その帯域には全く符号ビット割り当てられない
か、またはごく少ないビットしか割り当てられない。
【0029】さて、原理的には、絶対可聴閾値は不変で
あるべきものであり、入力音源によってその値が上下す
るものではない。ISO/IEC13818−7におい
ても絶対可聴閾値には定められたテーブル値を使うこと
が推奨されている。
【0030】ところが、絶対可聴閾値を固定して実際に
上記の手順で許容誤差強度を求め、それに基づいてビッ
ト割り当てと符号化を行うと、満足な音質が得られない
場合がある。例えば、女声ボーカル曲の場合は図20の
ような周波数分布となるが、この音源に対しては同図内
に示すような絶対可聴閾値を用いると良好な音質が得ら
れる。しかし、同じ閾値を図21に示すオーケストラ音
源に適用すると、耳障りなノイズが聴こえてしまう。そ
れは、オーケストラ音源では10kHz−15kHz付
近の音が重要であるが、図21の闘値を用いるとその付
近の音は全て絶対可聴閾値以下であると判断され、十分
なビット割り当てがなされないからである。そこで、図
22のように、絶対可聴閾値を全体に低めると、今度は
10kHz−15kHz付近の音は閾値以上となり、十
分に符号化ビットが割り当てられて音質が向上する。
【0031】しかし、一方、図20の女声ボーカル音源
に対して図22の閾値を適用して図23のようにする
と、逆に音質が劣化する。女声ボーカルの場合は10k
Hz以下の音が重要であるが、図23の場合は12kH
z−15kHz付近の音にもビット割り当てがなされる
ようになり、10kHz以下に割り当てられる分が相対
的に少なくなってしまうからである。
【0032】このように、絶対可聴閾値を固定値のまま
で考える従来方式では、必ずしも十分な音質が得られな
いという問題点があった。
【0033】また、聴覚心理モデルに基づくマスキング
効果を利用して音響信号を符号化することに関する方法
は、特開平5−248972、特開平7−46137、
特開平9−101799のようにいくつか提案されてい
るが、絶対可聴閾値の設定に関してはいずれも示されて
いない。
【0034】本発明は上記の点に鑑みてなされたもので
あり、入力音響データに応じた絶対可聴閾値の設定を可
能とすることにより音質を改善したデジタル音響信号符
号化装置、方法及び記録媒体を提供することを目的とす
る。
【0035】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明は次のように構成することができる。
【0036】請求項1に記載された発明は、デジタル音
響信号に所定の処理を施して当該音響信号を複数の帯域
に分割し、人間の絶対可聴閾値を用いて各分割帯域での
許容誤差強度を算出して符号化ビットの割り当てを行う
デジタル音響信号符号化装置であり、フレーム毎の入力
音響信号を周波数領域に変換した際の周波数領域におけ
る値の分布に基づいて、適応的に絶対可聴閾値を変動さ
せる変動手段を有する。
【0037】請求項2に記載された発明は、デジタル音
響信号を時間軸に沿って入力してフレーム化し、フレー
ム毎にサブバンド分割や周波数領域への変換等の処理を
施し、当該音響信号を複数の帯域に分割し、その分割帯
域毎に符号化ビットを割り当て、割り当てた符号化ビッ
ト数に応じて正規化係数を求め、前記音響信号を当該正
規化係数で量子化することにより、これを圧縮符号化す
るデジタル音響信号符号化装置であり、フレーム毎の入
力音響信号を周波数領域に変換した際の周波数領域にお
ける値の分布に基づいて、適応的に絶対可聴閾値を変動
させる変動手段と、その絶対可聴閾値を用いて前記各分
割帯域での許容誤差強度を算出して符号化ビットの割り
当てを行う手段とを有する。
【0038】このように適応的に絶対可聴閾値を変動さ
せることにより従来技術の問題点が解消され、音質が改
善される。
【0039】請求項3に記載された発明は、請求項1又
は2の記載において、前記変動手段は、フレーム毎の入
力データの周波数領域での値の強度の対数値に基づい
て、絶対可聴閾値を変動させるようにする。これによ
り、絶対可聴閾値の変動が行い易くなる。
【0040】請求項4に記載された発明は、請求項1又
は2の記載において、前記変動手段は、周波数領域での
値の強度の対数値を表すグラフに直線を配置し、前記強
度の対数値を表す曲線と当該直線とに挟まれた部分の面
積に基づいて、絶対可聴閾値を変動させるようにする。
【0041】請求項5に記載された発明は、請求項4の
記載において、前記変動手段において、強度の対数値を
表す曲線と配置した直線とに挟まれた部分の面積が所定
の値より大きい場合は絶対可聴閾値を高く、面積が所定
の値より小さい場合は絶対可聴閾値を低く、それぞれ設
定する。
【0042】これらの発明によって、入力音響信号に応
じて絶対可聴閾値が適切な値となり、音質が改善する。
【0043】請求項6に記載された発明は、請求項5の
記載において、前記変動手段において、配置する直線の
傾き、及び、面積計算の対象となる周波数範囲を予め定
めておき、当該直線の始点を入力信号に応じて変動させ
るようにする。これにより絶対可聴閾値の設定を容易に
行うことができるようになる。
【0044】請求項7に記載された発明は、請求項5の
記載において、前記変動手段において、強度の対数値を
表す曲線の中で、面積計算の対象となる周波数範囲にお
ける最低周波数側の予め定めた最初の数点の中の最大値
を、配置する直線の前記周波数範囲の最低周波数に対す
る値とする。この発明によれば、適切に直線を配置でき
るようになる。
【0045】請求項8に記載の発明は、請求項4ないし
7のうちいずれか1項の記載において、前記変動手段に
おいて、前記フレームを複数の小ブロックに分割し、小
ブロック毎に前記面積を計算する。
【0046】請求項9に記載の発明は、請求項8の記載
において、前記変動手段において、フレーム内の小ブロ
ック毎に算出した強度の対数値を表す曲線と直線とに挟
まれた部分の面積を、フレーム内の全小ブロックに関し
て合計し、その合計値が所定の値より大きい場合は絶対
可聴閾値を高く、合計値が所定の値より小さい場合は絶
対可聴閾値を低く、それぞれ設定するようにする。
【0047】請求項10に記載の発明は、デジタル音響
信号をフレーム化し、フレーム化した音響信号を1つの
長い変換ブロック又は複数の短い変換ブロックのいずれ
かにて変換し、所定の処理を施して当該音響信号を複数
の帯域に分割し、人間の絶対可聴閾値を用いて各分割帯
域での許容誤差強度を算出して符号化ビットの割り当て
を行うデジタル音響信号符号化装置において、周波数領
域での値の強度の対数値を表すグラフに直線を配置し、
長い変換ブロックで変換する場合には、フレーム内の小
ブロック毎に算出した強度の対数値を表す曲線とその直
線とに挟まれた部分の面積をフレーム内の全小ブロック
に関して合計し、その合計値が所定の値より大きい場合
は絶対可聴閾値を高く、合計値が所定の値より小さい場
合は絶対可聴閾値を低く、それぞれ設定し、短い変換ブ
ロックで変換する場合は予め定めた固定の絶対可聴閾値
を用いることにより適応的に絶対可聴閾値を変動させる
変動手段を有する。
【0048】請求項8〜10の発明によれば、フレーム
化した音響信号を1つの長い変換ブロック又は複数の短
い変換ブロックのいずれかにて変換して処理を行うデジ
タル音響信号符号化装置においても、入力音響信号に応
じて適応的に絶対可聴閾値を変動させることができ、音
質が改善される。
【0049】請求項11〜14に記載の発明によれば、
入力音響信号に応じて適応的に絶対可聴閾値を変動させ
ることができるデジタル音響信号符号化方法が提供され
る。また、請求項15〜18に記載の発明によれば、入
力音響信号に応じて適応的に絶対可聴閾値を変動させる
ことができるデジタル音響信号符号化プログラムを記録
した記録媒体が提供される。これらの発明によっても上
記のデジタル音響信号符号化装置と同様の作用効果を得
ることができる。
【0050】
【発明の実施の形態】本発明の第1の実施例について説
明する。第1の実施例におけるデジタル音響信号符号化
装置の構成は図16に示したものと同様とすることがで
きる。第1の実施例におけるデジタル音響信号符号化方
法の処理の基本的な手順は図1に示すフローチャートの
通りであり、その処理は図16の聴覚心理モデル部1で
行われる。
【0051】まず、時間領域の入力音響データをフレー
ム化し、周波数領域の値に変換する(ステップ20)。
次に、周波数領域での強度の対数値を表すグラフに直線
を配置する(ステップ21)。そして、強度の対数値を
表す曲線と配置した直線とに挟まれる部分の面積を求め
(ステップ22)、面積が大きい場合は絶対可聴閾値を
高く、面積が小さい場合は絶対可聴閾値を低く、それぞ
れ設定する(ステップ23)。
【0052】なお、ステップ21で直線を配置する際、
その傾きと周波数領域における範囲は予め定められてお
り、始点は入力データによって変動する。即ち、強度の
対数値を表す曲線の中で、面積計算の対象となる周波数
範囲における最低周波数側の予め定めた最初の数点の中
の最大値を、配置する直線の前記周波数範囲の最低周波
数に対する値とする。
【0053】以上を、具体例によって説明する。入力音
響データを周波数領域に変換し、周波数領域での強度の
対数値を表すグラフに直線を配置した例を図2に示す。
【0054】この直線の傾きは入力データによらず一定
である。また、直線の範囲も予め定められている(図2
では周波数0kHzから12kHzまで)。ここで、強
度の対数値を表す曲線の0kHzから12kHzまでの
範囲の、最低周波数(0kHz)側の例えば最初の3点
が図3のようであるとする。この例では2番目の点が3
個の点の中で最大値(58dB)をとっている。そこ
で、配置する直線の0kHzでの値を、この2番目の値
に等しくする。
【0055】続いて、0kHzから12kHzまでの範
囲において、強度の対数値を表す曲線と配置した直線に
挟まれる部分の面積を計算する。図2の例の場合の面積
を図4に示す。それは図4の塗りつぶしで示した部分で
ある。
【0056】面積の具体的な計算法は、例えば次のよう
にする。周波数fにおける強度の対数値をE
(f)、直線の値をL(f)、面積を計算する周波
数の範囲をFとして、
【0057】
【数3】 を計算する。
【0058】また、ここまでと同様の処理を、別の入力
データに関して行ったものを図5に示す。図4と図5を
比較すると容易に分かるように、図4の方が挟まれた部
分の面積が大きい。そこで、図6、図7にそれぞれ示す
ように、図4のデータに対しては絶対可聴閾値を高く、
また、図5のデータに対しては絶対可聴閾値を低く、そ
れぞれ設定する。
【0059】具体的な絶対可聴閾値の設定法としては、
例えば図8に示すように、面積値が500以上600未
満の場合は推奨テーブル値を用い、600以上700未
満なら推奨テーブル値プラス10dB、700以上なら
推奨テーブル値プラス20dB、また、400以上50
0未満なら推奨テーブル値マイナス10dB、400未
満なら推奨テーブル値マイナス20dB、とする、とい
うような方法が考えられる。
【0060】なお、上記の方法は一例であり、音響信号
の強度の対数値を表す曲線と上記の直線が近ければ絶対
可聴閾値を低くし、近くなければ絶対可聴閾値を高くす
ることができれば他の方法を用いることも可能である。
【0061】このように設定した絶対可聴閾値を用い
て、例えば、従来の技術で説明したISO/IEC13
838−7のステップ11の処理を行う。
【0062】なお、配置する直線の傾きは図に示したも
のに限らず、範囲も上記の0kHzから12kHzまで
に限るものではない。また、直線の最低周波数に対する
値を決めるために参照する強度の対数値を表す曲線の中
の点の個数も、上記の3個に限るものではない。ただ
し、これらは入力データによらず一定である。また、具
体的な面積の計算法は[数3]に限るものではないし、
絶対可聴閾値の設定法も、上記の図8の例に限るもので
はない。挟まれる部分の面積が相対的に大きい場合は絶
対可聴閾値が高く、小さい場合は低くなるような方法で
あれば構わない。上述した如く、時間領域の入力音響デ
ータを周波数領域の値に変換し、周波数領域での強度の
対数値を表すグラフに直線を配置し、強度の対数値を表
す曲線と配置した直線とに挟まれる部分の面積を求め、
面積が大きい場合は絶対可聴閾値を高く、面積が小さい
場合は絶対可聴閾値を低く、それぞれ設定しており、か
つ、直線を配置する際、その傾きと周波数領域における
範囲を予め定めておき、強度の対数値を表す曲線の中
で、面積計算の対象となる周波数範囲における最低周波
数側の予め定めた最初の数点の中の最大値を、配置する
直線の前記周波数範囲の最低周波数に対する値としてい
るので、入力音響データに応じた絶対可聴閾値の設定が
でき、そのため、適切な許容誤差強度の計算とビット割
り当てが実現できるので、符号化音の音質が向上する。
【0063】上記の方法は、絶対可聴閾値を用いる音響
圧縮符号化方式であればAACに限らず適用可能であ
る。
【0064】次に、従来技術で説明したロングブロック
とショートブロックの別を考慮した音響圧縮符号化方法
に上記の第1の実施例で説明した手法を適用するための
技術を第2の実施例で説明する。
【0065】(第2の実施例)第2の実施例における処理
の基本的な手順は図9及び図10に示すフローチャート
の通りである。
【0066】従来技術において説明した分割帯域毎の許
容誤差強度の算出法とロング/ショートの判定法におい
ては、絶対可聴閾値はステップ11で利用されるが、ロ
ング/ショートの判定はステップ13にてなされる。従
って、ステップ11においては、フレームがロングで変
換される場合とショートで変換される湯合の両方を想定
して処理を行う必要がある。即ち、絶対可聴閾値の設定
に関しても、ロングの場合とショートの場合の両方を行
わねばならない。
【0067】そこで、ステップ13の判定後、図9のス
テップ30において、フレームをロングで変換するとし
た場合はステップ31に進み、後述する図10のフロー
チャートの手順に従って求めた絶対可聴閾値を使用して
必要な処理を行う。
【0068】また、フレームをショートで変換すると想
定した場合は、ステップ32に進み、絶対可聴閾値には
予め定められた固定値を用いることにする。
【0069】次に、フレームをロングで変換するとした
場合の絶対可聴閾値を設定する処理を図10のフローチ
ャートを用いて説明する。
【0070】まず、フレーム化された時間領域の入力音
響データを複数の小ブロックに分割する(ステップ4
0)。ここでの分割はISO/IEC13818−7に
て規定された小ブロック、すなわち、図11に示すよう
なブロック長256サンプルでフレーム当たり8個のシ
ョートブロックとする。なお、図11はフレーム化され
た時間領域の入力音響データを連続する8つのショート
ブロックi(i=0,1,2,・・・)に分割する例を
示す図である。この分割については、必ずしもISO/
IEC13818−7にて規定されたショートブロック
の分割法に限るものではない。例えばブロック長512
サンプルでフレーム当たり4個、とする分割もあり得
る。しかし、ISO/IEC13818−7のショート
ブロックに一致させる方が処理が簡略になる。
【0071】次に、分割した小ブロック毎に、入力デー
タを周波数領域の値に変換する(ステップ41)。次
に、周波数領域での強度の対数値を表すグラフに直線を
配置する(ステップ42)。そして、強度の対数値を表
す曲線と配置した直線とに挟まれる部分の面積Siを求
め(ステップ43)、フレーム内の全小ブロックに関し
てSiの合計値Sを算出しSが大きい場合は絶対可聴閾
値を高く、Sが小さい場合は絶対可聴閾値を低く、それ
ぞれ設定する(ステップ44)。なお、ここで設定する
絶対可聴閾値は、あくまでもフレームを1つのロングブ
ロックで変換すると想定した場合の閾値であるから、そ
れは小ブロック毎にではなく、フレーム全体に対して絶
対可聴閾値を設定する。
【0072】直線を配置し、面積を求める具体的な方法
は第1の実施例と同様である。ただし、第2の実施例で
は、入力音響データを複数の小ブロックに分割し、その
小ブロック毎に面積を求める。
【0073】図11の入力音響データに関して、Si
(0≦i≦7)を求めた結果を図12に示す。図12は
各ショートブロックに対する面積、及び面積の合計値を
示す図であり、ショートブロックiに対する面積Si
(0≦i≦7)と、面積Siの合計値Sが示される。面
積の合計値Sは次式により求める。
【0074】
【数4】 具体的な絶対可聴閾値の設定法としては、例えば図13
に示すように、面積の合計値Sが500以上600未満
の場合は推奨テーブル値を用い、600以上700未満
なら推奨テーブル値プラス10dB、700以上なら推
奨テーブル値プラス20dB、また、400以上500
未満なら推奨テーブル値マイナス10dB、400未満
なら推奨テーブル値マイナス20dB、とする、という
ような方法が考えられる。
【0075】このように設定した絶対可聴閾値を用い
て、従来の技術で説明したISO/IEC13838−
7のステップ11の処理を行うのである。
【0076】なお、配置する直線の傾きや面積の計算法
は第1の実施例で示した方法と同様のものに限るもので
はない。絶対可聴閾値の設定法も、上記の図13の例に
限るものではない。挟まれる部分の面積が相対的に大き
い場合は絶対可聴閾値が高く、小さい場合は低くなるよ
うな方法であれば構わない。
【0077】本発明のデジタル音響信号符号化装置の構
成は、図16に示した例に限定されることなく、各々の
構成要件をソフトウェアで構築し、ディスク装置等に記
録しておき、必要に応じてコンピュータにインストール
して本発明の処理を行うことも可能である。更に、構築
されたプログラムをフロッピー(登録商標)ディスク、
メモリカード、CD−ROM等の記録媒体に格納し、こ
のようなデジタル音響信号符号化を用いる場面で汎用的
に使用することも可能である。
【0078】図14は、デジタル音響信号符号化装置と
して使用されるコンピュータの構成例を示す図である。
本コンピュータは、CPU(中央処理装置)101、メ
モリ102、入力装置103、表示装置104、CD−
ROMドライブ105、ハードディスク106、通信装
置107を有する。CPU101は装置の全体を制御す
る。メモリ102はCPU101で処理するデータやプ
ログラムを保持する。入力装置103は音響信号を入力
する装置である。表示装置104はディスプレイ等の装
置である。CD−ROMドライブ105はCD−ROM
等を駆動し、読み書きを行う。ハードディスク106に
は、プログラムや、本発明の処理に関わるデータが格納
される。通信装置107はネットワークとのデータ送受
信をするための装置である。本発明の処理を実行するプ
ログラムは、コンピュータに予めインストールされてい
てもよいし、例えばCD−ROMに格納され、CD−R
OMドライブ105を介してハードディスク106にロ
ードするようにしてもよい。プログラムが起動される
と、所定のプログラム部分がメモリ102に展開され、
処理が実行される。例えば、入力装置103から入力さ
れた音響信号を圧縮したデータがハードディスク106
に出力される。また、そのデータを通信装置107を介
して他のコンピュータ等に配信することもできる。
【0079】本発明は、上記の実施例に限定されること
なく、特許請求の範囲内で種々変更・応用が可能であ
る。
【0080】
【発明の効果】本発明によれば、フレーム化された時間
領域の入力音響データを複数のブロックに分割して小ブ
ロック毎に周波数領域の値に変換し、周波数領域での強
度の対数値を表すグラフに直線を配置し、強度の対数値
を表す曲線と配置した直線とに挟まれる部分の面積を求
め、かつ、直線を配置する際、その傾きと周波数領域に
おける範囲を予め定めておき、強度の対数値を表す曲線
の中で、面積計算の対象となる周波数範囲における最低
周波数側の予め定めた最初の数点の中の最大値を、配置
する直線の前記周波数範囲の最低周波数に対する値と
し、フレーム内の全小ブロックに関する上記面積の合計
値が大きい場合はフレーム全体の絶対可聴閾値を高く、
合計値が小さい場合は絶対可聴閾値を低く、それぞれ設
定しているので、強度変化が大きいフレームにおいて、
その変化に対応したきめ細かい面積算出ができるので音
質改善効果がある。
【0081】また、フレーム化した入力音響データを1
つの長い変換ブロック又は複数の短い変換ブロックのい
ずれかにて変換する方法において、長い変換ブロックで
変換する場合は第2の実施例で説明したようにデータを
小ブロックに分割してから上記の方法を用いて絶対可聴
閾値を設定し、短い変換ブロックで変換する場合は予め
定めた固定の絶対可聴閾値を用いるので、長いブロック
と短いブロックの別を考慮した絶対可聴閾値の設定がで
きるので、さらなる音質改善効果がある。
【図面の簡単な説明】
【図1】第1の実施例における処理の基本的な手順を示
すフローチャートである。
【図2】周波数領域での強度の対数値を表すグラフに直
線を配置した例を示す図である。
【図3】直線を配置する際の始点を定める方法を説明す
るための図である。
【図4】配置した直線と強度の対数値を表す曲線とに挟
まれる部分を示す図である(面積が大きい場合)。
【図5】配置した直線と強度の対数値を表す曲線とに挟
まれる部分を示す図である(面積が小さい場合)。
【図6】絶対可聴閾値を高くする例を示す図である。
【図7】絶対可聴閾値を低くする例を示す図である。
【図8】挟まれる部分の面積に対応した絶対可聴閾値の
設定例を示す図である。
【図9】第2の実施例における処理の基本的な手順を示
すフローチャートである。
【図10】第2の実施例における処理の基本的な手順を
示すフローチャートである。
【図11】フレーム化された時間領域の入力音響データ
を複数の小ブロックに分割する例を示す図である。
【図12】各ショートブロックに対する面積、及び面積
の合計値を示す図である。
【図13】挟まれる部分の面積の合計値に対応した絶対
可聴閾値の設定例を示す図である。
【図14】コンピュータの構成例を示す図である。
【図15】音響信号、マスキング閾値及び絶対可聴閾値
の強度分布を示す図である。
【図16】AAC方式における符号化装置の基本的なブ
ロック図である。
【図17】MDCTの変換領域を示す図である。
【図18】変化の少ない信号波形の場合のMDCTの変
換領域を示す図である。
【図19】変化の激しい信号波形の場合のMDCTの変
換領域を示す図である。
【図20】女声ボーカル音源の場合の周波数分布と絶対
可聴閾値を示す図である。
【図21】オーケストラ音源の場合の周波数分布と絶対
可聴閾値を示す図である。
【図22】オーケストラ音源において絶対可聴閾値を低
くした場合を示す図である。
【図23】女声ボーカル音源において絶対可聴閾値を低
くした場合を示す図である。
【符号の説明】
1 聴覚心理モデル部 2 ゲインコントロール 3 フィルタバンク 4 TNS 5 インテンシティ/カップリングステレオ部 6 予測器 7 M/Sステレオ部 8 正規化係数部 9 量子化器 10 ノイズレスコーディング部 11 マルチプレクサ 101 CPU 102 メモリ 103 入力装置 104 表示装置 105 CD−ROMドライブ 106 ハードディスク 107 通信装置

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 デジタル音響信号に所定の処理を施して
    当該音響信号を複数の帯域に分割し、人間の絶対可聴閾
    値を用いて各分割帯域での許容誤差強度を算出して符号
    化ビットの割り当てを行うデジタル音響信号符号化装置
    において、 フレーム毎の入力音響信号を周波数領域に変換した際の
    周波数領域における値の分布に基づいて、適応的に絶対
    可聴閾値を変動させる変動手段を有するデジタル音響信
    号符号化装置。
  2. 【請求項2】 デジタル音響信号を時間軸に沿って入力
    してフレーム化し、フレーム毎にサブバンド分割や周波
    数領域への変換等の処理を施し、当該音響信号を複数の
    帯域に分割し、その分割帯域毎に符号化ビットを割り当
    て、割り当てた符号化ビット数に応じて正規化係数を求
    め、前記音響信号を当該正規化係数で量子化することに
    より、これを圧縮符号化するデジタル音響信号符号化装
    置において、 フレーム毎の入力音響信号を周波数領域に変換した際の
    周波数領域における値の分布に基づいて、適応的に絶対
    可聴閾値を変動させる変動手段と、 その絶対可聴閾値を用いて前記各分割帯域での許容誤差
    強度を算出して符号化ビットの割り当てを行う手段とを
    有するデジタル音響信号符号化装置。
  3. 【請求項3】 前記変動手段は、フレーム毎の入力デー
    タの周波数領域での値の強度の対数値に基づいて、絶対
    可聴閾値を変動させる請求項1又は2に記載のデジタル
    音響信号符号化装置。
  4. 【請求項4】 前記変動手段は、周波数領域での値の強
    度の対数値を表すグラフに直線を配置し、前記強度の対
    数値を表す曲線と当該直線とに挟まれた部分の面積に基
    づいて、絶対可聴閾値を変動させる請求項1又は2に記
    載のデジタル音響信号符号化装置。
  5. 【請求項5】 前記変動手段において、強度の対数値を
    表す曲線と配置した直線とに挟まれた部分の面積が所定
    の値より大きい場合は絶対可聴閾値を高く、面積が所定
    の値より小さい場合は絶対可聴閾値を低く、それぞれ設
    定する請求項4に記載のデジタル音響信号符号化装置。
  6. 【請求項6】 前記変動手段において、配置する直線の
    傾き、及び、面積計算の対象となる周波数範囲を予め定
    めておき、当該直線の始点を入力信号に応じて変動させ
    る請求項5に記載のデジタル音響信号符号化装置。
  7. 【請求項7】 前記変動手段において、強度の対数値を
    表す曲線の中で、面積計算の対象となる周波数範囲にお
    ける最低周波数側の予め定めた最初の数点の中の最大値
    を、配置する直線の前記周波数範囲の最低周波数に対す
    る値とする請求項5に記載のデジタル音響信号符号化装
    置。
  8. 【請求項8】 前記変動手段において、前記フレームを
    複数の小ブロックに分割し、小ブロック毎に前記面積を
    計算する請求項4ないし7のうちいずれか1項に記載の
    デジタル音響信号符号化装置。
  9. 【請求項9】 前記変動手段において、フレーム内の小
    ブロック毎に算出した強度の対数値を表す曲線と直線と
    に挟まれた部分の面積を、フレーム内の全小ブロックに
    関して合計し、その合計値が所定の値より大きい場合は
    絶対可聴閾値を高く、合計値が所定の値より小さい場合
    は絶対可聴閾値を低く、それぞれ設定する請求項8に記
    載のデジタル音響信号符号化装置。
  10. 【請求項10】 デジタル音響信号をフレーム化し、フ
    レーム化した音響信号を1つの長い変換ブロック又は複
    数の短い変換ブロックのいずれかにて変換し、所定の処
    理を施して当該音響信号を複数の帯域に分割し、人間の
    絶対可聴閾値を用いて各分割帯域での許容誤差強度を算
    出して符号化ビットの割り当てを行うデジタル音響信号
    符号化装置において、 周波数領域での値の強度の対数値を表すグラフに直線を
    配置し、長い変換ブロックで変換する場合には、フレー
    ム内の小ブロック毎に算出した強度の対数値を表す曲線
    とその直線とに挟まれた部分の面積をフレーム内の全小
    ブロックに関して合計し、その合計値が所定の値より大
    きい場合は絶対可聴閾値を高く、合計値が所定の値より
    小さい場合は絶対可聴閾値を低く、それぞれ設定し、短
    い変換ブロックで変換する場合は予め定めた固定の絶対
    可聴閾値を用いることにより適応的に絶対可聴閾値を変
    動させる変動手段を有するデジタル音響信号符号化装
    置。
  11. 【請求項11】 デジタル音響信号を時間軸に沿って入
    力してフレーム化し、フレーム毎にサブバンド分割や周
    波数領域への変換等の処理を施し、当該音響信号を複数
    の帯域に分割し、その分割帯域毎に符号化ビットを割り
    当て、割り当てた符号化ビット数に応じて正規化係数を
    求め、前記音響信号を当該正規化係数で量子化すること
    により、これを圧縮符号化するデジタル音響信号符号化
    方法において、 フレーム毎の入力音響信号を周波数領域に変換した際の
    周波数領域における値の分布に基づいて、適応的に絶対
    可聴閾値を変動させ、 その絶対可聴閾値を用いて前記各分割帯域での許容誤差
    強度を算出して符号化ビットの割り当てを行うデジタル
    音響信号符号化方法。
  12. 【請求項12】 周波数領域での値の強度の対数値を表
    すグラフに直線を配置し、前記強度の対数値を表す曲線
    と当該直線とに挟まれた部分の面積に基づいて、絶対可
    聴閾値を変動させる請求項11に記載のデジタル音響信
    号符号化方法。
  13. 【請求項13】 強度の対数値を表す曲線と配置した直
    線とに挟まれた部分の面積が所定の値より大きい場合は
    絶対可聴閾値を高く、面積が所定の値より小さい場合は
    絶対可聴閾値を低く、それぞれ設定する請求項12に記
    載のデジタル音響信号符号化方法。
  14. 【請求項14】 デジタル音響信号をフレーム化し、フ
    レーム化した音響信号を1つの長い変換ブロック又は複
    数の短い変換ブロックのいずれかにて変換し、所定の処
    理を施して当該音響信号を複数の帯域に分割し、人間の
    絶対可聴閾値を用いて各分割帯域での許容誤差強度を算
    出して符号化ビットの割り当てを行うデジタル音響信号
    符号化方法において、 周波数領域での値の強度の対数値を表すグラフに直線を
    配置し、長い変換ブロックで変換する場合には、フレー
    ム内の小ブロック毎に算出した強度の対数値を表す曲線
    とその直線とに挟まれた部分の面積をフレーム内の全小
    ブロックに関して合計し、その合計値が所定の値より大
    きい場合は絶対可聴閾値を高く、合計値が所定の値より
    小さい場合は絶対可聴閾値を低く、それぞれ設定し、短
    い変換ブロックで変換する場合は予め定めた固定の絶対
    可聴閾値を用いることにより適応的に絶対可聴閾値を変
    動させるデジタル音響信号符号化方法。
  15. 【請求項15】 デジタル音響信号を時間軸に沿って入
    力してフレーム化し、フレーム毎にサブバンド分割や周
    波数領域への変換等の処理を施し、当該音響信号を複数
    の帯域に分割し、その分割帯域毎に符号化ビットを割り
    当て、割り当てた符号化ビット数に応じて正規化係数を
    求め、前記音響信号を当該正規化係数で量子化すること
    により、これを圧縮符号化する処理をコンピュータに実
    行させるデジタル音響信号符号化プログラムを記録した
    記録媒体において、 フレーム毎の入力音響信号を周波数領域に変換した際の
    周波数領域における値の分布に基づいて、適応的に絶対
    可聴閾値を変動させる変動手順と、 その絶対可聴閾値を用いて前記各分割帯域での許容誤差
    強度を算出して符号化ビットの割り当てを行う手順とを
    コンピュータに実行させるデジタル音響信号符号化プロ
    グラムを記録した記録媒体。
  16. 【請求項16】 前記変動手順は、周波数領域での値の
    強度の対数値を表すグラフに直線を配置し、前記強度の
    対数値を表す曲線と当該直線とに挟まれた部分の面積に
    基づいて、絶対可聴閾値を変動させる手順を有する請求
    項15に記載のデジタル音響信号符号化プログラムを記
    録した記録媒体。
  17. 【請求項17】 前記変動手順は、強度の対数値を表す
    曲線と配置した直線とに挟まれた部分の面積が所定の値
    より大きい場合は絶対可聴閾値を高く、面積が所定の値
    より小さい場合は絶対可聴閾値を低く、それぞれ設定す
    る手順を有する請求項16に記載のデジタル音響信号符
    号化プログラムを記録した記録媒体。
  18. 【請求項18】 デジタル音響信号をフレーム化し、フ
    レーム化した音響信号を1つの長い変換ブロック又は複
    数の短い変換ブロックのいずれかにて変換し、所定の処
    理を施して当該音響信号を複数の帯域に分割し、人間の
    絶対可聴閾値を用いて各分割帯域での許容誤差強度を算
    出して符号化ビットの割り当てを行う処理をコンピュー
    タに実行させるデジタル音響信号符号化プログラムを記
    録した記録媒体において、 周波数領域での値の強度の対数値を表すグラフに直線を
    配置し、長い変換ブロックで変換する場合には、フレー
    ム内の小ブロック毎に算出した強度の対数値を表す曲線
    とその直線とに挟まれた部分の面積をフレーム内の全小
    ブロックに関して合計し、その合計値が所定の値より大
    きい場合は絶対可聴閾値を高く、合計値が所定の値より
    小さい場合は絶対可聴閾値を低く、それぞれ設定し、短
    い変換ブロックで変換する場合は予め定めた固定の絶対
    可聴閾値を用いることにより適応的に絶対可聴閾値を変
    動させる手順をコンピュータに実行させるデジタル音響
    信号符号化プログラムを記録した記録媒体。
JP2000160999A 2000-05-30 2000-05-30 デジタル音響信号符号化装置、方法及び記録媒体 Expired - Fee Related JP4021124B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000160999A JP4021124B2 (ja) 2000-05-30 2000-05-30 デジタル音響信号符号化装置、方法及び記録媒体
US09/865,496 US6772111B2 (en) 2000-05-30 2001-05-29 Digital audio coding apparatus, method and computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000160999A JP4021124B2 (ja) 2000-05-30 2000-05-30 デジタル音響信号符号化装置、方法及び記録媒体

Publications (2)

Publication Number Publication Date
JP2001343997A true JP2001343997A (ja) 2001-12-14
JP4021124B2 JP4021124B2 (ja) 2007-12-12

Family

ID=18665109

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000160999A Expired - Fee Related JP4021124B2 (ja) 2000-05-30 2000-05-30 デジタル音響信号符号化装置、方法及び記録媒体

Country Status (2)

Country Link
US (1) US6772111B2 (ja)
JP (1) JP4021124B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008817A1 (ja) * 2004-07-22 2006-01-26 Fujitsu Limited オーディオ符号化装置及びオーディオ符号化方法
JP2008299005A (ja) * 2007-05-30 2008-12-11 Casio Comput Co Ltd 共鳴音付加装置および共鳴音付加プログラム
JP2008299004A (ja) * 2007-05-30 2008-12-11 Casio Comput Co Ltd 共鳴音付加装置および共鳴音付加プログラム
EP2202724A1 (en) 2008-12-26 2010-06-30 Fujitsu Limited Audio encoding apparatus
JP2012502550A (ja) * 2008-09-04 2012-01-26 ディーティーエス・インコーポレイテッド 両耳間時間遅延復元システム及び方法
JP2014510938A (ja) * 2011-02-09 2014-05-01 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオ信号の効率的なエンコーディング/デコーディング
JP2020518030A (ja) * 2017-04-25 2020-06-18 ディーティーエス・インコーポレイテッドDTS,Inc. デジタルオーディオ信号における差分データ

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4141235B2 (ja) * 2002-02-08 2008-08-27 株式会社リコー 画像補正装置及びプログラム
US20050096918A1 (en) * 2003-10-31 2005-05-05 Arun Rao Reduction of memory requirements by overlaying buffers
KR100668319B1 (ko) * 2004-12-07 2007-01-12 삼성전자주식회사 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
US7627481B1 (en) * 2005-04-19 2009-12-01 Apple Inc. Adapting masking thresholds for encoding a low frequency transient signal in audio data
JP4907522B2 (ja) * 2005-04-28 2012-03-28 パナソニック株式会社 音声符号化装置および音声符号化方法
US8194754B2 (en) * 2005-10-13 2012-06-05 Lg Electronics Inc. Method for processing a signal and apparatus for processing a signal
EP1946555A4 (en) * 2005-10-13 2009-12-30 Lg Electronics Inc METHOD AND APPARATUS FOR PROCESSING SIGNALS
WO2009029035A1 (en) 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Improved transform coding of speech and audio signals
US8515257B2 (en) * 2007-10-17 2013-08-20 International Business Machines Corporation Automatic announcer voice attenuation in a presentation of a televised sporting event
JP4656457B2 (ja) * 2008-11-13 2011-03-23 Necアクセステクニカ株式会社 画像処理システム
CN101751928B (zh) * 2008-12-08 2012-06-13 扬智科技股份有限公司 应用音频帧频谱平坦度简化声学模型分析的方法及其装置
US8891775B2 (en) * 2011-05-09 2014-11-18 Dolby International Ab Method and encoder for processing a digital stereo audio signal

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
JP3446216B2 (ja) 1992-03-06 2003-09-16 ソニー株式会社 音声信号処理方法
JP2993324B2 (ja) 1993-07-28 1999-12-20 日本ビクター株式会社 音声高能率符号化装置
JPH09101799A (ja) 1995-10-04 1997-04-15 Sony Corp 信号符号化方法及び装置
JP3739959B2 (ja) * 1999-03-23 2006-01-25 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008817A1 (ja) * 2004-07-22 2006-01-26 Fujitsu Limited オーディオ符号化装置及びオーディオ符号化方法
JP2008299005A (ja) * 2007-05-30 2008-12-11 Casio Comput Co Ltd 共鳴音付加装置および共鳴音付加プログラム
JP2008299004A (ja) * 2007-05-30 2008-12-11 Casio Comput Co Ltd 共鳴音付加装置および共鳴音付加プログラム
JP2012502550A (ja) * 2008-09-04 2012-01-26 ディーティーエス・インコーポレイテッド 両耳間時間遅延復元システム及び方法
EP2202724A1 (en) 2008-12-26 2010-06-30 Fujitsu Limited Audio encoding apparatus
JP2014510938A (ja) * 2011-02-09 2014-05-01 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオ信号の効率的なエンコーディング/デコーディング
US9280980B2 (en) 2011-02-09 2016-03-08 Telefonaktiebolaget L M Ericsson (Publ) Efficient encoding/decoding of audio signals
JP2020518030A (ja) * 2017-04-25 2020-06-18 ディーティーエス・インコーポレイテッドDTS,Inc. デジタルオーディオ信号における差分データ
JP7257965B2 (ja) 2017-04-25 2023-04-14 ディーティーエス・インコーポレイテッド デジタルオーディオ信号における差分データ

Also Published As

Publication number Publication date
JP4021124B2 (ja) 2007-12-12
US6772111B2 (en) 2004-08-03
US20020022898A1 (en) 2002-02-21

Similar Documents

Publication Publication Date Title
JP3762579B2 (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US9305558B2 (en) Multi-channel audio encoding/decoding with parametric compression/decompression and weight factors
US7613603B2 (en) Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
JP3739959B2 (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP2001343997A (ja) デジタル音響信号符号化装置、方法及び記録媒体
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
JP3765622B2 (ja) オーディオ符号化復号化システム
KR20090110244A (ko) 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
JPH05304479A (ja) オーディオ信号の高能率符号化装置
JP2002023799A (ja) 音声符号化装置及びそれに用いる心理聴覚分析方法
JP4657570B2 (ja) 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体
KR100477701B1 (ko) Mpeg 오디오 인코딩 방법 및 mpeg 오디오 인코딩장치
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
JPH08223052A (ja) 音声高能率符号化装置
JP3813025B2 (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
JP2001148632A (ja) 符号化装置、符号化方法、及びその記録媒体
JP2000206990A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
KR100590340B1 (ko) 디지털 오디오 부호화 방법 및 장치
JP2001109497A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法
JPH0746137A (ja) 音声高能率符号化装置
JP2005003835A (ja) オーディオ信号符号化装置、オーディオ信号符号化方法、及びプログラム
JP2003029797A (ja) 符号化装置、復号化装置および放送システム
JP2000276198A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP2000295110A (ja) オーディオ信号符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070730

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070828

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070926

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101005

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111005

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121005

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131005

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees