JP4055122B2 - 音響信号符号化方法及び音響信号符号化装置 - Google Patents

音響信号符号化方法及び音響信号符号化装置 Download PDF

Info

Publication number
JP4055122B2
JP4055122B2 JP2002214888A JP2002214888A JP4055122B2 JP 4055122 B2 JP4055122 B2 JP 4055122B2 JP 2002214888 A JP2002214888 A JP 2002214888A JP 2002214888 A JP2002214888 A JP 2002214888A JP 4055122 B2 JP4055122 B2 JP 4055122B2
Authority
JP
Japan
Prior art keywords
block
signal
short
determination result
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002214888A
Other languages
English (en)
Other versions
JP2004054156A (ja
Inventor
孝朗 山辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2002214888A priority Critical patent/JP4055122B2/ja
Publication of JP2004054156A publication Critical patent/JP2004054156A/ja
Application granted granted Critical
Publication of JP4055122B2 publication Critical patent/JP4055122B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、デジタルオーディオ信号の圧縮符号化における周波数変換ブロック長判定に係わり、特に単位時間毎に分割されたフレームについて時間軸上で先行してブロック長を判定し、一種類に限定されたブロック長のオーディオ信号に対して符号化処理を行うものである。
【0002】
【従来の技術】
従来より、代表的なオーディオ圧縮アルゴリズムは適応変換符号化方式が用いられている。その例としてはISO/IEC(International Organization for Standardization / International Electrotechnical Commission)11172−3のMPEG(moving picture experts group)−1 Audio Layer3、ISO/IEC13818−7 MPEG−2 AAC(Advanced Audio Coding)、及びミニディスクの圧縮方式であるATRAC(Adaptive TRansform Audio Coder)などがある。
【0003】
適応変換符号化は時間領域で表現されるPCM信号を直変換(MDCT;Modified Discrete Cosine Transform)を用いて周波数領域の信号に展開し、それを解析することにより聴覚的に重要な周波数帯の重みづけに従って、聴感上不要とされる周波数領域の信号を適応的に削減するようにして符号化を行うものである。
【0004】
図6に、MDCT及びIMDCT(Inverse Modified Discrete Cosine transform)の処理の流れを示す。MDCTはDCT(discrete cosine transform)の一種であり、変換幅の半分づつ隣り合う変換ブロックと常にオーバーラップさせながら周波数領域に展開する周波数変換手法である。
【0005】
図7に、MDCTに用いられるロングウインドウによる場合の変換幅の特性を示す。
同図において横軸は時間であり、縦軸は応答値を示している。
そして、変換はオーバーラップされる変換ブロック同士が対称形を成すウィンドウ処理を行うことにより、相互に情報が補完されて変換がなされる。
【0006】
ここで、上記した通常の圧縮アルゴリズムの例では、周波数領域への展開には2種類の変換長が用いられる。そして、長い変換長(以下変換幅と呼ぶこともある)を有する方をロングブロック、短い変換長の方をショートブロックと呼ぶ。また、周波数変換時に用いるウィンドウの形状をそれぞれロングウィンドウ、ショートウィンドウとも呼んでいる。
【0007】
図8に、MDCTに用いられる2種類の変換幅の特性を示す。そして、それらの変換長は変換ブロック内の信号の特徴に応じて選択可能とされている。そして、両者間で遷移するブロックとしての中間ブロックが用いられるが、その中間ウィンドウのことをスタートウィンドウ、ストップウィンドウと呼ぶ。但し、周波数変換ブロック長はロングブロックのサイズと共通である。
【0008】
そのようにして、変換幅の違いによってウィンドウの形状も異なる。さらに、上記の理由によりオーバーラップする領域でのウィンドウは左右対称形を成していなければならない。ここに示したウィンドウの形状はMPEG−2 AACのものである。また、MPEG−1 Layer3による符号化の場合でもこれとほぼ同じ特性のものが用いられる。
【0009】
このときの、符号化時にロングブロックを用いるか又はショートブロックを用いるかは符号化されるディジタルオーディオ信号の特性により定められる。ISO/IEC13818−7(MPEG-2 Advanced Audio Coding,AAC)に記載される例では、聴覚心理モデル内において、帯域毎の許容量子化雑音レベルを求め量子化ステップを決定するが、その際に周波数スペクトル毎の必要情報量を算出している。この情報量をスペクトル全体で集計したものであるPE(Perceptual Entropy)の時間的な変化量に応じてブロック長判定を行なうようにしている。
【0010】
図9に、従来のディジタルオーディオ信号符号化装置の構成を示す。
そのディジタルオーディオ信号符号化装置は、入力PCMバッファ61、FFT(Fast Fourier Transform)ロング62a、FFTショート62b、帯域重み付情報算出部ロング63a、帯域重み付情報算出部ショート63b、変換ブロック長仮判定部64、フレームバッファ65、変換ブロック長決定部66、遅延器67、パラメータ選択部68、MDCT69、量子化部70、及び出力ビットストリーム生成部71より構成される。
【0011】
次に、そのように構成されるディジタルオーディオ信号符号化装置の動作について概説する。
まず、符号化されるディジタルオーディオ信号は入力PCMバッファ61に一時記憶される。そこに記憶された信号は長い変換長を有するFFTロング62aと短い変換長を有するFFTショート62bのそれぞれのFFTに供給されて、それぞれのウインドウが用いられて周波数分析がなされる。
【0012】
FFTロング62aで周波数分析のなされた演算結果は帯域重み付情報算出部ロング63aに、またFFTショート62bで周波数分析のなされた演算結果は帯域重み付情報算出部ショート63bにそれぞれが供給され、ロング及びショートのそれぞれの帯域重み付け量が算出される。
【0013】
一方、FFTショート62bで演算された結果は変換ブロック長仮判定部64に供給され、そこでは前述したPEの時間的変化量から符号化するウインドウをロングの方にするかショートの方にするかが仮決定される。
【0014】
以上の動作は、聴覚心理モデルを基にした演算を行う部分であって、ロングブロック、及びショートブロックの両者に対応した帯域重みづけ情報を、1フレームの時間だけ先行して得るようになされている。そのことを図面上で「フレームN+1番目を実行」として記述してある。
【0015】
次に、「フレームN+1番目を実行」して得た結果を基に行う「フレームN番目を実行」について述べる。
即ち、ロング及びショートのFFT結果を基に算出されたそれぞれの帯域重み付け情報は、フレームバッファ65を介してパラメータ選択部68に供給される。
【0016】
また、変換ブロック長の仮判定された結果は変換ブロック長決定部66に供給され、そこでロング及びショートの何れのブロック長を用いて符号化を行うかが決定される。その決定されたブロック長情報はパラメータ選択部68、及びMDCT69の両者に供給される。
【0017】
そして、MDCT69には、入力PCMバッファ61から供給されるディジタルオーディオ信号は遅延器67により1フレームの時間遅延されてMDCT69に供給されており、決定されたブロック長によりMDCT変換がなされる。
【0018】
そのMDCT変換された変換データは量子化部70に供給される。そこでは、パラメータ選択器68により選択されたロング又はショートの何れか一方の重み付け情報が決定されたブロック長情報を基に選択され、その選択された情報は量子化部70に供給される。
【0019】
その量子化部70では、MDCT69より供給された変換データを、パラメータ選択部68により選択されたパラメータに従って帯域重み付けがなされた量子化幅に従って量子化がなされる。その量子化されたデータは所定のフォーマットに従って記述されるビットストリームとして生成され、出力される。
【0020】
図10に、従来のディジタルオーディオ信号符号化装置の動作状態を示す。
同図において、横方向に時間をフレーム単位で示し、(a)〜(e)の動作がどのような時間関係で実行されるかを示している。
【0021】
まず、最初の期間においてフレーム0(図中Fr0として記述)のディジタルオーディオ信号が入力される。次の期間では、Fr1のディジタルオーディオ信号が入力されると共に、FR0のFFTがなされて聴覚心理モデルによる信号の解析がなされ、変換ブロック長の仮検出が行なわれる。
【0022】
次の期間において、Fr2のディジタルオーディオ信号が入力され、Fr1の聴覚心理モデル解析及びブロック長仮判定がなされ、更にFr0の最終ブロック長が決定され、MDCTが実行される。
【0023】
このようにして、圧縮符号化のなされたビットストリームが生成されるが、生成されたビットストリームは、定常的な音に対してはロングウインドウにより周波数分解能を高くすることで符号化効率を高め、且つ急峻な立ち上がりを持つ音(アタック音)に対してはショートウインドウにより量子化雑音レベルをエネルギーが集中する短い時間内に留めることでプリエコー成分を抑圧し、順次変化する入力信号に対し適応的にブロック長が選択された符号化信号として出力されている。
【0024】
【発明が解決しようとする課題】
しかしながら、上述のブロック変換長判定方法では、聴覚心理モデルにおいて、情報量を削減するためのロングブロック及びショートブロックに対応した帯域重みづけ情報の両者を並列的に動作させる必要がある。
【0025】
そして、ロング及びショートのFFT等を用いて周波数解析を行うと共に、それぞれの周波数帯毎に聴感上優位であるか否かを判断するための畳み込み演算を多数回行う必要があり、聴覚心理モデルに従った重み付け情報算出のための演算処理量が多くなる程度のものでしかなかった。
【0026】
さらに、聴覚心理モデルの処理と時間−周波数変換部(MDCT)の処理との時間が1フレーム時間分だけ異なっており、その間の演算途中の中間データを一時記憶するための、メモリ領域の確保などを必要としていた。
【0027】
本発明は上述のような課題に鑑みてなされたもので、その目的は、ブロック変換長判定部分を聴覚心理モデル、及び周波数変換部と量子化部を主とする符号化部と分離して構成する。そして、先行してブロック判定を行なうことにより、聴覚心理モデルにより算出する帯域重みづけ情報を一種類のブロック長に対してのみ行う。それにより、聴覚心理モデルにおける演算処理量を軽減する、及び中間データを一時記憶するためのメモリ回路等の削減を行う。それにより経済的にも好適なディジタルオーディオ信号の圧縮符号化装置の構成を提供しようとするものである。
【0028】
上記目的を達成するために、本発明の変換ブロック長判定装置では、主要な符号化部より時間的に前もって変換ブロック長を検出する手段と、主要符号化部における周波数変換処理工程より前に、概フレームと前後のフレームから求めたブロック長仮判定結果から最終的なブロック長を決定する手段とを備えた。
【0029】
【課題を解決するための手段】
本発明は、上記課題を解決するために以下の1)及び2)の手段より成るものである。
すなわち、
【0030】
1) 入力されるディジタル音響信号を所定の時間間隔ごとの複数のブロックの信号に分割すると共に、前記分割されたブロック信号をロングブロックの信号として符号化するか又はショートブロックの信号として符号化するかを順次判定し、それらの判定して得られロングブロック信号又はショートブロック信号符号化する音響信号符号化方法において、
前記分割されたブロックごとのディジタル音響信号に含まれるアタック音信号成分について一つ前のブロックとの変化量を検出し、その変化量が閾値以下である場合にロングブロックとし、閾値を超えた場合にショートブロックとする判定結果を仮に得る第1のステップ(12)と、
前記第1のステップにおける仮判定結果がショートブロックであり、1つ前のブロックの判定結果がロングブロックであり、且つ2つ前のブロックの判定結果がショートブロックである場合にのみ前記1つ前のブロックの判定結果をショートブロックに変更し、それ以外の場合は前記1つ前のブロックの判定結果をそのままの判定結果として得る第2のステップ(13)と、
前記第2のステップにより判定された前記1つ前のブロックのディジタル音響信号を聴覚心理モデルに基づいて分析し、この分析結果により帯域重み付け情報を算出する一方前記1つ前のブロックの入力されるディジタル音響信号を周波数変換して所定周波数ごとの信号レベルを得る第のステップ(14、15)と、
前記第3のステップで得られた所定周波数ごとの信号レベルを前記算出された前記帯域重み付け情報を基に適応量子化して符号化音響信号を生成する第のステップ(16)と、
より成ることを特徴とする音響信号符号化方法。
2) 入力されるディジタル音響信号を所定の時間間隔ごとの複数のブロックの信号に分割すると共に、前記分割されたブロック信号をロングブロックの信号として符号化するか又はショートブロックの信号として符号化するかを順次判定し、それらの判定して得られロングブロック信号又はショートブロック信号符号化する音響信号符号化装置において、
前記分割されたブロックごとのディジタル音響信号に含まれるアタック音信号成分について一つ前のブロックとの変化量を検出し、その変化量が閾値以下である場合にロングブロックとし、閾値を超えた場合にショートブロックとする判定結果を仮に得る変換ブロック長判定手段(12)と、
前記変換ブロック長仮判定手段における仮判定結果がショートブロックであり、1つ前のブロックの判定結果がロングブロックであり、且つ2つ前のブロックの判定結果がショートブロックである場合にのみ前記1つ前のブロックの判定結果をショートブロックに変更し、それ以外の場合は前記1つ前のブロックの判定結果をそのままの判定結果として得るブロック長決定手段(13)と、
前記ブロック長決定手段により決定された前記1つ前のブロックのディジタル音響信号を聴覚心理モデルに基づいて分析し、この分析結果により帯域重み付け情報を算出する帯域重み付け情報算出手段(14)と、
前記1つ前のブロックの入力されるディジタル音響信号を周波数変換して所定周波数ごとの信号レベルを得る周波数変換手段(15)と、
前記周波数変換手段で得られた所定周波数ごとの信号レベルを前記算出された前記帯域重み付け情報を基に適応量子化して符号化音響信号を生成する量子化手段(16)と、
を具備して構成したことを特徴とする音響信号符号化装置。
【0031】
【発明の実施の形態】
以下、本発明の音響信号符号化方法及び音響信号符号化装置の実施の形態につき、好ましい実施例により説明する。
図1に、その音響信号符号化方法を採用した音響信号符号化装置の概略ブロック図を示し、その構成と動作について概説する。
【0032】
同図において、この音響信号符号化装置は、遅延器11、ブロック長仮判定部12、ブロック長決定部13、聴覚心理モデル14、周波数変換部15、量子化部16、及びMUX(Multiplexer)17より構成される。
【0033】
次に、それらの構成による動作について概説する。
まず、符号化すべきディジタルオーディオ信号(PCM信号)は遅延器11及びブロック長仮判定部12に供給される。
【0034】
そのブロック長仮決定部12では、ロングウインドウにより符号化を行うか、ショートウインドウにより符号化を行うかを、供給されたディジタルオーディオ信号に対して仮判定を行う。遅延器11は、その判定に要する1フレームの期間、供給されるPCM信号を遅延させる。
【0035】
次に、ブロック長仮決定部12で仮判定された結果はブロック長決定部13に供給され、ロング、及びショートの仮判定結果を基にしてロング、又はショートのブロック長を決定する。決定されたブロック長情報は聴覚心理モデル14、及び周波数変換部(MDCT)15に供給される。
【0036】
その周波数変換部15では、遅延器11により時間合わせのされたPCM信号のMDCT変換がなされる。そして、聴覚心理モデル14ではPCM信号の聴覚心理に基づく帯域重み付け情報が演算生成される。
【0037】
そのときの帯域重み付け情報は、決定されたロング、又はショートのいずれか一方のウインドウの信号に対して生成される。そして、生成された帯域重み付け情報及びMDCT変換されて得られた周波数情報は量子化部16に供給される。
【0038】
その量子化部16では、ロング、又はショートのいずれか一方のブロック長に従いMDCT変換されて得られた周波数情報に対して帯域重み付け情報を基にした量子化幅により量子化がなされる。
【0039】
次のMUX17では、量子化のなされたデータ及び符号化パラメータに係る情報を所定のフォーマットに従って多重化しビットストリームが生成される。
【0040】
以上の様にして、簡易な構成により実行した符号化にも拘らず、連続的な音響信号に対して歪成分が少なく、且つアタック音を含む音響信号に対してもプリエコー成分を含まない好適なビットストリームの生成がなされる。
更にその音響信号符号化装置の動作について述べる。
【0041】
図2に、本実施例に示した音響信号符号化装置の動作の流れを示し、説明する。
同図において、入力PCMバッファ21に入力されたディジタルオーディオ信号は後述の変換ブロック長仮判定部23に供給され、そこでロングウインドウとショートウインドウのどちらのウインドウを用いて圧縮符号化を行うかの仮判定を行う。
【0042】
その仮判定動作は1フレーム先行したN+1番目のフレームデータに対して行なう。仮判定されたロング及びショートウインドウに係る情報は変換ブロック長決定部24に供給され、そこでは上記の仮決定されたロング及びショートウインドウの前後の並びを基にロング及びショートウインドウの最終決定を行う。
【0043】
その決定されたブロック長情報はFFT25及びMDCT27に供給される。そのFFT25及びMDCT27には遅延器22により1フレーム分の期間遅延されたディジタルオーディオ信号が供給されている。
【0044】
そして、FFT25では供給された信号の高速フーリエ変換を、MDCT27では供給された信号のMDCT変換を、供給されたブロック長情報を基にして行なう。
【0045】
従って、FFT25で行われるFFT変換はロング又はショートウインドウの何れか一方のウインドウに対して行われている。さらに、従来のようにロングウインドウのFFTとショートウインドウのFFTの2つのFFTを用いて周波数分析を行なうのに比し、本実施例では1つのFFTを用いて演算している点で異なっている。
【0046】
また、FFTからの信号が供給されて実行される帯域重み付け情報算出26も1つの回路で良い。更に、従来のような2つの帯域重み付け情報のいずれを用いるかを選択するための選択回路、及びその2つの選択回路を同期して動作させるためのフレームバッファも不要とされている。
【0047】
以上のようにして、簡易な動作により帯域重み付け情報が算出されるが、その算出情報及びMDCT変換されて得られた周波数情報は量子化器28に供給され、そこでは帯域重み付け算出情報により量子化幅が設定され、周波数情報はその量子化幅で量子化された符号化信号として生成される。
【0048】
その生成された信号は出力ビットストリーム生成29に供給され、そこでは符号化信号に符号化に係る情報が付加された所定の記述フォーマットに従ったビットストリーム信号として出力される。
【0049】
以上、本実施例による音響信号符号化装置の動作の流れについて述べた。そして、聴覚心理モデルは1つのFFT25と1つの帯域重み付け情報算出26により構成されており、簡易な構成となっている。
【0050】
つぎに、その簡易な聴覚心理モデルを用い、且つ高品質なディジタルオーディオ信号の圧縮符号化を行なうためには、1つ前のフレームにおいてロングウインドウ及びショートウインドウのいずれを用いるかの判定がなされている必要があり、その判定方法について述べる。
【0051】
図3に、ブロック長仮判定部の構成を示す。
同図において、ブロック長仮判定部12はブロック分割回路121、周波数解析回路122、スペクトルエネルギー算出回路123、スペクトルエネルギーバッファ124、スペクトルエネルギー変化量算出回路125、しきい値比較回路126、及び条件適合ポイント測定回路127より構成される。
【0052】
次に、そのように構成されるブロック長仮判定部12の動作について述べる。まず、入力PCMバッファに一時記憶された1フレーム分のディジタルオーディオ信号がブロック分割回路121に供給される。そこでは、1フレームのディジタルオーディオ信号を、例えば4つの、所定サンプル数ごとのブロックの信号に分割する。
【0053】
即ち、1フレームの信号を複数のブロックのサンプル数(ブロックの長さ)毎に分割するのは、オーディオ信号に含まれるアタック音の検出を確実に行い、ロングウインドウで符号化すべきか、ショートウィンドウで符号化をすべきかの判定を入力信号の状態に応じ適応的に行うためである。
【0054】
そして、アタック音を含む信号は前後のブロック間でスペクトルのパワー比が急激に変化する。従って、演算量の増加が許す範囲で的確にその変移を捉えるには、次段以降での解析ブロック長が短い方がより信頼度の高いアタック音解析を行うことが出来る。
【0055】
そのようにしてブロック分割された信号は周波数解析回路122に供給される。そこでは分割された信号毎に周波数スペクトルが算出される。その周波数スペクトルの解析は、例えば一般的な高速フーリエ変換(FFT)等の周波数変換法によって周波数スペクトルの算出が行われる。
【0056】
次に、周波数解析回路122で得られた周波数スペクトルは、スペクトルエネルギー算出部123に供給される。そこでは、周波数解析ポイント毎のエネルギーが求められる。
【0057】
次に、前ブロックと現ブロックから周波数解析ポイントのエネルギー変化量を算出するため、スペクトルエネルギー算出回路123にて一旦求められたエネルギーは、スペクトルエネルギーバッファ124及びスペクトルエネルギー変化量算出回路125に供給される。
【0058】
そのスペクトルエネルギーバッファ124では1ブロックの期間供給された信号を遅延して出力するため、スペクトルエネルギー変化量算出回路125ではブロック毎のエネルギー変化量を比較により求めることができる。
【0059】
その分析周波数毎ごとに、且つブロック毎に演算されて求められたスペクトルエネルギーの変化量はしきい値比較回路126に供給される。そこでは、スペクトルエネルギー変化量算出回路125により測定されたエネルギー変化量と、予め定めておいたしきい値とを比較し、エネルギー変化量がしきい値を超えたか否かを判定する。その判定は個々の周波数スペクトルポイントにおいて行い、それらの判定結果は条件適合ポイント測定回路127に供給される。
【0060】
その条件適合ポイント測定回路127では、誤検出を防止するため、少なくとも複数の周波数スペクトルポイントにてエネルギー変化量がしきい値を超えたことが認められた場合にのみ、アタック音が含まれているとしてショートブロックへの切り替えを許可するためのブロック長仮判定情報を生成し、変換ブロック長決定部24に出力する。
【0061】
以上、ブロック長仮判定部の動作について述べた。なお、このブロック長仮判定部の詳細に関しては、本願発明者が発明し本願出願人により出願された特願2001−400181号「周波数変換ブロック長適応変換装置及びプログラム」(本願出願時に未公開)に開示されている。
【0062】
また、ここで用いられるブロック長判定方法は構成及び動作が簡易であり、且つ入力PCM信号に対して適当なロング及びショートの符号化用ウインドウの判定ができる限り、他の方法を用いても良い。その判定方法としては、周波数領域判定法、時間領域判定法、およびそれらの複合的な判定法がある。例えば周波数領域判定法としてはISO/IEC13818−7(MPEG-2 Advanced Audio Coding,AAC)に規定される方法がある。また、時間領域判定法としては1992年9月発行の「MD system」等の方法もある。
【0063】
以上、ブロック長仮判定部の構成と動作について詳述した。
次に変換ブロック長決定部24の動作について述べる。
図4に、仮判定ブロック長を基にブロック長を決定する場合の例を示す。
【0064】
同図の(a)に示すように、仮判定ブロック長がロング、ショート、ロング、ショート、及びロングのように仮判定されたときは、(b)に示すようにスタート、ショート、ショート、ショート、及びストップのように変更して最終決定ウインドウとする。
【0065】
また、同図の(c)に示すようにスタート、ショート、ストップ、ショート、及びストップのように仮判定された場合も、(b)に示すようにストップをショートに変更して最終決定ウインドウとする。
【0066】
上記のように、強制的にロングブロックをショートブロックに変更するときのウィンドウの形状はストップウィンドウの次のフレームがショートブロックと判定されたときである。
【0067】
そして、ここで仮判定されたブロック長が隣接するフレームにおいて異なっているときには、中間的なウィンドウとしてスタートウインドウ、又はストップウインドウが用いられる。通常は、ショートブロックが選択された次のフレームがロングブロックであるならばストップウィンドウが用いられるが、更にその次のフレームがショートブロックであるとき、強制的に中間のブロックをショートブロックに変更するようにしている。
【0068】
そして、ブロック長が前後のフレームの関係で強制的に変更されるのは、ショート、ロング、ショートと仮判定されるときの中間のロングブロックのときである。このような情報が入力されたときは中間のロングブロックがショートブロックに変更される。
【0069】
その強制的な変更を行うために、変換ブロック長決定部を更に1フレーム先行させて動作させ、3フレーム分(N+1、N、N−1)のブロック長仮判定結果を有するようにすれば良い。
【0070】
この場合であっても聴覚心理モデル及びMDCTの回路は簡易に構成することができるものである。
なお、最終判定ウインドウはロング又はストップウインドウがショートウインドうに変更される判定であり、その判定は過去より得られている仮判定結果を分析することにより、現時点で得られる2フレーム分(N+1、N)のウィンドウの形状からも最終的なブロック長を決定することもできる。
【0071】
以上、ブロック長の仮判定結果を基にブロック長を最終決定する方法について述べた。
そして、得られたブロック長情報を基にしてディジタルオーディオ信号の符号化がなされる。次に、その動作タイミングについて述べる。
【0072】
図5に、本音響信号符号化装置の動作状態を示す。
同図において、横方向に時間をフレーム単位で示し、(a)〜(e)の実行に係る動作状態を示している。
【0073】
まず、最初の期間においてフレーム0(図中Fr0として記述)のディジタルオーディオ信号が入力される。次の期間では、Fr1のディジタルオーディオ信号が入力されると共に、FR0のブロック長の仮判定がなされる。
【0074】
次の期間において、Fr2のディジタルオーディオ信号が入力され、Fr1のブロック長仮判定がなされ、更にFr0の最終ブロック長の決定、聴覚心理モデルによる帯域重み付け情報の算出、及びMDCT演算がが実行される。
【0075】
このようにして、ブロック長の仮判定が1フレーム先行してなされると共に、最終ブロック長の決定、聴覚心理モデル算出、及びMDCT演算が同一のフレーム期間において実行されている。
【0076】
そのようにして、主要な符号化部の時系列が一致することで回路設計等が簡易になると共に、演算処理量の削減及び記憶領域の削減による処理工程の軽減がなされる。
【0077】
さらに、上述した音響信号符号化装置はハードウエアによる手段を中心として述べたが、その手段はコンピュータによる信号処理を用いて実現させることが出来る。そして、CPUやDSP等の演算用ICを用いて装置を実現する場合では、演算ステップ数の減少、及びメモリ等の記憶領域用デバイスの縮小を図ることができる。そして、本発明は上記を実行するためのプログラムを含むものである。
【0078】
【発明の効果】
請求項1記載の発明によれば、ディジタル音響入力信号に含まれるアタック音信号成分を周波数領域判定及び/又は時間領域判定により検出し、ロングブロックにより又はショートブロックのいずれにより圧縮符号化を行うかを現在のブロック、1つ前のブロック、及び2つ前のブロックの判定結果を基に1つ前のブロックについて判定し、次に1つ前のブロックのディジタル音響入力信号について、その判定された方の、ロングブロック信号又はショートブロック信号を聴覚心理モデルにより分析して行う帯域重み付け情報の算出、及び判定された方のロング又はショートブロック信号を周波数変換して周波数領域信号を得、その得られた周波数領域信号を上記帯域重み付け情報を基にして適応量子化して圧縮符号化音響信号を生成するようにしているため、聴覚心理モデルの算出及び音響入力信号の周波数変換はロング又はショートブロック信号の何れか一方に対して行えば良く、聴覚心理モデルにおける演算処理量の軽減、及び演算処理中の中間データの蓄積に係るメモリの削減した音響信号符号化方法を提供できる効果がある。
【0079】
また、請求項2記載の発明によれば、ディジタル音響入力信号に含まれるアタック音信号成分を周波数領域判定及び/又は時間領域判定により検出し、ロングブロックにより又はショートブロックのいずれにより圧縮符号化を行うかを現在のブロック、1つ前のブロック、及び2つ前のブロックの判定結果を基に1つ前のブロックについて判定し、次に1つ前のブロックのディジタル音響入力信号について、その判定された方の、ロングブロック信号又はショートブロック信号を聴覚心理モデルにより分析して行う帯域重み付け情報の算出、及び判定された方のロング又はショートブロック信号を周波数変換して周波数領域信号を得、その得られた周波数領域信号を上記帯域重み付け情報を基にして適応量子化して圧縮符号化音響信号を生成するようにしているため、聴覚心理モデルの算出及び音響入力信号の周波数変換はロング又はショートブロック信号の何れか一方に対して行えば良く、聴覚心理モデルにおける演算処理量の軽減、及び演算処理中の中間データの蓄積に係るメモリの削減した音響信号符号化装置の構成を提供できる効果がある。
【図面の簡単な説明】
【図1】本発明の実施に係る、音響信号符号化装置の概略構成を例示した図である。
【図2】本発明の実施に係る、音響信号符号化装置の動作の流れを例示した図である。
【図3】本発明の実施に係る、ブロック長仮判定部の構成を例示した図である。
【図4】本発明の実施に係る、仮判定ブロック長を基に行うブロック長の決定例を示した図である。
【図5】本発明の実施に係る、本音響信号符号化装置のフレーム毎の動作状態を例示した図である。
【図6】従来例による、MDCT及びIMDCTの処理の流れ例示した図である。
【図7】従来例による、MDCTに用いられるロングウインドウの変換幅の特性を示した図である。
【図8】従来例による、MDCTに用いられる2種類の変換幅の特性を示した図である。
【図9】従来例による、ディジタルオーディオ信号符号化装置の構成を示した図である。
【図10】従来例による、ディジタルオーディオ信号符号化装置の動作状態を示した図である。
【符号の説明】
11 遅延器
12 ブロック長仮判定部
13 ブロック長決定部
14 聴覚心理モデル
15 周波数変換部
16 量子化部
17 MUX
61 入力PCMバッファ
62a FFTロング
62b FFTショート
63a 帯域重み付情報算出部ロング
63b 帯域重み付情報算出部ショート
64 変換ブロック長仮判定部
65 フレームバッファ
66 変換ブロック長決定部
67 遅延器
68 パラメータ選択部
69 MDCT
70 量子化部
71 出力ビットストリーム生成部
121 ブロック分割回路
122 周波数解析回路
123 スペクトルエネルギー算出回路
124 スペクトルエネルギーバッファ
125 スペクトルエネルギー変化量算出回路
126 しきい値比較回路
127 条件適合ポイント測定回路

Claims (2)

  1. 入力されるディジタル音響信号を所定の時間間隔ごとの複数のブロックの信号に分割すると共に、前記分割されたブロック信号をロングブロックの信号として符号化するか又はショートブロックの信号として符号化するかを順次判定し、それらの判定して得られロングブロック信号又はショートブロック信号符号化する音響信号符号化方法において、
    前記分割されたブロックごとのディジタル音響信号に含まれるアタック音信号成分について一つ前のブロックとの変化量を検出し、その変化量が閾値以下である場合にロングブロックとし、閾値を超えた場合にショートブロックとする判定結果を仮に得る第1のステップと、
    前記第1のステップにおける仮判定結果がショートブロックであり、1つ前のブロックの判定結果がロングブロックであり、且つ2つ前のブロックの判定結果がショートブロックである場合にのみ前記1つ前のブロックの判定結果をショートブロックに変更し、それ以外の場合は前記1つ前のブロックの判定結果をそのままの判定結果として得る第2のステップと、
    前記第2のステップにより判定された前記1つ前のブロックのディジタル音響信号を聴覚心理モデルに基づいて分析し、この分析結果により帯域重み付け情報を算出する一方前記1つ前のブロックの入力されるディジタル音響信号を周波数変換して所定周波数ごとの信号レベルを得る第のステップと、
    前記第3のステップで得られた所定周波数ごとの信号レベルを前記算出された前記帯域重み付け情報を基に適応量子化して符号化音響信号を生成する第のステップと、
    より成ることを特徴とする音響信号符号化方法。
  2. 入力されるディジタル音響信号を所定の時間間隔ごとの複数のブロックの信号に分割すると共に、前記分割されたブロック信号をロングブロックの信号として符号化するか又はショートブロックの信号として符号化するかを順次判定し、それらの判定して得られロングブロック信号又はショートブロック信号符号化する音響信号符号化装置において、
    前記分割されたブロックごとのディジタル音響信号に含まれるアタック音信号成分について一つ前のブロックとの変化量を検出し、その変化量が閾値以下である場合にロングブロックとし、閾値を超えた場合にショートブロックとする判定結果を仮に得る変換ブロック長判定手段と、
    前記変換ブロック長仮判定手段における仮判定結果がショートブロックであり、1つ前のブロックの判定結果がロングブロックであり、且つ2つ前のブロックの判定結果がショートブロックである場合にのみ前記1つ前のブロックの判定結果をショートブロックに変更し、それ以外の場合は前記1つ前のブロックの判定結果をそのままの判定結果として得るブロック長決定手段と、
    前記ブロック長決定手段により決定された前記1つ前のブロックのディジタル音響信号を聴覚心理モデルに基づいて分析し、この分析結果により帯域重み付け情報を算出する帯域重み付け情報算出手段と、
    前記1つ前のブロックの入力されるディジタル音響信号を周波数変換して所定周波数ごとの信号レベルを得る周波数変換手段と、
    前記周波数変換手段で得られた所定周波数ごとの信号レベルを前記算出された前記帯域重み付け情報を基に適応量子化して符号化音響信号を生成する量子化手段と、
    を具備して構成したことを特徴とする音響信号符号化装置。
JP2002214888A 2002-07-24 2002-07-24 音響信号符号化方法及び音響信号符号化装置 Expired - Fee Related JP4055122B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002214888A JP4055122B2 (ja) 2002-07-24 2002-07-24 音響信号符号化方法及び音響信号符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002214888A JP4055122B2 (ja) 2002-07-24 2002-07-24 音響信号符号化方法及び音響信号符号化装置

Publications (2)

Publication Number Publication Date
JP2004054156A JP2004054156A (ja) 2004-02-19
JP4055122B2 true JP4055122B2 (ja) 2008-03-05

Family

ID=31937061

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002214888A Expired - Fee Related JP4055122B2 (ja) 2002-07-24 2002-07-24 音響信号符号化方法及び音響信号符号化装置

Country Status (1)

Country Link
JP (1) JP4055122B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008817A1 (ja) * 2004-07-22 2006-01-26 Fujitsu Limited オーディオ符号化装置及びオーディオ符号化方法
US8121836B2 (en) 2005-07-11 2012-02-21 Lg Electronics Inc. Apparatus and method of processing an audio signal
JP4438713B2 (ja) 2005-07-25 2010-03-24 ブラザー工業株式会社 画像読取装置
JP2007079455A (ja) * 2005-09-16 2007-03-29 Matsushita Electric Ind Co Ltd 音声符号化復号化装置
KR100880995B1 (ko) 2007-01-25 2009-02-03 후지쯔 가부시끼가이샤 오디오 부호화 장치 및 오디오 부호화 방법

Also Published As

Publication number Publication date
JP2004054156A (ja) 2004-02-19

Similar Documents

Publication Publication Date Title
KR101395250B1 (ko) 스펙트럼 포락선의 수를 산출하기 위한 장치 및 그 방법
KR100608062B1 (ko) 오디오 데이터의 고주파수 복원 방법 및 그 장치
RU2504026C2 (ru) Способ и устройство для селективного кодирования сигнала на основе характеристик базового кодера
JP5975243B2 (ja) 符号化装置および方法、並びにプログラム
RU2680352C1 (ru) Способ и устройство для определения режима кодирования, способ и устройство для кодирования аудиосигналов и способ и устройство для декодирования аудиосигналов
US8886548B2 (en) Audio encoding device, decoding device, method, circuit, and program
KR101411901B1 (ko) 오디오 신호의 부호화/복호화 방법 및 장치
TW201250671A (en) Audio codec using noise synthesis during inactive phases
CN103594090A (zh) 使用时间分辨率能选择的低复杂性频谱分析/合成
KR20100086000A (ko) 오디오 신호 처리 방법 및 장치
KR20090083070A (ko) 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
JP3999807B2 (ja) 改良された周波数領域におけるエラー隠蔽技術
JP5633431B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
EP2626856B1 (en) Encoding device, decoding device, encoding method, and decoding method
US7197454B2 (en) Audio coding
JP2004198485A (ja) 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
JP4055122B2 (ja) 音響信号符号化方法及び音響信号符号化装置
JP3815323B2 (ja) 周波数変換ブロック長適応変換装置及びプログラム
JP3894722B2 (ja) ステレオオーディオ信号高能率符号化装置
US8751219B2 (en) Method and related device for simplifying psychoacoustic analysis with spectral flatness characteristic values
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP2008129250A (ja) Aacのためのウィンドウ切り替え方法およびm/s符号化の帯域決定方法
JP3353266B2 (ja) 音響信号変換符号化方法
KR100349329B1 (ko) 엠펙-2 고품질 오디오 처리 알고리즘의 병렬 처리 방법
JP2000268510A (ja) 符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071129

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131221

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees