JPWO2007026821A1 - エネルギー整形装置及びエネルギー整形方法 - Google Patents

エネルギー整形装置及びエネルギー整形方法 Download PDF

Info

Publication number
JPWO2007026821A1
JPWO2007026821A1 JP2007533326A JP2007533326A JPWO2007026821A1 JP WO2007026821 A1 JPWO2007026821 A1 JP WO2007026821A1 JP 2007533326 A JP2007533326 A JP 2007533326A JP 2007533326 A JP2007533326 A JP 2007533326A JP WO2007026821 A1 JPWO2007026821 A1 JP WO2007026821A1
Authority
JP
Japan
Prior art keywords
signal
downmix
pass
spread
energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007533326A
Other languages
English (en)
Other versions
JP4918490B2 (ja
Inventor
良明 高木
良明 高木
コク セン・チョン
セン・チョン コク
則松 武志
武志 則松
宮阪 修二
修二 宮阪
明久 川村
明久 川村
耕司郎 小野
耕司郎 小野
石川 智一
智一 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2007533326A priority Critical patent/JP4918490B2/ja
Publication of JPWO2007026821A1 publication Critical patent/JPWO2007026821A1/ja
Application granted granted Critical
Publication of JP4918490B2 publication Critical patent/JP4918490B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)

Abstract

エネルギー整形装置(600a)は、ハイブリッド時間・周波数変換によって得られるサブバンド領域の音響信号を、残響成分を示す拡散信号と非残響成分を示すダイレクト信号に分割し、ダイレクト信号からダウンミックス信号を生成し、ダウンミックス信号及びサブバンド毎に分割された拡散信号に対して、サブバンド毎に帯域通過処理を施すことによって、それぞれ、帯域通過ダウンミックス信号及び帯域通過拡散信号を生成し、帯域通過ダウンミックス信号及び帯域通過拡散信号から正規化ダウンミックス信号及び正規化拡散信号を生成し、予め定められた時間スロット毎に、正規化拡散信号のエネルギーに対する正規化ダウンミックス信号のエネルギーの大きさを示すスケール係数を算出し、正規化拡散信号にスケール係数を乗じることによって、スケール拡散信号を生成し、スケール拡散信号に対して高域通過処理を施すことによって、高域通過拡散信号を生成し、高域通過拡散信号とダイレクト信号とを加算することによって、加算信号を生成し、加算信号に対して合成フィルタ処理を施すことによって、時間領域信号に変換する。

Description

本発明は、エネルギー整形装置及びエネルギー整形方法に関し、特に、マルチチャンネル音響信号の復号化においてエネルギー整形を行う技術に関する。
近年、MPEGオーディオ規格において、Spatial Audio Codec(空間的符号化)といわれる技術が規格化されつつある。これは、非常に少ない情報量で臨場感を示すマルチチャンネル信号を圧縮・符号化することを目的としている。例えば、既にデジタルテレビの音声方式として広く用いられているマルチチャンネルコーデックであるAAC(Advanced Audio Coding)方式が、5.1ch当り512kbpsや、384kbpsというビットレートを要するのに対し、Spatial Audio Codecでは、128kbpsや、64kbps、さらに48kbpsといった非常に少ないビットレートでマルチチャンネル音響信号を圧縮及び符号化することを目指している(例えば、非特許文献1参照)。
図1は、空間的符号化の基本原理を用いたオーディオ装置の全体構成を示すブロック図である。
オーディオ装置1は、オーディオ信号の組に対する空間音響符号化を行って符号化信号を出力するオーディオエンコーダ10と、その符号化信号を復号化するオーディオデコーダ20とを備えている。
オーディオエンコーダ10は、1024サンプルや、2048サンプルなどによって示されるフレーム単位で、複数チャンネルのオーディオ信号(例えば、2チャンネルのオーディオ信号L,R)を処理するものであって、ダウンミックス部11と、バイノーラルキュー検出部12と、エンコーダ13と、多重化部14とを備えている。
ダウンミックス部11は、例えば左右2チャンネルのスペクトル表現されたオーディオ信号L,Rの平均をとることによって、つまり、M=(L+R)/2によって、オーディオ信号L,Rがダウンミックスされたダウンミックス信号Mを生成する。
バイノーラルキュー検出部12は、スペクトルバンド毎に、オーディオ信号L,R及びダウンミックス信号Mを比較することによって、ダウンミックス信号Mを元のオーディオ信号L,Rに戻すためのBC情報(バイノーラルキュー)を生成する。
BC情報は、チャンネル間レベル/強度差(inter−channel level/intensity difference)を示すレベル情報IIDと、及びチャンネル間コヒーレンス/相関(inter−channel coherence/correlation)を示す相関情報ICCと、チャンネル間位相遅延差(inter−channel phase/delay difference)を示す位相情報IPDとを含む。
ここで、相関情報ICCが2つのオーディオ信号L,Rの類似性を示すのに対し、レベル情報IIDは相対的なオーディオ信号L,Rの強度を示す。一般に、レベル情報IIDは、音のバランスや定位を制御するための情報であって、相関情報ICCは、音像の幅や拡散性を制御するための情報である。これらは、共に聴き手が聴覚的情景を頭の中で構成するのを助ける空間パラメータである。
最新のスペーシャルコーデックにおいては、スペクトル表現されたオーディオ信号L,R及びダウンミックス信号Mは、「パラメータバンド」からなる通常複数のグループに区分されている。したがって、BC情報は、それぞれのパラメータバンド毎に算出される。なお、「BC情報(バイノーラルキュー)」と「空間パラメータ」という用語はしばしば同義的に、互換性をもって用いられる。
エンコーダ13は、例えば、MP3(MPEG Audio Layer−3)や、AAC(Advanced Audio Coding)などによって、ダウンミックス信号Mを圧縮符号化する。つまり、エンコーダ13は、ダウンミックス信号Mを符号化して、圧縮された符号化列を生成する。
多重化部14は、BC情報を量子化すると共に、圧縮されたダウンミックス信号Mと、量子化されたBC情報とを多重化することによりビットストリームを生成し、そのビットストリームを上述の符号化信号として出力する。
オーディオデコーダ20は、逆多重化部21と、デコーダ22と、マルチチャンネル合成部23とを備えている。
逆多重化部21は、上述のビットストリームを取得し、そのビットストリームから量子化されたBC情報と、符号化されたダウンミックス信号Mとを分離して出力する。なお、逆多重化部21は、量子化されたBC情報を逆量子化して出力する。
デコーダ22は、符号化されたダウンミックス信号Mを復号化して、ダウンミックス信号Mをマルチチャンネル合成部23に出力する。
マルチチャンネル合成部23は、デコーダ22から出力されたダウンミックス信号Mと、逆多重化部21から出力されたBC情報とを取得する。そして、マルチチャンネル合成部23は、そのBC情報を用いて、ダウンミックス信号Mから、2つのオーディオ信号L,Rを復元する。これらダウンミックス信号から元の2つの信号を復元する処理は、後述する「チャンネル分離技術」を伴う。
なお、上記の例は、エンコーダにおいてどのように二つの信号を1つのダウンミックス信号と空間パラメータの組で表すことができ、空間パラメータとダウンミックス信号を処理することによって、デコーダにおいてどのようにダウンミックス信号を2つの信号に分離することができるのかを説明するにすぎない。その技術は、音響の2より多いチャンネル(例えば、5.1の音源からの6つのチャンネル)を、符号化処理時に1つもしくは2つのダウンミックスチャンネルに圧縮することもでき、復号化処理において復元することができる。
すなわち、上述では、2チャンネルのオーディオ信号を符号化して復号化する例を挙げてオーディオ装置1を説明したが、オーディオ装置1は、2チャンネルよりも多いチャンネルのオーディオ信号(例えば、5.1チャンネル音源を構成する、6つのチャンネルのオーディオ信号)を、符号化及び復号化することもできる。
図2は、6チャンネル時におけるマルチチャンネル合成部23の機能構成を示すブロック図である。
マルチチャンネル合成部23は、例えば、ダウンミックス信号Mを6つのチャンネルのオーディオ信号に分離する場合、第1チャンネル分離部241と、第2チャンネル分離部242と、第3チャンネル分離部243と、第4チャンネル分離部244と、第5チャンネル分離部245とを備える。なお、ダウンミックス信号Mは、聴取者の正面に配置されるスピーカに対する正面オーディオ信号Cと、視聴者の左前方に配置されるスピーカに対する左前オーディオ信号Lfと、視聴者の右前方に配置されるスピーカに対する右前オーディオ信号Rfと、視聴者の左後方に配置されるスピーカに対する左後オーディオ信号Lsと、視聴者の右後方に配置されるスピーカに対する右後オーディオ信号Rsと、低音出力用サブウーファースピーカに対する低域オーディオ信号LFEとがダウンミックスされて構成されている。
第1チャンネル分離部241は、ダウンミックス信号Mから中間の第1ダウンミックス信号M1と中間の第4ダウンミックス信号M4とを分離して出力する。第1ダウンミックス信号M1は、正面オーディオ信号Cと左前オーディオ信号Lfと右前オーディオ信号Rfと低域オーディオ信号LFEとがダウンミックスされて構成されている。第4ダウンミックス信号M4は、左後オーディオ信号Lsと右後オーディオ信号Rsとがダウンミックスされて構成されている。
第2チャンネル分離部242は、第1ダウンミックス信号M1から中間の第2ダウンミックス信号M2と中間の第3ダウンミックス信号M3とを分離して出力する。第2ダウンミックス信号M2は、左前オーディオ信号Lfと右前オーディオ信号Rfとがダウンミックスされて構成されている。第3ダウンミックス信号M3は、正面オーディオ信号Cと低域オーディオ信号LFEとがダウンミックスされて構成されている。
第3チャンネル分離部243は、第2ダウンミックス信号M2から左前オーディオ信号Lfと右前オーディオ信号Rfとを分離して出力する。
第4チャンネル分離部244は、第3ダウンミックス信号M3から正面オーディオ信号Cと低域オーディオ信号LFEとを分離して出力する。
第5チャンネル分離部245は、第4ダウンミックス信号M4から左後オーディオ信号Lsと右後オーディオ信号Rsとを分離して出力する。
このように、マルチチャンネル合成部23は、マルチステージの方法によって、各チャンネル分離部で1つのダウンミックス信号を2つのダウンミックス信号に分離するという同一の分離処理を施し、単一のオーディオ信号が分離されるまで再帰的に信号の分離を毎回繰り返す。
図3は、マルチチャンネル合成部23の原理を説明するための機能構成を示す他の機能ブロック図である。
マルチチャンネル合成部23は、オールパスフィルタ261と、BCC処理部262と、演算部263とを備えている。
オールパスフィルタ261は、ダウンミックス信号Mを取得して、そのダウンミックス信号Mに対して相関性のない無相関信号Mrevを生成して出力する。ダウンミックス信号Mと無相関信号Mrevとは、それぞれを聴覚的に比較すると、「相互にインコヒーレント」であるとみなされる。また、無相関信号Mrevはダウンミックス信号Mと同じエネルギーを有し、まるで音が広がっているかのような幻覚を作り出す有限時間の残響成分を含む。
BCC処理部262は、BC情報を取得して、そのBC情報に含まれるレベル情報IIDや相関情報ICCなどに基づいて、L,R間の相関の程度や、L,Rの指向性を維持するためのミキシング係数Hijを生成して出力する。
演算部263は、ダウンミックス信号M、無相関信号Mrev、及びミキシング係数Hijを取得して、これらを用いて下記の式(1)に示される演算を行い、オーディオ信号L,Rを出力する。このように、ミキシング係数Hijを用いることによって、オーディオ信号L,R間の相関の程度や、それらの信号の指向性を、意図した状態にすることができる。
Figure 2007026821
…(1)
図4は、マルチチャンネル合成部23の詳細な構成を示すブロック図である。なお、デコーダ22も併せて図示されている。
デコーダ22は、符号化ダウミックス信号を時間領域のダウンミックス信号Mに復号化し、復号化したダウンミックス信号Mをマルチチャンネル合成部23に出力する。
マルチチャンネル合成部23は、分析フィルタバンク231と、チャンネル拡大部232と、時間的処理装置(エネルギー整形装置)900とを備えている。チャンネル拡大部232は、プレマトリックス処理部2321、ポストマトリックス処理部2322、第1演算部2323、無相関処理部2324及び第2演算部2325によって、構成されている。
分析フィルタバンク231は、デコーダ22から出力されたダウンミックス信号Mを取得し、そのダウンミックス信号Mの表現形式を、時間/周波数ハイブリッド表現に変換し、略式のベクトルxで表される第1周波数帯域信号xとして出力する。なお、この分析フィルタバンク231は第1ステージ及び第2ステージを備える。例えば、第1ステージはQMFフィルタバンクであり、第2ステージはナイキストフィルタバンクである。これらのステージでは、まずQMFフィルタ(第1のステージ)で複数の周波数帯域に分割し、さらにナイキストフィルタ(第2のステージ)で低周波数側のサブバンドをさらに微細なサブバンドに分けることによって、低周波数サブバンドのスペクトルの分解能を高めている。
チャンネル拡大部232のプレマトリックス処理部2321は、信号強度レベルの各チャンネルへの配分(スケーリング)を示すスケーリングファクタたる行列R1を、BC情報を用いて生成する。
例えば、プレマトリックス処理部2321は、ダウンミックス信号Mの信号強度レベルと、第1ダウンミックス信号M1、第2ダウンミックス信号M2、第3ダウンミックス信号M3及び第4ダウンミックス信号M4の信号強度レベルとの比率を示すレベル情報IIDを用いて行列R1を生成する。
つまり、プレマトリックス処理部2321は、図2に示される第1〜第5チャンネル分離部241〜245が無相関信号を生成するために用いることができる中間信号を生成することを目的として、入力ダウンミックス信号MのエネルギーレベルをスケーリングするILD空間パラメータから合成信号M1からM4のILD空間的パラメータのベクトルエレメントR1[0]からR1[4]からなるスケーリング係数のベクトルR1を算出する。
第1演算部2323は、分析フィルタバンク231から出力された時間/周波数ハイブリッド表現の第1周波数帯域信号xを取得し、例えば、下記式(2)及び式(3)に示すように、その第1周波数帯域信号xと行列R1との積を算出する。そして、第1演算部2323は、その行列演算結果を示す中間信号vを出力する。つまり、第1演算部2323は、分析フィルタバンク231から出力された時間/周波数ハイブリッド表現の第1周波数帯域信号xから、4つのダウンミックス信号M1〜M4を分離する。
Figure 2007026821
…(2)
ここで、M1〜M4は、下記式(3)で表される。
Figure 2007026821
…(3)
無相関処理部2324は、図3に示すオールパスフィルタ261としての機能を有し、中間信号vに対してオールパスフィルタ処理を施すことによって、下記式(4)に示すように、無相関信号wを生成して出力する。なお、無相関信号wの構成要素Mrev及びMi,revは、ダウンミックス信号M,Miに対して無相関処理が施された信号である。
Figure 2007026821
…(4)
なお、上記式(4)のwDryは元のダウンミックス信号から構成され(以後「ドライ」信号とも記す。)、wWetは無相関信号の集まりで構成される(以後「ウェット」信号とも記す。)。
ポストマトリックス処理部2322は、残響の各チャンネルへの配分を示す行列R2を、BC情報を用いて生成する。つまり、ポストマトリックス処理部2322は、個々の信号を導出するために、MとMi,revをミキシングするミキシング係数のマトリックスR2を算出する。例えば、ポストマトリックス処理部2322は、音像の幅や拡散性を示す相関情報ICCからミキシング係数Hijを導出し、そのミキシング係数Hijから構成される行列R2を生成する。
第2演算部2325は、無相関信号wと行列R2との積を算出し、その行列演算結果を示す出力信号yを出力する。つまり、第2演算部2325は、無相関信号wから、6つのオーディオ信号Lf,Rf,Ls,Rs,C,LFEを分離する。
例えば、図2に示すように、左前オーディオ信号Lfは、第2ダウンミックス信号M2から分離されるため、その左前オーディオ信号Lfの分離には、第2ダウンミックス信号M2と、それに対応する無相関信号wの構成要素M2,revとが用いられる。同様に、第2ダウンミックス信号M2は、第1ダウンミックス信号M1から分離されるため、その第2ダウンミックス信号M2の算出には、第1ダウンミックス信号M1と、それに対応する無相関信号wの構成要素M1,revとが用いられる。
したがって、左前オーディオ信号Lfは、下記の式(5)により示される。
Figure 2007026821
…(5)
ここで、式(5)中のHij,Aは、第3チャンネル分離部243におけるミキシング係数であり、Hij,Dは、第2チャンネル分離部242におけるミキシング係数であり、Hij,Eは、第1チャンネル分離部241におけるミキシング係数である。式(5)に示す3つの数式は、以下の式(6)に示す一つのベクトル乗算式にまとめることができる。
Figure 2007026821
…(6)
左前オーディオ信号Lf以外の他のオーディオ信号Rf,C,LFE,Ls,Rsも、上述のような行列と無相関信号wの行列との演算によって算出される。
つまり、出力信号yは、下記の式(7)によって示される。
Figure 2007026821
…(7)
第1〜第5チャンネル分離部241〜245からのミキシング係数の倍数集合からなるマトリックスであるR2は、マルチチャンネル信号を生成するために、M、Mrev、M2,rev、… M4,revを線形結合したようにみられる。後続のエネルギー整形処理のために、yDryとyWetは別々に格納される。
時間的処理装置900は、復元された各オーディオ信号の表現形式を、時間/周波数ハイブリッド表現から時間表現に変換し、その時間表現の複数のオーディオ信号をマルチチャンネル信号として出力する。なお、時間的処理装置900は、分析フィルタバンク231と整合するように、例えば2つのステージから構成される。また、行列R1,R2は、上述のパラメータバンドb毎に、行列R1(b),R2(b)として生成される。
ここで、ウェット信号とドライ信号がマージされる前に、ウェット信号はドライ信号の時間的エンベロープに従って整形される。このモジュール、時間的処理装置900は、アタック音などのように高速な時間変化特性をもつ信号にとって不可欠なものである。
つまり、時間的処理装置900は、アタック音や音声信号のような時間変化の急激な信号の場合に、音がなまることを改善するために、ダイレクト信号の時間包絡に適合するように、拡散信号の時間包絡を整形した信号とダイレクト信号とを加算して出力することにより、原音の音質を保つ。
図5は、図4に示される時間的処理装置900の詳細な構成を示すブロック図である。
図5に示されるように、時間的処理装置900は、スプリッタ901と、合成フィルタバンク902,903と、ダウンミックス部904と、バンドパスフィルタ(BPF)905,906と、正規化処理部907,908と、スケール算出処理部909と、平滑化処理部910と、演算部911と、ハイパスフィルタ(HPF)912と、加算部913とを備える。
スプリッタ901は、復元された信号yを、下記式(8)、式(9)のようにダイレクト信号ydirectと、拡散信号ydiffuseとに分割する。
Figure 2007026821
…(8)
Figure 2007026821
…(9)
合成フィルタバンク902は、6つのダイレクト信号を時間領域へ変換する。合成フィルタバンク903は、合成フィルタバンク902と同様に、6つの拡散信号を時間領域へ変換する。
ダウンミックス部904は、下記式(10)に基づいて、時間領域における6つのダイレクト信号を1つのダイレクトダウンミックス信号Mdirectとなるように加算する。
Figure 2007026821
…(10)
BPF905は、1つのダイレクトダウンミックス信号に帯域通過処理を施す。BPF906は、BPF905と同様に、6つの全ての拡散信号に帯域通過処理を施す。帯域通過処理を施されたダイレクトダウンミックス信号及び拡散信号は下記式(11)に示される。
Figure 2007026821
…(11)
正規化処理部907は、下記に示される式(12)に基づいて、ダイレクトダウンミックス信号が1つの処理フレームにわたって1つのエネルギーを有するように正規化する。
Figure 2007026821
…(12)
正規化処理部908は、正規化処理部907と同様に、下記に示される式(13)に基づいて、6つの拡散信号を正規化する。
Figure 2007026821
…(13)
正規化された信号は、スケール算出処理部909において、時間ブロックに分割される。そして、スケール算出処理部909は、それぞれの時間ブロックについて、下記式(14)に基づいてスケール係数を算出する。
Figure 2007026821
…(14)
なお、図6は、上記式(14)の時間ブロックbが「ブロックインデックス」を示す場合の、上記分割処理を示す図である。
最後に、前記拡散信号は演算部911においてスケーリングされ、以下のように加算部913において前記ダイレクト信号に組み合わされる前に、HPF912において下記式(15)に基づいて、高域フィルタ処理が施される。
Figure 2007026821
…(15)
なお、平滑化処理部910は、連続した時間ブロックにわたるスケーリング係数の平滑性を高める付加的な技術である。例えば、連続した時間ブロックは、図6中のαで示されるようにそれぞれ重複していてもよく、重複領域において、「重み付けされた」スケール係数は、ウィンドウ機能を用いて演算される。
スケーリング処理911においても、当業者には周知のそのような公知の重複加算技術を用いることができる。
このように従来の時間的処理装置900では、元の信号それぞれについて時間領域の個々の無相関信号を整形することによる、上記エネルギー整形方法を提示している。
J. Herre, et al, "The Reference Model Architecture for MPEG Spatial Audio Coding", 118th AES Convention, Barcelona
しかしながら、従来のエネルギー整形装置では、半分がダイレクト信号であり、もう半分が拡散信号である12の信号に対する合成フィルタ処理を必要とするため、演算負荷が非常に重い。また、様々な帯域及び高域フィルタの使用することはフィルタ処理の遅延を引き起こす。
すなわち、従来のエネルギー整形装置では、スプリッタ901によって分割されたダイレクト信号と、拡散信号とを合成フィルタバンク902,903により時間領域の信号にそれぞれ変換している。このため、例えば入力オーディオ信号が6チャンネルの場合、時間フレーム毎に6×2=12個の合成フィルタ処理が必要となり、処理量が非常に大きいという問題がある。
また、合成フィルタバンク902,903により変換された時間領域のダイレクト信号及び拡散信号信号について帯域通過処理を施したり、高域通過処理を施しているので、これらの通過処理に要する遅延が発生するという問題もある。
そこで本発明は、上述の問題を解決し、合成フィルタ処理の処理量を低減し、通過処理に要する遅延の発生を防止することができるエネルギー整形装置及びエネルギー整形方法を提供することを目的とする。
上記目的を達成するために、本発明に係るエネルギー整形装置においては、マルチチャンネル音響信号の復号化においてエネルギー整形を行うエネルギー整形装置であって、ハイブリッド時間・周波数変換によって得られるサブバンド領域の音響信号を、残響成分を示す拡散信号と、非残響成分を示すダイレクト信号に分割するスプリッタ手段と、前記ダイレクト信号をダウンミックスすることによってダウンミックス信号を生成するダウンミックス手段と、前記ダウンミックス信号及び前記サブバンド毎に分割された拡散信号に対して、サブバンド毎に帯域通過処理を施すことによって、それぞれ、帯域通過ダウンミックス信号及び帯域通過拡散信号を生成するフィルタ処理手段と、前記帯域通過ダウンミックス信号及び前記帯域通過拡散信号に対して、それぞれのエネルギーについて正規化することによって、それぞれ、正規化ダウンミックス信号及び正規化拡散信号を生成する正規化処理手段と、予め定められた時間スロット毎に、前記正規化拡散信号のエネルギーに対する前記正規化ダウンミックス信号のエネルギーの大きさを示すスケール係数を算出するスケール係数算出手段と、前記拡散信号に前記スケール係数を乗じることによって、スケール拡散信号を生成する乗算手段と、前記スケール拡散信号に対して高域通過処理を施すことによって、高域通過拡散信号を生成する高域通過処理手段と、前記高域通過拡散信号と前記ダイレクト信号とを加算することによって、加算信号を生成する加算手段と、前記加算信号に対して合成フィルタ処理を施すことによって、時間領域信号に変換する合成フィルタ処理手段とを備えることを特徴とする。
このように、合成フィルタ処理を行う前に、各チャンネルのダイレクト信号及び拡散信号について、サブバンド毎に帯域通過処理を行うようにしている。このため、帯域通過処理を単純な乗算で実現することができ、帯域通過処理に要する遅延を防止することができる。しかも、各チャンネルのダイレクト信号及び拡散信号について処理がすんだ後に加算信号に対して合成フィルタ処理を施すことによって、時間領域信号に変換する合成フィルタ処理を行うようにしている。このため、例えば6チャンネルの場合、合成フィルタ処理の個数を6に減らすことができ、合成フィルタ処理の処理量を従来より半減させることができる。
また、本発明に係るエネルギー整形装置においては、前記エネルギー整形装置はさらに、前記スケール係数に対して時間スロット毎の変動を押さえる平滑化処理を施すことによって、平滑化スケール係数を生成する平滑化手段を備えることを特徴とすることができる。
これにより、周波数領域で求めたスケール係数の値が急激に変化する、あるいはオーバーフローし、音質劣化を引き起こすという問題の発生を未然に防止することができる。
また、本発明に係るエネルギー整形装置においては、前記平滑化手段は、現在の時間スロットにおけるスケール係数に対してαを乗じて得られる値と、直前の時間スロットにおけるスケール係数に対して(1−α)を乗じて得られる値とを加算することにより、前記平滑化処理を施すことを特徴とすることもできる。
これにより、簡単な処理で、周波数領域で求めたスケール係数の値の急激な変化や、オーバーフローを防止することができる。
また、本発明に係るエネルギー整形装置においては、前記エネルギー整形装置はさらに、前記スケール係数に対して、予め定められた上限値を超える場合には上限値に制限するとともに、予め下限値を下回る場合には下限値に制限することにより、前記スケール係数に対するクリップ処理を施すクリップ処理手段を備えることを特徴とすることができる。
これによっても、周波数領域で求めたスケール係数の値が急激に変化する、あるいはオーバーフローし、音質劣化を引き起こすという問題の発生を未然に防止することができる。
また、本発明に係るエネルギー整形装置においては、前記クリップ処理手段は、上限値をβとした場合に、下限値を1/βとして、前記クリップ処理を施すことを特徴とすることができる。
これによっても、簡単な処理で、周波数領域で求めたスケール係数の値の急激な変化や、オーバーフローを防止することができる。
また、本発明に係るエネルギー整形装置においては、前記ダイレクト信号には、前記音響信号の低周波帯域における残響成分と非残響成分、及び、前記音響信号の高周波帯域における非残響成分が含まれることを特徴とすることができる。
また、本発明に係るエネルギー整形装置においては、前記拡散信号には、前記音響信号の高周波帯域における残響成分が含まれ、前記音響信号の低周波成分が含まれないことを特徴とすることができる。
また、本発明に係るエネルギー整形装置においては、前記エネルギー整形装置はさらに、前記音響信号に対するエネルギー整形を施すか施さないかを切り替える制御手段を備えることを特徴とすることができる。 これにより、エネルギー整形を施すか施さないかを切り替えることで、音の時間的変動のシャープさや、音像のしっかりとした定位の両立を実現することができる。
また、本発明に係るエネルギー整形装置においては、前記制御手段は、エネルギー整形処理を施すか施さないかを制御する制御フラグに従って、前記拡散信号及び前記高域通過拡散信号のいずれかを選択し、前記加算手段は、前記制御手段で選択された信号と前記ダイレクト信号とを加算することを特徴とすることもできる。
これにより、時々刻々エネルギー整形を施すか施さないかを簡単に切り替えることができる。
なお、本発明は、このようなエネルギー整形装置として実現することができるだけでなく、このようなエネルギー整形装置が備える特徴的な手段をステップとするエネルギー整形方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したり、エネルギー整形装置が備える特徴的な手段を集積回路化することもできる。そして、そのようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのはいうまでもない。
以上の説明から明らかなように、本発明に係るエネルギー整形装置によれば、ビットストリームのシンタックスを変形することなく、高音質を維持したまま、合成フィルタ処理の処理量を低減し、通過処理に要する遅延の発生を防止することができる。
よって、本発明により、携帯電話機や携帯情報端末への音楽コンテンツの配信や、視聴が普及してきた今日における本願発明の実用的価値は極めて高い。
図1は、空間的符号化の基本原理を用いたオーディオ装置の全体構成を示すブロック図である。 図2は、6チャンネル時におけるマルチチャンネル合成部23の機能構成を示すブロック図である。 図3は、マルチチャンネル合成部23の原理を説明するための機能構成を示す他の機能ブロック図である。 図4は、マルチチャンネル合成部23の詳細な構成を示すブロック図である。 図5は、図4に示される時間的処理装置900の詳細な構成を示すブロック図である。 図6は、従来の整形方法における重複ウィンドウ化処理に基づく平滑化技術を示す図である。 図7は、本実施の形態1における時間的処理装置(エネルギー整形装置)の構成を示す図である。 図8は、サブバンド領域における帯域フィルタ処理及び演算節約のための考慮を示す図である。 図9は、本実施の形態1における時間的処理装置(エネルギー整形装置)の構成を示す図である。
符号の説明
600a,600b 時間的処理装置
601 スプリッタ
604 ダウンミックス部
605,606 BPF
607,608正規化処理部
609 スケール算出処理部
610 平滑化処理部
611 演算部
612 HPF
613 加算部
614 合成フィルタバンク
615 制御部
以下、本発明の実施の形態について、図面を用いて詳細に説明する。なお、以下に示す実施の形態は、単に様々な進歩性の原理を説明しているにすぎない。ここに記載される詳細の変形は、当業者にとっては明らかであると理解される。よって、本発明は、特許請求項の範囲においてのみ限定されるのであって、以下の具体的、説明的な詳細に限定されるものではないとする。
(実施の形態1)
図7は、本実施の形態1における時間的処理装置(エネルギー整形装置)の構成を示す図である。
この時間的処理装置600aは、図5の時間的処理装置900に代えてマルチチャンネル合成部23を構成する装置であり、図7に示されるように、スプリッタ601と、ダウンミックス部604と、BPF605と、BPF606と、正規化処理部607と、正規化処理部608と、スケール算出処理部609と、平滑化処理部610と、演算部611と、HPF612と、加算部613と、合成フィルタバンク614とを備える。
この時間的処理装置600aでは、チャンネル拡大部232からのハイブリッド時間・周波数表現されたサブバンド領域での出力信号を直接入力とし、最後に合成フィルタで時間信号に戻すことによって、従来必要とされた合成フィルタ処理負荷の50パーセントを取り除き、さらに各部での処理を単純化できるように構成されている。
スプリッタ601の動作は、図5のスプリッタ901と同様であるので説明を省略する。つまり、スプリッタ601は、ハイブリッド時間・周波数変換によって得られるサブバンド領域の音響信号を、残響成分を示す拡散信号と、非残響成分を示すダイレクト信号に分割する。
ここで、ダイレクト信号には、音響信号の低周波帯域における残響成分と非残響成分、及び、前記音響信号の高周波帯域における非残響成分が含まれる。また、拡散信号には、音響信号の高周波帯域における残響成分が含まれ、音響信号の低周波成分が含まれない。これにより、アタック音等の時間変化の激しい音に対する適切ななまり防止処理を施すことができる。
非特許文献1記載のダウンミックス部904と、本発明におけるダウンミックス部604は、処理する信号が時間領域信号か、サブバンド領域信号かの違いがある。しかしながら、どちらも共通の一般的なマルチチャンネルダウンミックス処理手法を用いる。つまり、ダウンミックス部604は、ダイレクト信号をダウンミックスすることによってダウンミックス信号を生成する。
BPF605及びBPF606は、ダウンミックス信号及び前記サブバンド毎に分割された拡散信号に対して、サブバンド毎に帯域通過処理を施すことによって、それぞれ、帯域通過ダウンミックス信号及び帯域通過拡散信号を生成する。
図8に示されるように、BPF605及びBPF606における帯域フィルタ処理は、帯域フィルタの対応する周波数応答によるそれぞれのサブバンドの単純な乗算に単純化される。広義の意味で、帯域フィルタは乗算器としてみなすことができる。ここで、800は帯域フィルタの周波数応答を示す。さらにここで乗算演算は、重要な帯域応答をもった領域801だけ行うえばよいのでさらに演算量の削減が可能となる。例えば外部ストップバンド領域802及び803においては、乗算結果は0であると仮定すると、パスバンドの振幅が1である場合、乗算は単純な複製処理とみなすことができる。
つまり、BPF605及びBPF606における帯域フィルタ処理は、下記式(16)に基づいて行うことができる。
Figure 2007026821
…(16)
ここで、tsは時間スロットインデックス、sbはサブバンドインデックスである。Bandpass(sp)は、上記で説明したように単純な乗算器としてもよい。
正規化処理部607,608は、帯域通過ダウンミックス信号及び帯域通過拡散信号に対して、それぞれのエネルギーについて正規化することによって、それぞれ、正規化ダウンミックス信号及び正規化拡散信号を生成する。
正規化処理部607及び正規化処理部608は、非特許文献1開示の正規化処理部907及び正規化処理部908との違いは、処理する信号の領域が、正規化処理部607及び正規化処理部608はサブバンド領域の信号、正規化処理部907及び正規化処理部908は時間領域の信号という点と、以下に示すような複素共役を用いることを除いて、一般的な正規化処理手法、つまり下記式(17)に従う処理手法である点である。
この場合、サブバンド毎に正規化処理を行う必要があるが、正規化処理部607及び正規化処理部608の利点により、ゼロのデータをもつ空間領域においては演算が省略される。よって、正規化対象の全サンプルに対して処理しなければならない先行文献開示の正規化モジュールに比べて、全体としては演算負荷の増加はほとんどない。
Figure 2007026821
…(17)
スケール算出処理部609は、予め定められた時間スロット毎に、正規化拡散信号のエネルギーに対する正規化ダウンミックス信号のエネルギーの大きさを示すスケール係数を算出する。より具体的には、以下のように、むしろ時間ブロック毎ではなく時間スロット毎に実行されることを除けば、スケール算出処理部609の演算もまた、下記式(18)に示されるように、原則としてスケール算出処理部909と同様である。
Figure 2007026821
…(18)
処理対象となる時間領域データがはるかに少ない場合、平滑化処理部910の重複ウィンドウ処理に基づく平滑化技術も、平滑化処理部610に取って代わられなければならない。
ところが、本実施の形態に係る平滑化処理部610の場合、非常に細かい単位で平滑化処理が行われるために、スケール係数を先行文献記載のスケール係数(式(14))の考え方をそのまま用いると、平滑化の係方が極端に振れる場合があるので、スケール係数自身を平滑化する必要がある。
そのために例えば、下記式(19)に示されるような単純な低域フィルタが、時間スロット毎にscalei(ts)の大幅な変動を抑制するために用いることができる。
Figure 2007026821
…(19)
つまり、平滑化処理部610は、スケール係数に対して時間スロット毎の変動を押さえる平滑化処理を施すことによって、平滑化スケール係数を生成する。より詳しくは、平滑化処理部610は、現在の時間スロットにおけるスケール係数に対してαを乗じて得られる値と、直前の時間スロットにおけるスケール係数に対して(1−α)を乗じて得られる値とを加算することにより、平滑化処理を施す。
ここで、αは例えば0.45に設定する。またαの大きさを変えることによって,効果を制御することも可能となる(0≦α≦1)。
上記αの値は、符号化装置側であるオーディオエンコーダ10から送信することも可能であり、送信側にて平滑化処理を制御可能となり、非常に多岐にわたる効果を出すことが可能となる。もちろん、前記のように予め定められたαの値を平滑化処理装置の中で保持してもよい。
ところで、平滑化処理で処理する信号エネルギーが大きい場合など、特定の帯域にエネルギーが集中して、平滑化処理の出力がオーバーフローする恐れがある。その場合に備えて、例えば下記式(20)のようにscalei(ts)のクリッピング処理を行う。
Figure 2007026821
…(20)
ここで、βはクリッピングの係数であり、min()、max()はそれぞれ最小値、最大値を表す。
つまり、このクリップ処理手段(不図示)は、スケール係数に対して、予め定められた上限値を超える場合には上限値に制限するとともに、予め下限値を下回る場合には下限値に制限することにより、スケール係数に対するクリップ処理を施す。
式(20)は、各チャンネル毎に計算したscalei(ts)が、例えばβ=2.82の場合には、上限値が2.82に、下限値が1/2.82に設定され、その範囲の値に制限されることを意味している。なお、前記閾値である2.82及び1/2.82は一例であって、その値に限定するものではない。
演算部611は、拡散信号にスケール係数を乗じることによって、スケール拡散信号を生成する。HPF612は、スケール拡散信号に対して高域通過処理を施すことによって、高域通過拡散信号を生成する。加算部613は、高域通過拡散信号とダイレクト信号とを加算することによって、加算信号を生成する。
具体的には、演算部611、HPF612及びダイレクト信号との加算部613は、それぞれ合成フィルタバンク902、HPF912、及び加算部913のように行われる。
しかしながら、上記処理は下記式(21)に示されるように組み合わせることができる。
Figure 2007026821
…(21)
前述のBPF605及びBPF606における演算節約のための考慮(例えば、ストップバンドにゼロを、パスバンドに複製処理を適用)は、高域フィルタ612においても適用可能である。
合成フィルタバンク614は、加算信号に対して合成フィルタ処理を施すことによって、時間領域信号に変換する。すなわち、最後に、合成フィルタバンク614によって、新しいダイレクト信号y1を時間領域信号に変換する。
なお、本発明に含まれる各構成要素を、LSI(LargeScaleIntegration)などの集積回路によって構成してもよい。
さらに本発明は、これらの装置及び各構成要素における動作をコンピュータに実行させるプログラムとしても実現することができる。
(実施の形態2)
また、本発明を適用するかの決定は、ビットストリーム中のいくつかの制御フラグを設定し、図9に示される時間的処理装置600bの制御部615において、そのフラグによって一部復元信号の各フレーム毎に作動させる/作動させないを制御することも可能である。つまり、制御部615は、音響信号に対するエネルギー整形を施すか施さないかを時間フレーム毎あるいはチャンネル毎に切り替えるようにしてもよい。これにより、エネルギー整形を施すか施さないかを切り替えることで、音の時間的変動のシャープさや、音像のしっかりとした定位の両立を実現することができる。
このために例えば符号化処理の過程で、音響チャンネルを分析し、急激な変化を伴うエネルギーエンベロープをもっているかどうかの判定を行い、該当する音響チャンネルがある場合は、エネルギー整形が必要であるため、前記制御フラグはオンに設定し、復号時に制御フラグに従い整形処理を適用させるようにしてもよい。
つまり、制御手段615は、前記制御フラグに従って、拡散信号及び高域通過拡散信号のいずれかを選択し、加算部613は、制御部615で選択された信号とダイレクト信号とを加算するようにしてもよい。これにより、時々刻々エネルギー整形を施すか施さないかを簡単に切り替えることができる。
本発明に係るエネルギー整形装置は、メモリの必要容量を減らし、チップサイズをより小さくすることができる技術であり、ホームシアターシステム、車載音響システム、電子ゲームシステムや携帯電話機等、マルチチャンネル再生が望まれる装置に適用することが可能である。
本発明は、エネルギー整形装置及びエネルギー整形方法に関し、特に、マルチチャンネル音響信号の復号化においてエネルギー整形を行う技術に関する。
近年、MPEGオーディオ規格において、Spatial Audio Codec(空間的符号化)といわれる技術が規格化されつつある。これは、非常に少ない情報量で臨場感を示すマルチチャンネル信号を圧縮・符号化することを目的としている。例えば、既にデジタルテレビの音声方式として広く用いられているマルチチャンネルコーデックであるAAC(Advanced Audio Coding)方式が、5.1ch当り512kbpsや、384kbpsというビットレートを要するのに対し、Spatial Audio Codecでは、128kbpsや、64kbps、さらに48kbpsといった非常に少ないビットレートでマルチチャンネル音響信号を圧縮及び符号化することを目指している(例えば、非特許文献1参照)。
図1は、空間的符号化の基本原理を用いたオーディオ装置の全体構成を示すブロック図である。
オーディオ装置1は、オーディオ信号の組に対する空間音響符号化を行って符号化信号を出力するオーディオエンコーダ10と、その符号化信号を復号化するオーディオデコーダ20とを備えている。
オーディオエンコーダ10は、1024サンプルや、2048サンプルなどによって示されるフレーム単位で、複数チャンネルのオーディオ信号(例えば、2チャンネルのオーディオ信号L,R)を処理するものであって、ダウンミックス部11と、バイノーラルキュー検出部12と、エンコーダ13と、多重化部14とを備えている。
ダウンミックス部11は、例えば左右2チャンネルのスペクトル表現されたオーディオ信号L,Rの平均をとることによって、つまり、M=(L+R)/2によって、オーディオ信号L,Rがダウンミックスされたダウンミックス信号Mを生成する。
バイノーラルキュー検出部12は、スペクトルバンド毎に、オーディオ信号L,R及びダウンミックス信号Mを比較することによって、ダウンミックス信号Mを元のオーディオ信号L,Rに戻すためのBC情報(バイノーラルキュー)を生成する。
BC情報は、チャンネル間レベル/強度差(inter−channel level/intensity difference)を示すレベル情報IIDと、及びチャンネル間コヒーレンス/相関(inter−channel coherence/correlation)を示す相関情報ICCと、チャンネル間位相遅延差(inter−channel phase/delay difference)を示す位相情報IPDとを含む。
ここで、相関情報ICCが2つのオーディオ信号L,Rの類似性を示すのに対し、レベル情報IIDは相対的なオーディオ信号L,Rの強度を示す。一般に、レベル情報IIDは、音のバランスや定位を制御するための情報であって、相関情報ICCは、音像の幅や拡散性を制御するための情報である。これらは、共に聴き手が聴覚的情景を頭の中で構成するのを助ける空間パラメータである。
最新のスペーシャルコーデックにおいては、スペクトル表現されたオーディオ信号L,R及びダウンミックス信号Mは、「パラメータバンド」からなる通常複数のグループに区分されている。したがって、BC情報は、それぞれのパラメータバンド毎に算出される。なお、「BC情報(バイノーラルキュー)」と「空間パラメータ」という用語はしばしば同義的に、互換性をもって用いられる。
エンコーダ13は、例えば、MP3(MPEG Audio Layer−3)や、AAC(Advanced Audio Coding)などによって、ダウンミックス信号Mを圧縮符号化する。つまり、エンコーダ13は、ダウンミックス信号Mを符号化して、圧縮された符号化列を生成する。
多重化部14は、BC情報を量子化すると共に、圧縮されたダウンミックス信号Mと、量子化されたBC情報とを多重化することによりビットストリームを生成し、そのビットストリームを上述の符号化信号として出力する。
オーディオデコーダ20は、逆多重化部21と、デコーダ22と、マルチチャンネル合成部23とを備えている。
逆多重化部21は、上述のビットストリームを取得し、そのビットストリームから量子化されたBC情報と、符号化されたダウンミックス信号Mとを分離して出力する。なお、逆多重化部21は、量子化されたBC情報を逆量子化して出力する。
デコーダ22は、符号化されたダウンミックス信号Mを復号化して、ダウンミックス信号Mをマルチチャンネル合成部23に出力する。
マルチチャンネル合成部23は、デコーダ22から出力されたダウンミックス信号Mと、逆多重化部21から出力されたBC情報とを取得する。そして、マルチチャンネル合成部23は、そのBC情報を用いて、ダウンミックス信号Mから、2つのオーディオ信号L,Rを復元する。これらダウンミックス信号から元の2つの信号を復元する処理は、後述する「チャンネル分離技術」を伴う。
なお、上記の例は、エンコーダにおいてどのように二つの信号を1つのダウンミックス信号と空間パラメータの組で表すことができ、空間パラメータとダウンミックス信号を処理することによって、デコーダにおいてどのようにダウンミックス信号を2つの信号に分離することができるのかを説明するにすぎない。その技術は、音響の2より多いチャンネル(例えば、5.1の音源からの6つのチャンネル)を、符号化処理時に1つもしくは2つのダウンミックスチャンネルに圧縮することもでき、復号化処理において復元することができる。
すなわち、上述では、2チャンネルのオーディオ信号を符号化して復号化する例を挙げてオーディオ装置1を説明したが、オーディオ装置1は、2チャンネルよりも多いチャンネルのオーディオ信号(例えば、5.1チャンネル音源を構成する、6つのチャンネルのオーディオ信号)を、符号化及び復号化することもできる。
図2は、6チャンネル時におけるマルチチャンネル合成部23の機能構成を示すブロック図である。
マルチチャンネル合成部23は、例えば、ダウンミックス信号Mを6つのチャンネルのオーディオ信号に分離する場合、第1チャンネル分離部241と、第2チャンネル分離部242と、第3チャンネル分離部243と、第4チャンネル分離部244と、第5チャンネル分離部245とを備える。なお、ダウンミックス信号Mは、聴取者の正面に配置されるスピーカに対する正面オーディオ信号Cと、視聴者の左前方に配置されるスピーカに対する左前オーディオ信号Lfと、視聴者の右前方に配置されるスピーカに対する右前オーディオ信号Rfと、視聴者の左後方に配置されるスピーカに対する左後オーディオ信号Lsと、視聴者の右後方に配置されるスピーカに対する右後オーディオ信号Rsと、低音出力用サブウーファースピーカに対する低域オーディオ信号LFEとがダウンミックスされて構成されている。
第1チャンネル分離部241は、ダウンミックス信号Mから中間の第1ダウンミックス信号M1と中間の第4ダウンミックス信号M4とを分離して出力する。第1ダウンミックス信号M1は、正面オーディオ信号Cと左前オーディオ信号Lfと右前オーディオ信号Rfと低域オーディオ信号LFEとがダウンミックスされて構成されている。第4ダウンミックス信号M4は、左後オーディオ信号Lsと右後オーディオ信号Rsとがダウンミックスされて構成されている。
第2チャンネル分離部242は、第1ダウンミックス信号M1から中間の第2ダウンミックス信号M2と中間の第3ダウンミックス信号M3とを分離して出力する。第2ダウンミックス信号M2は、左前オーディオ信号Lfと右前オーディオ信号Rfとがダウンミックスされて構成されている。第3ダウンミックス信号M3は、正面オーディオ信号Cと低域オーディオ信号LFEとがダウンミックスされて構成されている。
第3チャンネル分離部243は、第2ダウンミックス信号M2から左前オーディオ信号Lfと右前オーディオ信号Rfとを分離して出力する。
第4チャンネル分離部244は、第3ダウンミックス信号M3から正面オーディオ信号Cと低域オーディオ信号LFEとを分離して出力する。
第5チャンネル分離部245は、第4ダウンミックス信号M4から左後オーディオ信号Lsと右後オーディオ信号Rsとを分離して出力する。
このように、マルチチャンネル合成部23は、マルチステージの方法によって、各チャンネル分離部で1つのダウンミックス信号を2つのダウンミックス信号に分離するという同一の分離処理を施し、単一のオーディオ信号が分離されるまで再帰的に信号の分離を毎回繰り返す。
図3は、マルチチャンネル合成部23の原理を説明するための機能構成を示す他の機能ブロック図である。
マルチチャンネル合成部23は、オールパスフィルタ261と、BCC処理部262と、演算部263とを備えている。
オールパスフィルタ261は、ダウンミックス信号Mを取得して、そのダウンミックス信号Mに対して相関性のない無相関信号Mrevを生成して出力する。ダウンミックス信号Mと無相関信号Mrevとは、それぞれを聴覚的に比較すると、「相互にインコヒーレント」であるとみなされる。また、無相関信号Mrevはダウンミックス信号Mと同じエネルギーを有し、まるで音が広がっているかのような幻覚を作り出す有限時間の残響成分を含む。
BCC処理部262は、BC情報を取得して、そのBC情報に含まれるレベル情報IIDや相関情報ICCなどに基づいて、L,R間の相関の程度や、L,Rの指向性を維持するためのミキシング係数Hijを生成して出力する。
演算部263は、ダウンミックス信号M、無相関信号Mrev、及びミキシング係数Hijを取得して、これらを用いて下記の式(1)に示される演算を行い、オーディオ信号L,Rを出力する。このように、ミキシング係数Hijを用いることによって、オーディオ信号L,R間の相関の程度や、それらの信号の指向性を、意図した状態にすることができる。
Figure 2007026821
…(1)
図4は、マルチチャンネル合成部23の詳細な構成を示すブロック図である。なお、デコーダ22も併せて図示されている。
デコーダ22は、符号化ダウンミックス信号を時間領域のダウンミックス信号Mに復号化し、復号化したダウンミックス信号Mをマルチチャンネル合成部23に出力する。
マルチチャンネル合成部23は、分析フィルタバンク231と、チャンネル拡大部232と、時間的処理装置(エネルギー整形装置)900とを備えている。チャンネル拡大部232は、プレマトリックス処理部2321、ポストマトリックス処理部2322、第1演算部2323、無相関処理部2324及び第2演算部2325によって、構成されている。
分析フィルタバンク231は、デコーダ22から出力されたダウンミックス信号Mを取得し、そのダウンミックス信号Mの表現形式を、時間/周波数ハイブリッド表現に変換し、略式のベクトルxで表される第1周波数帯域信号xとして出力する。なお、この分析フィルタバンク231は第1ステージ及び第2ステージを備える。例えば、第1ステージはQMFフィルタバンクであり、第2ステージはナイキストフィルタバンクである。これらのステージでは、まずQMFフィルタ(第1のステージ)で複数の周波数帯域に分割し、さらにナイキストフィルタ(第2のステージ)で低周波数側のサブバンドをさらに微細なサブバンドに分けることによって、低周波数サブバンドのスペクトルの分解能を高めている。
チャンネル拡大部232のプレマトリックス処理部2321は、信号強度レベルの各チャンネルへの配分(スケーリング)を示すスケーリングファクタたる行列R1を、BC情報を用いて生成する。
例えば、プレマトリックス処理部2321は、ダウンミックス信号Mの信号強度レベルと、第1ダウンミックス信号M1、第2ダウンミックス信号M2、第3ダウンミックス信号M3及び第4ダウンミックス信号M4の信号強度レベルとの比率を示すレベル情報IIDを用いて行列R1を生成する。
つまり、プレマトリックス処理部2321は、図2に示される第1〜第5チャンネル分離部241〜245が無相関信号を生成するために用いることができる中間信号を生成することを目的として、入力ダウンミックス信号MのエネルギーレベルをスケーリングするILD空間パラメータから合成信号M1からM4のILD空間的パラメータのベクトルエレメントR1[0]からR1[4]からなるスケーリング係数のベクトルR1を算出する。
第1演算部2323は、分析フィルタバンク231から出力された時間/周波数ハイブリッド表現の第1周波数帯域信号xを取得し、例えば、下記式(2)及び式(3)に示すように、その第1周波数帯域信号xと行列R1との積を算出する。そして、第1演算部2323は、その行列演算結果を示す中間信号vを出力する。つまり、第1演算部2323は、分析フィルタバンク231から出力された時間/周波数ハイブリッド表現の第1周波数帯域信号xから、4つのダウンミックス信号M1〜M4を分離する。
Figure 2007026821
…(2)
ここで、M1〜M4は、下記式(3)で表される。
Figure 2007026821
…(3)
無相関処理部2324は、図3に示すオールパスフィルタ261としての機能を有し、中間信号vに対してオールパスフィルタ処理を施すことによって、下記式(4)に示すように、無相関信号wを生成して出力する。なお、無相関信号wの構成要素Mrev及びMi,revは、ダウンミックス信号M,Miに対して無相関処理が施された信号である。
Figure 2007026821
…(4)
なお、上記式(4)のwDryは元のダウンミックス信号から構成され(以後「ドライ」信号とも記す。)、wWetは無相関信号の集まりで構成される(以後「ウェット」信号とも記す。)。
ポストマトリックス処理部2322は、残響の各チャンネルへの配分を示す行列R2を、BC情報を用いて生成する。つまり、ポストマトリックス処理部2322は、個々の信号を導出するために、MとMi,revをミキシングするミキシング係数のマトリックスR2を算出する。例えば、ポストマトリックス処理部2322は、音像の幅や拡散性を示す相関情報ICCからミキシング係数Hijを導出し、そのミキシング係数Hijから構成される行列R2を生成する。
第2演算部2325は、無相関信号wと行列R2との積を算出し、その行列演算結果を示す出力信号yを出力する。つまり、第2演算部2325は、無相関信号wから、6つのオーディオ信号Lf,Rf,Ls,Rs,C,LFEを分離する。
例えば、図2に示すように、左前オーディオ信号Lfは、第2ダウンミックス信号M2から分離されるため、その左前オーディオ信号Lfの分離には、第2ダウンミックス信号M2と、それに対応する無相関信号wの構成要素M2,revとが用いられる。同様に、第2ダウンミックス信号M2は、第1ダウンミックス信号M1から分離されるため、その第2ダウンミックス信号M2の算出には、第1ダウンミックス信号M1と、それに対応する無相関信号wの構成要素M1,revとが用いられる。
したがって、左前オーディオ信号Lfは、下記の式(5)により示される。
Figure 2007026821
…(5)
ここで、式(5)中のHij,Aは、第3チャンネル分離部243におけるミキシング係数であり、Hij,Dは、第2チャンネル分離部242におけるミキシング係数であり、Hij,Eは、第1チャンネル分離部241におけるミキシング係数である。式(5)に示す3つの数式は、以下の式(6)に示す一つのベクトル乗算式にまとめることができる。
Figure 2007026821
…(6)
左前オーディオ信号Lf以外の他のオーディオ信号Rf,C,LFE,Ls,Rsも、上述のような行列と無相関信号wの行列との演算によって算出される。
つまり、出力信号yは、下記の式(7)によって示される。
Figure 2007026821
…(7)
第1〜第5チャンネル分離部241〜245からのミキシング係数の倍数集合からなるマトリックスであるR2は、マルチチャンネル信号を生成するために、M、Mrev、M2,rev、… M4,revを線形結合したようにみられる。後続のエネルギー整形処理のために、yDryとyWetは別々に格納される。
時間的処理装置900は、復元された各オーディオ信号の表現形式を、時間/周波数ハイブリッド表現から時間表現に変換し、その時間表現の複数のオーディオ信号をマルチチャンネル信号として出力する。なお、時間的処理装置900は、分析フィルタバンク231と整合するように、例えば2つのステージから構成される。また、行列R1,R2は、上述のパラメータバンドb毎に、行列R1(b),R2(b)として生成される。
ここで、ウェット信号とドライ信号がマージされる前に、ウェット信号はドライ信号の時間的エンベロープに従って整形される。このモジュール、時間的処理装置900は、アタック音などのように高速な時間変化特性をもつ信号にとって不可欠なものである。
つまり、時間的処理装置900は、アタック音や音声信号のような時間変化の急激な信号の場合に、音がなまることを改善するために、ダイレクト信号の時間包絡に適合するように、拡散信号の時間包絡を整形した信号とダイレクト信号とを加算して出力することにより、原音の音質を保つ。
図5は、図4に示される時間的処理装置900の詳細な構成を示すブロック図である。
図5に示されるように、時間的処理装置900は、スプリッタ901と、合成フィルタバンク902,903と、ダウンミックス部904と、バンドパスフィルタ(BPF)905,906と、正規化処理部907,908と、スケール算出処理部909と、平滑化処理部910と、演算部911と、ハイパスフィルタ(HPF)912と、加算部913とを備える。
スプリッタ901は、復元された信号yを、下記式(8)、式(9)のようにダイレクト信号ydirectと、拡散信号ydiffuseとに分割する。
Figure 2007026821
…(8)
Figure 2007026821
…(9)
合成フィルタバンク902は、6つのダイレクト信号を時間領域へ変換する。合成フィルタバンク903は、合成フィルタバンク902と同様に、6つの拡散信号を時間領域へ変換する。
ダウンミックス部904は、下記式(10)に基づいて、時間領域における6つのダイレクト信号を1つのダイレクトダウンミックス信号Mdirectとなるように加算する。
Figure 2007026821
…(10)
BPF905は、1つのダイレクトダウンミックス信号に帯域通過処理を施す。BPF906は、BPF905と同様に、6つの全ての拡散信号に帯域通過処理を施す。帯域通過処理を施されたダイレクトダウンミックス信号及び拡散信号は下記式(11)に示される。
Figure 2007026821
…(11)
正規化処理部907は、下記に示される式(12)に基づいて、ダイレクトダウンミックス信号が1つの処理フレームにわたって1つのエネルギーを有するように正規化する。
Figure 2007026821
…(12)
正規化処理部908は、正規化処理部907と同様に、下記に示される式(13)に基づいて、6つの拡散信号を正規化する。
Figure 2007026821
…(13)
正規化された信号は、スケール算出処理部909において、時間ブロックに分割される。そして、スケール算出処理部909は、それぞれの時間ブロックについて、下記式(14)に基づいてスケール係数を算出する。
Figure 2007026821
…(14)
なお、図6は、上記式(14)の時間ブロックbが「ブロックインデックス」を示す場合の、上記分割処理を示す図である。
最後に、前記拡散信号は演算部911においてスケーリングされ、以下のように加算部913において前記ダイレクト信号に組み合わされる前に、HPF912において下記式(15)に基づいて、高域フィルタ処理が施される。
Figure 2007026821
…(15)
なお、平滑化処理部910は、連続した時間ブロックにわたるスケーリング係数の平滑性を高める付加的な技術である。例えば、連続した時間ブロックは、図6中のαで示されるようにそれぞれ重複していてもよく、重複領域において、「重み付けされた」スケール係数は、ウィンドウ機能を用いて演算される。
スケーリング処理911においても、当業者には周知のそのような公知の重複加算技術を用いることができる。
このように従来の時間的処理装置900では、元の信号それぞれについて時間領域の個々の無相関信号を整形することによる、上記エネルギー整形方法を提示している。
J. Herre, et al, "The Reference Model Architecture for MPEG Spatial Audio Coding", 118th AES Convention, Barcelona
しかしながら、従来のエネルギー整形装置では、半分がダイレクト信号であり、もう半分が拡散信号である12の信号に対する合成フィルタ処理を必要とするため、演算負荷が非常に重い。また、様々な帯域及び高域フィルタの使用することはフィルタ処理の遅延を引き起こす。
すなわち、従来のエネルギー整形装置では、スプリッタ901によって分割されたダイレクト信号と、拡散信号とを合成フィルタバンク902,903により時間領域の信号にそれぞれ変換している。このため、例えば入力オーディオ信号が6チャンネルの場合、時間フレーム毎に6×2=12個の合成フィルタ処理が必要となり、処理量が非常に大きいという問題がある。
また、合成フィルタバンク902,903により変換された時間領域のダイレクト信号及び拡散信号信号について帯域通過処理を施したり、高域通過処理を施しているので、これらの通過処理に要する遅延が発生するという問題もある。
そこで本発明は、上述の問題を解決し、合成フィルタ処理の処理量を低減し、通過処理に要する遅延の発生を防止することができるエネルギー整形装置及びエネルギー整形方法を提供することを目的とする。
上記目的を達成するために、本発明に係るエネルギー整形装置においては、マルチチャンネル音響信号の復号化においてエネルギー整形を行うエネルギー整形装置であって、ハイブリッド時間・周波数変換によって得られるサブバンド領域の音響信号を、残響成分を示す拡散信号と、非残響成分を示すダイレクト信号に分割するスプリッタ手段と、前記ダイレクト信号をダウンミックスすることによってダウンミックス信号を生成するダウンミックス手段と、前記ダウンミックス信号及び前記サブバンド毎に分割された拡散信号に対して、サブバンド毎に帯域通過処理を施すことによって、それぞれ、帯域通過ダウンミックス信号及び帯域通過拡散信号を生成するフィルタ処理手段と、前記帯域通過ダウンミックス信号及び前記帯域通過拡散信号に対して、それぞれのエネルギーについて正規化することによって、それぞれ、正規化ダウンミックス信号及び正規化拡散信号を生成する正規化処理手段と、予め定められた時間スロット毎に、前記正規化拡散信号のエネルギーに対する前記正規化ダウンミックス信号のエネルギーの大きさを示すスケール係数を算出するスケール係数算出手段と、前記拡散信号に前記スケール係数を乗じることによって、スケール拡散信号を生成する乗算手段と、前記スケール拡散信号に対して高域通過処理を施すことによって、高域通過拡散信号を生成する高域通過処理手段と、前記高域通過拡散信号と前記ダイレクト信号とを加算することによって、加算信号を生成する加算手段と、前記加算信号に対して合成フィルタ処理を施すことによって、時間領域信号に変換する合成フィルタ処理手段とを備えることを特徴とする。
このように、合成フィルタ処理を行う前に、各チャンネルのダイレクト信号及び拡散信号について、サブバンド毎に帯域通過処理を行うようにしている。このため、帯域通過処理を単純な乗算で実現することができ、帯域通過処理に要する遅延を防止することができる。しかも、各チャンネルのダイレクト信号及び拡散信号について処理がすんだ後に加算信号に対して合成フィルタ処理を施すことによって、時間領域信号に変換する合成フィルタ処理を行うようにしている。このため、例えば6チャンネルの場合、合成フィルタ処理の個数を6に減らすことができ、合成フィルタ処理の処理量を従来より半減させることができる。
また、本発明に係るエネルギー整形装置においては、前記エネルギー整形装置はさらに、前記スケール係数に対して時間スロット毎の変動を押さえる平滑化処理を施すことによって、平滑化スケール係数を生成する平滑化手段を備えることを特徴とすることができる。
これにより、周波数領域で求めたスケール係数の値が急激に変化する、あるいはオーバーフローし、音質劣化を引き起こすという問題の発生を未然に防止することができる。
また、本発明に係るエネルギー整形装置においては、前記平滑化手段は、現在の時間スロットにおけるスケール係数に対してαを乗じて得られる値と、直前の時間スロットにおけるスケール係数に対して(1−α)を乗じて得られる値とを加算することにより、前記平滑化処理を施すことを特徴とすることもできる。
これにより、簡単な処理で、周波数領域で求めたスケール係数の値の急激な変化や、オーバーフローを防止することができる。
また、本発明に係るエネルギー整形装置においては、前記エネルギー整形装置はさらに、前記スケール係数に対して、予め定められた上限値を超える場合には上限値に制限するとともに、予め下限値を下回る場合には下限値に制限することにより、前記スケール係数に対するクリップ処理を施すクリップ処理手段を備えることを特徴とすることができる。
これによっても、周波数領域で求めたスケール係数の値が急激に変化する、あるいはオーバーフローし、音質劣化を引き起こすという問題の発生を未然に防止することができる。
また、本発明に係るエネルギー整形装置においては、前記クリップ処理手段は、上限値をβとした場合に、下限値を1/βとして、前記クリップ処理を施すことを特徴とすることができる。
これによっても、簡単な処理で、周波数領域で求めたスケール係数の値の急激な変化や、オーバーフローを防止することができる。
また、本発明に係るエネルギー整形装置においては、前記ダイレクト信号には、前記音響信号の低周波帯域における残響成分と非残響成分、及び、前記音響信号の高周波帯域における非残響成分が含まれることを特徴とすることができる。
また、本発明に係るエネルギー整形装置においては、前記拡散信号には、前記音響信号の高周波帯域における残響成分が含まれ、前記音響信号の低周波成分が含まれないことを特徴とすることができる。
また、本発明に係るエネルギー整形装置においては、前記エネルギー整形装置はさらに、前記音響信号に対するエネルギー整形を施すか施さないかを切り替える制御手段を備えることを特徴とすることができる。これにより、エネルギー整形を施すか施さないかを切り替えることで、音の時間的変動のシャープさや、音像のしっかりとした定位の両立を実現することができる。
また、本発明に係るエネルギー整形装置においては、前記制御手段は、エネルギー整形処理を施すか施さないかを制御する制御フラグに従って、前記拡散信号及び前記高域通過拡散信号のいずれかを選択し、前記加算手段は、前記制御手段で選択された信号と前記ダイレクト信号とを加算することを特徴とすることもできる。
これにより、時々刻々エネルギー整形を施すか施さないかを簡単に切り替えることができる。
なお、本発明は、このようなエネルギー整形装置として実現することができるだけでなく、このようなエネルギー整形装置が備える特徴的な手段をステップとするエネルギー整形方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したり、エネルギー整形装置が備える特徴的な手段を集積回路化することもできる。そして、そのようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのはいうまでもない。
以上の説明から明らかなように、本発明に係るエネルギー整形装置によれば、ビットストリームのシンタックスを変形することなく、高音質を維持したまま、合成フィルタ処理の処理量を低減し、通過処理に要する遅延の発生を防止することができる。
よって、本発明により、携帯電話機や携帯情報端末への音楽コンテンツの配信や、視聴が普及してきた今日における本願発明の実用的価値は極めて高い。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。なお、以下に示す実施の形態は、単に様々な進歩性の原理を説明しているにすぎない。ここに記載される詳細の変形は、当業者にとっては明らかであると理解される。よって、本発明は、特許請求項の範囲においてのみ限定されるのであって、以下の具体的、説明的な詳細に限定されるものではないとする。
(実施の形態1)
図7は、本実施の形態1における時間的処理装置(エネルギー整形装置)の構成を示す図である。
この時間的処理装置600aは、図5の時間的処理装置900に代えてマルチチャンネル合成部23を構成する装置であり、図7に示されるように、スプリッタ601と、ダウンミックス部604と、BPF605と、BPF606と、正規化処理部607と、正規化処理部608と、スケール算出処理部609と、平滑化処理部610と、演算部611と、HPF612と、加算部613と、合成フィルタバンク614とを備える。
この時間的処理装置600aでは、チャンネル拡大部232からのハイブリッド時間・周波数表現されたサブバンド領域での出力信号を直接入力とし、最後に合成フィルタで時間信号に戻すことによって、従来必要とされた合成フィルタ処理負荷の50パーセントを取り除き、さらに各部での処理を単純化できるように構成されている。
スプリッタ601の動作は、図5のスプリッタ901と同様であるので説明を省略する。つまり、スプリッタ601は、ハイブリッド時間・周波数変換によって得られるサブバンド領域の音響信号を、残響成分を示す拡散信号と、非残響成分を示すダイレクト信号に分割する。
ここで、ダイレクト信号には、音響信号の低周波帯域における残響成分と非残響成分、及び、前記音響信号の高周波帯域における非残響成分が含まれる。また、拡散信号には、音響信号の高周波帯域における残響成分が含まれ、音響信号の低周波成分が含まれない。これにより、アタック音等の時間変化の激しい音に対する適切ななまり防止処理を施すことができる。
非特許文献1記載のダウンミックス部904と、本発明におけるダウンミックス部604は、処理する信号が時間領域信号か、サブバンド領域信号かの違いがある。しかしながら、どちらも共通の一般的なマルチチャンネルダウンミックス処理手法を用いる。つまり、ダウンミックス部604は、ダイレクト信号をダウンミックスすることによってダウンミックス信号を生成する。
BPF605及びBPF606は、ダウンミックス信号及び前記サブバンド毎に分割された拡散信号に対して、サブバンド毎に帯域通過処理を施すことによって、それぞれ、帯域通過ダウンミックス信号及び帯域通過拡散信号を生成する。
図8に示されるように、BPF605及びBPF606における帯域フィルタ処理は、帯域フィルタの対応する周波数応答によるそれぞれのサブバンドの単純な乗算に単純化される。広義の意味で、帯域フィルタは乗算器としてみなすことができる。ここで、800は帯域フィルタの周波数応答を示す。さらにここで乗算演算は、重要な帯域応答をもった領域801だけ行えばよいのでさらに演算量の削減が可能となる。例えば外部ストップバンド領域802及び803においては、乗算結果は0であると仮定すると、パスバンドの振幅が1である場合、乗算は単純な複製処理とみなすことができる。
つまり、BPF605及びBPF606における帯域フィルタ処理は、下記式(16)に基づいて行うことができる。
Figure 2007026821
…(16)
ここで、tsは時間スロットインデックス、sbはサブバンドインデックスである。Bandpass(sp)は、上記で説明したように単純な乗算器としてもよい。
正規化処理部607,608は、帯域通過ダウンミックス信号及び帯域通過拡散信号に対して、それぞれのエネルギーについて正規化することによって、それぞれ、正規化ダウンミックス信号及び正規化拡散信号を生成する。
正規化処理部607及び正規化処理部608は、非特許文献1開示の正規化処理部907及び正規化処理部908との違いは、処理する信号の領域が、正規化処理部607及び正規化処理部608はサブバンド領域の信号、正規化処理部907及び正規化処理部908は時間領域の信号という点と、以下に示すような複素共役を用いることを除いて、一般的な正規化処理手法、つまり下記式(17)に従う処理手法である点である。
この場合、サブバンド毎に正規化処理を行う必要があるが、正規化処理部607及び正規化処理部608の利点により、ゼロのデータをもつ空間領域においては演算が省略される。よって、正規化対象の全サンプルに対して処理しなければならない先行文献開示の正規化モジュールに比べて、全体としては演算負荷の増加はほとんどない。
Figure 2007026821
…(17)
スケール算出処理部609は、予め定められた時間スロット毎に、正規化拡散信号のエネルギーに対する正規化ダウンミックス信号のエネルギーの大きさを示すスケール係数を算出する。より具体的には、以下のように、むしろ時間ブロック毎ではなく時間スロット毎に実行されることを除けば、スケール算出処理部609の演算もまた、下記式(18)に示されるように、原則としてスケール算出処理部909と同様である。
Figure 2007026821
…(18)
処理対象となる時間領域データがはるかに少ない場合、平滑化処理部910の重複ウィンドウ処理に基づく平滑化技術も、平滑化処理部610に取って代わられなければならない。
ところが、本実施の形態に係る平滑化処理部610の場合、非常に細かい単位で平滑化処理が行われるために、スケール係数を先行文献記載のスケール係数(式(14))の考え方をそのまま用いると、平滑化の係方が極端に振れる場合があるので、スケール係数自身を平滑化する必要がある。
そのために例えば、下記式(19)に示されるような単純な低域フィルタが、時間スロット毎にscalei(ts)の大幅な変動を抑制するために用いることができる。
Figure 2007026821
…(19)
つまり、平滑化処理部610は、スケール係数に対して時間スロット毎の変動を押さえる平滑化処理を施すことによって、平滑化スケール係数を生成する。より詳しくは、平滑化処理部610は、現在の時間スロットにおけるスケール係数に対してαを乗じて得られる値と、直前の時間スロットにおけるスケール係数に対して(1−α)を乗じて得られる値とを加算することにより、平滑化処理を施す。
ここで、αは例えば0.45に設定する。またαの大きさを変えることによって、効果を制御することも可能となる(0≦α≦1)。
上記αの値は、符号化装置側であるオーディオエンコーダ10から送信することも可能であり、送信側にて平滑化処理を制御可能となり、非常に多岐にわたる効果を出すことが可能となる。もちろん、前記のように予め定められたαの値を平滑化処理装置の中で保持してもよい。
ところで、平滑化処理で処理する信号エネルギーが大きい場合など、特定の帯域にエネルギーが集中して、平滑化処理の出力がオーバーフローする恐れがある。その場合に備えて、例えば下記式(20)のようにscalei(ts)のクリッピング処理を行う。
Figure 2007026821
…(20)
ここで、βはクリッピングの係数であり、min()、max()はそれぞれ最小値、最大値を表す。
つまり、このクリップ処理手段(不図示)は、スケール係数に対して、予め定められた上限値を超える場合には上限値に制限するとともに、予め下限値を下回る場合には下限値に制限することにより、スケール係数に対するクリップ処理を施す。
式(20)は、各チャンネル毎に計算したscalei(ts)が、例えばβ=2.82の場合には、上限値が2.82に、下限値が1/2.82に設定され、その範囲の値に制限されることを意味している。なお、前記閾値である2.82及び1/2.82は一例であって、その値に限定するものではない。
演算部611は、拡散信号にスケール係数を乗じることによって、スケール拡散信号を生成する。HPF612は、スケール拡散信号に対して高域通過処理を施すことによって、高域通過拡散信号を生成する。加算部613は、高域通過拡散信号とダイレクト信号とを加算することによって、加算信号を生成する。
具体的には、演算部611、HPF612及びダイレクト信号との加算部613は、それぞれ合成フィルタバンク902、HPF912、及び加算部913のように行われる。
しかしながら、上記処理は下記式(21)に示されるように組み合わせることができる。
Figure 2007026821
…(21)
前述のBPF605及びBPF606における演算節約のための考慮(例えば、ストップバンドにゼロを、パスバンドに複製処理を適用)は、高域フィルタ612においても適用可能である。
合成フィルタバンク614は、加算信号に対して合成フィルタ処理を施すことによって、時間領域信号に変換する。すなわち、最後に、合成フィルタバンク614によって、新しいダイレクト信号y1を時間領域信号に変換する。
なお、本発明に含まれる各構成要素を、LSI(LargeScaleIntegration)などの集積回路によって構成してもよい。
さらに本発明は、これらの装置及び各構成要素における動作をコンピュータに実行させるプログラムとしても実現することができる。
(実施の形態2)
また、本発明を適用するかの決定は、ビットストリーム中のいくつかの制御フラグを設定し、図9に示される時間的処理装置600bの制御部615において、そのフラグによって一部復元信号の各フレーム毎に作動させる/作動させないを制御することも可能である。つまり、制御部615は、音響信号に対するエネルギー整形を施すか施さないかを時間フレーム毎あるいはチャンネル毎に切り替えるようにしてもよい。これにより、エネルギー整形を施すか施さないかを切り替えることで、音の時間的変動のシャープさや、音像のしっかりとした定位の両立を実現することができる。
このために例えば符号化処理の過程で、音響チャンネルを分析し、急激な変化を伴うエネルギーエンベロープをもっているかどうかの判定を行い、該当する音響チャンネルがある場合は、エネルギー整形が必要であるため、前記制御フラグはオンに設定し、復号時に制御フラグに従い整形処理を適用させるようにしてもよい。
つまり、制御部615は、前記制御フラグに従って、拡散信号及び高域通過拡散信号のいずれかを選択し、加算部613は、制御部615で選択された信号とダイレクト信号とを加算するようにしてもよい。これにより、時々刻々エネルギー整形を施すか施さないかを簡単に切り替えることができる。
本発明に係るエネルギー整形装置は、メモリの必要容量を減らし、チップサイズをより小さくすることができる技術であり、ホームシアターシステム、車載音響システム、電子ゲームシステムや携帯電話機等、マルチチャンネル再生が望まれる装置に適用することが可能である。
図1は、空間的符号化の基本原理を用いたオーディオ装置の全体構成を示すブロック図である。 図2は、6チャンネル時におけるマルチチャンネル合成部23の機能構成を示すブロック図である。 図3は、マルチチャンネル合成部23の原理を説明するための機能構成を示す他の機能ブロック図である。 図4は、マルチチャンネル合成部23の詳細な構成を示すブロック図である。 図5は、図4に示される時間的処理装置900の詳細な構成を示すブロック図である。 図6は、従来の整形方法における重複ウィンドウ化処理に基づく平滑化技術を示す図である。 図7は、本実施の形態1における時間的処理装置(エネルギー整形装置)の構成を示す図である。 図8は、サブバンド領域における帯域フィルタ処理及び演算節約のための考慮を示す図である。 図9は、本実施の形態1における時間的処理装置(エネルギー整形装置)の構成を示す図である。
符号の説明
600a,600b 時間的処理装置
601 スプリッタ
604 ダウンミックス部
605,606 BPF
607,608正規化処理部
609 スケール算出処理部
610 平滑化処理部
611 演算部
612 HPF
613 加算部
614 合成フィルタバンク
615 制御部

Claims (20)

  1. マルチチャンネル音響信号の復号化においてエネルギー整形を行うエネルギー整形装置であって、
    ハイブリッド時間・周波数変換によって得られるサブバンド領域の音響信号を、残響成分を示す拡散信号と、非残響成分を示すダイレクト信号に分割するスプリッタ手段と、
    前記ダイレクト信号をダウンミックスすることによってダウンミックス信号を生成するダウンミックス手段と、
    前記ダウンミックス信号及び前記サブバンド毎に分割された拡散信号に対して、サブバンド毎に帯域通過処理を施すことによって、それぞれ、帯域通過ダウンミックス信号及び帯域通過拡散信号を生成するフィルタ処理手段と、
    前記帯域通過ダウンミックス信号及び前記帯域通過拡散信号に対して、それぞれのエネルギーについて正規化することによって、それぞれ、正規化ダウンミックス信号及び正規化拡散信号を生成する正規化処理手段と、
    予め定められた時間スロット毎に、前記正規化拡散信号のエネルギーに対する前記正規化ダウンミックス信号のエネルギーの大きさを示すスケール係数を算出するスケール係数算出手段と、
    前記拡散信号に前記スケール係数を乗じることによって、スケール拡散信号を生成する乗算手段と、
    前記スケール拡散信号に対して高域通過処理を施すことによって、高域通過拡散信号を生成する高域通過処理手段と、
    前記高域通過拡散信号と前記ダイレクト信号とを加算することによって、加算信号を生成する加算手段と、
    前記加算信号に対して合成フィルタ処理を施すことによって、時間領域信号に変換する合成フィルタ処理手段と
    を備えることを特徴とするエネルギー整形装置。
  2. 前記エネルギー整形装置はさらに、前記スケール係数に対して時間スロット毎の変動を押さえる平滑化処理を施すことによって、平滑化スケール係数を生成する平滑化手段を備える
    ことを特徴とする請求項1記載のエネルギー整形装置。
  3. 前記平滑化手段は、現在の時間スロットにおけるスケール係数に対してαを乗じて得られる値と、直前の時間スロットにおけるスケール係数に対して(1−α)を乗じて得られる値とを加算することにより、前記平滑化処理を施す
    ことを特徴とする請求項2記載のエネルギー整形装置。
  4. 前記エネルギー整形装置はさらに、前記スケール係数に対して、予め定められた上限値を超える場合には上限値に制限するとともに、予め下限値を下回る場合には下限値に制限することにより、前記スケール係数に対するクリップ処理を施すクリップ処理手段を備える
    ことを特徴とする請求項1記載のエネルギー整形装置。
  5. 前記クリップ処理手段は、上限値をβとした場合に、下限値を1/βとして、前記クリップ処理を施す
    ことを特徴とする請求項4記載のエネルギー整形装置。
  6. 前記ダイレクト信号には、前記音響信号の低周波帯域における残響成分と非残響成分、及び、前記音響信号の高周波帯域における非残響成分が含まれる
    ことを特徴とする請求項1記載のエネルギー整形装置。
  7. 前記拡散信号には、前記音響信号の高周波帯域における残響成分が含まれ、前記音響信号の低周波成分が含まれない
    ことを特徴とする請求項1記載のエネルギー整形装置。
  8. 前記エネルギー整形装置はさらに、前記音響信号に対するエネルギー整形を施すか施さないかを切り替える制御手段を備える
    ことを特徴とする請求項1記載のエネルギー整形装置。
  9. 前記制御手段は、音響フレーム毎にエネルギー整形処理を施すかどうかを示す制御フラグに従って、施さない場合には前記拡散信号を、施す場合には前記高域通過拡散信号を選択し、
    前記加算手段は、前記制御手段で選択された信号と前記ダイレクト信号とを加算する
    ことを特徴とする請求項8記載のエネルギー整形装置。
  10. マルチチャンネル音響信号の復号化においてエネルギー整形を行うエネルギー整形方法であって、
    ハイブリッド時間・周波数変換によって得られるサブバンド領域の音響信号を、残響成分を示す拡散信号と、非残響成分を示すダイレクト信号に分割するスプリッタステップと、
    前記ダイレクト信号をダウンミックスすることによってダウンミックス信号を生成するダウンミックスステップと、
    前記ダウンミックス信号及び前記サブバンド毎に分割された拡散信号に対して、サブバンド毎に帯域通過処理を施すことによって、それぞれ、帯域通過ダウンミックス信号及び帯域通過拡散信号を生成するフィルタ処理ステップと、
    前記帯域通過ダウンミックス信号及び前記帯域通過拡散信号に対して、それぞれのエネルギーについて正規化することによって、それぞれ、正規化ダウンミックス信号及び正規化拡散信号を生成する正規化処理ステップと、
    予め定められた時間スロット毎に、前記正規化拡散信号のエネルギーに対する前記正規化ダウンミックス信号のエネルギーの大きさを示すスケール係数を算出するスケール係数算出ステップと、
    前記拡散信号に前記スケール係数を乗じることによって、スケール拡散信号を生成する乗算ステップと、
    前記スケール拡散信号に対して高域通過処理を施すことによって、高域通過拡散信号を生成する高域通過処理ステップと、
    前記高域通過拡散信号と前記ダイレクト信号とを加算することによって、加算信号を生成する加算ステップと、
    前記加算信号に対して合成フィルタ処理を施すことによって、時間領域信号に変換する合成フィルタ処理ステップと
    を含むことを特徴とするエネルギー整形方法。
  11. 前記エネルギー整形方法はさらに、前記スケール係数に対して時間スロット毎の変動を押さえる平滑化処理を施すことによって、平滑化スケール係数を生成する平滑化ステップを含む
    ことを特徴とする請求項10記載のエネルギー整形方法。
  12. 前記平滑化ステップでは、現在の時間スロットにおけるスケール係数に対してαを乗じて得られる値と、直前の時間スロットにおけるスケール係数に対して(1−α)を乗じて得られる値とを加算することにより、前記平滑化処理を施す
    ことを特徴とする請求項11記載のエネルギー整形方法。
  13. 前記エネルギー整形方法はさらに、前記スケール係数に対して、予め定められた上限値を超える場合には上限値に制限するとともに、予め下限値を下回る場合には下限値に制限することにより、前記スケール係数に対するクリップ処理を施すクリップ処理ステップを含む
    ことを特徴とする請求項10記載のエネルギー整形方法。
  14. 前記クリップ処理ステップでは、上限値をβとした場合に、下限値を1/βとして、前記クリップ処理を施す
    ことを特徴とする請求項13記載のエネルギー整形方法。
  15. 前記ダイレクト信号には、前記音響信号の低周波帯域における残響成分と非残響成分、及び、前記音響信号の高周波帯域における非残響成分が含まれる
    ことを特徴とする請求項10記載のエネルギー整形方法。
  16. 前記拡散信号には、前記音響信号の高周波帯域における残響成分が含まれ、前記音響信号の低周波成分が含まれない
    ことを特徴とする請求項10記載のエネルギー整形方法。
  17. 前記エネルギー整形方法はさらに、前記音響信号に対するエネルギー整形を施すか施さないかを切り替える制御ステップを含む
    ことを特徴とする請求項10記載のエネルギー整形方法。
  18. 前記制御ステップでは、音響フレーム毎にエネルギー整形処理を施すか施さないかを示す制御フラグに従って、施さない場合には前記拡散信号を、施す場合には前記高域通過拡散信号を選択し、
    前記加算ステップでは、前記制御ステップで選択された信号と前記ダイレクト信号とを加算する
    ことを特徴とする請求項17記載のエネルギー整形方法。
  19. マルチチャンネル音響信号の復号化においてエネルギー整形を行うためのプログラムであって、
    請求項10記載のエネルギー整形方法に含まれるステップをコンピュータに実行させる
    ことを特徴とするプログラム。
  20. マルチチャンネル音響信号の復号化においてエネルギー整形を行うための集積回路であって、
    ハイブリッド時間・周波数変換によって得られるサブバンド領域の音響信号を、残響成分を示す拡散信号と、非残響成分を示すダイレクト信号に分割するスプリッタと、
    前記ダイレクト信号をダウンミックスすることによってダウンミックス信号を生成するダウンミックス回路と、
    前記ダウンミックス信号及び前記サブバンド毎に分割された拡散信号に対して、サブバンド毎に帯域通過処理を施すことによって、それぞれ、帯域通過ダウンミックス信号及び帯域通過拡散信号を生成するフィルタと、
    前記帯域通過ダウンミックス信号及び前記帯域通過拡散信号に対して、それぞれのエネルギーについて正規化することによって、それぞれ、正規化ダウンミックス信号及び正規化拡散信号を生成する正規化処理回路と、
    予め定められた時間スロット毎に、前記正規化拡散信号のエネルギーに対する前記正規化ダウンミックス信号のエネルギーの大きさを示すスケール係数を算出するスケール係数算出回路と、
    前記拡散信号に前記スケール係数を乗じることによって、スケール拡散信号を生成する乗算器と、
    前記スケール拡散信号に対して高域通過処理を施すことによって、高域通過拡散信号を生成する高域通過処理回路と、
    前記高域通過拡散信号と前記ダイレクト信号とを加算することによって、加算信号を生成する加算器と、
    前記加算信号に対して合成フィルタ処理を施すことによって、時間領域信号に変換する合成フィルタと
    を備えるエネルギー整形装置を集積化したことを特徴とする集積回路。
JP2007533326A 2005-09-02 2006-08-31 エネルギー整形装置及びエネルギー整形方法 Active JP4918490B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007533326A JP4918490B2 (ja) 2005-09-02 2006-08-31 エネルギー整形装置及びエネルギー整形方法

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2005254357 2005-09-02
JP2005254357 2005-09-02
JP2006190127 2006-07-11
JP2006190127 2006-07-11
JP2007533326A JP4918490B2 (ja) 2005-09-02 2006-08-31 エネルギー整形装置及びエネルギー整形方法
PCT/JP2006/317218 WO2007026821A1 (ja) 2005-09-02 2006-08-31 エネルギー整形装置及びエネルギー整形方法

Publications (2)

Publication Number Publication Date
JPWO2007026821A1 true JPWO2007026821A1 (ja) 2009-03-26
JP4918490B2 JP4918490B2 (ja) 2012-04-18

Family

ID=37808904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007533326A Active JP4918490B2 (ja) 2005-09-02 2006-08-31 エネルギー整形装置及びエネルギー整形方法

Country Status (6)

Country Link
US (1) US8019614B2 (ja)
EP (1) EP1921606B1 (ja)
JP (1) JP4918490B2 (ja)
KR (1) KR101228630B1 (ja)
CN (1) CN101253556B (ja)
WO (1) WO2007026821A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8498874B2 (en) * 2009-09-11 2013-07-30 Sling Media Pvt Ltd Audio signal encoding employing interchannel and temporal redundancy reduction
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9253574B2 (en) 2011-09-13 2016-02-02 Dts, Inc. Direct-diffuse decomposition
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP3048609A4 (en) 2013-09-19 2017-05-03 Sony Corporation Encoding device and method, decoding device and method, and program
EP3061089B1 (en) * 2013-10-21 2018-01-17 Dolby International AB Parametric reconstruction of audio signals
JP6201047B2 (ja) 2013-10-21 2017-09-20 ドルビー・インターナショナル・アーベー オーディオ信号のパラメトリック再構成のための脱相関器構造
CN105849801B (zh) 2013-12-27 2020-02-14 索尼公司 解码设备和方法以及程序
RU2704266C2 (ru) 2014-10-31 2019-10-25 Долби Интернешнл Аб Параметрическое кодирование и декодирование многоканальных аудиосигналов
RU169931U1 (ru) * 2016-11-02 2017-04-06 Акционерное Общество "Объединенные Цифровые Сети" Устройство сжатия аудиосигнала для передачи по каналам распространения данных
CN108694955B (zh) 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
RU2741379C1 (ru) 2017-07-28 2021-01-25 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Оборудование для кодирования или декодирования кодированного многоканального сигнала с использованием заполняющего сигнала, сформированного посредством широкополосного фильтра

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6128597A (en) * 1996-05-03 2000-10-03 Lsi Logic Corporation Audio decoder with a reconfigurable downmixing/windowing pipeline and method therefor
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
CN1666572A (zh) * 2002-04-05 2005-09-07 皇家飞利浦电子股份有限公司 信号处理
CN1650528B (zh) * 2002-05-03 2013-05-22 哈曼国际工业有限公司 多信道下混频设备
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
CN1906664A (zh) * 2004-02-25 2007-01-31 松下电器产业株式会社 音频编码器和音频解码器
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
KR101120911B1 (ko) * 2004-07-02 2012-02-27 파나소닉 주식회사 음성신호 복호화 장치 및 음성신호 부호화 장치
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
US7283634B2 (en) * 2004-08-31 2007-10-16 Dts, Inc. Method of mixing audio channels using correlated outputs
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US7813933B2 (en) * 2004-11-22 2010-10-12 Bang & Olufsen A/S Method and apparatus for multichannel upmixing and downmixing
US7382853B2 (en) * 2004-11-24 2008-06-03 General Electric Company Method and system of CT data correction
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
US7761289B2 (en) * 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths

Also Published As

Publication number Publication date
US20090234657A1 (en) 2009-09-17
WO2007026821A1 (ja) 2007-03-08
CN101253556A (zh) 2008-08-27
CN101253556B (zh) 2011-06-22
EP1921606A4 (en) 2011-03-09
EP1921606B1 (en) 2011-10-19
EP1921606A1 (en) 2008-05-14
KR20080039463A (ko) 2008-05-07
KR101228630B1 (ko) 2013-01-31
JP4918490B2 (ja) 2012-04-18
US8019614B2 (en) 2011-09-13

Similar Documents

Publication Publication Date Title
JP4918490B2 (ja) エネルギー整形装置及びエネルギー整形方法
JP5934922B2 (ja) 復号装置
KR101212900B1 (ko) 오디오 디코더
EP2535892B1 (en) Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages
JP4804532B2 (ja) 無相関信号の包絡線整形
EP1649723B1 (en) Multi-channel synthesizer and method for generating a multi-channel output signal
RU2388176C2 (ru) Почти прозрачная или прозрачная схема многоканального кодера/декодера
JP4589962B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
CN110047496B (zh) 立体声音频编码器和解码器
JP5053849B2 (ja) マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法
JP5166292B2 (ja) 主成分分析によりマルチチャネルオーディオ信号を符号化するための装置および方法
JPWO2006003891A1 (ja) 音声信号復号化装置及び音声信号符号化装置
JP2006337767A (ja) 低演算量パラメトリックマルチチャンネル復号装置および方法
JP2006323314A (ja) マルチチャネル音声信号をバイノーラルキュー符号化する装置
JP2006325162A (ja) バイノーラルキューを用いてマルチチャネル空間音声符号化を行うための装置
JP2007025290A (ja) マルチチャンネル音響コーデックにおける残響を制御する装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090703

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120130

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150203

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4918490

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350