JP4930320B2 - 再生方法及び装置、プログラム並びに記録媒体 - Google Patents

再生方法及び装置、プログラム並びに記録媒体 Download PDF

Info

Publication number
JP4930320B2
JP4930320B2 JP2007272856A JP2007272856A JP4930320B2 JP 4930320 B2 JP4930320 B2 JP 4930320B2 JP 2007272856 A JP2007272856 A JP 2007272856A JP 2007272856 A JP2007272856 A JP 2007272856A JP 4930320 B2 JP4930320 B2 JP 4930320B2
Authority
JP
Japan
Prior art keywords
stereo
audio signal
information
signal
monaural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007272856A
Other languages
English (en)
Other versions
JP2008158496A (ja
Inventor
千智 劔持
光行 畠中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007272856A priority Critical patent/JP4930320B2/ja
Priority to US11/935,050 priority patent/US8363842B2/en
Priority to TW096141906A priority patent/TWI380287B/zh
Priority to DE602007012644T priority patent/DE602007012644D1/de
Priority to EP07254547A priority patent/EP1928212B1/en
Priority to KR1020070120956A priority patent/KR20080049632A/ko
Priority to CN2007101954765A priority patent/CN101192407B/zh
Publication of JP2008158496A publication Critical patent/JP2008158496A/ja
Application granted granted Critical
Publication of JP4930320B2 publication Critical patent/JP4930320B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Description

本発明は、ステレオ化情報がモノラルオーディオ信号の符号化情報に間歇的に多重化されて伝送された符号化オーディオデータを復号化処理して再生するための再生方法及び装置、プログラム並びに記録媒体に関する。
モノラルオーディオ信号とステレオ化情報とが入力され、モノラルオーディオ信号をステレオ化情報に基づいてステレオ化処理してステレオオーディオ信号を生成する再生装置が知られている。
このようなモノラルオーディオ信号とステレオ化情報とに基づく一般的なステレオ化処理について図面を参照しながら説明する。図6は、一般的なステレオ化装置の構成例を示すブロック図、図7は、図6のステレオ化装置に入力される信号の一例を示す図である。ステレオ化情報は多重化されて伝送されてもよい。
図6において、入力端子41にはモノラルオーディオ信号が、入力端子42にはステレオ化情報がそれぞれ供給されている。入力端子41からのモノラルオーディオ信号は、切換スイッチ43を介して帯域分割部44に送られ、帯域分割処理されてステレオ化処理部45に送られる。ステレオ化処理部45には、入力端子42からのステレオ化情報が供給され、帯域分割されたモノラルオーディオ信号がステレオ化処理され、得られたステレオ左右チャンネルの各信号が、左チャンネル(Lch)の帯域合成部51及び右チャンネル(Rch)の帯域合成部52にそれぞれ送られる。帯域合成部51からのLchのオーディオ信号は、切換スイッチ53に送られ、切換スイッチ43から遅延部46を介した信号とのいずれかが切換選択されて、切換スイッチ54及び出力端子55に送られる。帯域合成部52からのRchのオーディオ信号は、切換スイッチ54に送られ、切換スイッチ53からの信号とのいずれかが切換選択されて、出力端子56に送られる。
図7は、図6のステレオ化装置に入力される信号の一例を示し、符号化オーディオデータのフレームあるいはブロック等の伝送単位毎に番号#0,#1,#2,・・・を付しており、Mはモノラルオーディオ信号を、Sはステレオ化情報を示している。この図7の例では、モノラルオーディオ信号Mは常に伝送されるが、ステレオ化情報Sは多重化されて伝送され、5回に1回の割合で伝送されている。この場合、伝送単位#0で送られたステレオ化情報Sは、伝送単位#0から#4までのステレオ化処理に用いられ、伝送単位#5で次のステレオ化情報Sに切り換えられ、この伝送単位#5で送られたステレオ化情報Sは伝送単位#5から#9まで用いられ、以下同様に次のステレオ化情報Sが送られるまで、先に送られたステレオ化情報Sが用いられる。
図6の構成において、ステレオ化情報の入力がある場合には、各切換スイッチ43,53,54は選択B端子側に切り換えられる。すなわち、入力端子41から入力されたモノラルオーディオ信号を帯域分割部44にて帯域分割し、ステレオ化処理部45にて、ステレオ化情報に基づいてステレオ信号を作成する。作成されたステレオ信号は、各チャンネルの帯域合成処理部51,52にて帯域合成され、ステレオ左右チャンネルの各オーディオ信号を出力端子55,56よりそれぞれ出力する。
これに対して、フレーム(伝送単位)の間引き再生による早送り再生のような不連続なフレーム再生を行うと、あるいは任意のフレームから再生を行うと、多重化された符号化情報が抜け落ちる場合がある。このような不連続なフレーム再生等により任意のフレーム(伝送単位)から符号化オーディオデータが入力された場合には、使用可能なステレオ化情報が無い状態が生ずる。例えば図7の伝送単位#2の位置から入力が始まる場合に、伝送単位#0のステレオ化情報Sはフレーム間引き等により入力されておらず、伝送単位#2〜#4の間は使用可能なステレオ化情報が無いことになる。
図6の装置では、ステレオ化情報の有無によって出力オーディオ信号のチャンネル数が変化しないように、使用可能なステレオ化情報が無い状態(例えば図7の伝送単位#2〜#4の間)でも、モノラルオーディオ信号をステレオ左右チャンネルに出力するようにしており、具体的には各切換スイッチ43,53,54を選択A端子側に切り換えることにより、同一のモノラルオーディオ信号を出力端子55,56よりそれぞれ出力している。ここで、切換スイッチ43が選択A端子側に切り換えられると、入力端子41からのモノラルオーディオ信号は遅延部46に送られるが、これは、帯域分割部44では、例えばFIRフィルタ処理のように状態変数を保持しており、処理するたびに状態変数が更新され、遅延が発生することを考慮し、入力されたモノラルオーディオ信号に帯域分割部44で発生する遅延分を同様に与えるためである。帯域合成部等では遅延が発生しないように帯域合成が行われるため、遅延部46での遅延は帯域分割部44のみを考慮している。遅延部46からのモノラルオーディオ信号は、切換スイッチ53を介して、Lch出力端子55より出力されると共に、切換スイッチ54を介してRch出力端子56より出力される。なお、図7の伝送単位#2〜#4の間のように使用可能なステレオ化情報が無いときは、内部の帯域分割部44等の状態変数が初期化される。
従って、図7の伝送単位#2の位置からデータが入力された場合、上記伝送単位#2〜#4の間は、内部の状態変数が初期化されると共に、図6のステレオ化装置の各切換スイッチ43,53,54は選択A端子側に切り換えられ、伝送単位#5の位置のデータが入力されると、各切換スイッチ43,53,54は選択B端子側に切り換えられると共に、内部の状態変数が更新される。なお、各切換スイッチ43,53,54の切換動作や、各部の処理動作については、図示しない制御部により、入力データの内容や内部状態等に応じて制御される。
ここで、ステレオ化処理等のための符号化情報の一部がモノラルオーディオ信号に多重化されて伝送される符号化方式の具体例について以下説明する。
例えば、HE AAC(High Efficiency Advanced Audio Coding,国際標準規格ISO/IEC 14496-3)、特にHE AAC v2(バージョン2)の符号化方式で符号化されたオーディオデータは、復号化するために必要な符号化情報の一部が多重化されて伝送される。このHE AAC v2の符号化方式は、AAC(Advanced Audio Coding)処理、SBR(Spectral Band Replication)処理、PS(Parametric Stereo)処理の3つの技術を組み合わせて構成しており、SBR処理、PS処理の符号化情報は、一部多重化されて伝送される。
AAC処理は、MPEG(Moving Picture Experts Group)オーディオで規格化された音声圧縮方式における符号化処理であり、SBR処理は、複数の帯域に分割して、高音域を低域より複製することで、帯域拡張を行う符号化処理であり、PS処理は、モノラル信号からステレオ信号を生成するために必要な空間情報等を用いて空間符号化を行う符号化処理である。
上記HE AAC v2方式で符号化された符号化オーディオデータには、上記AAC符号化方式で符号化されたモノラルオーディオデータに相当するAACコアの符号化情報と、上記SBR処理の符号化情報と、上記PS処理の符号化情報とで構成される。SBR処理の符号化情報は、多重化されて間歇的に伝送される符号化情報(sbr header)と常に伝送される符号化情報(sbr data)とで構成され、sbr data(SBRデータ)を復号化するには、sbr header(SBRヘッダ)が必要となる。sbr header(SBRヘッダ)は、一定の規則に従って内容を変更する事が可能であり、伝送されるタイミングも運用に一任されている。PS処理の符号化情報(ps data)は、sbr data(SBRデータ)の拡張領域に内包されて伝送される。そのため、ps data(PSデータ)を復号化するにもsbr header(SBRヘッダ)の情報が必要となる。すなわち、sbr header(SBRヘッダ)は、ステレオ化処理のためのps data(PSデータ)を得るために必要なステレオ化必要情報である。図8にHE AAC v2符号化方式で符号化されたオーディオデータの一例を示す。図8において、ACはAACコアの符号化情報を示し、SHは上記sbr header(SBRヘッダ)を示し、SDは上記sbr data(SBRデータ)を示す。
この図8に示すように、SD(SBRデータ)やその拡張領域に内包されているPSデータを復号化するためには、間歇的に伝送されるSH(SBRヘッダ)が必要となるが、上述したような任意のフレームから再生を行うと、多重化されたSH(SBRヘッダ)が抜け落ちることがある。ここで、特に上位側等で常に多重化されたフレームの監視を行わない場合には、多重化されたSH(SBRヘッダ)が得られるフレームに到達するまでは、AACコアの符号化情報(AC)を用いた復号化処理を行って出力オーディオ信号の生成を行う。この場合のデコード処理としては、上記AACデコード処理がされ、上記SBRの帯域分割、合成処理によりアップサンプリング処理が行われる。
多重化されたSH(SBRヘッダ)を含むフレームに達すると、このSH(SBRヘッダ)を用いて上記SD(SBRデータ)やその拡張領域に内包されているPSデータが復号化され、これらのSBRデータやPSデータを用いた完全な(ステレオ化を含む)復号化処理を行って、出力ステレオオーディオ信号の生成を行なう。上記HE AAC v2符号化オーディオデータのデコード処理の場合には、上記AACデコード処理がされ、上記SBR処理にて、帯域分割、高域生成がされた後に、上記PS処理にて符号化された空間情報を元に、帯域分割されたモノラル信号からステレオ信号の生成を行い、SBR処理の帯域合成処理により、出力ステレオオーディオ信号を生成する。
図9は、上記HE AAC v2方式で符号化された符号化オーディオデータの再生装置の構成例を示すブロック図である。この図9の入力端子11には、AACコアの符号化情報、高域生成符号化情報(SBRデータ)、PS符号化情報(PSデータ)が含まれる符号化オーディオデータのビットストリーム(Coded Audio Stream)が伝送されて入力されており、一部の符号化情報は多重化されて伝送される。高域生成符号化情報(SBRデータ)、PS符号化情報(PSデータ)を復号化するには、多重化されて伝送されるSH(SBRヘッダ)が必要となることは上述の通りである。
HE AAC v2符号化方式では、SH(SBRヘッダ)の一部が前フレームと異なる場合には、SBR処理の初期化を行う必要がある。SBR処理の初期化により、後述するQMF分析部/合成部やハイブリッド分析部等の状態変数(遅延信号)が初期化される。ここで、状態変数(遅延信号)とは、フィルタ内の遅延素子に保持されるデータ(信号)のことであり、フィルタ処理では、フィルタ長に応じて、信号が入力されてから出力されるまでに遅延が生じるが、この遅延信号を意味する。
ところで、HE AAC v2符号化方式で符号化された、AAC符号化情報を復号化して得られるモノラルオーディオデータは、SBR処理のQMF分析とQMF合成処理を行うことでアップサンプリングされる。例えば、AAC復号化後のモノラルオーディオデータが24kHzサンプリングで、SBR処理を行うことで、48kHzサンプリングのオーディオデータとなる。
図9において、入力端子11からの符号化オーディオデータは、ペイロードデフォーマッタ12に送られて、AACコア復号部13へのAACコア符号化情報と、高域生成符号化情報(SBRデータ)・PS符号化情報(PSデータ)とに分離される。AACコア復号部13では、入力されたAACコア符号化情報を復号化し、AACコアのモノラルオーディオ信号を生成し、SBR処理部20に送る。SBR処理部20のパーサ14は、ペイロードデフォーマッタ12からの高域生成符号化情報等の多重化情報を取得し、内容を確認して、SBR処理の初期化が必要か否かを判断し、初期化が必要な場合には、初期化制御信号を端子14tより出力して後述するように各部のSBR処理の初期化を行う。また、AACコア復号部13からSBR処理部20に送られたモノラルオーディオ信号は、QMF分析部21にて帯域分割され、切換スイッチ22に送られる。高域生成符号化情報(SBRデータ)が入力された場合には、切換スイッチ22が選択B,C端子に切換接続され、QMF分析部21からの信号が高域生成部23に送られる。高域生成部23では高域周波数信号を生成し、エンベロープ調整部24でエンベロープ調整を行って、切換スイッチ25に送る。
上記PS符号化情報(PSデータ)からステレオ化情報が得られている場合には、切換スイッチ22,25は選択C端子に切換接続される。切換スイッチ25の選択C端子からの信号は、ハイブリッド分析部27に送られる。ハイブリッド分析部27では入力された帯域分割信号の低域信号を更に帯域分割し、信号解析部29及びステレオ化処理部30に入力する。信号解析部29では、入力信号を解析し、音響調整し、ステレオ化処理部30に入力する。ステレオ化処理部30では、入力された帯域分割信号と、ステレオ化情報から、ステレオ左右チャンネルの信号を生成する。生成されたステレオの各チャンネルの信号は、それぞれ各チャンネルのハイブリッド合成部31,32にて、上記ハイブリッド分析部27にて分割された帯域を合成し、さらに、QMF合成部33,34にて、上記QMF分析部21で帯域分割された帯域を合成し、ステレオ左右チャンネル(Lch,Rch)の出力オーディオ信号を生成する。QMF合成部33からのLchのオーディオ信号は、切換スイッチ36及び出力端子37に送られる。QMF合成部34からのRchのオーディオ信号は、切換スイッチ36に送られ、QMF合成部33からの信号とのいずれかが切換選択されて、出力端子38に送られる。
上記ステレオ化情報のような多重化情報が伝送されていない場合には、図9の切換スイッチ22,25,35,36は選択A又はB端子に切換接続される。出力オーディオ信号のサンプリング周波数を一定にするために、QMF分析部21とQMF合成部33を用いてアップサンプリングのみを行う、また、出力チャンネル数も一定とするため、Lchのオーディオ信号をRchのオーディオ信号にコピーして出力信号を生成する。
図10は、例えば上記図9の構成における上述したようなデコード動作を説明するためのフローチャートである。
図10において、上記入力端子11に入力される符号化オーディオデータのビットストリームのような符号化情報に対して、ステップS101で上記HE AAC v2方式の符号化データの復号化処理(デフォーマット処理)を行い、多重化された符号化情報としての上述したような高域生成符号化情報や空間符号化情報を取り出し、また、上記AACコア情報については、ステップS102にてAAC信号処理を行う。次のステップS103では、上記SBR処理を行うか否かが判断され、YESの場合はステップS104に、NOの場合はステップS114に進む。これらの処理は、例えば図9のペイロードデフォーマッタ12、AACコア復号部13での処理に対応する。
ステップS104では、例えば上記QMF分析部21により、QMF帯域分割処理を行う。次のステップS105で、多重化された符号化情報が復号化済みか否かを判断し、YESのときはステップS106に進み、NOのときはステップS113に進む。ステップS106では、例えば上記高域生成部23により、多重化された高域生成符号化情報(多重化の復号化が済みの情報)を用いて高域信号生成処理を行い、次のステップS107でPS処理を行うか否かを判断する。
ステップS107でYES(PS処理を行う)と判断されたとき、ステップS108に進んでハイブリッド分析処理を行い、ステップS109で空間情報によるステレオ信号生成処理を行い、ステップS110でハイブリッド合成処理を行った後、ステップS111に進む。これらの処理は、例えば図9のハイブリッド分析部27からハイブリッド合成部31,32までの処理に対応する。ステップS107でNO(PS処理をしない)と判断されたときは、ステップS111に進む。
ステップS111では、LchのQMF帯域合成処理を行い、ステップS112でRchのQMF帯域合成処理を行って、得られたオーディオ信号を出力する。また、上記ステップS113ではLchのQMF帯域合成処理を行い、ステップS114で必要に応じてモノラル信号を複製してステレオ信号を生成し、得られたオーディオ信号を出力する。これらの処理は、例えば上記図9の切換スイッチ22,35,36及びQMF合成部33,34での処理に対応する。
従来技術として、特許文献1、2には、モノラルオーディオ信号をステレオ化情報に基づいてステレオ化処理してステレオオーディオ信号を生成するための技術が開示され、非特許文献1には、上記HE AAC(High Efficiency Advanced Audio Coding)符号化方式の規格が開示されている。
特表2004−535145号公報 特開2006−085183号公報 ISO/IEC 14496−3:2005, Information technology - Coding of audio-visual objects - part3:Audio
ところで、上述したフレーム間引き再生のような不連続フレームの再生等により任意のフレームから再生を行った場合、内部の状態変数が初期化され、その後、ステレオ化情報のような一部が多重化された符号化情報が入力されたときに状態変数が更新開始されるため、フィルタ遅延の影響等により異音が発生する。
例えば、上記図6の構成において、上記図7の伝送単位#2の位置から入力が始まる場合に、伝送単位#2〜#4の間の使用可能なステレオ化情報が無い状態から、伝送単位#5でステレオ化情報が入力されると、各切換スイッチ43,53,54は選択B端子側に切り換えられる。この選択B端子側に切り換えられたときに初めて帯域分割部44にて帯域分割信号を生成するが、このときの帯域分割部44の状態変数が初期化された状態であるため、伝送単位#5に対応する出力においてこの影響が出てしまう。例えば、出力信号が、減衰する等の影響が考えられる。そのため、異音が発生する原因となってしまう。
また、上記図9の構成の場合には、HE AAC v2方式で符号化されたオーディオデータをフレーム間引き再生等により早送り再生を行う場合等のように、不連続でフレーム再生を行うと、多重化されたsbr header(SBRヘッダ)が抜け落ちる場合がある。例えば、図8の例の場合に、フレーム(伝送単位)#1から再生すると、フレーム#5で始めてSH(SBRヘッダ)が伝送される。この場合、SH(SBRヘッダ)が得られるフレームに到達するまでは、SD(SBRデータ)のSBR符号化情報とPS符号化情報が復号化できないため、切換スイッチ22が選択A端子側、切換スイッチ35が選択A端子側、切換スイッチ36が選択B端子側にそれぞれ接続される構成となり、AACコアのモノラルオーディオ信号は、SBR処理のQMF分析部21とLchのQMF合成部33を用いてモノラルオーディオ信号をアップサンプリングし、ステレオ左右チャンネルに同じ出力オーディオ信号を生成する。
このように不連続でフレーム再生を行う場合、再生装置内のフィルタの状態変数(遅延信号)と入力HE AAC v2符号化方式で符号化されたオーディオデータとで不連続となるため、再生装置の初期化(SBR処理初期化含む)を行い再生装置内部の状態変数の初期化が必要となる。再生装置内部の状態変数(遅延信号)には、QMF分析部21、QMF合成部33,34、ハイブリッド分析部27の状態変数が含まれ、初期化により0に設定される。SH(SBRヘッダ)が伝送されるまでは、SBR符号化情報・PS符号化情報が復号化できないため、AACコア復号部13のモノラルオーディオ信号を切換スイッチ22が選択A端子側、切換スイッチ35が選択A端子側、切換スイッチ36が選択A端子側に切り替わり、QMF分析部21とLchのQMF合成部33を処理することでアップサンプリングして、ステレオ左右チャンネルに出力オーディオ信号として出力する。SH(SBRヘッダ)が伝送されると、再生装置初期化後初めてSBR符号化情報とPS符号化情報が復号化され、SBR処理・PS処理が実行される。QMF分析部21とLchのQMF合成部33はSH(SBRヘッダ)が伝送される前でもアップサンプリングするために処理されるため、状態変数は更新されている。一方、ハイブリッド分析部27、RchのQMF合成部34の状態変数は初期化された状態となっている。そのため後段の処理に影響を及ぼし、出力オーディオ信号に異音が発生する原因となってしまう。このときのステレオ左右チャンネル(Lch,Rch)の出力オーディオ信号の例を図11の(A)、(B)に示す。
図11の(A)、(B)は、使用可能な多重化された符号化情報(ステレオ情報等)が無い状態、例えば、AAC−LC(Low Complexity)符号化情報信号のみが入力され、SBR処理はアップサンプリング(Up Sampling)のみが行われている状態から、時刻t1においてステレオ化情報を含む多重化された符号化情報が有効(使用可能)となり、AAC処理、SBR処理、PS処理が開始された状態を表しており、図11の(A)はLch、(B)はRchの出力オーディオ信号をそれぞれ示している。
この図11の(A)、(B)において、時刻t1では、上記内部の状態変数の初期化後に初めて多重化された符号化情報を認識するが、状態変数が初期化状態から変化するため、時刻t1〜t2の間は、上記SBR処理のための帯域合成部(RchのQMF合成部34)の状態変数による影響がRchの出力オーディオ信号に現れ、また、時刻t2〜t3の間は、上記PS処理のためのハイブリッドフィルタ(ハイブリッド分析部27)の状態変数による影響がLch,Rchの両オーディオ信号に現れる。このため、出力オーディオ信号に異音が発生することになる。
これを回避する方法として、多重化された符号化情報を常に監視することが考えられるが、この場合、多重化された情報が、通常の符号化情報と同時に伝達されるため、全ての符号化情報を復号化する必要があり、処理量の削減が行えない。
本発明は、このような従来の実情に鑑みて提案されたものであり、多重化された符号化情報や復号化するために必要な情報(SBRヘッダ等)が間歇的に伝送されることにより任意位置から再生を行った場合の内部の状態変数が初期化された状態から、必要な符号化情報が入力されたときのフィルタ遅延等により、出力オーディオ信号に与える悪影響(異音の発生等)を有効に防止し得るような再生方法及び装置、プログラム並びに記録媒体を提供することを目的とする。
上述の課題を解決するために、本発明は、ステレオ化処理に必要とされるステレオ化必要情報がモノラルオーディオ信号の符号化情報に間歇的に多重化されて伝送された符号化オーディオデータを復号化処理して再生する際に、ステレオ化必要情報が入力されない場合、モノラルオーディオ信号を用いたステレオオーディオ信号を出力するようにし、ステレオ化必要情報が入力された場合、フィルタ内部の状態変数の更新を開始し、該状態変数が全て更新されるまで、モノラルオーディオ信号を用いたステレオオーディオ信号を出力するようにし、フィルタ内部の状態変数が全て更新された場合、モノラルオーディオ信号に対してステレオ化必要情報により得られたステレオ化情報に基づくステレオ化処理を行ってステレオオーディオ信号を生成して出力することを特徴とする。
ここで、上記ステレオ化処理は、帯域拡張されたモノラルオーディオ信号に対して行われることが好ましい。
また、上記ステレオ化必要情報が入力されない場合、上記モノラルオーディオ信号を帯域分割フィルタ処理により少なくとも2つ以上のサブバンドに分割し、帯域合成フィルタ処理によりアップサンプリングしてモノラルオーディオ信号を用いたステレオオーディオ信号を出力し、上記ステレオ化必要情報が入力された場合、モノラルオーディオ信号のフィルタ内部の状態変数をステレオオーディオ信号のフィルタ状態変数として処理させることが好ましい。
また、上記符号化オーディオデータは、HE AAC(High Efficiency Advanced Audio Coding)の符号化方式におけるモノラルオーディオデータに相当するAACコアの符号化情報と、SBR(Spectral Band Replication)処理の符号化情報と、PS(Parametric Stereo)処理の符号化情報とを有し、上記SBR処理の符号化情報は、多重化されて間歇的に伝送される符号化情報であるSBRヘッダ(sbr header)と常に伝送される符号化情報であるSBRデータ(sbr data)とで構成され、上記PS処理の符号化情報であるPSデータ(ps data)は、上記SBRデータの拡張領域に内包されて伝送され、上記SBRヘッダは上記SBRデータを復号化するために必要とされる上記ステレオ化必要情報であることが挙げられる。
本発明によれば、ステレオ化必要情報が入力されない場合から、ステレオ化必要情報が入力された場合でも、異音の発生等の無い良好なステレオオーディオ信号を再生することが可能となる。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。
図1は、本発明の実施の形態となる再生装置あるいは再生方法に用いられるステレオ化装置の一例の概略構成を示すブロック図である。この図1において、上述した図6の各部と対応する部分には同一の指示符号を付している。
図1の入力端子41にはモノラルオーディオ信号が、入力端子42にはステレオ化情報がそれぞれ供給されている。入力端子41からのモノラルオーディオ信号は、スイッチ43X及び遅延部46に送られる。スイッチ43Xからのモノラルオーディオ信号は、帯域分割部44に送られ、帯域分割処理されてステレオ化処理部45に送られる。ステレオ化処理部45には、入力端子42からのステレオ化情報が供給され、帯域分割されたモノラルオーディオ信号がステレオ化処理され、得られたステレオ左右チャンネルの信号の内、左チャンネル(Lch)の信号がスイッチ61を介して帯域合成部51に送られ、右チャンネル(Rch)の信号がスイッチ62を介して帯域合成部52に送られる。帯域合成部51からのLchのオーディオ信号は、切換スイッチ53Xに送られ、遅延部46を介した信号とのいずれかが切換選択されて、切換スイッチ54X及び出力端子55に送られる。帯域合成部52からのRchのオーディオ信号は、切換スイッチ54Xに送られ、切換スイッチ53Xからの信号とのいずれかが切換選択されて、出力端子56に送られる。なお、各切換スイッチ43X,53X,54Xの切換動作や、スイッチ61,62のオン、オフ操作、あるいは各部の処理動作については、図示しない制御部により、入力データの内容や内部状態等に応じて制御される。
この図1に示すようなステレオ化装置に対して、上記図7に示すような入力信号(モノラルオーディオ信号M及び間歇的なステレオ化情報S)が供給される場合に、伝送単位#0で送られたステレオ化情報Sは、伝送単位#0から#4までのステレオ化処理に用いられ、伝送単位#5で次のステレオ化情報Sに切り換えられ、この伝送単位#5で送られたステレオ化情報Sは伝送単位#5から#9まで用いられることは前述した通りである。
このように使用可能なステレオ化情報がある場合には、スイッチ43Xは選択B端子に接続され、スイッチ61,62は選択C端子に接続され、各切換スイッチ53X,54Xは選択C端子側に切換接続される。このとき、入力端子41から入力されたモノラルオーディオ信号を帯域分割部44にて帯域分割し、ステレオ化処理部45にて、ステレオ化情報に基づいてステレオ信号を作成し、作成されたステレオ信号を、各チャンネルの帯域合成処理部51,52にて帯域合成して、得られたステレオ左右チャンネル(Lch,Rch)の各オーディオ信号を出力端子55,56よりそれぞれ出力する。
これに対して、早送り再生のような不連続なフレーム再生等により任意のフレーム(伝送単位)から符号化オーディオデータが入力された場合には、使用可能なステレオ化情報が無い状態が生ずる。例えば図7の伝送単位#2の位置から入力が始まる場合に、伝送単位#0のステレオ化情報Sはフレーム間引き等により入力されておらず、伝送単位#2〜#4の間は使用可能なステレオ化情報が無いことになる。このように使用可能なステレオ化情報が無い伝送単位#2〜#4の間は、内部の帯域分割部44等の状態変数が初期化されると共に、図1のステレオ化装置の各切換スイッチ53X,54Xは選択A端子側に切り換えられ、入力端子41から遅延部46を介したモノラルオーディオ信号は、切換スイッチ53Xを介して、Lch出力端子55より出力されると共に、切換スイッチ54Xを介してRch出力端子56より出力される。これにより、ステレオ化情報の有無によって出力オーディオ信号のチャンネル数が変化しないようにしている。なお遅延部46は、帯域分割部44の例えばFIRフィルタ処理等による遅延を考慮して設けたものである。
次に、上記図7の伝送単位#5の位置のデータが入力され、使用可能なステレオ化情報Sが供給されると、先ずスイッチ43Xが選択B端子に接続され、帯域分割部44にモノラルオーディオ信号が供給されるが、この帯域分割部44の状態変数が十分に更新されるまで、スイッチ61,62、切換スイッチ53X,54Xは選択C端子に接続されない。このため、使用可能なステレオ化情報が無く、内部の状態変数が初期化された状態から、初めてステレオ化情報が入力されると、スイッチ43Xが選択B端子に接続され、帯域分割部44の状態変数を更新しつつ、遅延部46からのモノラルオーディオ信号を、各切換スイッチ53X,54Xの選択A端子を介して、各出力端子55,56より出力する。その後、帯域分割部44の状態変数が十分に更新されたところで、スイッチ61,62が選択C端子に接続されると共に、切換スイッチ53X,54Xが選択C端子側に切換接続され、上述したようなステレオ化された信号が出力オーディオ信号として出力端子55,56よりそれぞれ出力される。従って、帯域分割部44の状態変数が初期化された状態の影響が出力オーディオ信号に及ぶことがなく、異音等の発生が防止されたステレオオーディオ信号が得られる。
すなわち、本発明においては、ステレオ化情報がモノラルオーディオ信号の符号化情報に間歇的に多重化されて伝送された符号化オーディオデータを復号化処理して再生する際に、ステレオ化情報が入力されない場合、モノラルオーディオ信号を用いたステレオオーディオ信号を出力するようにし、ステレオ化情報が入力された場合、フィルタ内部の状態変数の更新を開始し、該状態変数が全て更新されるまでの間、モノラルオーディオ信号を用いたステレオオーディオ信号を出力するようにし、フィルタ内部の状態変数が全て更新された場合、モノラルオーディオ信号に対してステレオ化情報に基づくステレオ化処理を行ってステレオオーディオ信号を生成して出力するようにしている。
次に、上述したHE AAC(High Efficiency Advanced Audio Coding,国際標準規格ISO/IEC 14496-3)、特にHE AAC v2(バージョン2)の符号化方式で符号化された符号化オーディオデータの再生に本発明を適用した再生装置の構成例について、図2を参照しながら説明する。この図2において、上述した図9の各部と対応する部分には同一の指示符号を付している。
図2の入力端子11には、AACコアの符号化情報、高域生成符号化情報(SBR処理のための帯域拡張符号化情報)、PS符号化情報(ステレオ化のための空間情報)が含まれる符号化オーディオデータのビットストリーム(Coded Audio Stream)が伝送されて入力されており、一部の符号化情報は多重化されて伝送される。すなわち、上記図8と共に説明したように、AACコアの符号化情報ACに対して、上記SBR処理のための符号化情報SD(SBRデータ)は常時多重化されるのに対して、このSD(SBRデータ)を復号化するために必要とされるSH(SBRヘッダ)は間歇的に多重化されている。上記PS処理のためのPSデータは、SD(SBRデータ)の拡張領域に内包されて伝送されており、PSデータを得るためにもSH(SBRヘッダ)が必要とされるため、このSH(SBRヘッダ)はステレオ化必要情報となっている。
また、高域生成符号化情報(SBRデータ)、PS符号化情報(PSデータ)を含む場合には、AACコア復号部(AAC Core Coder)13で復号化されるオーディオ信号は最終出力オーディオ信号のハーフサンプリングレートで出力されるため、QMF分析(Analysis)部21とQMF合成(Synthesis)部33,34とを組み合わせることで、アップサンプリングされる。例えば、AACコア復号部13の出力信号がサンプリング周波数24kHzの場合、QMF合成部33,34からの出力オーディオ信号は、サンプリング周波数48kHzの信号となる。
入力端子11からの符号化オーディオデータ(Coded Audio Stream)は、ペイロードデフォーマッタ(Bitstream Payload Deformatter)12に送られて、AACコア復号部13へのAACコア符号化情報と、高域生成符号化情報・PS符号化情報とに分離される。
高域生成符号化情報・PS符号化情報は、SBR処理部20に送られ、SBR処理部20のパーサ(Bitstream Parser)14を介して、ハフマン復号・逆量子化部15に送られ、高域周波数信号生成情報、エンベロープ調整情報、ステレオ化情報が取り出されて各部23,24に送られると共に、Lch複製処理判断部16を介しステレオ化処理部30に送られる。SBR処理部20のパーサ14は、ペイロードデフォーマッタ12からの高域生成符号化情報等の多重化情報を取得し、内容を確認して、SBR処理の初期化が必要か否かを判断し、初期化が必要な場合には、初期化制御信号を端子14tより出力して後述するように各部のSBR処理の初期化を行う。また、Lch複製処理判断部16は、SBR処理初期化後に初めて多重化された符号化情報が得られたことを判定し、判定出力を端子16tより出力して、後述するLchのQMF合成部33の状態変数(遅延信号)をRchのQMF合成部34に複製する処理を行わせる。
AACコア復号部13では、入力されたAACコア符号化情報を復号化し、AACコアのモノラルオーディオ信号を生成する。生成されたモノラルオーディオ信号を、SBR処理部20のQMF分析部21に送って64帯域に帯域分割し、切換スイッチ22Xに送る。高域生成符号化情報(SBRデータ)が入力された場合には、切換スイッチ22Xが選択B,C端子に切換接続され、QMF分析部21からの信号が高域生成部(HF Generator)23に送られる。高域生成部23では高域周波数信号を生成し、エンベロープ調整部(Envelope Adjuster)24でエンベロープ調整を行って、ハイブリッド分析(Hybrid Analysis)部27及び切換スイッチ35Xに送る。
上記PS符号化情報(PSデータ)からステレオ化情報が得られている場合には、切換スイッチ22Xは選択C端子に切換接続される。ハイブリッド分析部27では入力された帯域分割信号の低域信号を更に帯域分割し、入力された帯域分割信号の高域信号と共に信号解析(De-correlate)部29及びステレオ化処理(Stereo Processing)部30に入力する。信号解析部29では、入力信号を解析し、音響調整し、ステレオ化処理部30に入力する。ステレオ化処理部30では、入力された帯域分割信号と、ステレオ化情報から、ステレオ左右チャンネルの信号を生成する。生成されたステレオの各チャンネルの信号は、それぞれスイッチ17,18を介して、各チャンネルのハイブリッド合成(Hybrid Synthesis)部31,32に送られる。各ハイブリッド合成部31,32にて、上記ハイブリッド分析部27にて分割された帯域を合成する。ハイブリッド合成部31からの信号は、切換スイッチ35Xを介してQMF合成(Synthesis)部33及び切換スイッチ19に送られ、ハイブリッド合成部32からの信号は、切換スイッチ19を介してQMF合成部34に送られる。各チャンネルのQMF合成部33,34にて、上記QMF分析部21で帯域分割された帯域を合成し、ステレオ左右チャンネル(Lch,Rch)の出力オーディオ信号を生成する。QMF合成部33からのLchのオーディオ信号は、切換スイッチ36X及び出力端子37に送られる。QMF合成部34からのRchのオーディオ信号は、切換スイッチ36Xに送られ、QMF合成部33からの信号とのいずれかが切換選択されて、出力端子38に送られる。
ここで、図2の再生装置のスイッチ切換等を含む各部動作は、図示しない制御手段により、入力された符号化情報の内容や、各部の状態等に応じて制御される。
この図2に示す再生装置は、上記図9に示した再生装置の構成に比較して、QMF分析部21の後段のスイッチ構成及びエンベロープ調整部24の後段のスイッチ構成が変更され、スイッチ17,18及び切換スイッチ19が追加され、QMF合成部33,34の状態変数を複製する点が異なっている。
図2の再生装置において、上述したような任意のフレーム(伝送単位)から符号化オーディオデータが入力された場合について説明する。例えば上記図8の伝送単位#2の位置から入力が始まる場合に、伝送単位#0のステレオ化必要情報であるSH(SBRヘッダ)は入力されていないため、伝送単位#2〜#4の間はSD(SBRデータ)が復号化できないため使用可能なステレオ化情報(PSデータ)が得られず、内部のSBR処理部20のQMF分析部21、ハイブリッド分析部27、QMF合成部33,34等の状態変数(遅延信号)が初期化される。次に、上記図8の伝送単位#5の位置のデータが入力されて、ステレオ化必要情報であるSH(SBRヘッダ)が供給されると、SD(SBRデータ)が復号化されて使用可能なステレオ化情報(PSデータ)が得られ、内部のSBR処理部20のQMF分析部21、ハイブリッド分析部27、QMF合成部33,34等の状態変数(遅延信号)が更新される。この状態変数(遅延信号)とは、フィルタ内の遅延素子に保持されるデータ(信号)のことであり、フィルタ処理では、フィルタ長に応じて、信号が入力されてから出力されるまでに遅延が生じるが、この遅延信号を意味する。
ここで、使用可能なステレオ化情報(PSデータ)が得られず内部の状態変数が初期化された状態では、各切換スイッチ22X,35X,36Xは、選択A端子側に切換接続される。このとき、AACコア復号部13からのモノラルオーディオ信号をQMF分析部21で帯域分割し、LchのQMF合成部33で帯域合成し、Lch,Rch共に同一のオーディオ信号を出力する。
次に、多重化された符号化情報が伝送されると、各切換スイッチ22X,35X,19,36Xは、選択B,C端子に切換接続される。この場合、選択B端子は帯域拡張符号化情報のみのとき、選択C端子は帯域拡張符号化情報(高域生成情報)及びステレオ化情報を含むときにそれぞれ切換接続される。
以下、ステレオ化必要情報であるSH(SBRヘッダ)が伝送されることによりSD(SBRデータ)が復号化されステレオ化情報(PSデータ)が得られるようになった場合について説明する。SBR処理の符号化情報(SBRデータ)及びステレオ化情報(PSデータ)が得られると、RchのQMF合成部34に初めて信号が送られるようになる。そのため、状態変数(遅延信号)を気にせずに出力オーディオ信号を生成すると、状態変数の初期化信号がRchのオーディオ信号に出力され、異音の原因となってしまう。そこで、本発明の実施の形態では、このタイミングで、Lch複製処理判断部16からの判定出力により、LchのQMF合成部33の状態変数(遅延信号)を、状態変数複製処理にて、RchのQMF合成部34に複製する。この操作により、ステレオ化情報が伝送されるまで選択A端子に接続された状態で再生していたにも拘わらず、LchのQMF合成部33の状態変数と同等の状態変数がRchのQMF合成部34に設定される。上記複製処理が実行されると、各切換スイッチ22X,35X,19,36Xは選択F端子に切換接続される。
通常、帯域合成処理にて、関係の無い適当な信号を遅延信号として用いると、帯域合成処理で意図しない増幅減衰がなされ、異音の原因となり得る。本実施の形態の方法では、初期化後初めて、多重化された符号化情報が得られたフレームでは、出力がモノラルからステレオと切り替わるポイントであるため、RchのQMF合成部34の状態変数(遅延信号)として、LchのQMF合成部33の状態変数(遅延信号)を用いても異音が発生する事は無い。
また、ステレオ化処理(PS処理)では、空間符号化の情報を適用するために、ハイブリッド分析部27による帯域分割、信号解析部29による解析結果と伝送された空間情報によるステレオ信号生成処理及びハイブリッド合成を行う。遅延を要すハイブリッド分析部27も多重化された符号化情報を復号化して初めて処理されるため、デコード内部変数初期化後に初めて多重化された符号化情報が得られたときの状態変数(遅延信号)は初期化された状態となり、信号解析部29の解析に影響し異音の原因となってしまう。すなわち、ハイブリッド分析部27にQMF分析部21で帯域分割された信号が入力されるが、ハイブリッド分析部27の状態変数(遅延信号)は初期化された状態であるため、正しく後段の処理がされない。
そのため、本実施の形態では、この影響を排除するために、初期化後初めてハイブリッド分析部27を処理する場合には、遅延信号を更新するためにハイブリッド分析部27とステレオ化処理部30のステレオ左右チャンネル生成係数の更新処理を行い、出力には、スイッチ35X,19をそれぞれ端子Fへ切り替え、ハイブリッド分析部27の前で分岐させた信号を各チャンネルのQMF合成部33,34に出力している。
具体的には、スイッチ17,18により、ハイブリッド分析部27の状態変数(遅延信号)が十分に更新されるまでステレオ化された信号は切断(スイッチ17,18が共にオフ)され、代わりに各切換スイッチ22X,35Xの選択F端子を介して伝送される信号がLchのQMF合成部33及び切換スイッチ19の選択F端子を介してRchのQMF合成部34に送られる。LchのQMF合成部33からの信号が出力端子37より出力され、LchのQMF合成部33と同じ状態変数のRchのQMF合成部34からの信号が切換スイッチ36Xの選択F端子を介して出力端子38より出力される。
ハイブリッド分析部27の状態変数(遅延信号)は、上記非特許文献1の8.6.4節に明記されている通り、6QMFサンプルの遅延がある。ステレオ化処理部30のステレオ左右チャンネル生成係数の更新処理は、上記非特許文献1の8.6.4.4節に記載されているように、係数が差分情報として伝送されるため、必要となる。
ハイブリッド分析部27の状態変数(遅延信号)が十分に更新されると、スイッチ17,18が共にオンされ(選択E端子に接続にされ)、ステレオ化処理部30からのステレオ左右チャンネルの信号がハイブリッド合成部31,32にそれぞれ送られる。各切換スイッチ35X,19,36Xは、選択E端子側にそれぞれ切換接続され、ハイブリッド合成部31からの信号はQMF合成部33を介してステレオLchのオーディオ信号として出力端子37より出力され、ハイブリッド合成部32からの信号はQMF合成部34を介してステレオRchのオーディオ信号として出力端子38より出力される。なお、スイッチ17,18及び切換スイッチ35X,19,36Xが選択E端子に接続されるタイミングとしては、ハイブリッド分析部27の状態変数の更新処理中にもRchのQMF合成部34の状態変数を更新することにより、1フレーム処理内で異音を発生させることなく、切り換えることが可能である。
図3〜図5は、例えば上記図2の構成における上述したようなデコード動作を説明するためのフローチャートである。
図3において、上記入力端子11に入力される符号化オーディオデータのビットストリームのような符号化情報に対して、ステップS101で上記HE AAC v2方式の符号化データの復号化処理(デフォーマット処理)を行い、多重化された符号化情報としての上述したような高域生成符号化情報(SBRデータ)や空間符号化情報(PSデータ)を取り出し、また、上記AACコア情報については、ステップS102にてAAC信号処理を行う。次のステップS103では、上記SBR処理を行うか否かが判断され、YESの場合はステップS104に、NOの場合はステップS114に進む。これらの処理は、例えば図2のペイロードデフォーマッタ12、AACコア復号部13での処理に対応する。
ステップS104では、例えば上記QMF分析部21により、QMF帯域分割処理を行う。次のステップS105で、多重化された符号化情報が復号化済みか否かを判断し、YESのときはステップS106に進み、NOのときはステップS113に進む。ステップS106では、例えば上記高域生成部23により、多重化された高域生成符号化情報(多重化の復号化が済みの情報)を用いて高域信号生成処理を行い、次のステップS107でPS処理を行うか否かを判断する。
ステップS107でYES(PS処理を行う)と判断されたとき、ステップS120でPS処理を行った後ステップS111に進み、ステップS107でNO(PS処理をしない)と判断されたときは、直接ステップS111に進む。ステップS120におけるPS処理の具体例については、図4、あるいは図5を参照しながら後述する。
ステップS111では、LchのQMF帯域合成処理を行い、ステップS112でRchのQMF帯域合成処理を行って、得られたオーディオ信号を出力する。また、上記ステップS113ではLchのQMF帯域合成処理を行い、ステップS114で必要に応じてモノラル信号を複製してステレオ信号を生成し、得られたオーディオ信号を出力する。これらの処理は、例えば上記図2の切換スイッチ35X,36XやQMF合成部33,34等での処理に対応する。
図4は、本発明の実施の形態の上記ステップS120のPS処理の一具体例を示し、上記図3のステップS107でYES(PS処理を行う)と判断されたとき、ステップS108に進んでハイブリッド分析処理を行い、ステップS109で空間情報によるステレオ信号生成処理を行い、ステップS110でハイブリッド合成処理を行った後、ステップS115に進む。ステップS115では、RchのQMF帯域合成処理の状態変数(遅延信号)、例えば図2のQMF合成部34の状態変数は更新済みか否かを判断し、YESのときは上記図3のステップS111へ、NOのときはステップS116へ進む。ステップS116では、LchのQMF帯域合成処理の状態変数をRchのQMF帯域合成処理の状態変数に複製した後、上記図3のステップS111に進む。これらの処理は、例えば図2のハイブリッド分析部27からQMF合成部33,34までの処理に対応する。
これらの図3、図4に示す具体例においては、符号化情報の一部が多重化されて伝送される符号化オーディオデータの任意のフレームからの再生を行う際に、再生装置の内部状態を初期化し、多重化されて伝送される符号化情報が無い状態でも、少なくとも2つ以上のサブバンドに分割し、遅延が発生する帯域合成フィルタ処理によりアップサンプリングしてモノラルオーディオ信号を出力するようにし、その後、多重化された符号化情報が入力されて最初にモノラル信号からステレオ信号を生成する処理を行う場合に、モノラル信号のフィルタ状態変数(遅延信号)をステレオ信号のフィルタ状態変数として処理させる(ステップS114,S115,S116)ことにより、フィルタ処理の遅延による出力オーディオ信号の異音発生を防止している。
次に、図5は、本発明の実施の形態の上記図3のステップS120のPS処理の他の具体例を示している。すなわち、上記図3のステップS107でYES(PS処理を行う)と判断されたとき、図5のステップS108に進んでハイブリッド分析処理(例えば図2のハイブリッド分析部27での処理)を行った後、ステップS119に進み、上記ハイブリッド分析処理の状態変数(遅延信号)は全て更新済みか否かを判別し、YESのときはステップS109に進み、NOのときはステップS117に進んでいる。ステップS109では、空間情報によるステレオ信号生成処理を行い、ステップS110でハイブリッド合成処理を行った後、ステップS115に進む。ステップS117では、上記ハイブリッド分析処理の状態変数が未だ全て更新されていないため、モノラル信号を複製してステレオ信号を生成したものをハイブリッド合成処理の出力とし、ステップS118に進んで必要な状態変数の更新を行った後、ステップS115に進む。
ステップS115では、RchのQMF帯域合成処理の状態変数(例えば図2のQMF合成部34の状態変数)は更新済みか否かを判断し、YESのときは上記図3のステップS111へ、NOのときはステップS116へ進む。ステップS116では、LchのQMF帯域合成処理の状態変数をRchのQMF帯域合成処理の状態変数に複製し、上記図3のステップS111に進む。
これらの図3、図5に示す具体例においては、上記図4と共に説明した具体例の構成に加えて、ステップS119,S117,S118に示すように、フィルタ処理の遅延が出力オーディオ信号に影響しないように、少なくともフィルタ状態変数(遅延信号)全てが更新されるまでは、フィルタ状態変数の更新処理と、出力信号の複製処理を行い、十分にフィルタ状態変数の更新が行われた後で、通常の再生処理を行うことにより、フィルタ処理の遅延による出力オーディオ信号の異音発生を防止している。
このような本発明の実施の形態におけるステレオ左右チャンネル(Lch,Rch)の出力オーディオ信号の例を図11の(C)、(D)に示す。各時刻t1〜t3については、上述した図11の(A)、(B)の説明と同様である。すなわち、時刻t1までは使用可能なステレオ化情報が無い状態(例えば、AAC−LC(Low Complexity)符号化情報信号のみが入力され、SBR処理はアップサンプリング(Up Sampling)のみが行われている状態)であり、時刻t1においてステレオ化情報を含む多重化された符号化情報が有効(使用可能)となり、AAC処理、SBR処理、PS処理が開始される。また、図11の(C)はLch、(D)はRchの出力オーディオ信号をそれぞれ示している。
図11に示す本発明の実施の形態におけるステレオ左右チャンネルの出力オーディオ信号(C)、(D)は、従来の出力オーディオ信号(A)、(B)と比較すれば明らかなように、時刻t1〜t2の間の上記SBR処理のための帯域合成部(QMF合成部34)の状態変数(遅延信号)による影響も、時刻t2〜t3の間の上記PS処理のためのハイブリッドフィルタ(ハイブリッド分析部27)の状態変数による影響も現れておらず、本発明の実施の形態によれば、内部の状態変数が初期化された状態から、初めて多重化された符号化情報(ステレオ化情報等)が入力された場合でも、異音の発生等の無い良好なステレオオーディオ信号を再生することができる。
以上説明した本発明の実施の形態は、ステレオ化情報を含む一部の符号化情報がモノラルオーディオ信号に多重化されて伝送される符号化オーディオデータを復号化処理して再生する際に、使用可能な上記多重化された符号化情報が入力されない状態で内部の状態変数(遅延信号)を初期化し、モノラルオーディオ信号を用いたステレオオーディオ信号を出力するようにし、上記内部の状態変数が初期化された状態で上記多重化された符号化情報が入力されたとき、内部の状態変数の更新を開始し、該状態変数が全て更新されるまでの間、モノラルオーディオ信号を用いたステレオオーディオ信号を出力するようにし、上記内部の状態変数が全て更新されたとき、上記モノラルオーディオ信号に対して上記多重化された符号化情報に基づくステレオ化処理を含む信号処理を行ってステレオオーディオ信号を生成して出力する。
すなわち、ステレオ化情報がモノラルオーディオ信号の符号化情報に間歇的に多重化されて伝送された符号化オーディオデータを復号化処理して再生する際に、ステレオ化情報が入力されない場合、モノラルオーディオ信号を用いたステレオオーディオ信号を出力するようにし、ステレオ化情報が入力された場合、フィルタ内部の状態変数の更新を開始し、該状態変数が全て更新されるまでの間、モノラルオーディオ信号を用いたステレオオーディオ信号を出力するようにし、フィルタ内部の状態変数が全て更新された場合、モノラルオーディオ信号に対してステレオ化情報に基づくステレオ化処理を行ってステレオオーディオ信号を生成して出力する。
本発明の他の実施の形態は、符号化情報の一部が多重化されて伝送される符号化オーディオデータの復号化手段と、多重化された符号化情報の一部が伝送されていない場合でも、伝送された符号化情報の一部から出力オーディオ信号を生成する情報を取得する手段と、少なくとも2つ以上の帯域に分割して帯域分割信号を生成するオーディオ信号帯域分割手段と、生成した帯域分割信号に対して、帯域拡張符号化情報が伝送されることで、高域情報を生成する手段と、空間符号化情報が伝送されることにより、帯域分割信号に対して、遅延を要す副帯域分割信号生成手段により副帯域分割信号を生成し、空間符号化情報に基づいてモノラル信号からステレオ信号を生成する手段と、副帯域分割信号を帯域分割信号に合成する副帯域分割信号合成手段と、合成された帯域分割信号を遅延を要すオーディオ信号合成手段により合成し、出力オーディオ信号を生成する手段と、を有する符号化オーディオデータ再生装置において、不連続な位置(フレーム)から再生を行う場合に、符号化オーディオデータ再生装置の遅延を要す副帯域信号生成手段と、オーディオ信号合成手段の状態変数(遅延信号)の初期化を行う手段と、上記初期化後に再生を継続する手段と、上記初期化後に、初めて多重化された符号化情報が伝送され、空間符号化情報が復号化されてモノラル信号からステレオ信号を生成する際に、生成されたステレオ信号のオーディオ信号合成手段の状態変数(遅延信号)としてモノラル信号の状態変数(遅延信号)を用いて処理する手段と、を有する。
また、このような符号化オーディオデータ再生装置の遅延信号初期化後に、初めて多重化された符号化情報が伝送され、空間符号化情報が復号化されてモノラル信号からステレオ信号が生成される際に、副帯域分割信号生成手段の状態変数(遅延信号)が全て更新されるまでは、状態変数(遅延信号)を更新するために擬似的に副帯域分割信号生成を行う手段と、擬似的に副帯域分割信号生成手段が動作している最中は、副帯域分割信号生成手段に入力されたモノラルの帯域分割信号を複製し、ステレオの帯域分割信号としてオーディオ信号合成手段へ出力する手段と、擬似的に副帯域分割信号生成手段が動作している最中は、モノラル信号からステレオ信号を生成する手段の差分で更新される分割係数を更新する手段と、副帯域分割信号生成手段の遅延信号が全て更新された後に空間符号化情報に基づいてモノラル信号からステレオ信号を生成する手段と、を有する。
すなわち、符号化情報の一部が多重化されて伝送される符号化されたオーディオデータの復号化処理にて、任意のフレームからの通常再生を行う際に、デコーダの遅延信号を初期化し、多重化されて伝送される符号化情報が無い状態でも、少なくとも2つ以上の帯域に分割し、遅延を要す帯域合成フィルタ処理によりアップサンプリングしてモノラルオーディオ信号を複製してステレオオーディオ信号として出力でき、初めて符号化情報が伝送され、空間復号化処理が有効になる場合に、モノラル信号のオーディオ信号帯域合成処理の遅延信号をステレオ信号のオーディオ信号帯域合成処理の遅延信号として処理させることにより、QMF合成フィルタ処理の遅延による出力オーディオ信号の異音を発生させなくする。
また、副帯域分割フィルタ処理の遅延が出力オーディオ信号に影響しないように、少なくとも副帯域分割フィルタ処理の遅延信号全てが更新されるまでは、遅延信号の更新処理と、出力信号の複製処理を行い、全ての遅延信号の更新が行われた後で、通常の再生処理を行うことにより、フィルタ処理の遅延による出力オーディオ信号の異音を発生させなくする。
これによって、符号化情報の一部が多重化されて伝送されるような空間復号化処理を有する符号化オーディオデータでも、異音が発生することなく、任意位置からの再生が可能となる。
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。例えば、上述した本発明の実施の形態においては、ハードウェア構成を有する再生装置あるいは再生方法として説明したが、上述した各工程の処理をソフトウェアにより実現すること、すなわち、CPU(Central Processing Unit)を用いたコンピュータによりプログラムを実行させることで実現することが可能であり、また、このコンピュータプログラムを記録媒体に記録して提供することも可能である。
本発明の実施の形態となる再生装置の概略構成を示すブロック図である。 本発明の実施の形態をHE AAC v2方式で符号化された符号化オーディオデータの再生装置に適用した構成例を示すブロック図である。 図2に示す再生装置の動作を説明するためのフローチャートである。 図3のステップS120のPS処理の一具体例を説明するためのフローチャートである。 図3のステップS120のPS処理の他の具体例を説明するためのフローチャートである。 従来のステレオ化装置の構成例を示すブロック図である。 図6のステレオ化装置に入力される信号の一例を示す図である。 HE AAC v2方式のステレオ化装置に入力される信号の一例を示す図である。 HE AAC v2方式で符号化された符号化オーディオデータの再生装置の構成例を示すブロック図である。 図9に示す再生装置の動作を説明するためのフローチャートである。 従来の再生装置の出力オーディオ信号と、本発明の実施の形態が適用された再生装置の出力オーディオ信号とを対比して示す波形図である。
符号の説明
11 符号化オーディオデータの入力端子、 21 QMF分析部、 23 高域生成部、 27ハイブリッド分析部、 30,45 ステレオ化処理部、 31,32 ハイブリッド合成部、 33,34 QMF合成部、 44 帯域分割部、 51,52 帯域合成部

Claims (8)

  1. ステレオ化処理に必要とされるステレオ化必要情報がモノラルオーディオ信号の符号化情報に間歇的に多重化されて伝送された符号化オーディオデータを復号化処理して再生する再生方法において、
    上記ステレオ化必要情報が入力されない場合、モノラルオーディオ信号を用いたステレオオーディオ信号を出力する第1の工程と、
    上記ステレオ化必要情報が入力された場合、フィルタ内部の状態変数の更新を開始し、該状態変数が全て更新されるまで、モノラルオーディオ信号を用いたステレオオーディオ信号を出力する第2の工程と、
    上記フィルタ内部の状態変数が全て更新された場合、上記モノラルオーディオ信号に対して上記ステレオ化必要情報により得られたステレオ化情報に基づくステレオ化処理を行ってステレオオーディオ信号を生成して出力する第3の工程と
    を有することを特徴とする再生方法。
  2. 上記ステレオ化処理は、帯域拡張されたモノラルオーディオ信号に対して行われることを特徴とする請求項1記載の再生方法。
  3. 上記第1の工程では、上記モノラルオーディオ信号を帯域分割フィルタ処理により少なくとも2つ以上のサブバンドに分割し、帯域合成フィルタ処理によりアップサンプリングしてモノラルオーディオ信号を用いたステレオオーディオ信号を出力し、
    上記第2の工程では、モノラルオーディオ信号のフィルタ内部の状態変数をステレオオーディオ信号のフィルタ状態変数として処理させることを特徴とする請求項2記載の再生方法。
  4. 上記符号化オーディオデータは、HE AAC(High Efficiency Advanced Audio Coding)の符号化方式におけるモノラルオーディオデータに相当するAACコアの符号化情報と、SBR(Spectral Band Replication)処理の符号化情報と、PS(Parametric Stereo)処理の符号化情報とを有し、上記SBR処理の符号化情報は、多重化されて間歇的に伝送される符号化情報であるSBRヘッダ(sbr header)と常に伝送される符号化情報であるSBRデータ(sbr data)とで構成され、上記PS処理の符号化情報であるPSデータ(ps data)は、上記SBRデータの拡張領域に内包されて伝送され、上記SBRヘッダは上記SBRデータを復号化するために必要とされる上記ステレオ化必要情報であることを特徴とする請求項3記載の再生方法。
  5. ステレオ化処理に必要とされるステレオ化必要情報がモノラルオーディオ信号の符号化情報に間歇的に多重化されて伝送された符号化オーディオデータを復号化処理して再生する再生装置において、
    入力されたモノラルオーディオ信号を帯域分割する帯域分割手段と、
    上記帯域分割手段からの信号を上記多重化された符号化情報に含まれる上記ステレオ化情報に基づきステレオ化処理するステレオ化処理手段と、
    ステレオ化処理手段からのステレオ左右チャンネルの信号をそれぞれ帯域合成する帯域合成手段と、
    上記ステレオ化必要情報が入力されない場合、モノラルオーディオ信号を用いたステレオオーディオ信号を出力するように制御し、上記ステレオ化必要情報が入力された場合、フィルタ内部の状態変数の更新を開始し、該状態変数が全て更新されるまで、モノラルオーディオ信号を用いたステレオオーディオ信号を出力するように制御し、上記フィルタ内部の状態変数が全て更新された場合、上記モノラルオーディオ信号に対して上記ステレオ化必要情報により得られたステレオ化情報に基づくステレオ化処理を行ってステレオオーディオ信号を生成して出力するように制御する制御手段と
    を有することを特徴とする再生装置。
  6. 上記ステレオ化処理は、帯域拡張されたモノラルオーディオ信号に対して行われることを特徴とする請求項5記載の再生装置。
  7. ステレオ化処理に必要とされるステレオ化必要情報がモノラルオーディオ信号の符号化情報に間歇的に多重化されて伝送された符号化オーディオデータを復号化処理して再生する処理をコンピュータに実行させるプログラムにおいて、
    上記ステレオ化必要情報が入力されない場合、モノラルオーディオ信号を用いたステレオオーディオ信号を出力する第1の工程と、
    上記ステレオ化必要情報が入力された場合、フィルタ内部の状態変数の更新を開始し、該状態変数が全て更新されるまで、モノラルオーディオ信号を用いたステレオオーディオ信号を出力する第2の工程と、
    上記フィルタ内部の状態変数が全て更新された場合、上記モノラルオーディオ信号に対して上記ステレオ化必要情報により得られたステレオ化情報に基づくステレオ化処理を行ってステレオオーディオ信号を生成して出力する第3の工程と
    を有することを特徴とするプログラム。
  8. ステレオ化処理に必要とされるステレオ化必要情報がモノラルオーディオ信号の符号化情報に間歇的に多重化されて伝送された符号化オーディオデータを復号化処理して再生する処理をコンピュータに実行させるプログラムが記録された記録媒体において、
    上記プログラムは、
    上記ステレオ化必要情報が入力されない場合、モノラルオーディオ信号を用いたステレオオーディオ信号を出力する第1の工程と、
    上記ステレオ化必要情報が入力された場合、フィルタ内部の状態変数の更新を開始し、該状態変数が全て更新されるまで、モノラルオーディオ信号を用いたステレオオーディオ信号を出力する第2の工程と、
    上記フィルタ内部の状態変数が全て更新された場合、上記モノラルオーディオ信号に対して上記ステレオ化必要情報により得られたステレオ化情報に基づくステレオ化処理を行ってステレオオーディオ信号を生成して出力する第3の工程と
    を有することを特徴とする記録媒体。
JP2007272856A 2006-11-30 2007-10-19 再生方法及び装置、プログラム並びに記録媒体 Expired - Fee Related JP4930320B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2007272856A JP4930320B2 (ja) 2006-11-30 2007-10-19 再生方法及び装置、プログラム並びに記録媒体
US11/935,050 US8363842B2 (en) 2006-11-30 2007-11-05 Playback method and apparatus, program, and recording medium
TW096141906A TWI380287B (en) 2006-11-30 2007-11-06 Playback method and apparatus, program, and recording medium
EP07254547A EP1928212B1 (en) 2006-11-30 2007-11-22 Playback method and apparatus for monaural audio signal using stereo process information
DE602007012644T DE602007012644D1 (de) 2006-11-30 2007-11-22 Abspielvorrichtung und -gerät für ein Monoaudiosignal unter Verwendung von Stereoprozessinformationen
KR1020070120956A KR20080049632A (ko) 2006-11-30 2007-11-26 재생 방법 및 장치, 프로그램 및 기록 매체
CN2007101954765A CN101192407B (zh) 2006-11-30 2007-11-30 再生方法和设备、程序、以及记录介质

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006324775 2006-11-30
JP2006324775 2006-11-30
JP2007272856A JP4930320B2 (ja) 2006-11-30 2007-10-19 再生方法及び装置、プログラム並びに記録媒体

Publications (2)

Publication Number Publication Date
JP2008158496A JP2008158496A (ja) 2008-07-10
JP4930320B2 true JP4930320B2 (ja) 2012-05-16

Family

ID=39487355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007272856A Expired - Fee Related JP4930320B2 (ja) 2006-11-30 2007-10-19 再生方法及び装置、プログラム並びに記録媒体

Country Status (5)

Country Link
JP (1) JP4930320B2 (ja)
KR (1) KR20080049632A (ja)
CN (1) CN101192407B (ja)
DE (1) DE602007012644D1 (ja)
TW (1) TWI380287B (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2521364T3 (da) * 2009-02-19 2014-10-20 Panasonic Corp Optagemedium, afspilningsindretning og optagefremgangsmåde
TWI433137B (zh) * 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN102254560B (zh) * 2010-05-19 2013-05-08 安凯(广州)微电子技术有限公司 一种移动数字电视录像中的音频处理方法
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
KR101118466B1 (ko) * 2010-11-08 2012-03-12 티제이미디어 주식회사 Vcd 모노 음악의 스테레오 변환 장치 및 그 방법
JP6155274B2 (ja) 2011-11-11 2017-06-28 ドルビー・インターナショナル・アーベー 過剰サンプリングされたsbrを使ったアップサンプリング
WO2014161996A2 (en) * 2013-04-05 2014-10-09 Dolby International Ab Audio processing system
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
KR102356012B1 (ko) 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
JP6210338B2 (ja) * 2015-12-28 2017-10-11 ソニー株式会社 信号処理装置および方法、並びにプログラム
CN106534762B (zh) * 2016-11-16 2019-12-13 深圳市捷视飞通科技股份有限公司 低延时分布式音频处理方法及系统
JP6439843B2 (ja) * 2017-09-14 2018-12-19 ソニー株式会社 信号処理装置および方法、並びにプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835895A (en) * 1997-08-13 1998-11-10 Microsoft Corporation Infinite impulse response filter for 3D sound with tap delay line initialization
US6721710B1 (en) * 1999-12-13 2004-04-13 Texas Instruments Incorporated Method and apparatus for audible fast-forward or reverse of compressed audio content
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
CN1284319C (zh) * 2002-04-22 2006-11-08 西安大唐电信有限公司 一种多通道amr声码器的实现方法和设备
SE527866C2 (sv) * 2003-12-19 2006-06-27 Ericsson Telefon Ab L M Kanalsignalmaskering i multikanalsaudiosystem

Also Published As

Publication number Publication date
CN101192407A (zh) 2008-06-04
KR20080049632A (ko) 2008-06-04
JP2008158496A (ja) 2008-07-10
TW200830276A (en) 2008-07-16
DE602007012644D1 (de) 2011-04-07
CN101192407B (zh) 2011-04-13
TWI380287B (en) 2012-12-21

Similar Documents

Publication Publication Date Title
JP4930320B2 (ja) 再生方法及び装置、プログラム並びに記録媒体
JP4834539B2 (ja) オーディオ信号合成
US8145498B2 (en) Device and method for generating a coded multi-channel signal and device and method for decoding a coded multi-channel signal
US8731204B2 (en) Device and method for generating a multi-channel signal or a parameter data set
JP4685925B2 (ja) 適応残差オーディオ符号化
JP4418493B2 (ja) パラメトリックマルチチャネル符号化システムにおけるチャネルの周波数ベースの符号化
JP4597967B2 (ja) オーディオ信号生成
JP4772279B2 (ja) オーディオ信号のマルチチャネル/キュー符号化/復号化
AU2006222285B2 (en) Device and method for generating an encoded stereo signal of an audio piece or audio data stream
KR101251426B1 (ko) 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
KR101283783B1 (ko) 고품질 다채널 오디오 부호화 및 복호화 장치
JP5260665B2 (ja) ダウンミックスを用いたオーディオコーディング
TWI550598B (zh) 使用聯合編碼殘餘信號之音訊編碼器、音訊解碼器、方法及電腦程式
JP2010505140A (ja) オブジェクトベースオーディオ信号をエンコーディング及びデコーディングする方法並びにその装置
JP2007528025A (ja) オーディオ配信システム、オーディオエンコーダ、オーディオデコーダ、及びそれらの動作方法
US20140310010A1 (en) Apparatus for encoding and apparatus for decoding supporting scalable multichannel audio signal, and method for apparatuses performing same
RU2420026C2 (ru) Способы и устройства для кодирования и декодирования аудиосигналов на основе объектов
US8363842B2 (en) Playback method and apparatus, program, and recording medium
JP2007110565A (ja) マルチチャンネル音響復号化装置及び方法
KR20080030848A (ko) 오디오 신호 인코딩 및 디코딩 방법 및 장치
KR20080030847A (ko) 오디오 신호 인코딩 및 디코딩 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120130

R151 Written notification of patent or utility model registration

Ref document number: 4930320

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150224

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees