JP5377974B2 - 信号処理装置 - Google Patents

信号処理装置 Download PDF

Info

Publication number
JP5377974B2
JP5377974B2 JP2008547029A JP2008547029A JP5377974B2 JP 5377974 B2 JP5377974 B2 JP 5377974B2 JP 2008547029 A JP2008547029 A JP 2008547029A JP 2008547029 A JP2008547029 A JP 2008547029A JP 5377974 B2 JP5377974 B2 JP 5377974B2
Authority
JP
Japan
Prior art keywords
header
frame
signal
encoding
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008547029A
Other languages
English (en)
Other versions
JPWO2008066114A1 (ja
Inventor
修二 宮阪
道弘 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2008547029A priority Critical patent/JP5377974B2/ja
Publication of JPWO2008066114A1 publication Critical patent/JPWO2008066114A1/ja
Application granted granted Critical
Publication of JP5377974B2 publication Critical patent/JP5377974B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • G11B2020/00028Advanced audio coding [AAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/04Selecting arrangements for multiplex systems for time-division multiplexing
    • H04Q11/0428Integrated services digital network, i.e. systems for transmission of different types of digitised signals, e.g. speech, data, telecentral, television signals

Description

本発明は、オーディオ信号を複数の階層に分離して圧縮符号化する信号処理装置に関する。例えば、MPEG規格AAC+SBR方式のように、メインの階層として低周波数帯域の信号を圧縮符号化するためにAAC方式を用い、サブの階層として高周波数帯域の信号を圧縮符号化するためにSBR方式を用いるような信号処理装置に関する。
近年、半導体メモリを記録媒体とするようなオーディオプレーヤの開発が行われている。当該オーディオプレーヤのユーザーは、多くの場合、CDなどの記録媒体に予め格納された音楽コンテンツを、エンコーダを用いて圧縮符号化し半導体メモリに格納し(CDリッピング)、当該半導体メモリに格納された圧縮オーディオコンテンツを、デコーダを用いて再生することによって音楽を楽しむ、という利用形態を取っている。
この場合、ユーザーの利便性の観点から、上記エンコーダに求められる特徴として、(1)圧縮符号化のビットレートが低いこと、(2)圧縮符号化の処理速度が速いこと、などがあげられる。圧縮符号化のビットレートが低いと、記録容量の少ない安価な記録媒体でも長時間の記録が行える。また、圧縮符号化の処理速度が速ければ、多くの曲のエンコードを短い時間内で実行できる。
近年ビットレートが低いことを特徴とする符号化方式として、例えば、MPEG規格AAC+SBR方式(ISO/IEC14496−3)が規格化された。図1は、AAC+SBR方式における圧縮符号化の基本的な考え方を示した図である。AAC+SBR方式では、メインの階層として、低周波数帯域の信号をAAC方式で圧縮符号化し(図1の左側)、サブの階層として高周波数帯域の信号をSBR方式で圧縮符号化(図1の右側)する。ここで、SBR方式は、低域の信号を高域に複製し、加工、整形するような方式であるので、SBR部分は非常に少ないビットレートで符号化できる。
図2は、AAC+SBR方式におけるビットストリームの基本的な構造を示した図である。予め定められた時間間隔に区切られたオーディオフレームごとに、AAC部(AACData)、SBR部(SBRData)が格納されており、それぞれにヘッダ情報(AACHeader,SBRHeader)がその先頭に置かれている。ここで注意すべきことは、SBR部のヘッダであるところのSBRHeaderは、ビットレート削減の観点から、必ずしも毎フレームごと存在する必要はなく、数フレームに1回挿入すればよいという点である。MPEG規格によれば、1秒間に2回挿入することが勧告されている。定期的に挿入しなければならない理由は、次の通りである。例えば、当該方式が放送で用いられたような場合、デコーダには、必ずしも先頭からビットストリームが投入されるとは限らない。そのような場合、ビットストリームの先頭にだけSBRHeaderが挿入されていて、定期的にSBRHeaderが挿入されていないような場合、ビットストリームの最後までSBR部分の再生ができないからである。同様に、蓄積されたビットストリームであっても、ビットストリームの先頭から再生するのではなく、例えば、40秒時点から再生するような場合、定期的にSBRHeaderが挿入されていなければ、SBR部分の再生ができないからである。
圧縮符号化処理の高速性に関しては、もちろん、エンコーダ自身を高速に処理するような技術が必要で、多数開発されているが、本願の趣旨ではないのでここでは省略する。一方、エンコードシステムとしての高速性の観点からいくつかの処理方法が工夫されている。図3は、CDの音楽信号を高速に処理するためのシステム構成を示している。
まず、CDに格納されている音楽信号は、入力PCM(Pulse Code Modulation)バッファに送られる。次に、信号処理プロセッサ、いわゆるDSP(Digital Signal Processor)は、上記入力PCMバッファから音楽信号を取り出して、当該音楽信号を圧縮符号化する。そのように圧縮符号化されて得られたビットストリームは、出力ビットストリームバッファを経由して、たとえばSDメモリカードのような外部メモリに格納される。この一連の処理は、制御マイコンによって制御される。ここで注意しなければならないことは、CDに格納された音楽信号から例えば10曲分をエンコードするような場合、上記入力PCMバッファには、各曲の切れ目なく連続的に音楽信号が投入され、上記信号処理プロセッサも、曲の切れ目を感知することなく、連続的にエンコード処理を行う、ということである。言い換えれば、10曲分の時間長を持った長い1曲をエンコードしているような処理である。このようにしてエンコードされ、出力ビットストリームバッファに格納されたビットストリームは、もともとCDに記録されている曲の長さ情報(何分何秒)に基づいて、1曲目、2曲目、というように、曲ごとに分割される(特許文献1参照)。このように、数曲分まとめて一括してエンコード処理する理由は、曲ごとにエンコード作業を行うよりも高速に処理することが可能だからである。
特開2004−101638号公報
しかしながら、上記のような方法の場合、符号化方式として、AAC+SBR方式を用いる場合、必ずしも各曲の先頭にSBRHeaderが挿入されないという課題がある。
図4は、CDに格納された音楽信号を、曲の切れ目を感知することなく連続的にAAC+SBR方式を用いてエンコードする場合に発生する課題を説明するための図である。図4(a)は、1枚のCDに4曲の音楽信号が格納されていることを示す図である。図4(b)は、一例として、1曲目と2曲目との曲間におけるビットストリームの構造をクローズアップして例示している。前述したように、信号処理プロセッサは、曲間を感知することなく入力の音楽信号を圧縮符号化しているので、SBRHeaderが定期的にしか挿入されていない場合、必ずしも曲の先頭にSBRHeader挿入されるとは限らないのである。勿論、SBRHeaderを毎フレーム挿入すれば、そのような問題はないが、SBRHeaderの分だけビットレートが上昇し、少しでもビットレートを低くしたい、という趣旨の符号化方式であるAAC+SBR方式としては、SBRHeaderを毎フレーム挿入することは趣旨に反する。
しかしながら、SBRHeaderには、SBR処理がどの周波数帯域の信号に適用されているか、ということを示す情報が記述されているので、もし、曲の先頭にSBRHeaderが挿入されていない場合、曲の先頭から、初めてSBRHeaderが検出されるまでの間、SBR部分を処理することができなくなり、結果として、再生音の信号が図4(c)に示すような状態になる、という課題がある。
図4(c)は、曲の先頭にSBRHeaderが挿入されていない場合の再生信号のスペクトルを示した図であり、横軸が時間、縦軸が周波数、そして、色の濃さは、信号の強さを示している。図から明らかなように、曲の先頭にSBRHeaderが挿入されていない場合、曲の先頭から、初めてSBRHeaderが検出されるまでの間、破線の楕円で示すSBR部分を処理することができなくなり、高域の周波数帯域の信号が再生されないという課題がある。
本発明は、このような従来の問題点に鑑みてなされたものであって、曲の切れ目なく連続的に投入された音楽信号をエンコードしたビットストリームを途中から再生する場合でも、再生開始時点から高音質の信号を再生できるようなビットストリームを生成する信号処理装置を提供することを目的とする。
上記の課題を解決するために、本発明の信号処理装置は、入力信号を、フレームの先頭に第1ヘッダを含む符号化信号に、フレーム単位で符号化する符号化手段と、前記符号化手段の符号化により生成される符号化信号の管理情報を示す第2ヘッダであって前記第1ヘッダとは異なる情報を示す第2ヘッダを、フレームの並びで表される前記符号化信号内の一定間隔のフレームごとに挿入する第1のヘッダ挿入手段と、前記第1のヘッダ挿入手段が前記第2ヘッダを挿入するフレームとは独立に、前記第2ヘッダを挿入するフレームを決定する制御手段と、前記制御手段によって決定された前記フレームに、前記第2ヘッダを単発的に挿入する第2のヘッダ挿入手段とを備えることを特徴とする。この構成により、第2ヘッダを毎フレーム挿入することによるビットレートの増加を避けつつ、必要なフレームには、第2ヘッダを挿入することができる。
前記第1のヘッダ挿入手段は、前記第2のヘッダ挿入手段によって前記第2ヘッダが挿入されると、前記第2のヘッダ挿入手段によって前記第2ヘッダが挿入されたフレームから一定間隔のフレームごとに前記第2ヘッダを挿入するものであってもよい。この構成により、第2のヘッダ挿入手段によって第2ヘッダが挿入されていない部分から再生を開始した場合でも、第1のヘッダ挿入手段によって周期的に挿入された前記第2ヘッダにより、当該第2ヘッダで示される符号化信号を再生することができる。
さらに、前記第1のヘッダ挿入手段は、フレーム毎に値が更新されるカウンタを有し、前記カウンタの値があらかじめ定められた設定値になると前記第2ヘッダを挿入し、前記第2のヘッダ挿入手段は、前記制御手段によって決定されたフレームで上記カウンタの値を強制的に前記設定値に書き換えることにより、前記第1のヘッダ挿入手段を使って前記制御手段によって決定されたフレーム内に前記第2ヘッダを挿入する構成としてもよい。この構成により、前記第1のヘッダ挿入手段と前記第2のヘッダ挿入手段とを少ない演算資源で実現できる。
また、前記制御手段は、入力信号の状態に応じて、前記第2ヘッダを挿入するフレームを決定するものであってもよい。この構成により、単発的に第2ヘッダを挿入するタイミングを入力信号の状態に応じて決定することができる。
前記制御手段は、外部から与えられる制御信号に従って、前記第2ヘッダを挿入するフレームを決定することとしてもよい。この構成によれば、単発的に第2ヘッダを挿入するタイミングを外部から与えられる制御信号に応じて決定することができる。
さらに、前記符号化手段は、複数曲の音楽信号からなる前記入力信号を連続的に符号化し、前記制御手段は、前記入力信号の曲の替わり目に相当する前記符号化信号中のフレームに前記第2ヘッダを挿入することを決定するようにしてもよい。この構成により、連続的に入力される複数曲の音楽信号を符号化する際、曲の替わり目で第2ヘッダ挿入することができる。
前記制御手段は、前記入力信号の振幅が閾値より小である前記符号化信号中のフレームに、前記第2ヘッダを挿入することを決定するようにしてもよく、この構成により入力信号の振幅が小であるフレーム、すなわち、曲の替わり目や入力信号の内容の替わり目などで第2ヘッダ挿入することができる。
前記制御手段は、前記入力信号の振幅が閾値より小である状態から前記閾値以上となるフレームに前記第2ヘッダを挿入することを決定するようにしてもよい。この構成により、入力信号の振幅が小である状態から大となるフレーム、すなわち、曲の先頭などに相当するフレームで第2ヘッダ挿入することができる。
また、前記制御手段は、前記入力信号の振幅が閾値より小である状態が所定の時間続いた後で、振幅が前記閾値以上となるフレームに前記第2ヘッダを挿入することを決定するようにしてもよい。この構成により、入力信号の振幅が小である状態が所定の時間続いた後で大となるフレーム、すなわち、曲の先頭などに相当するフレームなどで第2ヘッダを挿入することができる。
前記制御手段は、前記入力信号の曲調の変化を検出する曲調変化検出部を備え、前記制御手段は、前記曲調変化検出部が、前記入力信号の曲調が変化したことを検出した位置に相当する前記符号化信号中のフレームに、前記第2ヘッダを挿入することを決定するようにしてもよい。この構成により、曲調が変化した部分に相当するフレームで第2ヘッダ挿入することができる。
前記制御手段は、前記曲調変化検出部が、曲のさび部分を検出した前記入力信号の当該さび部分の先頭に相当する前記符号化信号中のフレームに、前記第2ヘッダを挿入することを決定するようにしてもよい。この構成により、曲のさび部分で第2ヘッダ挿入することができる。
また、前記第1のヘッダ挿入手段及び前記第2のヘッダ挿入手段は、前記符号化信号の再生周波数帯域を拡大するための副次的データの管理情報を示すヘッダを前記第2ヘッダとして挿入するとしてもよい。この構成により、再生周波数帯域を拡大するための符号化情報の管理情報を示す第2ヘッダを挿入することができる。
前記第1のヘッダ挿入手段及び前記第2のヘッダ挿入手段は、MPEG規格AAC+SBR方式におけるSBRHeaderを前記第2ヘッダとして挿入するとしてもよいし、前記第1のヘッダ挿入手段及び前記第2のヘッダ挿入手段は、前記符号化信号の再生チャネル数を拡大するための副次的データの管理情報を示すヘッダを前記第2ヘッダとして挿入するとしてもよい。
前記第1のヘッダ挿入手段及び前記第2のヘッダ挿入手段は、再生チャネル数を拡大するための副次的データの管理情報を示すヘッダであり、チャネル間の音圧差(Inter−channel Intensity Differences)を符号化するときの符号化方法を示す符号化モード情報を含むヘッダを前記第2ヘッダとして挿入するようにしてもよい。
前記第1のヘッダ挿入手段及び前記第2のヘッダ挿入手段は、再生チャネル数を拡大するための副次的データの管理情報を示すヘッダであり、チャネル間相関(Inter−channel Coherence)を符号化するときの符号化方法を示す符号化モード情報を含むヘッダを前記第2ヘッダとして挿入するようにしてもよい。
前記符号化手段は、前記入力信号の振幅の大きさを検出する振幅検出部を有し、前記制御手段は、前記符号化手段が検出する前記入力信号の振幅の大きさに基づいて、前記第2ヘッダを挿入するフレームを決定するようにしてもよい。この構成により前記制御手段が、少ない演算資源でいずれのフレームに第2ヘッダを挿入するかを決定することができる。
前記第1のヘッダ挿入手段が挿入する前記第2ヘッダと、前記第2のヘッダ挿入手段が挿入する前第2記ヘッダとは、値が同じであるとしてもよい。この構成により第2ヘッダの値を格納する領域が少なくて済むこととなる。
なお、本発明は、装置として実現できるだけでなく、その装置を構成する処理手段をステップとする方法として実現したり、それらステップをコンピュータに実行させるプログラムとして実現したり、そのプログラムを記録したコンピュータ読み取り可能なCD−ROMなどの記録媒体として実現したり、そのプログラムを示す情報、データ又は信号として実現したりすることもできる。そして、それらプログラム、情報、データ及び信号は、インターネット等の通信ネットワークを介して配信してもよい。
本発明の信号処理装置によれば、ヘッダを毎フレーム挿入することによるビットレートの増加を避けつつ、必要なフレームには、ヘッダを挿入することができる。
(実施の形態1)
以下本発明の実施の形態1における信号処理装置について図面を参照しながら説明する。
図5は本実施の形態1における信号処理装置1000の構成を示す図である。本信号処理装置は、第1符号化信号と第2符号化信号とからなる符号化信号を生成する信号処理装置であって、第1の符号化信号は、狭帯域のオーディオ信号をMPEG規格AAC方式で符号化した符号化信号であり、第2符号化信号は、前記第1符号化信号を復号化して得られる信号の周波数帯域を拡大する為の信号を符号化して得られる符号化信号であり、MPEG規格AAC+SBR方式におけるSBR部の符号化信号である。
図5において、信号処理装置1000は、制御部が入力PCM信号の振幅の変化から曲の変わり目を検出し、第2ヘッダ挿入部が次の曲の先頭のフレームにSBRHeaderを挿入する信号処理装置であって、第1符号化部100、第2符号化部101、ヘッダ情報記憶部102、ヘッダ挿入部110、制御部105及び多重化部106を備える。さらに、ヘッダ挿入部110は、第1ヘッダ挿入部103、第2ヘッダ挿入部104を備える。第1符号化部100は、入力のPCM信号の低域の周波数帯域の信号を符号化する。第2符号化部101は、入力のPCM信号の高域の周波数帯域の信号を符号化する。入力のPCM信号は、例えば、CD1枚を再生して得られる楽曲データである。ヘッダ情報記憶部102は、第2符号化部101が生成する第2符号化信号の管理情報を記憶する。ヘッダ挿入部110は、前記符号化信号の再生周波数帯域を拡大するための副次的データの管理情報を示すヘッダを挿入する前記第1のヘッダ挿入手段及び前記第2のヘッダ挿入手段の一例であり、すなわち、MPEG規格AAC+SBR方式におけるSBRHeaderを挿入する前記第1のヘッダ挿入手段及び前記第2のヘッダ挿入手段であり、ヘッダ情報記憶部102に格納されている第2符号化信号の管理情報であるSBRHeaderを第2符号化信号の先頭に挿入する。第1ヘッダ挿入部103は、前記管理情報を示すヘッダを周期的に、例えば、500m秒ごとに符号化信号に挿入する。なお、第1ヘッダ挿入部103がヘッダを符号化信号に挿入する周期は必ずしも500m秒である必要はなく、100m秒であってもよいし、300m秒であってもよいし、さらに異なる時間間隔であってもよい。第2ヘッダ挿入部104は、前記ヘッダを制御部105により決定されたフレームに単発的に挿入する。制御部105は、第2ヘッダ挿入部104を用いて符号化信号のどのフレームにSBRHeaderを挿入するかを決定する。多重化部106は、第1符号化部100が生成する第1符号化信号と、第2符号化部101が生成する第2符号化信号と、AACヘッダと、前記第1、第2の何れかのヘッダ挿入部によってSBRHeaderが挿入される場合は当該SBRHeaderなどとを多重化する。
以上のように構成された信号処理装置の動作について、図面を参照しながら以下に説明する。
まず、前記第1符号化部100において、入力のPCM信号の低域の周波数帯域、例えば、周波数8kHz以下の帯域などの信号を符号化する。本実施の形態では、第1符号化部100は、MPEG規格AAC方式により低域の周波数帯域を符号化するとしたが、特にそれに限定されるものではなく、他の方式でもよい。また、第1符号化部100が符号化を行う周波数帯域の上限を8kHzとしたが、これに限定されず、他の周波数であってもよい。
前記第2符号化部101では、前記第1符号化部100で生成される符号化信号を復号化して得られる信号の周波数帯域を拡大する為の信号を符号化する。本実施の形態では、MPEG規格AAC+SBR方式におけるSBR部の処理を行うものであるが、これも、特にAAC+SBR方式におけるSBR部の処理に限定されるものではなく、他の方式でもよい。第1符号化部100及び第2符号化部101は、入力信号をフレーム単位で符号化する符号化手段の一例である。また、第1符号化部100及び第2符号化部101は、複数曲の音楽信号からなる前記入力信号を連続的に符号化する前記符号化手段の一例である。
ヘッダ情報記憶部102は、AAC+SBR方式におけるいわゆるSBRHeaderに記載する情報を記憶するメモリである。図6は、MPEG規格書(ISO/IEC 14496−3:2005(E))の“Table4.1−Syntax of sbr_header()”(非特許文献1)を抜粋したものである。本テーブルに関する詳細な説明はISO/IEC 14496−3:2005(E)に記載されているのでここでは省略するが、SBRHeaderには、SBR処理における符号化信号の量子化分解能や、SBR処理がどの周波数帯域の信号に適用されているか、ということを示す情報などが含まれる。これらの情報は、通常、入力信号のサンプリング周波数や、出力ビットストリームのビットレートに応じて設定されるものであり、入力PCM信号自体の時々刻々の性質には依存しないので、予め当該ヘッダ情報記憶部102に記憶しておけばよい。すなわち、このことは、前記第1のヘッダ挿入手段が挿入する前記ヘッダと、前記第2のヘッダ挿入手段が挿入する前記ヘッダとは、値が同じであることの一例である。
制御部105は、前記第1のヘッダ挿入手段が前記ヘッダを挿入するフレームとは独立に、前記ヘッダを挿入するフレームを決定する制御手段、及び入力信号の状態に応じて、前記ヘッダを挿入するフレームを決定する前記制御手段の一例であり、入力PCM信号の振幅変化等を調べることにより、前記SBRHeaderをいつ、どのフレームに挿入するかを制御する。図7(a)は、第1ヘッダ挿入部103によって周期的にSBRHeaderが挿入された符号化信号の一部分を模式的に示す図である。図7(b)は、曲の替わり目で第2ヘッダ挿入部104によって次の曲の開始部分にSBRHeaderが単発的に挿入された符号化信号の一部分を模式的に示す図である。ここで、第1ヘッダ挿入部103は、前記符号化手段の符号化により生成される符号化信号の管理情報を示すヘッダを、フレームの並びで表される前記符号化信号内の一定間隔のフレームごとに挿入する第1のヘッダ挿入手段の一例であり、ヘッダ情報を所定のフレーム周期で挿入するものである。第2ヘッダ挿入部104は、前記制御手段によって決定された前記フレームに、前記ヘッダを単発的に挿入する第2のヘッダ挿入手段の一例であり、ヘッダ情報を単発的に挿入するものである。また、制御部105は、前記入力信号の曲の替わり目に相当する前記符号化信号中のフレームに前記ヘッダを挿入することを決定する前記制御手段の一例である。図7(a)は、第1ヘッダ挿入部103が500m秒ごとに周期的にSBRHeaderを挿入していることを示している。これに対し、図7(b)では、直前のSBRHeaderから500m秒に満たない200m秒後に、SBRHeaderが挿入されている。これは、制御部105が直前のSBRHeaderから200m秒後に曲の替わり目を検出したことにより、第2ヘッダ挿入部104が直前のSBRHeaderから200m秒後にSBRHeaderを挿入したことを示している。また、第2ヘッダ挿入部104がSBRHeaderを挿入した後は、第2ヘッダ挿入部104が挿入したSBRHeaderを起点として500m秒ごとに、第1ヘッダ挿入部103が周期的にSBRHeaderを挿入する。
ここで当該制御部105は、当該信号処理装置1000が生成する符号化信号が再生される際、再生開始点になりそうなフレームには、強制的にSBRHeaderを挿入し、そうでないフレームでは、ある所定のフレーム間隔で定期的にSBRHeaderを挿入する、という制御を行う。例えば、図8は、ステレオ入力PCM信号における曲の切り替わり部分の一例を示す波形図である。曲の無音の部分は、曲間であることが想定されるので、そのようなフレームにはSBRHeaderを挿入する。制御部105は、前記入力信号の振幅が閾値より小である前記符号化信号中のフレームに、前記ヘッダを挿入することを決定する前記制御手段の一例である。また、より好ましくは、図8の楕円で示される部分のように、無音から有音の部分に変化した時点は、曲の始まりであることが想定されるのでそのようなフレームにはSBRHeaderを挿入する。図8に示すように、CDでは、人間の耳に曲と曲との切れ目であることが認識できるように、曲と曲との間で無音部分が一定時間続くように楽曲が収録されている。従って、制御部105は、曲の先頭のフレームにSBRHeaderを挿入する場合、無音部分が一定時間続いた後、SBRHeaderを挿入することになる。ここで、制御部105は、前記入力信号の振幅が閾値より小である状態から前記閾値以上となるフレームに前記ヘッダを挿入することを決定する前記制御手段の一例である。また、曲調が変化した時点や、曲のいわゆる「さび」にあたる時点は、リスナーの嗜好に応じた再生開始時点として指示される可能性が高いことが想定されるのでそのようなフレームにはSBRHeaderを挿入する。ここで、曲調が変化した時点や、曲のさびにあたる時点を検出する方法は、従来から知られている方法を用いればよい(例えば特開2001−283569号公報参照(特許文献2))。制御部105の内部に備えられる図示しない曲調変化検出部は、前記入力信号の曲調の変化を検出する曲調変化検出部の一例であり、従来から知られている方法により曲調が変化した時点や、曲のさびにあたる時点を検出する。また、制御部105は、前記曲調変化検出部が、前記入力信号の曲調が変化したことを検出した位置に相当する前記符号化信号中のフレームに、前記ヘッダを挿入することを決定し、前記曲調変化検出部が、曲のさび部分を検出した前記入力信号の当該さび部分の先頭に相当する前記符号化信号中のフレームに、前記ヘッダを挿入することを決定する前記制御手段の一例である。
ここで、制御部105が上記のように入力信号の状態に応じて、SBRHeaderを挿入する時点を検出するには、図5に示したように、入力のPCM信号から直接情報を取り出してもよいが、前記第1符号化部100や、前記第2符号化部101における演算過程で生成される信号に基づいて検出してもよい。例えば、前記第1符号化部100は、本実施の形態では、AACエンコードの処理を実行している。AAC処理においては、所謂global_gainといわれる信号の大きさを示す情報が生成されるので、その情報を参照することで、入力PCM信号の振幅が大であるか小であるかを検出できる。従って、制御部は、それに基づいて、曲間の検出をしてもよい。ここで、第1符号化部100は、前記入力信号の振幅の大きさを検出する振幅検出部を有する前記符号化手段の一例である。図9は、第1符号化部の演算過程で生成される信号に基づいてSBRHeaderの挿入箇所を判断する信号処理装置の構成を示す図である。第1符号化部100で生成される信号に基づいて、入力PCM信号の振幅が大であるか小であるかを検出し、曲間の検出などを行う信号処理装置2000の構成は、図9のようになる。図9において、図5と同じ構成要素についてはすでに説明しているので同じ参照符号を付し、説明を省略する。信号処理装置2000の各構成要素は、制御部205以外、図5のものと同じである。信号処理装置2000では、制御部205が、第1符号化部100からの信号であるglobal_gainに基づいて曲の替わり目を検出する動作が異なる。制御部205は、前記符号化手段が検出する前記入力信号の振幅の大きさに基づいて、前記ヘッダを挿入するフレームを決定する前記制御手段の一例である。
また、あるいは、前記第2符号化部101は、本実施の形態では、AAC+SBR方式におけるSBRエンコードの処理を実施しており、SBR処理においても、入力信号の振幅の大きさを推定できる情報が生成されるので、その情報を参照することで、入力信号の振幅が大であるか小であるか検出でき、それに基づいて、曲間の検出をしてもよい。図10は、第2符号化部の演算過程で生成される信号に基づいてSBRHeaderの挿入箇所を判断する信号処理装置の構成を示す図である。第2符号化部101の演算過程で生成される信号に基づいて、入力PCM信号の振幅が大であるか小であるかを検出し、曲間の検出などを行う信号処理装置3000の構成は、図10のようになる。図10において、図5と同じ構成要素についてはすでに説明しているので同じ参照符号を付し、説明を省略する。信号処理装置3000の各構成要素は、制御部305を除き、図5のものと同じであるが、制御部305が、第2符号化部101からの信号に基づいて入力PCM信号の振幅が大であるか小であるかを検出し、曲の替わり目を検出するなどの動作をするところが異なる。
また、曲間を示す情報や、曲のさびの位置を示す情報は、当該発明による信号処理装置の外部より入手するように構成してもよい。図11は、外部から入力される制御信号に基づいてSBRHeaderの挿入箇所を判断する信号処理装置の構成を示す図である。外部からの制御信号に基づいてSBRHeaderの挿入箇所を検出する信号処理装置4000の構成は、図11のようになる。図11において、図5と同じ構成要素についてはすでに説明しているので同じ参照符号を付し、説明を省略する。信号処理装置4000の構成要素は制御部405を除き、図5のものと同じであるが、制御部405が曲間を示す情報や、曲のさびの位置を示す情報などの制御信号を外部より入手する経路を備えているところが図5と異なる。制御部405は、外部から与えられる制御信号に従って、前記ヘッダを挿入するフレームを決定する前記制御手段の一例である。
さて、第1ヘッダ挿入部103、第2ヘッダ挿入部104の動作について、フローチャートを用いて以下で詳細に説明する。
図12は、前記第1ヘッダ挿入部103の動作を示すフローチャートである。第1ヘッダ挿入部103は、フレーム毎に値が更新されるカウンタを有し、前記カウンタの値があらかじめ定められた設定値になると前記ヘッダを挿入する前記第1のヘッダ挿入手段の一例である。まず、第1ヘッダ挿入部103は、内部に備える図示しないヘッダ挿入間隔レジスタにヘッダ挿入の間隔を設定する(S1)。ここでは、A個のフレームに1回SBRHeaderを挿入することを設定している。なお、Aはあらかじめ定めた自然数である。次に、第1ヘッダ挿入部103は、フレームごとに値が更新されるフレームカウンタを0に初期化している(S2)。次いで、第1ヘッダ挿入部103は、上記フレームカウンタが0かどうかを検出している(S3)。フレームカウンタが0の場合、ステップS4にて、そのフレームにSBRHeaderの挿入を行う。その後、第1ヘッダ挿入部103は、フレームカウンタをフレーム毎に1インクリメントする。さらに、ここでは、フレームカウンタの値が、冒頭のステップS1で設定したフレーム間隔Aに一致した際、フレームカウンタの値を0に戻す(S5)。ステップS3においてフレームカウンタの値が0でなければ、ステップS5の処理に移る。ステップS5では、すでに説明したように、フレームカウンタの値を1インクリメントし、さらに、フレームカウンタの値がステップS1で設定されたAと一致すればフレームカウンタの値を0にリセットする。これによって、第1ヘッダ挿入部103は、周期的なヘッダ挿入を実現している。
図13は、第2ヘッダ挿入部104の機能も加味したときの、第1ヘッダ挿入部103及び第2ヘッダ挿入部104の動作を示すフローチャートである。ステップS11及びステップS12の処理は、図12のステップS1及びステップS2と同じであるが、第2ヘッダ挿入部104の動作を実現するために、ステップS13及びステップS14に制御部105の指示により強制的にフレームカウンタの値を0にする処理が設けられている点が、図12と異なる。ここで、第2ヘッダ挿入部104は、前記制御手段によって決定されたフレームで上記カウンタの値を強制的に前記設定値に書き換えることにより、前記第1のヘッダ挿入手段を使って前記制御手段によって決定されたフレーム内に前記ヘッダを挿入する前記第2のヘッダ挿入手段の一例である。この経路によって、単発的にヘッダを挿入したい際、それが実現できることとなる。すなわち、ステップS12でフレームカウンタの値を0に初期化した後、第2ヘッダ挿入部104は、制御部105からのヘッダ挿入指示があるか否かを判断し(S13)、制御部105からの指示があればフレームカウンタの値を0にする(S14)。ステップS13において、制御部105からの指示がなければ、何もせずにステップS15の処理に移る。図13において、ステップS15、ステップS16、及びステップS17の処理は、図12のステップS3、ステップS4及びステップS5の処理と同じである。ただし、ステップS17の処理の後の戻り先がステップS13の直前となる点は異なる。これにより、第2ヘッダ挿入部104は、フレームごとに制御部105からのヘッダ挿入指示があるか否かを判断して(S13)、制御部105からの指示があればフレームカウンタの値を0にする(S14)ことにより、ステップS16で単発的に、すなわち、第1ヘッダ挿入部103による周期的なヘッダ挿入とは無関係に、第2ヘッダ挿入部104はSBRHeaderを挿入することができる。また、第1ヘッダ挿入部103は、前記第2のヘッダ挿入手段によって前記ヘッダが挿入されると、前記第2のヘッダ挿入手段によって前記ヘッダが挿入されたフレームから一定間隔のフレームごとに前記ヘッダを挿入する前記第1のヘッダ挿入手段の一例であり、第2ヘッダ挿入部104によりSBRHeaderが挿入された後は、制御部105によるヘッダ挿入指示がなければ、フレームカウンタの値がフレーム挿入間隔Aと一致したフレームごとに、第1ヘッダ挿入部103はSBRHeaderを挿入することになる。
最後に、多重化部106によって、前記第1符号化部100が生成する符号化信号と、前記第2符号化部101が生成する符号化信号と、AACHeaderと、前記第1、第2の何れかのヘッダ挿入部によってヘッダが挿入される場合は当該SBRHeaderとが多重化される。
上記のように、本実施の形態によれば、入力のPCM信号の低域の周波数帯域の信号を符号化する第1符号化部100と、入力のPCM信号の高域の周波数帯域の信号を符号化する第2符号化部101と、前記第2符号化部が生成する符号化信号の管理情報を記憶するヘッダ情報記憶部102と、前記管理情報を示すヘッダを周期的に挿入する第1ヘッダ挿入部103と、前記ヘッダを単発的に挿入する第2ヘッダ挿入部104と、前記いずれのヘッダ挿入部を用いるかを決定する制御部と、前記第1符号化部100が生成する符号化信号と、前記第2符号化部101が生成する符号化信号と、前記第1、第2の何れかのヘッダ挿入部によってヘッダが挿入される場合は当該ヘッダとを多重化する多重化部とを備えることによって、当該信号処理装置で生成された符号化信号が再生される際、再生開始点となる箇所に、再生開始点で必要となるヘッダ情報を挿入することができることとなる。
尚、本実施の形態では、第1符号化部100は、AAC+SBR方式におけるAACの符号化部、第2符号化部101は、AAC+SBR方式におけるSBRの符号化部、挿入するヘッダは、SBRHeaderである、としたが、特にこれに限定されるべきものではない。例えば、AAC+SBR方式の拡張規格である、Enh−AAC+SBR方式(ISO/IEC14496−3:2001/FDAM2:2004(E)(非特許文献2))において本願の技術を用いてもよい。この場合、第1符号化部100はAACの符号化部、第2符号化部101は、SBRおよびParametricステレオ技術の符号化部、挿入するヘッダは、所謂ps_headerとなる。ここで、ps_headerは、再生チャネル数を拡大するための符号化情報の管理情報を示すヘッダであり、例えば、チャネル間の音圧差(Inter−channel Intensity Differences)を符号化するときの符号化方法を示す符号化モード情報や、チャネル間相関(Inter−channel Coherence)を符号化するときの符号化方法を示す符号化モード情報である。この場合、第1ヘッダ挿入部103及び第2ヘッダ挿入部104は、前記符号化信号の再生チャネル数を拡大するための副次的データの管理情報を示すヘッダを挿入する前記第1のヘッダ挿入手段及び前記第2のヘッダ挿入手段の一例である。また、第1ヘッダ挿入部103及び第2ヘッダ挿入部104は、再生チャネル数を拡大するための副次的データの管理情報を示すヘッダであり、チャネル間の音圧差(Inter−channel Intensity Differences)を符号化するときの符号化方法を示す符号化モード情報であるヘッダを挿入する前記第1のヘッダ挿入手段及び前記第2のヘッダ挿入手段の一例である。
尚、近年は、このようなチャネル間の違いを示す情報を圧縮符号化するMPEG Surround(MPS)も規格化されつつある。この方式においても、符号化のための管理情報の中には、必ずしも全フレームに挿入しなくてもよい管理情報がある。これらの情報についても、本願の技術を用いて、再生側で再生開始点になるフレームに当該管理情報を示すヘッダを挿入すればよい。例えば、MPEG Surround(MPS)の規格では、エンコード側では、入力のマルチチャネル信号をダウンミックスする必要があるが、そのダウンミックス係数は、必ずしも全フレームに挿入しなくてもよい情報である。
また、近年では、デジタル通信部を用いた会議システムなどの開発も行われており、その音声伝送方式として、本願が前提としているような階層構造をもった符号化方式が用いられる場合も想定される。例えば、AAC+SBRのように低域と高域を階層に分けて符号化するようなものや、MPSのようにダウンミックス信号とそれをマルチチャネルに拡大する信号を階層に分けて符号化するようなものが用いられることが想定される。それを用いることによって、通信経路の伝送容量に余裕がある場合は全階層を伝送し、そうでない場合はいくつかのサブの階層を廃棄して伝送する、というようなことができるからである。
また、第1符号化部100及び第2符号化部101が放送波に多重化する音声符号化信号を生成する場合には、制御部が放送波の内容がCM放送であるか番組放送であるかを検出して、番組放送に切り替わるフレームにSBRHeader、MPSのダウンミックス係数、又はps_headerなどを挿入するようにしてもよい。ここで、制御部は、放送波の内容がCM放送であるか番組放送であるかを検出する放送内容検出部を有し、放送がCM放送から番組放送に切り換わるフレームに前記ヘッダを挿入することを決定する前記制御手段の一例である。
同様に、第1符号化部100及び第2符号化部101が放送波に多重化する音声符号化信号を生成する場合には、符号化の対象となる音声情報が複数のマイクロホンで収録される場合がある。例えば、あるマイクロホンではソロ歌手の音声を収録し、別のマイクロホンではバックバンドの伴奏やバックコーラスの音声を収録するなどの場合である。バックバンドの前奏の後にソロ歌手の音声が収録されているような場合、歌手の音声情報から再生が開始される可能性も高いと考えられる。このような場合、主としてバックバンドの伴奏やバックコーラスの音声を収録した音声情報を符号化している状態から、主としてソロ歌手の音声を収録した音声情報を符号化している状態に遷移した場合、制御部は、このような音声情報の切り替え位置に当たるフレームを、音声情報を収録するマイクロホンの切り替えによって検出し、そのフレームにSBRHeaderを挿入することを決定するとしてもよい。ここで、制御部は、前記入力信号の内容である音声情報の切り替え位置で、前記ヘッダを挿入することを決定する前記制御手段の一例である。
より具体的には、第1マイクロホン及び第2マイクロホンを含む少なくとも2本のマイクロホンを用いて収音された音声情報を前記符号化手段が符号化する際、前記符号化手段が主として第1マイクロホンで収音している音声情報を符号化している状態であるか、前記符号化手段が主として第2マイクロホンで収音している音声情報を符号化している状態であるかを検知し、前記符号化手段が前記第1マイクロホンで収音した音声情報を符号化している状態から前記第2マイクロホンで収音した音声情報を符号化している状態へ遷移したことを検知した場合、前記第2マイクロホンで収音した音声情報に切り替わった先頭のフレームに、前記ヘッダを挿入することを決定する制御手段の一例である。
また、上記の例では、音声情報を収録したマイクロホンの区別により、再生が開始される先頭フレームとなる可能性が高いフレームを検出したが、第1符号化部100及び第2符号化部101が、音声情報と画像情報とを放送する放送波に多重化する音声符号化信号及び画像符号化信号を生成する場合、画像情報を収録したカメラの区別により、再生が開始される際の先頭フレームとなる可能性が高いフレームを検出することができる。この場合、制御部は、画像情報の切り替え時点の前記入力信号の位置に相当する前記符号化信号中のフレームに、前記ヘッダを挿入することを決定する前記制御手段の一例であり、より具体的には、前記画像情報が少なくとも第1カメラと第2カメラとを含む2台のカメラを用いて収録され、前記画像情報が第1カメラで収録されている状態であるか、第2カメラで収録される状態であるかを検知し、前記画像情報が前記第1カメラで収録されている状態から前記第2カメラで収録される状態へ遷移したことを検知した位置に相当するフレームに、前記ヘッダを挿入することを決定する前記制御手段の一例である。
さて、このような、階層構造を備えた符号化方式の場合は、AAC+SBRや、MPSがそうであるように、サブの階層の管理情報を必ずしも全フレーム伝送する必要がないが、一方で、通信を前提とした双方向の機器の場合は、受信側の要求に従って、サブの階層の管理情報を単発的に挿入しなければならない場合がある。これは、音声符号化信号に限らず、画像符号化信号についても同じことがいえる。例えば、1対1で通信していた電話会議において、もう1つ参加するサイトが増えたような場合、参加サイトが増えたそのタイミングでサブの階層の管理情報が音声符号化信号についても画像符号化信号についても、両方について、新たに参加したサイトのデコーダでは必要となる。そうしなければ、定期的に送信されてくる管理情報を待たなくてはならないからである。また、通信経路にエラーが生じ、信号を正常に受信できなかったような場合は、そのことを送信側に伝え、強制的に管理情報を送信させなくてはならない。そのような場合でも、本願実施の形態1の図11で示した構成において、制御情報を外部から挿入することで強制的に管理情報を挿入できることになる。
また、画像符号化及びオーディオ符号化において、時間的に先に符号化されたデータと符号化対象データとの差分を符号化する予測符号化の手法がとられている場合に、予測符号化の途中のデータから再生が開始されると、時間的に先に符号化されたデータがないので、符号化された画像及びオーディオを正しく復号化することができない。そのため、予測符号化された符号化データの途中から再生が開始される可能性がある場合、BSヘッダと同様にして、その位置に、予測符号化の初期化を示す管理情報(リセットサイン)を入れておくとしてもよい(特開2006−106475号公報参照(特許文献3))。この場合、第1符号化部100及び第2符号化部101は、入力信号の符号化対象フレームと、前記符号化対象フレームより前に符号化されたフレームとを用いて、それらの差分情報を符号化する予測符号化を行う前記符号化手段の一例である。また、制御部は、前記入力信号が予測符号化されている場合で、予測符号化された符号化信号の途中から再生が開始される可能性がある場合、再生が開始される可能性が高いフレームを、前記ヘッダを挿入するフレームと決定する前記制御手段の一例である。
なお、ブロック図(図5、図9、図10、及び図11など)の各機能ブロックは典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い。例えばメモリ以外の機能ブロックが1チップ化されていても良い。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、各機能ブロックのうち、符号化または復号化の対象となるデータを格納する手段だけ1チップ化せずに別構成としても良い。
本発明にかかる信号処理装置は、階層的な構成をもった符号化信号を生成する符号化装置に関し、サブの階層のヘッダ情報を定期的、あるいは単発的に挿入することで、再生側での再生開始点になるポイントにサブの階層のヘッダ情報を適切に挿入でき、再生側で再生開始時点から高音質の再生ができるので、例えば、AAC+SBR方式やMPEG Surround方式が採用されたオーディオ再生機器に応用できる。
図1は、AAC+SBR方式における圧縮符号化の基本的な考え方を示した図である。 図2は、AAC+SBR方式におけるビットストリームの基本的な構造を示した図である。 図3は、CDの音楽信号を高速に処理するためのシステム構成を示した図である。 図4(a)は、1枚のCDに4曲の音楽信号が格納されていることを示す図である。図4(b)は、一例として、1曲目と2曲目との曲間におけるビットストリームの構造をクローズアップして例示した図である。図4(c)は、曲の先頭にSBRHeaderが挿入されていない場合の再生信号のスペクトルを示した図である。 図5は、本実施の形態1における信号処理装置の構成を示す図である。 図6は、MPEG規格のsbr_header()の内容を示す図である。 図7(a)は、第1ヘッダ挿入部によって周期的にSBRHeaderが挿入された符号化信号の一部分を模式的に示す図である。図7(b)は、曲の替わり目で第2ヘッダ挿入部によって次の曲の開始部分にSBRHeaderが単発的に挿入された符号化信号の一部分を模式的に示す図である。 図8は、ステレオ入力PCM信号における曲の切り替わり部分の一例を示す波形図である。 図9は、第1符号化部の演算過程で生成される信号に基づいてSBRHeaderの挿入箇所を判断する信号処理装置の構成を示す図である。 図10は、第2符号化部の演算過程で生成される信号に基づいてSBRHeaderの挿入箇所を判断する信号処理装置の構成を示す図である。 図11は、外部から入力される制御信号に基づいてSBRHeaderの挿入箇所を判断する信号処理装置の構成を示す図である。 図12は、第1ヘッダ挿入部の動作を示すフローチャートである。 図13は、第1、第2ヘッダ挿入部の動作を示すフローチャートである。
100 第1符号化部
101 第2符号化部
102 ヘッダ情報記憶部
103 第1ヘッダ挿入部
104 第2ヘッダ挿入部
105、205、305、405 制御部
106 多重化部
110 ヘッダ挿入部
1000、2000、3000、4000 信号処理装置

Claims (27)

  1. 入力信号を、フレームの先頭に第1ヘッダを含む符号化信号に、フレーム単位で符号化する符号化手段と、
    前記符号化手段の符号化により生成される符号化信号の管理情報を示す第2ヘッダであって前記第1ヘッダとは異なる情報を示す第2ヘッダを、フレームの並びで表される前記符号化信号内の一定間隔のフレームごとに挿入する第1のヘッダ挿入手段と、
    前記第1のヘッダ挿入手段が前記第2ヘッダを挿入するフレームとは独立に、前記第2ヘッダを挿入するフレームを決定する制御手段と、
    前記制御手段によって決定された前記フレームに、前記第2ヘッダを単発的に挿入する第2のヘッダ挿入手段と
    を備えることを特徴とする信号処理装置。
  2. 前記第1のヘッダ挿入手段は、前記第2のヘッダ挿入手段によって前記第2ヘッダが挿入されると、前記第2のヘッダ挿入手段によって前記第2ヘッダが挿入されたフレームから一定間隔のフレームごとに前記第2ヘッダを挿入する
    ことを特徴とする請求項1記載の信号処理装置。
  3. 前記第1のヘッダ挿入手段は、フレーム毎に値が更新されるカウンタを有し、前記カウンタの値があらかじめ定められた設定値になると前記第2ヘッダを挿入し、
    前記第2のヘッダ挿入手段は、前記制御手段によって決定されたフレームで上記カウンタの値を強制的に前記設定値に書き換えることにより、前記第1のヘッダ挿入手段を使って前記制御手段によって決定されたフレーム内に前記第2ヘッダを挿入する
    ことを特徴とする請求項2記載の信号処理装置。
  4. 前記制御手段は、入力信号の状態に応じて、前記第2ヘッダを挿入するフレームを決定する
    ことを特徴とする請求項1記載の信号処理装置。
  5. 前記制御手段は、外部から与えられる制御信号に従って、前記第2ヘッダを挿入するフレームを決定する
    ことを特徴とする請求項1記載の信号処理装置。
  6. 前記符号化手段は、複数曲の音楽信号からなる前記入力信号を連続的に符号化し、
    前記制御手段は、前記入力信号の曲の替わり目に相当する前記符号化信号中のフレームに前記第2ヘッダを挿入することを決定する
    ことを特徴とする請求項4記載の信号処理装置。
  7. 前記制御手段は、前記入力信号の振幅が閾値より小である前記符号化信号中のフレームに、前記第2ヘッダを挿入することを決定する
    ことを特徴とする請求項4記載の信号処理装置。
  8. 前記制御手段は、前記入力信号の振幅が閾値より小である状態から前記閾値以上となるフレームに前記第2ヘッダを挿入することを決定する
    ことを特徴とする請求項4記載の信号処理装置。
  9. 前記制御手段は、前記入力信号の振幅が閾値より小である状態が所定の時間続いた後で、振幅が前記閾値以上となるフレームに前記第2ヘッダを挿入することを決定する
    ことを特徴とする請求項4記載の信号処理装置。
  10. 前記制御手段は、前記入力信号の曲調の変化を検出する曲調変化検出部を備え、
    前記制御手段は、前記曲調変化検出部が、前記入力信号の曲調が変化したことを検出した位置に相当する前記符号化信号中のフレームに、前記第2ヘッダを挿入することを決定する
    ことを特徴とする請求項4記載の信号処理装置。
  11. 前記制御手段は、前記曲調変化検出部が、曲のさび部分を検出した前記入力信号の当該さび部分の先頭に相当する前記符号化信号中のフレームに、前記第2ヘッダを挿入することを決定する
    ことを特徴とする請求項10記載の信号処理装置。
  12. 前記第1のヘッダ挿入手段及び前記第2のヘッダ挿入手段は、前記符号化信号の再生周波数帯域を拡大するための副次的データの管理情報を示すヘッダを前記第2ヘッダとして挿入する
    ことを特徴とする請求項1記載の信号処理装置。
  13. 前記第1のヘッダ挿入手段及び前記第2のヘッダ挿入手段は、MPEG規格AAC+SBR方式におけるSBRHeaderを前記第2ヘッダとして挿入する
    ことを特徴とする請求項1記載の信号処理装置。
  14. 前記第1のヘッダ挿入手段及び前記第2のヘッダ挿入手段は、前記符号化信号の再生チャネル数を拡大するための副次的データの管理情報を示すヘッダを前記第2ヘッダとして挿入する
    ことを特徴とする請求項1記載の信号処理装置。
  15. 前記第1のヘッダ挿入手段及び前記第2のヘッダ挿入手段は、再生チャネル数を拡大するための副次的データの管理情報を示すヘッダであり、チャネル間の音圧差(Inter−channel Intensity Differences)を符号化するときの符号化方法を示す符号化モード情報を含むヘッダを前記第2ヘッダとして挿入する
    ことを特徴とする請求項14記載の信号処理装置。
  16. 前記第1のヘッダ挿入手段及び前記第2のヘッダ挿入手段は、再生チャネル数を拡大するための副次的データの管理情報を示すヘッダであり、チャネル間相関(Inter−channel Coherence)を符号化するときの符号化方法を示す符号化モード情報を含むヘッダを前記第2ヘッダとして挿入する
    ことを特徴とする請求項14記載の信号処理装置。
  17. 前記符号化手段は、前記入力信号の振幅の大きさを検出する振幅検出部を有し、
    前記制御手段は、前記符号化手段が検出する前記入力信号の振幅の大きさに基づいて、前記第2ヘッダを挿入するフレームを決定する
    ことを特徴とする請求項4記載の信号処理装置。
  18. 前記第1のヘッダ挿入手段が挿入する前記第2ヘッダと、前記第2のヘッダ挿入手段が挿入する前記第2ヘッダとは、値が同じである
    ことを特徴とする請求項1記載の信号処理装置。
  19. 前記符号化手段は、放送波に多重化する音声符号化信号を生成し、
    前記制御手段は、放送波の内容がCM放送であるか番組放送であるかを検出する放送内容検出部を有し、
    前記制御手段は、放送がCM放送から番組放送に切り換わるフレームに前記第2ヘッダを挿入することを決定する
    ことを特徴とする請求項1記載の信号処理装置。
  20. 前記符号化手段は、音声情報を放送する放送波に多重化する音声符号化信号を生成し、
    前記制御手段は、前記入力信号の内容である音声情報の切り替え位置で、前記第2ヘッダを挿入することを決定する
    ことを特徴とする請求項1記載の信号処理装置。
  21. 前記制御手段は、第1マイクロホン及び第2マイクロホンを含む少なくとも2本のマイクロホンを用いて収音された音声情報を前記符号化手段が符号化する際、前記符号化手段が主として第1マイクロホンで収音している音声情報を符号化している状態であるか、前
    記符号化手段が主として第2マイクロホンで収音している音声情報を符号化している状態であるかを検知し、前記符号化手段が前記第1マイクロホンで収音した音声情報を符号化している状態から前記第2マイクロホンで収音した音声情報を符号化している状態へ遷移したことを検知した場合、前記第2マイクロホンで収音した音声情報に切り替わった先頭のフレームに、前記第2ヘッダを挿入することを決定する
    ことを特徴とする請求項20記載の信号処理装置。
  22. 前記符号化手段は、音声情報と画像情報とを放送する放送波に多重化する音声符号化信号及び画像符号化信号を生成し、
    前記制御手段は、画像情報の切り替え時点の前記入力信号の位置に相当する前記符号化信号中のフレームに、前記第2ヘッダを挿入することを決定する
    ことを特徴とする請求項1記載の信号処理装置。
  23. 前記制御手段は、前記画像情報が少なくとも第1カメラと第2カメラとを含む2台のカメラを用いて収録されている場合、前記画像情報が第1カメラで収録されている状態であるか、第2カメラで収録される状態であるかを検知し、前記画像情報が前記第1カメラで収録されている状態から前記第2カメラで収録される状態へ遷移したことを検知した位置に相当するフレームに、前記第2ヘッダを挿入することを決定する
    ことを特徴とする請求項22記載の信号処理装置。
  24. 前記符号化手段は、入力信号の符号化対象フレームと、前記符号化対象フレームより前に符号化されたフレームとを用いて、それらの差分情報を符号化する予測符号化を行い、
    前記制御手段は、前記入力信号が予測符号化されている場合で、予測符号化された符号化信号の途中から再生が開始される可能性がある場合、再生が開始される可能性が高いフレームを、前記第2ヘッダを挿入するフレームと決定する
    ことを特徴とする請求項1記載の信号処理装置。
  25. 符号化手段が、入力信号を、フレームの先頭に第1ヘッダを含む符号化信号に、フレーム単位で符号化する符号化ステップと、
    前記符号化ステップでの符号化により生成される符号化信号の管理情報を示す第2ヘッダであって前記第1ヘッダとは異なる情報を示す第2ヘッダを、第1のヘッダ挿入手段が、フレームの並びで表される前記符号化信号内の一定間隔のフレームごとに挿入する第1のヘッダ挿入ステップと、
    制御手段が、前記第1のヘッダ挿入手段が前記第2ヘッダを挿入するフレームとは独立に、前記第2ヘッダを挿入するフレームを決定する制御ステップと、
    第2のヘッダ挿入手段が、前記制御手段によって決定された前記フレームに、前記第2ヘッダを単発的に挿入する第2のヘッダ挿入ステップと
    を含むことを特徴とする信号処理方法。
  26. コンピュータを
    入力信号を、フレームの先頭に第1ヘッダを含む符号化信号に、フレーム単位で符号化する符号化手段と、
    前記符号化手段の符号化により生成される符号化信号の管理情報を示す第2ヘッダであって前記第1ヘッダとは異なる情報を示す第2ヘッダを、フレームの並びで表される前記符号化信号内の一定間隔のフレームごとに挿入する第1のヘッダ挿入手段と、
    前記第1のヘッダ挿入手段が前記第2ヘッダを挿入するフレームとは独立に、前記第2ヘッダを挿入するフレームを決定する制御手段と、
    前記制御手段によって決定された前記フレームに、前記第2ヘッダを単発的に挿入する第2のヘッダ挿入手段として機能させるプログラム。
  27. 入力信号を、フレームの先頭に第1ヘッダを含む符号化信号に、フレーム単位で符号化する符号化手段と、
    前記符号化手段の符号化により生成される符号化信号の管理情報を示す第2ヘッダであって前記第1ヘッダとは異なる情報を示す第2ヘッダを、フレームの並びで表される前記符号化信号内の一定間隔のフレームごとに挿入する第1のヘッダ挿入手段と、
    前記第1のヘッダ挿入手段が前記第2ヘッダを挿入するフレームとは独立に、前記第2ヘッダを挿入するフレームを決定する制御手段と、
    前記制御手段によって決定された前記フレームに、前記第2ヘッダを単発的に挿入する第2のヘッダ挿入手段と
    を備えることを特徴とする集積回路。
JP2008547029A 2006-11-30 2007-11-29 信号処理装置 Expired - Fee Related JP5377974B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008547029A JP5377974B2 (ja) 2006-11-30 2007-11-29 信号処理装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006323383 2006-11-30
JP2006323383 2006-11-30
PCT/JP2007/073054 WO2008066114A1 (fr) 2006-11-30 2007-11-29 Processeur de signal
JP2008547029A JP5377974B2 (ja) 2006-11-30 2007-11-29 信号処理装置

Publications (2)

Publication Number Publication Date
JPWO2008066114A1 JPWO2008066114A1 (ja) 2010-03-11
JP5377974B2 true JP5377974B2 (ja) 2013-12-25

Family

ID=39467902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008547029A Expired - Fee Related JP5377974B2 (ja) 2006-11-30 2007-11-29 信号処理装置

Country Status (4)

Country Link
US (1) US9153241B2 (ja)
JP (1) JP5377974B2 (ja)
CN (1) CN101512909B (ja)
WO (1) WO2008066114A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4990375B2 (ja) * 2008-01-16 2012-08-01 パナソニック株式会社 記録再生装置
KR101261677B1 (ko) * 2008-07-14 2013-05-06 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
JP2010074823A (ja) * 2008-08-22 2010-04-02 Panasonic Corp 録画編集装置
JP5746974B2 (ja) * 2009-11-13 2015-07-08 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置およびこれらの方法
WO2012070370A1 (ja) * 2010-11-22 2012-05-31 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置、方法およびプログラム、並びに、音声復号装置、方法およびプログラム
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
US9219950B2 (en) * 2011-11-01 2015-12-22 Sony Corporation Reproduction apparatus, reproduction method, and program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1166737A (ja) * 1997-08-11 1999-03-09 Nec Corp オーディオデータの複製防止方法およびその装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240140B1 (en) * 1997-02-24 2001-05-29 Picturetel Corporation Channel aggregation having low latency and overhead
CA2281431A1 (en) * 1998-10-28 2000-04-28 Lucent Technologies Inc. Mobile-tcp and method of establishing and maintaining a mobile-tcp connection
EP1085765A3 (en) * 1999-09-20 2006-03-01 Matsushita Electric Industrial Co., Ltd. System stream creating apparatus which adjusts system clock reference based on total number of pictures to be stored and decoded during certain time period
JP2001283569A (ja) 2000-03-30 2001-10-12 Seiko Epson Corp さびサーチ装置
US6954460B2 (en) * 2001-10-05 2005-10-11 Ericsson Inc. Method and apparatus for compressing packet headers
US7161887B2 (en) * 2001-11-13 2007-01-09 Digeo, Inc. Method and apparatus for extracting digital data from a medium
JP2004101638A (ja) 2002-09-05 2004-04-02 Matsushita Electric Ind Co Ltd 信号処理装置
JP2004227719A (ja) * 2003-01-27 2004-08-12 Toshiba Corp デジタル信号記録装置、デジタル信号再生装置及び記録媒体
JP2005292702A (ja) * 2004-04-05 2005-10-20 Kddi Corp オーディオフレームに対するフェードイン/フェードアウト処理装置及びプログラム
JP3972921B2 (ja) * 2004-05-11 2007-09-05 ソニー株式会社 音声集音装置とエコーキャンセル処理方法
JP4618634B2 (ja) 2004-10-07 2011-01-26 Kddi株式会社 圧縮オーディオデータ処理方法
US7742687B2 (en) * 2005-03-22 2010-06-22 Mediatek Inc. Digital television recorders and stream format conversion and methods thereof
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
US8321466B2 (en) * 2005-12-22 2012-11-27 Universal Electronics Inc. System and method for creating and utilizing metadata regarding the structure of program content stored on a DVR
JP2007180730A (ja) * 2005-12-27 2007-07-12 Eastman Kodak Co デジタルカメラおよびデータ管理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1166737A (ja) * 1997-08-11 1999-03-09 Nec Corp オーディオデータの複製防止方法およびその装置

Also Published As

Publication number Publication date
US9153241B2 (en) 2015-10-06
WO2008066114A1 (fr) 2008-06-05
CN101512909A (zh) 2009-08-19
US20090207775A1 (en) 2009-08-20
JPWO2008066114A1 (ja) 2010-03-11
CN101512909B (zh) 2012-12-19

Similar Documents

Publication Publication Date Title
JP5377974B2 (ja) 信号処理装置
US8064322B2 (en) Adaptive high fidelity reproduction system
US9257124B2 (en) Apparatus and method for coding and decoding multi-object audio signal with various channel
JP2008538239A (ja) データストリームおよびマルチチャネル表現を生成するための装置および方法
JP2005518560A (ja) 音楽部分を自動で選り分けて格納するデジタル再生装置及びその方法
JP2005084578A (ja) 演奏システム及び楽音映像再生装置
WO2007132569A1 (ja) 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置
WO2001016935A1 (fr) Procede et dispositif d'extraction/traitement d'informations, et procede et dispositif de stockage
KR100718132B1 (ko) 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
KR20080027165A (ko) 데이터 기록 장치, 데이터 기록 방법 및 데이터 기록프로그램
US20150104158A1 (en) Digital signal reproduction device
US20070192089A1 (en) Apparatus and method for reproducing audio data
US7507900B2 (en) Method and apparatus for playing in synchronism with a DVD an automated musical instrument
JP2008197199A (ja) オーディオ符号化装置及びオーディオ復号化装置
CN102044238B (zh) 音乐再现系统
JP2005149608A (ja) 音声データ記録/再生システムとその音声データ記録媒体
JP2010074823A (ja) 録画編集装置
KR20080113844A (ko) 전자기기에서 음성 파일 재생 방법 및 장치
KR20080010980A (ko) 부호화/복호화 방법 및 장치.
JP2002156998A (ja) オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置
KR100609173B1 (ko) Aac복호화 방법
JP2005196074A (ja) 演奏システム及び楽音映像再生装置
US9025081B2 (en) Time lag determination between audio channels
JPH10285046A (ja) 情報信号処理装置、情報信号記録装置及び情報信号再生装置
JP2005121743A (ja) オーディオデータ符号化方法、オーディオデータ復号方法、オーディオデータ符号化装置、オーディオデータ復号装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130718

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130925

R150 Certificate of patent or registration of utility model

Ref document number: 5377974

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees