JP5254808B2 - オーディオ信号の処理方法及び装置 - Google Patents

オーディオ信号の処理方法及び装置 Download PDF

Info

Publication number
JP5254808B2
JP5254808B2 JP2008556238A JP2008556238A JP5254808B2 JP 5254808 B2 JP5254808 B2 JP 5254808B2 JP 2008556238 A JP2008556238 A JP 2008556238A JP 2008556238 A JP2008556238 A JP 2008556238A JP 5254808 B2 JP5254808 B2 JP 5254808B2
Authority
JP
Japan
Prior art keywords
signal
information
extension
length information
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008556238A
Other languages
English (en)
Other versions
JP2009527789A (ja
JP2009527789A5 (ja
Inventor
スク パン,ヒー
スー キム,ドン
ヒュン リム,ジェ
オ オー,ヒェン
ウォン ジュン,ヤン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020070013364A external-priority patent/KR20070087494A/ko
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2009527789A publication Critical patent/JP2009527789A/ja
Publication of JP2009527789A5 publication Critical patent/JP2009527789A5/ja
Application granted granted Critical
Publication of JP5254808B2 publication Critical patent/JP5254808B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)

Description

本発明は、オーディオ信号の処理方法及び装置に係り、より詳細には、レジデュアル信号を処理する方法及び装置に関する。
オーディオ信号は、ダウンミックス信号と補助データ信号とで構成することができる。この補助データ信号には、空間情報信号及び拡張信号を含ませることができる。拡張信号とは、デコーディング装置がダウンミックス信号をアップミックスしてマルチャンネル信号を生成する時、より原信号に近く復元可能にするために必要な追加情報のことを意味する。例えば、拡張信号の例には、レジデュアル信号が含まれる。レジデュアル信号とは、原信号とコーディングされた信号との差に該当する信号のことを意味する。マルチチャンネルオーディオコーディングにおいてレジデュアル信号は、次のような場合等に使用することができる。例えば、任意のダウンミックス信号の補正用に用いられたり、デコーディング中に特定チャンネル補正用に用いたりすることができ、あるいは、これら2例の両方にも用いることができる。入力されたオーディオ信号は、レジデュアル信号を用いることによって、より原信号に近く復元でき、音質を向上させることができる。
しかしながら、デコーディング装置が無条件的に拡張信号のデコーディングを行うようにすれば、デコーディング装置によって音質を向上させることもできるが、複雑度が高くなり、演算量が多くなるという問題がある。
また、一般に、オーディオ信号のヘッダ情報は不変なため、ビットストリームに一回のみヘッダ情報を挿入する。しかし、ビットストリームに一回のみヘッダ情報を挿入すると、放送用やVOD等のように、任意の瞬間からオーディオ信号を再生しなければならない場合に、ヘッダ情報が存在せず、データフレーム情報をデコーディングできないという問題がある。
本発明の目的は、拡張信号のデコーディングを省略することによってオーディオ信号の処理効率を向上させることにある。
本発明の他の目的は、拡張信号の長さ情報を用いて拡張信号のデコーディングを省略する方法及び装置を提供することにある。
本発明の更に他の目的は、放送用オーディオ信号も任意の瞬間から再生可能にするオーディオ信号処理方法及び装置を提供することにある。
本発明の更に他の目的は、レベル情報によってオーディオ信号を処理する方法及び装置を提供することにある。
上記目的を達成するために、本発明は、オーディオ信号の生成のための補助信号と該補助信号に含まれる拡張信号を、受信したビットストリームから抽出する段階と、前記ビットストリームのレベルを確認する段階と、前記ビットストリームのレベルによって前記拡張信号を選択的にデコーディングする段階と、前記補助信号を用いて前記オーディオ信号を生成する段階とを含むことを特徴とするオーディオ信号処理方法を提供する。
また、本発明はオーディオ信号の生成のための補助信号と、該補助信号に含まれる拡張信号を、受信したビットストリームから抽出する信号抽出部と、前記ビットストリームのレベルを確認するレベル判断部と、前記ビットストリームのレベルによって前記拡張信号を選択的にデコーディングする選択的デコーディング部と、前記補助信号を用いて前記オーディオ信号を生成するアップミキシング部とを含むことを特徴とするオーディオ信号処理装置を提供する。
本発明によれば、選択的に拡張信号のデコーディングを行うことによって、より効率的なデコーディングを行うことができる。拡張信号のデコーディングを行う場合には、オーディオ信号の音質をより向上させることができ、拡張信号のデコーディングを行わない場合には、演算量、複雑度を減らすことができる。なお、拡張信号のデコーディングを行うとしても、一定低周波部分のみをデコーディングすることによって、音質を向上させると同時に演算量を減らすことができる。また、オーディオ信号中におけるヘッダ情報有無を識別することによって、オーディオ信号を放送等に用いる場合に、任意の瞬間からオーディオ信号を処理できるという効果を奏する。
図1は、本発明が適用される実施例で、オーディオ信号のエンコーディング装置及びデコーディング装置を示すブロック図である。
エンコーディング装置は、ダウンミキシング部10、ダウンミックス信号エンコーディング部20、補助信号エンコーディング部30、拡張信号エンコーディング部40及び多重化部50を含む。
図1を参照すると、マルチソースオーディオ信号X1,X2,…,Xnがダウンミキシング部10に入力されると、ダウンミキシング部10は、これらのマルチソースオーディオ信号をダウンミックスしてダウンミックス信号を生成する。このダウンミックス信号は、モノ、ステレオまたはマルチソースオーディオ信号を含む。ここで、ソースはチャンネルを含み、便宜上、以下ではチャンネルと記述する。本明細書では、モノまたはステレオダウンミックス信号を基準にして説明するが、このモノまたはステレオダウンミックス信号に本発明が限定されることはない。また、エンコーディング装置は、選択的に外部から直接提供される任意ダウンミックス信号を用いることができる。なお、ダウンミックス過程中にマルチチャンネルオーディオ信号から補助信号を生成することができ、追加情報に該当する拡張信号をも生成することができる。ここで、補助信号には、空間情報信号及び拡張信号を含ませることができる。このように生成されたダウンミックス信号、補助信号及び拡張信号はそれぞれ、ダウンミックス信号エンコーディング部20、補助信号エンコーディング部30及び拡張信号エンコーディング部40で符号化された後、多重化部50に転送される。
本発明でいう“空間情報”とは、エンコーディング装置でマルチャンネル信号をダウンミックスして生成されたダウンミックス信号をデコーディング装置に転送し、このダウンミックス信号をデコーディング装置がアップミックスしてマルチャンネル信号を生成する上で必要な情報のことを意味する。この空間情報は、空間パラメータを含む。空間パラメータには、チャンネル間のエネルギー差を意味するCLD(チャンネルレベル差)、チャンネル間の相関関係を意味するICC(チャンネル間コヒーレンス)、2チャンネルから3チャンネルを生成する時に用いられるCPC(チャンネル予測係数)等がある。また、“拡張信号”とは、デコーディング装置がダウンミックス信号をアップミックスしてマルチャンネル信号を生成する時に、より原信号に近く復元可能にする上で必要な追加情報のことを意味する。この追加情報には、例えば、レジデュアル信号、任意のダウンミックスレジデュアル信号、任意のツリー拡張信号等がある。ここで、レジデュアル信号とは、原信号とコーディングされた信号との差に該当する信号のことを指す。以下、レジデュアル信号は一般的なレジデュアル信号と任意のダウンミックス信号の補正のための任意のダウンミックスレジデュアル信号を含む。
本発明でいう“ダウンミックス信号エンコーディング部20”または“ダウンミックス信号デコーディング部70”は、補助信号でないオーディオ信号を符号化または復号化するコーデックのことを意味する。本明細書では、補助信号でないオーディオ信号を、ダウンミックスオーディオ信号とする。また、ダウンミックス信号エンコーディング部20またはダウンミックス信号デコーディング部70には、MP3、AC−3、DTSまたはAACを含ませることができる。オーディオ信号にコーデック機能を行う場合では、既に開発されたコーデックの他に、今後開発されるコーデックも含ませることができる。
多重化部50は、ダウンミックス信号、補助信号及び拡張信号を多重化してビットストリームを生成でき、生成されたビットストリームをデコーディング装置に転送する。この時、ダウンミックス信号と補助信号は一つのビットストリームの形態でデコーディング装置に転送することができ、または、補助信号とダウンミックス信号のそれぞれの独立したビットストリームの形態でデコーディング装置に転送することができる。このビットストリームの構造は、図9〜図11で詳細に後述される。
放送用ビットストリームのように、オーディオ信号をはじめからデコーディングせずに任意の瞬間からデコーディングするようにできることから、以前に転送したヘッダ情報を使用できない場合、オーディオ信号に挿入されている他のヘッダ情報を用いてオーディオ信号をデコーディングすることができる。または、オーディオ信号を転送する途中でヘッダ情報を失った場合には、信号をどの瞬間に受信してもその瞬間からデコーディングが始まらなければならない。したがって、ヘッダ情報は、オーディオ信号に少なくとも一回以上挿入することができる。これは、ヘッダ情報がオーディオ信号の前部に一度のみ存在するとしたら、任意の瞬間にオーディオ信号を受信する場合、ヘッダ情報の不在によってデコーディングができないためである。このような場合、ヘッダ情報を定められた方式(例えば、時間的、空間的間隔等)によって含めることができる。そして、このようなヘッダ情報が存在するか否かを表す識別情報をビットストリーム内に挿入することができ、この識別情報によってオーディオ信号は選択的にヘッダを含むことになる。例えば、補助信号は、ヘッダ識別情報によって選択的にヘッダを含むことができる。このビットストリームの構造は、図9〜図12で詳細に後述される。
デコーディング装置は、逆多重化部60、ダウンミックス信号デコーディング部70、補助信号デコーディング部80、拡張信号デコーディング部90及びアップミキシング部100を含む。
逆多重化部60は、ビットストリームを受信し、このビットストリームから、符号化されたダウンミックス信号と、符号化された補助信号と、符号化された拡張信号とを分離する。ダウンミックス信号デコーディング部70は、符号化されたダウンミックス信号を復号し、補助信号デコーディング部80は、符号化された補助信号を復号する。一方、この補助信号内には拡張信号を含ませることができるが、マルチチャンネルオーディオ信号を效率的に生成するために、拡張信号を效率的にデコーディングする必要がある。したがって、拡張信号デコーディング部90は、符号化された拡張信号を選択的にデコーディングすることができる。すなわち、符号化された拡張信号をデコーディングしても良く、デコーディングを省略しても良い。場合によっては、拡張信号のデコーディングを省略すると、原信号に近い復元が可能でありながらも、コーディング効率が高まる。例えば、デコーディング装置のレベルがビットストリームのレベルよりも低い場合には、デコーディング装置が受信した拡張信号をデコーディングできず、拡張信号のデコーディングを省略しても良い。または、デコーディング装置のレベルがビットストリームのレベルよりも高く、拡張信号をデコーディングできる場合であっても、オーディオ信号から獲得される他の情報によって拡張信号のデコーディングを省略しても良い。ここで、他の情報とは、例えば、拡張信号のデコーディングを行うか否かを表す情報でありうる。これについては、図14で詳細に後述する。
そして、拡張信号のデコーディングを省略する方法として、例えば、ビットストリームから拡張信号の長さ情報を読み取り、この長さ情報を用いて拡張信号のデコーディングを省略することができる。または、拡張信号の位置を表すシンク情報を用いて当該拡張信号のデコーディングを省略しても良い。これについては、図2で詳細に後述する。
また、拡張信号の長さ情報は、様々な方法で定義可能である。例えば、固定ビットを割り当てても良く、あらかじめ決定された長さ情報タイプによって可変的にビット割り当てても良く、または、実際拡張信号の長さを読み取りながらその長さに適合するビットを適応的に割り当てても良い。これについて、図3及び図4では固定ビットを割り当てる方法、図5及び図6では可変的にビット割り当てる方法、図7及び図8では適応的にビット割り当てる方法を詳細に説明する。
また、拡張信号の長さ情報は、補助データ領域内に位置することができる。補助データ領域とは、ダウンミックス信号を原信号に復元する上で必要な付加情報が存在する領域のことをいう。例えば、補助データとしては、空間情報信号または拡張信号等が挙げられる。したがって、拡張信号の長さ情報は、補助信号内に位置しても良く、または、補助信号の拡張領域内に位置しても良い。具体例として、拡張信号の長さ情報は、補助信号のヘッダ拡張領域に位置しても良く、補助信号のフレームデータ拡張領域に位置しても良く、または、補助信号のヘッダ拡張領域とフレームデータ拡張領域の両方ともに位置しても良い。これは、図9〜図11で詳細に説明する。
図2は、本発明が適用される実施例で、拡張信号デコーディング部90の概略的なブロック図である。
拡張信号デコーディング部90は、大きく、拡張信号タイプ情報獲得部91、拡張信号長さ読取部92及び選択的デコーディング部93を含み、この選択的デコーディング部93は、レベル判断部94、拡張信号情報獲得部95及び拡張信号情報スキップ部96を含む。拡張信号デコーディング部90は、逆多重化部60から拡張信号のビットストリームを受信し、デコーディングされた拡張信号を出力することができる。場合によっては、拡張信号を出力しない、または、拡張信号のビットストリームを全部‘0’で埋めて出力することができる。ここで、拡張信号を出力しない場合としては、拡張信号のデコーディングを省略する方法を利用することができる。拡張信号タイプ情報獲得部91は、ビットストリームから、拡張信号のタイプを表す情報を獲得する。例えば、拡張信号のタイプを表す情報には、レジデュアル信号、任意のダウンミックスレジデュアル信号、任意のツリー拡張信号等を含ませることができる。本発明でいうレジデュアル信号とは、一般的なレジデュアル信号と任意のダウンミックス信号の補正のための任意のダウンミックスレジデュアル信号を総称する。このレジデュアル信号は、マルチチャンネルオーディオ信号で任意のダウンミックス信号の補正用として使用することができ、または、デコーディング中に特定チャンネル補正用として使用することができる。または、これら2例の両方に使用することができる。拡張信号タイプ情報により拡張信号のタイプが定められ、拡張信号長さ読取部92では、拡張信号のタイプ情報により決定された拡張信号の長さを読み取る。これは、拡張信号がデコーディングされるか否かにかかわらずに行うことができる。拡張信号の長さが読み取られると、選択的デコーディング部93では、当該拡張信号に選択的にデコーディングを行う。これは、レベル判断部94で決定することができる。レベル判断部94では、デコーディング装置のレベルとビットストリームのレベルとを比較し、拡張信号をデコーディングするか否かを選択する。例えば、デコーディング装置のレベルがビットストリームのレベルと等しいまたは高い時、デコーディング装置は、拡張信号情報獲得部95を介して拡張信号に関する情報を獲得し、これをデコーディングして拡張信号として出力する。出力された拡張信号は、アップミキシング部100に転送され、原信号を復元したりオーディオ信号を生成するのに用いることができる。一方、デコーディング装置のレベルがビットストリームのレベルより低い場合には、拡張信号情報スキップ部96を介して拡張信号のデコーディングを省略することができる。この時、拡張信号長さ読取部92で読み取った長さ情報を用いて、拡張信号のデコーディングを省略することができる。このように拡張信号を用いる場合には、より原信号に近く復元することができ、音質向上が図られ、必要な場合には拡張信号のデコーディングを省略することによって、デコーディング装置の演算量を減らすことができる。
また、拡張信号情報スキップ部96で拡張信号のデコーディングを省略する方法の例として、拡張信号の長さ情報を用いる場合、拡張信号のビットまたはバイト長さ情報を、データ中に挿入することができる。そして、その長さ情報から得た値分だけ、当該拡張信号のビットフィールドを跳び越え、デコーディングを継続して行うようにすることができる。この拡張信号の長さ情報を定義する方法は、図3〜図8で後述する。
また、拡張信号のデコーディングを省略する方法の他の実施例として、拡張信号の位置を表すシンク情報を用いて拡張信号のデコーディングを省略することができる。例えば、拡張信号が終わる地点に、一定のビットを持つシンクワードを挿入することができる。デコーディング装置は、拡張信号のシンクワードを探すまでレジデュアル信号のビットフィールドを継続して探索する。シンクワードを探したら探索過程を止め、デコーディングを継続して行う。すなわち、拡張信号のシンクワードを探すまで拡張信号のデコーディングを省略することができる。また、選択による他のデコーディング方法の例として、拡張信号デコーディングを行う場合、拡張信号をパーシングしてデコーディングを行うことができる。拡張信号デコーディングを行うことになると、当該拡張信号のシンクワードは読むものの無視しても良い。
図3及び図4は、本発明が適用される一実施例で、拡張信号の長さ情報が固定的にビット割り当てられるのを説明するための図である。
拡張信号の長さ情報は、ビット単位またはバイト単位で定義することができる。もし、バイト単位で定義するとしたら、これは、拡張信号がバイトで割り当てられていることを意味する。図3は、拡張信号の長さ情報を最も簡単に定義する方法を示す図であり、図4は、図3の方法を図式的に表現したものである。拡張信号の長さ情報を表すシンタックス要素を定義し、そのシンタックス要素に一定のビットを割り当てる場合である。例えば、シンタックス要素として‘bsResidualSignalLength’を定義し、固定ビットである16ビットを割り当てる。しかし、このような方法は相対的にビットを多く消耗することになる。そこで、図5及び図6、図7及び図8の方法を説明する。
図5及び図6は、本発明が適用される一実施例で、拡張信号の長さ情報が長さタイプによって可変的にビットが割り当てられるのを説明するための図である。
図5は、ビット消耗をより減らすべく、‘bsResidualSignalLength’に、何ビット使用するかを定義するシンタックス要素を更に定義する方法を示し、図6は、図5の方法を図式的に示している。例えば、長さタイプとして‘bsResidualSignalLengthType’を新しく定義し、その値が0の場合には、‘bsResidualSignalLength'が4ビットで割り当てられ、1の場合には8ビットで、2の場合には12ビットで、3の場合には16ビットで、それぞれ割り当てられる。ここで割り当てられるビットは例示的なもので、ここで定義したビットとは異なる値のビットが割り当てられても良い。また、上記の方法よりも更にビット消耗を減らすために、図7及び図8の方法が提供される。
図7及び図8は、本発明が適用される一実施例で、拡張信号の長さ情報が拡張信号の実際長さによって適応的にビットが割り当てられるのを説明するための図である。
拡張信号が取り込まれると、拡張信号の長さ情報値を、最初定められた値まで読むことができる。この長さ情報値がある一定の値になると、追加的に更に定められた値まで読むことができる。そして、再び長さ情報値がある一定の値になると、再び追加的に更に定められた値まで読むことができる。この時、長さ情報値がある一定の値でない場合には、その値をそのまま長さ情報値として出力する。このように、拡張信号の長さ情報を実際のデータ長さによって適応的に読んでいくことによってビット消耗を最小限にすることが可能になる。以下、図7及び図8に示す例について説明する。
図7では、拡張信号の例としてレジデュアル信号を挙げて説明する。レジデュアル信号が取り込まれると、レジデュアル信号長さの4ビットを読む。なお、長さ情報値(bsResidualSignalLength)が24−1(=15)であれば、bsResidualSignalLength1値として8ビットを更に読む。同じ方式で、長さ情報値(bsResidualSignalLength)が(24−1)+(28−1)=15+255であれば、bsResidualSignalLength2値として12ビットを更に読む。同じ方式で、bsResidualSignalLength値が(24−1)+(28−1)+(212−1)=15+255+4095であれば、bsResidualSignalLength3値として16ビットを更に読む。
図8では、拡張信号の長さ情報によって適応的にビットが割り当てられる他の例を図式的に示す。
拡張信号が取り込まれると、まず、4ビットを読む。そして、長さ情報を読んだ値が4ビットよりも小さいと、その値が長さ情報となる。しかし、長さ情報を読んだ値が4ビットよりも大きいと、追加的に8ビットを更に読む。追加的に読んだ値が8ビットより小さいと、読んだ合計長さ情報値は12(=4+8)ビットとなる。しかし、追加的に読んだ値が8ビットより大きいと、再び追加的に16ビットを更に読む。これを詳細に説明すると、次の通りになる。まず、長さ情報が取り込まれると、4ビットを読む。実際長さ情報値は0〜14の値になる。そして、長さ情報値が24−1(=15)になると、拡張信号を追加的に更に読む。この時には拡張信号を追加的に28−2(=254)値まで更に読むことができる。しかし、長さ情報値が24−1より小さい値であれば、読まれた0〜24−2(=14)の値をそのまま出力する。長さ情報値が(24−1)+(28−1)になると、拡張信号を追加的に更に読む。この時には拡張信号を216−1値まで追加的に更に読むことができる。しかし、長さ情報値が216−1より小さい値であれば、読まれた0〜216−1の値をそのまま出力する。ここでも、前述した例と同様に、割り当てられるビットは例示的なもので、上記のビットと異なる値のビットを割り当てても良い。
一方、拡張信号の長さ情報は、拡張信号ヘッダの長さ情報、または、拡張信号フレームデータの長さ情報であり得る。したがって、拡張信号の長さ情報は、ヘッダ領域及び/またはフレームデータ領域に位置させることができる。これに関するビットストリームの構造を、図9〜図12を用いて以下に説明する。
図9及び図10は、本発明が適用される実施例で、ダウンミックス信号、補助信号及び拡張信号が一つのオーディオ信号を構成するビットストリーム構造を示す。
オーディオ信号は、ダウンミックス信号と補助信号を含む。この補助信号の例に、空間情報信号が挙げられる。ダウンミックス信号と補助信号はフレーム単位で転送される。補助信号は、ヘッダ情報とデータ情報を含むことができ、データ情報のみを含んでも良い。このように一つのオーディオ信号を構成するファイル/一般ストリーミング構造は、ヘッダ情報が前部に位置し、これにデータ情報が続く。例えば、ダウンミックス信号と補助信号が一つのオーディオ信号を構成するファイル/一般ストリーミング構造では、前部にヘッダ情報であるダウンミックス信号ヘッダと補助信号ヘッダを存在させることができる。これに続いてデータ情報として、ダウンミックス信号データと補助信号データとで一つのフレームを構成することができる。この時、補助データの拡張領域を定義し、拡張信号を位置させることができる。この拡張信号は、補助信号内に含まれても良く、または、独立した信号として用いても良い。図9は、拡張信号が独立した信号として用いられる場合を示し、図10は、拡張信号が補助信号内の拡張領域に位置する場合を示す。したがって、拡張信号が存在する場合、ファイル/一般ストリーミング構造は、前部にヘッダ情報であるダウンミックスヘッダと空間情報ヘッダの他に、拡張信号ヘッダを存在させることができる。これに続いてデータ情報としてダウンミックス信号データと補助信号データの他に、拡張信号データを更に含み、一つのフレームを構成することができる。拡張信号は、選択的にデコーディングされ得るので、フレームの最後の部分に位置させることができ、または、補助信号の直後に連続して存在させることができる。図3〜図8で説明した拡張信号の長さ情報は、拡張信号のヘッダ領域及び/または拡張信号のデータ領域内に位置することができる。この場合、ヘッダ領域(拡張信号ヘッダ)内に位置する長さ情報は、拡張信号ヘッダの長さ情報を表し、データ領域(拡張信号データ)内に位置する長さ情報は、拡張信号データの長さ情報を表す。このように、ビットストリームから各領域内に位置する長さ情報を読み、この長さ情報を用いてデコーディング装置は拡張信号のデコーディングを省略できるわけである。
図11は、本発明が適用される実施例で、ダウンミックス信号と補助信号が独立したオーディオ信号を構成するビットストリーム構造を示す。
オーディオ信号は、ダウンミックス信号と補助信号を含む。補助信号の例に空間情報信号が挙げられる。これらダウンミックス信号と補助信号はそれぞれ独立した信号として転送されることができる。この場合、ダウンミックス信号は、前部にヘッダ情報であるダウンミックス信号ヘッダ(ダウンミックス信号ヘッダ(丸付き数字の0))が位置し、これに続いてデータ情報としてダウンミックス信号データ(ダウンミックス信号データ(丸付き数字の1〜n))が来る構造を持つ。同様に、補助信号は前部にヘッダ情報である補助信号ヘッダ(補助信号ヘッダ(丸付き数字の0))が位置し、それに続いてデータ情報として補助信号データ(補助信号データ(丸付き数字の1〜m))が来る構造を持つ。拡張信号は、補助信号内に含まれても良いので、補助信号データに拡張信号が続く構造を有しても良い。したがって、補助信号ヘッダ(丸付き数字の0)に拡張信号ヘッダ(丸付き数字の0)が続き、補助信号データ(丸付き数字の1)に拡張信号データ(丸付き数字の1)が続き、同様に、補助信号データ(丸付き数字の2)に拡張信号データ(丸付き数字の2)が続く。この時、拡張信号の長さ情報は、拡張信号ヘッダ(丸付き数字の0)、拡張信号データ(丸付き数字の1)、及び/または拡張信号データ(丸付き数字の2〜m)にそれぞれ挿入することができる。
一方、ファイル/一般ストリーミング構造とは違い、オーディオ信号をはじめからデコーディングせずに任意の瞬間からデコーディングすることになり、以前に転送したヘッダ情報を利用できない場合、オーディオ信号に挿入されている他のヘッダ情報を用いてオーディオ信号をデコーディングすることができる。また、オーディオ信号を放送等に用いる場合や、オーディオ信号を転送する途中でヘッダ情報を失う場合には、信号をどの瞬間に受信してもその瞬間からデコーディングが始まらなければならないので、当該ヘッダが存在するか否かを表す識別情報を定義することによって、よりコーディング効率を向上させることができる。以下、図12では放送用ストリーミング構造について説明する。
図12は、本発明が適用される実施例で、ダウンミックス信号と補助信号が一つのオーディオ信号を構成する放送用ストリーミング構造を示す。
放送用ストリーミングの場合、ヘッダ情報がオーディオ信号の前部に一回のみ存在すると、任意の瞬間にオーディオ信号を受信する場合、ヘッダ情報の不在によってデコーディングができないので、ヘッダ情報はオーディオ信号に少なくとも一回以上挿入することができる。このような場合、ヘッダ情報を定められた方式(例えば、時間的、空間的間隔等)によって含めることができる。具体例として、ヘッダ情報を毎フレームごとに挿入する、一定間隔のフレームごとに周期的に挿入する、または、任意の間隔のフレームごとに非周期的に挿入することができる。または、一定の時間間隔に(例えば、2秒ごとに)一回ずつヘッダ情報を挿入しても良い。
一つのオーディオ信号を構成する放送用ストリーミング構造は、データ情報同士間に少なくとも一つ以上のヘッダ情報が挿入された形態を有する。例えば、一つのオーディオ信号を構成する放送用ストリーミング構造では、ダウンミックス信号が位置し、それに続いて補助信号が来る。この補助信号の前部に、ダウンミックス信号と補助信号とを区別するシンク情報を位置させることができる。そして、補助信号のヘッダ情報が存在するか否かを表す識別情報を位置させることができる。例えば、ヘッダ識別情報が0であれば、以降に読まれるフレームは、ヘッダ情報のないデータフレームのみ存在する反面、ヘッダ識別情報が1であれば、以降に読まれるフレームは、ヘッダ情報とデータフレームが両方とも存在する。これは、補助信号にも、拡張信号にも適用可能である。これらのヘッダ情報は、初期に転送したヘッダ情報と同じ情報の場合であっても良く、可変的であっても良い。ヘッダ情報が可変的な場合には、新しいヘッダ情報をデコーディングし、これによって、新しいヘッダ情報に続いて転送されるデータ情報をデコーディングする。また、ヘッダ識別情報が0の場合、転送されたフレームは、ヘッダ情報のないデータフレームのみ存在するが、この時、データフレームを処理するためには、以前に転送されたヘッダ情報を用いることができる。例えば、図12で、ヘッダ識別情報が1の時、補助信号ヘッダ(丸付き数字の1)と拡張信号ヘッダ(丸付き数字の1)が存在できる。ところが、以降取り込まれるフレームがヘッダ識別情報0を有し、ヘッダ情報がない場合、拡張信号データ(丸付き数字の3)を処理するために、以前に転送された拡張信号ヘッダ(丸付き数字の1)の情報を用いることができる。
図13は、本発明が適用される実施例で、オーディオ信号を放送等に用いる場合、補助信号内にヘッダが含まれているかを表す識別情報によって、長さ情報を用いて拡張信号を処理する方法を説明するためのフローチャートである。
本発明の実施例では、まず、受信したビットストリームから、オーディオ信号生成のための補助信号と該補助信号に含まれた拡張信号を抽出する(1301)。この拡張信号は、補助信号内に含ませることができる。補助信号内にヘッダが含まれているかを表す識別情報を抽出する(1303)。例えば、ヘッダ識別情報が1であれば、補助信号は補助信号ヘッダを含んでいることを表す。ヘッダ識別情報が0であれば、補助信号は補助信号ヘッダを含んでいないことを表す。もし、拡張信号が補助信号内に含まれる場合で、ヘッダ識別情報が1であれば、拡張信号は拡張信号ヘッダを含んでいることを表し、ヘッダ識別情報が0であれば、拡張信号は拡張信号ヘッダを含んでいないことを表す。ヘッダ識別情報によって補助信号内にヘッダが含まれているか否かを判断する(1305)。補助信号内にヘッダが含まれている場合、ヘッダから長さ情報を抽出する(1307)。その後、長さ情報を用いて拡張信号のデコーディングを省略することができる(1309)。ここで、ヘッダはそれぞれ、補助信号及び/または拡張信号を解読できるようにする役割を担うが、このようなヘッダ情報には、例えば、レジデュアル信号に関する情報、レジデュアル信号の長さ情報、レジデュアル信号の位置を表すシンク情報、サンプリング周波数、フレーム長さ、パラメータバンド数、ツリー情報、量子化モード情報、ICC、パラメータスムージング情報、クリッピング防止用ゲイン情報、QMF(動画データ処理用のフィルタ)関連情報等を含ませることができる。また、ヘッダ識別情報による判断結果、補助信号内にヘッダが含まれていない場合、以前に抽出したヘッダの長さ情報を用いて拡張信号のデコーディングを省略することができる(1311)。
図14は、本発明が適用される実施例で、拡張信号の長さ情報を用いて拡張信号の選択的デコーディングを行う方法を説明するためのフローチャートである。
プロファイルとは、コーディング過程でアルゴリズム上入る技術的構成要素を規格化したものを意味する。すなわち、ビットストリームをデコーディングする上で必要な技術要素の集合で、一種のサブ規格といえる。レベルは、プロファイルで規定された技術要素をどの範囲まで支援するかを定義する。すなわち、デコーディング装置の能力とビットストリームの複雑度を定義する役割を担う。本発明において、レベル情報とは、プロファイルとレベルに関する定義を全て含むことができる。ビットストリームのレベル情報とデコーディング装置のレベル情報によって、拡張信号のデコーディング方法を選択的に変えることができる。例えば、転送されたオーディオ信号内に拡張信号が存在しても、当該レベル情報の判断結果によって、拡張信号のデコーディングを行わないこともあり、拡張信号のデコーディングを行うこともあり、または、デコーディングを行うとしても一定の低周波部分のみを用いることができる。のみならず、拡張信号のデコーディングを行わないために、拡張信号の長さ情報分だけのデコーディングを省略しても良く、拡張信号を全て読むものの、デコーディングはしなくても良い。また、拡張信号の一部を読み、その読んだ部分のみをデコーディングし、残りはデコーディングしなくても良く、拡張信号の全部を読むものの、一部はデコーディングをし、残りはデコーディングをしなくても良い。
例えば、図14を参照すると、まず、受信したビットストリームから、オーディオ信号の生成のための補助信号と、補助信号に含まれた拡張信号とを抽出することができる(1410)。そして、当該拡張信号に関する情報を抽出することができる。ここで、拡張信号に関する情報は、拡張信号がどのタイプのデータかを表す拡張データタイプ情報を含むことができる。例えば、拡張データタイプ情報には、レジデュアルコーディングデータ、任意のダウンミックスレジデュアルコーディングデータ、任意のツリー拡張データ等を含ませることができる。これにより拡張信号のタイプが定められ、当該オーディオ信号の拡張領域から拡張信号の長さ情報を読むことができる(1420)。続いて、ビットストリームのレベルを判断するが、これは次のような情報によって判断することができる。例えば、拡張信号のタイプがレジデュアルコーディングデータである場合、ビットストリームのレベル情報は、出力チャンネル数、サンプリングレート、レジデュアル信号のバンド幅等を含むことができる。したがって、上記のようなビットストリームのレベル情報が取り込まれると、デコーディング装置のレベル情報と比較し、当該拡張信号をデコーディングするか否かを決定する(1430)。デコーディング装置のレベルは、あらかじめ定めることができる。そして、デコーディング装置のレベルは、通常、オーディオ信号のレベルと等しい、または大きくなければならない。これは、デコーディング装置は、転送されたオーディオ信号を全てデコーディングしなければならないからである。しかし、上記した以外の場合、すなわち、デコーディング装置に制限が加えられる所定の場合にも(例えば、デコーディング装置のレベルがオーディオ信号のレベルより小さい場合)、デコーディング可能な場合がある。ただし、この場合にはその品質が低下する恐れがある。例えば、デコーディング装置のレベルがオーディオ信号のレベルよりも下位レベルである場合、デコーディング装置は、当該オーディオ信号をデコーディングできない場合もあるが、所定の場合には、デコーディング装置のレベルに合わせて当該オーディオ信号をデコーディングすることもできる。
デコーディング装置のレベルがビットストリームのレベルよりも低いと判断される場合、拡張信号の長さ情報を用いて当該拡張信号のデコーディングを省略することができる(1440)。一方、デコーディング装置のレベルがビットストリームのレベルと等しい、または高い場合には、拡張信号のデコーディングを行うことができる(1460)。あるいは、拡張信号のデコーディングを行うものの、一定低周波部分のみをデコーディングすることもできる(1450)。その一例として、デコーディング装置が低いパワーを有する場合、拡張信号の全部をデコーディングすると効率が劣るか、または、全部をデコーディングできないことから、一定の低周波部分のみ拡張信号が使用可能になる場合が挙げられる。これは、ビットストリームのレベルまたはデコーディング装置のレベルが一定の条件を満たす場合に可能になる。
一般に、信号のエンコーディング環境及びデコーディング環境は様々であり、こうした様々な環境条件に応じて信号を処理する方法も様々に存在することができる。本明細書では、オーディオ信号の処理方法を取り上げて説明したが、本発明がこれに限定されることはない。ここで、信号は、オーディオ信号及び/またはビデオ信号を含むことができる。
上述した目的及び構成の特徴は、添付の図面に基づく詳細な説明からより明確になるであろう。
なお、本発明で使われる用語は、可能なかぎり現在広く使われている一般的な用語を選択したが、特定の場合は、出願人が任意に選定した用語もあり、その場合には該当する発明の説明部分において詳細にその意味を記載しておいたので、単純な用語の名称ではなく用語が持つ意味として本発明を把握すべきである。
本発明が適用される実施例で、オーディオ信号のエンコーディング装置及びデコーディング装置を示すブロック図である。 本発明が適用される実施例で、拡張信号デコーディング部90の概略的なブロック図である。 本発明が適用される一実施例で、拡張信号の長さ情報が固定的にビット割り当てられるのを説明するための図である。 本発明が適用される一実施例で、拡張信号の長さ情報が固定的にビット割り当てられるのを説明するための図である。 本発明が適用される一実施例で、拡張信号の長さ情報が長さタイプによって可変的にビット割り当てられるのを説明するための図である。 本発明が適用される一実施例で、拡張信号の長さ情報が長さタイプによって可変的にビット割り当てられるのを説明するための図である。 本発明が適用される一実施例で、拡張信号の長さ情報が前記拡張信号の実際長さによって適応的にビット割り当てられるのを説明するための図である。 本発明が適用される一実施例で、拡張信号の長さ情報が前記拡張信号の実際長さによって適応的にビット割り当てられるのを説明するための図である。 本発明が適用される実施例で、ダウンミックス信号、補助信号及び拡張信号が一つのオーディオ信号を構成するビットストリーム構造を示す図である。 本発明が適用される実施例で、拡張信号を含む補助信号とダウンミックス信号が一つのオーディオ信号を構成するビットストリーム構造を示す図である。 本発明が適用される実施例で、ダウンミックス信号と補助信号が独立してオーディオ信号を構成するビットストリーム構造を示す図である。 本発明が適用される実施例で、ダウンミックス信号と補助信号が一つのオーディオ信号を構成する放送用ストリーミング構造を示す図である。 本発明が適用される実施例で、オーディオ信号を放送等に用いる場合、補助信号中のヘッダ有無を表す識別情報によって、拡張信号の長さ情報を用いて拡張信号を処理する方法を説明するためのフローチャートである。 本発明が適用される実施例で、ビットストリームのレベルによって拡張信号の長さ情報を用いて前記拡張信号を選択的にデコーディングする方法を説明するためのフローチャートである。

Claims (11)

  1. デコーダが、
    マルチチャンネルオーディオ信号の生成のためのダウンミックス信号と、補助信号と、拡張信号と、を有するビットストリームを受信することと
    前記拡張信号のタイプを示す拡張信号タイプ情報を読み取ることであって、前記拡張信号のタイプは、レジデュアル信号と、任意のダウンミックスレジデュアル信号と、任意のツリー拡張信号と、のうちの少なくとも1つを有することと、
    前記拡張信号タイプ情報によって決定されたタイプを有する前記拡張信号の長さ情報を読み取ることと、
    前記ビットストリームのレベルと前記デコーダの複雑度レベル比較することと、
    前記拡張信号タイプ情報と、前記長さ情報と、前記比較した結果と、に基づいて前記拡張信号のビットフィールドを跳び越えることによって前記拡張信号のデコーディングを省略することであって、前記拡張信号のビットフィールドは、前記長さ情報を用いて決定された長さの値に対応することと、
    前記補助信号を前記ダウンミックス信号に適用することによって前記マルチチャンネルオーディオ信号を生成することと、を有することを特徴とするオーディオ信号処理方法。
  2. 前記マルチチャンネルオーディオ信号の出力チャンネル数とサンプリングレートと前記拡張信号のバンド幅に関する情報とを有する前記ビットストリームのレベルと、前記デコーダの複雑度レベルと、比較することを特徴とする請求項1に記載のオーディオ信号処理方法。
  3. 前記省略することにおいて、
    前記比較した結果が前記ビットストリームの複雑度レベルが前記デコーダの複雑度レベルよりも上位レベルである場合、前記拡張信号のデコーディングは、前記長さ情報に基づいて省略されることを特徴とする請求項1に記載のオーディオ信号処理方法。
  4. 前記補助信号の拡張領域から前記拡張信号の長さ情報を読むことを特徴とする請求項1に記載のオーディオ信号処理方法。
  5. 前記拡張信号の長さ情報を読み取ることは、
    長さ情報の値を前記拡張信号の第1の長さ情報の値に等しくなるよう設定することと、
    記長さ情報の値が予め定められた第1の値に等しい場合、前記長さ情報の第1の新しい値を前記長さ情報の値と前記拡張信号の第2の長さ情報の値と加えた値に等しくなるよう設定することと
    記長さ情報の第1の新しい値が予め定められた第の値に等しい場合、前記長さ情報の第2の新しい値を前記長さ情報の第1の新しい値と前記拡張信号のの長さ情報の加えた値に等しくなるよう設定することと、をさらに備える請求項1に記載のオーディオ信号処理方法。
  6. 前記拡張信号の長さ情報は、前記拡張信号の長さに基づいて適応的ビットとして割り当てられることを特徴とする請求項1に記載のオーディオ信号処理方法。
  7. 前記補助信号は、前記マルチチャンネルオーディオ信号を生成するための空間パラメータを含み、前記空間パラメータは、チャンネル間のエネルギー差を表す情報と、チャンネル間の相関関係を表す情報と、チャンネル予測係数情報とを含むことを特徴とする請求項1に記載のオーディオ信号処理方法。
  8. 前記デコーディングを省略することにおいて、
    前記デコーダの複雑度レベルに基づいて、前記拡張信号の一定低周波部分のみをデコーディングすることを特徴とする請求項1に記載のオーディオ信号処理方法。
  9. マルチチャンネルオーディオ信号の生成のためのダウンミックス信号と、補助信号と、拡張信号と、を有するビットストリームを受信するよう構成された逆多重化部と
    前記拡張信号のタイプを示す拡張信号タイプ情報を読み取るよう構成された拡張信号情報取得部であって、前記拡張信号のタイプは、レジデュアル信号と、任意のダウンミックスレジデュアル信号と、任意のツリー拡張信号と、のうちの少なくとも1つを有する拡張信号情報取得部と、
    前記拡張信号タイプ情報によって決定されたタイプを有する前記拡張信号の長さ情報を読み取るよう構成された拡張信号長さ読取部と、
    前記ビットストリームのレベルとデコーダの複雑度レベル比較するよう構成されたレベル判断部と、
    前記拡張信号タイプ情報と、前記長さ情報と、前記比較した結果と、に基づいて前記拡張信号のビットフィールドを跳び越えることによって前記拡張信号のデコーディングを省略することであって、前記拡張信号のビットフィールドは、前記長さ情報を用いて決定された長さの値に対応するよう構成された選択的デコーディング部と、
    前記補助信号を前記ダウンミックス信号に適用することによって前記マルチチャンネルオーディオ信号を生成するアップミキシング部と、を有することを特徴とするオーディオ信号処理装置。
  10. 前記選択的デコーディング部は、
    前記比較した結果が前記ビットストリームの複雑度レベルが前記デコーダの複雑度レベルよりも上位レベルである場合、前記拡張信号のデコーディングを前記長さ情報に基づいて省略するよう構成されることを特徴とする請求項に記載のオーディオ信号処理装置。
  11. 前記拡張信号長さ読取部は、
    長さ情報の値を前記拡張信号の第1の長さ情報のに等しくなるよう設定し
    前記長さ情報の値が予め定められた第1の値に等しい場合、前記長さ情報の第1の新しい値を前記長さ情報の値と前記拡張信号の第2の長さ情報の値とを加えた値に等しくなるよう設定し、
    前記長さ情報の第1の新しい値が予め定められた第2の値に等しい場合、前記長さ情報の第2の新しい値を前記長さ情報の第1の新しいと前記拡張信号の第3の長さ情報の値とを加えた値に等しくなるよう設定することによって、前記拡張信号の長さ情報を読み取るよう構成されることを特徴とする請求項に記載のオーディオ信号処理装置。
JP2008556238A 2006-02-23 2007-02-16 オーディオ信号の処理方法及び装置 Active JP5254808B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US77577506P 2006-02-23 2006-02-23
US60/775,775 2006-02-23
US79190706P 2006-04-14 2006-04-14
US60/791,907 2006-04-14
US80382506P 2006-06-02 2006-06-02
US60/803,825 2006-06-02
KR1020070013364A KR20070087494A (ko) 2006-02-23 2007-02-08 멀티 채널 오디오 신호의 디코딩 방법 및 장치
KR10-2007-0013364 2007-02-08
PCT/KR2007/000865 WO2007097549A1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal

Publications (3)

Publication Number Publication Date
JP2009527789A JP2009527789A (ja) 2009-07-30
JP2009527789A5 JP2009527789A5 (ja) 2009-09-10
JP5254808B2 true JP5254808B2 (ja) 2013-08-07

Family

ID=39791275

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2008556238A Active JP5254808B2 (ja) 2006-02-23 2007-02-16 オーディオ信号の処理方法及び装置
JP2008556240A Active JP5394753B2 (ja) 2006-02-23 2007-02-16 オーディオ信号の処理方法及び装置
JP2008556239A Active JP5390197B2 (ja) 2006-02-23 2007-02-16 オーディオ信号の処理方法及び装置
JP2008556241A Active JP5394754B2 (ja) 2006-02-23 2007-02-16 オーディオ信号の処理方法及び装置

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2008556240A Active JP5394753B2 (ja) 2006-02-23 2007-02-16 オーディオ信号の処理方法及び装置
JP2008556239A Active JP5390197B2 (ja) 2006-02-23 2007-02-16 オーディオ信号の処理方法及び装置
JP2008556241A Active JP5394754B2 (ja) 2006-02-23 2007-02-16 オーディオ信号の処理方法及び装置

Country Status (10)

Country Link
US (4) US7881817B2 (ja)
EP (4) EP1987594B1 (ja)
JP (4) JP5254808B2 (ja)
KR (5) KR100904439B1 (ja)
BR (1) BRPI0706488A2 (ja)
CA (1) CA2636330C (ja)
ES (4) ES2407820T3 (ja)
HK (1) HK1127825A1 (ja)
TW (5) TWI337341B (ja)
WO (1) WO2007097549A1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004043521A1 (de) * 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
US20080262853A1 (en) * 2005-10-20 2008-10-23 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
KR101438387B1 (ko) * 2006-07-12 2014-09-05 삼성전자주식회사 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치
US8571875B2 (en) 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
DE102007007830A1 (de) * 2007-02-16 2008-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
US20110112843A1 (en) * 2008-07-11 2011-05-12 Nec Corporation Signal analyzing device, signal control device, and method and program therefor
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
PL2311033T3 (pl) 2008-07-11 2012-05-31 Fraunhofer Ges Forschung Dostarczanie sygnału aktywującego dopasowanie czasowe i kodowanie sygnału audio z jego użyciem
US9330671B2 (en) * 2008-10-10 2016-05-03 Telefonaktiebolaget L M Ericsson (Publ) Energy conservative multi-channel audio coding
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
US9536529B2 (en) * 2010-01-06 2017-01-03 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
ES2935911T3 (es) 2010-04-09 2023-03-13 Dolby Int Ab Descodificación estéreo de predicción compleja basada en MDCT
CA2958360C (en) 2010-07-02 2017-11-14 Dolby International Ab Audio decoder
KR101748760B1 (ko) 2011-03-18 2017-06-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
CA2870452C (en) 2011-04-15 2020-03-10 Dominion Energy Technologies, Inc. System and method for single and multi zonal optimization of utility services delivery and utilization
WO2013009420A1 (en) 2011-06-09 2013-01-17 Power Tagging Technologies, Inc. System and method for grid based cyber security
US9380545B2 (en) 2011-08-03 2016-06-28 Astrolink International Llc System and methods for synchronizing edge devices on channels without carrier sense
TWI505262B (zh) * 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
MX339611B (es) 2013-01-21 2016-05-31 Dolby Laboratories Licensing Corp Codificador y decodificador de audio con metadatos de limite y sonoridad de programa.
US9841941B2 (en) 2013-01-21 2017-12-12 Dolby Laboratories Licensing Corporation System and method for optimizing loudness and dynamic range across different playback devices
US10097240B2 (en) 2013-02-19 2018-10-09 Astrolink International, Llc System and method for inferring schematic and topological properties of an electrical distribution grid
US9438312B2 (en) * 2013-06-06 2016-09-06 Astrolink International Llc System and method for inferring schematic relationships between load points and service transformers
US10001514B2 (en) 2013-06-13 2018-06-19 Astrolink International Llc System and method for detecting and localizing non-technical losses in an electrical power distribution grid
CA2915072A1 (en) 2013-06-13 2014-12-18 Astrolink International Llc Inferring feeder and phase powering a transmitter
JP2018504079A (ja) 2014-10-30 2018-02-08 アストロリンク インターナショナル エルエルシー グリッド位置のためのシステム、方法及び装置
JP2017532947A (ja) 2014-10-30 2017-11-02 アストロリンク インターナショナル エルエルシー 配電グリッドにおけるスロットの割り当てとスロットの競合の解消のシステムと方法
JPWO2016171002A1 (ja) * 2015-04-24 2018-02-15 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
CN106023999B (zh) * 2016-07-11 2019-06-11 武汉大学 用于提高三维音频空间参数压缩率的编解码方法及系统
US20180144757A1 (en) * 2016-11-23 2018-05-24 Electronics And Telecommunications Research Institute Method and apparatus for generating bitstream for acoustic data transmission
JP2018092012A (ja) * 2016-12-05 2018-06-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Family Cites Families (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3323730A1 (de) 1983-07-01 1985-01-10 Hoechst Ag, 6230 Frankfurt Fluessige magnesiumhaltige formulierungen
JP2811175B2 (ja) * 1986-01-27 1998-10-15 富士写真フイルム株式会社 画像データの直交変換符号化方法
JPH03245197A (ja) * 1990-02-23 1991-10-31 Toshiba Corp 音声符号化方式
US5166685A (en) * 1990-09-04 1992-11-24 Motorola, Inc. Automatic selection of external multiplexer channels by an A/D converter integrated circuit
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
DE4217276C1 (ja) 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
SG43996A1 (en) * 1993-06-22 1997-11-14 Thomson Brandt Gmbh Method for obtaining a multi-channel decoder matrix
DE69433258T2 (de) 1993-07-30 2004-07-01 Victor Company of Japan, Ltd., Yokohama Raumklangsignalverarbeitungsvorrichtung
AU691252B2 (en) * 1994-02-25 1998-05-14 Dorte Hammershoi Binaural synthesis, head-related transfer functions, and uses thereof
RU2158970C2 (ru) 1994-03-01 2000-11-10 Сони Корпорейшн Способ кодирования цифрового сигнала и устройство для его осуществления, носитель записи цифрового сигнала, способ декодирования цифрового сигнала и устройство для его осуществления
JP3129143B2 (ja) * 1994-05-31 2001-01-29 松下電器産業株式会社 データ転送方法
JP3397001B2 (ja) 1994-06-13 2003-04-14 ソニー株式会社 符号化方法及び装置、復号化装置、並びに記録媒体
US5703584A (en) 1994-08-22 1997-12-30 Adaptec, Inc. Analog data acquisition system
JPH08123494A (ja) 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
JPH08202397A (ja) * 1995-01-30 1996-08-09 Olympus Optical Co Ltd 音声復号化装置
JP3088319B2 (ja) 1996-02-07 2000-09-18 松下電器産業株式会社 デコード装置およびデコード方法
JPH09246989A (ja) * 1996-03-08 1997-09-19 Canon Inc 復号装置及びその方法
JPH10304360A (ja) * 1996-10-15 1998-11-13 Matsushita Electric Ind Co Ltd 映像・音声符号化方法、符号化装置、及び符号化プログラム記録媒体
JPH10124099A (ja) * 1996-10-15 1998-05-15 Olympus Optical Co Ltd 音声記録装置
JPH10233692A (ja) * 1997-01-16 1998-09-02 Sony Corp オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法
US6711266B1 (en) * 1997-02-07 2004-03-23 Bose Corporation Surround sound channel encoding and decoding
TW405328B (en) * 1997-04-11 2000-09-11 Matsushita Electric Ind Co Ltd Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment
JPH10294668A (ja) * 1997-04-22 1998-11-04 Matsushita Electric Ind Co Ltd オーディオ符号化データ復号化方法、オーディオ符号化データ復号化装置、及び記録媒体
US6307941B1 (en) 1997-07-15 2001-10-23 Desper Products, Inc. System and method for localization of virtual sound
CA2325482C (en) 1998-03-25 2009-12-15 Lake Technology Limited Audio signal processing method and apparatus
US6574339B1 (en) 1998-10-20 2003-06-03 Samsung Electronics Co., Ltd. Three-dimensional sound reproducing apparatus for multiple listeners and method thereof
JP3346556B2 (ja) 1998-11-16 2002-11-18 日本ビクター株式会社 音声符号化方法及び音声復号方法
JP2000200096A (ja) * 1999-01-07 2000-07-18 Kobe Steel Ltd ディジタル情報再生装置
KR100416757B1 (ko) 1999-06-10 2004-01-31 삼성전자주식회사 위치 조절이 가능한 가상 음상을 이용한 스피커 재생용 다채널오디오 재생 장치 및 방법
KR20010009258A (ko) 1999-07-08 2001-02-05 허진호 가상 멀티 채널 레코딩 시스템
US6864913B2 (en) * 1999-12-23 2005-03-08 Harry L. Tarnoff Method and apparatus for a reconfigurable digital processor for film conversion
JP2001292446A (ja) * 2000-04-05 2001-10-19 Nec Corp 映像及び音声符号化方法
US6973130B1 (en) * 2000-04-25 2005-12-06 Wee Susie J Compressed video signal including information for independently coded regions
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
JP2002262287A (ja) * 2001-03-05 2002-09-13 Canon Inc 情報処理方法及びその装置とその記憶媒体
JP3566220B2 (ja) 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
JP2002297496A (ja) * 2001-04-02 2002-10-11 Hitachi Ltd メディア配信システム及びマルチメディア変換サーバ
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
JP3747806B2 (ja) * 2001-06-11 2006-02-22 ソニー株式会社 データ処理装置及びデータ処理方法
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
CA2430923C (en) * 2001-11-14 2012-01-03 Matsushita Electric Industrial Co., Ltd. Encoding device, decoding device, and system thereof
EP1315148A1 (en) 2001-11-17 2003-05-28 Deutsche Thomson-Brandt Gmbh Determination of the presence of ancillary data in an audio bitstream
WO2003065353A1 (en) 2002-01-30 2003-08-07 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
WO2003070656A1 (de) 2002-02-25 2003-08-28 Foundation For Development Aid Acp-Eec Asbl Faservliesmaterial, vliesmaterialkörper und -verbundkörper sowie verfahren zur herstellung eines faservliesmateriales und verwendung desselben
EP1341160A1 (en) 2002-03-01 2003-09-03 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding and for decoding a digital information signal
JP3751001B2 (ja) 2002-03-06 2006-03-01 株式会社東芝 オーディオ信号再生方法および再生装置
AU2003216686A1 (en) 2002-04-22 2003-11-03 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
KR101016982B1 (ko) 2002-04-22 2011-02-28 코닌클리케 필립스 일렉트로닉스 엔.브이. 디코딩 장치
JP4404180B2 (ja) * 2002-04-25 2010-01-27 ソニー株式会社 データ配信システム、データ処理装置及びデータ処理方法、並びにコンピュータ・プログラム
JP4296752B2 (ja) * 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP2004023481A (ja) 2002-06-17 2004-01-22 Alpine Electronics Inc 音響信号処理装置及び方法並びにオーディオ装置
KR100981699B1 (ko) 2002-07-12 2010-09-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
BR0311601A (pt) 2002-07-19 2005-02-22 Nec Corp Aparelho e método decodificador de áudio e programa para habilitar computador
JP2004064363A (ja) 2002-07-29 2004-02-26 Sony Corp デジタルオーディオ処理方法、デジタルオーディオ処理装置およびデジタルオーディオ記録媒体
US7536305B2 (en) 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
US20060100861A1 (en) 2002-10-14 2006-05-11 Koninkijkle Phillips Electronics N.V Signal filtering
KR101004836B1 (ko) 2002-10-14 2010-12-28 톰슨 라이센싱 오디오 신 내 사운드 소스의 와이드니스를 코딩 및디코딩하기 위한 방법
EP1552724A4 (en) 2002-10-15 2010-10-20 Korea Electronics Telecomm METHOD FOR GENERATING AND USING A 3D AUDIOSCENCE WITH EXTENDED EFFICIENCY OF SOUND SOURCE
AU2003269550A1 (en) 2002-10-15 2004-05-04 Electronics And Telecommunications Research Institute Apparatus and method for adapting audio signal according to user's preference
US7787632B2 (en) 2003-03-04 2010-08-31 Nokia Corporation Support of a multichannel audio extension
KR100917464B1 (ko) 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
TWI236232B (en) 2004-07-28 2005-07-11 Via Tech Inc Method and apparatus for bit stream decoding in MP3 decoder
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
KR100571824B1 (ko) * 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
EP1713276B1 (en) * 2004-02-06 2012-10-24 Sony Corporation Information processing device, information processing method, program, and data structure
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
BRPI0509113B8 (pt) 2004-04-05 2018-10-30 Koninklijke Philips Nv codificador de multicanal, método para codificar sinais de entrada, conteúdo de dados codificados, portador de dados, e, decodificador operável para decodificar dados de saída codificados
KR100773539B1 (ko) 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
JP4614732B2 (ja) * 2004-10-22 2011-01-19 パナソニック株式会社 デコード装置
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP5228305B2 (ja) 2006-09-08 2013-07-03 ソニー株式会社 表示装置、表示方法
FR2913132B1 (fr) 2007-02-22 2010-05-21 Somfy Sas Dispositif de commande radio, actionneur electrique et installation domotique comprenant un tel dispositif

Also Published As

Publication number Publication date
JP5390197B2 (ja) 2014-01-15
TWI337341B (en) 2011-02-11
US20090240504A1 (en) 2009-09-24
EP1987597A1 (en) 2008-11-05
TWI447707B (zh) 2014-08-01
JP2009527790A (ja) 2009-07-30
US7991494B2 (en) 2011-08-02
KR20080095894A (ko) 2008-10-29
TW200738040A (en) 2007-10-01
KR20080055817A (ko) 2008-06-19
ES2391116T3 (es) 2012-11-21
CA2636330C (en) 2012-05-29
ES2407820T3 (es) 2013-06-14
JP2009527789A (ja) 2009-07-30
JP2009527791A (ja) 2009-07-30
TW201013638A (en) 2010-04-01
EP1987594A4 (en) 2010-03-31
TW200737125A (en) 2007-10-01
TWI333644B (en) 2010-11-21
KR100904439B1 (ko) 2009-06-26
KR100904438B1 (ko) 2009-06-24
US20100135299A1 (en) 2010-06-03
JP5394754B2 (ja) 2014-01-22
US7974287B2 (en) 2011-07-05
KR20080053296A (ko) 2008-06-12
JP2009527792A (ja) 2009-07-30
ES2391117T3 (es) 2012-11-21
EP1987597B1 (en) 2013-04-10
KR20080059156A (ko) 2008-06-26
KR101276849B1 (ko) 2013-06-18
US7991495B2 (en) 2011-08-02
EP1987596A1 (en) 2008-11-05
US20100046759A1 (en) 2010-02-25
KR20080055816A (ko) 2008-06-19
KR100904436B1 (ko) 2009-06-24
JP5394753B2 (ja) 2014-01-22
KR100904437B1 (ko) 2009-06-24
EP1987595A1 (en) 2008-11-05
BRPI0706488A2 (pt) 2011-03-29
TW200738039A (en) 2007-10-01
EP1987594B1 (en) 2013-05-08
HK1127825A1 (en) 2009-10-09
EP1987595B1 (en) 2012-08-15
CA2636330A1 (en) 2007-08-30
TWI333795B (en) 2010-11-21
TW200741650A (en) 2007-11-01
EP1987594A1 (en) 2008-11-05
EP1987595A4 (en) 2010-03-03
US20100046758A1 (en) 2010-02-25
US7881817B2 (en) 2011-02-01
TWI336599B (en) 2011-01-21
EP1987596A4 (en) 2010-03-10
WO2007097549A1 (en) 2007-08-30
EP1987596B1 (en) 2012-08-22
ES2413807T3 (es) 2013-07-17
EP1987597A4 (en) 2010-03-17

Similar Documents

Publication Publication Date Title
JP5254808B2 (ja) オーディオ信号の処理方法及び装置
JP5006315B2 (ja) オーディオ信号のエンコーディング及びデコーディング方法及び装置
US20100014679A1 (en) Multi-channel encoding and decoding method and apparatus
RU2383941C2 (ru) Способ и устройство для кодирования и декодирования аудиосигналов
AU2007218453B2 (en) Method and apparatus for processing an audio signal
RU2404507C2 (ru) Способ и устройство для обработки звукового сигнала
TWI459373B (zh) 音頻訊號之解碼方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110913

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111213

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120626

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120926

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130222

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130418

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5254808

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250