JP2011209741A - オーディオ信号デコーディング方法、オーディオ信号デコーディング装置及びオーディオ信号を処理するシステム - Google Patents

オーディオ信号デコーディング方法、オーディオ信号デコーディング装置及びオーディオ信号を処理するシステム Download PDF

Info

Publication number
JP2011209741A
JP2011209741A JP2011115621A JP2011115621A JP2011209741A JP 2011209741 A JP2011209741 A JP 2011209741A JP 2011115621 A JP2011115621 A JP 2011115621A JP 2011115621 A JP2011115621 A JP 2011115621A JP 2011209741 A JP2011209741 A JP 2011209741A
Authority
JP
Japan
Prior art keywords
data
coding
reference value
grouping
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011115621A
Other languages
English (en)
Other versions
JP5270717B2 (ja
Inventor
Hee Suk Pang
スク パン,ヒー
Dong Soo Kim
スー キム,ドン
Jae Hyun Lim
ヒュン リム,ジェ
Hyeon O Oh
オ オー,ヒェン
Yang Won Jung
ウォン ジュン,ヤン
Hyo Jin Kim
ジン キム,ヒョ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020060079836A external-priority patent/KR20070108312A/ko
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2011209741A publication Critical patent/JP2011209741A/ja
Application granted granted Critical
Publication of JP5270717B2 publication Critical patent/JP5270717B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/42Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code using table look-up for the coding or decoding process, e.g. using read-only memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L27/00Modulated-carrier systems
    • H04L27/26Systems using multi-frequency codes
    • H04L27/2601Multicarrier modulation systems
    • H04L27/2602Signal structure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】信号処理方法及び装置を提供する。
【解決手段】本発明のデータコーディング及びエントロピコーディングは相互連関性をもって行われ、グルーピングは、コーディング効率を増大させるのに用いられる。本発明の信号処理方法は、第1グルーピング及び前記第1グルーピングに対する外部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値及び前記グループ基準値に対応する差分値を獲得する段階と、前記グループ基準値及び前記差分値を用いて、前記データを獲得する段階と、を含む。
【選択図】図15

Description

本発明は、信号処理方法及び装置に関するものである。詳細には、信号の圧縮及び信号の復元のためのコーディング方法並びにそのための装置に関する。
従来より信号圧縮と復元に関する多くの技術が紹介されてきており、これらの技術の適用対象は、一般的に、オーディオとビデオを含めた様々なデータとなる。また、信号圧縮や復元技術は、圧縮率をより高めながらも、画質や音質をより良くする方向に発展して行っている。なお、多様な通信環境への適応のために転送効率を上げようと大いに努力してきた。
特開平11−32328号公報 特開平11−88185号公報 国際公開第2005/083679号 国際公開第2005/043511号
A.Ehret,X.D.Pan,M.Schun,H.Hoerich,W.M.Ren,X.M.Zhu,F.Henn,Audio Coding Technology of ExAC, Proceedings of 2004 International Symposium on Intelligent Multimedia,Video and Speech Processing,2004年10月,p.290-293 Ahmed H.Tewfik,Murtaza Ali,Enhanced Wavelet Based Audio Coder,Signals,Systems and Computers,1993.1993 Conference Record of The Twenty-Seventh Asilomar Conference on Pacific Grove,1993年11月,vol.2,p.896-900
しかしながら、転送効率を更に效果的に高めることができる余地がある。したがって、信号に対する新しい処理方案の開発によって、複雑な通信環境下でも信号の転送効率を最大にできる具体的な研究が望まれている。
本発明は上記の問題点を解決するためのもので、その目的は、信号の転送効率を最適化する信号処理方法及び装置を提供することにある。
また、本発明の他の目的は、効率的なデータコーディング方法とそのための装置を提供することにある。
本発明のさらに他の目的は、オーディオの復元に用いられる制御データの転送効率を極大化させることができるエンコーディング及びデコーディング方法とそのための装置を提供することにある。
本発明のさらに他の目的は、前記エンコーディングされたデータを含む媒体を提供することにある。
本発明のさらに他の目的は、前記エンコーディングされたデータを效率的に転送するためのデータ構造を提供することにある。
本発明のさらに他の目的は、前記デコーディング装置を含むシステムを提供することにある。
上記の目的を達成するための、本発明の信号処理方法は、第1グルーピング及び前記第1グルーピングに対する外部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値及び前記グループ基準値に対応する差分値を獲得し、前記グループ基準値及び前記差分値を用いて、前記データを獲得する過程を含む。また、前記第1グルーピングによってグルーピングされた前記データの個数である第1データ個数は、前記外部グルーピングによってグルーピングされた前記データの個数である第2データ個数よりも少ないことを特徴とする。また、前記第1データ個数と前記第2データ個数は互いに倍数関係を持つことを特徴とする。
また、前記グループ基準値は、パイロット基準値または差分基準値でありうる。また、上記方法は、前記グループ基準値及び前記差分値のうちの少なくとも一つをデコーディングする過程をさらに含む。また、前記パイロット基準値はグループ別に定められることを特徴とする。
また、前記グルーピングは、時間ドメイン及び周波数ドメインのうち少なくとも一つのドメイン上のデータに対して行われる。なお、前記時間ドメインは、タイムスロットドメイン、パラメータセットドメイン及びデータセットドメインのうちいずれか一つである。また、前記周波数ドメインは、サンプルドメイン、サブバンドドメイン、ハイブリッドドメイン、パラメータバンドドメイン、データバンドドメイン及びチャンネルドメインのうちのいずれか一つである。
また、上記方法は、前記獲得されたデータをパラメータとして用いてオーディオ信号を復元する過程をさらに含む。また、前記外部グルーピングは、ペアのパラメータを含むことができる。
上記の目的を達成するための、本発明の信号処理装置は、第1グルーピング及び前記第1グルーピングに対する外部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値及び前記グループ基準値に対応する差分値を獲得する値獲得部と、前記グループ基準値及び前記差分値を用いて、前記データを獲得するデータ獲得部と、を含む。
上記の目的を達成するための、本発明の他の信号処理方法は、第1グルーピング及び前記第1グルーピングに対する外部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値及び前記データを用いて差分値を生成し、前記生成された差分値を転送する過程を含む。
上記の目的を達成するための、本発明の他の信号処理装置は、第1グルーピング及び前記第1グルーピングに対する外部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値及び前記データを用いて差分値を生成する値生成部と、前記生成された差分値を転送する出力部と、を含む。
本発明による信号処理方法及び装置によれば、効率的なデータコーディング及びエントロピコーディングが可能になり、その結果、転送効率の高いデータ圧縮復元が可能になる。
本発明によるシステムを示す図である。 本発明によるシステムを示す図である。 本発明のPBCコーディング方式を説明するための図である。 本発明のPBCコーディング方式を説明するための図である。 本発明によるDIFFコーディングの種類を説明するための図である。 DIFFコーディング方式が適用される例を示す図である。 DIFFコーディング方式が適用される例を示す図である。 DIFFコーディング方式が適用される例を示す図である。 本発明による少なくとも3つのコーディング方式のうちのいずれか一つを選択する関係を示す図である。 従来方式による少なくとも3つのコーディング方式のうちのいずれか一つを選択する関係を示す図である。 本発明による前記データコーディング方式選択を示すフローチャートである。 本発明による前記データコーディング方式選択を示すフローチャートである。 本発明による内部グルーピングを説明するための図である。 本発明による外部グルーピングを説明するための図である。 本発明の混合グルーピングを説明するための図である。 本発明の混合グルーピングの他の実施例を説明するための図である。 本発明の混合グルーピングの他の実施例を説明するための図である。 本発明による1D及び2Dエントロピテーブルを例示する図である。 本発明による2Dエントロピコーディングの2つの方法を例示する図である。 本発明によるPBCコーディング結果に対するエントロピコーディング方法を示す図である。 本発明によるDIFFコーディング結果に対するエントロピコーディング方法を示す図である。 本発明によるエントロピテーブル選択方法を説明するための図である。 本発明が適用されるデータ構造を階層的に示す図である。 本発明の一実施例によるオーディオ圧縮及び復元のための装置構成を示す図である。 本発明の一実施例による空間情報エンコーディング部分の詳細構成を示すブロック図である。 本発明の一実施例による空間情報デコーディング部分の詳細構成を示すブロック図である。
以下、添付図面を参照しつつ、本発明の実施例の構成とその作用について説明する。ただし、図面に図示され且つそれに基づいて説明される本発明の構成と作用は、少なくとも一つの実施例として説明されるもので、これによって上記した本発明の技術的思想とその核心構成及び作用が制限されることはない。
なお、本発明で使われる用語は、可能なかぎり現在広く使われている一般的な用語を選択したが、特定の場合は、出願人が任意に選定した用語にて説明する。その場合には、該当の部分の詳細説明においてその意味を明確に記載しておくので、本発明の説明で使われた用語の名称だけで単純解釈されてはいけなく、その該当の用語の意味まで把握して本発明を解釈しなければならないということは明らかである。
本発明において“コーディング(coding)”という用語は、エンコーディング過程及びデコーディング過程を含む。ただし、特定のコーディング過程は、エンコーディング過程またはデコーディング過程のいずれか一過程にのみ適用できることは自明であり、これは、該当の説明部分で区分して説明される。この“コーディング(coding)”は、“コーデック(codec)”とも呼ばれる。
[本発明の全体概要]
本発明では、信号をコーディングする段階が、データコーディング(data coding)とエントロピコーディング(entropy coding)とに区分して説明される。ただし、このデータコーディングとエントロピコーディングは相互連関性を持ち、これについては詳細に後述する。また、本発明においては、効率的なデータコーディング及びエントロピコーディングを行うためにデータをグルーピング(grouping)する様々な方法について説明される。後述するグルーピング方法は、特定データコーディング及びエントロピコーディング方式にかかわらず独立的に有効な技術的思想を持つ。また、本発明によるデータコーディングとエントロピコーディングを適用した具体的な例として、空間情報を持つオーディオコーディング(例えば、“ISO/IEC 23003、MPEG Surround”)方法を取り上げて説明する。
図1及び図2は、本発明によるシステムを示す図である。図1はエンコーディング装置1を、図2はデコーディング装置2をそれぞれ示す。
エンコーディング装置1は、データグルーピング部10、第1データエンコーディング部20、第2データエンコーディング部31、第3データエンコーディング部32、エントロピエンコーディング部40及びビットストリーム多重化部50のうち、少なくとも一つを含んで構成される。
なお、第2データエンコーディング部31及び第3データエンコーディング部32は、一つのデータエンコーディング部30として統合しても良い。例えば、第2データエンコーディング部31及び第3データエンコーディング部32によってエンコーディングされたデータは、エントロピエンコーディング部40によって可変長符号化が行われるという面で似ている。以下、上記の各構成要素について詳細に説明する。
データグルーピング部10は、入力信号を一定単位にまとめ、データ処理の効率を図る。例えば、データグルーピング部10は、データの種類によってデータを区分し、区分されたデータは、データエンコーディング部20,31,32のいずれか一つでエンコーディングされる。また、データグルーピング部10は、データ処理の効率のためにデータの一部を少なくとも一つのグループに区分し、区分された各グループ別データは、データエンコーディング部20,31,32のいずれか一つでエンコーディングされる。このデータグルーピング部10の動作を含む本発明のグルーピング方法については、図13〜図17を参照しつつより詳細に後述する。
データエンコーディング部20,31,32はそれぞれ、入力データを該当のエンコーディング方式によって符号化する。このため、各データエンコーディング部20,31,32は少なくともPCM(パルス符号変調)方式と差分符号化方式を含む。具体的には、例えば、第1データエンコーディング部20はPCM方式を、第2データエンコーディング部31はパイロット基準値を用いる第1差分符号化方式を適用することができ、第3データエンコーディング部32は隣接データとの差分を用いる第2差分符号化方式を適用することができる。
以下、説明の便宜上、第1差分符号化方式を「パイロットコーディング(PBC)」と称し、第2差分符号化方式を「差分コーディング(DIFF)」と称する。このデータエンコーディング部20,31,32の動作を、図3〜図8を参照しつつ詳細に後述する。
また、エントロピエンコーディング部40は、エントロピテーブル41を参照してデータの統計的特性によって可変長符号化を行う。このエントロピエンコーディング部40の動作は、図18〜図22を参照して詳細に後述される。
また、ビットストリーム多重化部50は、コーディングされたデータを転送規格に合わせて配列及び/または変換し、ビットストリーム形態として転送する。ただし、本発明を用いた特定システムにおいてビットストリーム多重化部50が使われない場合には、ビットストリーム多重化部50無しでシステムを構成できることは自明である。
デコーディング装置2は、前述したエンコーディング装置1に対応して構成される。例えば、ビットストリーム逆多重化部60は、入力ビットストリームを受信し、受信したビットストリーム内に含まれた様々な情報を、既に定められたフォーマットによって解析して分類する。エントロピデコーディング部70は、エントロピテーブル71を用いてエントロピエンコーディング以前のデータに復元する。ここで、エントロピテーブル71は、エンコーディング装置1内のエントロピテーブル41と同じテーブルで構成されることは自明である。
また、第1データデコーディング部80、第2データデコーディング部91及び第3データデコーディング部92は、前述の第1データエンコーディング部20、第2データエンコーディング部31及び第3データエンコーディング部32にそれぞれ対応するデコーディング過程を行う。したがって、第2データデコーディング部91及び第3データデコーディング部92が差分復号化を行う場合では、重複するデコーディング過程を統合して一つのデコーディング過程内で共に処理しても良い。また、データ復元部95は、データデコーディング80,91,92によってデコーディングされたデータを、データエンコーディングされる前の元のデータに復元する。ただし、使用例によっては、元のデータを変換または修正した他のデータに復元することも可能である。
本発明は、データコーディングを効率的に行うために少なくとも2つのコーディング方式を混用し、コーディング方式相互間の関連性を用いて効率的なコーディング方式を提供することを目的とする。また、本発明は、データコーディングを效率的に行うために様々な方式のデータグルーピング方式を提供することを目的とする。また、本発明は、上述した本発明の特徴を含むデータ構造を提供することを目的とする。
なお、本発明の技術的思想を様々なシステムに適用するに当たり、前述した図1及び図2に示された構成要素の他にも、様々な付加的構成が必要となることは自明である。例えば、データの量子化を行ったり、制御部による上記過程の制御が必要な場合がありうる。
[データコーディング]
以下、本発明のデータコーディング方式として適用可能なPCM(パルス符号変調)方式、PBC(パイロットコーディング)方式及びDIFF(差分符号化)方式について詳細に説明する。これらのデータコーディング方式の効率的選択及び相互関連性についても続いて説明される。
1.PCM(パルス符号変調)
PCMは、アナログ信号をデジタル信号に変換するコーディング方式であり、アナログ信号を定められた一定の間隔で標本化し、その結果を量子化する。PCMは、コーディング効率の面では不利であるが、後述するPBCコーディング方式やDIFFコーディング方式に適合しないデータには有効に利用することができる。本発明において、PCMは、データコーディング時に、後述するPBC方式及びDIFF方式と共に用いられる。これについては、図9〜図12を参照しつつ後述する。
2.PBC(パイロットコーディング)
2−1.PBC概念
PBCは、区分されたデータグループ内で特定基準を定め、この定められた基準とコーディング対象となるデータ間の関係を用いるコーディング方式である。したがって、PBCを適用するために基準となる値を、「基準値」、「パイロット」、「パイロット基準値」または「パイロット値」に定義可能であるが、以下では、説明の便宜のために「パイロット基準値」とする。また、パイロット基準値とグループ内データ間の差の値を「差分値」または「パイロット差分値」と定義することができる。
また、PBCが適用される単位であるデータグループは、上記のデータグルーピング部10によって特定のグルーピング方式が適用された最終のグループのことを意味する。前述したように、データグルーピングは、様々な方法で可能であり、これについての詳細説明を後述する。本発明では、以下、上記のようにグルーピングされて特定の意味を持つデータを「パラメータ」と定義して説明するが、これは説明の便宜のためのもので、他の用語に取り替えても良いことは自明である。
すなわち、本発明によるPBC過程は、少なくとも次の2段階を含んで構成される。まず、第一に、複数個のパラメータに対応するパイロット基準値を選定する。パイロット基準値は、PBCの対象になるパラメータを参照して定める。例えば、パイロット基準値を、PBCの対象になるパラメータの平均値、対象になるパラメータの平均の近似値、対象になるパラメータのうち、中間水準に該当する中間値、及び、対象になるパラメータのうち、最も頻繁に使われた最頻値から選定された一つの値に設定することができる。また、パイロット基準値は、既に定められたデフォルト値に選定されても良い。また、パイロット基準値は、既に定められたテーブル内で選択によって決定することも可能である。
また、本発明は、前述した様々なパイロット基準値選定方法のうちの少なくとも2つの方法によって選ばれたパイロット基準値を、一時的なパイロット基準値に設定し、それぞれの場合に対してコーディング効率を計算した後、最もコーディング効率の良い場合に該当する一時的なパイロット基準値を、最終パイロット基準値に選定しても良い。
上記の平均の近似値は、平均がPの時、Ceil[P]またはFloor[P]である。ここで、Ceil[x]は、xを越えない最大整数であり、Floor[x]は、xを越える最小整数である。しかし、PBCの対象になるパラメータを参照せず、任意の固定されたデフォルト値に選定しても良い。また、他の例として、前述したように、パイロットとして選定可能な様々な値を任意に複数個選定した後、それらの各値に対してコーディングを行い、以降、最も良いコーディング効率を示す値を、最適のパイロットと選定することができる。第二に、当該選定されたパイロットとグループ内のパラメータとの差分値を求める。例えば、PBCの対象になるパラメータ値からパイロット基準値を減算して差分値を算出する。これを、図3及び図4を参照しつつ説明すると、下記の通りである。
図3及び図4は、本発明のPBCコーディング方式を説明するための図である。例えば、一つのグループ内に複数のパラメータ(例えば、10個)が存在し、それぞれのパラメータは、次のようなパラメータ値x[n]={11,12,9,12,10,8,12,9,10,9}を持つと仮定する。このグループ内のパラメータをエンコーディングするためにPBC方式が選択されたとすれば、まず、パイロット基準値を選定しなければならない。図4によれば、本例のパイロット基準値は、‘10’に選定されたことがわかる。パイロット基準値は、前述したように、パイロット基準値を選定する様々な方法によって選定可能である。以下、PBCによる差分値は、下記の数式1で算出される。
[式1]
d[n]=x[n]-P、n=0,1,…,9
ここで、Pはパイロット基準値(=10)を表し、x[n]は、データコーディングの対象パラメータを表す。上記の数式1によるPBCの結果は、d[n]={1,2,−1,2,0,−2,2,−1,0,−1}となる。すなわち、PBCコーディングの結果は、選定されたパイロット基準値及び計算されたd[n]を有し、これらの値は、後述するエントロピエンコーディングの対象となる。なお、PBCは、対象パラメータ値の偏差が全体的に小さい時により効果的となる。
2−2.PBC客体
PBCコーディングの対象はいずれか一つに特定されない。様々な信号のデジタルデータをPBCでコーディングすることが可能であり、例えば、後述するオーディオコーディングでも適用することが可能である。本発明では、特に、オーディオデータと一緒に処理される付加的な制御データをPBCコーディングの対象として詳細に説明する。
この制御データは、オーディオのダウンミックスされた信号に付加的に転送され、その制御データは、オーディオを復元するのに使われる。この制御データを、以下では「空間情報または空間パラメータ」と定義する。この空間情報は、チャンネルレベル差(以下、“CLD”という。)、チャンネル間コヒーレンス(以下、“ICC”という。)及びチャンネル予測係数(以下、“CPC”という。)などの様々な空間パラメータを含む。
さらに具体的には、CLDは、相互に異なる2チャンネル間のエネルギー差を表すパラメータである。例えば、CLDは、−15から+15までの範囲の値を持つ。また、ICCは、相互に異なる2チャンネル間の相関関係を表すパラメータである。例えば、ICCは、0から7までの範囲の値を持つ。また、CPCは、2チャンネルから3チャンネルを生成する時に用いられる予測係数を表すパラメータである。例えば、CPCは、−20から30までの範囲の値を持つ。
また、PBCコーディングの対象として、信号の利得を調節するために使われる利得値、例えば、‘ADG(Arbitary Downmix gain)'も含むことができる。また、ダウンミックスされるオーディオ信号の任意のチャンネル変換ボックスに適用されるATD(Arbitary Tree Data)もPBCコーディングの対象になる。特に、ADGは、前述したCLD、ICC、CPCとは区分されるパラメータである。すなわち、ADGは、オーディオ信号のチャンネルから抽出されるCLD、ICC、CPCのような空間情報とは違い、オーディオの利得を調節するためのパラメータに該当する。ただし、使用例において、ADG及びATDを、オーディオコーディングの効率を上げるために前述したCLDと同様に処理することができる。
PBCコーディングの他の対象として、部分パラメータを考慮することができる。本発明でいう「部分パラメータ」とは、パラメータの一部のことを意味する。例えば、特定パラメータがnビットで表現されると仮定する時、nビットを少なくとも2部分に区分し、これらをそれぞれ第1部分パラメータ及び第2部分パラメータと定義することができる。この場合、PBCコーディングを行おうとする場合には、例えば、第1部分パラメータ値とパイロット基準値との差分値を求めることが可能である。ただし、差分値算出において除外された第2部分パラメータを、別の値として転送しなければならない。
より具体的に説明すると、例えば、パラメータ値を表すnビットであれば、そのうち、最下位1ビット(LSB)を第2部分パラメータと定義し、残りの上位(n-1)ビットで構成されたパラメータ値を、第1部分パラメータと定義することができる。この場合、PBCは、第1部分パラメータのみを対象にして行うことができる。これは、上位(n−1)ビットからなる第1部分パラメータ値間に偏差が少ないためにコーディング効率が良くなるからである。差分値算出時に除外された第2部分パラメータは別途転送し、デコーディング部で最終のパラメータの復元時には、別途転送された第2部分パラメータを考慮すればいい。ただし、第2部分パラメータを別途転送せず、既に定められた方式によって第2部分パラメータを獲得しても良い。
このような部分パラメータの特性を用いたPBCコーディングは、対象パラメータの特性によって限定的に利用される。例えば、前述したように、第1部分パラメータ値間の偏差が少なくなければならない。もし偏差が大きいと、部分パラメータを利用する必要がなく、むしろコーディング効率をより悪くする。実験的な結果によれば、前述した空間情報のうち、CPCパラメータが部分パラメータPBC方式のアプリケーションに適している。ただし、CPCパラメータであるとしても、粗量子化方式を適用する場合には好ましくない。これは、粗量子化方式の場合には、第1部分パラメータ値間の偏差が増加するためである。部分パラメータを用いたデータコーディングは、PBCの他に、後述するDIFF方式にも同様に適用可能である。
次に、上記のようにCPCパラメータに部分パラメータ概念を適用する場合、これを復元する信号処理方法及び装置について説明する。例えば、部分パラメータを用いた本発明の信号処理方法は、第1部分パラメータに対応する基準値と該基準値に対応する差分値を用いて、第1部分パラメータを獲得する段階と、この第1部分パラメータ及び第2部分パラメータを用いて、パラメータを決定する段階と、を含む。また、基準値は、パイロット基準値及び差分基準値のいずれか一つである。また、第1部分パラメータは、パラメータの一部のビットであり、第2部分パラメータは、パラメータの残りのビットである。第2部分パラメータは、パラメータの最下位ビットとなる。
また、この信号処理方法は、当該決定されたパラメータを用いてオーディオ信号を復元する段階をさらに含む。このパラメータは、CLD、ICC、CPC及びADGのうちの少なくとも一つを含む空間情報である。また、パラメータがCPCであり、このパラメータの量子化スケールが粗くない時、第2部分パラメータが獲得される。また、第1部分パラメータを2倍とし、これを第2部分パラメータに加えて最終パラメータを決定する。
また、部分パラメータを用いた本発明の信号処理装置は、第1部分パラメータに対応する基準値とこの基準値に対応する差分値を用いて、第1部分パラメータを獲得する第1パラメータ獲得部と、この第1部分パラメータ及び第2部分パラメータを用いて、パラメータを決定するパラメータ決定部と、を含む。また、この信号処理装置は、第2部分パラメータを受信して獲得する第2パラメータ獲得部をさらに備える。第1パラメータ獲得部、パラメータ決定部及び第2パラメータ獲得部は、前述したデータデコーディング部91または92内に含まれる。
また、部分パラメータを用いた本発明の信号処理方法は、パラメータを第1部分パラメータと第2部分パラメータとに分割する段階と、第1部分パラメータに対応する基準値とこの第1部分パラメータを用いて差分値を生成する段階と、を含む。また、この信号処理方法は、当該差分値と第2部分パラメータを転送する段階をさらに含む。
また、部分パラメータを用いた本発明の信号処理装置は、パラメータを第1部分パラメータと第2部分パラメータとに分割するパラメータ分割部と、第1部分パラメータに対応する基準値と第1部分パラメータを用いて差分値を生成する値生成部と、を備える。また、この信号処理装置は、当該差分値と第2部分パラメータを転送するパラメータ出力部をさらに備える。パラメータ分割部、差分値生成部は、前述したデータエンコーディング部31または32内に含まれる。
2−3.PBC条件
本発明のPBCコーディングは、別のパイロット基準値を選定し、これをビットストリーム上に含めねばならないという面から、後述するDIFFコーディング方式に比べて転送効率が低くなる可能性がある。したがって、本発明では、PBCコーディングを行うための最小条件を提供しようとする。実験的に、グループ内のデータコーディングの対象になるデータ個数が少なくとも3つである場合に、PBCコーディングを適用することが可能である。これは、データコーディングの効率性を考慮した結果であり、もしグループ内に2個のデータのみが存在する場合では、PBCよりはDIFFコーディングやPCMコーディングがより効率的であることを意味する。
また、3つ以上のデータに対するPBCコーディングが可能であるが、データの個数が少なくとも5個である場合には、PBCを適用することが好ましい。換言すると、PBCコーディングが最も效率的に適用可能な場合は、グループ内のデータコーディングの対象になるデータの個数が少なくとも5個で、5個以上のデータ値間の偏差が少ない場合に該当する。このようなPBCコーディングを行うのに適合した最小限のデータの個数は、システム及びコーディング環境によって決定される。
また、データコーディングの対象になるデータは、データバンド別に与えられる。これは、後述するグルーピング過程を通じても説明される。したがって、例えば、後述するMPEGオーディオサラウンドコーディングでは、PBCコーディングの適用のためにはデータバンドが少なくとも5個になることを提案している。
以下、上記PBCを行う条件を用いた本発明の信号処理方法及び装置を説明する。
本発明の信号処理方法は、パイロット基準値に対応するデータの個数を獲得し、データバンドの個数があらかじめ設定された条件を満たす場合、当該パイロット基準値とパイロット基準値に対応するパイロット差分値を獲得する。その後、得られたパイロット基準値及びパイロット差分値を用いて、データを獲得する。特に、データの含まれたデータバンドの個数を用いて、当該データの個数を獲得する。
また、本発明の他の信号処理方法は、データの個数を用いて、複数個のデータコーディング方式のうちの一つを決定し、決定されたデータコーディング方式によってデータをデコーディングする。前記複数個のデータコーディング方式は、少なくともパイロットコーディング方式を含む。また、データの個数があらかじめ設定された条件を満たす場合、データコーディング方式がパイロットコーディング方式と決定される。
また、データをデコーディングする過程は、複数個のデータに対応するパイロット基準値とこのパイロット基準値に対応するパイロット差分値を獲得し、獲得したパイロット基準値及びパイロット差分値を用いて、当該データを獲得する過程を含む。
また、この信号処理方法において、データはパラメータであり、このパラメータを用いてオーディオ信号を復元する。また、この信号処理方法は、パラメータの個数に対応する識別情報を受信し、この受信した識別情報を用いてパラメータの個数を生成する。また、データの個数を考慮しながら、複数個のデータコーディング方式を表す識別情報を階層的に抽出する。
また、前記識別情報を抽出する過程は、第1データコーディング方式を表示する第1識別情報を抽出し、前記第1識別情報及び前記データの個数を用いて、第2データコーディング方式を表示する第2識別情報を抽出する。ここで、第1識別情報は、DIFFコーディング方式か否かを表し、第2識別情報は、パイロットコーディング方式か、PCMグルーピング方式かを表す。
また、本発明のさらに他の信号処理方法は、複数個のデータの個数があらかじめ設定された条件を満たす場合、該複数個のデータに対応するパイロット基準値と当該データを用いてパイロット差分値を生成し、以降、生成されたパイロット差分値を転送する。特に、この信号処理方法は、パイロット基準値を転送する。
また、本発明のさらに他の信号処理方法は、複数個のデータの個数によって、データコーディング方式を決定し、決定されたデータコーディング方式によってデータをエンコーディングする。この場合、複数個のデータコーディング方式はパイロットコーディング方式を少なくとも含む。また、データの個数があらかじめ設定された条件を満たす場合、データコーディング方式がパイロットコーディング方式と決定される。
また、本発明の信号処理装置は、パイロット基準値に対応するデータの個数を獲得する個数獲得部と、データの個数があらかじめ設定された条件を満たす場合、パイロット基準値とこのパイロット基準値に対応するパイロット差分値を獲得する値獲得部と、当該パイロット基準値及びパイロット差分値を用いて、データを獲得するデータ獲得部と、を含む。これらの個数獲得部、値獲得部及びデータ獲得部は、前述したデータデコーディング部91または92内に含まれる。
また、本発明の他の信号処理装置は、複数個のデータコーディング方式のうちのいずれか一つを、複数個のデータの個数によって決定する方式決定部と、当該決定されたデータコーディング方式によってデータをデコーディングするデコーディング部と、を含む。また、複数個のデータコーディング方式は、少なくともパイロットコーディング方式を含む。
また、本発明のさらに他の信号処理装置は、複数個のデータの個数があらかじめ設定された条件を満たす場合、複数個のデータに対応するパイロット基準値と当該データを用いてパイロット差分値を生成する値生成部と、当該生成されたパイロット差分値を転送する出力部と、を含む。値生成部は、前述したデータエンコーディング部31または32内に含まれる。
また、本発明のさらに他の信号処理装置は、複数個のデータの個数によって、データコーディング方式を決定する方式決定部と、当該決定されたデータコーディング方式によって当該データをエンコーディングするエンコーディング部と、を含む。この複数個のデータコーディング方式は、少なくともパイロットコーディング方式を含む。
2−4.PBC信号処理方法
以下、本発明による、PBCコーディング特徴を用いた信号処理方法及び装置について説明する。
本発明の信号処理方法は、まず、複数個のデータに対応するパイロット基準値と該パイロット基準値に対応するパイロット差分値を獲得する。次いで、前記パイロット基準値及び前記パイロット差分値を用いて、当該データを獲得する。また、前記パイロット差分値及びパイロット基準値のうち少なくとも一つをデコーディングする過程をさらに含むことができる。また、前記PBC適用データはパラメータであり、前記獲得されたパラメータを用いてオーディオ信号を復元する過程をさらに含むことができる。
また、本発明の信号処理装置は、複数個のデータに対応するパイロット基準値と前記パイロット基準値に対応するパイロット差分値を獲得する値獲得部と、前記パイロット基準値及び前記パイロット差分値を用いて、前記データを獲得するデータ獲得部と、を含む。前記値獲得部及びデータ獲得部は、前述したデータデコーディング部91または92内に含まれる。
本発明の他の信号処理方法は、複数個のデータに対応するパイロット基準値と前記データを用いてパイロット差分値を生成し、前記生成されたパイロット差分値を出力する過程を含む。
また、本発明の信号処理装置は、複数個のデータに対応するパイロット基準値と前記データを用いてパイロット差分値を生成する値生成部と、前記生成されたパイロット差分値を出力する出力部と、を含む。
本発明のさらに他の信号処理方法は、複数個の利得に対応するパイロット基準値と前記パイロット基準値に対応するパイロット差分値を獲得し、前記パイロット基準値及びパイロット差分値を用いて、前記利得を獲得する過程を含む。また、前記パイロット差分値及びパイロット基準値のうちの少なくとも一つをデコーディングする過程をさらに含むことができる。また、前記獲得された利得を用いてオーディオ信号を復元する過程をさらに含むことができる。
この場合、前記パイロット基準値は、前記複数個の利得の平均または平均近似値であるか、前記複数個の利得の中間値であるか、前記複数個の利得の最頻値であるか、デフォルトで設定された値であるか、または、テーブルから抽出した一つの値であれば良い。また、前記パイロット基準値を複数個の利得のそれぞれに設定した後、最も高い符号化効率を示す利得を、最終的な前記パイロット基準値として選定する段階をさらに含むことができる。
また、本発明の他の信号処理装置は、複数個の利得に対応するパイロット基準値と前記パイロット基準値に対応するパイロット差分値を獲得する値獲得部と、前記パイロット基準値及び前記パイロット差分値を用いて、前記利得を獲得する利得獲得部と、を含む。
また、本発明のさらに他の信号処理方法は、複数個の利得に対応するパイロット基準値と前記利得を用いてパイロット差分値を生成し、前記生成されたパイロット差分値を出力する過程を含む。
また、本発明のさらに他の信号処理装置は、複数個の利得に対応するパイロット基準値と前記利得を用いてパイロット差分値を生成する値算出部と、前記生成されたパイロット差分値を出力する出力部と、を含む。
3.DIFF(差分符号化)
DIFFコーディングは、区分されたデータグループ内に存在するデータ同士間の関係を用いるコーディング方式である(これを「差分符号化」ともいう。)。ここで、DIFFが適用される単位としてのデータグループは、前述したデータグルーピング部10を通じて特定のグルーピング方式が適用された最終のグループを意味する。本発明では、上記のようにグルーピングされて特定の意味を持つデータを「パラメータ」と定義して説明し、これは、前述のPBCと同様である。特に、DIFFコーディング方式は、同一グループ内に存在するパラメータ、特に、隣接したパラメータ間の差分値を用いるコーディング方式である。以下、DIFFコーディング方式の種類及び詳細適用例について、図5〜図8を参照しつつ詳細に説明する。
3−1.DIFF種類
図5は、本発明によるDIFFコーディングの種類を説明するための図である。DIFFコーディングは、隣接したパラメータとの差分値を求める方向によって区分される。例えば、DIFFコーディングの種類は、周波数軸で差値分を求めるDIFF(以下、‘DIFF_FREQ'または‘DF'という。)と、時間軸で差分値を求めるDIFF(以下、‘DIFF_TIME'または‘DT'という。)とに区分される。図5によれば、グループ1は、周波数軸で差分値を算出するDIFF(DF)を示し、グループ2及びグループ3は、時間軸で差分値を算出するDIFF(DT)を示す。
図5からわかるように、時間軸で差分値を算出するDIFF(DT)は、差分値を求める時間軸の方向によって再び区分される。例えば、グループ2に適用されたDIFF(DT)は、現在の時間のパラメータ値と以前の時間のパラメータ値(例えば、グループ1)との差分値を求める方式である。これを後方時間DIFF(DT)(以下、‘DT−BACKWARD’という。)という。また、例えば、グループ3に適用されたDIFF(DT)は、現在の時間のパラメータ値と以降の時間のパラメータ値(例えば、グループ4)との差分値を求める方式である。これを、前方時間DIFF(DT)(以下、‘DT−FORWARD’という。)という。
したがって、図5に示すように、グループ1はDIFF(DF)コーディング方式、グループ2はDIFF(DT−BACKWARD)コーディング方式、グループ3はDIFF(DT−BACKWARD)コーディング方式であることがわかる。ただし、グループ4は、まだコーディング方式が決定されていない場合である。
また、本発明では、周波数軸でのDIFFを、一つのコーディング方式(例えば、DIFF(DF))のみと定義したが、システム及びコーディング規格によって‘DIFF(DF−TOP)’または‘DIFF(DF−BOTTOM)'に区分して定義しても良い。
3−2.DIFF適用例
図6〜図8は、DIFFコーディング方式による適用例を示す図である。図6は、説明の便宜上、図5におけるグループ1とグループ2を取り上げている。すなわち、グループ1は、DIFF(DF)コーディング方式であり、例えば、パラメータ値はx[n]={11,12,9,12,10,8,12,9,10,9}の場合である。グループ2は、DIFF(DF−BACKWARD)コーディング方式であり、例えば、パラメータ値はy[n]={10,13,8,11,10,7,14,8,10,8}の場合である。
図7は、グループ1の差分値を算出した結果を示す図である。このグループ1は、DIFF(DF)コーディング方式でコーディングされたので、下記の数式2によって差分値が算出される。数式2は、周波数軸で以前のパラメータとの差分値を求める式を意味する。
[式2]
d[0]=x[0]、
d[n]=x[n]-x[n-1]、n=1,2,…,9
すなわち、上記の数式2によるグループ2のDIFF(DF)結果は、d[n]={11,1,−3,3,−2,−2,4,−3,1,−1}となる。
図8は、グループ2の差分値を算出した結果を示す図である。このグループ2は、DIFF(DT−BACKWARD)コーディング方式でコーディングされたので、下記の数式3によって差分値が算出される。数式3は、時間軸で以前のパラメータとの差分値を求める式を意味する。
[式3]
d[n]=y[n]-x[n]、n=0,1,…,9
すなわち、上記数式3によるグループ2のDIFF(DT−BACKWARD)結果は、d[n]={−1,1,−1,−1,0,−1,2,−1,0,−1}となる。
4.データコーディング方式の選択
本発明は、様々なデータコーディング方式を混用してデータを圧縮したり復元したりすることに特徴がある。したがって、特定グループをコーディングするに当たり、少なくとも3つのデータコーディング方式のうちのいずれか一方式を選択することが必要である。また、選択されたコーディング方式に関する識別情報は、ビットストリームを介してデコーディング部に伝達されなければならない。
以下、本発明によるデータコーディング方式の選択と、これを用いたコーディング方法及び装置について説明する。
本発明の信号処理方法は、データコーディング識別情報を獲得する段階と、このデータコーディング識別情報が表示するデータコーディング方式によって、データをデータデコーディングする段階と、を含む。また、このデータコーディング方式は、少なくともPBCコーディング方式を含み、このPBCコーディング方式は、複数個のデータに対応するパイロット基準値とパイロット差分値を用いて前記データをデコーディングし、前記パイロット差分値は、前記データと前記パイロット基準値を用いて生成される。
また、データコーディング方式は、DIFFコーディング方式をさらに含む。ここで、DIFFコーディング方式は、DIFF−DF方式及びDIFF−DT方式のいずれかであり、DIFF−DT方式は、前方タイムDIFF−DT(FORWARD)方式及び後方タイムDIFF−DT(BACKWARD)方式のいずれか一つである。
また、この信号処理方法は、エントロピコーディング識別情報を獲得する段階と、該エントロピコーディング識別情報が表示するエントロピコーディング方式を用いて、前記データをエントロピデコーディングする段階と、をさらに含む。また、前記データデコーディング段階は、前記エントロピデコーディングされたデータを前記データコーディング方式によってデータデコーディングする。また、この信号処理方法は、データをパラメータとして用いて、オーディオ信号をデコーディングする段階をさらに含む。
また、本発明の信号処理装置は、データコーディング識別情報を獲得する識別情報獲得部と、このデータコーディング識別情報が表示するデータコーディング方式によって、データをデータデコーディングするデコーディング部と、を含む。また、少なくとも前記データコーディング方式は、PBCコーディング方式を含み、このPBCコーディング方式は、複数個のデータに対応するパイロット基準値とパイロット差分値を用いて前記データをデコーディングし、前記パイロット差分値は、前記データと前記パイロット基準値を用いて生成される。
また、本発明の他の信号処理方法は、データコーディング方式によってデータをデータエンコーディングする段階と、データコーディング方式を表示するデータコーディング識別情報を生成して転送する段階と、を含む。また、このデータコーディング方式は、少なくともPBCコーディング方式を含み、このPBCコーディング方式は、複数個のデータに対応するパイロット基準値とパイロット差分値を用いて前記データをエンコーディングし、前記パイロット差分値は、前記データ及び前記パイロット基準値を用いて生成される。
また、本発明の他の信号処理装置は、データコーディング方式によってデータをデータエンコーディングするエンコーディング部と、データコーディング方式を表示するデータコーディング識別情報を生成して転送する出力部と、を含む。また、このデータコーディング方式は少なくともPBCコーディング方式を含み、このPBCコーディング方式は、複数個のデータに対応するパイロット基準値とパイロット差分値を用いて前記データをエンコーディングし、前記パイロット差分値は、前記データ及び前記パイロット基準値を用いて生成される。
以下、本発明によるデータコーディング方式の選択方法及びコーディング選択識別情報を最適の転送効率の下で転送する方法について説明する。
4−1.使用頻度を考慮したデータコーディング識別方法
図9は、本発明による少なくとも3つのコーディング方式のうちのいずれか一つを選択する関係を示す図である。例えば、第1、第2及び第3データエンコーディング部53,52,51が存在し、このうち、第1データエンコーディング部53の使用頻度が最も低く、かつ、第3データエンコーディング部51の使用頻度が最も高いと仮定する。説明の便宜上、使用頻度は、全体‘100’を基準に、第1データエンコーディング部53が‘10’、第2データエンコーディング部52が‘30’、そして第3データエンコーディング部51が‘60’であると仮定する。すなわち、これを具体的に説明すると、100個のデータグループに対して、PCM方式を10回、PBC方式を30回、DIFF方式を60回適用したと考えることができる。
このような仮定において、3つのコーディング方式を識別するための識別情報に必要なビット数を計算すると、次の通りになる。例えば、図9によれば、まず、1ビットの第1情報を使用するので、全体で100グループの各コーディング方式を区分するためには、第1識別情報として100ビットが使われる。この100ビットを通じて使用頻度の高い第3データエンコーディング部51を識別したので、残り1ビットの第2情報は、40ビットだけで第1データエンコーディング部53と第2データエンコーディング部52を区別することが可能になる。
したがって、100個のデータグループに対して各グループ別コーディングタイプ選択のための識別情報は、「第1情報(100ビット)+第2情報(40ビット)」からなる合計140ビットが必要とされる。
図10は、従来方式による少なくとも3つのコーディング方式のうちのいずれか一つを選択する関係を示す図である。説明の便宜上、図9と同様に、使用頻度は、全体‘100’を基準に、第1データエンコーディング部53が‘10’、第2データエンコーディング部52が‘30’、そして第3データエンコーディング部51が‘60’であると仮定する。図10によって3つのコーディング方式を識別するための識別情報に必要なビット数を計算してみると、次の通りになる。図10によれば、まず、1ビットの第1情報を使用するので、全体で100グループの各コーディング方式を区分するためには、第1情報として100ビットが使われる。この100ビットを通じて使用頻度の低い第1データエンコーディング部53がまず識別される。したがって、残り1ビットの第2情報は、第2データエンコーディング部52と第3データエンコーディング部53とを区別するために合計90ビットがさらに必要となる。したがって、100個のデータグループに対して各グループ別コーディングタイプ選択のための識別情報は、「第1情報(100ビット)+第2情報(90ビット)」の合計190ビットが必要となる。
前述した図9による場合と図10による場合とを比較すると、図9のようなデータコーディング選択識別情報を構成することが、転送効率の面においてより有利であることがわかる。すなわち、本発明は、3つ以上のデータコーディング方式が存在する場合、使用頻度数が類似する2つのコーディング方式を、同じ識別情報によって区分せず、相互に異なる識別情報を用いることに特徴がある。例えば、図10のように、第1データエンコーディング部51と第2データエンコーディング部52を同一識別情報で分類する場合には、データ転送ビットが増えて転送効率が低くなってしまう。また、本発明は、3つ以上のデータコーディング方式が存在する場合、最も使用頻度の高いデータコーディング方式が第1識別情報によって区分されるようにすることに特徴がある。その結果、第2識別情報によって使用頻度の低い残り2個のコーディング方式が区別される。
図11及び図12は、本発明によるデータコーディング方式選択に対するフローチャートをそれぞれ示す。例えば、図11は、‘DIFF’コーディングを最も使用頻度の高いデータコーディングと仮定した場合であり、図12は、‘PBC’コーディングを最も使用頻度の高いデータコーディングと仮定した場合である。
したがって、図11を参照すると、まず、使用頻度の最も低いPCMコーディングか否かを確認する(S10)。この確認は、前述したように、第1情報によって行われる。この確認の結果、PCMコーディングであれば、PBCコーディングか否かを確認する(S20)。これは第2情報によって行われる。もし、DIFFコーディングの使用頻度が、全体で100回のうち60回であれば、同一の100個のデータグループに対して、各グループ別コーディングタイプ選択のための識別情報は「第1情報(100ビット)+第2情報(40ビット)」となり、合計140ビットが必要となることがわかる。
また、図12を参照すると、まず、図11と同様に、使用頻度の最も低いPCMコーディングか否かを確認する(S30)。この確認は、前述したように、第1識別情報によって行われる。この確認の結果、PCMコーディングであれば、DIFFコーディングか否かを確認する(S40)。これは、第2識別情報によって行われる。もし、PBCコーディングの使用頻度が、全体で100回のうち80回であれば、同一の100個のデータグループに対して、各グループ別コーディングタイプ選択のための識別情報は「第1識別情報(100ビット)+第2識別情報(20ビット)」となり、合計120ビットが必要となることがわかる。
以下、本発明による複数のデータコーディング方法を識別する方法と、これを用いた信号処理方法及び装置について説明する。
本発明の信号処理方法は、複数個のデータコーディング方式を表す識別情報を階層的に抽出し、この識別情報に対応するデータコーディング方式によってデータをデコーディングする。この場合、複数個のデータコーディング方式に含まれるPBCコーディング方式及びDIFFコーディング方式を表す識別情報は、相互に異なる階層から抽出される。また、前記デコーディングする段階は、前記データコーディング方式によって、複数個のデータに対応する基準値と前記データを用いて生成された差分値を用いて、前記データを獲得する。前記基準値は、パイロット基準値または差分基準値になることができる。
また、本発明の他の信号処理方法は、3つ以上のデータコーディング方式を表す識別情報を階層的に抽出するが、ここで、前記識別情報の使用頻度数の高い2個のコーディング方式を表す識別情報は、相互に異なる階層から抽出される。
また、本発明のさらに他の信号処理方法は、データコーディング方式を表す識別情報の使用頻度数によって、前記識別情報を階層的に抽出し、前記識別情報に対応するデータコーディング方式によって前記データをデコーディングする過程を含む。前記識別情報は、第1識別情報と第2識別情報を階層的に抽出し、前記第1識別情報は、第1データコーディング方式か否かを表し、前記第2識別情報は、第2データコーディング方式か否かを表す。前記第1識別情報はDIFFコーディング方式か否かを表し、前記第2識別情報はパイロットコーディング方式か、PCMグルーピング方式かを表す。また、前記第1データコーディング方式を、PCMコーディング方式にすることができる。また、前記第2データコーディング方式を、PBCコーディング方式またはDIFFコーディング方式にすることができる。また、この信号処理方法において、前記データはパラメータであり、このパラメータを用いてオーディオ信号を復元する過程をさらに含む。
また、本発明の信号処理装置は、複数個のデータコーディング方式を区分付ける識別情報を階層的に抽出する識別子抽出部(例えば、図13の710)と、前記識別情報に対応するデータコーディング方式によって前記データをデコーディングするデコーディング部と、を含む。
また、本発明の他の信号処理方法は、データコーディング方式によってデータをエンコーディングし、前記データのエンコーディングに用いられる頻度数が相互に異なるデータコーディング方式を区分付ける識別情報を階層的に生成する過程を含む。前記識別情報は、PCMコーディング方式とPBCコーディング方式を区分付ける。具体的に、前記識別情報は、PCMコーディング方式とDIFFコーディング方式を区分付ける。
また、本発明の他の信号処理装置は、データコーディング方式によってデータをエンコーディングするエンコーディング部と、前記データのエンコーディングに用いられる頻度数が相互に異なるデータコーディング方式を区分付ける識別情報を階層的に生成する識別情報生成部(例えば、図11の400)と、を含む。
4−2.データコーディング間の関連性
本発明のPCM、PBC及びDIFFは、相互独立的及び/または非独立的な関連性を持つ。例えば、データコーディングの対象になる各グループ別に、上記3つの方式のうちのいずれか一つを自由に選択することが可能である。したがって、全体のデータコーディングは、上記3方式のコーディングを組み合わせて使用した結果となる。ただし、上記3つのコーディング方式の使用頻度を考慮し、最上の使用頻度を持つDIFFコーディング方式と残り2つのコーディング方式(例えば、PCMとPBC)のうちのいずれか一方式が先ず選択される。その後、PCMとPBCのうちのいずれか一方式が次に選択される。ただし、これは、前述したように、識別情報の転送効率を考慮したもので、実質的なコーディング方式の類似性に起因するものではない。
コーディング方式の類似性の観点において、PBCとDIFFは、差分値を算出する面で似ている。したがって、PBCとDIFFのコーディング処理過程は、多くの部分が重複する。特に、デコーディング時に差分値から元のパラメータを復元する過程は、「デルタデコーディング」(delta decoding)と定義し、同じ過程内で処理されるように設計可能である。
また、PBCまたはDIFFとしてコーディングを行う過程で、範囲を外れるパラメータが存在してもよい。このような場合、該当のパラメータは別のPCMでコーディングして転送する必要がある。
[グルーピング]
1.グルーピングの概念
本発明は、コーディングの効率性のために一定のデータをまとめて処理するグルーピングを提案する。特に、PBCコーディングの場合、グループ単位にパイロット基準値を選定するので、PBCコーディングが行われる以前の段階としてグルーピング過程が完了しなければならない。また、グルーピングは、DIFFコーディングでも同様に適用される。また、本発明のグルーピングのうちの一部の方式は、エントロピコーディングでも適用可能であり、これについての詳細は、該当の説明部分で後述される。
本発明のグルーピングの種類を、グルーピング実行方法を基準に、「外部グルーピング」と「内部グルーピング」とに区分することができる。
また、本発明のグルーピングの種類を、グルーピングの対象を基準に、「ドメイングルーピング」、「データグルーピング」及び「チャンネルグルーピング」に区分することができる。
また、本発明のグルーピングの種類を、グルーピング実行順序を基準に、「1次グルーピング」、「2次グルーピング」、「3次グルーピング」などに区分することができる。
また、グルーピング実行回数を基準に、「単一グルーピング」と「混合グルーピング」とに区分することができる。
ただし、上記のグルーピングの区分は、本発明を概念的に伝達するために便宜上区分したもので、その使用用語に必ずしも限定されることはない。また、本発明のグルーピングは、上記の様々なグルーピング方式が重複適用されたり、組合的に使われたりして完成する。以下、本発明のグルーピングを、内部グルーピングと外部グルーピングとに区分して説明し、続いて様々なグルーピングが混合して存在する混合グルーピングについて説明する。なお、ドメイングルーピングとデータグルーピングの概念についても説明する。
2.内部グルーピング
内部グルーピングとは、グルーピングの実行が内的に行われることを意味する。一般的に、内部グルーピングが行われると、既存のグループを内的に再グルーピングして新しいグループを生成し、または、分割されたグループを生成する。
図13は、本発明による内部グルーピングを説明するための図である。図13を参照すると、例えば、本発明の内部グルーピングを周波数ドメイン単位(以下、「バンド」という。)で行った場合である。したがって、一部の内部グルーピング方式は、一種のドメイングルーピングに該当することができる。
サンプリングデータが特定のフィルター、例えば、QMF(クアドラチャミラーフィルタ)を通過すると、複数のサブバンドが生成される。このサブバンド状態で1次周波数グルーピングを行い、1次グループバンドを生成する。これは、パラメータバンドともいう。この1次周波数グルーピングは、サブバンドを不均一にまとめてパラメータバンドを生成することができる。したがって、パラメータバンドの大きさを非均等的に構成することができる。ただし、コーディングの目的によっては、パラメータバンドを均等的にすることも可能である。また、前記サブバンドを生成する過程も、グルーピングと分類することができる。
前記生成されたパラメータバンドに対して2次周波数グルーピングを行い、2次グループバンドを生成する。これをデータバンドともいう。この2次周波数グルーピングは、パラメータバンドを均一な個数で統合してデータバンドを生成できる。
前記グルーピングの後に、コーディングの目的に応じて、1次グループバンドであるパラメータバンド単位でコーディングを行ったり、2次グループバンドであるデータバンド単位でコーディングを行ったりすることができる。
例えば、前述したPBCコーディングを適用する時、グルーピングされたパラメータバンドを一グループとしてパイロット基準値(一種のグループ基準値となる)を選定しても良く、グルーピングされたデータバンドを一グループとしてパイロット基準値を選定しても良い。この選定されたパイロット基準値を用いてPBCを行うことになり、以降の詳細なPBC動作は、前述した通りである。
また、例えば、前述したDIFFコーディングを適用する時、グルーピングされたパラメータバンドを一グループとしてグループ基準値を決定し、差分値を算出する。また、グルーピングされたデータバンドを一グループとしてグループ基準値を決定し、差分値を算出することも可能である。以降の詳細DIFF動作は、前述した通りである。
実際のコーディング時に、前記1次周波数グルーピング及び/または2次周波数グルーピングを適用した場合は、それに該当する情報を転送する必要がある。これについては、図23を参照しつつ後述する。
3.外部グルーピング
外部グルーピングとは、グルーピングが外的に行われることを意味する。一般的に、外部グルーピングが行われると、既存のグループを外的に再グルーピングして新しいグループを生成し、または、拡張されたグループを生成する。
図14は、本発明による外部グルーピングを説明するための図である。図14を参照すると、例えば、本発明の外部グルーピングは、時間ドメイン単位(以下、「タイムスロット」)で行われる。したがって、一部の外部グルーピング方式は、一種のドメイングルーピングに該当することができる。
サンプリングデータを含むフレームに対して1次タイムグルーピングを行い、1次グループタイムスロットを生成する。図14では、8個のタイムスロットが生成された場合を例示している。この1次タイムグルーピングは、フレームを均等な大きさのタイムスロットに分割するという意味も有する。
前記生成された1次タイムグルーピングによって生成されたタイムスロットのうち、少なくとも一つのタイムスロットを選択する。図14では、例えば、タイムスロット1、4、5、8が選択された場合が示されている。この選択過程において、コーディング方法によっては、全てのタイムスロットを選択することも可能である。また、選択されたタイムスロット1、4、5、8は、タイムスロット1、2、3、4に再配列される。ただし、コーディングの目的によっては、前記選択されたタイムスロット1、4、5、8の一部のみを再配列することも可能である。この場合、再配列から抜けるタイムスロットは、最終グループ形成では除外されるので、前述したPBCコーディングやDIFFコーディング適用対象からも除外される。
前記選択されたタイムスロットに対して2次タイムグルーピングを行い、最終時間軸上で一緒に処理されるグループを形成する。例えば、タイムスロット1、2及びタイムスロット3、4を一つのグループと形成でき、この場合を、それぞれタイムスロットペア(pair)という。また、タイムスロット1、2、3を一つのグループと形成でき、この場合をタイムスロットトリプル(triple)という。また、他のタイムスロットとグループを形成しない単独のタイムスロットも存在することができる。
実際のコーディングの時に前記1次タイムグルーピング及び2次タイムグルーピングを適用した場合には、それに該当する情報を転送する必要がある。これについては、図23を参照しつつ後述する。
4.混合グルーピング
混合グルーピングとは、前述した内部グルーピング、外部グルーピング及びその他様々なグルーピングを混合して最終グループを生成するグルーピング方式のことをいう。前述したように、本発明の個別のグルーピング方式は、相互に重複して適用可能または組み合わせて適用可能であり、これは、様々なコーディング方式の効率を上げるための方案として活用される。
4−1.内部グルーピングと外部グルーピングとの混合
図15は、本発明の混合グルーピングを説明するための図である。特に、図15は、内部グルーピングと外部グルーピングとを混合した場合を示す。
すなわち、周波数ドメインで内部グルーピングが完了して最終グループバンド64が生成され、時間ドメインで外部グルーピングが完了して最終タイムスロット61,62,63が生成された場合を示している。
以下、グルーピングの完了した一つの個別のタイムスロットを、データセットと呼ぶ。図15でデータセットは、参照符号61a,61b,62a,62b,63が該当する。特に、2個のデータセット(61aと61b及び62aと62b)は、外部グルーピングによってそれぞれ対をなすことができる。このデータセットの対を、「データペア」という。
混合グルーピングが完了した後、PBCコーディングまたはDIFFコーディング適用が行われる。例えば、PBCコーディングを行う場合では、前記最終完了したデータペア61,62またはデータペアを形成しない単一データセット63毎に1つずつのパイロット基準値P1,P2,P3を選定する。選定されたパイロット基準値を用いてPBCコーディングを行うことは、前述した通りである。
また、例えば、DIFFコーディングを行う場合では、データセット61a,61b,62a,62b,63毎にDIFFコーディングタイプが決定される。前述したように、データセット毎にDIFF方向を決定すべきであり、これは、‘DIFF−DF'と‘DIFF−DT'のうちのいずれか一つと決定される。前記決定されたDIFFコーディング方式によってDIFFコーディングが行われる過程は、前述した通りである。
混合グルーピングにおいて外部グルーピングが行われてデータペアを形成するためには、データペアを形成する各データセットに対して均等な内部グルーピングが行わなければならない。例えば、データペアを形成するデータセット61aと61bは、同じデータバンド数を持つ。また、データペアを形成するデータセット62aと62bは、同じデータバンド数を持つ。ただし、相互に異なるデータペア内に属するデータセット、例えば、61aと62aはデータバンド数が異なっても問題がない。これは、それぞれのデータペア別に異なる内部グルーピングが適用されることができるということを意味する。
また、データペアを形成する場合に、1次グルーピングは内部グルーピングで行うことができ、2次グルーピングは外部グルーピングで行うことができる。例えば、2次グルーピング後のデータバンド数は、1次グルーピング後のデータバンド数と倍数関係にある。これは、前述したように、データペアを形成するデータセットはいずれも同じデータバンド数を持つためである。
4−2.内部グルーピングと外部グルーピングとの混合
図16及び図17は、本発明の混合グルーピングの他の実施例を説明するための図である。特に、図16及び図17は、内部グルーピングと外部グルーピングとの混合に重点をおいて示す。したがって、図16及び図17において、外部グルーピングを行い又は行うことができるということは自明である。
例えば、図16は、前述した2次周波数グルーピングが完了してデータバンドが生成された場合に対して、再び内部グルーピングを行った場合を示す。すなわち、2次周波数グループを通じて生成されたデータバンドは、低周波帯域と高周波帯域とに区分される。特定のコーディングの場合、低周波帯域と高周波帯域を分離して利用する必要がある。特に、このように低周波帯域と高周波帯域を分離して利用する場合を、「デュアルモード」ともいう。
したがって、デュアルモードの場合、最終生成された低周波帯域と高周波帯域をそれぞれ一グループとし、データコーディングを行う。例えば、低周波帯域及び高周波帯域のそれぞれに対してパイロット基準値(P1,P2)を生成し、該当の周波数帯域内でPBCコーディングを行う。
このデュアルモードは、チャンネルごとの特性に応じて適用することが可能であり、したがって、これを「チャンネルグルーピング」ともいう。また、データタイプによって別々に適用することも可能である。
例えば、図17は、前述した2次周波数グルーピングが完了してデータバンドが生成された場合に対して、再び内部グルーピングを行った場合を示す。すなわち、2次周波数グループを通じて生成されたデータバンドは、低周波帯域と高周波帯域とに区分される。特定のコーディングの場合、低周波帯域だけを利用し、高周波帯域を廃棄する必要もある。特に、このように低周波帯域のみをグルーピングして利用する場合を、「低周波チャンネル(LFE)モード」ともいう。
したがって、低周波チャンネル(LFE)モードでは、最終生成された低周波帯域を一グループとしてデータコーディングを行う。例えば、低周波帯域に対してパイロット基準値(P1)を生成し、該当の低周波数帯域内でPBCコーディングを行うこととなる。ただし、選択された低周波帯域を再び内部グルーピングして新しいデータバンドを生成することも可能である。これは、低周波帯域をより稠密にグルーピングして表現するためである。
この低周波チャンネル(LFE)モードは、低周波チャンネル特性によって適用されるもので、よって、これを「チャンネルグルーピング」ともいう。
5.ドメイングルーピングとデータグルーピング
グルーピングの対象を基準に、ドメイングルーピングとデータグルーピングとに区分できる。ドメイングルーピングとは、特定ドメイン(例えば、周波数ドメインまたは時間ドメイン)上で各ドメインの単位をグルーピングする方式のことを意味する。ドメイングルーピングを、前述した内部グルーピング及び/または外部グルーピングを通じて行うことができる。
また、データグルーピングとは、データ自体をグルーピングする方式を意味する。データグルーピングも同様、前述した内部グルーピング及び/または外部グルーピングを通じて行われることができる。
また、データグルーピングのうちの特殊な場合として、特に後述するエントロピコーディングで活用できるようにグルーピングすることができる。例えば、データグルーピングは、図15に示すように最終完了したグルーピング状態で、実際データをエントロピコーディングするために使われる。すなわち、データを周波数方向または時間方向のうちのいずれか一方向に隣接した2個のデータをまとめて処理する方式である。ただし、上記のようにデータグルーピングを行った場合なら、実際最終グループ内の一部データのみを再グルーピングしたことであるから、データグルーピングされたグループ(例えば、2個のデータ)に限ってはPBCコーディングやDIFFコーディングを適用しない。前記データグルーピングに対応するエントロピコーディング方式は後述される。
6.グルーピングを用いた信号処理方法
6−1.少なくとも内部グルーピングを用いた信号処理方法
以下、前述した本発明のグルーピング方式を用いた信号処理方法及び装置について説明する。
本発明の信号処理方法は、第1グルーピング及びこの第1グルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する差分値を獲得し、前記グループ基準値及び前記差分値を用いて、前記データを獲得する過程を含む。また、本発明は、前記第1グルーピングによってグルーピングされた前記データの個数は、前記内部グルーピングによってグルーピングされた前記データの個数よりも大きいことを特徴とする。ここで、グループ基準値は、パイロット基準値または差分基準値でありうる。
また、本発明は、前記グループ基準値及び前記差分値のうちの少なくとも一つをデコーディングする過程をさらに含む。ここで、前記パイロット基準値は、前記グループ別に定められる。
また、前記内部グルーピングによる内部グループに含まれる前記データの個数は、あらかじめ設定される。ここで、前記内部グループに含まれるデータの個数は、相互に異なる。
前記第1グルーピング及び前記内部グルーピングは、周波数ドメイン上の前記データに対して行われる。この周波数ドメインは、ハイブリッドドメイン、パラメータバンドドメイン、データバンドドメインまたはチャンネルドメインのうちのいずれか一つになりうる。
また、本発明は、前記第1グルーピングによる第1グループは、前記内部グルーピングによる内部グループを複数個含むことを特徴とする。
また、本発明の周波数ドメインは、周波数バンドで区分され、この周波数バンドは、内部グルーピングによってサブバンドとなり、サブバンドは再び内部グルーピングによってパラメータバンドとなり、パラメータバンドは再び内部グルーピングによってデータバンドとなる。ここで、パラメータバンドの個数は、最大28個に制限することができる。また、パラメータバンドの個数を、2個、5個または10個のうちのいずれか一つにまとめて一つのデータバンドにグルーピングする。
また、本発明の信号処理装置は、第1グルーピング及びこの第1グルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する差分値を獲得する値獲得部と、前記グループ基準値及び前記差分値を用いて、前記データを獲得するデータ獲得部と、を含む。
また、本発明の他の信号処理方法は、第1グルーピング及びこの第1グルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成し、前記生成された差分値を転送する過程を含む。
また、本発明の他の信号処理装置は、第1グルーピング及びこの第1グルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成する値生成部と、前記生成された差分値を転送する出力部と、を含む。
6−2.混合グルーピングを用いた信号処理方法
以下、前述した本発明のグルーピング方式を用いた信号処理方法及び装置について説明する。
本発明の信号処理方法は、グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する差分値を獲得し、前記グループ基準値及び前記差分値を用いて、前記データを獲得する過程を含む。前記グループ基準値は、パイロット基準値及び差分基準値のうちの一つでありうる。また、前記グルーピングは、外部グルーピング及び内部グルーピングのいずれか一つでありうる。また、前記グルーピングは、ドメイングルーピング及びデータグルーピングのいずれか一つでありうる。
前記データグルーピングは、ドメイングループ上で行われる。また、前記ドメイングルーピングに含まれる時間ドメインは、タイムスロットドメイン、パラメータセットドメイン及びデータセットドメインのうちの少なくとも一つを含む。
また、前記ドメイングルーピングに含まれる周波数ドメインは、サンプルドメイン、サブバンドドメイン、ハイブリッドドメイン、パラメータバンドドメイン、データバンドドメイン及びチャンネルドメインのうちの少なくとも一つでありうる。前記グループに含まれた前記複数個のデータから一つの前記差分基準値が設定される。グルーピング回数、グルーピング範囲及びグルーピングの有無のうちの少なくとも一つが決定される。
また、本発明の信号処理装置は、グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する差分値を獲得する値獲得部と、前記グループ基準値及び前記差分値を用いて、前記データを獲得するデータ獲得部と、を含む。
また、本発明の他の信号処理方法は、グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成し、前記生成された差分値を転送する過程を含む。
また、本発明の他の信号処理装置は、グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成する値生成部と、前記生成された差分値を転送する出力部と、を含む。
また、本発明のさらに他の信号処理方法は、第1グルーピング及び第2グルーピングを含むグルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する第1差分値を獲得し、前記グループ基準値及び前記第1差分値を用いて、前記データを獲得する過程を含む。ここで、前記グループ基準値は、パイロット基準値または差分基準値でありうる。
また、前記グループ基準値及び前記第1差分値のうちの少なくとも一つをデコーディングする過程をさらに含む。また、前記第1パイロット基準値はグループ別に定められる。
また、本発明は、前記複数個の第1パイロット基準値に対応する第2パイロット基準値とこの第2パイロット基準値に対応する第2差分値を獲得し、前記第2パイロット基準値と前記第2差分値を用いて前記第1パイロット基準値を獲得する過程をさらに含む。ここで、第2グルーピングは、前記第1グルーピングに対する外部グルーピングまたは内部グルーピングでありうる。
また、前記グルーピングは、時間ドメイン及び周波数ドメインのうちの少なくとも一つのドメイン上のデータに対して行われる。特に、前記グルーピングは、時間ドメイン及び周波数ドメインのうちの少なくとも一つをグルーピングするドメイングルーピングである。
また、前記時間ドメインは、タイムスロットドメイン、パラメータセットドメインまたはデータセットドメインでありうる。また、前記周波数ドメインは、サンプルドメイン、サブバンドドメイン、ハイブリッドドメイン、パラメータバンドドメイン、データバンドドメインまたはチャンネルドメインでありうる。前記グルーピングされるデータは、インデックスまたはパラメータである。
また、前記第1グルーピングを通じた一つのグループに含まれる前記インデックスが表すエントロピテーブルを用いて、前記第1差分値をエントロピデコーディングするが、この場合、前記データは、前記グループ基準値及び前記エントロピデコーディングされた第1差分値を用いて獲得される。
また、前記第1グルーピングを通した一つのグループに含まれる前記インデックスが表すエントロピテーブルを用いて、前記第1差分値と前記グループ基準値をエントロピデコーディングするものの、前記データは前記エントロピデコーディングされたグループ基準値及び第1差分値を用いて獲得される。
また、本発明のさらに他の信号処理装置は、第1グルーピング及び第2グルーピングを含むグルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する差分値を獲得する値獲得部と、前記グループ基準値及び前記差分値を用いて、前記データを獲得するデータ獲得部と、を含む。
また、本発明のさら他の信号処理方法は、第1グルーピング及び第2グルーピングを含むグルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成し、前記生成された差分値を転送する過程を含む。
また、本発明のさらに他の信号処理装置は、第1グルーピング及び第2グルーピングを含むグルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのデータを用いて差分値を生成する値生成部と、前記生成された差分値を転送する出力部と、を含む。
また、本発明のさらに他の信号処理方法は、第1グルーピング及び前記第1グルーピングに対する外部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する差分値を獲得し、前記グループ基準値及び前記差分値を用いて、前記データを獲得する過程を含む。また、前記第1グルーピングによってグルーピングされた前記データの個数である第1データの個数は、前記外部グルーピングによってグルーピングされた前記データの個数である第2データの個数よりも少ないことを特徴とする。また、前記第1データの個数と前記第2データの個数は、互いに倍数関係を持つことを特徴とする。
また、前記グループ基準値は、パイロット基準値または差分基準値でありうる。また、本発明は、前記グループ基準値及び前記差分値のうちの少なくとも一つをデコーディングする過程をさらに含む。また、前記パイロット基準値は、グループ別に定められることを特徴とする。
前記グルーピングは、時間ドメイン及び周波数ドメインのうちの少なくとも一つのドメイン上のデータに対して行われる。前記時間ドメインは、タイムスロットドメイン、パラメータセットドメイン及びデータセットドメインのうちのいずれか一つである。また、前記周波数ドメインは、サンプルドメイン、サブバンドドメイン、ハイブリッドドメイン、パラメータバンドドメイン、データバンドドメイン及びチャンネルドメインのうちのいずれか一つである。
また、本発明は、前記獲得されたデータをパラメータとして用いてオーディオ信号を復元する過程をさらに含む。また、前記外部グルーピングは、ペアをなすパラメータを含むことができる。
また、本発明のさらに他の信号処理装置は、第1グルーピング及び前記第1グルーピングに対する外部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する差分値を獲得する値獲得部と、前記グループ基準値及び前記差分値を用いて、前記データを獲得するデータ獲得部と、を含む。
また、本発明のさらに他の信号処理方法は、第1グルーピング及びこの第1グルーピングに対する外部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成し、前記生成された差分値を転送する過程を含む。
また、本発明のさらに他の信号処理装置は、第1グルーピング及び前記第1グルーピングに対する外部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのデータを用いて差分値を生成する値生成部と、前記生成された差分値を転送する出力部と、を含む。
6−3.少なくともデータグルーピングを用いた信号処理方法
以下、前述した本発明のグルーピング方式を用いた信号処理方法及び装置について説明する。
本発明の信号処理方法は、データグルーピング及び前記データグルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応する一つのグループ基準値とこのグループ基準値に対応する差分値を獲得し、前記グループ基準値及び前記差分値を用いて前記データを獲得する過程を含む。前記内部グルーピングに含まれた前記データの個数は、前記データグルーピングに含まれた前記データの個数よりも少ない。前記データは、パラメータに対応する。
前記データグルーピングされる前記複数個のデータ全体に対して前記内部グルーピングが行われる。ここで、前記内部グルーピングを、パラメータの帯域別に行うことができる。また、前記データグルーピングされる前記複数個のデータの一部に対して前記内部グルーピングを行うことができる。また、前記データグルーピングされる前記複数個のデータのチャンネル別に前記内部グルーピングを行うことができる。
また、前記グループ基準値は、パイロット基準値または差分基準値でありうる。また、本発明は、前記グループ基準値及び前記差分値のうちの少なくとも一つをデコーディングする過程をさらに含むことができる。ここで、前記パイロット基準値は、グループ別に定められる。
また、前記データグルーピング及び前記内部グルーピングは、周波数ドメイン上のデータに対して行われる。
また、前記周波数ドメインは、サンプルドメイン、サブバンドドメイン、ハイブリッドドメイン、パラメータバンドドメイン、データバンドドメイン及びチャンネルドメインのうちのいずれか一つになることができる。また、前記データを獲得する時、前記データグルーピング及び前記内部グルーピングのうちの少なくとも一つに対するグルーピング情報が用いられる。
また、前記グルーピング情報は、各グループの位置、各グループの個数、グループ基準値のグループ別適用の有無、グループ基準値の個数、グループ基準値のコーデック方式及びグループ基準値の獲得の有無のうちの少なくとも一つを含む。
また、本発明の信号処理装置は、データグルーピング及びこのデータグルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応する一つのグループ基準値と前記グループ基準値に対応する差分値を獲得する値獲得部と、前記グループ基準値及び前記差分値を用いて前記データを獲得するデータ獲得部と、を含む。
また、本発明の他の信号処理方法は、データグルーピング及びこのデータグルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成する段階と、前記生成された差分値を転送する段階と、をさらに含む。
また、本発明の他の信号処理装置は、データグルーピング及び前記データグルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成する値生成部と、前記生成された差分値を転送する出力部と、を含む。
[エントロピコーディング]
1.エントロピコーディング概念
本発明のエントロピコーディングは、前述したデータコーディングの結果を可変長符号化する過程のことを意味する。一般に、エントロピコーディングは、特定データの発生確率を統計的方式で処理する。例えば、確率的に発生頻度の高いデータに対しては少ないビットを割り当て、確率的に発生頻度の低いデータには多いビットを割り当てることによって、全体的に転送効率を上げる役割を果たす。ただし、本発明は、上記の一般的なエントロピコーディングとは違い、前述したPBCコーディング及びDIFFコーディングと関連した効率的なエントロピコーディング方法を提案しようとする。
1−1.エントロピテーブル
エントロピコーディングのためには、既に定められたエントロピテーブルが必要となる。エントロピテーブルは、コードブックとも定義され、エンコーディング部とデコーディング部が同じテーブルを用いる。本発明は、様々な種類のデータコーディング結果を效率的に処理するために、エントロピコーディング方法及び特有のエントロピテーブルを提案する。以下、これについて詳細に説明する。
1−2.エントロピコーディング種類(1D/2D)
本発明のエントロピコーディングは、2種類に大別される。その一つは、エントロピテーブルを通じて一つのインデックス(index 1)を導出する過程であり、もう一つは、エントロピテーブルを通じて2個の連続したインデックス(index 1、index 2)を導出する過程である。以下、前者を1次元(以下、“1D”)エントロピコーディングといい、後者を2次元(以下、“2D”)エントロピコーディングという。
図18は、本発明による1D及び2Dエントロピテーブルの例示図である。基本的に、本発明のエントロピテーブルは、インデックスフィールド、長さフィールド及びコードワードフィールドで構成される。例えば、前述したデータコーディングによって特定データ(例えば、パイロット基準値、差分値など)が算出されると、該当のデータ(これは、“index”に該当する。)は、エントロピテーブルを通じて指定されたコードワードを持つようになり、コードワードは、ビットストリーム化されてデコーディング部に転送される。このコードワードを受信したエントロピデコーディング部は、該当のデータが使われたエントロピテーブルを決定し、決定されたテーブル内で対応するコードワード及びコードワードを構成するビット長を用いてインデックス“index”値を導出する。例えば、本発明では、コードワードを16進法で表示した。
1Dまたは2Dエントロピコーディングによって導出されるインデックス値は、負(−)または正(+)の符号が省略されている。したがって、1Dまたは2Dエントロピコーディングの後に符号を割り当てなければならない。本発明では、前記符号を割り当てる方法を、1Dと2Dの場合に異にして適用する。例えば、1Dエントロピコーディングの場合は、該当のインデックスが‘0’でないと、別の1ビットの符号ビット(例えば、、“bsSign”)を割り当てて転送する。2Dエントロピコーディングの場合は、2個のインデックスが連続して抽出されるので、前記抽出された2個のインデックス間の関連性をプログラム化し、符号ビットの割当するか否かを決定する。このプログラムは、抽出された2個のインデックスの和の値及び差分値と該当のエントロピテーブル内の最大絶対値(lav)を用いる。これにより、2Dの場合に、単に全てのインデックス毎に符号ビットを割り当てることに比べて転送ビット数を減らすことが可能になる。
1Dエントロピテーブルは、インデックスが一つずつ導出されるので、全てのデータコーディング結果に利用可能である。一方、2Dエントロピテーブルは、インデックスが一度に2個ずつ導出されるので、特定の場合には使用が制約されることができる。例えば、前述したグルーピング過程を通じたデータコーディングがペアでないと、2Dエントロピテーブルのうち一部は使用が制限される。また、PBCコーディングの結果として算出されたパイロット基準値に対しても、2Dエントロピテーブルの使用が制限される。すなわち、前述したように、本発明のエントロピコーディングは、データコーディングの結果と関連して最も効率的なエントロピコーディング方式を用いることに特徴がある。以下、これについて詳細に説明する。
1−3.2D方法(時間ペアリング/周波数ペアリング)
図19は、本発明による2Dエントロピコーディングの2つの方法の例示図である。2Dエントロピコーディングは、隣接する2個のインデックスを導出する過程であるから、前記連続した2個のインデックスの方向によって区分される。例えば、2個のインデックスが周波数方向に隣接した場合を、「2D−周波数ペアリング(Frequency Pairing)」(以下、2D−FP)という。また、2個のインデックスが時間方向に隣接した場合を、「2D−時間ペアリング(Time Pairing)」(以下、2D−TP)という。
図19に示すように、‘2D−FP'及び‘2D−TP’は、それぞれ別のインデックステーブルを構成することが可能である。エンコーダは、データコーディングされた結果によって最も効率的なエントロピコーディング方式を決定すべきである。以下、データコーディングに関連したエントロピコーディングの効率的な決定方法について説明する。
1−4.エントロピコーディング信号処理方法
以下、本発明によるエントロピコーディングを用いた信号処理方法を説明する。
本発明の信号処理方法は、まず、複数個のデータに対応する基準値とこの基準値に対応する差分値を獲得する。その後、前記差分値をエントロピデコーディングし、前記基準値及び前記エントロピデコーディングされた差分値を用いて、前記データを獲得する。なお、本発明は、前記基準値をエントロピデコーディングする過程をさらに含み、前記エントロピデコーディングされた基準値及び前記エントロピデコーディングされた差分値を用いて前記データを獲得する過程をさらに含むことができる。
また、エントロピコーディング識別情報を獲得する過程をさらに含むことができ、前記エントロピデコーディングは、前記エントロピコーディング識別情報が表すエントロピコーディング方式によって行われる。ここで、エントロピコーディング方式は、1Dコーディング方式と多次元(例えば、2D)コーディング方式のうちの一つであり、多次元コーディング方式は、周波数ペア(FP)コーディング方式と時間ペア(TP)コーディング方式のうちの一つである。なお、前記基準値は、パイロット基準値及び差分基準値のうちの一つになることができる。また、前記信号処理方法は、前記データをパラメータとして用いてオーディオ信号を復元する過程をさらに含むことができる。
また、本発明の信号処理装置は、複数個のデータに対応する基準値とこの基準値に対応する差分値を獲得する値獲得部と、前記差分値をエントロピデコーディングするエントロピデコーディング部と、前記基準値及び前記エントロピデコーディングされた差分値を用いて、前記データを獲得するデータ獲得部と、を含む。前記値獲得部は、前述したビットストリーム逆多重化部60内に含まれ、前記データ獲得部は、前述したデータデコーディング部91または92内に含まれる。
また、本発明の信号処理方法は、複数個のデータに対応する基準値と前記データを用いて差分値を生成する。その後、前記生成された差分値をエントロピエンコーディングと、前記エントロピエンコーディングされた差分値を出力する。前記信号処理方法は、前記基準値をエントロピエンコーディングし、前記エントロピエンコーディングされた基準値は転送される。また、前記エントロピエンコーディングに用いられたエントロピコーディング方式を生成する過程をさらに含み、前記生成されたエントロピコーディング方式は転送される。
また、本発明の信号処理装置は、複数個のデータに対応する基準値と前記データを用いて差分値を生成する値生成部と、前記生成された差分値をエントロピエンコーディングするエントロピエンコーディング部と、前記エントロピエンコーディングされた差分値を転送する出力部と、を含む。前記値生成部は、前述したデータエンコーディング部31または32内に含まれ、前記出力部は、前述したビットストリーム多重化部50内に含まれる。
また、本発明の他の信号処理方法は、複数個のデータコーディング方式に対応するデータを獲得し、データコーディング方式に固有なエントロピテーブル識別子を用いて、前記データに含まれたパイロット基準値及びパイロット差分値のうちの少なくとも一つに対するエントロピテーブルを決定する。その後、前記エントロピテーブルを用いて、パイロット基準値及びパイロット差分値のうちの少なくとも一つをエントロピデコーディングする。前記エントロピテーブル識別子は、パイロットコーディング方式、周波数差分コーディング方式及び時間差分コーディング方式のうちの一つに固有であることを特徴とする。また、前記エントロピテーブル識別子は、前記パイロット基準値及びパイロット差分値にそれぞれ固有であることを特徴とする。
前記エントロピテーブルは、前記エントロピテーブル識別子に固有であり、パイロットテーブル、周波数差分テーブル及び時間差分テーブルのうちの一つになることができる。また、前記エントロピテーブルは、前記エントロピテーブル識別子に固有であり、周波数差分テーブル及びタイム差分テーブルのうちの一つを共に使用しても良い。
また、前記パイロット基準値に対応するエントロピテーブルは、周波数差分テーブルを使用することができる。この場合、前記パイロット基準値は、前記一次元エントロピコーディング方式によってエントロピデコーディングされる。
前記エントロピコーディング方式は、1Dエントロピコーディング方式及び2Dエントロピコーディング方式を含む。特に、2Dエントロピコーディング方式は、周波数ペア(2D−FP)コーディング方式及び時間ペア(2D−TP)コーディング方式を含む。また、本発明は、前記データをパラメータとして用いてオーディオ信号を復元することができる。
また、本発明の他の信号処理装置は、複数個のデータに対応するパイロット基準値とこのパイロット基準値に対応するパイロット差分値を獲得する値獲得部と、前記パイロット差分値をエントロピデコーディングするエントロピデコーディング部と、を含む。また、前記パイロット基準値及び前記エントロピデコーディングされたパイロット差分値を用いて、前記データを獲得するデータ獲得部を含む。
また、本発明のさらに他の信号処理方法は、複数個のデータに対応するパイロット基準値と前記データを用いてパイロット差分値を生成し、前記生成されたパイロット差分値をエントロピエンコーディングする。その後、前記エントロピエンコーディングされたパイロット差分値を転送する。また、前記エントロピエンコーディングに用いられるテーブルは、パイロット専用テーブルでありうる。この方法は、前記パイロット基準値をエントロピエンコーディングする過程をさらに含み、前記エントロピエンコーディングされたパイロット基準値は転送される。
また、この方法は、前記エントロピエンコーディングに用いられたエントロピコーディング方式を生成する過程をさらに含み、前記生成されたエントロピコーディング方式は転送される。
また、本発明のさらに他の信号処理装置は、複数個のデータに対応するパイロット基準値と前記データを用いてパイロット差分値を生成する値生成部と、前記生成されたパイロット差分値をエントロピエンコーディングするエントロピエンコーディング部と、前記エントロピエンコーディングされたパイロット差分値を転送する出力部と、を含む。
2.データコーディングとの関係
前述したように、本発明は、3つのデータコーディング方式を説明した。この中で、PCM方式によるデータは、エントロピコーディングを行わない。以下、PBCコーディングとエントロピコーディングとの関係及びDIFFコーディングとエントロピコーディングとの関係をそれぞれ説明する。
2−1.PBCコーディングとエントロピコーディング
図20は、本発明によるPBCコーディング結果に対するエントロピコーディング方法を示す。前述したように、PBCコーディングを行った後には、一つのパイロット基準値と複数の差分値が算出され、前記パイロット基準値と差分値はいずれもエントロピコーディングの対象となる。
例えば、前述したグルーピング方法によって、PBCコーディングが適用されるグループが決定されるので、図20では説明の便宜上、時間軸上でペアである場合とノンペアである場合を取り上げた。以下、PBCコーディング実行後のエントロピコーディングについて説明する。
まず、PBCコーディングがノンペアで行われた場合83について説明する。エントロピコーディングの対象となる一つのパイロット基準値は、1Dエントロピコーディングを行い、残りの差分値は1Dエントロピコーディングまたは2D−FPエントロピコーディングが可能である。すなわち、ノンペアの場合、時間軸上に一つのデータセットに対する一つのグループのみが存在するので、2D−TPエントロピコーディングを行うことができなくなる。また、2D−FPを行う場合でも、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド81a内のパラメータ値は、1Dエントロピコーディングを行わなければならない。前記各データ別エントロピコーディング方式が決定されると、該当のエントロピテーブルを用いてコードワードを生成する。
ここで、本発明は、例えば、前記パイロット基準値が一つのグループに対して一つのみ生成される場合であるから、1Dエントロピコーディングを行わねばならない。ただし、本発明を適用した他の使用例で、一つのグループ内に2個以上のパイロット基準値を生成した場合では、連続したパイロット基準値に対して2Dエントロピコーディングを行うことも可能である。
次に、PBCコーディングがペアで行われた場合84について説明する。エントロピコーディングの対象となる一つのパイロット基準値は、1Dエントロピコーディングを行い、残りの差分値は1Dエントロピコーディング、2D−FPエントロピコーディングまたは2D−TPエントロピコーディングのいずれを行っても良い。すなわち、ペアの場合、時間軸上に隣接した2つのデータセットに対する一つのグループが存在するので、2D−TPエントロピコーディングも可能になる。また、2D−FPを行う場合においても、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド81b,81c内のパラメータ値は、1Dエントロピコーディングを行わなければならない。ただし、図20から確認できるように、2D−TPエントロピコーディングを適用する場合では、上記のようなペアを形成できない最後のバンドは存在しない。
2−2.DIFFコーディングとエントロピコーディング
図21は、本発明によるDIFFコーディング結果に対するエントロピコーディング方法を示す図である。前述したように、DIFFコーディングを行った後には一つの基準値と複数の差分値が算出され、前記基準値と差分値はいずれもエントロピコーディングの対象となる。ただし、DIFF−DTの場合は、基準値が存在しなくても良い。
例えば、前述したグルーピング方法によって、DIFFコーディングが適用されるグループが決定されるので、図21では、説明の便宜上、時間軸上にペアである場合とノンペアである場合を取り上げた。また、図21は、データコーディングの単位となるデータセットを、DIFFコーディング方向によって時間軸方向のDIFF−DTと、周波数軸方向のDIFF−DFとに区分した場合を示す。以下、DIFFコーディングを行った後のエントロピコーディングについて説明する。
まず、DIFFコーディングがノンペアで行われた場合について説明する。すなわち、ノンペアの場合、時間軸上に一つのデータセットが存在し、このデータセットは、DIFFコーディング方向によって、DIFF−DFまたはDIFF−DTとなることができる。
例えば、ノンペアの一つのデータセットが、DIFF−DFである場合(85)、基準値は、第1バンド82a(これを‘First band’という。)内のパラメータ値となる。この基準値は1Dエントロピコーディングを行い、残りの差分値は1Dエントロピコーディングまたは2D−FPエントロピコーディングを行うことが可能である。すなわち、ノンペアで且つDIFF−DFである場合、時間軸上に一つのデータセットに対する一つのグループのみが存在するので、2D−TPエントロピコーディングを行うことができなくなる。また、2D−FPを行う場合でも、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド83a内のパラメータ値は、1Dエントロピコーディングを行わなければならない。前記各データ別エントロピコーディング方式が決定されると、対応するエントロピテーブルを用いてコードワードを生成する。
また、例えばノンペアの一つのデータセットがDIFF−DTである場合(86)、基準値は、該当のデータセット内に存在しないので、‘First band'処理は行わない。したがって、全ての差分値は1Dエントロピコーディングまたは2D−FPエントロピコーディングを行うことができる。ここで、ノンペアで且つDIFF−DTである場合に、差分値を求めるためのデータセットは、データペアを構成しない隣接したデータセットまたは他のオーディオフレーム内のデータセットでありうる。すなわち、ノンペアで且つDIFF−DTである場合(86)、時間軸上に一つのデータセットに対する一つのグループのみが存在するので、2D−TPエントロピコーディングを行うことができなくなる。また、2D−FPを行う場合でも、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド内のパラメータ値は、1Dエントロピコーディングを行わなければならない。ただし、図21では、単に、ペアを形成できない最後のバンドが存在しない場合を取り上げている。前記各データ別エントロピコーディング方式が決定されると、対応するエントロピテーブルを用いてコードワードを生成する。
次に、DIFFコーディングがペアで行われた場合について説明する。すなわち、データコーディングがペアの場合、時間軸上に2個のデータセットが一つのグループを構成し、前記グループ内の各データセットは、DIFFコーディング方向によって、DIFF−DFまたはDIFF−DTとなることができる。したがって、ペアをなす2個のデータセットがいずれもDIFF−DFである場合(87)と、ペアをなす2個のデータセットがいずれもDIFF−DTである場合(89)と、ペアをなす2個のデータセットが相互に異なるコーディング方向を持つ場合(88)(例えば、DIFF−DF/DTまたはDIFF−DT/DF)とに区分できる。
例えば、ペアの2個のデータセットがいずれもDIFF−DFである場合(87)(すなわち、DIFF−DF/DF)、基本的に、各データセットは前述したノンペアであり且つデータセットがDIFF−DFの場合に適用可能な全てのエントロピコーディング方式を行うことができる。例えば、該当のデータセット内のそれぞれの基準値は、‘First band’82b,82c内のパラメータ値となり、この基準値には1Dエントロピコーディングが行われる。残りの差分値は、1Dエントロピコーディングまたは2D−FPエントロピコーディングを行うことができる。また、対応するデータセット内で2D−FPを行う場合でも、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド83b,83c内のパラメータ値は、1Dエントロピコーディングを行わなければならない。また、2個のデータセットがペアであるので、2D−TPエントロピコーディングも行うことができる。この場合、該当のデータセット内の‘First band’82b,82cを除外した次のバンドから最後のバンドまで順次に2D−TPエントロピコーディングを行う。2D−TPエントロピコーディングを行うと、ペアを形成できない最後のバンドは生成されない。前記各データ別エントロピコーディング方式が決定されると、対応するエントロピテーブルを用いてコードワードを生成する。
また、例えば、ペア)の2個のデータセットがいずれもDIFF−DTである場合(89)(すなわち、DIFF−DT/DT)、例えば、基準値は、該当のデータセット内に存在しないので、‘First band’処理は行わない。また、それぞれのデータセット内の全ての差分値に対して、1Dエントロピコーディングまたは2D−FPエントロピコーディングを行うことができる。該当のデータセット内で2D−FPを行う場合でも、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド内のパラメータ値は1Dエントロピコーディングを行わなければならない。ただし、図21では、単に、ペアを形成できない最後のバンドが存在しない場合を取り上げている。また、2個のデータセットがペアであるから、2D−TPエントロピコーディングも行うことができる。この場合、該当のデータセット内の最初のバンドから最後のバンドまで順次に2D−TPエントロピコーディングを行う。2D−TPエントロピコーディングを行うと、ペア)を形成できない最後のバンドは生成されない。前記各データ別エントロピコーディング方式が決定されると、対応するエントロピテーブルを用いてコードワードを生成する。
また、例えば、ペアの2個のデータセットが相互に異なるコーディング方向を持つ場合(88)(すなわち、DIFF−DF/DTまたはDIFF−DT/DF)が存在可能である。図21では、DIFF−DF/DTである場合を取り上げている。この場合、それぞれのデータセットは、基本的に、該当のコーディングタイプによって適用可能な全てのエントロピコーディング方式を行うことができる。
例えば、ペアを構成する2個のデータセットのうち、DIFF−DFであるデータセットは、該当のデータセット(DIFF−DF)内の基準値で‘First band’82d内のパラメータ値を1Dエントロピコーディングする。残りの差分値には、1Dエントロピコーディングまたは2D−FPエントロピコーディングを行うことができる。また、該当のデータセット(DIFF−DF)内で2D−FPを行う場合でも、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド83d内のパラメータ値には1Dエントロピコーディングを行わなければならない。
また、例えば、ペアを構成する2個のデータセットのうち、DIFF−DTであるデータセットは、基準値が存在しないので、‘First band’処理は行わない。該当のデータセット(DIFF−DT)内の全ての差分値は、1Dエントロピコーディングまたは2D−FPエントロピコーディングを行うことができる。該当のデータセット(DIFF−DT)内で2D−FPを行う場合でも、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド内のパラメータ値は1Dエントロピコーディングを行わなければならない。ただし、図21では、単に、ペアを形成できない最後のバンドが存在しない場合を取り上げている。
また、ペアの2個のデータセットが相互に異なるコーディング方向を持つ場合(DIFF−DF/DTまたはDIFF−DT/DF)であるので、2D−TPエントロピコーディングも行うことができる。この場合、前記‘First band’82dを含む第1バンドを除外した、次のバンドから最後のバンドまで順次に2D−TPエントロピコーディングを行う。2D−TPエントロピコーディングを行うと、ペアを形成できない最後のバンドは生成されない。前記各データ別エントロピコーディング方式が決定されると、対応するエントロピテーブルを用いてコードワードを生成する。
2−3.エントロピコーディングとグルーピング
前述したように、2D−FPまたは2D−TPエントロピコーディングの場合、一つのコードワードを用いて2個のインデックスを抽出する。したがって、これは、前記エントロピコーディングにグルーピング方式が行われたことを意味する。これを「時間グルーピング」及び「周波数グルーピング」と呼ぶことができる。
例えば、エンコーディング部は、データコーディング段階で抽出された2個のインデックスを、周波数方向または時間方向にグルーピングする。その後、エンコーディング部は、前記グルーピングされた2個のインデックスを表現する一つのコードワードをエントロピテーブルを用いて選定し、これをビットストリームに含めて転送する。デコーディング部は、前記ビットストリーム内に含まれた2個のインデックスをグルーピングした一つのコードワードを受信し、適用されたエントロピテーブルを確認し、2個のインデックス値を抽出する。
2−4.データコーディングとエントロピコーディングとの関係による信号処理方法
以下、前述したPBCコーディングとエントロピコーディングとの関係及びDIFFコーディングとエントロピコーディングとの関係による本発明の信号処理方法の特徴について説明する。
本発明の信号処理方法は、差分情報を獲得し、時間グルーピング及び周波数グルーピングを含むエントロピコーディング方式によって、前記差分情報をエントロピデコーディングする。また、パイロット差分、時間差分及び周波数差分を含むデータコーディング方式によって、前記差分情報をデータデコーディングする。データコーディングとエントロピコーディングの具体的な関連性は、前述した内容と同様である。
また、本発明の他の信号処理方法は、デジタル信号を獲得し、前記デジタル信号をエントロピコーディング方式によってエントロピデコーディングする。また、少なくともパイロットコーディング方式を含めた複数個のデータコーディング方式のうちの一つによって、前記エントロピデコーディングされたデジタル信号をデータデコーディングする。この場合、前記データコーディング方式によって前記エントロピコーディング方式を定めることができる。
また、本発明の他の信号処理装置は、デジタル信号を獲得する信号獲得部と、前記デジタル信号をエントロピコーディング方式によってエントロピデコーディングするエントロピデコーディング部と、少なくともパイロットコーディング方式を含む複数個のデータコーディング方式のうちの一つによって、前記エントロピデコーディングされたデジタル信号をデータデコーディングするデータデコーディング部と、を含む。
また、本発明のさらに他の信号処理方法は、デジタル信号をデータコーディング方式によってデータエンコーディングし、前記データエンコーディングされたデジタル信号をエントロピコーディング方式によってエントロピエンコーディングする。また、前記エントロピエンコーディングされたデジタル信号を転送する。同様に、前記データコーディング方式によって前記エントロピコーディング方式を定めることができる。
また、本発明のさらに他の信号処理装置は、デジタル信号をデータコーディング方式によってデータエンコーディングするデータエンコーディング部と、前記データエンコーディングされたデジタル信号をエントロピコーディング方式によってエントロピエンコーディングするエントロピエンコーディング部と、を含む。さらに、前記エントロピエンコーディングされたデジタル信号を転送する出力部を含むことができる。
3.エントロピテーブルの選択
エントロピコーディングのためのエントロピテーブルは、データコーディング方式及びエントロピの対象となるデータの種類によって自動で決定される。例えば、データ種類がCLDパラメータであり、エントロピコーディングの対象がパイロット基準値である場合、エントロピコーディングは、‘hcodPilot_CLD’とテーブル名が付いた1Dエントロピテーブルを用いる。
また、データの種類がCPCパラメータであり、データコーディングはDIFF−DFであり、エントロピコーディングの対象が第1バンド値である場合、エントロピコーディングは、‘hcodFirstband_CPC’とテーブル名が付いた1Dエントロピテーブルを用いる。
また、データの種類がICCパラメータであり、データコーディング方式がPBCであり、エントロピコーディングが2D−TPで行われる場合、エントロピコーディングは‘hcod2D_ICC_PC_TP_LL’とテーブル名が付いた2D−PC/TPエントロピテーブルを用いる。この場合、2Dエントロピテーブル名内の‘LL’は、テーブル内の最大絶対値(以下、‘LAV(Largest Absolute Vaule)’)を意味する。この最大絶対値(LAV)については後述する。
また、データの種類がICCパラメータであり、データコーディング方式がDIFF−DFであり、エントロピコーディングが2D−FPで行われる場合、エントロピコーディングは、‘hcod2D_ICC_DF_FP_LL’とテーブル名の付いた2D−FPエントロピテーブルを用いる。
すなわち、複数のエントロピテーブルのうちのいずれのテーブルを用いてエントロピコーディングを行うかは、非常に重要な問題である。また、各エントロピの対象となる各データの特性に合うエントロピテーブルを独立して構成することが好ましい。しかし、類似な属性を持つデータに対するエントロピテーブルは混用しても良い。その代表例として、データタイプが‘ADG’または‘ATD’である場合、前述したCLD用エントロピテーブルを適用することができる。また、PBCコーディングのパイロット基準値には、前述した‘First band’用エントロピテーブルを適用することができる。以下、最大絶対値(LAV)を用いたエントロピテーブルの選択方法について詳細に説明する。
3−1.エントロピテーブルの最大絶対値(LAV)
図22は、本発明によるエントロピテーブル選択方法を説明するための図である。図22の(a)は、複数個(n個)のエントロピテーブルを示し、図22の(b)は、前記エントロピテーブルを選択するためのテーブルを示す。
前述したように、エントロピテーブルは、データコーディング及びデータの種類によって複数個存在する。例えば、これらのエントロピテーブルは、データの種類が‘xxx’の場合に適用可能なエントロピテーブル(例えば、テーブル1〜4)、データの種類が‘yyy’の場合に適用可能なエントロピテーブル(例えば、テーブル5〜8)、PBC専用エントロピテーブル(例えば、テーブルk〜k+1)、後述するエスケープ用エントロピテーブル(例えば、テーブルn−2〜n−1)、及び、後述する最大絶対値インデックス(LAV Index)用エントロピテーブル(例えば、テーブルn)を含むことができる。
特に、前記データの種類別エントロピテーブルは、対応するデータで発生可能な全てのインデックスにコードワードを与えてテーブルを構成することが好ましい。しかし、このようにエントロピテーブルを構成する場合、テーブルの容量が大きすぎになるだけでなく、不必要なまたはほとんど発生しないインデックスも管理せねばならないという不便さがある。特に、このような問題点は、2Dエントロピテーブルの場合に、発生の場合の数が多すぎるので、より不便を招く。これを解決するために前述の最大絶対値(LAV)を用いる。
例えば、特定データの種類(例えば、CLD)に対してインデックス値の範囲を“−X〜+X(X=15)”と仮定すれば、この範囲内で確率的に発生頻度が高い最大絶対値(LAV)を少なくとも一つ以上選定し、これを別途テーブルとして構成できる。より具体的には、例えば、上記の場合でCLD用エントロピテーブルを構成するにおいて、“LAV=3”のテーブル、“LAV=5”のテーブル、“LAV=7”のテーブル、“LAV=9”のテーブルをそれぞれ備えることができる。例えば、図22の(a)でテーブル1(91a)がCLD用“LAV=3”のテーブルを意味し、テーブル2(91b)はCLD用“LAV=5”のテーブルを意味し、テーブル3(91c)はCLD用“LAV=7”のテーブルを意味し、テーブル4(91d)はCLD用“LAV=9”のテーブルを意味することと設定可能である。前記LAVテーブル内でLAV範囲を外れるインデックスは、エスケープ用エントロピテーブル(例えば、テーブルn−2〜n−1)によって処理される。例えば、CLD用“LAV=7”のテーブル(91c)を使用してコーディングする際に、最大値‘7’を外れるインデックス(例えば、‘8,9,…,15’)が発生すると、該当のインデックスは、エスケープ用エントロピテーブル(例えば、テーブルn−2〜n−1)によって別途処理される。
同様に、他のデータの種類(例えば、ICC、CPCなど)にも前記CLD用テーブルと同じ方式でLAVテーブルを設定可能である。ただし、各データ別LAVはお互いに相異値を持つこととなり、これはデータの種類別範囲が相互に異なるためである。具体的には、例えば、ICC用エントロピテーブルを構成するにおいて、“LAV=1”のテーブル、“LAV=3”のテーブル、“LAV=5”のテーブル、“LAV=7”のテーブルをそれぞれ備えることができる。また、CPC用エントロピテーブルを構成するにおいて、“LAV=3”のテーブル、“LAV=6”のテーブル、“LAV=9”のテーブル、“LAV=12”のテーブルをそれぞれ備えることができる。
3−2.最大絶対値インデックス(LAV Index)用エントロピテーブル
本発明は、LAVを用いてエントロピテーブルを選択するために、最大絶対値インデックス(LAV Index)を用いる。すなわち、図22の(b)を参照すると、データタイプ別LAV値は、再びLAVインデックス(LAV Index)によって区別される。すなわち、最後に使われるエントロピテーブルを選択するためには、まず、該当のデータタイプ別‘LAV Index’を確認し、その後、‘LAV Index’に該当する‘LAV'を確認しなければならない。前記最後に確認された‘LAV'値は、前述したエントロピテーブル名の構成において‘LL’に該当する。例えば、データの種類がCLDパラメータであり、データコーディング方式がDIFF−DFであり、エントロピコーディングが2D−FPで行われ、‘LAV=3’である場合、エントロピコーディングは、‘hcod2D_CLD_DF_FP_03’とテーブル名の付いたエントロピテーブルを用いることになる。
前記データタイプ別‘LAV Index’の確認において、本発明は、‘LAV Index'用エントロピテーブルを別途使用することに特徴がある。これは、‘LAV Index’自体をエントロピコーディングの対象として処理するということを意味する。例えば、図22の(a)でテーブルnが‘LAV Index’用エントロピテーブル91eとして使われる。これは、表1で示される。
Figure 2011209741
これは、前記‘LAV Index'値自体も統計的に使用頻度が互いに異なるというのを意味する。例えば、‘LAV Index=0’が最も使用頻度数が高いので、これに1ビットを割り当てる。次に使用頻度の高い‘LAV Index=1’には2ビットを割り当てる。最後に使用頻度の低い‘LAV Index=2、3’にはそれぞれ3ビットを割り当てる。
したがって、上記のように‘LAV Index’用エントロピテーブル91eを使用しない場合は、4つの‘LAV Index’を区分するために、LAVエントロピテーブルを用いる度に‘2ビット’の識別情報を転送しなければならない。しかし、本発明の‘LAV Index’用エントロピテーブル91eを用いると、例えば、発生頻度が60%以上である‘LAV Index=0’の場合に対して「1ビット」コードワードのみを転送すればいいので、以前方式に比べて転送効率がより高められる。
ここで、前記キップ1の‘LAV Index’用エントロピテーブル91eは、4つの‘LAV Index’に対して適用した場合であるが、‘LAV Index’がそれよりも多い場合には、より転送効率が上げられることは自明である。
3−3.エントロピテーブル選択を用いた信号処理方法
以下、前述したエントロピテーブル選択を用いた信号処理方法及び装置について説明する。
本発明の信号処理方法は、インデックス情報を獲得し、前記インデックス情報をエントロピデコーディングし、前記エントロピデコーディングされたインデックス情報に該当するコンテンツを識別する過程を含む。前記インデックス情報は、確率的な利用頻度特性を持つインデックスに関する情報である。また、前述したように、インデックス専用エントロピテーブル91eを用いて前記インデックス情報をエントロピデコーディングする。前記コンテンツは、データの種類別に分類され、データのデコーディングに用いられる。また、前記コンテンツは、グルーピング情報になることができ、前記グルーピング情報は、複数個のデータのグルーピングに関する情報である。また、前記エントロピテーブルのインデックスは、前記エントロピテーブルに含まれたインデックスのうち最大絶対値(LAV)であることを特徴とする。また、前記エントロピテーブルは、前記パラメータを2次元エントロピデコーディングする時に用いられる。
また、本発明の信号処理装置は、インデックス情報を獲得する情報獲得部と、前記インデックス情報をエントロピデコーディングするデコーディング部と、前記エントロピデコーディングされたインデックス情報に該当するコンテンツを識別する識別部と、を含む。
また、本発明の他の信号処理方法は、コンテンツを識別するインデックス情報を生成し、前記インデックス情報をエントロピエンコーディングする。その後、前記エントロピエンコーディングされたインデックス情報を転送する。
また、本発明の他の信号処理装置は、コンテンツを識別するインデックス情報を生成する情報生成部と、前記インデックス情報をエントロピエンコーディングするエンコーディング部と、前記エントロピエンコーディングされたインデックス情報を送る情報出力部と、を含む。
また、本発明のさらに他の信号処理方法は、差分値とインデックス情報を獲得し、前記インデックス情報をエントロピデコーディングし、前記エントロピデコーディングされたインデックス情報に該当するエントロピテーブルを識別し、前記識別されたエントロピテーブルを用いて、前記差分値をエントロピデコーディングする過程を含む。その後、複数個のデータに対応する基準値と前記デコーディングされた差分値を用いて前記データを獲得する。前記基準値は、パイロット基準値または差分基準値でありうる。また、インデックス専用エントロピテーブルを用いて前記インデックス情報をエントロピデコーディングし、前記エントロピテーブルは、前記データの種類別に分類される。
また、前記データはパラメータであり、上記方法は、前記パラメータを用いてオーディオ信号を復元する過程をさらに含む。また、前記差分値をエントロピデコーディングする場合、前記エントロピテーブルを用いて前記差分値を2次元エントロピデコーディングする。また、上記方法は、前記基準値を獲得し、前記基準値専用エントロピテーブルを用いて前記基準値をエントロピデコーディングする過程をさらに含むことができる。
また、本発明のさらに他の信号処理装置は、差分値とインデックス情報を獲得する入力部と、前記インデックス情報をエントロピデコーディングするインデックスデコーディング部と、前記エントロピデコーディングされたインデックス情報に該当するエントロピテーブルを識別するテーブル識別部と、前記エントロピテーブルを用いて、前記差分値をエントロピデコーディングするデータデコーディング部と、を含む。また、複数個のデータに対応する基準値と前記デコーディングされた差分値を用いて前記データを獲得するデータ獲得部をさらに含む。
また、本発明のさらに他の信号処理方法は、複数個のデータに対応する基準値と前記データを用いて差分値を生成し、エントロピテーブルを用いて差分値をエントロピエンコーディングし、前記エントロピテーブルを識別するインデックス情報を生成する過程を含む。また、前記インデックス情報をエントロピエンコーディングする過程及び前記エントロピエンコーディングされたインデックス情報と前記差分値を送る過程をさらに含む。
本発明のさらに他の信号処理装置は、複数個のデータに対応する基準値と前記データを用いて差分値を生成する値生成部と、エントロピテーブルを用いて差分値をエントロピエンコーディングする値エンコーディング部と、前記エントロピテーブルを識別するインデックス情報を生成する情報生成部と、前記インデックス情報をエントロピエンコーディングするインデックスエンコーディング部と、を含む。この装置は、前記エントロピエンコーディングされたインデックス情報と前記差分値を送る情報出力部をさらに含む。
[データ構造]
以下、前述した本発明のデータコーディング、グルーピング及びエントロピコーディングに関連した様々な情報を含むデータ構造について説明する。図23は、本発明が適用されるデータ構造を階層的に示す。
本発明のデータ構造は、ヘッダ100と複数のフレーム101,102とを含む。ヘッダ100内には、下位フレーム101,102に共通して適用される構成情報が含まれる。構成情報は、前述したグルーピングに用いられるグルーピング情報を含む。このグルーピング情報は、例えば、第1タイムグルーピング情報100a、第1周波数グルーピング情報100b及びチャンネルグルーピング情報100cを含む。ここで、前記ヘッダ内の構成情報を「メイン構成情報」という。また、フレーム内に記録される情報部分を「ペイロード」という。
より具体的に、本発明のデータ構造をオーディオ空間情報に適用した場合を取り上げて説明する。例えば、ヘッダ100内の第1タイムグルーピング情報100aは、“bsFrameLength”フィールドとなり、これは、フレーム内タイムスロットの個数を指定する情報である。また、第1周波数グルーピング情報100bは、“bsFreqRes”フィールドとなり、これは、フレーム内パラメータバンド数を指定する情報である。また、チャンネルグルーピング情報100cは、“OttmodeLFE−bsOttBands”フィールド及び“bsTttDualmode−bsTttBandsLow”フィールドを意味する。この“OttmodeLFE−bsOttBands”フィールドは、LFEチャンネルに適用されるパラメータバンド数を指定する情報であり、“bsTttDualmode−bsTttBandsLow”フィールドは、低周波帯域及び高周波帯域の両方を持つデュアルモード内の低周波帯域のパラメータバンド数を指定する情報である。ただし、“bsTttDualmode−bsTttBandsLow”フィールドは、チャンネルグルーピング情報ではなく周波数グルーピング情報として分類されることができる。
また、それぞれのフレームは、フレーム内の全てのグループに共通して適用されるフレーム情報(Frame Info)101aと複数のグループ101b,101cを含む。フレーム情報(Frame Info)101aは、時間選択情報103a、第2時間グルーピング情報103b及び第2周波数グルーピング情報103cを含む。ここで、フレーム情報101aは、各フレーム別に適用される「サブ構成情報」ともいう。
より具体的に、本発明のデータ構造をオーディオ空間情報に適用した場合を取り上げて説明すると、次の通りである。例えば、フレーム情報101a内の時間選択情報103aは、“bsNumParamset”フィールド、“bsParamslot”フィールド及び“bsDataMode”フィールドを含む。“bsNumParamset”フィールドは、全体フレーム内に存在するパラメータセットの個数を指定する情報である。また、“bsParamslot”フィールドは、パラメータセットが存在するタイムスロットの位置を指定する情報である。
また、“bsDataMode”フィールドは、前記各パラメータセットのエンコーディング及びデコーディング処理方法を指定する情報である。例えば、特定パラメータセットの“bsDataMode=0”(例えば、「デフォルトモード」)である場合、デコーディング部は、該当のパラメータセットをデフォルト値に取り替える。また、特定パラメータセットの“bsDataMode=1”(例えば、「先モード」)である場合、デコーディング部は、先パラメータセットのデコーディング値を保持する。また、特定パラメータセットの“bsDataMode=2”(例えば、「補間モード」)である場合、デコーディング部は、パラメータセット間の補間を通じて対応するパラメータセットを算出する。最後に、特定パラメータセットの“bsDataMode=3”(例えば、「読取モード」)である場合、対応するパラメータセットに対するコーディングデータが転送されるということを意味する。したがって、フレーム内の複数のグループ101b,101cは、“bsDataMode=3”(例えば、「読取モード」)である場合に転送されるデータで構成されるグループである。したがって、デコーディング部は、“bsDataMode=3”である場合、後述する各グループ内のコーディングタイプ情報を参照してデータをデコーディングする。
次いで、前記“bsDataMode”フィールドを用いた本発明の信号処理方法及び装置について具体的に説明する。
前記“bsDataMode”フィールドを用いた本発明の信号処理方法は、モード情報を獲得する段階と、前記モード情報が表すデータの属性によって、複数個のデータに対応するパイロット基準値と前記パイロット基準値に対応するパイロット差分値を獲得する段階と、前記パイロット基準値と前記パイロット差分値を用いて前記データを獲得する段階と、を含む。また、この信号処理方法で、前記データはパラメータであり、前記パラメータを用いてオーディオ信号を復元する段階をさらに含む。また、前記モード情報が読取モードを表す場合、パイロット差分値を獲得する。前記モード情報は、デフォルトモード、先モード、補間モードのうち少なくとも一つをさらに含む。また、この信号処理方法は、前記パイロット差分値をグループバンド別に獲得する。また、この信号処理方法は、前記読取モードの個数を識別するための第1変数(例えば、‘dataset’)及びこの第1変数に基づいて、パイロット差分値を獲得するための第2変数(例えば、‘setidx’)を用いる。
また、“bsDataMode”フィールドを用いた本発明の信号処理装置は、モード情報を獲得する情報獲得部と、前記モード情報が表すデータの属性によって、複数個のデータに対応するパイロット基準値と前記パイロット基準値に対応するパイロット差分値を獲得する値獲得部と、前記パイロット基準値と前記パイロット差分値を用いて前記データを獲得するデータ獲得部と、を含む。前記値獲得部、パラメータ決定部及びデータ獲得部は、前述したデータデコーディング部91または92内に備えられる。
また、“bsDataMode”フィールドを用いた本発明の他の信号処理方法は、データの属性を表すモード情報を生成する段階と、前記データの属性によって複数個のデータに対応するパイロット基準値と前記データを用いてパイロット差分値を生成する段階と、前記生成された差分値を転送する段階と、を含む。この信号処理方法は、前記生成された差分値をエンコーディングする段階をさらに含む。
“bsDataMode”フィールドを用いた本発明の他の信号処理装置は、データの属性を表すモード情報を生成する情報生成部と、前記データの属性によって複数個のデータに対応するパイロット基準値と前記データを用いてパイロット差分値を生成する値生成部と、前記生成された差分値を転送する出力部と、を含む。前記値生成部は、前述したデータエンコーディング部31または32内に備えられる。
また、フレーム情報101a内の第2タイムグルーピング情報103bは、“bsDatapair”フィールドを含む。この“bsDatapair”フィールドは、“bsDataMode=3”によって指定されたデータセット間のペアの有無を指定する情報である。すなわち、“bsDatapair”フィールドによって2つのデータセットが1つのグループにグルーピングされる。
また、フレーム情報101a内の第2周波数グルーピング情報103cは、“bsFreqResStride”フィールドを含む。この“bsFreqResStride”フィールドは、前述した第1周波数グルーピング情報100bとして“bsFreqRes”フィールドによって1次グルーピングされたパラメータバンドを2次グルーピングする情報である。すなわち、“bsFreqResStride”フィールドによって指定された幅(stride)ずつパラメータバンドをまとめてデータバンドを生成する。これらのデータバンド別にパラメータ値が与えられる。
また、それぞれのグループ101b,101cは、データコーディングタイプ情報104a、エントロピコーディングタイプ情報104b、コードワード104c及び付加データ104dを含む。
より具体的に、本発明のデータ構造をオーディオ空間情報に適用した場合を取り上げて説明すると、次の通りである。例えば、各グループ101b,101c内のデータコーディングタイプ情報104aは、“bsPCMCoding”フィールド、“bsPilotCoding”フィールド、“bsDiffType”フィールド及び“bdDiffTimeDirection”フィールドを含む。“bsPCMCoding”フィールドは、対応するグループのデータコーディングがPCM方式かまたはDIFF方式かを識別する情報である。また、“bsPCMCoding”フィールドがPCM方式を指定する場合に限って、“bsPilotCoding”フィールドによってPBC方式か否かが指定される。また、“bsDiffType”フィールドは、DIFF方式が適用される場合にコーディング方向を指定する情報であり、‘DF:DIFF−FREQ’及び‘DT:DIFF−TIME’のうちのいずれか一つを指定する。また、“bdDiffTimeDirection”フィールドは、“bsDiffType”フィールドが‘DT'の場合に、時間軸上のコーディング方向が‘FORWARD’か、或いは、‘BACKWARD’かを指定する情報である。
また、各グループ101b,101c内のエントロピコーディングタイプ情報104bは、“bsCodingScheme”フィールド及び“bsPairing”フィールドを含む。“bsCodingScheme”フィールドは、エントロピコーディングが、1Dか或いは2Dかを指定する情報である。また、“bsPairing”フィールドは、“bsCodingScheme”フィールドが‘2D’を指定する場合に、2個のインデックスを抽出する方向が周波数方向なのか(FP;周波数ペアリング)、時間方向なのか(TP;時間ペアリング)を指定する情報である。
また、各グループ101b,101c内のコードワード104cは、“bsCodeW”フィールドを含み、この“bsCodeW”フィールドは、エントロピコーディングのために適用されたテーブル上のコードワードを指定する。したがって、前述した大部分のデータは、エントロピコーディングの対象となり、この場合、“bsCodeW”フィールドによって転送される。例えば、エントロピコーディングの対象となるPBCコーディングのパイロット基準値、‘LAV Index’値も全て“bsCodeW”フィールドによって転送される。
また、各グループ101b,101c内の付加データ104dは、“bsLsb”フィールド及び“bsSign”フィールドを含む。特に、付加データ104dは、“bsLsb”フィールド及び“bsSign”フィールドの他にも、エントロピコーディングされて“bsCodeW”フィールドによって転送されないその他全てのデータを含む。“bsLsb”フィールドは、前述した部分パラメータに適用されるフィールドで、データタイプが‘CPC’であり、かつ、粗量子化でない場合に限って転送される付加情報である。また、“bsSign”フィールドは、1Dエントロピコーディングが適用された場合に抽出されたインデックスの符号を指定する情報である。また、付加データ104dには、PCM方式で転送されるデータが含まれる。
以下、本発明による信号処理用データ構造の特徴について説明する。本発明の信号処理用データ構造は、フレーム別にパイロットコーディング情報を少なくとも含むデータコーディング情報及びエントロピコーディング情報のうちの少なくとも一つを有するペイロード部分と、このペイロード部分に関するメイン構成情報を有するヘッダ部分と、を含む。
また、メイン構成情報は、全体フレームに関する時間情報を持つ第1時間情報部分と、全体フレームに関する周波数情報を持つ第1周波数情報部分と、を含む。また、このメイン構成情報は、複数個のデータを含む任意のグループを内部グルーピングする情報をフレーム別に有する第1内部グルーピング情報部分をさらに含む。
また、前記フレームは、グループ別に前記データコーディング情報及び前記エントロピコーディング情報のうちの少なくとも一つを有する第1データ部分と、この第1データ部分に関するサブ構成情報を有するフレーム情報部分と、を含む。ここで、サブ構成情報は、全体グループに関する時間情報を有する第2時間情報部分を含む。また、サブ構成情報は、複数個のデータを含む任意のグループに関する外部グルーピングの情報をグループ別に有する外部グルーピング情報部分をさらに含む。また、サブ構成情報は、複数個のデータを含む任意のグループを内部グルーピングする情報をグループ別に有する第2内部グルーピング情報部分をさらに含む。
また、前記グループは、データコーディング方式に関する情報を有するデータコーディング情報と、エントロピコーディング方式に関する情報を有するエントロピコーディング情報と、複数個のデータに対応する基準値及びこの基準値と前記データを用いて生成された差分値を有する第2データ部分と、を含む。
[オーディオコーディング(MPEG SURROUND)への適用]
以下、前述した本発明の概念及び特徴を統合して適用した一例について説明する。
図24は、本発明の一実施例によるオーディオ圧縮及び復元のための装置構成を示す図である。図24を参照すると、全体装置構成は、オーディオ圧縮のための部分105〜400とオーディオ復元のための部分500〜800とを含む。
圧縮のための部分105〜400は、ダウンミキシング部105、コアコーディング部200、空間情報コーディング部300及び多重化部400を含む。ダウンミキシング部105は、チャンネルダウンミキシング部110と空間情報生成部120とを含んで構成される。
ダウンミキシング部105において、チャンネルダウンミキシング部110の入力は、N個のマルチャンネル(X1,X2,…,XN)のオーディオ信号と、そのオーディオ信号である。チャンネルダウンミキシング部110は、定められたダウンミックス方式を用いて上記した入力のチャンネル個数よりも少ない個数のチャンネルにダウンミックスされた信号を出力する。ダウンミキシング部105の出力を、1つまたは2つのチャンネルにダウンミックスし、別のダウンミックス命令に応じて特定個数のチャンネルにダウンミックスし、または、システム実現上あらかじめ設定された特定個数のチャンネルにダウンミックスすることができる。
コアコーディング部200は、チャンネルダウンミキシング部110の出力、すなわち、ダウンミックスされたオーディオ信号に対してコアコーディングを行う。コアコーディングは、離散変換方式のような様々な変換方式を用いて入力を圧縮する。
空間情報生成部120は、マルチャンネルのオーディオ信号から空間情報を抽出する。そして、抽出した空間情報を、空間情報コーディング部300に送信する。
空間情報コーディング部300は、入力された空間情報に対するデータコーディングとエントロピコーディングを行う。空間情報コーディング部300は、データコーディングとして前述のPCM、PBC及びDIFFのうちの少なくとも一つを行い、場合によっては、エントロピコーディングをさらに行う。この空間情報コーディング部300でどんなデータコーディング方式を使用したかによって、空間情報デコーディング部700でのデコーディング方式を決定することができる。この空間情報コーディング部300の詳細は、図25を参照して後述する。
コアコーディング部200の出力と空間情報コーディング部300の出力は、多重化部400に入力される。多重化部400は、前記2つの入力を多重化したビットストリームを、オーディオ復元のための部分500〜800に転送する。
オーディオ復元のための部分500〜800は、逆多重化部500、コアデコーディング部600、空間情報デコーディング部700及びマルチチャンネル生成部800を含む。
逆多重化部500は、受信したビットストリームをオーディオ部分と空間情報部分とに逆多重化する。ここで、オーディオ部分は、圧縮されたオーディオ信号であり、空間情報部分は、圧縮された空間情報である。
コアデコーディング部600は、逆多重化部500から、圧縮されたオーディオ信号を受信する。コアデコーディング部600は、圧縮されたオーディオ信号に対するデコーディングを行い、ダウンミックスされたオーディオ信号を生成する。
空間情報デコーディング部700は、逆多重化部500から、圧縮された空間情報を受信する。空間情報デコーディング部700は、圧縮された空間情報に対するデコーディングを行い、空間情報を生成する。
この時、受信したビットストリームから、前述した図23のデータ構造内に含まれた様々なグルーピング情報及びコーディング情報を表す識別情報を抽出し、この識別情報によって少なくとも一つのデコーディング方式のうち特定デコーディング方式が選択される。この選択されたデコーディング方式で空間情報をデコーディングし、空間情報を生成する。この時、空間情報デコーディング部700におけるデコーディング方式を、空間情報コーディング部300でどんなデータコーディング方式を使用したかによって決定することができる。この空間情報デコーディング部700についての詳細は、図26を参照して後述する。
マルチチャンネル生成部800は、コアデコーディング部600の出力を受信し、また、空間情報デコーディング部700の出力を受信する。マルチャンネル生成部800は、前記2つの出力からN個のマルチチャンネル(y1,y2,…,yN)のオーディオ信号を生成する。
一方、前記オーディオ圧縮のための部分100〜400は、空間情報コーディング部300でどんなデータコーディング方式を使用したかを表す識別情報を、オーディオ復元のための部分500〜800に提供する。上記の場合に備えて、オーディオ復元のための部分500〜800は、前記識別情報をパースするための手段を含む。したがって、空間情報デコーディング部700はオーディオ圧縮のための部分105〜400から提供された識別情報を参照してデコーディング方式を決定する。好ましくは、前記コーディング方式を表す識別情報をパースするための手段は、空間情報デコーディング部700に備えられる。
図25は、本発明の一実施例による空間情報コーディング部分の詳細構成を示すブロック図である。図25における説明では、前記空間情報を空間パラメータと称する。
図25を参照すると、本発明のコーディング部分は、PCMコーディング部310、DIFF部320及びハフマンコーディング部330で構成される。ハフマンコーディング部330は、前述したエントロピコーディングを行う一実施例に該当する。
PCMコーディング部310は、グループPCMコーディング部311とPBC部312とを含んで構成される。グループPCMコーディング部311は、空間パラメータをPCMコーディングする。場合によって、グループPCMコーディング部311は、空間パラメータをグループ単位にPCMコーディングすることができる。PBC部312は、空間パラメータに前述のPBCコーディングを行う。
DIFF部320は、空間パラメータに前述のDIFFコーディングを行う。特に、本発明では、空間パラメータのコーディングのために、グループPCMコーディング部311、PBC部312及びDIFF部320のうちのいずれか一つが選択的に動作する。その制御手段は、別に図示しない。
PBC部312が行うPBCについては上に詳細に説明したので、その説明は省略する。PBCの他の例において、空間パラメータに対して1回のPBCを行い、その最初のPBCの結果に対して以降N(N>1)回さらにPBCを行うことができる。すなわち、1次PBCを行った結果であるパイロット基準値や差分値に対して少なくとも1回さらにPBCを行う。場合によっては、2次PBCからはパイロット基準値は除外し、差分値に対してのみPBCを行うことが好ましい。
DIFF部320は、空間パラメータに対してDIFF_FREQを行うDIFF_FREQコーディング部321と、空間パラメータに対してDIFF_TIMEを行うDIFF_TIMEコーディング部322,323を含む。DIFF部320において、DIFF_FREQコーディング部321とDIFF_TIMEコーディング部322、323のうちの選択された一つが、入力される空間パラメータに対する処理を行う。
ここで、DIFF_TIMEコーディング部322,323は、空間パラメータに対してDIFF_TIME_FORWARDを行うDIFF_TIME_FORWARD部322と、空間パラメータに対してDIFF_TIME_BACKWARDを行うDIFF_TIME_BACKWARD部323とに区分される。
DIFF_TIMEコーディング部322,323において、DIFF_TIME_FORWARD部322とDIFF_TIME_BACKWARD323のうちの選択された一つが、入力される空間パラメータに対するデータコーディング処理を行う。DIFF部320の内部構成要素321,322,323がそれぞれ行う具体的なDIFFコーディングについては既に詳細に説明したので、その説明は省略する。
ハフマンコーディング部330は、PBC部312の出力とDIFF部320の出力のうちの少なくとも一つに対してハフマンコーディングを行う。
ハフマンコーディング部330は、コーディング及び転送対象となるデータを一つずつ処理する1次元ハフマンコーディング部(以下、‘HUFF_1D部’という。)331と、コーディング及び転送対象となるデータを2個ずつまとめて処理する2次元ハフマンコーディング部(以下、‘HUFF_2D部’という。)332,333と、を含む。ハフマンコーディング部330において、HUFF_1D部331とHUFF_2D部332,333のうちの選択された一つが、入力に対するハフマンコーディング処理を行う。
ここで、HUFF_2D部332,333は、周波数を基準にしてまとめられた1データ対に対してハフマンコーディングを行う周波数ペア2次元ハフマンコーディング部(以下、「HUFF_2D_FREQ_PAIR部」という。)332と時間を基準してまとめられた1データ対に対してハフマンコーディングを行う時間ペア2次元ハフマンコーディング部(以下、「HUFF_2D_TIME_PAIR部」という。)333とに区分される。
HUFF_2D部332,333において、HUFF_2D_FREQ_PAIR部332とHUFF_2D_TIME_PAIR部333のうちの選択された一つが、入力に対するハフマンコーディング処理を行う。ハフマンコーディング部330の内部構成要素331,332,333がそれぞれ行うハフマンコーディングについては既に詳細に説明したので、その説明は省略する。
その後、ハフマンコーディング部330の出力は、グループPCMコーディング部311の出力と多重化されて送信される。
本発明による空間情報のコーディング部分を、データコーディング及びエントロピコーディングで生成された多様な識別情報を転送ビットストリームに挿入させる。そして、転送ビットストリームは、図26の空間情報デコーディング部分に転送される。
図26は、本発明の一実施例による空間情報デコーディング部分の詳細構成を示すブロック図である。図26を参照すると、空間情報デコーディング部分は、空間情報を含む転送ビットストリームを受信し、該転送ビットストリームをデコーディングして空間情報を生成する。
空間情報デコーディング部分700は、識別情報抽出部710、PCMデコーディング部720、ハフマンデコーディング部730、差分デコーディング部740を含む。
空間情報デコーディング部分において、識別情報パース部710は、転送ビットストリームから様々な識別情報を抽出してパースする。これは、図23の説明部分で言及した様々な情報を抽出するということを意味する。空間情報デコーディング部分は、識別情報パース部710の出力から、空間パラメータに対してどんなグルーピング及びどんなコーディング方式が使われたかがわかり、その該当するグルーピング及びコーディング方式に対応するデコーディング方式を決定する。このような識別情報パース部710の役割は、前述の逆多重化部500で行っても良い。
PCMデコーディング部720は、グループPCMデコーディング部721と、パイロットベースデコーディング部722と、を含む。
グループPCMデコーディング部721は、転送ビットストリームに対してPCMデコーディングを行い、空間パラメータを生成する。場合によって、グループPCMデコーディング部721は、転送ビットストリームをデコーディングし、グループ単位の空間パラメータを生成する。
パイロットベースデコーディング部722は、ハフマンデコーディング部730の出力に対してパイロットベースデコーディングを行い、空間パラメータ値を生成する。これは、ハフマンデコーディング部730の出力にパイロット基準値が含まれた場合である。別の例で、パイロットベースデコーディング部722は、転送ビットストリームからパイロット基準値を直接抽出するためのパイロット抽出部(図示せず)を備えても良い。これにより、パイロット抽出部で抽出したパイロット基準値とハフマンデコーディング部730の出力である差分値を用いて空間パラメータ値を生成する。
ハフマンデコーディング部730は、転送ビットストリームに対してハフマンデコーディングを行う。ハフマンデコーディング部730は、転送ビットストリームに対して1次元ハフマンデコーディングを行い、1つずつのデータ値を出力する1次元ハフマンデコーディング部(以下、「HUFF_1Dデコーディング部」という。)731と、転送ビットストリームに対して2次元ハフマンデコーディングを行い、1対ずつのデータ値を出力する2次元ハフマンデコーディング部(以下、「HUFF_2Dデコーディング部」という。)732,733と、を含む。
識別情報パース部710は、転送ビットストリームから、ハフマンコーディング方式がHUFF_1DかまたはHUFF_2Dかを表す識別情報(例えば、“bsCodingScheme”)を抽出しそれをパースし、用いられたハフマンコーディング方式を把握する。これにより、それぞれの場合に対応するHUFF_1DデコーディングとHUFF_2Dデコーディングのうちの一つをハフマンデコーディング方式として決定する。
HUFF_1Dデコーディング部731がHUFF_1Dデコーディングを行い、HUFF_2Dデコーディング部732、733がHUFF_2Dデコーディングを行う。識別情報パース部710は、転送ビットストリームから、ハフマンコーディング方式がHUFF_2Dである場合に、そのHUFF_2D方式がHUFF_2D_FREQ_PAIRか、または、HUFF_2D_TIME_PAIRかを表す識別情報(例えば、“bsPairing”)をさらに抽出し、それをパースする。これにより、1対をなす2データを、周波数に基準してまとめるか、あるいは、時間を基準してまとめるかを把握する。これにより、それぞれの場合に対応する周波数ペア2次元ハフマンデコーディング(以下、「HUFF_2D_FREQ_PAIRデコーディング」という。)とタイムペア2次元ハフマンデコーディング(以下、「HUFF_2D_TIME_PAIRデコーディング」という。)のうちの一つを、ハフマンデコーディング方式と決定する。
HUFF_2D decoding部732,733において、HUFF_2D_FREQ_PAIRデコーディング部732がHUFF_2D_FREQ_PAIR decodingを行い、HUFF_2D_TIME_PAIRデコーディング部733がHUFF_2D_TIME_PAIRデコーディングを行う。
ハフマンデコーディング部730の出力は、識別情報パース部710の出力に基づいてパイロットベースデコーディング部722や差分デコーディング部740に伝達される。差分デコーディング部740は、ハフマンデコーディング部730の出力に対して差分デコーディングを行い、空間パラメータ値を生成する。
識別情報パース部710は、転送ビットストリームから、DIFF方式がDIFF_FREQかまたはDIFF_TIMEかを表す識別情報(例えば、“bsDiffType”)を抽出し、それをパースし、用いられたDIFF方式を把握する。これにより、それぞれの場合に対応するDIFF_FREQデコーディングとDIFF_TIMEデコーディングのうちの一つを、差分デコーディング方式と決定する。DIFF_FREQデコーディング部741がDIFF_FREQデコーディングを行い、DIFF_TIMEデコーディング部742,743がDIFF_TIMEデコーディングを行う。
識別情報パース部710は、転送ビットストリームから、DIFF方式がDIFF_TIMEである場合に、そのDIFF_TIMEがDIFF_TIME_FORWARDかまたはDIFF_TIME_BACKWARDかを表す識別情報(例えば、“bsDiffTimdDirection”)をさらに抽出し、それをパースする。
これにより、ハフマンデコーディング部730の出力が、現在のデータと以前のデータとの間の差分値なのか、または、現在のデータと以後のデータとの間の差分値なのかを把握する。これにより、それぞれの場合に対応するDIFF_TIME_FORWARDデコーディングとDIFF_TIME_BACKWARDデコーディングのうち一つを、DIFF_TIME方式と決定する。
DIFF_TIMEデコーディング部742,743において、DIFF_TIME_FORWARDデコーディング部742がDIFF_TIME_FORWARDデコーディングを行い、DIFF_TIME_BACKWARDデコーディング部743がDIFF_TIME_BACKWARDデコーディングを行う。
上記の空間情報デコーディング部分において識別情報パース部710の出力に基づいてハフマンデコーディング方式とデータデコーディング方式を決定する手順は、下記のようになる。
一例として、識別情報パース部710は、空間パラメータのコーディングにPCMとDIFFのうちのいずれかの方式が用いられたかを表す第1識別情報(例えば、“bsPCMCoding”)を読む。この第1識別情報がPCMを表した値であれば、再び、識別情報パース部710は、空間パラメータのコーディングにPCMとPBCのうちのいずれかの方式が用いられたかを表す第2識別情報(例えば、“bsPilotCoding”)を読む。第2識別情報がPBCを表した値であれば、空間情報デコーディング部分は、PBCに対応するデコーディングを行う。第2識別情報がPCMを表した値であれば、空間情報デコーディング部分は、PCMに対応するデコーディングを行う。一方、第1識別情報がDIFFを表した値であれば、空間情報デコーディング部分は、DIFFに対応するデコーディング処理を行う。
以上開示した本発明の好適な実施例は、本発明を例示するためのもので、添付の特許請求の範囲に開示された本発明の技術的思想とその技術的範囲内で、様々な他の実施例へと改良、変更、代替または付加などが可能であるということは、当業者にとっては自明である。例えば、本発明によるグルーピング、データコーディング及びエントロピコーディングを適用した様々な応用分野及び製品に適用することが可能である。また、本発明による少なくとも一特徴を適用したデータを保存する媒体を提供することが可能である。

Claims (14)

  1. オーディオ信号のデコーディング方法であって、
    前記オーディオ信号から、第1タイムグルーピング情報、タイム選択情報及び、第2タイムグルーピング情報を含むタイムグルーピング情報を抽出し、ここで、前記第1タイムグルーピング情報は、カレントフレーム内のタイムスロットの数量を規定し、前記タイム選択情報は、前記規定されたタイムスロットから1つ又はそれ以上の選択されたタイムスロットを特定し、前記第2のタイムグルーピング情報は、前記カレントフレームに含まれる前記1つ又はそれ以上の選択されたタイムスロットから前記タイムスロットのグループを特定し、
    パイロット基準値と、前記タイムスロットの特定されたグループに関連した1またはそれ以上のパイロット差分値を抽出し、
    前記パイロット基準値と前記パイロット差分値を用いて前記タイムスロットの特定されたグループのデータエレメントをデコードし、
    前記パイロット基準値は、前記タイムスロットの特定されたグループの前記データエレメントに依存し、他のフレームのデータエレメントには依存せず、前記パイロット差分値の数量は、前記タイムスロットの特定されたグループの前記データエレメントの数量に等しく、前記パイロット基準値は、前記タイムスロットの特定されたグループの前記データエレメントの全てに適用される単一値であり、パイロット差分値のそれぞれは、前記タイムスロットの特定されたグループのデータエレメントのそれぞれに対応する、方法。
  2. 前記パイロット基準値は、前記タイムスロットの特定されたグループの前記データエレメントに関連した中間値、平均値又は最頻値を表わす、請求項1記載の方法。
  3. 更に、前記データエレメントを使用してオーディオ信号を復元することを含む、請求項1記載の方法。
  4. 更に、前記パイロット基準値又は前記パイロット差分値をエントロピーデコーディングすることを含む、請求項1記載の方法。
  5. 前記タイムスロットのグループは、タイムスロットペア又はタイムスロットトリプルを表わす、請求項1記載の方法。
  6. 前記タイムスロットのグループが単一のタイムスロットを含む、請求項1記載の方法。
  7. オーディオ信号を処理するためのオーディオデコーディング装置であって、
    前記オーディオ信号から、第1タイムグルーピング情報、タイム選択情報及び、第2タイムグルーピング情報を含むタイムグルーピング情報を抽出し、ここで、前記第1タイムグルーピング情報は、カレントフレーム内のタイムスロットの数量を規定し、前記タイム選択情報は、前記規定されたタイムスロットから1つ又はそれ以上の選択されたタイムスロットを特定し、前記第2のタイムグルーピング情報は、前記カレントフレームに含まれる前記1つ又はそれ以上の選択されたタイムスロットから前記タイムスロットのグループを特定するように構成された識別子解析部と、
    パイロット基準値と、前記タイムスロットの特定されたグループと関連する1又はそれ以上のパイロット差分値を取得し、そして、前記パイロット基準値及び前記パイロット差分値を用いてデータエレメントをデコードし、
    前記パイロット基準値は、前記タイムスロットの特定されたグループの前記データエレメントに依存し、他のフレームのデータエレメントには依存せず、前記パイロット差分値の数量は、前記タイムスロットの特定されたグループの前記データエレメントの数量に等しく、前記パイロット基準値は、前記タイムスロットの特定されたグループの前記データエレメントの全てに適用される単一値であり、パイロット差分値のそれぞれは、前記タイムスロットの特定されたグループのデータエレメントのそれぞれに対応するように構成されたパイロットベースデコーディング部とを、含む装置。
  8. 前記パイロット基準値は、前記タイムスロットの特定されたグループの前記データエレメントに関連した中間値、平均値又は最頻値を表わす、請求項7記載の装置。
  9. 更に、前記データエレメントを用いてオーディオ信号を復元するように構成された復元部を含む、請求項7記載の装置。
  10. 更に、前記パイロット基準値又は前記パイロット差分値をエントロピーデコーディングするために構成されたエントロピーデコーディング部を含む、請求項7記載の装置。
  11. 前記タイムスロットのグループは、タイムスロットペア又はタイムスロットトリプルを表わす、請求項7記載の装置。
  12. 前記タイムスロットのグループは、単一のタイムスロットを含む、請求項7記載の装置。
  13. オーディオ信号を処理するシステムであって、
    前記オーディオ信号から、第1タイムグルーピング情報、タイム選択情報及び、第2タイムグルーピング情報を含むタイムグルーピング情報を抽出し、ここで、前記第1タイムグルーピング情報は、カレントフレーム内のタイムスロットの数量を規定し、前記タイム選択情報は、前記規定されたタイムスロットから1つ又はそれ以上の選択されたタイムスロットを特定し、前記第2のタイムグルーピング情報は、前記カレントフレームに含まれる前記1つ又はそれ以上の選択されたタイムスロットから前記タイムスロットのグループを特定し、
    パイロット基準値と、前記タイムスロットの特定されたグループと関連する1またはそれ以上のパイロット差分値を抽出し、
    前記パイロット基準値と前記パイロット差分値を使って、データエレメントをデコードし、
    前記パイロット基準値は、前記タイムスロットの特定されたグループの前記データエレメントのそれぞれに依存し、他のフレームのデータエレメントには依存せず、前記パイロット差分値の数量は、前記タイムスロットの特定されたグループの前記データエレメントの数量に等しく、前記パイロット基準値は、前記タイムスロットの特定されたグループの前記データエレメントの全てに適用される単一値であり、パイロット差分値のそれぞれは、前記タイムスロットの特定されたグループのデータエレメントのそれぞれに対応するように構成されたオーディオデコーディング装置を含む、システム。
  14. 前記パイロット基準値は、前記タイムスロットの特定されたグループの前記データエレメントに関連した中間値、平均値又は最頻値を表わす、請求項13記載のシステム。
JP2011115621A 2005-10-05 2011-05-24 オーディオ信号デコーディング方法、オーディオ信号デコーディング装置及びオーディオ信号を処理するシステム Expired - Fee Related JP5270717B2 (ja)

Applications Claiming Priority (34)

Application Number Priority Date Filing Date Title
US72363105P 2005-10-05 2005-10-05
US60/723,631 2005-10-05
US72565405P 2005-10-13 2005-10-13
US60/725,654 2005-10-13
US72622805P 2005-10-14 2005-10-14
US60/726,228 2005-10-14
US72971305P 2005-10-25 2005-10-25
US60/729,713 2005-10-25
US73039405P 2005-10-27 2005-10-27
US73039305P 2005-10-27 2005-10-27
US60/730,393 2005-10-27
US60/730,394 2005-10-27
US73776005P 2005-11-18 2005-11-18
US60/737,760 2005-11-18
US75291105P 2005-12-23 2005-12-23
US60/752,911 2005-12-23
US75340805P 2005-12-27 2005-12-27
US60/753,408 2005-12-27
US75823806P 2006-01-12 2006-01-12
US75823106P 2006-01-12 2006-01-12
US60/758,238 2006-01-12
US60/758,231 2006-01-12
KR20060004049 2006-01-13
KR20060004050 2006-01-13
KR10-2006-0004050 2006-01-13
KR10-2006-0004049 2006-01-13
KR10-2006-0030651 2006-04-04
KR20060030651 2006-04-04
KR10-2006-0079838 2006-08-23
KR10-2006-0079836 2006-08-23
KR1020060079836A KR20070108312A (ko) 2005-10-05 2006-08-23 오디오 신호의 인코딩/디코딩 방법 및 장치
KR1020060079837A KR20070108313A (ko) 2005-10-05 2006-08-23 오디오 신호의 인코딩/디코딩 방법 및 장치
KR10-2006-0079837 2006-08-23
KR1020060079838A KR20070108314A (ko) 2005-10-05 2006-08-23 오디오 신호의 인코딩/디코딩 방법 및 장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2008534465A Division JP2009520384A (ja) 2005-10-05 2006-10-09 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置

Publications (2)

Publication Number Publication Date
JP2011209741A true JP2011209741A (ja) 2011-10-20
JP5270717B2 JP5270717B2 (ja) 2013-08-21

Family

ID=39580443

Family Applications (9)

Application Number Title Priority Date Filing Date
JP2008534463A Expired - Fee Related JP5329964B2 (ja) 2005-10-05 2006-10-09 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置
JP2008534464A Expired - Fee Related JP5329965B2 (ja) 2005-10-05 2006-10-09 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置
JP2008534465A Withdrawn JP2009520384A (ja) 2005-10-05 2006-10-09 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置
JP2008534460A Pending JP2009520382A (ja) 2005-10-05 2006-10-09 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置
JP2008534462A Active JP5524484B2 (ja) 2005-10-05 2006-10-09 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置
JP2011010444A Pending JP2011130470A (ja) 2005-10-05 2011-01-21 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置
JP2011115954A Expired - Fee Related JP5330453B2 (ja) 2005-10-05 2011-05-24 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置
JP2011115621A Expired - Fee Related JP5270717B2 (ja) 2005-10-05 2011-05-24 オーディオ信号デコーディング方法、オーディオ信号デコーディング装置及びオーディオ信号を処理するシステム
JP2011167446A Expired - Fee Related JP5016129B2 (ja) 2005-10-05 2011-07-29 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置

Family Applications Before (7)

Application Number Title Priority Date Filing Date
JP2008534463A Expired - Fee Related JP5329964B2 (ja) 2005-10-05 2006-10-09 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置
JP2008534464A Expired - Fee Related JP5329965B2 (ja) 2005-10-05 2006-10-09 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置
JP2008534465A Withdrawn JP2009520384A (ja) 2005-10-05 2006-10-09 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置
JP2008534460A Pending JP2009520382A (ja) 2005-10-05 2006-10-09 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置
JP2008534462A Active JP5524484B2 (ja) 2005-10-05 2006-10-09 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置
JP2011010444A Pending JP2011130470A (ja) 2005-10-05 2011-01-21 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置
JP2011115954A Expired - Fee Related JP5330453B2 (ja) 2005-10-05 2011-05-24 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2011167446A Expired - Fee Related JP5016129B2 (ja) 2005-10-05 2011-07-29 信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置

Country Status (8)

Country Link
US (2) US7774199B2 (ja)
EP (5) EP1946305A4 (ja)
JP (9) JP5329964B2 (ja)
KR (19) KR100857113B1 (ja)
CN (1) CN101283256B (ja)
ES (1) ES2513816T3 (ja)
HK (1) HK1125172A1 (ja)
WO (5) WO2007040373A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US20060235683A1 (en) * 2005-04-13 2006-10-19 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Lossless encoding of information with guaranteed maximum bitrate
US8120515B2 (en) * 2006-09-29 2012-02-21 Agiledelta, Inc. Knowledge based encoding of data with multiplexing to facilitate compression
EP2208305B1 (en) * 2007-11-02 2017-12-13 Symbol Technologies, LLC Efficient encoding and decoding of mixed data strings in rfid tags and other media
CN102007533B (zh) * 2008-04-16 2012-12-12 Lg电子株式会社 用于处理音频信号的方法和装置
KR101241177B1 (ko) * 2010-08-04 2013-03-13 포항공과대학교 산학협력단 과부하된 코드 분할 다중 접속 채널의 용량 향상 방법 및 장치
KR101105745B1 (ko) * 2010-11-19 2012-01-17 경상대학교산학협력단 데이터 송수신 장치 및 이에 따른 데이터 송수신 방법
KR101416223B1 (ko) * 2012-11-27 2014-08-06 주식회사 인트로메딕 캡슐형 내시경 및 캡슐형 내시경의 영상 압축 방법
JP6105159B2 (ja) 2013-05-24 2017-03-29 ドルビー・インターナショナル・アーベー オーディオ・エンコーダおよびデコーダ
GB2530312B (en) * 2014-09-19 2016-09-14 Imagination Tech Ltd Data compression
KR101703330B1 (ko) 2014-10-06 2017-02-06 삼성전자 주식회사 이미지 재부호화 방법 및 그 장치
KR101740043B1 (ko) * 2015-07-08 2017-06-08 주식회사 케이티 번들 케이블의 데이터 전송 속도 최적화 방법 및 그 장치
WO2017007169A1 (ko) * 2015-07-08 2017-01-12 주식회사 케이티 번들 케이블의 데이터 전송 속도 최적화 방법 및 그 장치
CN105448299B (zh) * 2015-11-17 2019-04-05 中山大学 一种鉴别数字音频aac格式编解码器的方法
CN111490984B (zh) * 2020-04-03 2022-03-29 上海宽创国际文化科技股份有限公司 一种网络数据编码及其加密算法
GB2595871A (en) * 2020-06-09 2021-12-15 Nokia Technologies Oy The reduction of spatial audio parameters

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05265487A (ja) * 1992-03-18 1993-10-15 Sony Corp 高能率符号化方法
JPH1132328A (ja) * 1997-07-10 1999-02-02 Pfu Ltd 多値画像データにおけるデータ圧縮方法、データ圧縮装置および記録媒体
JP2005184839A (ja) * 2003-12-23 2005-07-07 Agere Systems Inc フレーム集約

Family Cites Families (157)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3276651D1 (en) * 1982-11-26 1987-07-30 Ibm Speech signal coding method and apparatus
JPS6096079A (ja) * 1983-10-31 1985-05-29 Matsushita Electric Ind Co Ltd 多値画像の符号化方法
US4661862A (en) 1984-04-27 1987-04-28 Rca Corporation Differential PCM video transmission system employing horizontally offset five pixel groups and delta signals having plural non-linear encoding functions
US4621862A (en) 1984-10-22 1986-11-11 The Coca-Cola Company Closing means for trucks
JPS6294090A (ja) * 1985-10-21 1987-04-30 Hitachi Ltd 符号化装置
US4725885A (en) * 1986-12-22 1988-02-16 International Business Machines Corporation Adaptive graylevel image compression system
JPH0793584B2 (ja) * 1987-09-25 1995-10-09 株式会社日立製作所 符号化装置
NL8901032A (nl) 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
US5243686A (en) * 1988-12-09 1993-09-07 Oki Electric Industry Co., Ltd. Multi-stage linear predictive analysis method for feature extraction from acoustic signals
US5143686A (en) * 1989-01-05 1992-09-01 Tokichi Shimizu Chuck with four differential jaws
CA2026207C (en) * 1989-01-27 1995-04-11 Louis Dunn Fielder Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
DE3943879B4 (de) * 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
US6289308B1 (en) * 1990-06-01 2001-09-11 U.S. Philips Corporation Encoded wideband digital transmission signal and record carrier recorded with such a signal
NL9000338A (nl) 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
GB8921320D0 (en) 1989-09-21 1989-11-08 British Broadcasting Corp Digital video coding
US5226084A (en) * 1990-12-05 1993-07-06 Digital Voice Systems, Inc. Methods for speech quantization and error correction
CA2077662C (en) * 1991-01-08 2001-04-17 Mark Franklin Davis Encoder/decoder for multidimensional sound fields
JPH04239225A (ja) * 1991-01-11 1992-08-27 Sony Corp 可変長符号化装置
DE69232251T2 (de) * 1991-08-02 2002-07-18 Sony Corp., Tokio/Tokyo Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung
US5231485A (en) * 1991-11-19 1993-07-27 Scientific-Atlanta, Inc. Method and apparatus for transforming between fixed-rate vector quantized data and variable rate vector quantized data
JP3297749B2 (ja) * 1992-03-18 2002-07-02 ソニー株式会社 符号化方法
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP3104400B2 (ja) 1992-04-27 2000-10-30 ソニー株式会社 オーディオ信号符号化装置及び方法
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
US5481643A (en) * 1993-03-18 1996-01-02 U.S. Philips Corporation Transmitter, receiver and record carrier for transmitting/receiving at least a first and a second signal component
US5563661A (en) * 1993-04-05 1996-10-08 Canon Kabushiki Kaisha Image processing apparatus
JP3227929B2 (ja) * 1993-08-31 2001-11-12 ソニー株式会社 音声符号化装置およびその符号化信号の復号化装置
US5511003A (en) * 1993-11-24 1996-04-23 Intel Corporation Encoding and decoding video signals using spatial filtering
US6125398A (en) * 1993-11-24 2000-09-26 Intel Corporation Communications subsystem for computer-based conferencing system using both ISDN B channels for transmission
US5640159A (en) * 1994-01-03 1997-06-17 International Business Machines Corporation Quantization method for image data compression employing context modeling algorithm
JP3448091B2 (ja) * 1994-02-18 2003-09-16 富士通株式会社 符号化復号化装置及び符号化復号化方法
RU2158970C2 (ru) 1994-03-01 2000-11-10 Сони Корпорейшн Способ кодирования цифрового сигнала и устройство для его осуществления, носитель записи цифрового сигнала, способ декодирования цифрового сигнала и устройство для его осуществления
JP3498375B2 (ja) * 1994-07-20 2004-02-16 ソニー株式会社 ディジタル・オーディオ信号記録装置
US6549666B1 (en) * 1994-09-21 2003-04-15 Ricoh Company, Ltd Reversible embedded wavelet system implementation
JPH08123494A (ja) 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
JPH08130649A (ja) * 1994-11-01 1996-05-21 Canon Inc データ処理装置
KR100209877B1 (ko) * 1994-11-26 1999-07-15 윤종용 복수개의 허프만부호테이블을 이용한 가변장부호화장치 및 복호화장치
JPH08180193A (ja) * 1994-12-22 1996-07-12 Fujitsu Ltd データ圧縮装置
JP3371590B2 (ja) 1994-12-28 2003-01-27 ソニー株式会社 高能率符号化方法及び高能率復号化方法
JP3484832B2 (ja) 1995-08-02 2004-01-06 ソニー株式会社 記録装置、記録方法、再生装置及び再生方法
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6047027A (en) 1996-02-07 2000-04-04 Matsushita Electric Industrial Co., Ltd. Packetized data stream decoder using timing information extraction and insertion
JP3088319B2 (ja) 1996-02-07 2000-09-18 松下電器産業株式会社 デコード装置およびデコード方法
US6399760B1 (en) * 1996-04-12 2002-06-04 Millennium Pharmaceuticals, Inc. RP compositions and therapeutic and diagnostic uses therefor
WO1997040630A1 (en) * 1996-04-18 1997-10-30 Nokia Mobile Phones Ltd. Video data encoder and decoder
EP0827312A3 (de) 1996-08-22 2003-10-01 Marconi Communications GmbH Verfahren zur Änderung der Konfiguration von Datenpaketen
US5912636A (en) * 1996-09-26 1999-06-15 Ricoh Company, Ltd. Apparatus and method for performing m-ary finite state machine entropy coding
US5893066A (en) 1996-10-15 1999-04-06 Samsung Electronics Co. Ltd. Fast requantization apparatus and method for MPEG audio decoding
TW429700B (en) 1997-02-26 2001-04-11 Sony Corp Information encoding method and apparatus, information decoding method and apparatus and information recording medium
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
US6639945B2 (en) * 1997-03-14 2003-10-28 Microsoft Corporation Method and apparatus for implementing motion detection in video compression
US6356639B1 (en) 1997-04-11 2002-03-12 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
CN1137487C (zh) * 1997-09-17 2004-02-04 松下电器产业株式会社 将视频数据记录在光盘的设备和方法
US6130418A (en) 1997-10-06 2000-10-10 U.S. Philips Corporation Optical scanning unit having a main lens and an auxiliary lens
US5966688A (en) * 1997-10-28 1999-10-12 Hughes Electronics Corporation Speech mode based multi-stage vector quantizer
JP3022462B2 (ja) 1998-01-13 2000-03-21 興和株式会社 振動波の符号化方法及び復号化方法
EP0932141B1 (en) * 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
US6121904A (en) * 1998-03-12 2000-09-19 Liquid Audio, Inc. Lossless data compression with low complexity
JPH11282496A (ja) 1998-03-30 1999-10-15 Matsushita Electric Ind Co Ltd 復号装置
US6339760B1 (en) * 1998-04-28 2002-01-15 Hitachi, Ltd. Method and system for synchronization of decoded audio and video by adding dummy data to compressed audio data
JPH11330980A (ja) 1998-05-13 1999-11-30 Matsushita Electric Ind Co Ltd 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体
GB2340351B (en) 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6298071B1 (en) * 1998-09-03 2001-10-02 Diva Systems Corporation Method and apparatus for processing variable bit rate information in an information distribution system
MY118961A (en) * 1998-09-03 2005-02-28 Sony Corp Beam irradiation apparatus, optical apparatus having beam irradiation apparatus for information recording medium, method for manufacturing original disk for information recording medium, and method for manufacturing information recording medium
US6148283A (en) * 1998-09-23 2000-11-14 Qualcomm Inc. Method and apparatus using multi-path multi-stage vector quantizer
US6553147B2 (en) 1998-10-05 2003-04-22 Sarnoff Corporation Apparatus and method for data partitioning to improving error resilience
KR100676109B1 (ko) 1998-10-16 2007-02-01 다이이치 아스비오파마 가부시키가이샤 신경보호제로서의 아미노페녹시아세트산 유도체
US6556685B1 (en) 1998-11-06 2003-04-29 Harman Music Group Companding noise reduction system with simultaneous encode and decode
US6757659B1 (en) 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
JP3346556B2 (ja) 1998-11-16 2002-11-18 日本ビクター株式会社 音声符号化方法及び音声復号方法
US6195024B1 (en) * 1998-12-11 2001-02-27 Realtime Data, Llc Content independent data compression method and system
US6208276B1 (en) * 1998-12-30 2001-03-27 At&T Corporation Method and apparatus for sample rate pre- and post-processing to achieve maximal coding gain for transform-based audio encoding and decoding
US6631352B1 (en) 1999-01-08 2003-10-07 Matushita Electric Industrial Co. Ltd. Decoding circuit and reproduction apparatus which mutes audio after header parameter changes
JP4610087B2 (ja) * 1999-04-07 2011-01-12 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 損失のない符号化・復号へのマトリックス改良
JP3323175B2 (ja) * 1999-04-20 2002-09-09 松下電器産業株式会社 符号化装置
US6421467B1 (en) * 1999-05-28 2002-07-16 Texas Tech University Adaptive vector quantization/quantizer
KR100307596B1 (ko) * 1999-06-10 2001-11-01 윤종용 디지털 오디오 데이터의 무손실 부호화 및 복호화장치
JP2001006291A (ja) * 1999-06-21 2001-01-12 Fuji Film Microdevices Co Ltd オーディオ信号の符号化方式判定装置、及びオーディオ信号の符号化方式判定方法
JP3762579B2 (ja) 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP2001094433A (ja) * 1999-09-17 2001-04-06 Matsushita Electric Ind Co Ltd サブバンド符号化・復号方法
JP2002016921A (ja) * 2000-06-27 2002-01-18 Matsushita Electric Ind Co Ltd 動画像符号化装置および動画像復号化装置
JP2002026738A (ja) * 2000-07-11 2002-01-25 Mitsubishi Electric Corp オーディオデータ復号処理装置および方法、ならびにオーディオデータ復号処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2002072871A (ja) * 2000-08-29 2002-03-12 Victor Co Of Japan Ltd 動画像デ−タの符号化処理方法、復号化処理方法、符号化処理装置、及び復号化処理装置
US20020049586A1 (en) * 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
JP2002157000A (ja) * 2000-09-11 2002-05-31 Matsushita Electric Ind Co Ltd 符号化装置及び復号化装置、符号化処理プログラム及び復号化処理プログラム、符号化処理プログラム又は復号化処理プログラムを記録した記録媒体、並びに符号化装置又は復号化装置を用いた放送システム
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
JP4008244B2 (ja) 2001-03-02 2007-11-14 松下電器産業株式会社 符号化装置および復号化装置
JP3566220B2 (ja) 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
JP2002335230A (ja) 2001-05-11 2002-11-22 Victor Co Of Japan Ltd 音声符号化信号の復号方法、及び音声符号化信号復号装置
JP2002374171A (ja) * 2001-06-15 2002-12-26 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
JP2003005797A (ja) 2001-06-21 2003-01-08 Matsushita Electric Ind Co Ltd オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム
JP3866539B2 (ja) * 2001-07-05 2007-01-10 日本電信電話株式会社 符号化方法,復号方法,符号化装置,復号装置,符号化プログラム,復号プログラムおよびそれらのプログラム記録媒体
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
GB0119569D0 (en) * 2001-08-13 2001-10-03 Radioscape Ltd Data hiding in digital audio broadcasting (DAB)
EP1308931A1 (de) * 2001-10-23 2003-05-07 Deutsche Thomson-Brandt Gmbh Decodierung eines codierten digitalen Audio-Signals welches in Header enthaltende Rahmen angeordnet ist
JP3923783B2 (ja) * 2001-11-02 2007-06-06 松下電器産業株式会社 符号化装置及び復号化装置
DE60208426T2 (de) * 2001-11-02 2006-08-24 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
KR100480787B1 (ko) * 2001-11-27 2005-04-07 삼성전자주식회사 좌표 인터폴레이터의 키 값 데이터 부호화/복호화 방법 및 장치
US7376555B2 (en) * 2001-11-30 2008-05-20 Koninklijke Philips Electronics N.V. Encoding and decoding of overlapping audio signal values by differential encoding/decoding
JP2003195894A (ja) * 2001-12-27 2003-07-09 Mitsubishi Electric Corp 符号化装置、復号化装置、符号化方法、及び復号化方法
TW569550B (en) 2001-12-28 2004-01-01 Univ Nat Central Method of inverse-modified discrete cosine transform and overlap-add for MPEG layer 3 voice signal decoding and apparatus thereof
EP1827029A1 (en) * 2002-01-18 2007-08-29 Kabushiki Kaisha Toshiba Video decoding method and apparatus
JP2003233395A (ja) 2002-02-07 2003-08-22 Matsushita Electric Ind Co Ltd オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム
EP1484841B1 (en) * 2002-03-08 2018-12-26 Nippon Telegraph And Telephone Corporation DIGITAL SIGNAL ENCODING METHOD, DECODING METHOD, ENCODING DEVICE, DECODING DEVICE and DIGITAL SIGNAL DECODING PROGRAM
EP1493146B1 (en) 2002-04-11 2006-08-02 Matsushita Electric Industrial Co., Ltd. Encoding and decoding devices, methods and programs
US7275036B2 (en) * 2002-04-18 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
DE10217297A1 (de) 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
AU2003230986A1 (en) * 2002-04-19 2003-11-03 Droplet Technology, Inc. Wavelet transform system, method and computer program product
EP1500082B1 (en) * 2002-04-22 2007-02-14 Koninklijke Philips Electronics N.V. Signal synthesizing
ES2268340T3 (es) * 2002-04-22 2007-03-16 Koninklijke Philips Electronics N.V. Representacion de audio parametrico de multiples canales.
RU2363116C2 (ru) 2002-07-12 2009-07-27 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
BR0305555A (pt) 2002-07-16 2004-09-28 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado
CA2453814C (en) 2002-07-19 2010-03-09 Nec Corporation Audio decoding apparatus and decoding method and program
ATE341923T1 (de) 2002-08-07 2006-10-15 Dolby Lab Licensing Corp Audiokanalumsetzung
US7536305B2 (en) 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
TW567466B (en) 2002-09-13 2003-12-21 Inventec Besta Co Ltd Method using computer to compress and encode audio data
EP1604528A2 (en) 2002-09-17 2005-12-14 Ceperkovic, Vladimir Fast codec with high compression ratio and minimum required resources
JP4084990B2 (ja) 2002-11-19 2008-04-30 株式会社ケンウッド エンコード装置、デコード装置、エンコード方法およびデコード方法
JP2004220743A (ja) 2003-01-17 2004-08-05 Sony Corp 情報記録装置及び情報記録制御方法、並びに情報再生装置及び情報再生制御方法
EP2665294A2 (en) 2003-03-04 2013-11-20 Core Wireless Licensing S.a.r.l. Support of a multichannel audio extension
WO2004090864A2 (en) * 2003-03-12 2004-10-21 The Indian Institute Of Technology, Bombay Method and apparatus for the encoding and decoding of speech
JP2004276576A (ja) * 2003-03-17 2004-10-07 Shinji Watanabe 台紙
US20040199276A1 (en) * 2003-04-03 2004-10-07 Wai-Leong Poon Method and apparatus for audio synchronization
EP1621047B1 (en) 2003-04-17 2007-04-11 Koninklijke Philips Electronics N.V. Audio signal generation
JP4388771B2 (ja) * 2003-07-18 2009-12-24 三菱電機株式会社 動画像復号装置、および動画像復号方法
JP2005086486A (ja) * 2003-09-09 2005-03-31 Alpine Electronics Inc オーディオ装置およびオーディオ処理方法
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
KR101106026B1 (ko) * 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
GB2407952B (en) 2003-11-07 2006-11-29 Psytechnics Ltd Quality assessment tool
US20050137729A1 (en) * 2003-12-18 2005-06-23 Atsuhiro Sakurai Time-scale modification stereo audio signals
SE527670C2 (sv) 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US20050174269A1 (en) * 2004-02-05 2005-08-11 Broadcom Corporation Huffman decoder used for decoding both advanced audio coding (AAC) and MP3 audio
EP1719115A1 (en) * 2004-02-17 2006-11-08 Koninklijke Philips Electronics N.V. Parametric multi-channel coding with improved backwards compatibility
JP2004201345A (ja) * 2004-02-20 2004-07-15 Mitsubishi Electric Corp 画像符号化方法、画像符号化装置、画像復号化方法及び画像復号化装置
CA3035175C (en) * 2004-03-01 2020-02-25 Mark Franklin Davis Reconstructing audio signals with multiple decorrelation techniques
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US7813571B2 (en) * 2004-04-22 2010-10-12 Mitsubishi Electric Corporation Image encoding apparatus and image decoding apparatus
JP2005332449A (ja) 2004-05-18 2005-12-02 Sony Corp 光学ピックアップ装置、光記録再生装置及びチルト制御方法
TWM257575U (en) 2004-05-26 2005-02-21 Aimtron Technology Corp Encoder and decoder for audio and video information
JP2006012301A (ja) * 2004-06-25 2006-01-12 Sony Corp 光記録再生方法、光ピックアップ装置、光記録再生装置、光記録媒体とその製造方法及び半導体レーザ装置
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
JP2006120247A (ja) 2004-10-21 2006-05-11 Sony Corp 集光レンズ及びその製造方法、これを用いた露光装置、光学ピックアップ装置及び光記録再生装置
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP4737711B2 (ja) * 2005-03-23 2011-08-03 富士ゼロックス株式会社 復号化装置、逆量子化方法、分布決定方法及びこのプログラム
US7991610B2 (en) 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
KR100803205B1 (ko) 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
WO2007040349A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05265487A (ja) * 1992-03-18 1993-10-15 Sony Corp 高能率符号化方法
JPH1132328A (ja) * 1997-07-10 1999-02-02 Pfu Ltd 多値画像データにおけるデータ圧縮方法、データ圧縮装置および記録媒体
JP2005184839A (ja) * 2003-12-23 2005-07-07 Agere Systems Inc フレーム集約

Also Published As

Publication number Publication date
JP5329965B2 (ja) 2013-10-30
JP2009520384A (ja) 2009-05-21
KR20080049035A (ko) 2008-06-03
KR100878830B1 (ko) 2009-01-14
JP2011209742A (ja) 2011-10-20
EP1941499A1 (en) 2008-07-09
KR100857115B1 (ko) 2008-09-05
KR100857114B1 (ko) 2008-09-08
EP1949063A1 (en) 2008-07-30
KR20080044864A (ko) 2008-05-21
KR20080059221A (ko) 2008-06-26
CN101283256A (zh) 2008-10-08
ES2513816T3 (es) 2014-10-27
KR20080042127A (ko) 2008-05-14
EP1946306A4 (en) 2009-08-19
EP1952114B1 (en) 2014-08-27
HK1125172A1 (en) 2009-07-31
KR100857110B1 (ko) 2008-09-05
KR20080044859A (ko) 2008-05-21
KR20080048029A (ko) 2008-05-30
EP1946306A1 (en) 2008-07-23
KR100878833B1 (ko) 2009-01-14
JP5524484B2 (ja) 2014-06-18
KR100878828B1 (ko) 2009-01-14
JP2009521710A (ja) 2009-06-04
KR20080053292A (ko) 2008-06-12
WO2007040371A1 (en) 2007-04-12
KR20080042126A (ko) 2008-05-14
KR20080048028A (ko) 2008-05-30
EP1946305A1 (en) 2008-07-23
KR100857117B1 (ko) 2008-09-05
JP5270717B2 (ja) 2013-08-21
KR100857112B1 (ko) 2008-09-05
KR20080044860A (ko) 2008-05-21
EP1949063A4 (en) 2009-09-23
KR100878829B1 (ko) 2009-01-14
KR20080044862A (ko) 2008-05-21
KR100857118B1 (ko) 2008-09-05
EP1952114A4 (en) 2009-08-12
US20080262852A1 (en) 2008-10-23
EP1952114A1 (en) 2008-08-06
WO2007040374A1 (en) 2007-04-12
JP2009520382A (ja) 2009-05-21
KR20080047551A (ko) 2008-05-29
KR20080046181A (ko) 2008-05-26
KR20080047550A (ko) 2008-05-29
JP2012023738A (ja) 2012-02-02
JP5329964B2 (ja) 2013-10-30
KR100878832B1 (ko) 2009-01-14
EP1941499A4 (en) 2009-08-19
KR20080047380A (ko) 2008-05-28
JP2009520213A (ja) 2009-05-21
EP1946305A4 (en) 2009-08-19
KR100857121B1 (ko) 2008-09-05
JP5330453B2 (ja) 2013-10-30
WO2007040373A1 (en) 2007-04-12
JP2009524837A (ja) 2009-07-02
KR100857111B1 (ko) 2008-09-08
KR100857113B1 (ko) 2008-09-08
KR20080044863A (ko) 2008-05-21
KR100857116B1 (ko) 2008-09-08
KR100878831B1 (ko) 2009-01-14
KR100857119B1 (ko) 2008-09-05
KR20080044861A (ko) 2008-05-21
JP5016129B2 (ja) 2012-09-05
KR20080059222A (ko) 2008-06-26
KR100857120B1 (ko) 2008-09-05
WO2007040368A1 (en) 2007-04-12
US20090219182A1 (en) 2009-09-03
WO2007040372A1 (en) 2007-04-12
US7774199B2 (en) 2010-08-10
JP2011130470A (ja) 2011-06-30
US7663513B2 (en) 2010-02-16
CN101283256B (zh) 2014-09-17
KR20080045701A (ko) 2008-05-23
KR100857109B1 (ko) 2008-09-05

Similar Documents

Publication Publication Date Title
JP5319286B2 (ja) データ処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置
JP5270717B2 (ja) オーディオ信号デコーディング方法、オーディオ信号デコーディング装置及びオーディオ信号を処理するシステム
KR20080031561A (ko) 신호 처리 방법 및 장치와, 인코딩 및 디코딩 방법과 그를위한 장치
KR20080031560A (ko) 신호 처리 방법 및 장치와, 인코딩 및 디코딩 방법과 그를위한 장치
KR20080031559A (ko) 신호 처리 방법 및 장치와, 인코딩 및 디코딩 방법과 그를위한 장치

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130315

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130509

R150 Certificate of patent or registration of utility model

Ref document number: 5270717

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees