JP5174027B2 - ミックス信号処理装置及びミックス信号処理方法 - Google Patents

ミックス信号処理装置及びミックス信号処理方法 Download PDF

Info

Publication number
JP5174027B2
JP5174027B2 JP2009530283A JP2009530283A JP5174027B2 JP 5174027 B2 JP5174027 B2 JP 5174027B2 JP 2009530283 A JP2009530283 A JP 2009530283A JP 2009530283 A JP2009530283 A JP 2009530283A JP 5174027 B2 JP5174027 B2 JP 5174027B2
Authority
JP
Japan
Prior art keywords
signal
mix
additional information
source
mix signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009530283A
Other languages
English (en)
Other versions
JP2010505143A (ja
Inventor
オー オー,ヒェン
ウォン ジュン,ヤン
ヨン ユーン,ソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2010505143A publication Critical patent/JP2010505143A/ja
Application granted granted Critical
Publication of JP5174027B2 publication Critical patent/JP5174027B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • H04N21/8113Monomedia components thereof involving special audio data, e.g. different tracks for different languages comprising music, e.g. song in MP3 format
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/242Synchronization processes, e.g. processing of PCR [Program Clock References]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、信号処理方法及び装置に関するもので、より詳細には、オーディオ信号またはビデオ信号などのミックス信号をエンコーディング及びデコーディングできる信号処理方法及び装置に関する。
一般に、ステレオ信号が最も頻繁に生成され、消費者に最も広く利用されている。最近では、マルチチャネル信号が益々広く利用されてきている。しかし、これらのミックス信号は、ミックス信号を構成するソース信号単位ではなく、チャネル信号単位で処理されるという限界がある。したがって、チャネル信号単位でミックス信号を処理する場合、ミックス信号を構成する特定ソース信号のみを独立して処理できないという問題点がある。例えば、映画を見ながら俳優たちの音声のボリュームを一定に維持したまま、背景音楽のボリュームのみを上げることは不可能である。また、付加情報のビットストリームを構成する方法がまだ定められておらず、付加情報を記憶するのに問題点がある。
また、記録媒体にメディア信号を記憶する場合、該メディア信号に対する付加情報を記憶できる補助データ領域が存在しない場合がある。したがって、このような場合には、メディア信号をソース信号単位で処理できないという問題点がある。また、付加情報を別途記憶したり、または別途伝送する場合には一般的なオーディオ信号フォーマットとの互換性において問題点がある。
また、ユーザがミックス信号(または合成ソース信号)をソース別に、すなわち、ソース信号別にリミキシングしてミックス信号を再生させた後、過去にリミキシングしたミックス信号を後で再生したい場合には、過去に入力した制御情報をそのまま再び入力しなければならないという問題がある。
また、チャネル単位でミックス信号を処理するため、ミックス信号に含まれたソース信号をユーザが提供する特定のソース信号に置き替えることが不可能であるという問題がある。
上記の問題点を解決するために、本発明は、ミックス信号及び付加情報を用いてリミックス信号を生成する方法を提供することを課題とする。
また、本発明は、リミックス信号を生成するのに用いられる付加情報のビットストリームを構成する方法を提供することを課題とする。
また、本発明は、付加情報を用いてメディア信号をソース信号単位で処理するために、メディア信号に対する付加情報を埋め込む符号化/復号化方法及び装置を提供することを課題とする。
また、本発明は、ミックス信号のリミックスにおいて、ユーザが入力した制御情報を記憶させた後に、後でそのミックス信号をリミキシングするのに用いることができるようにするミックス信号制御方法及び装置を提供することを課題とする。
また、本発明は、特に、パニング効果またはフェーディング効果を特定区間に適用する際に、制御情報のデータ容量を最小化できるミックス信号のインターフェース表示方法及び装置を提供することを課題とする。
また、本発明は、ミックス信号に含まれるソース信号が別途存在しない場合に、ソース信号と類似する信号を用いてソース信号別付加情報を生成する方法を提供することを課題とする。
また、本発明は、デコーディング装置でミックス信号を用いて該ミックス信号をリミックスするための付加情報を生成する方法及び装置を提供することを課題とする。
また、本発明は、ミックス信号に含まれた特定のソース信号を、ユーザが提供するソース信号に置き換える方法及び装置を提供することを課題とする。
また、本発明は、ユーザがソース信号を用いてミックス信号を変形できる信号処理方法及び装置を提供することを課題とする。
上記課題を解決するために、本発明は、ミックス信号ビットストリームから1つ以上のソース信号を含むミックス信号を抽出する段階と、付加情報ビットストリームから付加情報を抽出する段階と、ユーザミックスパラメータを獲得する段階と、前記ミックス信号、前記付加情報及び前記ユーザミックスパラメータを用いてリミックス信号を生成する段階と、を含み、前記付加情報ビットストリームは、第1ヘッダ領域とデータ領域とに区分され、前記データ領域は、1つ以上のフレームデータ領域及び1つ以上の第2ヘッダ領域を含むことを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、1つ以上のソース信号を含むミックス信号を獲得する段階と、前記ソース信号からリミックスされるソース信号を獲得する段階と、前記ミックス信号及び前記リミックスされるソース信号を用いて付加情報を生成する段階と、前記ミックス信号及び前記付加情報を用いて各々ミックス信号ビットストリーム及び付加情報ビットストリームを生成する段階と、を含み、前記付加情報ビットストリームは、第1ヘッダ領域とデータ領域とに区分され、前記データ領域は、1つ以上のフレームデータ領域及び1つ以上の第2ヘッダ領域を含むことを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、ミックス信号成分のうち非知覚領域に埋め込まれた付加情報を抽出する段階と、前記付加情報及び前記ミックス信号を用いてリミキシング信号を生成する段階と、を含むことを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、ミックス信号及び前記ミックス信号に含まれたソース信号を用いて前記ミックス信号をリミキシングするための付加情報を生成する段階と、前記付加情報を前記ミックス信号成分のうち非知覚領域に埋め込む段階と、を含むことを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、ミックス信号成分のうち非知覚領域に埋め込まれた結合信号を抽出する段階と、前記結合信号を無損失復号化し、前記非知覚領域に対応する信号成分を復元する段階と、前記復元された信号成分を用いて前記結合信号の抽出されたミックス信号を復元する段階と、を含み、前記結合信号は、前記ミックス信号成分のうち非知覚領域に位置する信号成分を無損失符号化した信号成分及び付加情報を含み、前記付加情報は、前記ミックス信号をリミキシングするための情報を含むことを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、ミックス信号成分のうち非知覚領域に位置する信号成分を無損失符号化する段階と、前記無損失符号化された信号成分及び付加情報を結合して結合信号を生成する段階と、前記結合信号を前記非知覚領域に埋め込む段階と、を含むことを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、ミックス信号成分のうち非知覚領域に存在する付加情報を抽出する段階と、前記付加情報の抽出されたミックス信号を符号化する段階と、前記符号化されたミックス信号及び前記付加情報を用いてビットストリームを生成する段階と、を含み、前記付加情報は、前記ミックス信号をリミキシングするための情報を含むことを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、ビットストリームから符号化されたミックス信号及び付加情報を抽出する段階と、前記符号化されたミックス信号を復号化する段階と、前記復号化されたミックス信号成分のうち非知覚領域に前記付加情報を埋め込む段階と、を含み、前記付加情報は、前記ミックス信号をリミキシングするための情報を含むことを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、ミックス信号成分のうち非知覚領域に埋め込まれた符号化された付加情報を抽出する埋め込み信号デコーディング部と、前記符号化された付加情報をデコーディングして付加情報を生成する付加情報デコーディング部と、前記付加情報及び前記ミックス信号を用いてリミキシング信号を生成するリミックスレンダリング部と、を含むことを特徴とする信号処理装置を提供する。
また、上記課題を解決するために、本発明は、ミックス信号の識別情報を受信する段階と、前記ミックス信号とマッチングされるソース制御情報を読み取って出力する段階と、を含むことを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、ミックス信号の処理装置と連係している信号処理装置であって、ミックス信号の識別情報別ソース制御情報が記憶されているメモリと、ミックス信号の識別情報に基づいて、前記ミックス信号とマッチングするソース制御情報を前記メモリから読み取り、前記ミックス信号の処理装置に出力する制御部と、を含むことを特徴とする信号処理装置を提供する。
また、上記課題を解決するために、本発明は、ミックス信号に該当するソース制御情報を読み取る段階と、前記ソース制御情報を第2ミックス信号制御装置に伝送する段階と、を含み、前記ソース制御情報は、ミックス信号を識別するためのミックス信号の識別情報を含むことを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、ミックス信号に該当するソース制御情報が記憶されているメモリと、第2ミックス信号制御装置と通信するための通信部と、前記ソース制御情報を前記通信部を通じて第2ミックス信号制御装置に伝送するようにする制御部と、を含むことを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、ミックス信号に該当する付加情報及び制御情報を受信する段階と、前記付加情報及び前記制御情報に基づいて、前記ミックス信号をアップミックスするためのアップミキシングパラメータを生成する段階と、を含むことを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、ミックス信号に該当する制御情報を受信するための通信部と、前記制御情報及び付加情報に基づいて前記ミックス信号をアップミックスするためのアップミキシングパラメータを生成するパラメータ生成部と、を含むことを特徴とする信号処理装置を提供する。
また、上記課題を解決するために、本発明は、1つ以上のソース信号を含むミックス信号を獲得する段階と、ミックスパラメータを獲得する段階と、前記ミックス信号に含まれた特定空間を表す信号成分を用いて付加情報を生成する段階と、前記ミックス信号、前記ミックスパラメータ、及び前記付加情報を用いてリミックス信号を生成する段階と、を含み、前記付加情報は、前記ミックス信号に含まれたソース信号のうちリミックスされるソース信号と前記ミックス信号との関係を表すことを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、ミックス信号に含まれた特定の第1ソース信号を調節して第1リミックス信号を生成する段階と、前記ミックス信号に含まれていない別の第2ソース信号を生成する段階と、前記第1リミックス信号及び前記第2ソース信号を用いて第2リミックス信号を生成する段階と、を含むことを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、1つ以上の第1ソース信号を含む第1ミックス信号を獲得する段階と、前記第1ミックス信号に含まれていない第2ソース信号を獲得する段階と、前記第1ミックス信号及び前記第2ソース信号を用いて第2ミックス信号を生成する段階と、を含むことを特徴とする信号処理方法を提供する。
また、上記目的を解決するために、本発明は、通信網を通じてユーザ端末と結合するソース信号提供サーバで行なうソース信号提供方法であって、前記ユーザ端末からソース信号の選択情報を獲得する段階と、前記選択情報によって、選択されたソース信号に対する付加情報を生成する段階と、前記選択されたソース信号及び前記付加情報を前記ユーザ端末に伝送する段階と、を含み、前記付加情報は、前記ソース信号を用いてリミックス信号を生成するのに用いられる情報であることを特徴とする信号処理方法を提供する。
また、上記課題を解決するために、本発明は、1つ以上のソース信号を含むミックス信号を獲得するミックス信号デコーディング部と、前記ミックス信号に含まれた特定空間を表す信号成分を用いて付加情報を生成する付加情報生成部と、前記ミックス信号、前記ミックスパラメータ、及び前記付加情報を用いてリミックス信号を生成するリミックスレンダリング部と、を含み、前記付加情報は、前記ミックス信号に含まれたソース信号のうちリミックスされるソース信号と前記ミックス信号との関係を表すことを特徴とする信号処理装置を提供する。
また、上記課題を解決するために、本発明は、ミックス信号に含まれた特定の第1ソース信号を調節して第1リミックス信号を生成するリミックスレンダリング部と、前記ミックス信号に含まれていない他の第2ソース信号を生成するソース信号生成部と、前記第1リミックス信号及び前記第2ソース信号を用いて第2リミックス信号を生成するレコーディング部と、を含むことを特徴とする信号処理装置を提供する。
また、上記課題を解決するために、本発明は、1つ以上の第1ソース信号を含む第1ミックス信号を獲得するミックス信号デコーディング部と、前記第1ミックス信号に含まれていない第2ソース信号を獲得するソース信号デコーディング部と、前記第1ミックス信号及び前記第2ソース信号を用いて第2ミックス信号を生成するミックス信号変形部と、を含み、前記第2ミックス信号は、前記第1ソース信号及び前記第2ソース信号のうち、ユーザが選択したソース信号のみを含むことを特徴とする信号処理装置を提供する。
本発明に係る信号処理方法及び装置によれば、リミックス信号を生成するのに必要な付加情報のビットストリームを構成する方法を規定することによってデータをより効率的に管理し、かつ、該ビットストリームで構成されたデータは互いに互換性を持つことができるという効果が得られる。
また、本発明に係る信号処理方法及び装置によれば、オーディオ信号をコーディングするに当たり、低いビット率を持つ付加情報を用いてオーディオ信号に含まれた特定のソース信号をリミックスすることができる。この場合、ソース信号をリミキシングするための付加情報が必要となる。本発明は、この付加情報をオーディオ信号に埋め込むことによって、補助データ領域が存在しない記憶媒体や、補助データ領域が存在しないデータフォーマットにリミックス信号を再生できる方法及び装置を提供するという効果がある。
また、本発明による信号処理方法及び装置によれば、ミックス信号をリミックスするに当たり、ユーザが入力した制御情報を記憶させた後、後でそのミックス信号をリミキシングするのに利用できるため、ユーザが希望通りにリミキシングしたミックス信号を特別な操作なしに反復再生できるという効果がある。
また、本発明による信号処理方法及び装置によれば、パニング効果またはフェーディング効果を特定区間に適用するに当たり、区間内における制御情報を除外させても、以降同じ効果を奏するソース制御情報を再生できるため、制御情報のデータ容量を最小化できるという効果がある。
また、本発明による信号処理方法及び装置によれば、ユーザにより記憶されたソース制御情報がミックス信号またはミックス信号の付加情報とは独立して流通され、他のユーザによっても消費することができるため、ミックス信号をリミキシングしたユーザは編曲者または編集者となることができるという効果がある。
また、本発明による信号処理方法及び装置によれば、低いビット率を持つ付加情報を用いてミックス信号に含まれた特定のソース信号をリミキシングすることができる。また、別のソース信号が存在しないミックス信号からソース信号別パラメータを生成できるという効果を提供する。
また、本発明による信号処理方法及び装置によれば、デコーディング装置でミックス信号を用いてソース信号別パラメータを生成できるという効果を提供する。また、ユーザが直接生成したソース信号が合成されたミックス信号を生成するという効果を提供する。
本発明の一実施例による第1信号処理装置のブロック図である。 ステレオ信号を用いる場合、図1に示す第1信号処理装置の詳細ブロック図である。 本発明の一実施例によるメディア信号を処理するためのドメインである。 本発明の一実施例による第2信号処理装置のブロック図である。 本発明の一実施例による第3信号処理装置のブロック図である。 ステレオ信号を用いる場合、図5に示す第3信号処理装置の詳細ブロック図である。 本発明の一実施例による第4信号処理装置のブロック図である。 通常のエンコーディング装置及び本発明の一実施例による信号処理装置の結合を示すブロック図である。 通常のデコーディング装置及び本発明の一実施例による信号処理装置の結合を示すブロック図である。 本発明の一実施例による第5信号処理装置のブロック図である。 本発明の一実施例によるミックス信号ビットストリーム及び付加情報ビットストリームのデータ構造を示す図である。 図10に示す付加情報ビットストリームの詳細データ構造を示す図である。 本発明の一実施例による第6信号処理装置のブロック図である。 図13に示す第6信号処理装置を構成する埋め込み部の詳細ブロック図である。 本発明の一実施例による付加情報を埋め込む方法を示す図である。 本発明の一実施例による付加情報を再構成したデータ構造を示す図である。 本発明の一実施例による埋め込まれた付加情報を用いてオーディオ信号をデコーディングする第7信号処理装置のブロック図である。 元信号を保存しながら付加情報を埋め込む本発明の一実施例による第8信号処理装置を構成する埋め込み部の詳細ブロック図である。 本発明の一実施例による元信号を保存しながら付加情報を埋め込む方法を示す図である。 元信号を完全に復元する本発明の一実施例による第8信号処理装置のブロック図である。 本発明の一実施例による2つのチャネルのオーディオ信号に付加情報を埋め込む第1方法を示す図である。 本発明の一実施例による2つのチャネルのオーディオ信号に付加情報を埋め込む第2方法を示す図である。 本発明の一実施例による埋め込まれた付加情報を除去する第9信号処理装置のブロック図である。 本発明の一実施例による付加情報が埋め込まれたミックス信号のビットストリームを生成する第10信号処理装置のブロック図である。 図24に示す第10信号処理装置の詳細ブロック図である。 本発明の一実施例によるミックス信号に付加情報を埋め込む第11信号処理装置のブロック図である。 本発明の一実施例によるミックス信号を制御するための第11信号処理装置のブロック図である。 本発明の一実施例によるパニング効果において、始点情報、終点情報並びに始点及び終点におけるゲインファクタを説明するための図である。 本発明の一実施例によるフェーディング効果において、始点情報、終点情報並びに始点及び終点におけるゲインファクタを説明するための図である。 本発明の一実施例によるソース制御情報の目録を表示した画面例を示す図である。 本発明の一実施例によるソース制御情報の目録を表示した画面例を示す図である。 本発明の一実施例によるミックス信号を制御するための第12信号処理装置のブロック図である。 本発明の一実施例によるミックス信号処理方法を示すフローチャートである。 本発明の一実施例によるソース制御情報が生成されて用いられる過程を示す図である。 本発明の一実施例によるミックス信号を制御するための第13信号処理装置のブロック図である。 本発明の一実施例によるミックス信号処理方法を示すフローチャートである。 本発明の一実施例によるミックス信号を制御するための第14信号処理装置のブロック図である。 本発明の一実施例によるミックス信号処理方法を示すフローチャートである。 本発明の一実施例による付加情報を生成する方法を示すフローチャートである。 本発明の一実施例による特定のソース信号を替えるための第15信号処理装置を示すブロック図である。 本発明の一実施例による第16信号処理装置のブロック図である。 本発明の一実施例による第17信号処理装置のブロック図である。 本発明の一実施例によるミックス信号変形部の内部ブロック図である。 本発明の一実施例によるソース信号提供サーバを用いて信号処理する方法を示す図である。 本発明の一実施例によるミックス信号を変形する方法を示すフローチャートである。 本発明の一実施例によるミックス信号を変形する方法を示すフローチャートである。
以下、添付の図面を参照しつつ、本発明の好適な実施例について詳細に説明する。ただし、本明細書及び請求範囲に用いられた用語や単語は通常的または辞書的な意味に限定して解釈されてはならず、発明者は自身の発明を最善の方法で説明するために用語の概念を適宜定義することができるという原則に立ち、本発明の技術的思想に符合する意味及び概念として解釈されなければならない。したがって、本明細書に記載された実施例と図面に示された構成は、本発明の最も好ましい一実施例に過ぎないもので、本発明の技術的思想を限定するためのものではない。したがって、本出願時点においてこれらに代わる様々な均等物と変形例が存在しうることは明らかである。
図1は、本発明の一実施例による第1信号処理装置のブロック図である。この第1信号処理装置は、付加情報生成部103及び付加情報エンコーディング部105を含む。
図1を参照すると、付加情報生成部103は、通常のミックス信号101及びミックス信号を構成するソース信号102を用いて付加情報104を生成する。ミックス信号101は、モノ、ステレオ及びマルチチャネルオーディオ信号とすることができる。ソース信号102は、ミックス信号101を構成するソース信号の一部を含んでもよく、全部を含んでもよい。付加情報104は、ミックス信号をソース信号単位で処理するのに用いられる情報のことを指す。付加情報104は、ミックス信号をリミキシングするためのミックスパラメータを含む。このミックスパラメータには、エンコーダでソース信号を用いて生成されたエンコーダミックスパラメータを含み、選択的にミックス信号のみを用いて生成されたブラインドミックスパラメータを含むことができる。ミックスパラメータの例には、それぞれのソース信号に対するゲイン値及びサブバンドパワーなどがある。付加情報104に対する具体的な定義及び生成方法は、図2で説明する。本発明は、また、ミックス信号を構成するソース信号102のみを用いて付加情報104を生成することもできる。付加情報エンコーディング部105は、生成された付加情報104をエンコーディングし、符号化された付加情報信号106を生成する。ミックス信号101及び付加情報信号106は、デコーディング装置に伝送される。
図2は、ステレオ信号を用いる場合の、図1に示す第1信号処理装置の詳細ブロック図である。前述したように、本発明で用いられるミックス信号は、モノ、ステレオ及びマルチチャネルオーディオ信号とすることができるが、便宜上、ステレオ信号201を基準にして説明する。
Figure 0005174027
Figure 0005174027
Figure 0005174027
本発明の目的は、M個(0≦M≦I)のソース信号がリミックスされるように、該ソース信号を含むステレオ信号を修正することにある。これらソース信号は互いに異なるゲインファクタを持ちながらステレオ信号にリミックスすることができる。リミックス信号は式2のように表現することができる。
Figure 0005174027
ここで、ci及びdiは、リミックスされるM個のソース信号に対する新しいゲインファクタである。ci及びdiはデコーダ端より提供することができる。この場合、付加情報生成部206は、ステレオ信号201及びM個のソース信号202を用いて付加情報207を生成することができる。
上述の如く、本発明の目的は、通常のステレオ信号と若干の付加情報が与えられる場合に、ステレオ信号をソース信号単位でリミックスすることにある。本発明におけるように、ごく少ない量の付加情報を用いて上記の式1で表現されるミックス信号から上記の式2で表現されるリミックス信号を完璧に生成することは不可能である。
Figure 0005174027
図2を参照すると、第1信号処理装置に通常のステレオ信号201及びステレオ信号201に含まれるM個のソース信号202が入力される。ステレオ信号201は、付加情報と同期させるためにある程度ディレーされ、出力信号として直接用いることができる。付加情報を生成するために、ステレオ信号201及びソース信号202は、フィルタバンク203を通じて時間−周波数ドメインのサブバンド別信号204及び205に分解される。すなわち、ステレオ信号201及びソース信号は時間−周波数ドメインで処理される。この時間−周波数ドメインについては図3で後述する。サブバンド別信号204は、各サブバンドの中心周波数で同様に処理される。特定の周波数でステレオ信号201のサブバンド対204はx1(k)及びx2(k)で表示される。ここで、kはサブバンド信号の時間インデックスである。同様に、M個のソース信号202のサブバンド信号205は、s1(k),s2(k),…,sM(k)で表示される。明瞭な表現のために、サブバンド(周波数)インデックスを使用しなかった。
これらのソース信号202のサブバンド信号205が与えられると、付加情報生成部206は、サブバンド別にショート−タイムサブバンドパワーE{si 2(k)}を生成する。また、付加情報生成部206は、ステレオ信号201のサブバンド対204を用いて、サブバンド別にゲインファクタai及びbiを生成する。このゲインファクタai及びbiは、外部から直接与えることができる。このサブバンド別ショート−タイムサブバンドパワー及びゲインファクタを用いてサブバンド別付加情報207が生成される。付加情報生成部206は、ショート−タイムサブバンドパワー及びゲインファクタの他にステレオ信号に関連した他の情報を付加情報207として生成できる。付加情報エンコーディング部208は、サブバンド別付加情報207を用いて、符号化された付加情報信号209を生成する。
多数のステレオ信号201に対して、ゲインファクタai及びbiは不変とする。ai及びbiが時間kによって変化するとすれば、これらゲインファクタは時間の関数として生成される。これらゲインファクタは直接量子化及び符号化せずに、まず、より量子化及び符号化に適合した他の値に変形することができる。また、E{si 2(k)}はステレオ信号201のサブバンドパワーに相対的な値に正規化することができる。これは、ステレオ信号を効率的に符号化する目的で通常のエンコーディング装置が用いられる場合に、本発明を相対的に変化に強くさせる。例えば、ai及びbiは、式3で表現されるゲイン及びデシベル(dB)単位のレベル差に変換して伝送することができる。
Figure 0005174027
また、E{si 2(k)}は付加情報として直接符号化されるのではなく、式4で表現されるステレオ信号に相対的に定義された値に変換して伝送することができる。
Figure 0005174027
ショート−タイムサブバンドパワーを生成するために、本発明は単一ポール平均を使用する。すなわち、E{si 2(k)}は、式5のように計算することができる。
Figure 0005174027
Figure 0005174027
Figure 0005174027
ここで、fsはサブバンドサンプリング周波数を表す。例えば、T=40msを利用できる。
Figure 0005174027
Figure 0005174027
同様に、biは、式8のように計算される。
Figure 0005174027
図3は、本発明の一実施例によるメディア信号を処理するためのドメインを示す。前述したように、オーディオ信号及び付加情報は、図3に示すような時間−周波数ドメインのサブバンド別信号として処理される。この時間−周波数ドメインのサブバンド別信号は知覚的に誘導される。例えば、約20msの長さを持つサイン波分析窓及び統合窓を持つSTFT(Short Time Fourier transform)を用いてサブバンド別信号を生成できる。この時、STFT係数は、1つのグループがERB(equivalent rectangular bandwidth)の約2倍となる帯域幅を持つようにグループ化することができる。
図4は、本発明の一実施例による第2信号処理装置のブロック図である。図4を参照すると、ダウンミキシング部402は、複数のソース信号401を合算して1つの和信号404を生成する。第2信号処理装置は、第1信号処理装置とは違い、ステレオ信号を伝送する代わりに和信号404を伝送する。付加情報生成部403は、ソース信号401を用いて付加情報405を生成する。付加情報405は、各ソース信号に対応するサブバンドパワー及びゲインファクタを含む。また、付加情報405は、リミックスレンダリング部におけるディレーに対応するパラメータを含むことができる。第1信号処理装置におけると略同様に、付加情報405は、より量子化及び符号化に適合した他の値に変換して伝送することができる。付加情報エンコーディング部406は、生成された付加情報405を用いて、符号化された付加情報信号407を生成する。生成された和信号404及び付加情報信号407はデコーディング装置に伝送される。本発明はまた、ダウンミキシング部402を有しないエンコーディング装置を含む。この場合、ソース信号401は、和信号404に変換されず、各ソース信号401が直接伝送される。
図5は、本発明の一実施例による第3信号処理装置のブロック図である。この第3信号処理装置は、付加情報デコーディング部503及びリミックスレンダリング部505を含む。
図5を参照すると、ミックス信号501及び付加情報信号502が第3信号処理装置に入力される。ミックス信号501は、モノ、ステレオまたはマルチチャネルオーディオ信号とすることができる。付加情報デコーディング部503は、付加情報信号502をデコーディングして付加情報504を生成する。付加情報504は、伝送されたオーディオ信号501に含まれたソース信号のゲインファクタ及びサブバンドパワーなどを含む。リミックスレンダリング部505には、ユーザが直接提供する制御情報を用いて生成されたユーザミックスパラメータ506を入力することができる。リミックスレンダリング部505は、ミックス信号501、伝送された付加情報504及びユーザミックスパラメータ506を用いてリミックス信号507を生成する。リミックス信号を生成する方法についての具体的な説明は、図6で後述する。リミックス信号507は、伝送されたミックス信号のチャネル数と同じチャネル数を持つEqチャネルミックス信号として生成するか、または、ミックス信号のチャネル数より多いチャネル数を持つアップチャネルミックス信号として生成することができる。
図6は、ステレオ信号を用いる場合における、図5の第3信号処理装置を示す詳細ブロック図である。前述したように、伝送されたミックス信号は、モノ、ステレオ及びマルチチャネルオーディオ信号とすることができるが、便宜上、ステレオ信号601とする。
図6を参照すると、ステレオ信号601は、フィルタバンク603を通じて時間−周波数ドメインのサブバンド別信号604に分解される。図6に示すように、特定の周波数におけるサブバンド別信号604はx1(k)及びx2(k)で表現される。付加情報デコーディング部605は、伝送された付加情報信号602を復号化し、サブバンド別付加情報606を生成する。また、リミックスレンダリング部607に、ユーザが提供する制御情報を用いて生成されたユーザミックスパラメータ608を入力することができ、ユーザミックスパラメータ608はサブバンド別に提供することができる。前述したように、付加情報606は、リミックスされるM個のソース信号に対するサブバンド別ゲインファクタ(ai及びbi)及びE{si 2(k)}で表現されるサブバンドパワーを含む。
Figure 0005174027
リミックスレンダリング部607で生成されたリミックス信号609を生成する方法は、次の通りである。
Figure 0005174027
Figure 0005174027
サブバンド別リミックス信号609は、式10のように表現することができる。
Figure 0005174027
リミックス信号609を生成するために、最小二乗推定法を用いることができる。サブバンド別ミックス信号604x1(k)及びx2(k)が与えられると、式11のように、互いに異なるゲインを持つサブバンド別リミックス信号609がサブバンド別ミックス信号604の線形結合として推定することができる。
Figure 0005174027
ここで、w11(k),w12(k),w21(k)及びw22(k)は、重み係数である。このとき、生成される推定誤差は、式12のように定義することができる。
Figure 0005174027
重み係数w11(k),w12(k),w21(k)及びw22(k)は平均自乗誤差E{e1 2(k)}及びE{e2 2(k)}が最小となるようにサブバンド別に生成することができる。このとき、推定誤差e1(k)及びe2(k)がx1(k)及びx2(k)に直交する時に、平均自乗誤差が最小となることを利用することができる。生成されるw11(k)及びw12(k)は、式13のように表現することができる。
Figure 0005174027
ここで、E{x1 2}、E{x2 2}及びE{x12}は、直接生成することができるが、E{x11}及びE{x21}は、伝送された付加情報606(例えば、E{si 2}、ai、bi)及びユーザが提供する制御情報608(例えば、ゲインファクタci及びdi)を用いて、式14のように生成することができる。
Figure 0005174027
同様に、w21及びw22を式15のように生成することができる。
Figure 0005174027
ここで、E{x12}及びE{x22}は、式16のように表現することができる。
Figure 0005174027
ミックス信号604の位相が互いに同期しているか、ほとんど同期している場合、式17で表現される値が1に近づく。
Figure 0005174027
この時、加重値は、式18のように表現することができる。
Figure 0005174027
このように生成されたサブバンド別リミックス信号609は、前述したように、逆フィルタバンク610を通じて時間−ドメインのリミックス信号611に変換される。リミックス信号611は、ユーザが提供した制御情報を用いて生成されたユーザミックスパラメータci及びdiを用いてそれぞれのソース信号を独立的にリミックスして生成されたリミックス信号と略同様に聞こえる。
以上では2チャネルステレオ信号のリミキシングに焦点を当てた。しかし、前述したように、本発明は、ステレオ信号に限定されず、マルチチャネルオーディオ信号、例えば5.1チャネルオーディオ信号をリミキシングすることにまで拡張可能である。当業者は、本明細書で記述されたステレオ信号と略同様にしてマルチチャネルオーディオ信号をリミキシングすることができる。この場合に、上記の式11は式19のように書き直すことができる。
Figure 0005174027
選択的に、ミックス信号のチャネルのうちの特定のチャネルはリミックスせずにそのまま残すようにすることができる。例えば、5.1サラウンドチャネルに対して、2つの後方チャネルは修正せずに、前方チャネルにのみリミキシングを適用するようにすることができる。この場合に、2または3チャネルリミキシングアルゴリズムが前方チャネルに適用される。
図7は、本発明の一実施例による第4信号処理装置のブロック図である。第4信号処理装置は、付加情報デコーディング部703、付加情報統合部705及びリミックスレンダリング部707を含む。
図7を参照すると、ソース信号の和信号701及び付加情報信号702が第4信号処理装置に入力される。付加情報デコーディング部703は、付加情報信号702をデコーディングして付加情報704を生成する。付加情報704は、ゲインファクタ、ディレー定数及びサブバンドパワーなどを含む。付加情報統合部705は、付加情報704を用いて、和信号701を複数のソース信号706に分離する。リミックスレンダリング部707は、ソース信号706を用いてリミックス信号709を生成する。この時、リミックスレンダリング部707は、付加情報として伝送されたミックスパラメータを用いてリミックス信号709を生成できる。また、リミックスレンダリング部707は、選択的に、ユーザが提供する制御情報を用いて生成されたユーザミックスパラメータ708を用いてリミックス信号709を生成することができる。
図8は、通常のエンコーディング装置と本発明の一実施例による信号処理装置との結合を示すブロック図である。ミックス信号801は、通常のエンコーディング装置803により符号化され、符号化されたミックス信号805に変換することができる。ミックス信号801は、チャネル別信号またはソース信号になりうる。通常のエンコーディング装置803は、AAC、MP3エンコーダなどのような従来のエンコーディング装置だけでなく、今後開発されるエンコーディング装置を含む。本発明によるリミックス信号エンコーディング装置804は、ミックス信号801及びミックス信号に含まれるソース信号802を用いて付加情報信号806を生成する。多重化部807は、符号化されたミックス信号805及び付加情報信号806を用いてビットストリーム808を生成する。前述したように、付加情報信号806は従来の装置と互換性を持つように、従来のミックス信号フォーマット内の補助データ領域に挿入することができる。
図9は、通常のデコーディング装置と本発明の一実施例による信号処理装置との結合を示すブロック図である。逆多重化部902は、伝送されたビットストリーム901から符号化されたミックス信号903及び付加情報信号904を分離する。その後、通常のデコーディング装置905は、符号化されたミックス信号903をデコーディングし、本発明によるリミックス信号デコーディング装置907で用いられうるようなミックス信号906を生成する。通常のデコーディング装置905は、AAC、MP3デコーダなどのような従来のデコーディング装置だけでなく、今後開発されるデコーディング装置を含む。ミックス信号906は、チャネル別信号またはソース信号になりうる。本発明によるリミックス信号デコーディング装置907は、付加情報信号904及びユーザミックスパラメータ908のうち少なくとも1つを用いてミックス信号906をリミックス信号909に変換できる。
図10は、本発明の一実施例による第5信号処理装置のブロック図である。図10を参照すると、第5信号処理装置は、ミックス信号デコーディング部1001、パラメータ生成部1002、及びリミックスレンダリング部1008を含む。選択的に、エフェクタ1011を含むことができる。パラメータ生成部1002は、ブラインドミックスパラメータ生成部1003、ユーザミックスパラメータ生成部1004、及びリミックスパラメータ生成部1005を含むことができる。リミックスパラメータ生成部1005は、Eqミックスパラメータ生成部1006を含み、選択的にアップミックスパラメータ生成部1007を含むことができる。また、リミックスレンダリング部1008はEqミックスレンダリング部1009を含み、選択的にアップミックスレンダリング部1010を含むことができる。
ミックス信号デコーディング部1001は、エンコーディング端から伝送された符号化されたミックス信号をデコーディングしてミックス信号を生成する。パラメータ生成部1002は、エンコーディング端から伝送された付加情報及びユーザ制御情報(または、構成情報)を受信する。ユーザ制御情報はエンコーダ端から伝送されずに、デコーダ端で生成されても良い。ユーザミックスパラメータ生成部1004は、ユーザ制御情報を用いてユーザミックスパラメータを生成する。エンコーダ端から伝送された付加情報にはエンコーダミックスパラメータを含むことができる。また、ブラインドミックスパラメータ生成部1003は、ミックス信号を用いてブラインドミックスパラメータを生成することができる。エンコーダミックスパラメータとブラインドミックスパラメータは択一的にリミックスパラメータ生成部1005に入力される。
リミックスパラメータ生成部1005は、付加情報及びユーザミックスパラメータを用いてリミックスパラメータを生成する。このリミックスパラメータはリミックス信号のチャネルに適用されうるように生成することができる。リミックスパラメータ生成部1005に含まれるEqミックスパラメータ生成部1006は、ミックス信号のチャネル数と同じチャネル数を持つリミックス信号を生成するのに用いられるリミックスパラメータを生成し、リミックスパラメータ生成部1005に含まれうるアップミックスパラメータ生成部1007は、ミックス信号のチャネル数よりも多いチャネル数を持つリミックス信号を生成するのに用いられるリミックスパラメータを生成する。リミックスパラメータはリミックスレンダリング部1008に入力される。
リミックスレンダリング部1008に含まれるEqミックスレンダリング部1009は、リミックスパラメータ及びミックス信号を用いて、ミックス信号のチャネル数と同じチャネル数を持つEqチャネルリミックス信号を生成する。リミックスレンダリング部1008に含まれうるアップミックスレンダリング部1010は、アップミックスパラメータ生成部1007で生成されたリミックスパラメータ及びミックス信号を用いて、ミックス信号のチャネル数よりも多いチャネル数を持つアップチャネルリミックス信号を生成する。アップミックスレンダリング部1010は、Eqチャネルレンダリング部1009で生成されたリミックス信号を用いてアップチャネルリミックス信号を生成しても良い。
したがって、第5信号処理装置は、エンコーディング端から伝送されたミックス信号をそのまま出力したり、Eqチャネルリミックス信号として出力したり、または、アップチャネルリミックス信号として出力することができる。選択的に、リミックスレンダリング部はエフェクタ1011から提供される情報を用いて、リミックス信号に多様な効果を与えることができる。
図11は、本発明の一実施例によるミックス信号ビットストリーム及び付加情報ビットストリームのデータ構造を示す図である。図11を参照すると、データ構造は、ミックス信号ビットストリーム1101及び付加情報ビットストリーム1102を含む。付加情報ビットストリーム1102は、ヘッダ領域1103及びデータ領域1104を含む。前述したように、本発明による信号処理装置は、図11に示すデータ構造を持つビットストリームを受信する。信号処理装置は、ミックス信号ビットストリーム1101をデコーディングして1つ以上のソース信号を含むミックス信号を獲得し、付加情報ビットストリーム1102をデコーディングして付加情報を獲得する。
付加情報は、ソース信号のうちリミックスされるソース信号とミックス信号との関係を表す情報を含む。例えば、付加情報は、レベル情報、時間遅延情報、相互相関情報、ミックス情報などを含む。
ここで、レベル情報は、リミックスされるソース信号のレベルを含むことができ、リミックスされるソース信号同士の相対的なレベルや、リミックスされるソース信号とミックス信号間の相対的なレベルを含むことができる。また、ミックス信号のレベルを別に付加情報に含めることができる。
時間遅延情報は、リミックスされるソース信号同士の時間遅延情報、または、リミックスされるソース信号とミックス信号間の時間遅延情報を含むことができる。相互相関情報は、リミックスされるソース信号同士の相互相関情報、または、リミックスされるソース信号とミックス信号間の相互相関情報、ミックス信号同士の相互相関情報を含むことができる。
ミックス情報は、特定ソースがミックス信号にミックスされる程度を表す情報で、例えば、特定ソースが右側に位置する効果が現れるようにミックスしたい場合、左側チャネルよりも右側チャネルにより大きい大きさで含まれるようにミックスを行なうことができる。このようにミックス情報は、各ソースが各チャネルにミックスされる程度を表すことができる。ミックス情報は、大きさの他に、ミックスに関連した時間遅延、相関関係などの情報を含むことが可能である。
本発明による信号処理装置は、付加情報ビットストリーム1102からミックスパラメータを獲得できる。ミックスパラメータは、ユーザが提供する制御情報を用いて生成される。このミックスパラメータは、エンコーディング装置で生成するか、または、デコーディング装置で生成することができる。デコーディング装置で生成される場合に、デコーディング装置はユーザから制御情報を受信し、該制御情報を用いてミックスパラメータを生成する。本発明による信号処理装置は、上記のミックス信号、付加情報及びミックスパラメータを用いてリミックス信号を生成する。次に、付加情報ビットストリームに含まれる情報について説明する。
図12は、図10に示す付加情報ビットストリームの詳細データ構造である。図12を参照すると、ヘッダ領域1201はヘッダ1 1203を含み、データ領域1202は複数のフレームデータ1204及び複数のヘッダ2 1205を含む。ヘッダ1 1203には、ミックス信号に含まれるソース信号の名前、ソース信号の特性、及び再生方法などのようなハイレベル情報を含む。
また、ヘッダ1 1203は、ソース信号のゲイン、ソース信号の数、サブバンド数などを含むことができる。また、ヘッダ1 1203は、選択的にソース信号の再生方法/構成方法を含むことができる。例えば、選択的にあらかじめ定められたユーザミックスパラメータを含めて上記再生方法/構成方法を規定できる。
また、ヘッダ1 1203は、選択的にゲイン及びパニングに対するリミキシング範囲を含むことができる。本発明による信号処理装置で、ミックス信号、付加情報、及びユーザミックスパラメータを用いてリミックス信号を生成する。この時、適当な程度の制御、例えば、特定のソース信号のエネルギーを+20dB〜−20dB程度調節したりすることは、再生品質に大きな影響を与えない。しかし、特定ソース信号のエネルギーを完全に抑圧するか、または、過度に大きく変形する場合には、再生品質の低下につながりうる。したがって、本発明による信号処理装置で調整可能な最大のゲイン、減衰レベルを設定し、再生品質を保障できる方法を提案する。例えば、減衰は最大−40dBまで可能にする等の方法を用いることができる。この場合に、ユーザが−80dBまで減衰するように調節する場合、実際デコーディング装置はこれをそのまま行なわずに、−40dBまでの減衰を行なうように動作する。この時、ユーザに指示した減衰を行わずに、あらかじめ定められたレベルまで減衰が行なわれていることを知らせることができる。
フレームデータ1204は、各サブバンド内に正規化されたソースパワーを含んでもよい。また、フレームデータ1204は、各フレームに含まれるデータタイプに関する情報を含んでもよい。例えば、1番目のデータタイプである場合、フレームデータ1204は最小の情報を含む。例えば、付加情報と関連したソースパワーのみを含んでもよい。2番目のデータタイプである場合、フレームデータ1204は追加的にアップデートされるゲインを含む。これは、時間によって変わるミキシングゲインを用いてリミックス信号を生成する場合に有用である。3番目及び4番目のデータタイプである場合、フレームデータ1204は、将来の使用のために保存領域に割り当てることができる。万一、ビットストリームが放送用に用いられる場合に、保存領域は、放送信号のチューニングを合わせるために必要な情報(例えば、サンプリング周波数、サブバンド数等)を含んでもよい。
図13は、本発明の一実施例による第6信号処理装置のブロック図である。第6信号処理装置は、付加情報生成部1303、付加情報エンコーディング部1305及び埋め込み部1307を含む。
図13を参照すると、ミックス信号1301及びソース信号1302が第6信号処理装置に入力される。前述したように、ミックス信号1301は、モノ、ステレオまたはマルチチャネルオーディオ信号とすることができる。本明細書では便宜上、ステレオ信号として説明するが、本発明がこれに限定されることはない。付加情報生成部1303は、ミックス信号1301及びソース信号1302を用いて付加情報1304を生成する。付加情報1304は、ミックス信号に含まれたソース信号がミックス信号チャネルにミックスされる程度を表すミックス情報、ミックス信号に含まれたソース信号同士の時間遅延情報またはソース信号とミックス信号チャネル間の時間遅延情報、及び、ミックス信号に含まれたソース信号同士の相互相関情報またはソース信号とミックス信号チャネル間の相互相関情報を含む。
付加情報エンコーディング部1305は、付加情報1304を用いて、伝送及び記憶のための付加情報信号1306を生成する。埋め込み部1307は、付加情報信号1306をミックス信号1301に埋め込む。この時、“デジタル信号埋め込み技法”を用いることができる。“デジタル信号埋め込み技法”を用いると、PCM型のミックス信号1301に音質歪み無しで付加情報を埋め込むことができる。
Figure 0005174027
“デジタル信号埋め込み技法”には、ビット置換符号化方法、反響挿入方法、帯域拡散通信法などがある。ビット置換符号化方法は、量子化されたミックス信号サンプルの最下位ビットを変形して所望の情報を挿入する方法で、最下位ビットの変形はミックス信号の品質にほとんど影響を与えないという特性に着目した方法である。反響挿入方法は、人の耳に聞こえない程度の小さな大きさの反響をミックス信号に挿入する方法である。帯域拡散通信法は、離散コサイン変換、離散フーリエ変換等を通じてミックス信号を周波数領域に変換した後に、二進数にした所望の情報をPN(Pseudo Noise)シーケンスに帯域拡散し、周波数領域に変換されたミックス信号に追加する方法である。本発明では、上記埋め込み方法の中でもビット置換符号化方法を中心にして記述するが、本発明がビット置換符号化方法に限定されるわけではない。
図14は、図13に示す第6信号処理装置を構成する埋め込み部の詳細ブロック図である。埋め込み部1307は、バッファ1403、マスキング限界値計算部1405、ビットストリーム再構成部1407及びミックス信号エンコーディング部1409を含む。上記ビット置換符号化方法によって付加情報をミックス信号成分の非知覚領域に埋め込むことができる。この時、非知覚領域の大きさ(以下、K値という。)は、最下位1ビットのみを使用するのではなく、あらかじめ定められた方法によって特定領域のK(K>0)ビットを使用することができる。例えば、あらかじめ定められた方法とは、心理音響モデルによるマスキング限界値を求め、このマスキング限界値によって適当なビットを割り当てることをいう。
図14を参照すると、ミックス信号1401は、バッファ1403を介してミックス信号エンコーディング部1409に入力される。マスキング限界値計算部1405は、入力されたミックス信号1401の特性に関する情報1404を用いて、一定の区間(例えば、ブロック)別にマスキング限界値を求める。また、マスキング限界値計算部1405は、マスキング限界値を用いて、聴覚的な歪みを発生させずに変更できるK値を求める。すなわち、付加情報1402をミックス信号1401に埋め込むのに使用できるビット数をブロック別に割り当てる。本明細書で、ブロックとは、フレーム中に存在する1つのK値を用いて挿入されたデータ単位のことをいう。1つのフレームには1つ以上の複数のブロックが存在でき、したがって、フレームの長さ固定の場合、ブロックの長さは、ブロックの個数が増加するにつれて減少する。
ビットストリーム再構成部1407は、K値を含むように付加情報を再構成することができる。この時、再構成された付加情報には、シンクワード、エラー検出コードまたはエラー訂正コードなどが含まれる。ミックス信号エンコーディング部1409は、再構成された付加情報1408をミックス信号1401に埋め込み、付加情報の埋め込まれたミックス信号1410を出力する。前述したように、再構成された付加情報1408は、上記ミックス信号のKビット内に埋め込まれる。K値は再構成された付加情報1408に挿入されてデコーディング装置に伝送され、デコーディング装置では該K値を用いてミックス信号から付加情報を抽出することができる。
付加情報がブロック別にミックス信号に埋め込まれる過程には多様な方法が用いられる。第1の方法は、単に、ミックス信号の下位Kビットのみを0に置換した後、付加情報を加える方法である。例えば、K値が3で、ミックス信号の1サンプルデータが11101101で、埋め込むべき付加情報データが111である場合、11101101の下位3ビットを0に替えて11101000にした後、付加情報データ111を加算して11101111とする。
第2の方法は、ディザリング方法を用いるもので、まず、付加情報データをミックス信号の下位Kビットから減算した後に、該ミックス信号をK値に基づいて再量子化し、再量子化したミックス信号に対して付加情報データを加算する方法である。例えば、K値が3で、ミックス信号の1サンプルデータが11101101で、埋め込むべき付加情報データが111である場合、この11101101から111を引いて11100110にし、下位3ビット以上に対して再量子化して11101000(四捨五入を適用)にし、その後に111を加算して11101111にする。
ミックス信号に埋め込まれる付加情報は、任意のビットストリームであるために白色雑音的な特性を持つことができないという可能性もある。ミックス信号に白色雑音形態の信号が加えられるのが音質特性の上で有利なため、付加情報を白色化する過程を行なった後にミックス信号に加えることができる。白色化は、シンクワードを除外した付加情報信号に適用することができる。本発明でいう白色化とは、ミックス信号の音量が全ての周波数領域で同一または類似な大きさを持つランダムな信号とすることを指す。また、付加情報をミックス信号に埋め込む過程に、付加情報にノイズシェービング技法を適用して聴覚的歪みを最小化できる。本発明でいうノイズシェービングとは、量子化過程で生成される量子化ノイズのエネルギーが可聴周波数帯域以上の高周波数帯域に移動するようにノイズ特性を変形させるか、該当のミックス信号からマスキング限界値を求め、該マスキング限界値に対応する時変フィルタを生成し、このフィルタによって量子化過程で発生するノイズの特性を変形させる過程のことを指す。
図15には、本発明の一実施例による付加情報を埋め込む方法を示す。付加情報は、様々な方式でミックス信号に埋め込むことができ、図15は、サンプルプレーン順に付加情報を埋め込む方式に該当する。この埋め込み方法は、Kビット単位で該当のブロックに対する付加情報を分散して埋め込む。図示の如く、K値が4で、1ブロック1505がN個のサンプル1504で構成された場合、付加情報は、各サンプルの下位4ビットに埋め込むことができる。前述の如く、本発明は、各サンプルの下位4ビットにのみ付加情報を埋め込むことに限定されるわけではない。そして、各サンプルの下位Kビット内で、付加情報は、図15に示すように上位ビットから埋め込むか(MSB(Most Significant Bit) first)、または、下位ビットから埋め込む(LSB(Least Significant Bit) first)ことができる。
同図で、矢印1503は埋め込まれる方向を表し、括弧中の数字はデータ整列順序を表す。付加情報が埋め込まれる領域で埋め込み可能なビット数よりも埋め込むべき付加情報のビット数が小さい場合には、残っているビットを0で埋めたり(1506)、ランダム信号を入れたり、または、元のミックス信号に替えることができる。例えば、ブロックを構成するサンプル数Nが100で、K値が4の場合、該ブロックに埋め込み可能なビット数Wは、W=N*K=100*4=400ビットとなる。埋め込むべき付加情報のビット数Vが390ビットである場合(すなわち、V<Wである場合)、残りの10ビットは0で埋めたり、ランダム信号を入れたり、元のミックス信号に替えたり、データの終わりを知らせる末端ビット列で埋めたり、または、これらを組み合わせて埋めることができる。末端ビット列とは、該当のブロックにおいて付加情報の終わりを知らせるビット列のことをいう。たとえ、図15はブロック別に残っているビットを埋めるとしたが、本発明は、挿入フレーム別に残っているビットを上記のような方法で埋めても良い。
図16は、本発明の一実施例による付加情報を再構成したデータ構造を示す。前述の如く、付加情報は、ビットストリーム再構成部でシンクワード1603とK値1604を含むように再構成することができる。また、再構成過程で、付加情報信号が伝送または記憶過程で損傷したか否かを判断できる少なくとも1つのエラー検出コードまたはエラー訂正コード1606,1608(以下、‘エラー訂正コード’と総称する。)を、再構成された付加情報信号に含むことができる。エラー訂正コードはCRC(Cyclic Redundancy Check)を含む。エラー訂正コードは、2段階に分けて含むことができるが、K値の含まれたヘッダ1601に対するエラー訂正コード1 1606と付加情報データ1607に対するエラー訂正コード2 1608を含むことができる。その他、其の他情報1605が単独で付加情報信号に含まれうる。其の他情報1605には付加情報の埋め込み方法に対する識別情報などを含むことができる。
図17は、本発明の一実施例による埋め込まれた付加情報を用いてオーディオ信号をデコーディングする第7信号処理装置のブロック図である。第7信号処理装置は、埋め込み信号デコーディング部1702、付加情報デコーディング部1704及びリミキシング部1706を含む。
図17を参照すると、埋め込み信号デコーディング部1702は、ミックス信号1701から付加情報信号1703を検出できる。付加情報デコーディング部1704は付加情報信号を復号化し、付加情報1705を生成する。リミックスレンダリング部1706は、付加情報1705及びミックス信号1701を用いて、リミックス信号1708を生成する。この時、リミックスレンダリング部1706は、ユーザが提供する制御情報を用いて生成されたユーザミックスパラメータ1707を利用できる。
図18は、元信号を保存しながら付加情報を埋め込む本発明の一実施例による第8信号処理装置を構成する埋め込み部の詳細ブロック図である。第8信号処理装置は、図13に示す第6信号処理装置と略同様であり、同一部分についての詳細な説明は省略する。第6信号処理装置との差異点は、エンコーディング装置を構成する埋め込み部が異なるように構成されているという点である。
図18を参照すると、ミックス信号1801は、バッファ1803を介してミックス信号エンコーディング部1809に入力される。マスキング限界値計算部1805は、ミックス信号1801の特性に関する情報1804を用いてマスキング限界値を計算し、マスキング限界値を用いてK値1806を求める。ビットストリーム再構成部1807は、付加情報信号1802が埋め込まれる領域のミックス信号データ1811を除去せずに、ミックス信号データ1811と付加情報信号1802とを結合するように再構成する。再構成方法については図19でより詳細に説明される。ミックス信号エンコーディング部1809は、再構成された信号1808をミックス信号1801に埋め込むことができる。
図19は、本発明の一実施例による元信号を保存しながら付加情報を埋め込む方法を示す図である。説明の便宜上、ミックス信号の1チャネル1901を構成する1つのブロックに付加情報を挿入するとして説明する。図19を参照すると、ミックス信号1901の成分は、付加情報が埋め込まれない領域1902と埋め込まれる領域1903とに分けられる。埋め込まれる領域1903のミックス信号は、無損失符号化1904過程を経る。その後、無損失符号化されたミックス信号及び付加情報信号1905は結合及びエンコーディングされ、結合信号1907を形成する。その後、結合信号1907はミックス信号に埋め込まれ、結合信号の埋め込まれたミックス信号1908を生成する。
こうすることによって、デコーディング装置では、必要な場合、結合信号1907を用いて、元のミックス信号1901を完璧に復元できる。上記方法が可能な理由は、埋め込むべき付加情報信号のデータ量が埋め込み可能なデータ量よりも実際に小さく、よって、無損失符号化されたミックス信号を挿入する空間を確保できるためである。単純に付加情報信号を埋め込む方法は、知覚的に埋め込まれた信号と元の信号が同一であることから歪みは生じないが、完全に同一な信号ではないため、完全な元の信号の復元が必要な場合、上記方法を用いることができる。
図20は、元信号を完全に復元する本発明の一実施例による第8信号処理装置のブロック図である。第8信号処理装置は、埋め込み信号デコーディング部2002、無損失デコーディング部2004及びリプレーシング部2006を含む。
図20を参照すると、埋め込み信号デコーディング部2002は、結合信号が埋め込まれたミックス信号2001から、結合信号2003を抽出する。無損失デコーディング部2004は、結合信号2003を用いて結合信号の埋め込まれた領域に対応するミックス信号2005を復元する。リプレーシング部2006は、復元されたミックス信号2005を用いて元の信号2007を生成する。
Figure 0005174027
図21は、本発明の一実施例による2チャネルのミックス信号に付加情報を埋め込む第1の方法を示す。この第1の方法は、各チャネルのフレームが複数のブロック(長さB)で構成された場合に、付加情報を少なくとも1チャネルを持つミックス信号に挿入する方法に関する。図示の如く、K値は、各チャネル別及びブロック別にそれぞれ異なる値を有するか、または、同一値を有することができる。K1、K2、K3及びK4値は、フレーム全体に対して1回伝送されるフレームヘッダ内に記憶することができ、該フレームヘッダはLSBに位置することができる。この場合に、ヘッダはビットプレーン単位で挿入することができ、付加情報データはサンプル単位で交互に挿入するか、または、ブロック単位で交互に挿入することができる。図21は、フレーム内のブロック個数が2の場合を示し、したがって、ブロックの大きさBはN/2となる。この場合に、フレームに挿入されたビット数は(K1+K2+K3+K4)*Bとなる。
図22は、本発明の一実施例による2チャネルのミックス信号に付加情報を埋め込む第2の方法を示す。第2の方法は、付加情報を2チャネルに分けて埋め込むもので、その順序をLSB(またはMSB)からビットプレーン順に2チャネルに交互に挿入する方法と、サンプル単位で交互に挿入する方法とを混合したものである。この方法は、フレーム単位とするか、または、図示のようにブロック単位とすることができる。図22に示すように、1乃至C(ハッチング部分)はヘッダに対応する部分で、挿入フレームシンクワードの探索を容易にするためにLSBまたはMSBにビットプレーン順に挿入することができる。C+1以上(非ハッチング部分)はヘッダ以外の部分で、付加情報データを読み取りやすくするようにサンプル単位で2チャネルに交互に挿入することができる。K値は、各チャネル及びブロック別に異なる値を持つか、または、同一の値を持つことができる。
図23は、本発明の一実施例による埋め込まれた付加情報を除去する第9信号処理装置を示すブロック図である。コンテンツに対する著作権保護などの目的で、付加情報が挿入されているミックス信号から付加情報のみを除去したり変形させたりして、それ以上リミックスのための付加情報が残らないようにする方法である。
図23を参照すると、分析部2302は、付加情報の埋め込まれたミックス信号2301を分析し、付加情報の埋め込まれた領域に関する情報などのような埋め込み情報2303を抽出する。除去部2304は、埋め込み情報2303を用いて、付加情報の埋め込まれたミックス信号2301から付加情報を除去し、付加情報の除去されたミックス信号2305を生成する。このとき、付加情報を除去するために様々な方法を用いることができる。その第一の方法は、分析部2302を通じてミックス信号から、埋め込まれた付加情報の存在の有無を確認し、埋め込まれたレベル値などを見出して除去範囲を確定する。その後、正確に付加情報の埋め込まれたビット列を除去する。第二の方法は、分析部2302を通じて音質に歪みを生じさせずに、埋め込み可能なランダムノイズのレベル値(K値に類似する)を見出し、それに該当するランダム信号を添加して挿入された付加情報を破壊するものである。第三の方法は、オールパスフィルタを用いて信号を変形させるものである。第四の方法は、最下位1ビットを任意のランダム信号に替えることによって、シンクワード情報を除去するものである。
図24は、本発明の一実施例による付加情報が埋め込まれたミックス信号のビットストリームを生成する第10信号処理装置のブロック図である。図24を参照すると、エンコーディング装置は、付加情報抽出部2401、ミックス信号エンコーディング部2402、及び多重化部2403を含む。付加情報の埋め込まれたミックス信号をエンコーディング(例えば、AAC(Advanced Audio Coding)エンコーディング)しなければならない場合が発生しうる。この時、一般的なAACエンコーディングをする場合に、埋め込まれた情報の強じん性が非常に欠けるため、エンコーディングする過程で完全に消滅することがある。しかし、エンコーディングされる前に付加情報の埋め込まれたミックス信号から付加情報を抽出した後にミックス信号を圧縮符号化すると、圧縮されたミックス信号と一緒に付加情報を伝送することができる。このような方法を下記に詳細に説明する。
まず、付加情報抽出部2401は、付加情報の埋め込まれたミックス信号から付加情報を抽出する。付加情報の抽出方法は、図1で説明した方法とすれば良い。その後、ミックス信号エンコーディング部2402は、付加情報の抽出されたミックス信号を圧縮符号化し、多重化部2403は、符号化されたミックス信号及び付加情報を多重化してビットストリームを生成する。付加情報が空間情報であれば、多重化されたビットストリームは空間情報を持つ圧縮されたビットストリームになり得る。例えば、AAC+MPEG サラウンド信号になり得る。
この時、付加情報がPCM型のミックス信号と時間的に整列されて使われる信号であれば、符号化されるミックス信号のフレーム単位と付加情報の挿入される単位とが整列される必要がある。付加情報の抽出過程からわかるフレームシンク情報を用いてミックス信号のエンコーディング開始位置を合わせる過程が必要である。また、埋め込まれた情報のフレーム長情報を用いてミックス信号のフレーム長を決定することができる。該フレーム長情報を用いる方法については後述する。上記のような方法で生成された最終ビット列は、データレートが非常に低いながらも付加情報を持っているため、マルチチャネル信号を非常に低いビット率を持つ信号として生成し、記憶及び伝送に非常に便利に使用することができる。
図25は、図24に示す第10信号処理装置の詳細ブロック図である。図25を参照すると、エンコーディング装置は、バッファリング部2505をさらに含むことができる。また、エンコーディング装置の構成要素である付加情報抽出部2501は、シンク情報抽出部2502、ヘッダ情報抽出部2503、及びペイロード抽出部2504を含む。
まず、シンク情報抽出部2502は、付加情報の埋め込まれたミックス信号Lo’,Ro’から付加情報のシンク情報を抽出する。シンク情報が見つけられると、該当のシンク情報の最初のサンプルに対応する位置がフレームシンク値となり、このフレームシンク値をバッファリング部2505に伝達される。バッファリング部2505は、フレームシンク値を用いてフレームの開始位置を把握し、該当の位置からミックス信号フレーム長分のデータをバッファリングし、これをミックス信号エンコーディング部2506に伝達する。
一方、ヘッダ情報抽出部2503は、シンク情報を抽出した後に存在する付加情報のヘッダ領域をデコーディングし、復号化に必要なヘッダ情報を抽出する。該ヘッダ情報は、付加情報に含まれるデータ情報に該当するペイロード情報を復号化するのに用いることができる。この時、ヘッダ領域から抽出された付加情報のフレーム長情報をバッファリング部2505またはミックス信号エンコーディング部2506に伝達できる。ミックス信号エンコーディング部2506は、フレーム長情報を用いてミックス信号のフレーム長を決定できる。
ペイロード抽出部2504は、付加情報のうちシンク情報及びヘッダ情報を除外した実際のデータ情報を抽出する。ミックス信号エンコーディング部2506は、シンク情報及びフレーム長情報を用いてミックス信号を符号化する。その後、多重化部2507は、符号化されたミックス信号及び付加情報を用いてビットストリームを生成する。
図26は、本発明の一実施例によるミックス信号に付加情報を埋め込む第11信号処理装置のブロック図である。図26を参照すると、第11信号処理装置は、逆多重化部2601、ミックス信号デコーディング部2602、及び埋め込み部2603を含む。
逆多重化部2601は、ビットストリームを逆多重化し、符号化されたミックス信号及び該ミックス信号に埋め込む付加情報を抽出する。その後、ミックス信号デコーディング部2602は、符号化されたミックス信号を復号化し、復号化されたミックス信号Ld及びRdを出力する。埋め込み部2603は、復号化されたミックス信号に付加情報を埋め込み、付加情報の埋め込まれたミックス信号Ld’及びRd’を生成する。ミックス信号は、CDなどのPCM信号記憶媒体に記憶及び伝送することができる。
図27は、本発明の一実施例によるミックス信号を制御するための第11信号処理装置のブロック図である。図27を参照すると、第11信号処理装置は、ミックス信号制御装置2710及びミックス信号処理装置2720を含む。ミックス信号制御装置2710は、ミックス信号処理装置2720と連係しており、制御部2711、メモリ2712、入力部2713、ディスプレイ2714、及び通信部2715を含む。ここで、ミックス信号処理装置2720は、図5に基づいて説明した第3信号処理装置と同様であり、その説明は省略する。
メモリ2712は、ミックス信号の識別情報別ソース制御情報が記憶されている記憶装置である。この場合、ミックス信号の識別情報は、付加情報デコーディング部2723から受信したミックス信号の付加情報siであっても良く、ミックス信号2721それ自体であっても良い。一方、ソース制御情報は、ソース別チャネル別ゲインファクタを含むことができ、ここで、ゲインファクタは、図6と共に上述したゲインファクタ(ci及びdi)608と同一なものとすれば良いが、本発明がこれに限定されるわけではない。また、ゲインファクタci及びdiが時間によって変化する場合、時間インデックスkを付けてci(k)、di(k)(kは時間インデックス)で表記すると、上記の式10は、下記の式20のように書き直すことができる。
Figure 0005174027
一方、ソース制御情報は、特定区間におけるパニング効果に関する制御情報を含むことができ、例えば、2分24秒から2分42秒までの区間で人の音声信号が右側チャネルから左側チャネルに徐々に移動するようにすることがパニング効果である。この場合、始点情報(例:ks=2分24秒)、終点情報(例:kf=2分42秒)、始点におけるゲインファクタ(例:ci(ks)=1、di(ks)=0)、終点におけるゲインファクタ(ci(kf)=0、di(kf)=1)のみを含み、始点及び終点間におけるゲインファクタ(ci(k)、di(k)、ここで、ks<k<kf)は含まない。
図28は、本発明の一実施例によるパニング効果の場合、始点情報、終点情報、並びに始点及び終点におけるゲインファクタを説明するための図である。図28を参照すると、k=ks(始点)及びk=kf(終点)におけるゲインファクタci,diが表示されており、始点及び終点間のゲインファクタはハッチング表示されている。始点及び終点におけるゲインファクタがソース制御情報としてメモリ2712に記憶されていると、それらの区間におけるゲインファクタ(ハッチング部分)は制御部2711により生成することができる。
また、ソース制御情報は、特定区間におけるフェーディング効果に関する制御情報を含むことができ、例えば、1分24秒から1分42秒までの区間で女性の音声信号が徐々に高まるか、または、徐々に低くなるということがフェーディング効果である。この場合も、パニング効果の場合と同様に、始点情報(例:ks=1分24秒)、終点情報(例:kf=1分42秒)、始点におけるゲインファクタ(例:ci(ks)=0、di(ks)=0)、終点におけるゲインファクタ(ci(kf)=1、di(kf)=1)のみを含み、始点及び終点間におけるゲインファクタ(ci(k)、di(k)、ここで、ks<k<kf)は含まない。
図29は、本発明の一実施例によるフェーディング効果の場合、始点情報、終点情報並びに、始点及び終点におけるゲインファクタを説明するための図である。図29の場合も、図28の場合と同様に、始点及び終点区間におけるゲインファクタ(ハッチング部分)は、メモリ2712に記憶されていなくても制御部2711により生成することができる。
制御部2711は、メディア信号の識別情報に基づいてミックス信号とマッチングするソース制御情報ciをメモリ2712から読み取り、これをミックス信号処理装置2720に出力する。好ましくは、ミックス信号とマッチングする制御情報ciが存在する場合、制御部2711はソース制御情報の目録を表示する。
図30及び31は、本発明の一実施例によるソース制御情報の目録を表示した画面の例である。図31は、ソース制御情報の目録にソース情報まで表示した画面である。以降、ユーザから入力部2713を通じて特定ソース制御情報に対する選択命令が入力されると、選択されたソース制御情報ciをメモリ2712から読み取ってミックス信号処理装置2720に出力する。もし、図31に表示された画面を用いて1つのミックス信号に含まれているソース(例:ピアノ、バイオリン、女性ボーカル、フルート)の中から1つ(例:女性ボーカル)に対する選択命令が入力された場合、制御部2711は、選択されたソース(例:女性ボーカル)に該当するソース制御情報(例:ci=[c3(k)、d3(k)])のみを出力する。また、入力部を通じて選択されたソース制御情報に関して変更されたソース制御情報が入力される場合、制御部2711は、変更されたソース制御情報をメモリ2712に記憶する。
一方、ミックス信号にマッチングするソース制御情報ciがメモリ2712に記憶されていない場合、制御部2711は、ソース制御情報を入力できる画面をディスプレイ2714を通じて出力した後、入力部2713を通じてソース制御情報が入力されると、ミックス信号の識別情報にマッチングさせ、メモリ2712に記憶する。
入力部2713は、ソース制御情報、ソース制御情報変更命令、ソース制御情報選択命令などを入力するための入力装置である。
ディスプレイ2714は、ソース制御情報入力画面、ソース制御情報の目録、ソース制御情報選択画面などが表示される表示装置である。
通信部2715は、制御部2711の制御によって、ソース制御情報ciを第2リミックス制御装置(図示せず)に通信網を通じて送信するための構成要素で、ここで、ソース制御情報は、ミックス信号を識別するためのミックス信号の識別情報を含むエンコーディングされたビット列でありうる。第2リミックス制御装置(図示せず)については図34〜図36に基づいて後述する。
図32は、本発明の一実施例によるミックス信号を制御するための第12信号処理装置のブロック図である。図32を参照すると、第12信号処理装置は、ミックス信号制御装置3210及びミックス信号処理装置3220を含む。ミックス信号制御装置3210は、ミックス信号処理装置3220と連携しており、制御部3211、メモリ3212、入力部3213、及びディスプレイ3214を含む。ここで、ミックス信号処理装置3220は、図7に基づいて説明された第4信号処理装置と同一であり、その説明は省略する。
一方、第12信号処理装置に含まれる制御装置3210の制御部3211、メモリ3212、入力部3213、及びディスプレイ3214は、上記の第11信号処理装置に含まれる制御装置2710における同一名称の構成要素とその機能が略同様なので、それぞれの構成要素についての説明は省略する。
図33は、本発明の一実施例によるミックス信号処理方法を示すフローチャートである。図33を参照すると、まず、ユーザが多数のミックス信号のうちリミキシングしようとする特定のミックス信号を選択する(S3301段階)。すると、ミックス信号処理装置は、ミックス信号の付加情報をデコーディングする。ミックス信号制御装置は、ミックス信号の識別情報(ミックス信号またはミックス信号の付加情報)をミックス信号処理装置または外部装置から受信する(S3302段階)。その後、ミックス信号制御装置はS3302段階で受信したミックス信号の識別情報に基づいて、S3301段階で選択されたミックス信号にマッチングするソース制御情報が記憶されているか否かを照会する(S3303段階)。
記憶されているソース制御情報が存在する場合(S3304段階の‘Yes’)、ソース制御情報の目録をディスプレイに表示する(S3305段階)。ソース制御情報の目録の例は、上述した図30及び図31と同様である。ユーザが特定ソース制御情報全体または一部ソースに対する選択命令を入力する(S3305段階)。例えば、図30のような画面が表示された状態で、2番目のリミックス情報(“2.リミックス情報2”)をクリックするか、図31のような画面が表示された状態で2番目のリミックス情報(“2.リミックス情報2”)の“ピアノ”のアイコンをクリックする。すると、ミックス信号処理装置は、S3305段階で選択されたソース制御情報全体または一部ソースを読み取ってミックス信号処理装置に出力する(S3306段階)。すると、ミックス信号処理装置は、S3306段階で出力されたソース制御情報を受信した後、そのソース制御情報によってミックス信号をリミキシングする(S3308段階)。もし、ユーザがソース制御情報の一部または全部を変更する場合(S3309段階)、変更された制御情報を記憶する(S3310段階)。
記憶されているソース制御情報が存在しない場合(S3304の‘No’)、ユーザがソース制御情報の記憶を選択するか否か判断する(S3311段階)。もし、ユーザがソース制御情報の記憶を選択する場合(S3311段階の‘Yes’)、ミックス信号制御装置はソース制御情報入力画面を表示し、ユーザがソース制御情報を入力するとそのソース制御情報を受信する(S3312段階)。その後、ミックス信号制御装置は、S3312段階で受信したソース制御情報をミックス信号の識別情報にマッチングさせて記憶する(S3313段階)。
図34は、本発明の一実施例によるソース制御情報が生成されて用いられる過程を示す図である。図34を参照すると、第1ミックス信号制御装置3401がソース制御情報ciを、通信網を通じて制御情報提供サーバ3403に提供するか、第2ミックス信号制御装置3402に直接伝送する。ここで、第1ミックス信号制御装置3401は、上記の図27または図32に基づいて説明されたミックス信号制御装置2710,3210と同一のものでもよい。一方、ソース制御情報ciを受信した第2ミックス信号制御装置3402は、ソース制御情報ciを用いて該当のミックス信号をリミックスする。第2ミックス信号制御装置3402についての具体的な説明は、図35に基づいて後述する。
図35は、本発明の一実施例によるミックス信号を制御するための第13信号処理装置のブロック図であり、図36は、本発明の一実施例によるミックス信号制御方法を示すフローチャートである。まず、図35を参照すると、第13信号処理装置は、第2ミックス信号制御装置3510及びミックス信号処理装置3520を含む。第2ミックス信号制御装置3510は、ミックス信号処理装置3520と連係しており、通信部3511、入力部3512、制御部3513、及びディスプレイ3514を含む。ここで、ミックス信号処理装置3520は、上記の図5に基づいて説明された第3信号処理装置と同様なので、その説明は省略する。
通信部3511は、ミックス信号に該当する1つ以上のソース制御情報ciを受信するための構成要素である。ここで、1つ以上のソース制御情報ciはそれぞれビット列を構成しても良いが、1つのビット列に構成されても良い。また、ソース制御情報ciは、エンコーディング装置で生成されたもの(ci(preset))であっても良く、一般ユーザにより生成されたもの(ci(UCC))であっても良い。入力部3512は、受信した1つ以上のソース制御情報ciのうち1つが選択されるようにするための入力装置である。制御部3513は、入力部3512を通じて選択されたソース制御情報ciをミックス信号処理装置3520に出力するようにする。ディスプレイ3514は、1つ以上のソース制御情報を表示するための表示装置である。
図36を参照すると、第2ミックス信号制御装置3510は、まず、ミックス信号に該当する1つ以上のソース制御情報を受信する(S3601段階)。すると、ソース制御情報のリストを表示する(S3602段階)。ユーザが、表示されたソース制御情報の中から1つを選択すると(S3603段階の‘Yes’)、選択されたソース制御情報をミックス信号処理装置3520に出力する(S3604段階)。
図37は、本発明の一実施例によるミックス信号を制御するための第14信号処理装置のブロック図である。図37を参照すると、本発明のさらに他の実施例によるミックス信号制御装置3710は、パラメータ生成部3713及びアップミックスレンダリング部3714を含む。
パラメータ生成部3713は、付加情報3712、制御情報ciを受信してアップミキシングパラメータUPBSを生成する。付加情報3712に代えてミックス信号3711を受信し、ミックス信号3711に基づいて付加情報3712を生成しても良い。一方、制御情報ciは、ソース別ゲインファクタ、チャネル別ゲインファクタ及びサブバンド別ソース別ゲインファクタg及び出力チャネル構成情報cfを含む概念で、ソース別ゲインファクタ、チャネル別ゲインファクタ及びサブバンド別ソース別ゲインファクタgは、上記の図6に基づいて説明されたゲインファクタci及びdi608と同一のものとなりうるが、本発明はこれに限定されるものではない。パラメータ生成部3713が生成するアップミキシングパラメータUPBS(Upmix Parameter Bit Stream)はミックス信号3711のチャネル数よりも多いチャネル数にレンダリングしようとする場合、これに対応するパラメータである。アップミキシングパラメータは、他の装置に伝送されうるようにエンコーディングされたビット列で構成することができる。
アップミックスレンダリング部3714は、アップミキシングパラメータUPBS及びミックス信号3711を受信し、アップチャネルミックス信号UCMS(Up−channel Mix Signal)を出力する。ここで、アップチャネルミックス信号UCMSは、ミックス信号3711のチャネル数よりも多いチャネル数を持つ。
図38は、本発明の一実施例によるミックス信号処理方法を示すフローチャートである。まず、ミックス信号に該当する付加情報を受信し(S3801段階)、ソース別ゲインファクタ、チャネル別ゲインファクタ及びサブバンド別ソース別ゲインファクタ及び出力チャネル構成情報を含む制御情報を受信する(S3802段階)。その後、S3801段階で受信した付加情報及びS3802段階で受信した制御情報を用いてアップミキシングパラメータを生成する(S3803段階)。その後、このアップミキシングパラメータ及びミックス信号を用いてリミキシングされたアップミックスミックス信号を生成する(S3804段階)。
図39は、本発明の一実施例による付加情報を生成する方法を示すフローチャートである。エンコーディング装置で付加情報を生成するためには別のソース信号が必要である。ところが、多くのミックス信号において、ミックス信号に含まれたソース信号が別に存在しない場合がある。このような場合に、ミックス信号に含まれたソース信号と類似する信号を用いて付加情報を生成できる。この付加情報は、ゲイン値、サブバンドパワーなどのようなパラメータを含む。
図39を参照すると、ミックス信号が入力されると(S3901)、該ミックス信号の別のソース信号が独立して存在するか否かを判断する(S3902)。別のソース信号が存在する場合に、当該ソース信号を用いて付加情報を生成する(S3904)。別のソース信号が存在しない場合は、ミックス信号に対するMIDIファイルが存在するか判断する(S3903)。MIDIファイルが存在する場合は、MIDIファイルを用いて付加情報を生成する(S3906)。例えば、MIDIファイルを用いて特定のソース信号(例えば、ピアノ音)を生成し、該特定のソース信号を用いて付加情報を生成できる。
MIDIファイルが存在しない場合は、下記の方法を用いて付加情報を生成すれば良い。その第一の方法は、特定のソース信号と類似する音域帯を使用する楽器を用いて付加情報を生成するものである(S3905)。例えば、ボーカルの場合、ボーカルに似た音域帯を使用する楽器を用いて付加情報を生成することができる。第二の方法は、ミックス信号のうち、特定の空間を表す音成分を用いて付加情報を生成するものである(S3905)。例えば、ボーカルの場合、ミックス信号のうち、中央の空間を表す音成分を分析してボーカルと見なし、この音成分を用いて付加情報を生成できる。第三の方法は、第一の方法と第二の方法とを結合したものである。すなわち、特定のソース信号と類似する音域帯を使用する楽器を用いる他、ミックス信号のうち特定の空間を表す音成分を用いて付加情報を生成する(S3905)。その後、これらミックス信号及び付加情報を用いてミックス信号ファイルを生成することができる(S3907)。
図40は、本発明の一実施例による特定のソース信号を置き換える第15信号処理装置を示すブロック図である。第15信号処理装置は、リミックスレンダリング部4002、制御部4003、再生部4004、ソース信号生成部4005、メモリ4008、レコーディング部4009及び記録媒体4011を含むことができる。同図において、再生部4004はスピーカとしたが、本発明はこの実施例に限定されることはない。
図40を参照すると、ミックス信号4001がリミックスレンダリング部4002に入力される。リミックスレンダリング部4002は、付加情報、ミックス信号及びユーザミックスパラメータを用いてリミックス信号を生成する。ユーザミックスパラメータは、ユーザから獲得された制御情報を用いて生成される。例えば、ミックス信号に含まれた特定のソース信号(例えば、ボーカル信号)のゲインを下げ、または、黙音状態にすることでリミックス信号を生成できる。
制御部4003は、リミックス信号を、スピーカ4004を通じて出力することができる。この時、リミックス信号を出力する過程で、新しいソース4006を、ソース信号生成部4005を通じて入力することができる。新しいソース4006は、ユーザにより提供されるか、別の装置を用いて提供することができる。その後、ソース信号生成部4005で生成されたソース信号はメモリ4008に記憶することができる。レコーディング部4009は、リミックス信号とメモリ4008に記憶された新しいソース信号を用いて新しいリミックス信号4010を生成できる。例えば、ミックス信号に含まれたピアノ信号を黙音としてリミックス信号を生成し、このリミックス信号を出力する過程でユーザが直接演奏して生成されたピアノ信号を入力することで新しいリミックス信号を生成することができる。また、ユーザにより生成されたピアノ信号はメモリに記憶された後、当該リミックス信号と合成され、新しいリミックス信号を生成するのに用いることができる。新しいミックス信号4010は記録媒体4011に記憶され、外部に出力される(4012)。記録媒体4011は、本発明による信号処理処置に含まれてもよいし、または独立して存在してもよい。
図41は、本発明の一実施例による第16信号処理装置のブロック図である。図41を参照すると、第16信号処理装置は、第1付加情報生成部4103、第1付加情報エンコーディング部4104、第2付加情報生成部4106及び第2付加情報エンコーディング部4107を含む。エンコーディング装置は、ミックス信号4101をデコーディング装置に伝送する。エンコーディング装置は、ミックス信号4101を直接デコーディング装置に伝送しても良いが、ミックス信号4101が複数である場合はミックス信号4101を1つまたは2つのダウンミックス信号にダウンミキシングして伝送しても良い。図示してはいないが、ミックス信号伝送効率のためにミックス信号4101は、量子化及び符号化されて伝送することができる。
Figure 0005174027
例えば、ミックス信号4101に含まれているソース信号4102はドラムとベース信号であり、ミックス信号4101に含まれていないソース信号4105はボーカル1、ボーカル2、ボーカル3及びピアノとバイオリン信号と仮定する。このとき、第1付加情報生成部4103は、ミックス信号4101及びミックス信号に含まれているドラム及びベース信号4102を用いてドラム及びベース信号を調節するための第1付加情報を生成する。以下、ミックス信号4101に含まれているソース信号4102に対する付加情報を第1付加情報とし、ミックス信号4101に含まれていないソース信号4105に対する付加情報を第2付加情報とする。
第2付加情報生成部4106は、ボーカル1乃至3及びピアノとバイオリン信号を用いて第2付加情報を生成する。第2付加情報は、ミックス信号4101に含まれていないソース信号4105をソース信号別に調節するための情報である。第1付加情報及び第2付加情報は、ゲインファクタ、サブバンド別パワーやディレー定数などを含む。第1付加情報エンコーディング部4104は、第1付加情報生成部4103が生成した第1付加情報をエンコーディングしてデコーディング装置に伝送する。第2付加情報エンコーディング部4107は、第2付加情報生成部4106で生成した第2付加情報をエンコーディングしてデコーディング装置に伝送する。ミックス信号4101に含まれていないソース信号4105及びこれに対する第2付加情報は、エンコーディング装置外で生成しても良い。
すなわち、ミックス信号4101に含まれていないソース信号4105及びこれに対する第2付加情報は、エンコーディング装置とは別個のソース信号提供サーバで生成してデコーディング装置に提供しても良く、ユーザにより直接生成しても良い。デコーディング装置は、ミックス信号4101に含まれているソース信号4102及びミックス信号に含まれていないソース信号4105を用いて新しいミックス信号を生成できる。上の例で、ユーザは、好みによってミックス信号4101に含まれているソース信号4102からベース信号のみを選択し、ミックス信号4101に含まれていないソース信号4105からボーカル1及びピアノ音のみを選択し、ベース信号、ボーカル1、ピアノ音を含む新しいミックス信号を生成できる。
ユーザはソース信号提供サーバ及びデコーディング装置から、ミックス信号4101に含まれていないソース信号4105のそれぞれを受信することができる。ユーザは個別に受信したそれぞれのソース信号4105を用いて新しいミックス信号を生成することができる。
図42は、本発明の一実施例による第17信号処理装置のブロック図である。図42を参照すると、第17信号処理装置は、ミックス信号変形部4203、付加情報変形部4207及びリミキシング部4211を含む。第17信号処理装置は、エンコーディング装置から受信するか、またはあらかじめ記憶しておいたミックス信号4201及びミックス信号4201に含まれていないソース信号4202を抽出する。ミックス信号変形部4203は、ミックス信号4201及びミックス信号に含まれていないソース信号4202を用いてミックス信号4201を変形する。
すなわち、ミックス信号変形部4203は、ユーザからソース信号選択情報4208を受信し、ミックス信号4201に含まれているソース信号とミックス信号4201に含まれていないソース信号4202のうち、ユーザが選択したソース信号のみを含む新しいミックス信号4204を生成する。付加情報変形部4207は、ユーザからソース信号選択情報4208を受信し、新しいミックス信号4204をソース信号別に調節できる付加情報4209を生成する。以下、新しいミックス信号4204に対する付加情報を第3付加情報4209とする。付加情報変形部4207は、ミックス信号4201をソース信号別に調節するための第1付加情報4205及びミックス信号に含まれていないソース信号4202を調節するための第2付加情報4206を用いて新しいミックス信号4204に対する第3付加情報4209を生成できる。
また、付加情報変形部4207は、ミックス信号4201及びミックス信号4201に含まれていないソース信号4202を用いて直接第3付加情報4209を生成することができる。リミキシング部4211は、ユーザから制御情報4210を受信し、ミックス信号変形部4203から変形されたミックス信号4204を受信し、付加情報変形部4207から新しいミックス信号4204に対する第3付加情報4209を受信する。リミキシング部4211は、制御情報4210、変形されたミックス信号4204及びこれに対する第3付加情報4209を用いてリミキシングされたミックス信号4212を生成する。
図42には示していないが、第17信号処理装置は、ソース信号を表現するアイコンを抽出し、これを変形し、または新しいアイコンを生成できるようなアイコン処理部を含むことができる。ユーザは、ミックス信号に含まれているソース信号を調節する時に各ソース信号を象徴するアイコンを使用することができる。アイコンは、ソース信号の楽器や歌手の顔などを表現するイメージや、楽器名などを説明するテキストを含んでもよい。ユーザは、エンコーディング装置が伝送したソース信号のアイコンを用いてソース信号を調節することができる。また、ユーザは、エンコーディング装置が伝送したソース信号のアイコンを所望の通りに変形して使用しても良い。また、ユーザは、ソース信号を提供するサーバに接続してソース信号のアイコンを受信し、これを使用しても良い。また、ユーザは、ソース信号のアイコンを直接生成し、これをソース信号と連動して使用しても良い。
図43は、本発明の一実施例によるミックス信号変形部の内部ブロック図である。図43を参照すると、ミックス信号変形部4203は、ソース信号抽出部4301、制御部4302及び信号変形部4303を含む。ソース信号抽出部4301はソース信号を抽出する。このとき、ソース信号は、ミックス信号に含まれているソース信号及びミックス信号に含まれていないソース信号を含む。制御部4302は、ユーザからソース信号選択情報4304を受け取る。制御部4302は、ソース信号抽出部4301でユーザが選択したソース信号を抽出し、これを信号変形部4303に送る。信号変形部4303は、ユーザが選択したソース信号を用いて新しいミックス信号を生成する。すなわち、信号変形部4303は、ユーザの選択に応じて、ミックス信号に含まれているソース信号のうち特定のソース信号を新しいミックス信号から除外し、ミックス信号に含まれていないソース信号のうち特定のソース信号を新しいミックス信号に含めることで、ユーザが選択したソース信号を含む新しいミックス信号を生成する。ユーザは好みによって所望のソース信号を選択し、元のミックス信号を新しいミックス信号に変形することができる。
図44は、本発明の一実施例によるソース信号提供サーバを用いて信号処理する方法を示す図である。図44を参照すると、ユーザは、ユーザ端末4402を用いてソース信号提供サーバ4401に接続する。ユーザ端末4402は、ユーザPC、携帯電話、PDA、PMPなど、通信網を通じてサーバに接続できる装置を含む。ソース信号提供サーバ4401は、ミックス信号には含まれていないがミックス信号と一緒に再生されうるソース信号を含む。ソース信号提供サーバ4401は、ミックス信号と同じ拍子、速さなどを持っており、ミックス信号と一緒に演奏できるように同期しているソース信号を含んでいる。例えば、November rainという曲をドラム、ベース、ギター、ピアノで演奏する時に、各ソース信号は同一の曲に対して同一の速さと拍子で演奏される。この時、ソース信号のうち、ドラムとベース信号のみがミックス信号に含まれているとする場合、ユーザは、ソース信号提供サーバに接続してNovember rainという曲を演奏したギターまたはピアノ信号をダウンロードすることができる。
ユーザは、ダウンロードしたギターまたはピアノ信号を元のミックス信号と一緒に再生させることができる。ユーザは、ソース信号提供サーバ4401に接続して所望の曲を選択する。ソース信号提供サーバ4401は、ユーザが所望する曲に対して現在含んでいるソース信号目録を表示する。ユーザは、ソース信号提供サーバ4401が表示するソース信号から所望のソース信号を選択する。ソース信号提供サーバ4401は、ユーザが選択したソース信号を抽出し、ユーザ端末4402に伝送する。ソース信号提供サーバ4401は、場合によって、ユーザが選択したソース信号に対する付加情報を生成し、これをソース信号と一緒にユーザ端末4402に伝送することができる。ユーザは、デコーディング装置を用いて、ソース信号提供サーバ4401からのソース信号及び元のミックス信号に含まれているソース信号から新しいミックス信号を生成することができる。
ユーザは、ソース信号提供サーバ4401からソース信号を受信しても良いが、直接特定曲に対するソース信号を生成しても良い。ユーザは、ミックス信号に含まれているソース信号及び直接生成したソース信号を用いて元のミックス信号を変形して新しいミックス信号を生成することができる。ソース信号提供サーバ4401は、ソース信号の他に、ソース信号のアイコンを含むことができる。ユーザは、ソース信号提供サーバ4401に接続し、ソース信号のアイコンをダウンロードして使用することができる。また、ユーザは、ソース信号提供サーバ4401から受信したソース信号のアイコンを変形して使用することができる。
図45は、本発明の一実施例によるミックス信号を変形する方法を示すフローチャートである。図45を参照すると、本発明による信号処理装置は、エンコーディング装置から受信するか、またはあらかじめ記憶しておいたミックス信号を抽出する。この信号処理装置は、ミックス信号に含まれているソース信号を抽出する(S4501)。以下、ミックス信号に含まれているソース信号を第1ソース信号とし、ミックス信号に含まれていないソース信号を第2ソース信号とする。信号処理装置は、エンコーディング装置から受け取ったり、ソース信号提供サーバ4401から受け取ったり、または、ユーザが直接生成した第2ソース信号を抽出する(S4502)。信号処理装置は、第1ソース信号及び第2ソース信号を用いてミックス信号を変形する(S4503)。すなわち、信号処理装置は、第1ソース信号と第2ソース信号のうち、ユーザが選択したソース信号のみを含む新しいミックス信号を生成する。
図46は、本発明の一実施例によるミックス信号を変形する方法を示すフローチャートである。図46を参照すると、本発明による信号処理装置は、ソース信号を抽出する(S4601)。ここで、ソース信号は、ミックス信号に含まれている第1ソース信号及びミックス信号に含まれていない第2ソース信号を含む。この信号処理装置は、ユーザにより選択されたソース信号を受信する(S4602)。信号処理装置は、ユーザが選択したソース信号を用いて新しいミックス信号を生成する(S4603)。信号処理装置は、元のミックス信号に含まれているソース信号のうち、ユーザが所望しないソース信号は除去し、ミックス信号に含まれていないソース信号のうち、ユーザが所望するソース信号はミックス信号に加えることによって、ユーザが選択したソース信号のみを含む新しいミックス信号を生成する。信号処理装置は、新しいミックス信号をソース信号別に調節するために新しいミックス信号に対する第3付加情報を生成する(S4604)。
本発明による信号処理装置は、ミックス信号に対する第1付加情報及びミックス信号に含まれていないソース信号に対する第2付加情報を用いて新しいミックス信号に対する第3付加情報を生成できる。また、信号処理装置は、第1及び第2付加情報を使用せずに第3付加情報を生成することができる。すなわち、信号処理装置は、新しいミックス信号を生成した後、生成されたミックス信号を用いて新しいミックス信号に対する第3付加情報を直接生成しても良い。信号処理装置はユーザから制御情報を受信する(S4605)。信号処理装置は、ユーザから受信した制御情報及び第3付加情報を用いて新しいミックス信号をソース信号別に制御できるようなリミックスされたミックス信号を生成する(S4606)。
以上では幾つかの実施例に挙げて本発明を具体的に説明してきたが、これらの実施例は、本発明の理解を助ける説明のために提示されたもので、本発明の範囲を制限するためのものではない。当業者には、本発明の技術的思想を逸脱しない範囲内で様々な変形が可能であるということが理解でき、よって、本発明の範囲は、添付した特許請求の範囲によって定められるべきである。

Claims (10)

  1. ミックス信号の識別情報を獲得する段階と、
    前記識別情報にマッチングするソース制御情報がメモリに記憶されているか否かを決定する段階と、
    前記ソース制御情報が前記ミックス信号にマッチングする場合は、ソース制御情報の目録を表示する段階と、
    前記目録のうちの特定のソース制御情報に対する選択命令がユーザにより入力された場合は、選択されたソース制御情報を読み取って出力する段階と、
    前記選択されたソース制御情報及び前記ミックス信号を用いてリミックス信号を生成する段階と、を含み、
    各ソース制御情報は前記ミックス信号におけるソース信号を変形するために使用可能であることを特徴とする信号処理方法。
  2. 前記ミックス信号の識別情報は、前記ミックス信号の付加情報である、請求項1に記載の信号処理方法。
  3. 前記ソース制御情報は、ソース別ゲインファクタを含む、請求項1に記載の信号処理方法。
  4. 前記ソース制御情報は時間によって変化し、前記ソース制御情報の適用時点にする情報をさらに含む、請求項3に記載の信号処理方法。
  5. 前記選択されたソース制御情報に関する変形命令がユーザにより入力された場合、前記選択されたソース制御情報を変形し、前記の変形されたソース制御情報を記憶する段階をさらに含、請求項1に記載の信号処理方法。
  6. 前記ソース制御情報の目録は、前記ミックス信号のソース情報を含み、前記選択命令は、一部のソースに関するものであり、前記の選択されたソース制御情報を出力する段階は、選択されたソースに該当するソース制御情報を読み取って出力する段階である、請求項に記載の信号処理方法。
  7. 前記ミックス信号にマッチングする前記ソース制御情報は記憶しておいた値であるか、入力された値である、請求項1に記載の信号処理方法。
  8. ミックス信号の処理装置と連係している信号処理装置であって、
    前記ミックス信号の識別情報別ソース制御情報が記憶されているメモリと、
    ソース制御情報の目録を表示するディスプレイと、
    前記ミックス信号の識別情報に基づいて、前記ミックス信号にマッチングするソース制御情報を読み取制御部と、を含み、
    前記識別情報にマッチングするソース制御情報がメモリに記憶されているか否かを決定し、
    前記ソース制御情報が前記ミックス信号にマッチングする場合は、前記ソース制御情報の目録を表示し、
    前記目録のうちの特定のソース制御情報に対する選択命令がユーザにより入力された場合は、選択されたソース制御情報を前記ミックス信号の制御部へ出力し、
    各ソース制御情報は前記ミックス信号におけるソース信号を変形するために使用可能であることを特徴とする信号処理装置。
  9. 前記ディスプレイはインターフェースを出力するためのものであり
    前記ミックス信号にマッチングするソース制御情報は、前記メモリに記憶された値であるか、入力された値である、請求項8に記載の信号処理装置。
  10. 前記選択されたソース制御情報を用いてミックス信号を生成するミックス信号処理装置と通信する通信部をさらに有する、請求項8に記載の信号処理装置。
JP2009530283A 2006-09-29 2007-10-01 ミックス信号処理装置及びミックス信号処理方法 Expired - Fee Related JP5174027B2 (ja)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US84821806P 2006-09-29 2006-09-29
US60/848,218 2006-09-29
US82923306P 2006-10-12 2006-10-12
US60/829,233 2006-10-12
US82935006P 2006-10-13 2006-10-13
US60/829,350 2006-10-13
US86830406P 2006-12-01 2006-12-01
US60/868,304 2006-12-01
US88574207P 2007-01-19 2007-01-19
US60/885,742 2007-01-19
US89416207P 2007-03-09 2007-03-09
US60/894,162 2007-03-09
PCT/KR2007/004805 WO2008039045A1 (en) 2006-09-29 2007-10-01 Apparatus for processing mix signal and method thereof

Publications (2)

Publication Number Publication Date
JP2010505143A JP2010505143A (ja) 2010-02-18
JP5174027B2 true JP5174027B2 (ja) 2013-04-03

Family

ID=39230402

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009530283A Expired - Fee Related JP5174027B2 (ja) 2006-09-29 2007-10-01 ミックス信号処理装置及びミックス信号処理方法

Country Status (5)

Country Link
US (1) US20100040135A1 (ja)
EP (1) EP2084703B1 (ja)
JP (1) JP5174027B2 (ja)
CN (1) CN101652810B (ja)
WO (1) WO2008039045A1 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9031242B2 (en) * 2007-11-06 2015-05-12 Starkey Laboratories, Inc. Simulated surround sound hearing aid fitting system
KR101461685B1 (ko) 2008-03-31 2014-11-19 한국전자통신연구원 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
KR101061129B1 (ko) * 2008-04-24 2011-08-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
JP5174527B2 (ja) * 2008-05-14 2013-04-03 日本放送協会 音像定位音響メタ情報を付加した音響信号多重伝送システム、制作装置及び再生装置
US9485589B2 (en) 2008-06-02 2016-11-01 Starkey Laboratories, Inc. Enhanced dynamics processing of streaming audio by source separation and remixing
US8705751B2 (en) 2008-06-02 2014-04-22 Starkey Laboratories, Inc. Compression and mixing for hearing assistance devices
US9185500B2 (en) 2008-06-02 2015-11-10 Starkey Laboratories, Inc. Compression of spaced sources for hearing assistance devices
KR101137360B1 (ko) * 2009-01-28 2012-04-19 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US20110054917A1 (en) * 2009-08-28 2011-03-03 Electronics And Telecommunications Research Institute Apparatus and method for structuring bitstream for object-based audio service, and apparatus for encoding the bitstream
FR2966277B1 (fr) * 2010-10-13 2017-03-31 Inst Polytechnique Grenoble Procede et dispositif de formation d'un signal mixe numerique audio, procede et dispositif de separation de signaux, et signal correspondant
US9246725B2 (en) * 2011-09-06 2016-01-26 Electronics And Telecommunications Research Institute Method of generating and receiving packets in low energy critical infrastructure monitoring system
US8964979B2 (en) * 2011-10-07 2015-02-24 Silicon Image, Inc. Identification and handling of data streams using coded preambles
WO2014007097A1 (ja) 2012-07-02 2014-01-09 ソニー株式会社 復号装置および方法、符号化装置および方法、並びにプログラム
EP2741286A4 (en) * 2012-07-02 2015-04-08 Sony Corp DECODING DEVICE AND METHOD, CODING DEVICE AND METHOD AND PROGRAM
KR20150032649A (ko) 2012-07-02 2015-03-27 소니 주식회사 복호 장치 및 방법, 부호화 장치 및 방법, 및 프로그램
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
KR20140017338A (ko) * 2012-07-31 2014-02-11 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
CN103812824A (zh) * 2012-11-07 2014-05-21 中兴通讯股份有限公司 音频多编码传输方法及相应装置
US20150371644A1 (en) * 2012-11-09 2015-12-24 Stormingswiss Gmbh Non-linear inverse coding of multichannel signals
WO2014101169A1 (zh) * 2012-12-31 2014-07-03 北京印声科技有限公司 提供增强音频数据流的方法及装置
JP5591423B1 (ja) 2013-03-13 2014-09-17 パナソニック株式会社 オーディオ再生装置およびオーディオ再生方法
US9607624B2 (en) * 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
WO2014171341A1 (ja) * 2013-04-15 2014-10-23 ソニー株式会社 受信装置、受信方法、及び、プログラム
EP3210206B1 (en) * 2014-10-24 2018-12-05 Dolby International AB Encoding and decoding of audio signals
GB2549922A (en) * 2016-01-27 2017-11-08 Nokia Technologies Oy Apparatus, methods and computer computer programs for encoding and decoding audio signals
US10535357B2 (en) * 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
CN110428798B (zh) * 2019-08-02 2021-08-10 湖南国声声学科技股份有限公司深圳分公司 人声与伴奏同步方法、蓝牙设备、终端及存储介质
CN111341323B (zh) * 2020-02-10 2022-07-01 厦门快商通科技股份有限公司 声纹识别训练数据扩增方法、系统、移动终端及存储介质

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3503958B2 (ja) * 1992-12-28 2004-03-08 パイオニア株式会社 オムニバスカラオケ演奏装置
US6141446A (en) * 1994-09-21 2000-10-31 Ricoh Company, Ltd. Compression and decompression system with reversible wavelets and lossy reconstruction
US5838664A (en) * 1997-07-17 1998-11-17 Videoserver, Inc. Video teleconferencing system with digital transcoding
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6128597A (en) * 1996-05-03 2000-10-03 Lsi Logic Corporation Audio decoder with a reconfigurable downmixing/windowing pipeline and method therefor
US6026168A (en) * 1997-11-14 2000-02-15 Microtek Lab, Inc. Methods and apparatus for automatically synchronizing and regulating volume in audio component systems
WO1999053479A1 (en) * 1998-04-15 1999-10-21 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Fast frame optimisation in an audio encoder
JP3770293B2 (ja) * 1998-06-08 2006-04-26 ヤマハ株式会社 演奏状態の視覚的表示方法および演奏状態の視覚的表示プログラムが記録された記録媒体
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US7103187B1 (en) * 1999-03-30 2006-09-05 Lsi Logic Corporation Audio calibration system
US6546299B1 (en) * 1999-06-01 2003-04-08 Martin Fitzgerald Bradley Machine and method for manipulating digital audio
JP3775156B2 (ja) * 2000-03-02 2006-05-17 ヤマハ株式会社 携帯電話機
US6739418B2 (en) * 2000-04-27 2004-05-25 Mitsubishi Fuso Truck And Bus Corporation Engine operation controller for hybrid electric vehicle
WO2002007481A2 (en) * 2000-07-19 2002-01-24 Koninklijke Philips Electronics N.V. Multi-channel stereo converter for deriving a stereo surround and/or audio centre signal
JP2002058100A (ja) * 2000-08-08 2002-02-22 Yamaha Corp 音像定位制御装置および音像定位制御プログラムが記録された記録媒体
JP2002125010A (ja) * 2000-10-18 2002-04-26 Casio Comput Co Ltd 移動体通信装置及びメロディ着信音出力方法
US6888999B2 (en) * 2001-03-16 2005-05-03 Magix Ag Method of remixing digital information
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
JP3726712B2 (ja) * 2001-06-13 2005-12-14 ヤマハ株式会社 演奏設定情報の授受が可能な電子音楽装置及びサーバ装置、並びに、演奏設定情報授受方法及びプログラム
BR0304542A (pt) * 2002-04-22 2004-07-20 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal de áudio de multicanal, aparelho para fornecer um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio
EP1394772A1 (en) * 2002-08-28 2004-03-03 Deutsche Thomson-Brandt Gmbh Signaling of window switchings in a MPEG layer 3 audio data stream
KR100542129B1 (ko) * 2002-10-28 2006-01-11 한국전자통신연구원 객체기반 3차원 오디오 시스템 및 그 제어 방법
JP4084990B2 (ja) * 2002-11-19 2008-04-30 株式会社ケンウッド エンコード装置、デコード装置、エンコード方法およびデコード方法
CN1321423C (zh) * 2003-03-03 2007-06-13 三菱重工业株式会社 容器、中子屏蔽体用组合物和中子屏蔽体制造法
US6937737B2 (en) * 2003-10-27 2005-08-30 Britannia Investment Corporation Multi-channel audio surround sound from front located loudspeakers
TWI233091B (en) * 2003-11-18 2005-05-21 Ali Corp Audio mixing output device and method for dynamic range control
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
US7332666B2 (en) * 2004-08-05 2008-02-19 Yamaha Corporation Performance control system, performance control apparatus, performance control method, program for implementing the method, and storage medium storing the program
US7452989B2 (en) * 2004-08-09 2008-11-18 Silverbrook Research Pty Ltd Metal-cyanine dye having improved water solubility
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US20070083365A1 (en) * 2005-10-06 2007-04-12 Dts, Inc. Neural network classifier for separating audio sources from a monophonic audio signal
US8081762B2 (en) * 2006-01-09 2011-12-20 Nokia Corporation Controlling the decoding of binaural audio signals
US9426596B2 (en) * 2006-02-03 2016-08-23 Electronics And Telecommunications Research Institute Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
US7876904B2 (en) * 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
EP2092516A4 (en) * 2006-11-15 2010-01-13 Lg Electronics Inc METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING

Also Published As

Publication number Publication date
EP2084703A1 (en) 2009-08-05
EP2084703B1 (en) 2019-05-01
EP2084703A4 (en) 2009-09-23
US20100040135A1 (en) 2010-02-18
CN101652810A (zh) 2010-02-17
CN101652810B (zh) 2012-04-11
WO2008039045A1 (en) 2008-04-03
JP2010505143A (ja) 2010-02-18

Similar Documents

Publication Publication Date Title
JP5174027B2 (ja) ミックス信号処理装置及びミックス信号処理方法
JP4787362B2 (ja) オブジェクトベースオーディオ信号をエンコーディング及びデコーディングする方法及び装置
US20120134511A1 (en) Multichannel audio coder and decoder
JP2010515944A (ja) オーディオデコーダ
NO338928B1 (no) Generering av et kodet flerkanalsignal og dekoding av et kodet flerkanalsignal
RU2455708C2 (ru) Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
US20210343302A1 (en) High resolution audio coding
KR100891666B1 (ko) 믹스 신호의 처리 방법 및 장치
US11735193B2 (en) High resolution audio coding
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
JP7130878B2 (ja) 高分解能オーディオコーディング
KR102664768B1 (ko) 고해상도 오디오 코딩
KR100891671B1 (ko) 믹스신호 제어 방법 및 장치
KR100891669B1 (ko) 믹스 신호의 처리 방법 및 장치

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120327

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120627

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121227

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees