JP4084990B2 - エンコード装置、デコード装置、エンコード方法およびデコード方法 - Google Patents

エンコード装置、デコード装置、エンコード方法およびデコード方法 Download PDF

Info

Publication number
JP4084990B2
JP4084990B2 JP2002335166A JP2002335166A JP4084990B2 JP 4084990 B2 JP4084990 B2 JP 4084990B2 JP 2002335166 A JP2002335166 A JP 2002335166A JP 2002335166 A JP2002335166 A JP 2002335166A JP 4084990 B2 JP4084990 B2 JP 4084990B2
Authority
JP
Japan
Prior art keywords
channel
music
decoding
music signal
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002335166A
Other languages
English (en)
Other versions
JP2004170610A (ja
Inventor
憲一 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kenwood KK
Original Assignee
Kenwood KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kenwood KK filed Critical Kenwood KK
Priority to JP2002335166A priority Critical patent/JP4084990B2/ja
Publication of JP2004170610A publication Critical patent/JP2004170610A/ja
Application granted granted Critical
Publication of JP4084990B2 publication Critical patent/JP4084990B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
この発明は、エンコード装置、デコード装置、エンコード方法およびデコード方法に関する。
【0002】
【従来の技術】
近年、デジタルデータの圧縮技術が各種研究され、そして、規格化されている。例えば、MP3(MPEG1 Audio Layer-3)に代表される音楽データの圧縮技術は、パーソナルコンピュータ(パソコン)やインターネット等の普及に伴い、一般に広く利用されて来ている。
このMP3は、2チャンネルのPCM(Pulse Code Modulation)音声を圧縮する技術であり、データ量を元データの約10分の1程度にまで高圧縮でき、しかも、良好な音質を保てることが特徴である。
【0003】
例えば、利用者は、図10(a)に示すようなパソコンシステムを使用して、MP3形式の音楽ファイル(MP3ファイル)を生成し(或いは、ダウンロードし)、そして、生成等したMP3ファイルを再生して、所望の音楽を聴くことができる。
具体的に図10(a)に示すパソコンシステムは、パソコン100と、モデム200と、リーダ・ライタ300とから構成される。
パソコン100は、ハードディスクやCD−R/RWドライブ等を備えたパソコン本体101と、モニタ102と、キーボード103と、マウス104と、スピーカ105とを備えている。
また、モデム200は、電話回線を介してインターネット等のWAN(Wide Area Network)と接続可能であり、リーダ・ライタ300は、メモリ媒体400にMP3ファイル等を書き込む。また、パソコン本体101は、記録可能なディスク500にMP3ファイル等を書き込む。
【0004】
このような構成のパソコンシステムにおいて、パソコン100は、CD−R/RWドライブ等にて音楽CDから、読み出した(リッピングした)2チャンネルステレオの音楽データをMP3ファイルに変換して、ハードディスクに格納する。また、パソコン100は、モデム200を介してWAN(例えば、サーバ等)からダウンロードしたMP3ファイルをハードディスクに格納する。
そして、パソコン100は、キーボート103やマウス104による再生指示に従って、ハードディスクに格納したMP3ファイルを再生し、スピーカ105から楽曲音を出力する。
【0005】
また、パソコン100は、ハードディスクに格納したMP3ファイルを、リーダ・ライタ300を介して、メモリ媒体400に書き込むことができ、また、CD−R/RWドライブ等により、ディスク500にも書き込むことができる。
そして、MP3ファイルが書き込まれたメモリ媒体400は、例えば、図10(b)に示すような携帯型のメモリプレーヤ600にて再生することができる。同様に、MP3ファイルが書き込まれたディスク500は、図10(c)に示すようなMP3再生機能付きのディスクプレーヤ700にて再生できる(例えば、特許文献1参照)。
【0006】
【特許文献1】
特開2001−266470号公報 (第4−7頁、第1図)
【0007】
【発明が解決しようとする課題】
このようなMP3ファイルは、2チャンネルステレオの音楽信号を対象とした規格であり、マルチチャンネルの音楽信号には対応していない。これは、図11(a),(b)に示すようなMP3ファイルのヘッダ部からも明らかである。
つまり、図11(a)に示すように、ヘッダ部の構造では、先頭からヘッダ部を示す「1」が11ビット乃至12ビット連続(網掛けの部分)した後に、ファイルの詳細が規定されている。なお、図中の圧縮データは、音楽データの実体である。
また、MP3ファイルは、このような構成のヘッダ部が、ある一定の間隔で繰り返し配置されて構成されている。
【0008】
そして、図11(b)に示すように、ファイルの詳細は、No.2のバージョンが「1」で、No.3のレイヤが「01」であれば、MP3ファイルを示しており、No.9のチャンネルモードには、ステレオまでの規定に止まり、マルチチャンネルに対応していないことが分かる。
また、ファイルの詳細には、ソース信号からMP3ファイルに変換する過程で、音量レベルを変化させたことを規定する項目や、非直線圧縮等の処理に対応する項目も規定されていない。
【0009】
すなわち、従来のMP3の規格は、マルチチャンネルに未対応であるため、マルチチャンネルの音楽データをそのまま、MP3ファイルに変換することができなかった。
そのため、マルチチャンネルの音楽データを一端、2チャンネルの音楽データにダウンミックスし、ダウンミックスした音楽データからMP3ファイルに変換する必要があった。
しかしながら、適切にダウンミックスされないと、ダイナミックレンジが確保されないといった、音質の劣化が生じることとなる。また、ダウンミックスし、MP3ファイルに変換した後では、2チャンネルステレオの楽曲音でしか再生されないため、元のマルチチャンネルの楽曲音と大きく異なるものとなってしまうという問題があった。
【0010】
この発明は、上記実状に鑑みてなされたもので、マルチチャンネルの音楽データを適切にエンコードでき、エンコードした音楽データをマルチチャンネルの音楽データに適切にデコードできるエンコード装置、デコード装置、エンコード方法およびデコード方法を提供することを目的とする。
【0011】
【課題を解決するための手段】
上記目的を達成するため、本発明の第1の観点に係るエンコード装置は、
マルチチャンネルの音楽信号を入力し、前記マルチチャンネルの各チャンネルに対して所定の減衰値のアッテネータにより減衰させ、減衰させた各チャンネルの音楽信号を加算器にて加算させて、2チャンネルステレオの音楽信号にダウンミックスするミックス手段と、
前記ミックス手段によりダウンミックスされた音楽信号を、該音楽信号がクリップしない非直線特性を用いて非直線圧縮し、前記ミックス手段により減衰させた分だけレベルシフトする圧縮手段と、
前記圧縮手段により非直線圧縮された音楽信号を、予め定められたデータ圧縮規格に従って、圧縮された音楽データにエンコードするエンコード手段と、
前記ミックス手段がダウンミックスしたマルチチャンネルの内容と、該ダウンミックスにより減衰させた減衰量とを含むヘッダ情報を生成するヘッダ生成手段と、
前記エンコード手段がエンコードした音楽データに、前記ヘッダ生成手段により生成されたヘッダ情報を付加する付加手段と、
を備えることを特徴とする。
【0012】
前記エンコード手段は、MP3規格に従って、音楽信号を音楽データにエンコードしてもよい。
【0013】
上記目的を達成するため、本発明の第2の観点に係るデコード装置は、
請求項1に記載のエンコード装置によりエンコードされた音楽データをデコードするデコード装置であって、
入力した音楽データを、予め定められたデータ伸張規格に従って、2チャンネルの音楽信号にデコードするデコード手段と、
ダウンミックスしたマルチチャンネルの内容と該ダウンミックスにより減衰させた減衰量とを含むヘッダ情報が、入力した音楽データに付加されているか否かを判別する判別手段と、
前記判別手段によりヘッダ情報が付加されていると判別された場合に、前記デコード手段によりデコードされた、クリップしない非直線特性を用いて非直線圧縮されている音楽信号を、当該非直線特性と逆の入出力特性にて変換することにより元のリニア特性に戻し、ヘッダ情報における減衰させた減衰量の分だけ音量レベルを上げる伸張手段と、
前記伸張手段により非直線伸張された音楽信号を、ヘッダ情報におけるマルチチャンネルの内容に従ってマルチチャンネルの音楽信号に変換する変換手段と、
を備えることを特徴とする。
【0014】
前記デコード手段は、MP3規格に従って、音楽データを音楽信号にデコードし
記変換手段は、予め定められた規格に従って、2チャンネルの音楽信号から、方向性が強調されたマルチチャンネルの音楽信号に変換してもよい。
【0015】
上記目的を達成するため、本発明の第3の観点に係るエンコード方法は、
ミキサ部、圧縮部、エンコーダ、制御部、及び、加算器を有するエンコード装置におけるエンコード方法であって、
前記ミキサ部が行う、マルチチャンネルの音楽信号を入力し、前記マルチチャンネルの各チャンネルに対して所定の減衰値のアッテネータにより減衰させ、減衰させた各チャンネルの音楽信号を加算器にて加算させて、2チャンネルステレオの音楽信号にダウンミックスするミックスステップと、
前記圧縮部が行う、前記ミックスステップにてダウンミックスされた音楽信号を、該音楽信号がクリップしない非直線特性を用いて非直線圧縮し、前記ミックス手段により減衰させた分だけレベルシフトする圧縮ステップと、
前記エンコーダが行う、前記圧縮ステップにて非直線圧縮された音楽信号を、予め定められたデータ圧縮規格に従って、圧縮された音楽データにエンコードするエンコードステップと、
前記制御部が行う、ミックスステップにてダウンミックスされたマルチチャンネルの内容と、該ダウンミックスにより減衰させた減衰量とを含むヘッダ情報を生成するヘッダ生成ステップと、
前記加算器が行う、前記エンコードステップにてエンコードされた音楽データに、前記ヘッダ生成ステップにて生成されたヘッダ情報を付加する付加ステップと、
を備えることを特徴とする。
【0016】
上記目的を達成するため、本発明の第4の観点に係るデコード方法は、
デコーダ、制御部、伸張部、及び、強調回路を有し、請求項5に記載のエンコード方法によりエンコードされた音楽データをデコードするデコード装置におけるデコード方法であって、
前記デコーダが行う、入力した音楽データを、予め定められたデータ伸張規格に従って、2チャンネルの音楽信号にデコードするデコードステップと、
前記制御部が行う、ダウンミックスしたマルチチャンネルの内容と該ダウンミックスにより減衰させた減衰量とを含むヘッダ情報が、入力した音楽データに付加されているか否かを判別する判別ステップと、
前記伸張部が行う、前記判別ステップにてヘッダ情報が付加されていると判別された場合に、前記デコードステップにてデコードされた、クリップしない非直線特性を用いて非直線圧縮されている音楽信号を、当該非直線特性と逆の入出力特性にて変換することにより元のリニア特性に戻し、付加されたヘッダ情報における減衰させた減衰量の分だけ音量レベルを上げる伸張ステップと、
前記強調回路が行う、前記伸張ステップにて非直線伸張された音楽信号を、付加されたヘッダ情報におけるマルチチャンネルの内容に従ってマルチチャンネルの音楽信号に変換する変換ステップと、
を備えることを特徴とする。
【0017】
【発明の実施の形態】
本発明の実施の形態にかかるエンコード装置及びデコード装置について、以下図面を参照して説明する。
【0018】
図1は、この発明の実施の形態に適用されるエンコード装置の構成の一例を示すブロック図であり、また、図2は、この発明の実施の形態に適用されるデコード装置の構成の一例を示すブロック図である。
まず、図1を参照して、マルチチャンネル等の音楽信号(楽曲データ)をMP3ファイル(MP3形式の音楽データ)に変換するエンコード装置について説明する。図示するように、このエンコード装置は、サラウンドデコーダ11と、ミキサ部12と、圧縮部13と、スイッチ14と、MP3エンコーダ15と、加算器16と、マイコン17と、キー18とから構成される。なお、加算器16の出力は、メモリカード等の記録媒体80やLAN等の通信媒体90と接続されている。
【0019】
サラウンドデコーダ11は、マイコン17に制御され、入力したサラウンドオーディオストリームをデコードし、後述するLt/Rt信号にダウンミックスする。
具体的にサラウンドデコーダ11は、サラウンドオーディオストリームを、その平均音量レベルが下がらないように圧縮してダウンミックスする。そして、ダウンミックスしたLt/Rt信号を非直線圧縮することなく、スイッチ14を介してMP3エンコーダ15に供給する。その際、サラウンドデコーダ11は、チャンネル数等の情報もMP3エンコーダ15に通知する。
【0020】
ミキサ部12は、マイコン17に制御され、アッテネータ及び、Lt/Rtミキサの機能を有する。具体的に、ミキサ部12は、図3に示すように、アッテネータBF1〜BF7と、加算器ADD1〜ADD3とが適宜接続されて構成される。
そして、図3に示すようなミキサ部12は、記録媒体の再生により得られるマルチチャンネルの音楽信号を入力し、Lt/Rt信号(例えば、Dolby社のプロロジックでデコードできる2チャンネルの信号)にダウンミックスする。
なお、Lt/Rt信号は、マルチチャンネルの信号(Lch,Rch,Cch,SWch,Slch,Srchの信号)から、例えば、以下の数式1,2により得られる。
【0021】
【数1】
Lt=L+K(C+SW+(Sl+Sr))
K:係数
【0022】
【数2】
Rt=R+K(C+SW−(Sl+Sr))
K:係数
【0023】
なお、各係数Kには、一例として、−3dB、−4.5dB、又は、−6dB等が適用される。この係数Kにより、例えば、モノラルなCchの信号をLとRとに振り分けたときに、スピーカから出るエネルギーが不適切に増加してしまうのを防止できる。
上記の数式1と数式2とを比べると、最後尾の項である(Sl+Sr)の符号が逆になっているが、これは、互いの位相が180度ずれていることを表している。
【0024】
そして、マルチチャンネルの信号をLt/Rt信号にダウンミックスする場合には、デジタルPCMでの加算の際に、クリップしないように配慮する。
例えば、数式1では、各チャンネルが、同じ周波数及び位相で最大振幅の場合に、約12dB分クリップするので、アッテネータBF1〜BF6の減衰値を−12dBとしておく。
更にアッテネータBF3〜BF6は、数式1,2中の係数Kを考慮して、先ほどの−12dBに係数Kの値を加える。つまり、係数Kを−3dBとした場合に、アッテネータBF3〜BF6の減衰値をそれぞれ−15dBとしておく。
また、例えば、マルチチャンネルのソースがLch,Rch,Cchの信号しかなかった場合に、数式1,2に当てはめて計算すると、約5dB(+4.65dB)分クリップする。
つまり、ソースのチャンネル数が異なると、クリップマージンが変わるため、アッテネータBF1〜BF6の減衰値を変化させる必要がある。そこで、アッテネータBF1〜BF6の減衰値は、マイコン17により適宜設定される。
なお、アッテネータBF7は、位相反転だけを行う。
そして、加算器ADD1〜ADD3は、減衰等された各信号を加算する。
【0025】
図1に戻って、圧縮部13は、マイコン17に制御され、非直線圧縮及び、レベルシフトの機能を有する。つまり、圧縮部13は、ミキサ部12にてダウンミックスされたLt/Rt信号を非直線圧縮し、そして、レベルシフトする。
上述したように、ミキサ部12において、ソースとなるマルチチャンネルのチャンネル数に応じてクリップマージンが変わるため、アッテネータBF1〜BF6の減衰値も変化することになる。そのため、このまま再生したとすると、楽曲に応じて異なった音量で再生されることになり、利用者が、その都度ボリューム操作を行う必要がある。
また、MP3は16ビットまでしか扱えないため、ダイナミックレンジが十分に確保できなくなる。
【0026】
このため、圧縮部13は、入力したLt/Rt信号を非直線圧縮し、そして、レベルシフトする。具体的にマルチチャンネル(Lch〜Srch)の場合を一例として、図4を参照して説明する。
グラフAに示すような、リニアな入出力特性において、各チャンネルを2チャンネルステレオにダウンミックスした場合、−12dB下げることになるので、矢印sに示すように全体的に音量が下がる。この時、グラフBに示すように、クリップ付近だけを−12dB分下げる。これにより、12dBのマージンができるため、矢印dに示すように音量レベルを12dB上げ、グラフCを生成する。この結果、平均レベルである−20dB〜−30dB付近の信号を、マルチチャンネルの時と同じ平均レベルで得ることができる。また、楽曲の微小変化分を再現するためのデータの下位ビットも元のまま確保される。
【0027】
図1に戻って、スイッチ14は、マイコン17に制御され、サラウンドデコーダ11の出力、圧縮部13の出力、若しくは、通常のステレオ(L/Rch)信号の入力から、何れかを選択してMP3エンコーダ15に供給する。
【0028】
MP3エンコーダ15は、マイコン17に制御され、入力した音楽信号をMP3の規格に従って、圧縮及び符号化する。すなわち、MP3エンコーダ15は、スイッチ14を介して供給された2チャンネルのステレオ信号を、MP3形式にエンコードする。
【0029】
加算器16は、マイコン17に制御され、MP3エンコーダ15によりエンコードされたMP3ファイルに、後述する追加ヘッダを付加する。
【0030】
マイコン17は、エンコード装置全体を制御する。具体的にマイコン17は、データ通信により供給される制御データやキー18からの入力に従って、エンコード対象の音楽ソース(サラウンドオーディオストリーム、マルチチャンネル、若しくは、ステレオ)を選択して、種々の制御を行う。
例えば、エンコード対象としてマルチチャンネルが選択された場合に、マイコン17は、スイッチ14の入力を圧縮部13に切り換え、ミキサ部12、圧縮部13及び、MP3エンコーダ15を制御する。
すなわち、マイコン17は、ミキサ部12を制御し、図3に示すようなアッテネータBF1〜BF6の減衰値を、マルチチャンネルのチャンネル数に応じて設定する。この際、マイコン17は、各チャンネル(Lch〜Srch)における音楽信号の供給の有無を、キー18又はデータ通信にて得ているものとする。
これにより、ミキサ部12は、マルチチャンネルの音楽信号を2チャンネルのLt/Rt信号に、適切にダウンミックスする。
また、マイコン17は、圧縮部13を制御し、図4を参照して説明したように、非直線圧縮処理し、ミキサ部12にてアッテネートした分だけ、レベルシフトする。
【0031】
そして、マイコン17は、マルチチャンネルのチャンネル数の情報等に従って、追加ヘッダを生成する。
一例として、マイコン17は、図5(a),(b)に示すような追加ヘッダを生成する。つまり、この追加ヘッダには、先頭から「K」,「W」,「D」の3つの文字コードが固定された後に、詳細情報が規定されている。なお、先頭の3つの文字コードは、圧縮データや後述するID3TAGと区別するための文字コードである。つまり、デコードする際に、「K」,「W」,「D」の3つの文字コードにより、圧縮データやID3TAGと間違えることなく、追加ヘッダであることが判別される。
そして、図5(b)に示すように、詳細情報において、No.2〜4のソース構成には、ソースのマルチチャンネルがどのようなチャンネル構成であったかが規定される。また、No.5のLt/Rtは、エンコードする信号が2チャンネルだった場合に、「不明」、「L0/R0(普通のステレオ)」、或いは、「Lt/Rt」であるかを規定する。
更に、No.6の圧縮は、ダウンミックスする際に、何dB減衰させたかを規定する。この規定により、デコード時にどれだけの圧縮カーブを使用すれば良いかが判別できる。
【0032】
マイコン17は、このような追加ヘッダを生成すると、加算器16にて、図6(a)に示すように、MP3ファイルの先頭に付加する。これにより、MP3ファイルを再生する際に、追加ヘッダがいち早く検索可能となる。
ところで、MP3では、ID3TAGという文字情報や静止画を納めておく付属ファイルが提案されており、「ID3TAG Ver.1.x」では、MP3ファイルの最後尾に配置され、「ID3TAG Ver.2.x」では、MP3ファイルの前に配置される。この場合であっても、マイコン17は、図6(b)に示すように、MP3ファイルの先頭に付加する。
なお、「ID3TAG Ver.1.x」の場合に、付属ファイルは、先頭から「T」,「A」,「G」の3つの文字コードが固定されている。また、「ID3TAG Ver.2.x」の場合に、付属ファイルは、先頭から「I」,「D」,「3」の3つの文字コードが固定されている。つまり、上述の追加ヘッダと混同することがない。
【0033】
図1に戻って、キー18は、エンコード装置に配置された複数のキースイッチ等からなる。キー18は、利用者に操作され、エンコード対象となる音楽ソースを指定したり、マルチチャンネルをエンコードする際に、チャンネル数等の情報を入力する。
【0034】
次に、図2を参照して、MP3ファイルをマルチチャンネル等の音楽信号に変換するデコード装置について説明する。図示するように、このデコード装置は、MP3デコーダ21と、非直線伸張部22と、方向性強調回路23と、サブマネージメント回路24と、レベルシフト25と、マイコン26と、キー27とから構成される。なお、MP3エンコーダ21の入力は、記録媒体80や通信媒体90と接続されている。
【0035】
MP3デコーダ21は、マイコン26に制御され、記録媒体80や通信媒体90から供給されたMP3ファイルをデコードする。
例えば、MP3デコーダ21は、図6(a),(b)に示すような追加ヘッダが付加されたMP3ファイルから、追加ヘッダやID3TAGのファイル等を読み飛ばし、圧縮データ(実音楽データ)をデコードする。そして、デコードにより2チャンネルのステレオ信号(Lt/Rt信号等)を復調し、非直線伸張部22に供給する。
【0036】
非直線伸張部22は、マイコン26に制御され、非直線圧縮されたLt/Rt信号を伸張等する。つまり、非直線伸張部22は、上述した図4の非直線圧縮と逆の入出力特性を持たせて、元のリニア特性に戻す。
具体的に、図7を参照して、非直線伸張部22が行う伸張処理について説明する。
非直線圧縮された信号(上述の図4のグラフC)を元に戻すには、図7のグラフDに示すような逆特性のカーブで変換する。この変換により、非直線圧縮された信号は、グラフFに示すようにリニアになる。この際、平均音量レベルは、図中の矢印dのように移動するが、−12dBとなっているため元より音量レベルが下がっている。
そこで、12dBだけ音量レベルを上げる必要があるが、デジタル処理では音の大きい方にダイナミックレンジを拡大できないため、一端、DAコンバータでアナログ信号に置き換えてから、12dB分だけ音量レベルを上げることとする。
なお、そもそも非直線圧縮がされていない場合は、伸張する必要がないので、そのままグラフFとなる。
【0037】
図2に戻って、方向性強調回路23は、マイコン26に制御され、非直線伸張部22により伸張されたLt/Rt信号から、方向性が強調されたマルチチャンネルの音楽信号(Lch,Rch,Cch,SWch,Slch,Srch)に変換する。つまり、2チャンネルの信号をマルチチャンネルの信号に復調する。具体的に方向性強調回路23は、プロロジックやプロロジックII(ドルビー研究所)や、サークルサラウンド(SRS社)の規格に合致した回路である。
【0038】
サブマネージメント回路24は、最終的な出力先となるスピーカの構成数及びその低域再生能力等に応じて信号処理し、方向性強調回路23から供給されたマルチチャンネルの音楽信号を適宜振り分ける。
【0039】
レベルシフト25は、サブマネージメント回路24から供給されたマルチチャンネル信号を適宜レベルシフトする。
【0040】
マイコン26は、キー27からの指示入力等に従って、デコード装置全体を制御する。
例えば、記録媒体80や通信媒体90から供給されたMP3ファイルに追加ヘッダが付加されている場合に、マイコン26は、図5(b)に示すような追加ヘッダの内容に従って、MP3デコーダ21、非直線伸張部22、方向性強調回路23、及び、サブマネージメント回路24をそれぞれ制御する。
なお、追加ヘッダが付加されていない場合、マイコン26は、MP3デコーダ21を制御するのみで、他の制御を行わないまま、音楽信号を次段に送る。
【0041】
キー27は、デコード装置に配置された複数のキースイッチ等からなり、利用者に操作され、所定の指示情報をマイコン26に供給する。
【0042】
以下、この発明の形態にかかるエンコード装置及びデコード装置の動作について、図面を参照して説明する。
まず、図8を参照して、エンコード装置におけるエンコード処理について説明する。図8は、マイコン17が実行するエンコード処理を説明するためのフローチャートである。このエンコード処理は、例えば、キー18を介してエンコード対象が選択された後に開始する。
【0043】
まず、マイコン17は、キー18からの指示情報に従って、スイッチ14を切り換える(ステップS11)。そして、スイッチ14の切り換え先となるエンコード対象を判別する(ステップS12)。
【0044】
ステップS12にて、エンコード対象(切り換え先)がサラウンドオーディオストリームであると判別すると、マイコン17は、サラウンドデコーダ11を制御する(ステップS13)。
そして、マイコン17に制御されたサラウンドデコーダ11は、入力したサラウンドオーディオストリームを、その平均音量が下がらないように圧縮してダウンミックスし、ダウンミックスしたLt/Rt信号を、スイッチ14を介してMP3エンコーダ15に供給する。
【0045】
また、ステップS12にて、エンコード対象がマルチチャンネルであると判別すると、マイコン17は、ミキサ部12にてアッテネータ設定し(ステップS14)、また、圧縮部13にてレベルシフトの設定を行う(ステップS15)。
すなわち、マイコン17は、ミキサ部12を制御し、マルチチャンネルの音楽信号を2チャンネルのLt/Rt信号にダウンミックスする。また、マイコン17は、圧縮部13を制御し、ダウンミックスされたLt/Rt信号を非直線圧縮処理し、ミキサ部12にてアッテネートした分だけ、レベルシフトする。
そして、圧縮部13は、レベルシフト後のLt/Rt信号を、スイッチ14を介してMP3エンコーダ15に供給する。
【0046】
また、ステップS12にて、エンコード対象が通常のステレオであると判別すると、マイコン17は、ステップS16に処理を進める。なおその際、入力された通常のステレオ信号は、スイッチ14を介してMP3エンコーダ15に供給される。
【0047】
各種の設定等を終えると、マイコン17は、MP3エンコーダ15を制御する(ステップS16)。つまり、マイコン17に制御されたMP3エンコーダ15は、スイッチ14を介して供給された2チャンネルの音楽信号を、MP3形式の音楽データ(MP3ファイル)にエンコードする。
【0048】
そして、マイコン17は、追加ヘッダを生成し、MP3ファイルの先頭に付加する(ステップS17)。
つまり、マイコン17は、マルチチャンネルのチャンネル数の情報等に従って、図5(a),(b)に示すような追加ヘッダを生成する。そして、生成した追加ヘッダを図6(a),(b)に示すように、MP3ファイルの先頭に付加する。
【0049】
このようなエンコード処理により、マルチチャンネル等の音楽信号がMP3ファイルに適切に変換される。その際、追加ヘッダがMP3ファイルに付加され、ダウンミックスしたマルチチャンネルの内容や、非直線圧縮した内容を把握することができる。
この結果、マルチチャンネルの音楽データを適切にエンコードすることができる。
【0050】
次に、図9を参照して、デコード装置におけるデコード処理について説明する。図9は、マイコン26が実行するデコード処理を説明するためのフローチャートである。このデコード処理は、記録媒体80や通信媒体90からMP3ファイルが供給された際に開始する。
【0051】
まず、マイコン26は、記録媒体80等から供給されたMP3ファイルに追加ヘッダが付加されているか否かを判別する(ステップS21)。つまり、図5(a),(b)に示すような追加ヘッダの有無から、MP3ファイルが上述したエンコード装置にて変換されたファイルであるか否かを判別する。
【0052】
マイコン26は、MP3ファイルに追加ヘッダが付加されていないと判別すると、後述するステップS23に処理を進める。
一方、追加ヘッダが付加されていると判別した場合に、マイコン26は、追加ヘッダの内容が「Lt/Rt」であるか否かを判別する(ステップS22)。
つまり、マイコン26は、図5(b)に示す追加ヘッダにおいて、No.6の圧縮が、「11」(Lt/Rt)であるか否かを判別する。
【0053】
マイコン26は、追加ヘッダの内容が「Lt/Rt」でないと判別すると(ステップS21にて追加ヘッダがないと判別した場合も含む)、ステレオ出力制御を行う(ステップS23)。
すなわち、マイコン26は、非直線伸張部22〜サブマネージメント回路24を何ら制御することなく、MP3デコーダ21にてデコードされたステレオ信号を通過させる。つまり、レベルシフト25を介して2チャンネルステレオの音楽信号を出力させる。
【0054】
一方、追加ヘッダの内容が「Lt/Rt」であると判別した場合に、マイコン26は、マルチチャンネル出力制御を行う(ステップS24)。
すなわち、マイコン26は、非直線伸張部22、方向性強調回路23及び、サブマネージメント回路24をそれぞれ制御し、MP3デコーダ21にてデコードされた2チャンネルステレオの音楽信号をマルチチャンネルの音楽信号に変換する。
つまり、非直線伸張部22は、上述の図7を参照して説明したように、非直線圧縮されたLt/Rt信号を伸張等する。続いて、方向性強調回路23は、伸張されたLt/Rt信号から、方向性が強調されたマルチチャンネル(Lch〜Srch)の音楽信号に変換する。更に、サブマネージメント回路24は、スピーカの構成数等に応じて適宜信号処理し、方向性強調回路23から供給されたマルチチャンネルの音楽信号を振り分ける。
そして、マイコン26は、レベルシフト25を介してマルチチャンネルの音楽信号を出力させる。
【0055】
このようなデコード処理により、付加された追加ヘッダに従って、非直線伸張部22及び、方向性強調回路23を適宜制御し、ステレオ信号を非直線伸張部22にて伸張し、そして、伸張したステレオ信号をマルチチャンネルの音楽信号に変換することができる。
この結果、エンコードした音楽データをマルチチャンネルの音楽データに適切にデコードすることができる。
【0056】
上記の実施の形態では、図9に示すデコード処理において、非直線伸張部22を使用する場合について説明したが、非直線伸張部22を使用しなくともよい。この場合、元の信号を再現することはできなくなるが、楽曲の大きなレベルが非直線圧縮されているため、最大レベルの信号自体が丸められているだけである。そのため、ノイズの発生がなく、平均レベルの変化がなく、また、微小信号の欠落もない。
すなわち、非直線伸張部22を有しない、従来のデコーダ装置(再生装置)等であっても、そのまま再生できるメリットがあり、2チャンネル再生での互換性を保つことができる。
【0057】
上記の実施の形態では、図9に示すデコード処理において、追加ヘッダに従って、方向性強調回路23を制御する場合について説明したが、キー27の操作に従って、利用者が、変換パターンを適宜選択できるようにしてもよい。
すなわち、方向性強調回路23は、図1のエンコード装置により生成されたLt/Rt信号でなくとも、ある程度の互換性を有している。つまり、通常のステレオ信号であっても、マルチチャンネル信号として出力できるし、逆に、Lt/Rt信号であって、通常のステレオ信号として出力できる。
このため、キー27の操作に従って、利用者が、出力パターンを適宜選択できるようにしてもよい。
【0058】
【発明の効果】
以上説明したように、本発明によれば、マルチチャンネルの音楽データを適切にエンコードすることができる。また、エンコードした音楽データをマルチチャンネルの音楽データに適切にデコードすることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係るエンコード装置の構成の一例を示すブロック図である。
【図2】本発明の実施の形態に係るデコード装置の構成の一例を示すブロック図である。
【図3】エンコード装置におけるミキサ部の詳細な構成の一例を示すブロック図である。
【図4】エンコード装置における非直線圧縮について説明するための模式図である。
【図5】(a)が追加ヘッダの構造の一例を示す模式図であり、(b)が追加ヘッダの内容を説明するための模式図である。
【図6】(a),(b)共に、追加ヘッダが付加されたMP3ファイルの一例を説明するための模式図である。
【図7】デコード装置における非直線伸張について説明するための模式図である。
【図8】本発明の実施の形態に係るエンコード処理を説明するためのフローチャートである。
【図9】本発明の実施の形態に係るデコード処理を説明するためのフローチャートである。
【図10】(a)〜(c)共に、MP3ファイルの再生等を行う従来環境を説明するための模式図である。
【図11】(a)がMP3ヘッダの構造の一例を示す模式図であり、(b)がMP3ヘッダの内容を説明するための模式図である。
【符号の説明】
11 サラウンドデコーダ
12 ミキサ部
13 圧縮部
14 スイッチ
15 MP3エンコーダ
16 加算器
17 マイコン
18 キー
21 MP3デコーダ
22 非直線伸張部
23 方向性強調回路
24 サブマネージメント回路
25 レベルシフト
26 マイコン
27 キー
80 記録媒体
90 通信媒体

Claims (6)

  1. マルチチャンネルの音楽信号を入力し、前記マルチチャンネルの各チャンネルに対して所定の減衰値のアッテネータにより減衰させ、減衰させた各チャンネルの音楽信号を加算器にて加算させて、2チャンネルステレオの音楽信号にダウンミックスするミックス手段と、
    前記ミックス手段によりダウンミックスされた音楽信号を、該音楽信号がクリップしない非直線特性を用いて非直線圧縮し、前記ミックス手段により減衰させた分だけレベルシフトする圧縮手段と、
    前記圧縮手段により非直線圧縮された音楽信号を、予め定められたデータ圧縮規格に従って、圧縮された音楽データにエンコードするエンコード手段と、
    前記ミックス手段がダウンミックスしたマルチチャンネルの内容と、該ダウンミックスにより減衰させた減衰量とを含むヘッダ情報を生成するヘッダ生成手段と、
    前記エンコード手段がエンコードした音楽データに、前記ヘッダ生成手段により生成されたヘッダ情報を付加する付加手段と、
    を備えることを特徴とするエンコード装置。
  2. 前記エンコード手段は、MP3(MPEG1 Audio Layer-3)規格に従って、音楽信号を音楽データにエンコードする、
    ことを特徴とする請求項1に記載のエンコード装置。
  3. 請求項1に記載のエンコード装置によりエンコードされた音楽データをデコードするデコード装置であって、
    入力した音楽データを、予め定められたデータ伸張規格に従って、2チャンネルの音楽信号にデコードするデコード手段と、
    ダウンミックスしたマルチチャンネルの内容と該ダウンミックスにより減衰させた減衰量とを含むヘッダ情報が、入力した音楽データに付加されているか否かを判別する判別手段と、
    前記判別手段によりヘッダ情報が付加されていると判別された場合に、前記デコード手段によりデコードされた、クリップしない非直線特性を用いて非直線圧縮されている音楽信号を、当該非直線特性と逆の入出力特性にて変換することにより元のリニア特性に戻し、ヘッダ情報における減衰させた減衰量の分だけ音量レベルを上げる伸張手段と、
    前記伸張手段により非直線伸張された音楽信号を、ヘッダ情報におけるマルチチャンネルの内容に従ってマルチチャンネルの音楽信号に変換する変換手段と、
    を備えることを特徴とするデコード装置。
  4. 前記デコード手段は、MP3規格に従って、音楽データを音楽信号にデコードし
    記変換手段は、予め定められた規格に従って、2チャンネルの音楽信号から、方向性が強調されたマルチチャンネルの音楽信号に変換する、
    ことを特徴とする請求項3に記載のデコード装置。
  5. ミキサ部、圧縮部、エンコーダ、制御部、及び、加算器を有するエンコード装置におけるエンコード方法であって、
    前記ミキサ部が行う、マルチチャンネルの音楽信号を入力し、前記マルチチャンネルの各チャンネルに対して所定の減衰値のアッテネータにより減衰させ、減衰させた各チャンネルの音楽信号を加算器にて加算させて、2チャンネルステレオの音楽信号にダウンミックスするミックスステップと、
    前記圧縮部が行う、前記ミックスステップにてダウンミックスされた音楽信号を、該音楽信号がクリップしない非直線特性を用いて非直線圧縮し、前記ミックス手段により減衰させた分だけレベルシフトする圧縮ステップと、
    前記エンコーダが行う、前記圧縮ステップにて非直線圧縮された音楽信号を、予め定められたデータ圧縮規格に従って、圧縮された音楽データにエンコードするエンコードステップと、
    前記制御部が行う、ミックスステップにてダウンミックスされたマルチチャンネルの内容と、該ダウンミックスにより減衰させた減衰量とを含むヘッダ情報を生成するヘッダ生成ステップと、
    前記加算器が行う、前記エンコードステップにてエンコードされた音楽データに、前記ヘッダ生成ステップにて生成されたヘッダ情報を付加する付加ステップと、
    を備えることを特徴とするエンコード方法。
  6. デコーダ、制御部、伸張部、及び、強調回路を有し、請求項5に記載のエンコード方法によりエンコードされた音楽データをデコードするデコード装置におけるデコード方法であって、
    前記デコーダが行う、入力した音楽データを、予め定められたデータ伸張規格に従って、2チャンネルの音楽信号にデコードするデコードステップと、
    前記制御部が行う、ダウンミックスしたマルチチャンネルの内容と該ダウンミックスにより減衰させた減衰量とを含むヘッダ情報が、入力した音楽データに付加されているか否かを判別する判別ステップと、
    前記伸張部が行う、前記判別ステップにてヘッダ情報が付加されていると判別された場合に、前記デコードステップにてデコードされた、クリップしない非直線特性を用いて非直線圧縮されている音楽信号を、当該非直線特性と逆の入出力特性にて変換することにより元のリニア特性に戻し、付加されたヘッダ情報における減衰させた減衰量の分だけ音量レベルを上げる伸張ステップと、
    前記強調回路が行う、前記伸張ステップにて非直線伸張された音楽信号を、付加されたヘッダ情報におけるマルチチャンネルの内容に従ってマルチチャンネルの音楽信号に変換する変換ステップと、
    を備えることを特徴とするデコード方法。
JP2002335166A 2002-11-19 2002-11-19 エンコード装置、デコード装置、エンコード方法およびデコード方法 Expired - Fee Related JP4084990B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002335166A JP4084990B2 (ja) 2002-11-19 2002-11-19 エンコード装置、デコード装置、エンコード方法およびデコード方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002335166A JP4084990B2 (ja) 2002-11-19 2002-11-19 エンコード装置、デコード装置、エンコード方法およびデコード方法

Publications (2)

Publication Number Publication Date
JP2004170610A JP2004170610A (ja) 2004-06-17
JP4084990B2 true JP4084990B2 (ja) 2008-04-30

Family

ID=32699367

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002335166A Expired - Fee Related JP4084990B2 (ja) 2002-11-19 2002-11-19 エンコード装置、デコード装置、エンコード方法およびデコード方法

Country Status (1)

Country Link
JP (1) JP4084990B2 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
WO2006126858A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
JP2009500657A (ja) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
CA2613885C (en) * 2005-06-30 2014-05-06 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
EP1913576A2 (en) 2005-06-30 2008-04-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
JP4859925B2 (ja) 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
WO2007027055A1 (en) * 2005-08-30 2007-03-08 Lg Electronics Inc. A method for decoding an audio signal
WO2007055464A1 (en) 2005-08-30 2007-05-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP5173811B2 (ja) 2005-08-30 2013-04-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
KR100857119B1 (ko) 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
WO2007040361A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US20070092086A1 (en) 2005-10-24 2007-04-26 Pang Hee S Removing time delays in signal paths
US7752053B2 (en) 2006-01-13 2010-07-06 Lg Electronics Inc. Audio signal processing using pilot based coding
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
JP2007311965A (ja) * 2006-05-17 2007-11-29 Pioneer Electronic Corp デジタルオーディオ信号処理装置
EP2084703B1 (en) * 2006-09-29 2019-05-01 LG Electronics Inc. Apparatus for processing mix signal and method thereof
EP2084901B1 (en) 2006-10-12 2015-12-09 LG Electronics Inc. Apparatus for processing a mix signal and method thereof
US20080269929A1 (en) 2006-11-15 2008-10-30 Lg Electronics Inc. Method and an Apparatus for Decoding an Audio Signal
JP5270566B2 (ja) 2006-12-07 2013-08-21 エルジー エレクトロニクス インコーポレイティド オーディオ処理方法及び装置
US8265941B2 (en) 2006-12-07 2012-09-11 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
DE102008036924B4 (de) * 2008-08-08 2011-04-21 Gunnar Kron Verfahren zur Mehrkanalbearbeitung in einem Mehrkanaltonsystem
JP2011060366A (ja) * 2009-09-09 2011-03-24 Teac Corp マルチトラックレコーダ装置
JP5417227B2 (ja) * 2010-03-12 2014-02-12 日本放送協会 マルチチャンネル音響信号のダウンミックス装置及びプログラム

Also Published As

Publication number Publication date
JP2004170610A (ja) 2004-06-17

Similar Documents

Publication Publication Date Title
JP4084990B2 (ja) エンコード装置、デコード装置、エンコード方法およびデコード方法
JP5695677B2 (ja) 単一再生モードにおいてラウドネス測定値を合成するシステム
JP4610650B2 (ja) 多チャンネルオーディオ符号化
JP4952469B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP5329846B2 (ja) ディジタルデータプレーヤー、そのデータ処理方法及び記録媒体
KR20020071691A (ko) 오디오 데이터 편집 방법과 이를 적용한 기록매체 및디지털 오디오 플레이어
US7714223B2 (en) Reproduction device, reproduction method and computer usable medium having computer readable reproduction program emodied therein
US20080013430A1 (en) Method of Recording, Reproducing and Handling Audio Data in a Data Recording Medium
JP2001134295A (ja) 符号化装置および符号化方法、記録装置および記録方法、送信装置および送信方法、復号化装置および符号化方法、再生装置および再生方法、並びに記録媒体
US6759585B2 (en) Musical-file-processing apparatus, musical-file-processing method and musical-file-processing method program
JP2002314429A (ja) 信号処理装置および信号処理方法
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
Knapen et al. Lossless compression of 1-bit audio
JP2004194100A (ja) オーディオ復号再生装置
Smyth et al. DTS Coherent Acoustics Delivering High-Quality Multichannel Sound to the Consumer
JP2005149608A (ja) 音声データ記録/再生システムとその音声データ記録媒体
JP2006350132A (ja) オーディオ再生装置、オーディオ再生方法及びオーディオ再生プログラム
JP2002109824A (ja) ディジタル音声信号の記録方法、およびその装置
JPH1173728A (ja) チャネル毎に分解能が異なるマルチチャネルデジタル音声の記録および再生
JP4254960B2 (ja) 音声データエンコード装置および音声データ再生装置
KR100990200B1 (ko) 최소한의 메모리를 사용하여 크로스-페이드 효과를 내는오디오 재생방법
JP2003257125A (ja) 音再生方法および音再生装置
JP2002304198A (ja) 信号処理装置および信号処理方法
JP2000347697A (ja) 音声記録再生装置および記録媒体
JP2001069089A (ja) ディジタル信号記録装置および記録方法、並びに記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070724

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080218

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120222

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees