JP2005149608A - 音声データ記録/再生システムとその音声データ記録媒体 - Google Patents
音声データ記録/再生システムとその音声データ記録媒体 Download PDFInfo
- Publication number
- JP2005149608A JP2005149608A JP2003384556A JP2003384556A JP2005149608A JP 2005149608 A JP2005149608 A JP 2005149608A JP 2003384556 A JP2003384556 A JP 2003384556A JP 2003384556 A JP2003384556 A JP 2003384556A JP 2005149608 A JP2005149608 A JP 2005149608A
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- power
- data
- power information
- music
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/12—Formatting, e.g. arrangement of data block or words on the record carriers
- G11B20/1217—Formatting, e.g. arrangement of data block or words on the record carriers on discs
- G11B20/1251—Formatting, e.g. arrangement of data block or words on the record carriers on discs for continuous data, e.g. digitised analog information signals, pulse code modulated [PCM] data
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
- G11B2020/00014—Time or data compression or expansion the compressed signal being an audio signal
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
【課題】 簡単な構成で使い勝手がよく安全な音声データ記録/再生システムとその音声データ記録媒体を提供する。
【解決手段】 楽曲(音楽プログラム)に対応した音声データの平均的な音圧パワーに相関したパワー情報を上記楽曲(音楽プログラム)に付属させて記録して音楽データ記録媒体を構成する。あるいは、エンコード部において、楽曲(音楽プログラム)に対応したデジタル音声データを受けて、その平均的な音圧パワーに相関したパワー情報を生成するパワー情報生成部を備え、上記デジタル音声データをデータ圧縮したデータに上記パワー情報を関連付けて記録部に記録し、デコード部により上記パワー情報を抽出するとともに圧縮された音声データをもとのデジタル音声データに復元し、上記パワー情報に基づいて調整して出力し、又は上記復元されたデジタル音声データと上記パワー情報とを出力する。【選択図】 図1
【解決手段】 楽曲(音楽プログラム)に対応した音声データの平均的な音圧パワーに相関したパワー情報を上記楽曲(音楽プログラム)に付属させて記録して音楽データ記録媒体を構成する。あるいは、エンコード部において、楽曲(音楽プログラム)に対応したデジタル音声データを受けて、その平均的な音圧パワーに相関したパワー情報を生成するパワー情報生成部を備え、上記デジタル音声データをデータ圧縮したデータに上記パワー情報を関連付けて記録部に記録し、デコード部により上記パワー情報を抽出するとともに圧縮された音声データをもとのデジタル音声データに復元し、上記パワー情報に基づいて調整して出力し、又は上記復元されたデジタル音声データと上記パワー情報とを出力する。【選択図】 図1
Description
この発明は、音声データ記録/再生システムとその音声データ記録媒体に関し、例えば複数の音楽CD(Compact Disc Digital Audio(CD−DA))に記録されたデジタル音楽データを編集する音声データ記録/再生システムとその音声データ記録媒体に利用して有効な技術に関するものである。
音楽CDからオーディオデジタルデータを読み出し(CDリッピング)、AAC,MP3などに圧縮(エンコード)した上、ハードディスク等の記録媒体に保存する記録/再生システムが各種提案されている。従来の提案されているシステムでは、音楽CDの録音レベルは保たれた状態で保存される。ミドルウェア単品(デコーダ、エンコーダ)の技術に関しては、例えば、MPEG1 Audio Layer3 (規格書:ISO/IEC11172-3),MPEG2 Audio Layer3 (規格書:ISO/IEC 13818-3),MPEG2 Advance Audio Coding (規格書:ISO/IEC13818-7),MPEG4 Advance Audio Coding (規格書:ISO/IEC14496-3)がある。
MPEG1 Audio Layer3 (規格書:ISO/IEC11172-3) MPEG2 Audio Layer3 (規格書:ISO/IEC 13818-3) MPEG2 Advance Audio Coding (規格書:ISO/IEC13818-7) MPEG4 Advance Audio Coding (規格書:ISO/IEC14496-3)
MPEG1 Audio Layer3 (規格書:ISO/IEC11172-3) MPEG2 Audio Layer3 (規格書:ISO/IEC 13818-3) MPEG2 Advance Audio Coding (規格書:ISO/IEC13818-7) MPEG4 Advance Audio Coding (規格書:ISO/IEC14496-3)
本願発明者等においては、オーディオデータを保存するハードディスク等の記憶容量は増加する動向にあり、何枚もの音楽CDから好みの楽曲(音楽プログラム)を選んでオーディオデータを保存する使い方に向けた音声データ記録/再生システムを検討した。音楽CDの録音レベルは音楽CDや同じ音楽CDでも楽曲(音楽プログラム)毎に異なる為、何枚もの音楽CDから抽出された複数の楽曲(音楽プログラム)を1つのハードディスク等の記憶媒体に保存し、それらを連続して再生した場合、楽曲(音楽プログラム)毎の再生音量にバラツキが生じてしまう。つまり、実際の聴取場面において、聴取者は楽曲(音楽プログラム)が切り替わる毎に手動にて最適な音量の調整する必要が生じる。この再生音量にバラツキは、特に、ヘッドフォンなど密閉度の高い機器を使用中では、再生音量が急激に上がるような楽曲(音楽プログラム)の組み合わせがあると不快感が生じることの他に人の聴覚にも障害を与えたり、運転中でのカーオーディオでは再生音量が急激に上がることにより、注意力が音量調整に向けられて咄嗟の運転操作に支障きたしたりしてしまう等の危険性もある。
図17には、2枚の音楽CDデータをエンコードしてHD(ハードディスク)に保存することを想定した場合の実際の波形図が示されている。同図においては、CD1がロック等の楽曲(音楽プログラム)が記録され、CD2がジャズ等の楽曲(音楽プログラム)が記録された場合の波形例である。この場合、CD1の曲Aのパワーは大きく、CD2の曲Bのパワーは小さい。このようにパワーに大きな差がある曲Bと曲AをエンコードしてハードディスクHDにデータを保存し、その圧縮データを再生する場合には、曲Bに対応して音量を設定していると、曲Bから曲Aに切り替わるとそのままでは音量が非常に大きくなりユーザが手動でボリューム調整を行うことが必要となり、前記のような問題を生じる。
この発明の目的は、簡単な構成で使い勝手がよく安全な音声データ記録/再生システムとその音声データ記録媒体を提供することにある。この発明の前記ならびにそのほかの目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。
本願において開示される発明のうち代表的なものの概要を簡単に説明すれば、下記の通りである。すなわち、楽曲(音楽プログラム)に対応した音声データと、上記音声データの平均的な音圧パワーに相関したパワー情報を上記楽曲(音楽プログラム)に付属させて記録して音楽データ記録媒体を構成する。
本願において開示される発明のうち他の代表的なものの概要を簡単に説明すれば、下記の通りである。すなわち、エンコード部において、楽曲(音楽プログラム)に対応したデジタル音声データを受けて、その音声データの平均的な音圧パワーに相関したパワー情報を生成するパワー情報生成部を備え、上記デジタル音声データをデータ圧縮した圧縮データに上記生成されたパワー情報を関連付けて記録部に記録し、デコード部により上記記録部の読み出し信号から上記パワー情報を抽出するとともに圧縮された音声データをもとのデジタル音声データに復元し、出力部により上記復元されたデジタル音声データから生成されたアナログ音声データのレベルを上記パワー情報に基づいて調整して出力し、又は上記復元されたデジタル音声データと上記パワー情報とを出力する。
音圧パワーの異なる音データを再生する際に、該音データの切り替わり毎の音量調整を不要にできる音データを再生又は、生成又は、保持する事ができる。
図1には、この発明に係る音声データ(音データ)の記録/再生システムの一実施例のブロック図が示されている。同図は、音声データの記録/再生の信号処理に沿った信号処理フローの形態で音声データ記録/再生システムを表している。入力音声データは、特に制限されないが、音楽CD等の音楽データ(:PCMデータ)101とされる。この実施例のシステムでは、エンコード処理部102に音の大きさを表すパワー情報(音圧パワー)の計算部103と、ここで生成されたパワー情報をエンコード処理部102で形成された圧縮データに埋め込む処理部104とを有す。
上記PCMデータ101を入力した後、本実施例のシステムでは、上記のようにパワー情報計算部103と、パワー情報を圧縮データに埋め込む処理部104とをエンコード処理部102に付加し、パワー情報が付加された圧縮データ105を生成する。このようなパワー情報が付加された圧縮データ105は、例えばMP3やAAC等の圧縮データに対してパワー情報が付加されたものであり、HD(ハードディスク)や光ディスク等の記録媒体105aに記録される。
デコード処理部106は、上記記録媒体105a中に記録されたパワー情報付圧縮データ105を受けて、圧縮データに付加されたパワー情報を読み出し部107によりパワー情報を取り出す。出力部108では、パワー情報に合わせてPCMデータのパワーを調整する。つまり、この実施例のシステムのデコード処理106では前記パワー情報付加圧縮データ105を読み出し、パワー情報読み出し部107により圧縮データの中からパワー情報を取り出す。また、圧縮データをもとのPCMデータに復元する。
出力部108においては、パワー情報読み出し部107で取得したパワー情報に合わせ、PCMデータの音量を自動調整する。PCMデータの調整は、デコード処理部106の内でも実行するようにしてもよいし、デコード処理外(アプリケーション等の外部処理部)でも実行することも可能である。以上の信号処理により、PCMデータ109は音量(パワー)を調整されたものとされる。
図2には、この発明に係る音声データ記録/再生システムに用いられるエンコード処理部の一実施例のブロック図が示されている。同図においても、信号処理に沿った信号処理フローの形態でエンコード処理部を表している。つまり、図2は、図1のエンコード部102の具体的構成例が示されている。この実施例のエンコード処理部では、入力音声データとして16ビットPCM201が入力される。この入力信号は、フィルタバンク処理部202でスペクトルに変換される。本エンコード処理はMP3やAACのような従来のエンコード処理と同様である。この実施例では、スペクトルとなったデータをもとに、計算部203によりスペクトル平均パワー値を計算する。スペクトルとなったデータを基にスペクトル平均パワー値を計算する事により計算量を減らし、平均パワー値を計算する事による消費電力や処理時間を殆ど増やすことなく行う事ができる。このスペクトル平均パワー値を計算する処理は、この発明に係る音声データ記録/再生システムにおける特徴の一つとなる。パワー値の実際の計算方法は、図5,図6を用いて後述する。
パワー値の計算とは別に、上記エンコード処理の一部である量子化処理部204により量子化処理を実施し、ハフマン符号化処理部205でハフマン符号化処理を実施する。これらの量子化処理とハフマン符号化処理も従来のエンコード処理と同様である。次にビットストリームを生成部206において、ビットストリーム(圧縮データ)生成の中に、上記計算部203で計算したスペクトル平均パワー値を挿入する処理部207が設けられる。このスペクトル平均パワー値をビットストリームに挿入する方法は図7を用いて後述する。ビットストリームの生成そのものは従来のエンコード処理と同様であるが、圧縮データに平均パワー値を書き込む処理部207が設けられるところが本発明の特徴の一つとなる。以上より、パワー情報が付加された圧縮ビットストリーム208が生成される。
図3には、パワー情報付きストリームデータ形式の一実施例の構成図が示されている。この実施例は本発明のパワー情報を付加したMP3圧縮データが、コンパクトディスク(CD)301に記録されている場合の例である。これは、図1の記録媒体105aに相当する。同図に示したストリームのデータ形式は、コンパクトディスク301の一部ということになる。MP3のデータ形式は、1フレーム302は、1152サンプル毎のフレーム構成をとっている。また1フレーム302は、576サンプル(1グラニュールとよばれる)の2グラニュール構成となっている。1フレーム302は、ヘッダ303、CRC307、サイド情報309、メインデータ310からなる。
MP3の基本構成は、図4に示したように各フレームのはじめに、フレームの始まりである事を示す12ビットの同期語(Syncword)304やID情報305、layer情報306、ビットレート情報等を含む全32ビットからなるヘッダ部分303がある。次に、存在する場合としない場合がある16ビットのエラーチェック情報(CRC)307がある。CRC307のある/なしは、ヘッダのprotection-bit308の0と1の値で判別する。次にサイド情報(309)等が続く。サイド情報(309)は、メインデータ311の開始を示す9ビットのmain-data-begin情報311、私用目的のビットであるprivate-bits312,313等が続く。Private-bits312,313は、ステレオ時3ビット313であり、モノラル時5ビット312と規定されている。
この実施例では、このサイド情報309の中のprivate-bits312,313に平均パワー値を書き込むビットとして使用する。平均パワーを書き込むビットは、圧縮データの中であればprivate-bitsでなくてもかまわない。次に、実際のオーディオ圧縮データであるメインデータ310が続く。メインデータの中には、scalefac-scale314、scalefac-l315等、様々なデータがビットで構成されている。1フレームが完了すると、次に2フレームのヘッダ316が続く。
図5には、この発明に係る音声データ記録/再生システムに用いられるデコード処理部の一実施例のブロック図が示されている。同図においても、信号処理に沿った信号処理フローの形態でデコード処理部を表している。このデコード処理部は、図1のデコード処理部106に対応している。この発明の特徴であるパワー情報付き圧縮データ401が前記記憶媒体から読み出されて入力される。デコーダは、サーチ部402により入力圧縮データ401の各フレームのサイド情報から前記パワー情報をサーチして読み出す。計算部403によりサーチしたパワー情報を平均化して1曲のパワー平均を計算する。デコート部では、ハフマン復号部404により圧縮データ401からハフマン復号を行い、逆量子化部405により逆量子化を行い、逆フィルタバンク部406により逆フィルタバンクを行ってPCMデータ407を得る。上記ハフマン復号部404から逆フィルタバンク部406は従来のデコード処理と同様である。
図6には、本発明に係るスペクトル平均(パワー計算)の一実施例のフローチャート図が示されている。このスペクトル平均(パワー計算)は、図1のパワー情報計算部103での計算処理の例である。この実施例は、MPEG1 Audio Layer3(MP3)の例である。MP3では一般的に1グラニュール(576サンプル)単位で処理を行う。入力データ(16ビットPCM(501))を入力して、フィルタバンク処理502を行い、入力信号をスペクトルに変換する。ここで、576個の要素から構成されるスペクトル情報配列をSPEC[576]とする。計算処理504において、次式(1)のように1グラニュール毎にスペクトル絶対値平均Agr計算する。
(式1)
計算処理505において、1フレーム分のAgrデータを計算し、1フレーム分のグラニュール平均を1フレーム平均パワー(Aframe)として次式(2)により計算する。
(式2)
図7には、本発明に係るスペクトル平均(パワー計算)の他の一実施例のフローチャート図が示されている。このスペクトル平均(パワー計算)は、図1のパワー情報計算部103での計算処理の例である。この実施例は、MPEG1 AudioLayer3(MP3)の例である。前記図6の実施例では、1フレームの平均パワーをパワー情報として取得、フレーム毎に圧縮データに書き込むことに対し、本実施例は、パワー平均を1曲全体で取得し、1曲につき、1パワー情報を取得、書き込みする例である。入力データ(16ビットPCM(601))を入力して、フィルタバンク処理602を行い、入力信号をスペクトルに変換する。ここで、576個の要素から構成されるスペクトル情報配列をSPEC[576]とする。計算処理604において、次式(3)のように1グラニュール毎にスペクトル絶対値平均Agr計算する。
(式3)
計算処理605において、1フレーム分のAgrデータを計算し、そのデータから1曲分のスペクトル平均を1曲平均パワーとして取得する。グラニュール平均を1曲平均パワー(Amusic)として次式(4)により計算する。
(式4)
この実施例では、図6の実施例が各フレームにパワー情報が付加されている例に対し、曲の開始フレームのサイド情報又は、最終フレームのサイド情報に書き込むようにするか、あるいは途中からの再生を行う場合も考慮して、全てのフレームのサイド情報に同じパワー情報を書き込むようにするものであってもよい。このようなデータ形式の場合、開始フレーム又は最終フレーム或いは途中のいずれか1つのフレームのパワー情報だけを読み込めば、その曲全体のパワー平均が取得できる。その為、図6のデータ形式のようにデコーダ1曲分のフレームを全てサーチしてパワー平均を計算する必要がなくなる。この実施例のように1曲分の平均パワー情報を計算するものにおいては、パワー情報をヘッダ部に書き込むことを想定した場合、MPEG Advance Audio Coding のADIF形式のように、ヘッダ部が曲の始めに1つしか存在しないデータ形式にも応用できる。
(式1)
計算処理505において、1フレーム分のAgrデータを計算し、1フレーム分のグラニュール平均を1フレーム平均パワー(Aframe)として次式(2)により計算する。
(式2)
図7には、本発明に係るスペクトル平均(パワー計算)の他の一実施例のフローチャート図が示されている。このスペクトル平均(パワー計算)は、図1のパワー情報計算部103での計算処理の例である。この実施例は、MPEG1 AudioLayer3(MP3)の例である。前記図6の実施例では、1フレームの平均パワーをパワー情報として取得、フレーム毎に圧縮データに書き込むことに対し、本実施例は、パワー平均を1曲全体で取得し、1曲につき、1パワー情報を取得、書き込みする例である。入力データ(16ビットPCM(601))を入力して、フィルタバンク処理602を行い、入力信号をスペクトルに変換する。ここで、576個の要素から構成されるスペクトル情報配列をSPEC[576]とする。計算処理604において、次式(3)のように1グラニュール毎にスペクトル絶対値平均Agr計算する。
(式3)
計算処理605において、1フレーム分のAgrデータを計算し、そのデータから1曲分のスペクトル平均を1曲平均パワーとして取得する。グラニュール平均を1曲平均パワー(Amusic)として次式(4)により計算する。
(式4)
この実施例では、図6の実施例が各フレームにパワー情報が付加されている例に対し、曲の開始フレームのサイド情報又は、最終フレームのサイド情報に書き込むようにするか、あるいは途中からの再生を行う場合も考慮して、全てのフレームのサイド情報に同じパワー情報を書き込むようにするものであってもよい。このようなデータ形式の場合、開始フレーム又は最終フレーム或いは途中のいずれか1つのフレームのパワー情報だけを読み込めば、その曲全体のパワー平均が取得できる。その為、図6のデータ形式のようにデコーダ1曲分のフレームを全てサーチしてパワー平均を計算する必要がなくなる。この実施例のように1曲分の平均パワー情報を計算するものにおいては、パワー情報をヘッダ部に書き込むことを想定した場合、MPEG Advance Audio Coding のADIF形式のように、ヘッダ部が曲の始めに1つしか存在しないデータ形式にも応用できる。
図8には、この発明に係るパワー情報を圧縮データに書き込む方法の一実施例の説明図が示されている。これは、図1の処理部104での書き込み方法に対応している。前記図6で計算した1フレーム平均パワー(Aframe) (式(2))で得たデータから、分類処理702によりパワー情報として7段階のパワーレベルの何処に属するかの分類を行う。このような分類により得たパワーレベル情報は、対応フレーム707のサイド情報706の一部分であるprivate-bits705に書き込まれる。本実施例では、private-bitsの3ビットを使用する例が示されている。
パワーレベル情報の一例704は、以下のようにされる。
000:パワー情報オフ(無し)
001:パワーレベル1
010:パワーレベル2
011:パワーレベル3
100:パワーレベル4
101:パワーレベル5
110:パワーレベル6
111:パワーレベル7
上記パワーレベルは、CDのうちの最もパワーレベルが小さいのグループをレベル1とし、パワーレベルが最も大きいグループをレベル7として7段階に分類するものである。この分類のために、すべての音楽ジャンルを含む複数のCDの楽曲(音楽プログラム)毎の平均パワーを求めて統計的に7グループに分けるようにするものである。ここでは、聴感上の平均パワーとして7段階とすることが必要である。これにより、上記レベル1からレベル7までのパワーレベルが聴感上直線的に並べられることとなる。上記パワー情報を記録するための記録部のビット数がより多く使用できるものでは、パワー情報のレベルは上記7段階以上に設定することも可能となる。また、パワーレベル情報を書き込む場所は、レベル情報が前記private-bitsでなくてもよい。
001:パワーレベル1
010:パワーレベル2
011:パワーレベル3
100:パワーレベル4
101:パワーレベル5
110:パワーレベル6
111:パワーレベル7
上記パワーレベルは、CDのうちの最もパワーレベルが小さいのグループをレベル1とし、パワーレベルが最も大きいグループをレベル7として7段階に分類するものである。この分類のために、すべての音楽ジャンルを含む複数のCDの楽曲(音楽プログラム)毎の平均パワーを求めて統計的に7グループに分けるようにするものである。ここでは、聴感上の平均パワーとして7段階とすることが必要である。これにより、上記レベル1からレベル7までのパワーレベルが聴感上直線的に並べられることとなる。上記パワー情報を記録するための記録部のビット数がより多く使用できるものでは、パワー情報のレベルは上記7段階以上に設定することも可能となる。また、パワーレベル情報を書き込む場所は、レベル情報が前記private-bitsでなくてもよい。
図9には、この発明に係る圧縮データをデコードする際のパワーレベルの読み出し方法の一実施例の説明図が示されている。これは、前記図5の計算処理403に対応している。同図では、MP3の圧縮データを対象とし、フレーム毎のサイド情報のprivate-bitsに各フレームのパワーレベルが入っている例が示されている。パワー情報付き圧縮データ801を取り込んだデコーダ部802は、各フレームのprivate-bitsに埋め込まれたパワーレベルを1曲分全てサーチ処理803をして、1曲のパワー平均を次の式(5)に従って計算する。
(式5)
(式5)
図10のフレームビット構成図に示したように、Private-bits805は、807で示したようにCRC有りの場合、フレームの開始から58ビット目を始まりとし、CRC無しの場合、フレームの開始から42ビット目を始まりとする。そのため、フレームの開始から対応ビット数目をカウントし、そこから3ビットを読み出せばよいこととなる。特に制限はないが、音楽データをデコードする前に、ヘッダのパワー情報のみをサーチして、パワー平均を計算することが可能である。
図11には、この発明に係る音声データ記録/再生システムのデコード処理部の一実施例のブロック図が示されている。同図においても、信号処理に沿った信号処理フローの形態でデコード処理部を表している。この実施例では、デコード処理部内でパワー情報を読み取り、デコード処理部外でパワーを調整するシステムに向けられている。パワー情報付き圧縮データ901はデコード処理部902に入力される。サーチ部903、計算部904及び出力部905及びメモリ906によりパワー情報を取得して記憶し、ハフマン復号、逆量子化及び逆フィルタバンクによりPCMデータを生成する一連の動作は、前記図5と同様である。ただし、前記図5の実施例と異なる点は、1曲のパワー平均を計算部904で算出した後、出力部905を介してパワー平均を出力データを一旦何らかのメモリ906に保持させる。
一方、デコード結果で得たPCMデータは、D/A(デジタル/アナログ)変換部907でアナログ信号に変換され、スピーカやヘッドフォン等で外部に出力する際に、メモリ906に保持されたパワー平均情報を使用して、出力音量制御部908により出力するボリューム(音量)を自動調整する。それにより、曲毎のボリュームが平均的に保たれ、曲により急激にボリュームが大きくなる(又は小さくなる)等の問題が無くなる。つまり、前記7段階のレベル情報が記録されていた場合、中間のレベル4を中心にして、それよりも小さいレベル3、2、1は、レベル4を目標としてレベル増大させられ、それよりも大きなレベル5、6、7は、レベル4を目標としてレベルが減衰させられる。レベル4とされた曲は、そのままのレベルで出力される。
図12には、この発明に係る音声データ記録/再生システムのデコード処理部の他の一実施例のブロック図が示されている。同図においても、信号処理に沿った信号処理フローの形態でデコード処理部を表している。前記図1と図11の実施例が、デコード処理部内で各楽曲(音楽プログラム)のパワーレベルを取得し、かかるパワーレベルを用いてデコード処理部の外部でボリューム調整(音量調整)を行うのに対し、図12の実施例は、デコード処理部の内部でボリューム(ここではPCMデータ)のパワー調整を行うものである。この場合、MP3プレーヤ等、外部のアプリケーションでボリューム調整を行う必要がなくなる。
パワー情報付き圧縮データ1001をデコーダ処理部に入力されると、ハフマン復号、逆量子化、逆フィルタバンクを行い、PCMデータを生成するまでは前記図5の実施例と同様である。サーチ部1002によりパワー情報を取り出し、計算部1003で1曲のパワー平均を計算する。前記のPCMデータを生成後、計算部1003からの1曲のパワー平均の情報を受けて、デコード処理部内でPCMデータの大きさを、調整部1004により前記のようにパワー平均に合わせ調整する。それにより、パワー調整済みのPCMデータ1005を生成するものである。
図13には、この発明に係る音声データ記録/再生システムのエンコード処理部の他の一実施例のブロック図が示されている。前記図2に示した実施例では、フィルタバンク処理後、PCMデータをスペクトルデータに変換した後にパワー情報の取得を行うものである。これに対して、図13の実施例では、エンコード処理部にPCMデータ1101が入力されると、フィルタバンク処理部1103でのフィルタバンド処理の前に、計算部1102により当該PCMデータのパワー平均を取得する。PCMデータ1101が入力されると、上記計算部1102によりフレーム毎のPCMパワー平均値が計算される。
その後、フィルタバンク部1103、量子化処理部1104、ハフマン符号化処理部1105でエンコード処理が行われてデータ圧縮が行われてビットストリーム生成部1106により平均パワー(本実施例ではPCMデータのフレーム平均パワー)が所定ビットに書き込まれる。結果、パワー情報付き圧縮ビットストリーム1107を出力できる。つまり、図示しない記録媒体に記憶される。
図14には、この発明に係る音声データ記録/再生システムのエンコード処理部の更に他の一実施例のブロック図が示されている。この実施例は、計算部1202により入力PCM1201のパワー最大値を計算し、最大値をパワー情報として取得する。このパワー情報を用いて出力音量調整(ボリューム調整)に利用する。ここで、パワー情報は最小値でもかまわないし、PCMのパワーでも、フィルタバンク後のスペクトルのパワーでもかまわない。パワー情報を取得後、ビットストリーム生成部1206において情報をビットに書き込まれる。
図15には、この発明に係る音声データ記録媒体の一実施例の構成図が示されている。この実施例は、Compact Disc Digital Audio(CD−DA)に本願発明を適用した例が示されている。音楽CD規格のフォーマットは1フレーム24バイト(=192ビット)データのほか、誤り訂正用の情報等を含む588ビットから成る。この588ビットの中には、8ビットのサブコードが含まれている。サブコードは、Pビット、Qビット、Rビット、Sビット、Tビット、Uビット、Vビット、Wビットで構成されている。また、98フレームが1セクタ(1ブロック)である。
1セクタに含まれる98のフレームから、それぞれのPビットを集めた98ビットをPチャネル、Qビットを集めた98ビットをQチャネルというように、8つのサブチャネルとして扱う。規格では、音楽CDやカラオケCD等で、いくつかのチャネルは既に使用されている(Pチャネル、Qチャネル等)。現在、Uチャネルは、空きチャネルであることを利用してUチャネルにパワー情報を埋め込むようにする。パワー情報は、前記のような計算方法に従って曲毎の平均パワー、最大パワーあるいは最小パワーのいずれかが書き込まれるようにするものである。
このようなCD−DAにおいては、上記パワー情報により音量調整が可能なCDプレーヤーで再生する際に出力音声の音量が自動調整される。特に、複数のCD−DAが搭載可能なCDチェンジャーを用いたカーオーディオ装置では、複数のCDを連続して再生する際に、CDが切り替わる毎での音量調整を不要にできる。また、本願発明に係る前記のような音声データ記録/再生システムにおいては、CD−DAに記録されたパワー情報をそのまま取り出して圧縮データに対応させてHD等の記録媒体に記録するようにできる。この場合、本願発明に係る前記のような音声データ記録/再生システムにおいては、パワー情報付きのPCMデータが入力された場合、エンコード処理部102等のパワー情報計算部103等では前記のような計算処理を行うことなく、上記入力されたPCMデータのUチャネルからパワー情報を取り出すだけでよい。
図16には、この発明に係る音声データ記録/再生システムの動作を説明するための波形図が示されている。同図において、2枚の音楽CDデータをエンコードしてハードディスク等に保存して再生した場合の実際の波形図が示されている。CD入力信号は、前記図17で説明したものと同様に、CD1がロック等の楽曲(音楽プログラム)(曲A)が記録され、CD2がジャズ等の楽曲(音楽プログラム)(曲B)が記録された場合の波形例である。この場合、CD1の曲Aのパワーは大きく、CD2の曲Bのパワーは小さい。このようにパワーに大きな差がある曲Bと曲Aのエンコード処理の過程でパワー情報の計算を行い、それのビットストリーム生成時に埋め込みを行い、ハードディスクとメモリカード等の記録媒体に記録する。この記録媒体から読み出しを行い、読み出された圧縮データをデコード処理で再生する場合に、上記パワー情報を読み出して曲B及び曲Aのそれぞれにおいて出力音量の自動調整が行われる。つまり、曲Bについては音量が大きくされ、曲Aは音量が小さくされる。この結果、曲Bから曲Aに切り替わるときにわざわざボリューム調整を行う手間が不要となる。
本願においては、前記実施例で説明したように音楽CDから読み出したオーディオデータをAAC,MP3形式等に圧縮(エンコード)する際に、音楽CDの録音レベルを示すデータ(パワー情報)を生成し、圧縮データの中にパワー情報を埋め込む。この圧縮データの中にパワー情報が埋め込まれている。圧縮し保存されたオーディオデータを伸張再生(デコード)する際には、圧縮データ内に埋め込まれた録音レベルのデータに基づき再生音量を自動調整する。パワー情報の計算方法と圧縮データへの埋め込み、再生音量の決定方法、デコード及び自動調整の仕組みについては、前記のようにいくつかの方法を提示するものである。これにより、圧縮(エンコード)時にパワー情報(録音レベル情報)を入れることで、再生(デコード)時に、再生音量の制御データとして取り出すことができる。MP3プレーヤや、ナビゲーションシステム等の製品で、圧縮データを再生する際、本発明のパワー情報(録音レベル情報)を読み出すことで主にCD毎での楽曲(音楽プログラム)による音量のバラツキを自動的に調整することができる。それにより、曲のジャンル等により自分でボリューム調整をする手間が省ける。
以上の実施例においては、楽曲(音楽プログラム)の連続再生時において楽曲(音楽プログラム)の切り替わり毎の音量調整を不要にできる。CD−DAにパワー情報を格納することにより、CDリッピングの際にかかるパワー情報を取り出して圧縮されたデータに付加するだけで編集された楽曲(音楽プログラム)の切り替わり毎の音量調整を不要にできる。記録媒体に算出したパワー情報を楽曲データ又は圧縮データと共に記録することで、編集された楽曲(音楽プログラム)の切り替わり毎の音量調整を不要にできる。ヘッドフォン使用時での聴覚の障害を防止し、あるいは快適で安全運転を実現したオーディオ装置が得られる。
以上本発明者によってなされた発明を、前記実施形態に基づき具体的に説明したが、本発明は、前記実施形態に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能である。例えば、パワー情報の計算方法は種々の実施形態をとることができる。パワー情報の計算手段は、それぞれの信号処理部を専用のハードウェアにより行うもの他、マイクロプロセッサ、あるいはそれと特定の演算を専用的に行うコプロサッサからなるマイクロコンピュータを用いて全部又は部分的にソフトウェアにより実現するものであってもよい。この発明は、オーディオ機能AAC/MP3等の搭載のナビゲーションシステム、AAC/MP3プレーヤ、サウンドエンコーダ、デコーダ搭載機器全般に広く利用することができる。また、音声データ記録媒体としては、CD−DA、CVD、CD−ROMやハードディスク、MDディスク、あるいはメモリチップやメモリカード等に適用することができる。
101…PCMデータ、102…エンコード処理部、103…計算部、104…処理部、105…圧縮データ、105a…記録媒体、106…デコード処理部、読み出し部107、108…出力部、109…PCMデータ、
201…16ビットPCM、202…フィルタバンク処理部、203…計算部、204…量子化処理部、205…ハフマン符号化処理部、206…ビットストリーム生成部、207…処理部、208…圧縮ビットストリーム、
301…コンパクトディスク、302…1フレーム、303…ヘッダ、304…同期語、305…ID情報、306…layer情報、307…CRC、308…protection-bit、309…サイド情報、310…メインデータ、311…main-data-begin情報、312,313…private-bits、314…scalefac-scale、315…scalefac-l、
401…パワー情報付圧縮データ、402…サーチ部、403…計算部、404…ハフマン復号部、405…逆量子化部、406…逆フィルタバンク部、407…PCMデータ、
901…パワー情報付き圧縮データ、902…デコード処理部、903…サーチ部、904,905…出力部、906…メモリ、907…D/A変換部、908…出力音声制御部、
1001…パワー情報付き圧縮データ、1002…サーチ部、1003…計算部、1004…調整部、1005…PCMデータ、
1101…16ビットPCM、1102…計算部、1103…フィルタバンク処理部、1104…量子化部、1105…ハフマン符号化処理部、1106…ビットストリーム生成部、1107…パワー情報付き圧縮ビットストリーム、
1201…16ビットPCM、1202…計算部、1203…フィルタバンク処理部、1204…量子化部、1205…ハフマン符号化処理部、1206…ビットストリーム生成部、1207…パワー情報付き圧縮ビットストリーム。
201…16ビットPCM、202…フィルタバンク処理部、203…計算部、204…量子化処理部、205…ハフマン符号化処理部、206…ビットストリーム生成部、207…処理部、208…圧縮ビットストリーム、
301…コンパクトディスク、302…1フレーム、303…ヘッダ、304…同期語、305…ID情報、306…layer情報、307…CRC、308…protection-bit、309…サイド情報、310…メインデータ、311…main-data-begin情報、312,313…private-bits、314…scalefac-scale、315…scalefac-l、
401…パワー情報付圧縮データ、402…サーチ部、403…計算部、404…ハフマン復号部、405…逆量子化部、406…逆フィルタバンク部、407…PCMデータ、
901…パワー情報付き圧縮データ、902…デコード処理部、903…サーチ部、904,905…出力部、906…メモリ、907…D/A変換部、908…出力音声制御部、
1001…パワー情報付き圧縮データ、1002…サーチ部、1003…計算部、1004…調整部、1005…PCMデータ、
1101…16ビットPCM、1102…計算部、1103…フィルタバンク処理部、1104…量子化部、1105…ハフマン符号化処理部、1106…ビットストリーム生成部、1107…パワー情報付き圧縮ビットストリーム、
1201…16ビットPCM、1202…計算部、1203…フィルタバンク処理部、1204…量子化部、1205…ハフマン符号化処理部、1206…ビットストリーム生成部、1207…パワー情報付き圧縮ビットストリーム。
Claims (14)
- 音声データと、
上記音声データの音圧パワーに相関したパワー情報とが記録されてなることを特徴とする音声データ記録媒体。 - 請求項1において、
上記音声データは、デジタル音声データがデータ圧縮されたものであり、
上記パワー情報は、上記デジタル音声データから計算された平均的な音圧パワーを予め決められた複数段階からなるパワーレベルに置き換えられたものであることを特徴とする音声データ記録媒体。 - 請求項1において、
上記音声データは、コンパクトディスクに記録されたデジタル音声データであり、
上記パワー情報は、上記コンパクトディスクに記録されるデジタル音声データから計算された平均的な音圧パワーを予め決められた複数段階からなるパワーレベルに置き換えられたものであり、上記コンパクトディスクの各楽曲(音楽プログラム)に対応して記録されたものであることを特徴とする音声データ記録媒体。 - 請求項3において、
上記パワーレベルは、楽曲(音楽プログラム)のうち想定された最も小さいレベルと最も大きなレベルとの間を聴感上直線的に変化するような複数段階に設定されたものであることを特徴とする音声データ記録媒体。 - 請求項2において、
記録媒体は、ヘッダ部、CRC部、サイド情報部及びメインデータ部を1フレームとする複数フレームを有し、
上記音声データは、上記1フレーム中のメインデータ部に記録され、
上記パワー情報は、上記1フレーム中のサイド情報に含まれるプライベートビット領域に記録されることを特徴とする音声データ記録媒体。 - 請求項1において、
上記音声データは、楽曲(音楽プログラム)に対応したものであり、
上記音圧パワーは、上記音声データの音量を平均化したものであることを特徴とする音声データ記録媒体。 - 請求項1において、
上記音声データ記録媒体は、ヘッダ部及びメインデータ部を1フレームとする複数フレームを有するものであり、
上記音圧パワーは、上記1フレームにおいて平均的な音圧パワーに相関したパワー情報が1フレーム毎に記録されてなることを特徴とする音声データ記録媒体。 - 請求項1において、
上記音圧パワーは、楽曲(音楽プログラム)一曲においての平均的な音圧パワーに相関したパワー情報であることを特徴とする音声データ記録媒体。 - エンコード部と、
記録部と、
デコード部と、
出力部とを含み、
上記エンコード部は、楽曲(音楽プログラム)に対応したデジタル音声データを受けて、その音声データの音圧パワーに相関したパワー情報を生成するパワー情報生成部を備え、上記デジタル音声データをデータ圧縮した圧縮データに上記生成されたパワー情報を関連付けて上記記録部に記録し、
上記デコード部は、上記記録部の読み出し信号を受けて、上記パワー情報を抽出するとともに圧縮された音声データをもとのデジタル音声データに復元し、
上記出力部は、上記復元されたデジタル音声データから生成されたアナログ音声データのレベルを上記パワー情報に基づいて調整して出力し、又は上記復元されたデジタル音声データと上記パワー情報とを出力してなることを特徴とする音声データ記録/再生システム。 - 請求項9において、
上記音声データは、コンパクトディスクに記録されたデジタル音声データであり、
上記パワー情報は、上記コンパクトディスクから読み出された音声データから計算された平均的な音圧パワーを予め決められた複数段階からなるパワーレベルに置き換えられたものであることを特徴とする音声データ記録/再生システム。 - 請求項10において、
上記パワーレベルは、楽曲(音楽プログラム) に対応したデジタル音声データのうち想定された最も小さいレベルと最も大きなレベルとの間を聴感上直線的に変化するような複数段階に設定されたものであることを特徴とする音声データ記録/再生システム。 - 請求項11において、
記録部は、ヘッダ部、CRC部、サイド情報部及びメインデータ部を1フレームとする複数フレームを有し、
上記音声データは、上記1フレーム中のメインデータ部に記録され、
上記パワー情報は、上記1フレーム中のサイド情報に含まれるプライベートビット領域に記録されることを特徴とする音声データ記録/再生システム。 - 請求項12において、
上記音声データ記録/再生システムは、自動車搭載用オーディオ装置に含まれるものであることを特徴とする音声データ記録/再生システム。 - 請求項12において、
上記音声データ記録/再生システムは、ヘッドフォンを音声出力手段とする携帯型オーディオ装置に含まれるものであることを特徴とする音声データ記録/再生システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003384556A JP2005149608A (ja) | 2003-11-14 | 2003-11-14 | 音声データ記録/再生システムとその音声データ記録媒体 |
US10/983,582 US20050147004A1 (en) | 2003-11-14 | 2004-11-09 | Audio data recording/reproduction system and audio data recording medium therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003384556A JP2005149608A (ja) | 2003-11-14 | 2003-11-14 | 音声データ記録/再生システムとその音声データ記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005149608A true JP2005149608A (ja) | 2005-06-09 |
Family
ID=34692905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003384556A Pending JP2005149608A (ja) | 2003-11-14 | 2003-11-14 | 音声データ記録/再生システムとその音声データ記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20050147004A1 (ja) |
JP (1) | JP2005149608A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007013482A1 (ja) * | 2005-07-27 | 2007-02-01 | Matsushita Electric Industrial Co., Ltd. | ガイダンス報知装置、ガイダンス報知用集積回路、ガイダンス報知方法、及びガイダンス報知用プログラム |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4695006B2 (ja) * | 2006-04-04 | 2011-06-08 | Okiセミコンダクタ株式会社 | 復号処理装置 |
KR101461685B1 (ko) * | 2008-03-31 | 2014-11-19 | 한국전자통신연구원 | 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치 |
TWI384459B (zh) * | 2009-07-22 | 2013-02-01 | Mstar Semiconductor Inc | 音框檔頭之自動偵測方法 |
US8838259B2 (en) * | 2009-11-18 | 2014-09-16 | Blackberry Limited | Frequency-specific determination of audio dose |
US8660677B2 (en) * | 2009-11-18 | 2014-02-25 | Blackberry Limited | Sound pressure level-aware music playlists |
US9509267B2 (en) * | 2011-11-08 | 2016-11-29 | Nokia Technologies Oy | Method and an apparatus for automatic volume leveling of audio signals |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5444686A (en) * | 1993-09-28 | 1995-08-22 | Dunlavy; John H. | Method and apparatus for correcting distortion in compact disc recording and playback system |
CN1716417A (zh) * | 2002-03-29 | 2006-01-04 | 索尼株式会社 | 光盘识别装置和方法、光盘记录装置和光盘再现装置 |
US7990822B2 (en) * | 2002-08-21 | 2011-08-02 | Yamaha Corporation | Sound recording/reproducing method and apparatus |
-
2003
- 2003-11-14 JP JP2003384556A patent/JP2005149608A/ja active Pending
-
2004
- 2004-11-09 US US10/983,582 patent/US20050147004A1/en not_active Abandoned
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007013482A1 (ja) * | 2005-07-27 | 2007-02-01 | Matsushita Electric Industrial Co., Ltd. | ガイダンス報知装置、ガイダンス報知用集積回路、ガイダンス報知方法、及びガイダンス報知用プログラム |
JP2007034658A (ja) * | 2005-07-27 | 2007-02-08 | Matsushita Electric Ind Co Ltd | ガイダンス報知装置、ガイダンス報知用集積回路、ガイダンス報知方法、及びガイダンス報知用プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20050147004A1 (en) | 2005-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4731774B2 (ja) | 高品質オーディオ用縮尺自在符号化方法 | |
JP2005202248A (ja) | オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路 | |
US6385571B1 (en) | High quality audio encoding/decoding apparatus and digital versatile disc | |
US7714223B2 (en) | Reproduction device, reproduction method and computer usable medium having computer readable reproduction program emodied therein | |
JP5331290B2 (ja) | 多チャンネル信号符号化/復号化方法及びその装置 | |
JP2004199075A (ja) | ビット率調節可能なステレオオーディオ符号化・復号化方法及びその装置 | |
JP3937788B2 (ja) | データ記録方法及び装置、データ再生方法及び装置、データ編集方法及び装置 | |
JP2002535893A (ja) | 符号化された信号への補足データの組み込み | |
KR20030011910A (ko) | 데이터 기록 매체, 데이터 기록 방법 및 장치, 및 데이터전송 방법 및 장치 | |
JP2005149608A (ja) | 音声データ記録/再生システムとその音声データ記録媒体 | |
JP3304750B2 (ja) | ロスレス符号装置とロスレス記録媒体とロスレス復号装置とロスレス符号復号装置 | |
WO2009090705A1 (ja) | 記録再生装置 | |
JP3304739B2 (ja) | ロスレス符号装置とロスレス記録媒体とロスレス復号装置とロスレス符号復号装置 | |
JP2002109824A (ja) | ディジタル音声信号の記録方法、およびその装置 | |
JP2006350132A (ja) | オーディオ再生装置、オーディオ再生方法及びオーディオ再生プログラム | |
JPH09120645A (ja) | オーディオ信号圧縮記録装置及びオーディオ信号圧縮装置並びに光記録媒体 | |
JPH09120647A (ja) | オーディオ信号圧縮記録装置及びオーディオ信号圧縮装置並びに光記録媒体 | |
JP2000347697A (ja) | 音声記録再生装置および記録媒体 | |
JP3490655B2 (ja) | オーディオ信号復号器 | |
JP3829944B2 (ja) | 再生装置 | |
JPH10285046A (ja) | 情報信号処理装置、情報信号記録装置及び情報信号再生装置 | |
KR0176640B1 (ko) | 오디오신호 부호화회로 | |
JPH1083198A (ja) | ディジタル信号処理方法及び装置 | |
JP4363924B2 (ja) | オーディオ装置 | |
JPH09120646A (ja) | オーディオ信号圧縮記録装置及びオーディオ信号圧縮装置並びに光記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081022 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090304 |