JP2005149608A

JP2005149608A - 音声データ記録／再生システムとその音声データ記録媒体

Info

Publication number: JP2005149608A
Application number: JP2003384556A
Authority: JP
Inventors: Michi Kumagai; みち熊谷; Akira Naito; 彰内藤
Original assignee: Renesas Technology Corp
Current assignee: Renesas Technology Corp
Priority date: 2003-11-14
Filing date: 2003-11-14
Publication date: 2005-06-09
Also published as: US20050147004A1

Abstract

【課題】簡単な構成で使い勝手がよく安全な音声データ記録／再生システムとその音声データ記録媒体を提供する。
【解決手段】楽曲(音楽プログラム)に対応した音声データの平均的な音圧パワーに相関したパワー情報を上記楽曲(音楽プログラム)に付属させて記録して音楽データ記録媒体を構成する。あるいは、エンコード部において、楽曲(音楽プログラム)に対応したデジタル音声データを受けて、その平均的な音圧パワーに相関したパワー情報を生成するパワー情報生成部を備え、上記デジタル音声データをデータ圧縮したデータに上記パワー情報を関連付けて記録部に記録し、デコード部により上記パワー情報を抽出するとともに圧縮された音声データをもとのデジタル音声データに復元し、上記パワー情報に基づいて調整して出力し、又は上記復元されたデジタル音声データと上記パワー情報とを出力する。【選択図】図１

Description

この発明は、音声データ記録／再生システムとその音声データ記録媒体に関し、例えば複数の音楽ＣＤ（Ｃompact Ｄisc Ｄigital Ａudio（ＣＤ−ＤＡ））に記録されたデジタル音楽データを編集する音声データ記録／再生システムとその音声データ記録媒体に利用して有効な技術に関するものである。

音楽ＣＤからオーディオデジタルデータを読み出し（ＣＤリッピング）、ＡＡＣ，ＭＰ３などに圧縮（エンコード）した上、ハードディスク等の記録媒体に保存する記録／再生システムが各種提案されている。従来の提案されているシステムでは、音楽ＣＤの録音レベルは保たれた状態で保存される。ミドルウェア単品（デコーダ、エンコーダ）の技術に関しては、例えば、ＭＰＥＧ１Ａudio Ｌayer3 （規格書:ISO/IEC11172-3)，ＭＰＥＧ２Ａudio Ｌayer3 （規格書:ISO/IEC 13818-3），ＭＰＥＧ２Ａdvance Ａudio Ｃoding （規格書:ISO/IEC13818-7)，ＭＰＥＧ４Ａdvance Ａudio Ｃoding （規格書:ISO/IEC14496-3)がある。
ＭＰＥＧ１Ａudio Ｌayer3 （規格書:ISO/IEC11172-3) ＭＰＥＧ２Ａudio Ｌayer3 （規格書:ISO/IEC 13818-3）ＭＰＥＧ２Ａdvance Ａudio Ｃoding （規格書:ISO/IEC13818-7) ＭＰＥＧ４Ａdvance Ａudio Ｃoding （規格書:ISO/IEC14496-3)

本願発明者等においては、オーディオデータを保存するハードディスク等の記憶容量は増加する動向にあり、何枚もの音楽ＣＤから好みの楽曲(音楽プログラム)を選んでオーディオデータを保存する使い方に向けた音声データ記録／再生システムを検討した。音楽ＣＤの録音レベルは音楽ＣＤや同じ音楽ＣＤでも楽曲(音楽プログラム)毎に異なる為、何枚もの音楽ＣＤから抽出された複数の楽曲(音楽プログラム)を１つのハードディスク等の記憶媒体に保存し、それらを連続して再生した場合、楽曲(音楽プログラム)毎の再生音量にバラツキが生じてしまう。つまり、実際の聴取場面において、聴取者は楽曲(音楽プログラム)が切り替わる毎に手動にて最適な音量の調整する必要が生じる。この再生音量にバラツキは、特に、ヘッドフォンなど密閉度の高い機器を使用中では、再生音量が急激に上がるような楽曲(音楽プログラム)の組み合わせがあると不快感が生じることの他に人の聴覚にも障害を与えたり、運転中でのカーオーディオでは再生音量が急激に上がることにより、注意力が音量調整に向けられて咄嗟の運転操作に支障きたしたりしてしまう等の危険性もある。

図１７には、２枚の音楽ＣＤデータをエンコードしてＨＤ（ハードディスク）に保存することを想定した場合の実際の波形図が示されている。同図においては、ＣＤ１がロック等の楽曲(音楽プログラム)が記録され、ＣＤ２がジャズ等の楽曲(音楽プログラム)が記録された場合の波形例である。この場合、ＣＤ１の曲Ａのパワーは大きく、ＣＤ２の曲Ｂのパワーは小さい。このようにパワーに大きな差がある曲Ｂと曲ＡをエンコードしてハードディスクＨＤにデータを保存し、その圧縮データを再生する場合には、曲Ｂに対応して音量を設定していると、曲Ｂから曲Ａに切り替わるとそのままでは音量が非常に大きくなりユーザが手動でボリューム調整を行うことが必要となり、前記のような問題を生じる。

この発明の目的は、簡単な構成で使い勝手がよく安全な音声データ記録／再生システムとその音声データ記録媒体を提供することにある。この発明の前記ならびにそのほかの目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。

本願において開示される発明のうち代表的なものの概要を簡単に説明すれば、下記の通りである。すなわち、楽曲(音楽プログラム)に対応した音声データと、上記音声データの平均的な音圧パワーに相関したパワー情報を上記楽曲(音楽プログラム)に付属させて記録して音楽データ記録媒体を構成する。

本願において開示される発明のうち他の代表的なものの概要を簡単に説明すれば、下記の通りである。すなわち、エンコード部において、楽曲(音楽プログラム)に対応したデジタル音声データを受けて、その音声データの平均的な音圧パワーに相関したパワー情報を生成するパワー情報生成部を備え、上記デジタル音声データをデータ圧縮した圧縮データに上記生成されたパワー情報を関連付けて記録部に記録し、デコード部により上記記録部の読み出し信号から上記パワー情報を抽出するとともに圧縮された音声データをもとのデジタル音声データに復元し、出力部により上記復元されたデジタル音声データから生成されたアナログ音声データのレベルを上記パワー情報に基づいて調整して出力し、又は上記復元されたデジタル音声データと上記パワー情報とを出力する。

音圧パワーの異なる音データを再生する際に、該音データの切り替わり毎の音量調整を不要にできる音データを再生又は、生成又は、保持する事ができる。

図１には、この発明に係る音声データ（音データ）の記録／再生システムの一実施例のブロック図が示されている。同図は、音声データの記録／再生の信号処理に沿った信号処理フローの形態で音声データ記録／再生システムを表している。入力音声データは、特に制限されないが、音楽ＣＤ等の音楽データ（：ＰＣＭデータ）１０１とされる。この実施例のシステムでは、エンコード処理部１０２に音の大きさを表すパワー情報（音圧パワー）の計算部１０３と、ここで生成されたパワー情報をエンコード処理部１０２で形成された圧縮データに埋め込む処理部１０４とを有す。

上記ＰＣＭデータ１０１を入力した後、本実施例のシステムでは、上記のようにパワー情報計算部１０３と、パワー情報を圧縮データに埋め込む処理部１０４とをエンコード処理部１０２に付加し、パワー情報が付加された圧縮データ１０５を生成する。このようなパワー情報が付加された圧縮データ１０５は、例えばＭＰ３やＡＡＣ等の圧縮データに対してパワー情報が付加されたものであり、ＨＤ（ハードディスク）や光ディスク等の記録媒体１０５ａに記録される。

デコード処理部１０６は、上記記録媒体１０５ａ中に記録されたパワー情報付圧縮データ１０５を受けて、圧縮データに付加されたパワー情報を読み出し部１０７によりパワー情報を取り出す。出力部１０８では、パワー情報に合わせてＰＣＭデータのパワーを調整する。つまり、この実施例のシステムのデコード処理１０６では前記パワー情報付加圧縮データ１０５を読み出し、パワー情報読み出し部１０７により圧縮データの中からパワー情報を取り出す。また、圧縮データをもとのＰＣＭデータに復元する。

出力部１０８においては、パワー情報読み出し部１０７で取得したパワー情報に合わせ、ＰＣＭデータの音量を自動調整する。ＰＣＭデータの調整は、デコード処理部１０６の内でも実行するようにしてもよいし、デコード処理外（アプリケーション等の外部処理部）でも実行することも可能である。以上の信号処理により、ＰＣＭデータ１０９は音量（パワー）を調整されたものとされる。

図２には、この発明に係る音声データ記録／再生システムに用いられるエンコード処理部の一実施例のブロック図が示されている。同図においても、信号処理に沿った信号処理フローの形態でエンコード処理部を表している。つまり、図２は、図１のエンコード部１０２の具体的構成例が示されている。この実施例のエンコード処理部では、入力音声データとして１６ビットＰＣＭ２０１が入力される。この入力信号は、フィルタバンク処理部２０２でスペクトルに変換される。本エンコード処理はＭＰ３やＡＡＣのような従来のエンコード処理と同様である。この実施例では、スペクトルとなったデータをもとに、計算部２０３によりスペクトル平均パワー値を計算する。スペクトルとなったデータを基にスペクトル平均パワー値を計算する事により計算量を減らし、平均パワー値を計算する事による消費電力や処理時間を殆ど増やすことなく行う事ができる。このスペクトル平均パワー値を計算する処理は、この発明に係る音声データ記録／再生システムにおける特徴の一つとなる。パワー値の実際の計算方法は、図５，図６を用いて後述する。

パワー値の計算とは別に、上記エンコード処理の一部である量子化処理部２０４により量子化処理を実施し、ハフマン符号化処理部２０５でハフマン符号化処理を実施する。これらの量子化処理とハフマン符号化処理も従来のエンコード処理と同様である。次にビットストリームを生成部２０６において、ビットストリーム（圧縮データ）生成の中に、上記計算部２０３で計算したスペクトル平均パワー値を挿入する処理部２０７が設けられる。このスペクトル平均パワー値をビットストリームに挿入する方法は図７を用いて後述する。ビットストリームの生成そのものは従来のエンコード処理と同様であるが、圧縮データに平均パワー値を書き込む処理部２０７が設けられるところが本発明の特徴の一つとなる。以上より、パワー情報が付加された圧縮ビットストリーム２０８が生成される。

図３には、パワー情報付きストリームデータ形式の一実施例の構成図が示されている。この実施例は本発明のパワー情報を付加したＭＰ３圧縮データが、コンパクトディスク（ＣＤ）３０１に記録されている場合の例である。これは、図１の記録媒体１０５ａに相当する。同図に示したストリームのデータ形式は、コンパクトディスク３０１の一部ということになる。ＭＰ３のデータ形式は、１フレーム３０２は、１１５２サンプル毎のフレーム構成をとっている。また１フレーム３０２は、５７６サンプル（１グラニュールとよばれる）の２グラニュール構成となっている。１フレーム３０２は、ヘッダ３０３、ＣＲＣ３０７、サイド情報３０９、メインデータ３１０からなる。

ＭＰ３の基本構成は、図４に示したように各フレームのはじめに、フレームの始まりである事を示す１２ビットの同期語（Syncword）３０４やＩＤ情報３０５、layer情報３０６、ビットレート情報等を含む全３２ビットからなるヘッダ部分３０３がある。次に、存在する場合としない場合がある１６ビットのエラーチェック情報（ＣＲＣ）３０７がある。ＣＲＣ３０７のある／なしは、ヘッダのprotection-bit３０８の０と１の値で判別する。次にサイド情報（３０９）等が続く。サイド情報（３０９）は、メインデータ３１１の開始を示す９ビットのmain-data-begin情報３１１、私用目的のビットであるprivate-bits３１２，３１３等が続く。Private-bits３１２，３１３は、ステレオ時３ビット３１３であり、モノラル時５ビット３１２と規定されている。

この実施例では、このサイド情報３０９の中のprivate-bits３１２，３１３に平均パワー値を書き込むビットとして使用する。平均パワーを書き込むビットは、圧縮データの中であればprivate-bitsでなくてもかまわない。次に、実際のオーディオ圧縮データであるメインデータ３１０が続く。メインデータの中には、scalefac-scale３１４、scalefac-l３１５等、様々なデータがビットで構成されている。１フレームが完了すると、次に２フレームのヘッダ３１６が続く。

図５には、この発明に係る音声データ記録／再生システムに用いられるデコード処理部の一実施例のブロック図が示されている。同図においても、信号処理に沿った信号処理フローの形態でデコード処理部を表している。このデコード処理部は、図１のデコード処理部１０６に対応している。この発明の特徴であるパワー情報付き圧縮データ４０１が前記記憶媒体から読み出されて入力される。デコーダは、サーチ部４０２により入力圧縮データ４０１の各フレームのサイド情報から前記パワー情報をサーチして読み出す。計算部４０３によりサーチしたパワー情報を平均化して１曲のパワー平均を計算する。デコート部では、ハフマン復号部４０４により圧縮データ４０１からハフマン復号を行い、逆量子化部４０５により逆量子化を行い、逆フィルタバンク部４０６により逆フィルタバンクを行ってＰＣＭデータ４０７を得る。上記ハフマン復号部４０４から逆フィルタバンク部４０６は従来のデコード処理と同様である。

図６には、本発明に係るスペクトル平均（パワー計算）の一実施例のフローチャート図が示されている。このスペクトル平均（パワー計算）は、図１のパワー情報計算部１０３での計算処理の例である。この実施例は、ＭＰＥＧ１Ａudio Ｌayer３（ＭＰ３）の例である。ＭＰ３では一般的に１グラニュール（５７６サンプル）単位で処理を行う。入力データ（１６ビットＰＣＭ（５０１））を入力して、フィルタバンク処理５０２を行い、入力信号をスペクトルに変換する。ここで、５７６個の要素から構成されるスペクトル情報配列をSPEC[576]とする。計算処理５０４において、次式（１）のように１グラニュール毎にスペクトル絶対値平均Ａgr計算する。
（式１）

計算処理５０５において、１フレーム分のAgrデータを計算し、１フレーム分のグラニュール平均を１フレーム平均パワー(Aframe)として次式（２）により計算する。
（式２）

図７には、本発明に係るスペクトル平均（パワー計算）の他の一実施例のフローチャート図が示されている。このスペクトル平均（パワー計算）は、図１のパワー情報計算部１０３での計算処理の例である。この実施例は、ＭＰＥＧ１ＡudioＬayer３（ＭＰ３）の例である。前記図６の実施例では、１フレームの平均パワーをパワー情報として取得、フレーム毎に圧縮データに書き込むことに対し、本実施例は、パワー平均を１曲全体で取得し、１曲につき、１パワー情報を取得、書き込みする例である。入力データ（１６ビットＰＣＭ（６０１））を入力して、フィルタバンク処理６０２を行い、入力信号をスペクトルに変換する。ここで、５７６個の要素から構成されるスペクトル情報配列をSPEC[576]とする。計算処理６０４において、次式（３）のように１グラニュール毎にスペクトル絶対値平均Ａgr計算する。
（式３）

計算処理６０５において、１フレーム分のAgrデータを計算し、そのデータから１曲分のスペクトル平均を１曲平均パワーとして取得する。グラニュール平均を１曲平均パワー(Amusic)として次式（４）により計算する。
（式４）

この実施例では、図６の実施例が各フレームにパワー情報が付加されている例に対し、曲の開始フレームのサイド情報又は、最終フレームのサイド情報に書き込むようにするか、あるいは途中からの再生を行う場合も考慮して、全てのフレームのサイド情報に同じパワー情報を書き込むようにするものであってもよい。このようなデータ形式の場合、開始フレーム又は最終フレーム或いは途中のいずれか１つのフレームのパワー情報だけを読み込めば、その曲全体のパワー平均が取得できる。その為、図６のデータ形式のようにデコーダ１曲分のフレームを全てサーチしてパワー平均を計算する必要がなくなる。この実施例のように１曲分の平均パワー情報を計算するものにおいては、パワー情報をヘッダ部に書き込むことを想定した場合、ＭＰＥＧＡdvance Ａudio Ｃoding のＡＤＩＦ形式のように、ヘッダ部が曲の始めに１つしか存在しないデータ形式にも応用できる。

図８には、この発明に係るパワー情報を圧縮データに書き込む方法の一実施例の説明図が示されている。これは、図１の処理部１０４での書き込み方法に対応している。前記図６で計算した１フレーム平均パワー(Aframe) (式（２））で得たデータから、分類処理７０２によりパワー情報として７段階のパワーレベルの何処に属するかの分類を行う。このような分類により得たパワーレベル情報は、対応フレーム７０７のサイド情報７０６の一部分であるprivate-bits７０５に書き込まれる。本実施例では、private-bitsの３ビットを使用する例が示されている。

パワーレベル情報の一例７０４は、以下のようにされる。

０００：パワー情報オフ（無し）
００１：パワーレベル１
０１０：パワーレベル２
０１１：パワーレベル３
１００：パワーレベル４
１０１：パワーレベル５
１１０：パワーレベル６
１１１：パワーレベル７
上記パワーレベルは、ＣＤのうちの最もパワーレベルが小さいのグループをレベル１とし、パワーレベルが最も大きいグループをレベル７として７段階に分類するものである。この分類のために、すべての音楽ジャンルを含む複数のＣＤの楽曲(音楽プログラム)毎の平均パワーを求めて統計的に７グループに分けるようにするものである。ここでは、聴感上の平均パワーとして７段階とすることが必要である。これにより、上記レベル１からレベル７までのパワーレベルが聴感上直線的に並べられることとなる。上記パワー情報を記録するための記録部のビット数がより多く使用できるものでは、パワー情報のレベルは上記７段階以上に設定することも可能となる。また、パワーレベル情報を書き込む場所は、レベル情報が前記private-bitsでなくてもよい。

図９には、この発明に係る圧縮データをデコードする際のパワーレベルの読み出し方法の一実施例の説明図が示されている。これは、前記図５の計算処理４０３に対応している。同図では、ＭＰ３の圧縮データを対象とし、フレーム毎のサイド情報のprivate-bitsに各フレームのパワーレベルが入っている例が示されている。パワー情報付き圧縮データ８０１を取り込んだデコーダ部８０２は、各フレームのprivate-bitsに埋め込まれたパワーレベルを１曲分全てサーチ処理８０３をして、１曲のパワー平均を次の式（５）に従って計算する。
（式５）

図１０のフレームビット構成図に示したように、Private-bits８０５は、８０７で示したようにＣＲＣ有りの場合、フレームの開始から５８ビット目を始まりとし、ＣＲＣ無しの場合、フレームの開始から４２ビット目を始まりとする。そのため、フレームの開始から対応ビット数目をカウントし、そこから３ビットを読み出せばよいこととなる。特に制限はないが、音楽データをデコードする前に、ヘッダのパワー情報のみをサーチして、パワー平均を計算することが可能である。

図１１には、この発明に係る音声データ記録／再生システムのデコード処理部の一実施例のブロック図が示されている。同図においても、信号処理に沿った信号処理フローの形態でデコード処理部を表している。この実施例では、デコード処理部内でパワー情報を読み取り、デコード処理部外でパワーを調整するシステムに向けられている。パワー情報付き圧縮データ９０１はデコード処理部９０２に入力される。サーチ部９０３、計算部９０４及び出力部９０５及びメモリ９０６によりパワー情報を取得して記憶し、ハフマン復号、逆量子化及び逆フィルタバンクによりＰＣＭデータを生成する一連の動作は、前記図５と同様である。ただし、前記図５の実施例と異なる点は、１曲のパワー平均を計算部９０４で算出した後、出力部９０５を介してパワー平均を出力データを一旦何らかのメモリ９０６に保持させる。

一方、デコード結果で得たＰＣＭデータは、Ｄ／Ａ（デジタル／アナログ）変換部９０７でアナログ信号に変換され、スピーカやヘッドフォン等で外部に出力する際に、メモリ９０６に保持されたパワー平均情報を使用して、出力音量制御部９０８により出力するボリューム（音量）を自動調整する。それにより、曲毎のボリュームが平均的に保たれ、曲により急激にボリュームが大きくなる（又は小さくなる）等の問題が無くなる。つまり、前記７段階のレベル情報が記録されていた場合、中間のレベル４を中心にして、それよりも小さいレベル３、２、１は、レベル４を目標としてレベル増大させられ、それよりも大きなレベル５、６、７は、レベル４を目標としてレベルが減衰させられる。レベル４とされた曲は、そのままのレベルで出力される。

図１２には、この発明に係る音声データ記録／再生システムのデコード処理部の他の一実施例のブロック図が示されている。同図においても、信号処理に沿った信号処理フローの形態でデコード処理部を表している。前記図１と図１１の実施例が、デコード処理部内で各楽曲(音楽プログラム)のパワーレベルを取得し、かかるパワーレベルを用いてデコード処理部の外部でボリューム調整（音量調整）を行うのに対し、図１２の実施例は、デコード処理部の内部でボリューム（ここではＰＣＭデータ）のパワー調整を行うものである。この場合、ＭＰ３プレーヤ等、外部のアプリケーションでボリューム調整を行う必要がなくなる。

パワー情報付き圧縮データ１００１をデコーダ処理部に入力されると、ハフマン復号、逆量子化、逆フィルタバンクを行い、ＰＣＭデータを生成するまでは前記図５の実施例と同様である。サーチ部１００２によりパワー情報を取り出し、計算部１００３で１曲のパワー平均を計算する。前記のＰＣＭデータを生成後、計算部１００３からの１曲のパワー平均の情報を受けて、デコード処理部内でＰＣＭデータの大きさを、調整部１００４により前記のようにパワー平均に合わせ調整する。それにより、パワー調整済みのＰＣＭデータ１００５を生成するものである。

図１３には、この発明に係る音声データ記録／再生システムのエンコード処理部の他の一実施例のブロック図が示されている。前記図２に示した実施例では、フィルタバンク処理後、ＰＣＭデータをスペクトルデータに変換した後にパワー情報の取得を行うものである。これに対して、図１３の実施例では、エンコード処理部にＰＣＭデータ１１０１が入力されると、フィルタバンク処理部１１０３でのフィルタバンド処理の前に、計算部１１０２により当該ＰＣＭデータのパワー平均を取得する。ＰＣＭデータ１１０１が入力されると、上記計算部１１０２によりフレーム毎のＰＣＭパワー平均値が計算される。

その後、フィルタバンク部１１０３、量子化処理部１１０４、ハフマン符号化処理部１１０５でエンコード処理が行われてデータ圧縮が行われてビットストリーム生成部１１０６により平均パワー（本実施例ではＰＣＭデータのフレーム平均パワー）が所定ビットに書き込まれる。結果、パワー情報付き圧縮ビットストリーム１１０７を出力できる。つまり、図示しない記録媒体に記憶される。

図１４には、この発明に係る音声データ記録／再生システムのエンコード処理部の更に他の一実施例のブロック図が示されている。この実施例は、計算部１２０２により入力ＰＣＭ１２０１のパワー最大値を計算し、最大値をパワー情報として取得する。このパワー情報を用いて出力音量調整（ボリューム調整）に利用する。ここで、パワー情報は最小値でもかまわないし、ＰＣＭのパワーでも、フィルタバンク後のスペクトルのパワーでもかまわない。パワー情報を取得後、ビットストリーム生成部１２０６において情報をビットに書き込まれる。

図１５には、この発明に係る音声データ記録媒体の一実施例の構成図が示されている。この実施例は、Ｃompact Ｄisc Ｄigital Ａudio（ＣＤ−ＤＡ）に本願発明を適用した例が示されている。音楽ＣＤ規格のフォーマットは１フレーム２４バイト（＝１９２ビット）データのほか、誤り訂正用の情報等を含む５８８ビットから成る。この５８８ビットの中には、８ビットのサブコードが含まれている。サブコードは、Ｐビット、Ｑビット、Ｒビット、Ｓビット、Ｔビット、Ｕビット、Ｖビット、Ｗビットで構成されている。また、９８フレームが１セクタ（１ブロック）である。

１セクタに含まれる９８のフレームから、それぞれのＰビットを集めた９８ビットをＰチャネル、Ｑビットを集めた９８ビットをＱチャネルというように、８つのサブチャネルとして扱う。規格では、音楽ＣＤやカラオケＣＤ等で、いくつかのチャネルは既に使用されている(Ｐチャネル、Ｑチャネル等)。現在、Ｕチャネルは、空きチャネルであることを利用してＵチャネルにパワー情報を埋め込むようにする。パワー情報は、前記のような計算方法に従って曲毎の平均パワー、最大パワーあるいは最小パワーのいずれかが書き込まれるようにするものである。

このようなＣＤ−ＤＡにおいては、上記パワー情報により音量調整が可能なＣＤプレーヤーで再生する際に出力音声の音量が自動調整される。特に、複数のＣＤ−ＤＡが搭載可能なＣＤチェンジャーを用いたカーオーディオ装置では、複数のＣＤを連続して再生する際に、ＣＤが切り替わる毎での音量調整を不要にできる。また、本願発明に係る前記のような音声データ記録／再生システムにおいては、ＣＤ−ＤＡに記録されたパワー情報をそのまま取り出して圧縮データに対応させてＨＤ等の記録媒体に記録するようにできる。この場合、本願発明に係る前記のような音声データ記録／再生システムにおいては、パワー情報付きのＰＣＭデータが入力された場合、エンコード処理部１０２等のパワー情報計算部１０３等では前記のような計算処理を行うことなく、上記入力されたＰＣＭデータのＵチャネルからパワー情報を取り出すだけでよい。

図１６には、この発明に係る音声データ記録／再生システムの動作を説明するための波形図が示されている。同図において、２枚の音楽ＣＤデータをエンコードしてハードディスク等に保存して再生した場合の実際の波形図が示されている。ＣＤ入力信号は、前記図１７で説明したものと同様に、ＣＤ１がロック等の楽曲(音楽プログラム)（曲Ａ）が記録され、ＣＤ２がジャズ等の楽曲(音楽プログラム)（曲Ｂ）が記録された場合の波形例である。この場合、ＣＤ１の曲Ａのパワーは大きく、ＣＤ２の曲Ｂのパワーは小さい。このようにパワーに大きな差がある曲Ｂと曲Ａのエンコード処理の過程でパワー情報の計算を行い、それのビットストリーム生成時に埋め込みを行い、ハードディスクとメモリカード等の記録媒体に記録する。この記録媒体から読み出しを行い、読み出された圧縮データをデコード処理で再生する場合に、上記パワー情報を読み出して曲Ｂ及び曲Ａのそれぞれにおいて出力音量の自動調整が行われる。つまり、曲Ｂについては音量が大きくされ、曲Ａは音量が小さくされる。この結果、曲Ｂから曲Ａに切り替わるときにわざわざボリューム調整を行う手間が不要となる。

本願においては、前記実施例で説明したように音楽ＣＤから読み出したオーディオデータをＡＡＣ，ＭＰ３形式等に圧縮（エンコード）する際に、音楽ＣＤの録音レベルを示すデータ（パワー情報）を生成し、圧縮データの中にパワー情報を埋め込む。この圧縮データの中にパワー情報が埋め込まれている。圧縮し保存されたオーディオデータを伸張再生（デコード）する際には、圧縮データ内に埋め込まれた録音レベルのデータに基づき再生音量を自動調整する。パワー情報の計算方法と圧縮データへの埋め込み、再生音量の決定方法、デコード及び自動調整の仕組みについては、前記のようにいくつかの方法を提示するものである。これにより、圧縮（エンコード）時にパワー情報（録音レベル情報）を入れることで、再生（デコード）時に、再生音量の制御データとして取り出すことができる。ＭＰ３プレーヤや、ナビゲーションシステム等の製品で、圧縮データを再生する際、本発明のパワー情報（録音レベル情報）を読み出すことで主にＣＤ毎での楽曲(音楽プログラム)による音量のバラツキを自動的に調整することができる。それにより、曲のジャンル等により自分でボリューム調整をする手間が省ける。

以上の実施例においては、楽曲(音楽プログラム)の連続再生時において楽曲(音楽プログラム)の切り替わり毎の音量調整を不要にできる。ＣＤ−ＤＡにパワー情報を格納することにより、ＣＤリッピングの際にかかるパワー情報を取り出して圧縮されたデータに付加するだけで編集された楽曲(音楽プログラム)の切り替わり毎の音量調整を不要にできる。記録媒体に算出したパワー情報を楽曲データ又は圧縮データと共に記録することで、編集された楽曲(音楽プログラム)の切り替わり毎の音量調整を不要にできる。ヘッドフォン使用時での聴覚の障害を防止し、あるいは快適で安全運転を実現したオーディオ装置が得られる。

以上本発明者によってなされた発明を、前記実施形態に基づき具体的に説明したが、本発明は、前記実施形態に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能である。例えば、パワー情報の計算方法は種々の実施形態をとることができる。パワー情報の計算手段は、それぞれの信号処理部を専用のハードウェアにより行うもの他、マイクロプロセッサ、あるいはそれと特定の演算を専用的に行うコプロサッサからなるマイクロコンピュータを用いて全部又は部分的にソフトウェアにより実現するものであってもよい。この発明は、オーディオ機能ＡＡＣ／ＭＰ３等の搭載のナビゲーションシステム、ＡＡＣ／ＭＰ３プレーヤ、サウンドエンコーダ、デコーダ搭載機器全般に広く利用することができる。また、音声データ記録媒体としては、ＣＤ−ＤＡ、ＣＶＤ、ＣＤ−ＲＯＭやハードディスク、ＭＤディスク、あるいはメモリチップやメモリカード等に適用することができる。

この発明に係る音声データ記録／再生システムの一実施例を示すブロック図である。この発明に係る音声データ記録／再生システムに用いられるエンコード処理部の一実施例を示すブロック図である。この発明に係るパワー情報付きストリームデータ形式の一実施例を示す構成図である。この発明が適用されるＭＰ３のビット基本構成である。この発明に係る音声データ記録／再生システムに用いられるデコード処理部の一実施例を示すブロック図である。この発明に係るスペクトル平均の一実施例を示すフローチャート図である。この発明に係るスペクトル平均の他の一実施例を示すフローチャート図である。この発明に係るパワー情報を圧縮データに書き込む方法の一例を示す説明図である。この発明に係る圧縮データをデコードする際のパワーレベルの読み出し方法の一例を示す説明図である。この発明が適用される圧縮データのフレームビット構成図である。この発明に係る音声データ記録／再生システムのデコード処理部の一実施例を示すブロック図である。この発明に係る音声データ記録／再生システムのデコード処理部の他の一実施例を示すブロック図である。この発明に係る音声データ記録／再生システムのエンコード処理部の他の一実施例を示すブロック図である。この発明に係る音声データ記録／再生システムのエンコード処理部の更に他の一実施例を示すブロック図である。この発明に係る音声データ記録媒体の一実施例を示す構成図である。この発明に係る音声データ記録／再生システムの動作を説明するための波形図である。２枚の音楽ＣＤデータをエンコードしてハードディスクに保存することを想定した場合の実際の波形図である。

符号の説明

１０１…ＰＣＭデータ、１０２…エンコード処理部、１０３…計算部、１０４…処理部、１０５…圧縮データ、１０５ａ…記録媒体、１０６…デコード処理部、読み出し部１０７、１０８…出力部、１０９…ＰＣＭデータ、
２０１…１６ビットＰＣＭ、２０２…フィルタバンク処理部、２０３…計算部、２０４…量子化処理部、２０５…ハフマン符号化処理部、２０６…ビットストリーム生成部、２０７…処理部、２０８…圧縮ビットストリーム、
３０１…コンパクトディスク、３０２…１フレーム、３０３…ヘッダ、３０４…同期語、３０５…ＩＤ情報、３０６…layer情報、３０７…ＣＲＣ、３０８…protection-bit、３０９…サイド情報、３１０…メインデータ、３１１…main-data-begin情報、３１２，３１３…private-bits、３１４…scalefac-scale、３１５…scalefac-l、
４０１…パワー情報付圧縮データ、４０２…サーチ部、４０３…計算部、４０４…ハフマン復号部、４０５…逆量子化部、４０６…逆フィルタバンク部、４０７…ＰＣＭデータ、
９０１…パワー情報付き圧縮データ、９０２…デコード処理部、９０３…サーチ部、９０４，９０５…出力部、９０６…メモリ、９０７…Ｄ／Ａ変換部、９０８…出力音声制御部、
１００１…パワー情報付き圧縮データ、１００２…サーチ部、１００３…計算部、１００４…調整部、１００５…ＰＣＭデータ、
１１０１…１６ビットＰＣＭ、１１０２…計算部、１１０３…フィルタバンク処理部、１１０４…量子化部、１１０５…ハフマン符号化処理部、１１０６…ビットストリーム生成部、１１０７…パワー情報付き圧縮ビットストリーム、
１２０１…１６ビットＰＣＭ、１２０２…計算部、１２０３…フィルタバンク処理部、１２０４…量子化部、１２０５…ハフマン符号化処理部、１２０６…ビットストリーム生成部、１２０７…パワー情報付き圧縮ビットストリーム。

Claims

音声データと、
上記音声データの音圧パワーに相関したパワー情報とが記録されてなることを特徴とする音声データ記録媒体。
請求項１において、
上記音声データは、デジタル音声データがデータ圧縮されたものであり、
上記パワー情報は、上記デジタル音声データから計算された平均的な音圧パワーを予め決められた複数段階からなるパワーレベルに置き換えられたものであることを特徴とする音声データ記録媒体。
請求項１において、
上記音声データは、コンパクトディスクに記録されたデジタル音声データであり、
上記パワー情報は、上記コンパクトディスクに記録されるデジタル音声データから計算された平均的な音圧パワーを予め決められた複数段階からなるパワーレベルに置き換えられたものであり、上記コンパクトディスクの各楽曲(音楽プログラム)に対応して記録されたものであることを特徴とする音声データ記録媒体。
請求項３において、
上記パワーレベルは、楽曲(音楽プログラム)のうち想定された最も小さいレベルと最も大きなレベルとの間を聴感上直線的に変化するような複数段階に設定されたものであることを特徴とする音声データ記録媒体。
請求項２において、
記録媒体は、ヘッダ部、ＣＲＣ部、サイド情報部及びメインデータ部を１フレームとする複数フレームを有し、
上記音声データは、上記１フレーム中のメインデータ部に記録され、
上記パワー情報は、上記１フレーム中のサイド情報に含まれるプライベートビット領域に記録されることを特徴とする音声データ記録媒体。
請求項１において、
上記音声データは、楽曲（音楽プログラム）に対応したものであり、
上記音圧パワーは、上記音声データの音量を平均化したものであることを特徴とする音声データ記録媒体。
請求項１において、
上記音声データ記録媒体は、ヘッダ部及びメインデータ部を１フレームとする複数フレームを有するものであり、
上記音圧パワーは、上記１フレームにおいて平均的な音圧パワーに相関したパワー情報が１フレーム毎に記録されてなることを特徴とする音声データ記録媒体。
請求項１において、
上記音圧パワーは、楽曲（音楽プログラム）一曲においての平均的な音圧パワーに相関したパワー情報であることを特徴とする音声データ記録媒体。
エンコード部と、
記録部と、
デコード部と、
出力部とを含み、
上記エンコード部は、楽曲(音楽プログラム)に対応したデジタル音声データを受けて、その音声データの音圧パワーに相関したパワー情報を生成するパワー情報生成部を備え、上記デジタル音声データをデータ圧縮した圧縮データに上記生成されたパワー情報を関連付けて上記記録部に記録し、
上記デコード部は、上記記録部の読み出し信号を受けて、上記パワー情報を抽出するとともに圧縮された音声データをもとのデジタル音声データに復元し、
上記出力部は、上記復元されたデジタル音声データから生成されたアナログ音声データのレベルを上記パワー情報に基づいて調整して出力し、又は上記復元されたデジタル音声データと上記パワー情報とを出力してなることを特徴とする音声データ記録／再生システム。
請求項９において、
上記音声データは、コンパクトディスクに記録されたデジタル音声データであり、
上記パワー情報は、上記コンパクトディスクから読み出された音声データから計算された平均的な音圧パワーを予め決められた複数段階からなるパワーレベルに置き換えられたものであることを特徴とする音声データ記録／再生システム。
請求項１０において、
上記パワーレベルは、楽曲(音楽プログラム) に対応したデジタル音声データのうち想定された最も小さいレベルと最も大きなレベルとの間を聴感上直線的に変化するような複数段階に設定されたものであることを特徴とする音声データ記録／再生システム。
請求項１１において、
記録部は、ヘッダ部、ＣＲＣ部、サイド情報部及びメインデータ部を１フレームとする複数フレームを有し、
上記音声データは、上記１フレーム中のメインデータ部に記録され、
上記パワー情報は、上記１フレーム中のサイド情報に含まれるプライベートビット領域に記録されることを特徴とする音声データ記録／再生システム。
請求項１２において、
上記音声データ記録／再生システムは、自動車搭載用オーディオ装置に含まれるものであることを特徴とする音声データ記録／再生システム。
請求項１２において、
上記音声データ記録／再生システムは、ヘッドフォンを音声出力手段とする携帯型オーディオ装置に含まれるものであることを特徴とする音声データ記録／再生システム。