以下、図面を参照して、本発明を実施するための形態について詳細に説明する。図1には、本実施形態に係る音声処理装置10が示されている。図1に示すように、本実施形態に係る音声処理装置10は、取得部11、処理部12及び実行部13を備えている。
取得部11は、デジタル音声データを取得する。なお、本実施形態に係る音声処理装置10では、デジタル音声データを、装置内に装着された記録媒体60から取得するものとしているが、これに限らない。例えば、外部装置から有線通信または無線通信によりデジタル音声データを取得する形態としてもよい。
また、処理部12は、取得部11によって取得されたデジタル音声データに対して、該デジタル音声データの値が大きくなるほど音量を多くする音量増加処理を初めとした種々の音声処理を行う。そして、実行部13は、処理部12によって各種音声処理が行われたデジタル音声データの再生および記録の少なくとも一方(本実施形態では、双方)を実行する。
なお、音声処理装置10における取得部11は本発明に係る取得部の一例であり、処理部12は本発明に係る処理部の一例であり、実行部13は本発明に係る実行部の一例である。以下では、本発明を、一例として、CDに記録されたデジタル音声データに対して各種の音声処理を加えた上でリアルタイムで再生すると共に、当該デジタル音声データを内蔵された記憶部に記憶する音声処理装置に適用した場合について説明する。
上述した音声処理装置10は、図2に示す音声再生・記録装置20によって実現することができる。
図2に示すように、本実施形態に係る音声再生・記録装置20は、CPU(Central Processing Unit)21、メモリ22、記憶部23、入力部24、表示部25、光学ドライブ26、通信部27及びDSP(Digital Signal Processor)28を備えている。CPU21、メモリ22、記憶部23、入力部24、表示部25、光学ドライブ26、通信部27及びDSP28はバス29を介して互いに接続されている。
光学ドライブ26は、CDとして構成された記録媒体60に書き込まれているデジタル音声データの読み出しを行う。
一方、DSP28は、主として、光学ドライブ26にセットされた記録媒体60に書き込まれているデジタル音声データに対し、予め指定された音声処理を施す。DSP28には、D/A(Digital to Analog)コンバータ80、フィルタ81、アンプ82及びスピーカ83が、この順で接続されており、DSP28によって音声処理が施されたデジタル音声データは、D/Aコンバータ80、フィルタ81及びアンプ82を介してスピーカ83により音声として再生される。
また、記憶部23は、HDD(Hard Disk Drive)やフラッシュメモリ等によって実現できる。記憶部23には、音声再生・記録装置20を音声処理装置10として機能させるための音声再生・記録プログラム23Aが記憶されている。本実施形態に係る音声再生・記録装置20では、音声再生・記録プログラム23Aが記憶部23に予めインストールされている。そして、CPU21は、音声再生・記録プログラム23Aを記憶部23から読み出してメモリ22に展開し、音声再生・記録プログラム23Aが有するプロセスを順次実行する。
音声再生・記録プログラム23Aは、取得プロセス23A1、処理プロセス23A2及び実行プロセス23A3を有する。CPU21は、取得プロセス23A1を実行することで、図1に示す取得部11として動作する。また、CPU21は、処理プロセス23A2を実行することで、図1に示す処理部12として動作する。さらに、CPU21は、実行プロセス23A3を実行することで、図1に示す実行部13として動作する。
なお、本実施形態に係る音声再生・記録装置20では、処理プロセス23A2による音声処理そのものについては、DSP28が通常はリアルタイムで実行する。
以上により、音声再生・記録プログラム23Aを実行した音声再生・記録装置20が、音声処理装置10として機能することになる。
次に、図3を参照して、本実施形態に係るDSP28の構成について説明する。図3に示すように、本実施形態に係るDSP28は、シフトダウン処理部30、ダイナミックレンジ変換部32、位相変換部34、高周波数帯域変換部36、共振周波数信号付加部38、ヒスノイズ付加部40、サブソニック帯域付加部42、クロストーク付加部44及び高音領域音量増減処理部46を備えている。
シフトダウン処理部30は、ダイナミックレンジ変換部32による音声処理の実行に先立ち、取得部11によって取得されたデジタル音声データに対して、予め定められた値だけ当該デジタル音声データの音量分を低減する処理を行う。なお、本実施形態に係るシフトダウン処理部30では、上記予め定められた値だけ音量分を低減する処理として、デジタル音声データを予め定められたビット数だけシフトダウンさせる処理を行う。
本実施形態では、後述するように、ダイナミックレンジ変換部32により音量にして最大6dB程度の倍率でデジタル音声データの嵩上げを行うことを想定しているため、本実施形態に係るシフトダウン処理部30では、デジタル音声データの音量分に対して、例えば1ビットのシフトダウンを行う。
一方、ダイナミックレンジ変換部32は、入力されたデジタル音声データに対して、該デジタル音声データの値が大きくなるほど音量を多くする音量増加処理を行う。なお、本実施形態に係るダイナミックレンジ変換部32では、音量増加処理として、入力されたデジタル音声データに対し、アナログ方式で音声が記録されたビニールレコード盤の音溝をレコード針でトレースすることにより上記音声を示すアナログ音声信号を生成する場合における、上記レコード針が音溝の傾斜面に衝突することによる上記音溝の変形及び反発に起因するダイナミックレンジの増加に応じた音量増加分を反映させる処理を行う。
すなわち、図4及び図5に示すように、ビニールレコード盤の音溝50は断面視V字状とされて蛇行しており、音溝50の一方の傾斜面が左チャネルの音声を表す面とされ、他方の傾斜面が右チャネルの音声を表す面とされている。
ここで、ビニールレコード盤に記録された音声を再生する場合、ビニールレコード盤が回転された状態で、レコード針52の先端部が音溝50に沿って相対的に移動(トレース)することになる。この際、一例として図5の矢印Aで示す方向にレコード針52の先端部が相対的に移動し、該先端部が音溝50の一方の傾斜面に衝突することにより該傾斜面に対して動的加重が付与され、音溝50におけるレコード針52の先端部が衝突された部分が変形する。この音溝50の変形に応じたレコード針52の先端部の反発によってレコード針52の図5の矢印Bで示す方向に対する加速度が増加される。この加速度の増加により、レコード針52の先端部が衝突した位置に対応する音声のダイナミックレンジが一時的に拡大される。
この際の動的加重による音溝50の変形量は、レコード針52が設けられたカートリッジの針先加重量、レコード針52の針先の特性や形状、ビニールレコード盤の材質等にもよるが、一般に、音溝50の傾斜面のビニールレコード盤の表面からの深さa(図4参照。)に対して1割程度の割合に及ぶ。そして、この場合の音声のダイナミックレンジの拡大量は、音量の拡大倍率として最低でも数dB程度にもなる。
これに対し、CDやSACD等のデジタル音声記録媒体では、音溝そのものがないため、音溝の変形や弾性による反発に起因するダイナミックレンジの拡大が発生することはなく、この点において違和感や、物足りなさを感じるユーザも多い。
そこで、本実施形態に係るダイナミックレンジ変換部32では、この際のダイナミックレンジの拡大に応じた音量増加分をデジタル音声データに対して反映させる。
ここで、音溝50は記録される音声の音量が大きいほど音溝に対する横方向の変化幅が大きくなるため、該音量が大きいほどレコード針52の先端部の衝突による音溝50の変形量が多くなり、かつ加速度がより多く発生するので、この結果として該音量が大きいほど上記ダイナミックレンジの拡大量は多くなる。そこで、本実施形態に係るダイナミックレンジ変換部32では、デジタル音声データの値が大きくなるほど、上記音量増加分を多くする。
なお、本実施形態に係るダイナミックレンジ変換部32では、一例として図6に示すように、音量増加の対象とするデジタル音声データの直前のピーク値が大きいほど音量増加分を多くする。図6に示す例では、ダイナミックレンジ変換部32は、最初に正極性となる一連のデジタル音声データのピーク値P1の大きさに応じた音量増加分p1で、直後の負極性となる一連のデジタル音声データに対して一律で嵩上げする。これに引き続き、ダイナミックレンジ変換部32は、上記負極性となる一連のデジタル音声データのピーク値P2の大きさに応じた音量増加分p2で、直後の正極性となる一連のデジタル音声データに対して一律で嵩上げする。そして、これ以降、ダイナミックレンジ変換部32は、処理すべきデジタル音声データがなくなるまで同様の処理を繰り返す。
但し、音量増加処理は、この形態に限らず、例えば、音量増加分の基準となるピーク値を、音量増加の対象とするデジタル音声データの直前のピーク値とする形態に代えて、該ピーク値のさらに直前のピーク値としてもよい。また、例えば、音量増加の対象とするデジタル音声データそのものの値が大きくなるほど、該デジタル音声データに対して適用する音量増加分を多くする形態としてもよい。
以上のダイナミックレンジを擬似的に拡大する機能を実現するため、本実施形態に係るダイナミックレンジ変換部32は、図7に示すように、左チャネルの音声用のメモリ32A及び右チャネルの音声用のメモリ32Bを備えている。また、本実施形態に係るダイナミックレンジ変換部32は、それぞれ左右のチャネルの各音声に共用されるピーク検出部32C及びゼロクロス検出部32Dを備えると共に、左チャネルの音声用の音声データ嵩上げ部32E及び右チャネルの音声用の音声データ嵩上げ部32Fを備えている。
メモリ32Aは左チャネルのデジタル音声データLを記憶し、メモリ32Bは右チャネルのデジタル音声データRを記憶する。また、ピーク検出部32Cは、デジタル音声データL及びデジタル音声データRからピーク値(図6も参照。)を検出する。また、ゼロクロス検出部32Dは、デジタル音声データL及びデジタル音声データRから音波の粗密が無くなる節の部分、すなわちゼロクロスとなる時点を検出する。さらに、音声データ嵩上げ部32Eは、デジタル音声データLに対して、該デジタル音声データLからピーク検出部32Cによって検出されたピーク値に応じた大きさの音量増加分に相当する値を加算する。同様に、音声データ嵩上げ部32Fは、デジタル音声データRに対して、該デジタル音声データRからピーク検出部32Cによって検出されたピーク値に応じた大きさの音量増加分に相当する値を加算する。
すなわち、ダイナミックレンジ変換部32では、メモリ32Aによってデジタル音声データLを一時的に記憶する。次に、ピーク検出部32C及びゼロクロス検出部32Dによってデジタル音声データLを時系列順に参照し、ピーク検出部32Cによってピーク値が検出されたことに引き続き、ゼロクロス検出部32Dによってゼロクロスが最初に検出された時点から次に検出される時点までのデジタル音声データLを特定する。そして、音声データ嵩上げ部32Eにより、特定したデジタル音声データLに対して、ピーク検出部32Cによって検出したピーク値に応じた大きさの値を加算する。
同様に、ダイナミックレンジ変換部32では、メモリ32Bによってデジタル音声データRを一時的に記憶する。次に、ピーク検出部32C及びゼロクロス検出部32Dによってデジタル音声データRを時系列順に参照し、ピーク検出部32Cによってピーク値が検出されたことに引き続き、ゼロクロス検出部32Dによってゼロクロスが最初に検出された時点から次に検出される時点までのデジタル音声データRを特定する。そして、音声データ嵩上げ部32Fにより、特定したデジタル音声データRに対して、ピーク検出部32Cによって検出したピーク値に応じた大きさの値を加算する。
本実施形態に係るダイナミックレンジ変換部32では、以上の処理を、処理対象とするデジタル音声データがなくなるまで繰り返し実行する。
なお、本実施形態に係るダイナミックレンジ変換部32では、各チャネルのデジタル音声データに加算する値を、該値の基準となるピーク値の所定の割合(本実施形態では、一例として6dB)に相当する値を適用しているが、これに限定されるものではない。
このように、本実施形態に係るダイナミックレンジ変換部32による音声処理では、処理後のデジタル音声データの値が処理前の値より大きくなるため、ダイナミックレンジ変換部32を駆動させる場合には、上述したシフトダウン処理部30も駆動させるようにする。
ところで、上述したように、一般に、音の波形の振幅は周波数が低くなるほど大きいので、デジタル音声データに対して、音量増加処理により、単にデジタル音声データの値が大きくなるほど音量を多くする処理を行うと、周波数が低くなるほど音量の増加量が相対的に多くなってしまう。
そこで、ダイナミックレンジ変換部32は、デジタル音声データの周波数が低くなるほど音量の増加量が相対的に少なくなるように音量増加処理を行うようにしてもよい。特に、ダイナミックレンジ変換部32は、周波数が低い分割領域ほど音量の増加量が相対的に少なくなるように音量増加処理を行うようにしてもよい。この場合、ダイナミックレンジ変換部32は、デジタル音声データの周波数帯域を複数の領域に分割し、各分割領域の各々毎に、各分割領域間において周波数が低い分割領域ほど音量の増加量が相対的に少なくなるように音量増加処理を行うようにしてもよい。
これにより、より高精度に、デジタル音声データによる再生音を改質することができる。
一方、位相変換部34は、入力されたデジタル音声データに対して、当該デジタル音声データの予め定められた周波数帯域以下の帯域の位相を当該帯域より高い周波数帯域の位相より遅らせる処理を行う。
すなわち、上述したように、ビニールレコード盤の音溝は、レコード針の先端部によるトレースにより変形する。また、レコード針が設けられたカートリッジは、一例として図8に示すように、低周波数領域(低音)のほうが中周波数領域(中音)に比較して高い値となる機械インピーダンス特性を有する。なお、機械インピーダンスは、構造物の機械的な動き難さを表す値であり、機械インピーダンスが小さければ動きやすく、大きければ動き難いことを表す。
従って、音溝の振幅が大きく、かつカートリッジにおける機械インピーダンスが相対的に大きい低音の方が、中音に比較して位相が遅れる。これに対し、前述したように、CDやSACD等のデジタル音声記録媒体では、音溝そのものがないため、デジタルデータとしては低音の位相が中音に比較して遅れることはなく、この点において違和感や、物足りなさを感じるユーザも多い。
ここで、人間の聴覚は2kHz〜5kHz程度の音に対して最も感度が高いので、この周波数帯域の位相は変化させないほうが好ましい。そこで、本実施形態に係る位相変換部34では、入力されたデジタル音声データに対し、2kHz以下の周波数帯域について位相を遅延させる位相変換を行う。但し、この周波数帯域に限らず、他の周波数帯域について位相変換を行う形態としてもよい。
以上の位相変換を行う機能を実現するため、本実施形態に係る位相変換部34は、図9に示すように、左チャネルの音声用のメモリ34A及び右チャネルの音声用のメモリ34Bを備えている。また、本実施形態に係る位相変換部34は、それぞれ左右のチャネルの各音声に共用される周波数分割部34C、FFT(Fast Fourier Transform、高速フーリエ変換)部34D、位相角変更部34E、IFFT(Inverse FFT、逆高速フーリエ変換)部34F及びLPF(Low-Pass Filter、ロー・パス・フィルタ)34Gを備えている。さらに、本実施形態に係る位相変換部34は、左チャネルの音声用の音声データ統合部34H及び右チャネルの音声用の音声データ統合部34Iを備えている。
メモリ34Aは左チャネルのデジタル音声データLを記憶し、メモリ34Bは右チャネルのデジタル音声データRを記憶する。また、周波数分割部34Cは、デジタル音声データL及びデジタル音声データRを、予め定められた周波数(ここでは、2kHz)で分割する。また、周波数分割部34Cは、分割後のデジタル音声データLの高周波数側のデータをメモリ34Aに格納すると共に、分割後のデジタル音声データRの高周波数側のデータをメモリ34Bに格納する。そして、周波数分割部34Cは、分割後のデジタル音声データL及びデジタル音声データRの各々の低周波数側のデータをFFT部34Dに出力する。
また、FFT部34Dは、周波数分割部34Cによって得られたデジタル音声データL及びデジタル音声データRの各々の低周波数側のデータに対して高速フーリエ変換を行うことによって左右のチャネルの上記低周波数側の各音声に対応する周波数領域のデータを生成する。また、位相角変更部34Eは、FFT部34Dによって得られた低周波数領域のデータを高周波数側のデータより位相角を予め定められた位相角だけ相対的に遅延させる。また、IFFT部34Fは、位相角変更部34Eによって位相角が遅延された低周波数領域のデータをデジタル音声データに戻す。
また、LPF34Gは、IFFT部34Fによって得られたデジタル音声データから、上記予め定められた周波数以下のデータのみを抽出する。そして、音声データ統合部34Hは、メモリ32Aに記憶されているデジタル音声データLの上記高周波数側のデータと、LPF34Gによりデジタル音声データLに基づいて得られたデータとを統合(合成)することにより、位相変換が行われたデジタル音声データLを作成する。同様に、音声データ統合部34Iは、メモリ32Bに記憶されているデジタル音声データRの上記高周波数側のデータと、LPF34Gによりデジタル音声データRに基づいて得られたデータとを統合(合成)することにより、位相変換が行われたデジタル音声データRを作成する。
すなわち、位相変換部34では、デジタル音声データLをメモリ34Aに記憶すると共に、デジタル音声データRをメモリ34Bに記憶する。また、位相変換部34では、メモリ34A及びメモリ34Bに記憶されたデジタル音声データの各々について、周波数分割部34Cにより、上記予め定められた周波数(本実施形態では、2kHz)を境界として分割し、デジタル音声データLの高周波数側のデータをメモリ34Aに格納すると共に、デジタル音声データRの高周波数側のデータをメモリ34Bに格納する。
次に、位相変換部34では、周波数分割部34Cによって得られた左右のチャネルの音声に対応する上記低周波数側のデータをFFT部34Dにより周波数領域のデータに変換する。これにより、一例として図10に示すように、左右のチャネルの音声に対応する低周波数領域のデータが得られる。
次に、位相変換部34では、位相角変更部34Eにより、左右のチャネルの音声に各々対応する低周波数領域のデータの位相角を予め定められた位相角だけ遅延させる。例えば、周波数が100Hzのデータに対して遅延させる場合は、該周波数のデータの1周期は10ms(=1÷100)なので、位相角を一例として90度遅延させるためには、2.5ms(=10÷4)遅延させることになる。
なお、本実施形態に係る位相角変更部34Eでは、上記予め定められた位相角として簡便化のために45度を適用しているが、これに限定されるものではない。例えば、22.5度、67.5度、90度等といった他の位相角を適用する形態としてもよい。また、周波数により位相角を変えてもよい。さらに、ここで適用する位相角を、ユーザに対し、入力部24等を介して入力させるようにして、入力された位相角を適用する形態としてもよい。
次に、位相変換部34では、IFFT部34Fにより、位相角変更部34Eによって位相角が遅延された、左右のチャネルの音声に対応する低周波数領域のデータをデジタル音声データに戻し、LPF34Gにより、該左右のチャネルの音声に対応するデジタル音声データから、上記予め定められた周波数以下のデータのみを抽出する。
そして、位相変換部34では、音声データ統合部34Hにより、メモリ34Aに記憶されているデジタル音声データLの上記高周波数側のデータと、LPF34Gによりデジタル音声データLに基づいて得られたデータとを統合(合成)することにより、位相変換後のデジタル音声データLを作成して出力する。同様に、位相変換部34では、音声データ統合部34Iにより、メモリ34Bに記憶されているデジタル音声データRの上記高周波数側のデータと、LPF34Gによりデジタル音声データRに基づいて得られたデータとを統合(合成)することにより、位相変換後のデジタル音声データRを作成して出力する。
このように、本実施形態に係る位相変換部34では、FFT部34Dの前段において周波数分割部34Cにより周波数領域の分割を行っている。しかしながら、これに限定されるものではなく、例えば、周波数分割部34Cに代えて、FFT部34Dによってデジタル音声データを周波数領域のデータに変換した状態で周波数領域の分割を行ってもよい。また、位相角変更部34Eに代えて、IFFT部34Fの後段において位相角の変更を行ってもよい。また、LPF34Gに代えて、IFFT部34Fの前段において上記予め定められた周波数以下のデータのみを抽出する形態としてもよい。
ところで、CDにおいて採用されているサンプリング周波数は44.1kHzであるが、このサンプリング周波数では、20kHz程度の周波数帯域の忠実な録音や再生を行うことは困難である。すなわち、20kHz付近の楽音は一般に非常に複雑な波形をしており、該波形に対して、たかだか数ポイントのサンプリングを行うのみでは、忠実に音を再現することは難しい。
そこで、本実施形態に係る高周波数帯域変換部36は、一例として図11に示すように、入力されたデジタル音声データから予め定められたクロスオーバー周波数(図11に示す例では、18kHz)の1オクターブ下(図11に示す例では、9kHz)までの第1音声データを抽出する。また、高周波数帯域変換部36は、抽出した第1音声データに対して当該第1音声データの周波数を2倍強とする疑似倍音生成処理を行う。また、高周波数帯域変換部36は、以上によって得られた第2音声データの振幅を予め定められた量(本実施形態では、第2音声データの振幅の2分の1)だけ減少させる減少処理を行う。そして、高周波数帯域変換部36は、上記減少処理によって得られた第3音声データを、一例として図12に示すように、上記デジタル音声データの上記クロスオーバー周波数の帯域に付加する処理を行う。
以上の高周波数帯域の変換を行う機能を実現するため、本実施形態に係る高周波数帯域変換部36は、図13に示すように、左チャネルの音声用のメモリ36A及び右チャネルの音声用のメモリ36Bを備えている。また、本実施形態に係る高周波数帯域変換部36は、それぞれ左右のチャネルの各音声に共用される周波数分割部36C、FFT部36D、周波数抽出部36E、疑似倍音生成部36F、IFFT部36G、アッテネータ36H及びBPF(Band-Pass Filter、バンド・パス・フィルタ)36Iを備えている。さらに、高周波数帯域変換部36は、左チャネルの音声用の音声データ統合部36J及び右チャネルの音声用の音声データ統合部36Kを備えている。
メモリ36Aは左チャネルのデジタル音声データLを記憶し、メモリ36Bは右チャネルのデジタル音声データRを記憶する。また、周波数分割部36Cは、デジタル音声データL及びデジタル音声データRを、上記クロスオーバー周波数の1オクターブ下までの周波数帯域(ここでは、9kHz)で分割する。そして、周波数分割部36Cは、分割後のデジタル音声データL及びデジタル音声データRの各々のデータをFFT部36Dに出力する。
また、FFT部36Dは、周波数分割部36Cによって分割されたデジタル音声データL及びデジタル音声データRの各々のデータに対して高速フーリエ変換を行うことによって左右のチャネルの各音声に対応する周波数領域のデータを生成する。また、周波数抽出部36Eは、FFT部36Dによって得られた周波数領域のデータにおける、クロスオーバー周波数の1オクターブ下までの周波数帯域のデータを抽出する。また、疑似倍音生成部36Fは、周波数抽出部36Eによって抽出されたデータに対して上記疑似倍音生成処理を行う。また、IFFT部36Gは、疑似倍音生成部36Fによって疑似倍音生成処理が行われたデータをデジタル音声データに戻す。
また、アッテネータ36Hは、IFFT部36Gによって得られたデジタル音声データに対して上記減少処理を行う。また、BPF36Iは、アッテネータ36Hによって減少処理が行われたデジタル音声データから、上記クロスオーバー周波数の1オクターブ強上までの周波数帯域のデータのみを抽出する。
そして、音声データ統合部36Jは、メモリ36Aに記憶されているデジタル音声データLの上記クロスオーバー周波数以上の帯域に、BPF36Iによりデジタル音声データLに基づいて得られたデータを統合(合成)することにより、高周波数帯域の変換が行われたデジタル音声データLを作成する。同様に、音声データ統合部36Kは、メモリ36Bに記憶されているデジタル音声データRの上記クロスオーバー周波数以上の帯域に、BPF36Iによりデジタル音声データRに基づいて得られたデータを統合(合成)することにより、高周波数帯域の変換が行われたデジタル音声データRを作成する。
すなわち、高周波数帯域変換部36では、デジタル音声データLをメモリ36Aに記憶すると共に、デジタル音声データRをメモリ36Bに記憶する。また、高周波数帯域変換部36では、メモリ36A及びメモリ36Bに記憶されたデジタル音声データの各々について、周波数分割部36Cにより、上記クロスオーバー周波数の1オクターブ下の周波数帯域を境界として分割する。
次に、高周波数帯域変換部36では、周波数分割部36Cによって分割された左右のチャネルの音声に対応するデータをFFT部36Dにより周波数領域のデータに変換する。次に、高周波数帯域変換部36では、周波数抽出部36Eにより、左右のチャネルの音声に各々対応する上記周波数領域のデータを抽出し、疑似倍音生成部36Fにより、左右のチャネルの音声に各々対応する上記周波数領域のデータに対して計算値で2倍強の上記疑似倍音生成処理を行う。
次に、高周波数帯域変換部36では、IFFT部36Gにより、疑似倍音生成部36Fによって疑似倍音生成処理が行われた左右のチャネルの音声に対応する周波数領域のデータをデジタル音声データに戻し、アッテネータ36Hにより、該左右のチャネルの音声に対応するデジタル音声データに対して上記減少処理を行った後、BPF36Iにより、該左右のチャネルの音声に対応するデジタル音声データから、上記クロスオーバー周波数の1オクターブ強上までの周波数帯域のデータのみを抽出する。
そして、高周波数帯域変換部36では、音声データ統合部36Jにより、メモリ36Aに記憶されているデジタル音声データLの上記クロスオーバー周波数以上の帯域に、BPF36Iによりデジタル音声データLに基づいて得られたデータを統合(合成)することにより、高周波数帯域の変換が行われたデジタル音声データLを作成して出力する。同様に、高周波数帯域変換部36では、音声データ統合部36Kにより、メモリ36Bに記憶されているデジタル音声データRの上記クロスオーバー周波数以上の帯域に、BPF36Iによりデジタル音声データRに基づいて得られたデータを統合(合成)することにより、高周波数帯域の変換が行われたデジタル音声データRを作成して出力する。
このように、本実施形態に係る高周波数帯域変換部36では、FFT部36Dの前段において周波数分割部36Cにより周波数領域の分割を行っている。しかしながら、これに限定されるものではなく、例えば、周波数分割部36Cに代えて、FFT部36Dによってデジタル音声データを周波数領域のデータに変換した状態で周波数領域の分割を行ってもよい。また、疑似倍音生成部36Fに代えて、IFFT部36Gの後段において疑似倍音生成処理を行ってもよい。また、BPF36Iに代えて、IFFT部36Gの前段においてクロスオーバー周波数の1オクターブ下の周波数帯域のデータのみを抽出する形態としてもよい。
ところで、高音質で定評のあるカートリッジでは、15kHz〜20kHz付近の高周波数帯域に、該カートリッジとビニールレコード盤との共振周波数が存在する場合が多い。そして、該共振周波数における高周波数帯域における共振では、レコード針が複雑な動きをするので、レコード針に非常に多くの歪動作が発生する。
これに対し、CDやSACD等のデジタル音声記録媒体に記録されたデータを再生する場合にはカートリッジを用いないため、上記共振周波数は存在せず、この点において違和感や、物足りなさを感じるユーザも多い。
そこで、本実施形態に係る共振周波数信号付加部38は、入力されたデジタル音声データの予め定められた周波数より高い高周波数帯域(本実施形態では、15kHz〜20kHzの基音周波数帯域)に対して、上記カートリッジとビニールレコード盤との共振周波数の成分を擬似的に付加する処理を行う。
なお、本実施形態に係る共振周波数信号付加部38では、上記共振周波数の成分として、該成分を擬似的に、一例として図14に示す三角波として適用しているが、これに限るものではない。例えば、一例として図15や図16に示すノコギリ波を上記共振周波数の成分として擬似的に適用する形態としてもよい。また、実際の共振周波数による成分を予め取得しておき、該成分を適用する形態としてもよい。
以上の共振周波数の成分を付加する機能を実現するため、本実施形態に係る共振周波数信号付加部38は、図17に示すように、三角波発生器38A、音量判定器38C、アッテネータ38D、及び2つの重畳部38E,38Fを備えている。
三角波発生器38Aは、従来既知の技術により、一例として図14に示す三角波を発生してアッテネータ38Dに出力する。また、音量判定器38Cは、左チャネルのデジタル音声データL及び右チャネルのデジタル音声データRによる音声の音量を判定する。そして、アッテネータ38Dは、入力された三角波の振幅を、音量判定器38Cによって判定された音量が少ないほど大きく減衰して出力する。さらに、重畳部38Eは、デジタル音声データLに対してアッテネータ38Dから出力された三角波を重畳させて出力する。同様に、重畳部38Fは、デジタル音声データRに対してアッテネータ38Dから出力された三角波を重畳させて出力する。
すなわち、共振周波数信号付加部38では、三角波発生器38Aにより三角波を発生させる。また、共振周波数信号付加部38では、音量判定器38Cにより、左右のチャネルのデジタル音声データによる音声の音量を判定する。
そして、共振周波数信号付加部38では、三角波発生器38Aにより発生された三角波を、アッテネータ38Dにより、音量判定器38Cによって判定された音量が少ないほど大きく減衰し、重畳部38Eにより、デジタル音声データLに対して減衰された三角波を重畳して出力する一方、重畳部38Fにより、デジタル音声データRに対して減衰された三角波を重畳して出力する。
ところで、1980年代以前の音楽等の録音現場では、主にオープンリール式磁気テープを用いた記録再生装置が用いられており、該記録再生装置を用いた音源では、磁気テープ特有のヒスノイズが発生していた。これに対し、CDやSACD等のデジタル音声記録媒体では、元録音もデジタルで行われる場合にはヒスノイズが発生することはなく、この点において違和感や、物足りなさを感じるユーザも多い。
そこで、ヒスノイズ付加部40は、入力されたデジタル音声データに対して、磁気テープにおいて生じるヒスノイズの成分を付加する処理を行う。
以上のヒスノイズの成分を付加する機能を実現するため、本実施形態に係るヒスノイズ付加部40は、図18に示すように、ヒス音発生器40A、ゲート部40B、無音/有音判別器40C、及び2つの重畳部40D,40Eを備えている。
ヒス音発生器40Aは、ヒスノイズを示すデジタル音声データ(以下、「ヒスノイズデータ」という。)を予め記憶しており、該ヒスノイズデータを出力する。なお、本実施形態では、ヒスノイズデータを、実際のオープンリール式磁気テープを用いて記録再生装置により無音状態で録音し、これによって上記磁気テープに記録されたアナログ信号の再生音をデジタル録音することにより取得する。この際のデジタル録音は、一例として、176.4(=44.1×4)kHzのサンプリングで、かつ24ビット構成としてMSB(Most Significant Bit)まで全て用いた録音レベルにて行う。
また、ゲート部40Bは、入力された制御信号に応じて開状態と閉状態とを切り替えることにより、入力されたヒスノイズデータの出力及び出力停止を切り替える。無音/有音判別器40Cは、左チャネルのデジタル音声データL及び右チャネルのデジタル音声データRにおける無音部分と有音部分とを判別する。そして、無音/有音判別器40Cは、有音部分を検出している場合はゲート部40Bを開状態としてヒスノイズデータを出力する状態とする一方、無音部分を検出している場合はゲート部40Bを閉状態としてヒスノイズデータを出力しない状態とする制御信号をゲート部40Bに出力する。なお、無音/有音判別器40Cを用いてヒスノイズデータを適用する対象を有音部分のみとするか否かを予め選択可能とする形態としてもよい。
さらに、重畳部40Dは、デジタル音声データLに対してゲート部40Bから出力されたヒスノイズデータを重畳させて出力する。同様に、重畳部40Eは、デジタル音声データRに対してゲート部40Bから出力されたヒスノイズデータを重畳させて出力する。なお、本実施形態では、上記ヒスノイズデータの重畳を、左右のチャネルの各デジタル音声データのLSB(Least Significant Bit)付近(具体的には、24ビット処理の場合には、一例としてLSBを含めてLSBから遡って最大3ビット目まで)に加算することにより行う。また、この際に対象とする周波数帯域は5Hz〜50kHz程度とする。これは、上述したように、本実施形態では、176.4kHzでヒスノイズをサンプリングしているため、50kHz程度までは比較的正確にデジタル録音することができるためである。
すなわち、ヒスノイズ付加部40では、ヒス音発生器40Aによりヒスノイズデータを出力させる。また、ヒスノイズ付加部40では、無音/有音判別器40Cにより、左右のチャネルのデジタル音声データにおける有音部分を検出している場合はゲート部40Bにてヒスノイズデータを出力させ、無音部分を検出している場合はゲート部40Bにてヒスノイズデータの出力を停止させる。
そして、ヒスノイズ付加部40では、重畳部40Dにより、デジタル音声データLに対して上記ヒスノイズデータを重畳して出力する一方、重畳部40Eにより、デジタル音声データRに対して上記ヒスノイズデータを重畳して出力する。
一方、一般にレコードプレーヤでは、ビニールレコード盤の偏心、反りに加えて、アームとカートリッジとの相対関係等により、低周波数帯域側の共振周波数が10Hz付近に現れることが多く、この場合、極低周波雑音(サブソニック)が発生する。これに対し、CDやSACD等のデジタル音声記録媒体では、このような共振点はないため、10Hz付近の音は、大太鼓のような楽器の音等が録音されている場合を除き、通常は録音されておらず、この点においてビニールレコード盤とは違った聴感や、物足りなさを感じるユーザも多い。
そこで、サブソニック帯域付加部42は、入力されたデジタル音声データに対して、サブソニックの成分を付加する処理を行う。
以上のサブソニックの成分を付加する機能を実現するため、本実施形態に係るサブソニック帯域付加部42は、図19に示すように、サブソニックデータ発生器42A及び2つの重畳部42B,42Cを備えている。
サブソニックデータ発生器42Aは、サブソニックの成分となるデジタル音声データ(以下、「サブソニックデータ」という。)を発生して出力する。なお、本実施形態では、上記サブソニックデータとして、人のα波の周波数を模倣したデジタル音声データを適用している。なお、ここで適用するサブソニックデータはα波の周波数を模倣したものに限らず、β波等の人の脳波の周波数を模倣したものや、該脳波に類似するシューマン共鳴の1次〜3次周波数の信号等を適用する形態としてもよい。
また、重畳部42Bは、デジタル音声データLに対してサブソニックデータ発生器42Aから出力されたサブソニックデータを重畳させて出力する。同様に、重畳部42Cは、デジタル音声データRに対して上記サブソニックデータを重畳させて出力する。
すなわち、サブソニック帯域付加部42では、サブソニックデータ発生器42Aによりサブソニックデータを出力させる。そして、サブソニック帯域付加部42では、重畳部42Bにより、デジタル音声データLに対してサブソニックデータを重畳して出力する一方、重畳部42Cにより、デジタル音声データRに対してサブソニックデータを重畳して出力する。
ところで、前述したように、ビニールレコード盤では、一つの音溝に左チャネルの音声及び右チャネルの音声が同時に記録されており、カートリッジの機構とも相まってクロストークが発生する。これに対し、CDやSACD等のデジタル音声記録媒体に記録されたデータを再生する場合にはクロストークはデジタル領域では発生せず、この点において違和感や、物足りなさを感じるユーザも多い。
そこで、クロストーク付加部44は、入力されたデジタル音声データにおける左右のチャネルの各デジタル音声データに対して、クロストークの成分を付加する処理を行う。
以上のクロストークの成分を付加する機能を実現するため、本実施形態に係るクロストーク付加部44は、図20に示すように、共に左チャネルの音声用のLPF44A、アッテネータ44B、HPF(High-Pass Filter、ハイ・パス・フィルタ)44C、及びアッテネータ44Dを備えている。また、クロストーク付加部44は、共に右チャネルの音声用のLPF44F、アッテネータ44G、HPF44H、及びアッテネータ44Iを備えている。さらに、クロストーク付加部44は、2つの重畳部44E,44Jを備えている。
LPF44Aは、左チャネルのデジタル音声データLから、予め定められた第1周波数(本実施形態では、100Hz)以下のデータのみを抽出して出力する。また、アッテネータ44Bは、LPF44Aから出力されたデータを予め定められた第1量(本実施形態では、レコードプレーヤで通常発生する低周波数帯域でのクロストーク量以下の量。)まで減少させて出力する。
また、HPF44Cは、デジタル音声データLから、予め定められた第2周波数(本実施形態では、10kHz)以上のデータのみを抽出して出力する。また、アッテネータ44Dは、HPF44Cから出力されたデータを予め定められた第2量(本実施形態では、レコードプレーヤで通常発生する高周波数帯域でのクロストーク量以下の量。)まで減少させて出力する。
一方、LPF44Fは、右チャネルのデジタル音声データRから、上記第1周波数以下のデータのみを抽出して出力する。また、アッテネータ44Gは、LPF44Fから出力されたデータを上記第1量まで減少させて出力する。
また、HPF44Hは、デジタル音声データRから、上記第2周波数以上のデータのみを抽出して出力する。また、アッテネータ44Iは、HPF44Hから出力されたデータを上記第2量まで減少させて出力する。
そして、重畳部44Eは、デジタル音声データLに対して、アッテネータ44G及びアッテネータ44Iから出力されたデータを重畳させて出力する。また、重畳部44Jは、デジタル音声データRに対して、アッテネータ44B及びアッテネータ44Dから出力されたデータを重畳させて出力する。
なお、本実施形態に係るクロストーク付加部44において上記第1周波数として100Hzを採用し、上記第2周波数として10kHzを採用しているのは、実際のビニールレコード盤を再生する場合において、100Hz以下及び10kHz以上の各周波数帯域が、より多くのクロストークが発生する領域であるためである。(なお、実際には、レベルは低いものの、ビニールレコード盤の再生では全周波数帯でクロストークは発生している。)
すなわち、クロストーク付加部44では、LPF44Aにより、デジタル音声データLから、上記第1周波数以下のデータのみを抽出して出力し、アッテネータ44Bにより、LPF44Aから出力されたデータを上記第1量まで減少させて出力する。また、クロストーク付加部44では、HPF44Cにより、デジタル音声データLから、上記第2周波数以上のデータのみを抽出して出力し、アッテネータ44Dにより、HPF44Cから出力されたデータを上記第2量まで減少させて出力する。
一方、クロストーク付加部44では、LPF44Fにより、デジタル音声データRから、上記第1周波数以下のデータのみを抽出して出力し、アッテネータ44Gにより、LPF44Fから出力されたデータを上記第1量まで減少させて出力する。また、クロストーク付加部44では、HPF44Hにより、デジタル音声データRから、上記第2周波数以上のデータのみを抽出して出力し、アッテネータ44Iにより、HPF44Hから出力されたデータを上記第2量まで減少させて出力する。
そして、クロストーク付加部44では、重畳部44Eにより、デジタル音声データLに対して、アッテネータ44G及びアッテネータ44Iから出力されたデータを重畳させて出力する。また、クロストーク付加部44では、重畳部44Jにより、デジタル音声データRに対して、アッテネータ44B及びアッテネータ44Dから出力されたデータを重畳させて出力する。
ところで、レコードプレーヤにおいては、レコード針の針圧を調整することによって、高周波数成分を強調(所謂「ハイ上がり」)したり、高周波数成分を抑制(所謂「ハイ下がり」)したりすることができる。
そこで、高音領域音量増減処理部46は、入力されたデジタル音声データに対して、予め定められた周波数より高い高周波数成分の強調を行う処理、または当該高周波数成分の減衰を行う処理を行う。
以上の高周波数成分を強調する処理(以下、「強調処理」という。)、または減衰する処理(以下、「減衰処理」という。)を行う機能を実現するため、本実施形態に係る高音領域音量増減処理部46は、図21に示すように、共に左チャネルの音声用のLPF46A、HPF46B、周波数イコライザ46C、及び重畳部46Dを備えると共に、共に右チャネルの音声用のLPF46E、HPF46F、周波数イコライザ46G及び重畳部46Hを備えている。
LPF46Aは、左チャネルのデジタル音声データLから、予め定められた第3周波数(本実施形態では、4kHz)未満のデータのみを抽出して出力する。また、HPF46Bは、左チャネルのデジタル音声データLから、上記第3周波数以上のデータのみを抽出して出力する。また、周波数イコライザ46Cは、HPF46Bから出力されたデジタル音声データに対して、予め定められた強調量で強調するか、または予め定められた減衰量で減衰して出力する。そして、重畳部46Dは、LPF46Aから出力されたデジタル音声データに対して、周波数イコライザ46Cから出力されたデジタル音声データを統合させて出力する。なお、本実施形態では、上記予め定められた強調量及び上記予め定められた減衰量として、実際にカートリッジの振る舞いに近い強調処理時の強調量及び減衰処理時の減衰量を各々用いているが、これに限るものではない。
一方、LPF46Eは、右チャネルのデジタル音声データRから、上記第3周波数未満のデータのみを抽出して出力する。また、HPF46Fは、右チャネルのデジタル音声データRから、上記第3周波数以上のデータのみを抽出して出力する。また、周波数イコライザ46Gは、HPF46Fから出力されたデジタル音声データに対して、上記予め定められた強調量で強調するか、または上記予め定められた減衰量で減衰して出力する。そして、重畳部46Hは、LPF46Eから出力されたデジタル音声データに対して、周波数イコライザ46Gから出力されたデジタル音声データを重畳させて出力する。
すなわち、高音領域音量増減処理部46では、LPF46Aにより、デジタル音声データLから、上記第3周波数未満のデータのみを抽出して出力する。また、高音領域音量増減処理部46では、HPF46Bにより、デジタル音声データLから、上記第3周波数以上のデータのみを抽出して出力する。また、高音領域音量増減処理部46では、周波数イコライザ46Cにより、HPF46Bから出力されたデジタル音声データに対して、上記予め定められた強調量で強調するか、または上記予め定められた減衰量で減衰して出力する。そして、高音領域音量増減処理部46では、重畳部46Dにより、LPF46Aから出力されたデジタル音声データに対して、周波数イコライザ46Cから出力されたデジタル音声データを重畳させて出力する。
一方、高音領域音量増減処理部46では、LPF46Eにより、デジタル音声データRから、上記第3周波数未満のデータのみを抽出して出力する。また、高音領域音量増減処理部46では、HPF46Fにより、デジタル音声データRから、上記第3周波数以上のデータのみを抽出して出力する。また、高音領域音量増減処理部46では、周波数イコライザ46Gにより、HPF46Fから出力されたデジタル音声データに対して、上記予め定められた強調量で強調するか、または上記予め定められた減衰量で減衰して出力する。そして、高音領域音量増減処理部46では、重畳部46Hにより、LPF46Eから出力されたデジタル音声データに対して、周波数イコライザ46Gから出力されたデジタル音声データを重畳させて出力する。
本実施形態に係るDSP28では、CPU21により、ユーザによる指定に応じて、シフトダウン処理部30、ダイナミックレンジ変換部32、位相変換部34及び高周波数帯域変換部36の各々の駆動/非駆動が設定される。また、本実施形態に係るDSP28では、CPU21により、ユーザによる指定に応じて、共振周波数信号付加部38、ヒスノイズ付加部40、サブソニック帯域付加部42、クロストーク付加部44及び高音領域音量増減処理部46の各々の駆動/非駆動が設定される。なお、本実施形態に係るDSP28では、上記各部の各々において、CPU21により非駆動が設定されると、自身による音声処理を実行せず、かつデータ入力端子と、当該データ入力端子に対応するデータ出力端子と、を短絡する。以下では、DSP28におけるダイナミックレンジ変換部32、位相変換部34等の各種の音声処理を行う部位を総称して「音声処理部」という。
なお、図示は省略するが、本実施形態に係るDSP28は、光学ドライブ26にセットされた記録媒体60に記録されているデジタル音声データによる、ユーザに指定された音声処理部による音声処理が施された状態での音声再生を行う音声再生機能を有している。また、本実施形態に係るDSP28は、上記デジタル音声データの、ユーザに指定された音声処理部による音声処理が施された状態での記憶部23への記録を行う音声記録機能を有している。以下では、上記音声再生機能及び上記音声記録機能を総称して「音声再生・記録機能」という。
次に、本実施形態に係る音声再生・記録装置20の作用を説明する。ユーザは、まず、音声再生・記録装置20に対して所望の記録媒体60を光学ドライブ26にセットする。そして、ユーザは、音声再生・記録装置20に対して音声再生・記録プログラム23Aを実行させることで、図22に示す音声再生・記録処理が行われる。
音声再生・記録処理のステップ100において、取得部11は、ユーザに対して所望の音声処理を指定させるための初期設定画面を表示するように表示部25を制御し、次のステップ102において、取得部11は、所定情報の入力待ちを行う。
図23には、本実施形態に係る初期設定画面が示されている。図23に示すように、初期設定画面では、ダイナミックレンジ変換部32による音声処理を実行させる場合に指定される「ダイナミックレンジ変換」ボタン25Aが表示される。また、初期設定画面では、位相変換部34による音声処理を実行させる場合に指定される「位相変換」ボタン25Bと、高周波数帯域変換部36による音声処理を実行させる場合に指定される「高周波数帯域変換」ボタン25Cと、が表示される。また、初期設定画面では、共振周波数信号付加部38による音声処理を実行させる場合に指定される「共振周波数信号付加」ボタン25Dと、ヒスノイズ付加部40による音声処理を実行させる場合に指定される「ヒスノイズ付加」ボタン25Eと、が表示される。また、初期設定画面では、サブソニック帯域付加部42による音声処理を実行させる場合に指定される「サブソニック帯域付加」ボタン25Fが表示される。さらに、初期設定画面では、クロストーク付加部44による音声処理を実行させる場合に指定される「クロストーク付加」ボタン25Gと、高音領域音量増減処理部46による音声処理を実行させる場合に指定される「高音領域音量増減処理」ボタン25Hと、が表示される。
図23に示す初期設定画面が表示部25に表示されると、ユーザは、入力部24を介して、1または複数の所望の音声処理を示すボタンを指定した後、「指定終了」ボタン25Iを指定する。ここで、取得部11は、ユーザが「高音領域音量増減処理」ボタン25Hを指定した場合は、一例として図24に示すように、「減衰処理」ボタン25H1及び「強調処理」ボタン25H2をプルダウン・メニューとして表示部25に表示する。当該プルダウン・メニューが表示されると、ユーザは、入力部24を介して、高音領域音量増減処理部46によって減衰処理を実行させる場合は「減衰処理」ボタン25H1を指定し、強調処理を実行させる場合は「強調処理」ボタン25H2を指定する。なお、ユーザは、本音声再生・記録処理を終了させる場合には、入力部24を介して「処理終了」ボタン25Jを指定する。
ユーザによって初期設定画面の「指定終了」ボタン25I又は「処理終了」ボタン25Jが指定されると、上記ステップ102が肯定判定となってステップ104に移行する。
ステップ104において、処理部12は、ユーザによって指定されたボタンが「処理終了」ボタン25Jであったか否かを判定し、否定判定となった場合は、ユーザによって「指定終了」ボタン25Iが指定されたと見なして、ステップ106に移行する。
ステップ106において、処理部12は、ユーザによって指定されたボタンに対応する部位が駆動するようにDSP28に設定する。例えば、ユーザによって、「ダイナミックレンジ変換」ボタン25A及び「位相変換」ボタン25Bが指定された場合、処理部12は、DSP28に対し、シフトダウン処理部30、ダイナミックレンジ変換部32及び位相変換部34が駆動するように設定する。また、ユーザによって、各ボタン25A〜25Hの全てのボタンが指定された場合、処理部12は、DSP28に対し、全ての部位が駆動するように設定する。DSP28は、処理部12によって駆動するように設定された部位を除く部位に対し、前述したように、自身による音声処理を実行せず、かつ信号入力端子と、当該信号入力端子に対応する信号出力端子と、を短絡する処理を行う。これによって、DSP28では、処理部12によって駆動するように設定された部位のみが駆動する準備が完了する。
次のステップ108において、処理部12は、ユーザによって「高音領域音量増減処理」ボタン25Hが指定されたか否かを判定し、否定判定となった場合は後述するステップ116に移行する一方、肯定判定となった場合はステップ110に移行して、ユーザによって「減衰処理」ボタン25H1が指定されたか否かを判定する。ここで、肯定判定となった場合はステップ112に移行し、処理部12は、DSP28に対して高音領域音量増減処理部46により減衰処理を実行するように設定した後、ステップ116に移行する。また、否定判定となった場合は、処理部12は、ユーザによって「強調処理」ボタン25H2が指定されたと見なしてステップ114に移行し、DSP28に対して高音領域音量増減処理部46により強調処理を実行するように設定した後、ステップ116に移行する。
ステップ116において、取得部11は、光学ドライブ26にセットされた記録媒体60からデジタル音声データを読み出す。
次のステップ118において、実行部13は、DSP28に対し、取得部11によって読み出したデジタル音声データを送信しつつ、上記ステップ106の処理によって駆動するように設定された音声処理部の駆動を開始するように制御する。次のステップ120において、実行部13は、前述した音声再生・記録機能の実行を開始するようにDSP28を制御した後、上記ステップ102に戻る。
一方、上記ステップ104において肯定判定となった場合、処理部12は、ユーザによって「処理終了」ボタン25Jが指定されたと見なしてステップ122に移行し、予め定められた終了処理を実行した後、音声再生・記録処理を終了する。なお、本実施形態に係る音声再生・記録処理では、上記予め定められた終了処理として、DSP28に対する各種の設定を解除してデフォルトの状態(本実施形態では、全ての音声処理部を駆動可能とする状態)とした後にDSP28の駆動を停止する処理を適用しているが、これに限るものでないことはいうまでもない。
以上詳細に説明したように、本実施形態では、取得部(本実施形態では、取得部11)によりデジタル音声データを取得する。また、本実施形態では、処理部(本実施形態では、処理部12)により、取得部によって取得されたデジタル音声データに対して、該デジタル音声データの値が大きくなるほど音量を多くする音量増加処理(本実施形態では、ダイナミックレンジ変換部32による音声処理)を行う。そして、本実施形態では、実行部(本実施形態では、実行部13)により、処理部による音量増加処理が行われたデジタル音声データの再生および記録の少なくとも一方(本実施形態では、双方)を実行する。従って、本実施形態によれば、音量増加処理を行わない場合に比較して、より効果的にデジタル音声データによる再生音を改質することができる。
また、本実施形態では、上記処理部により、音量増加処理として、時系列順で直前の逆極性とされている一連のデジタル音声データの最大値(本実施形態では、ピーク値)が大きくなるほど音量を多くする処理を行っている。従って、本実施形態によれば、デジタル音声データを一時的に記憶して、該デジタル音声データに音量増加処理を行う場合における、デジタル音声データを記憶するための記憶容量の増加を抑制しつつ、音量増加処理をリアルタイムで行うことができる。
また、本実施形態では、上記処理部により、音量増加処理を行うに先立ち、上記取得部によって取得されたデジタル音声データに対して、予め定められた値だけ当該デジタル音声データの音量分を低減する処理(本実施形態では、シフトダウン処理部30による音声処理)を行っている。従って、本実施形態によれば、音量増加処理による音量の増加に伴って生じ得るデジタル音声データのサチュレーションの発生を未然に防止することができる。
また、本実施形態では、上記処理部により、さらに、デジタル音声データに対して、当該デジタル音声データの予め定められた周波数帯域以下の帯域の位相を当該帯域より高い周波数帯域の位相より遅らせる処理(本実施形態では、位相変換部34による音声処理)を行っている。従って、本実施形態によれば、より効果的にデジタル音声データによる再生音を改質することができる。
また、本実施形態では、上記処理部により、さらに、デジタル音声データから予め定められたクロスオーバー周波数の1オクターブ下までの第1音声データを抽出し、抽出した第1音声データに対して当該第1音声データの周波数を2倍強とする疑似倍音生成処理を行う。また、本実施形態では、上記処理部により、疑似倍音生成処理を行うことによって得られた第2音声データの振幅を予め定められた量だけ減少させる減少処理を行う。そして、本実施形態では、上記処理部により、上記減少処理を行うことによって得られた第3音声データを、デジタル音声データのクロスオーバー周波数以上の帯域に付加する処理(本実施形態では、高周波数帯域変換部36による音声処理)を行っている。従って、本実施形態によれば、より効果的にデジタル音声データによる再生音を改質することができる。
また、本実施形態では、上記処理部により、さらに、デジタル音声データの予め定められた周波数より高い高周波数帯域に対して、カートリッジとビニールレコード盤との共振周波数の成分を擬似的に付加する処理(本実施形態では、共振周波数信号付加部38による音声処理)を行っている。従って、本実施形態によれば、より効果的にデジタル音声データによる再生音を改質することができる。
また、本実施形態では、上記処理部により、さらに、デジタル音声データに対して、磁気テープにおいて生じるヒスノイズの成分を付加する処理(本実施形態では、ヒスノイズ付加部40による音声処理)を行っている。従って、本実施形態によれば、より効果的にデジタル音声データによる再生音を改質することができる。
また、本実施形態では、上記処理部により、さらに、デジタル音声データに対して、サブソニックの成分を付加する処理(本実施形態では、サブソニック帯域付加部42による音声処理)を行っている。従って、本実施形態によれば、より効果的にデジタル音声データによる再生音を改質することができる。
また、本実施形態では、上記処理部により、さらに、デジタル音声データにおける左右のチャネルの各デジタル音声データに対して、クロストークの成分を付加する処理(本実施形態では、クロストーク付加部44による音声処理)を行っている。従って、本実施形態によれば、より効果的にデジタル音声データによる再生音を改質することができる。
また、本実施形態では、上記処理部により、さらに、デジタル音声データに対して、予め定められた周波数より高い高周波数成分の強調を行う処理または当該高周波数成分の減衰を行う処理(本実施形態では、高音領域音量増減処理部46による音声処理)を行っている。従って、本実施形態によれば、より効果的にデジタル音声データによる再生音を改質することができる。
特に、本実施形態では、上記強調および上記減衰の何れの処理を適用するかを示す選択指示を受け付け、上記処理部により、受け付けた選択指示に応じて、上記強調および上記減衰の何れかの処理を選択的に行っている。従って、本実施形態によれば、上記強調および上記減衰の何れか所望の処理を行うことができる。
以上、本発明を、実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。発明の要旨を逸脱しない範囲で上記実施形態に多様な変更または改良を加えることができ、当該変更または改良を加えた形態も本発明の技術的範囲に含まれる。
また、上記の実施形態は、クレーム(請求項)にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。前述した実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜の組み合わせにより種々の発明を抽出できる。実施形態に示される全構成要件から幾つかの構成要件が削除されても、効果が得られる限りにおいて、この幾つかの構成要件が削除された構成が発明として抽出され得る。
例えば、上記実施形態では、音声処理装置10として、デジタル音声データを再生する機能と、デジタル音声データに対して予め設定された音声処理を加えた上で記録する機能とを有する音声再生・記録装置20を適用した場合について説明した。しかしながら、本発明はこれに限定されるものではなく、例えば、音声処理装置10として、デジタル音声データを再生する機能のみを有する音声再生装置を適用する形態としてもよい。また、音声処理装置10として、デジタル音声データに対して予め設定された音声処理を加えた上で記録する機能のみを有する音声記録装置を適用する形態としてもよい。
また、上記実施形態では、本発明に係る各種音声処理を、DSPを用いて実行する場合について説明したが、本発明はこれに限定されるものではない。例えば、ソフトウェアや、ハードウェアとソフトウェアとの組み合わせ、もしくはハードウェアのみで実行する形態としてもよい。
また、上記実施形態では、高音領域音量増減処理部46によって減衰処理及び強調処理の何れを実行するのかをユーザに指定させる場合について説明したが、本発明はこれに限定されるものではない。例えば、減衰処理及び強調処理の何れか一方を固定的に実行する形態としてもよい。
また、上記実施形態では、ダイナミックレンジ変換部32による音声処理を実行する場合には、必ずシフトダウン処理部30による処理を実行する場合について説明したが、本発明はこれに限定されるものではない。例えば、処理対象とするデジタル音声データやダイナミックレンジ変換部32によるダイナミックレンジの変更範囲等によっては、シフトダウン処理部30による処理を省略する形態としてもよい。
また、上記実施形態に係るDSP28に設けられた各音声処理部の全てが必須ではなく、各音声処理部の少なくとも1つが備えられていればよい。
また、上記実施形態では、ダイナミックレンジ変換部32、位相変換部34等の各部位における音声処理を部位毎に独立して実行する場合について説明したが、これに限定されるものではない。例えば、各部位におけるメモリ、FFT部、IFFT部、音声データ統合部等の同一名称の構成部については上記実施の形態より少ない数だけ用意し、複数の部位において共用する形態としてもよい。
また、上記実施形態では、ダイナミックレンジ変換部32、位相変換部34等の各部位における音声処理をデジタル信号処理によって行う場合について説明したが、これに限定されるものではない。例えば、各部位の少なくとも1つの部位についてアナログ信号処理で音声処理を行う形態としてもよい。
また、上記実施形態では、本発明のデジタル音声データとしてステレオの音声データを適用した場合について説明したが、これに限定されるものではない。例えば、モノラルの音声データや、3チャネル以上のマルチチャネルの音声データを本発明のデジタル音声データとして適用する形態としてもよい。
その他、上記実施形態で説明した音声再生・記録装置20の構成(図2参照。)は一例であり、本発明の主旨を逸脱しない範囲内において、不要な構成要素を削除したり、新たな構成要素を追加したりすることができることは言うまでもない。
さらに、上記実施形態で示した音声再生・記録処理の流れ(図22参照。)も一例であり、本発明の主旨を逸脱しない範囲内において、不要なステップを削除したり、新たなステップを追加したり、ステップの順序を入れ替えたりすることができることは言うまでもない。