JP2004163681A

JP2004163681A - 音声信号処理装置及び音声信号処理コンピュータプログラム

Info

Publication number: JP2004163681A
Application number: JP2002329774A
Authority: JP
Inventors: Kazuhito Okayama; 一仁岡山; Toshiharu Kuwaoka; 俊治桑岡; Isao Hijikata; 勲土方; Ryoichi Nagata; 良一永田; Haruyuki Mori; 晴之森
Original assignee: Victor Company of Japan Ltd
Current assignee: Victor Company of Japan Ltd
Priority date: 2002-11-13
Filing date: 2002-11-13
Publication date: 2004-06-10
Anticipated expiration: 2022-11-13
Also published as: US7424332B2; JP4224807B2; US20040098150A1

Abstract

【課題】半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止し、また、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調する。
【解決手段】係数補正テーブル（Ｂ）は複数の係数補正テーブルにより構成され、各係数補正テーブルには、３つの連続する各半波長におけるサンプル数Ｐｒｅ０、Ｐｒｅ１、Ｐｒｅ２に応じて＜歪み感＞、＜余韻感＞、＜解像感、定位＞の問題をそれぞれ防止するようにゲインテーブル（Ａ）の係数を補正するための係数補正値が記憶されている。半波長毎に係数補正テーブル内のテーブルが選択されて係数補正値がゲインテーブルの係数と乗算されてゲインテーブルの係数が補正されて係数テーブル（Ｃ）にセットされ、係数テーブルの係数により各サンプルが補正される。
【選択図】図４

Description

【０００１】
【発明の属する技術分野】
本発明は、デジタル音声信号の音質を改善する音声信号処理装置及び音声信号処理コンピュータプログラムに関する。
【０００２】
【従来の技術】
一般に、アナログ音声信号をＡ／Ｄ変換したＰＣＭ音声データは量子化誤差を含むので、そのままＤ／Ａ変換してスピーカにより再生しても原音を忠実に再生することができない。また、ＰＣＭ音声データを更に非可逆圧縮方式で圧縮すると、再生した音声は、更に原音から遠ざかる。
【０００３】
そこで、デジタル音声信号を原音に近づける従来の方法としては、例えば特許文献１及び後述する式（１）に示すように補正対象の現サンプル値と１サンプル前の値の差分を算出し、この成分に係数を乗算し、この乗算結果を現サンプル値に加算することにより現サンプルのゲインを補正している。この場合、特許文献１では、ＰＣＭ音声データの補正対象である頂点間（上限値から下限値まで、及び下限値から上限値までの半波長）のサンプル数を検出し、サンプル数に応じた係数をその半波長における各ＰＣＭ音声データに乗算して重み付けする方法が提案されている。
【０００４】
【特許文献１】
特開２００２−１６９５９７号公報
【０００５】
図５はその重み付け係数が記憶されたゲインテーブル（Ａ）を示し、ゲインテーブル（Ａ）にはあらかじめ、半波長におけるサンプル数に応じたその半波長における各ＰＣＭ音声データの係数が記憶されている。この各ＰＣＭ音声データの係数は、経験により半波長におけるサンプル数（ＦＳ）と各サンプル位置ｎに応じて最適になるようにあらかじめ固定で設定され、一例としては半波長におけるサンプル数（ゲインテーブル（Ａ）のアドレス）としては２〜１６個であり、それぞれの係数α（ゲインテーブル（Ａ）のデータ）はサンプル数と同じ数である。また、ゲインテーブル（Ａ）は２種類あり、波形が増加傾向にある場合（下限値から上限値までの半波長）のテーブルＡ’と、波形が減少傾向にある場合（上限値から下限値までの半波長）のテーブルＡ”により構成される。
【０００６】
また、特許文献１では、上記の重み付けを行う前に原データをアップサンプリングし、重み付け後にダウンサンプリングしている。この場合には、図５に示すゲインテーブル（Ａ）には、アップサンプリングしたＰＣＭ音声データに対する係数があらかじめ固定で設定され、４倍にアップサンプリングする場合のサンプル数（アドレス）は、図５に示す従来例と対応させると、サンプル数ＦＳ及びサンプル位置ｎの最大値は２〜１６×４個である。したがって、図５に示すテーブル（Ａ）よりゲインを細かに補正して音質を改善することができる。
【０００７】
【発明が解決しようとする課題】
しかしながら、上記従来例では、補正対象の半波長のみのサンプル数のみに基づいて固定の係数で一義的に重み付けするので、以下に示す＜歪み感＞、＜余韻感＞、＜解像感、定位＞、＜ハイサンプリング＞について問題点がある。また、補正対象の半波長のみのサンプル数のみに基づいて補正対象の現サンプル値と１サンプル前の値の差分に固定の係数で一義的に重み付けするので、同様な問題点がある。
【０００８】
＜歪み感＞
まず、半波長毎に比較的高いレベルで連続する音源に対しては過剰な重み付けが連続する状態（補正過多状態）となり、聴感上の歪み感として表れるという問題点がある。ここで、このような音源の例としては、ベル、チャイム、鉄琴、シンセサイザなどであって、半波長におけるサンプル数ＦＳが２〜３個（ｆ＝７ｋＨｚ〜１０ｋＨｚ）の繰り返し信号である。
【０００９】
＜余韻感＞
逆に、音源としてボーカルやピアノなどのほとんどのアコースティック楽器は、倍音を多く含むので、上記従来例のように補正対象の半波長のみのサンプル数のみに基づいて固定の係数で一義的に重み付けすると、重み付けが不足した状態となり、聴感上余韻が足りない感じとして表れるという問題点がある。ここで、このような音源は、半波長におけるサンプル数が６個以下（ｆ＝４ｋＨｚ以下）であって繰り返し信号でない音である。また、その波形は複雑であり、その繰り返し周波数は検出されにくい。
【００１０】
＜解像感、定位＞
さらに、繰り返し信号でない音源として、ハイハットやシンバルなどのリズム系楽器やシンセサイザで効果を付加した電子楽器系楽曲に対しては、解像感、定位の強調度が足りない感じとして表れるという問題点がある。ここで、このような音源は、半波長におけるサンプル数が３個以上（ｆ＝７ｋＨｚ以上）であって、その波形は複雑であり、その繰り返し周波数は検出されにくい。
【００１１】
＜ハイサンプリング＞
また、上記従来例では、アップサンプリングを行わない方法は、行う方法より音質改善効果が少ないという問題点がある。
【００１２】
本発明は上記従来例の問題点に鑑み、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる音声信号処理装置及び音声信号処理コンピュータプログラムを提供することを目的とする。
本発明はまた、アップサンプリングを行わなくても音質を改善することができる音声信号処理装置及び音声信号処理プログラムを提供することを目的とする。
本発明はまた、アップサンプリングを行えば更に音質を改善することができる音声信号処理装置及び音声信号処理コンピュータプログラムを提供することを目的とする。
【００１３】
【課題を解決するための手段】
本発明は上記目的を達成するために、補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて重み付け係数を補正するようにしたものである。
また、本発明は上記目的を達成するために、補正対象の半波長、及びそれより前の半波長におけるサンプル間の差分に応じて重み付け係数を補正するようにしたものである。
上記発明により、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる。また、アップサンプリングを行わなくても音質を改善することができ、アップサンプリングを行えば更に音質を改善することができる。
【００１４】
すなわち本発明によれば、デジタル音声信号の半波長における各サンプル数及びサンプル位置に応じた係数を記憶する第１のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて前記第１のテーブルの係数を補正するための係数補正値を記憶する第２のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数を検出し、その検出結果に応じて前記第１のテーブルの係数を前記第２のテーブルの係数補正値により補正する係数補正手段と、
前記係数補正手段により補正された係数により前記補正対象の半波長における各サンプル値を補正するサンプル補正手段とを、
備えた音声信号処理装置が提供される。
【００１５】
また本発明によれば、コンピュータに、
デジタル音声信号の半波長における各サンプル数及びサンプル位置に応じた係数を第１のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて前記第１のテーブルの係数を補正するための係数補正値を第２のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数を検出し、その検出結果に応じて前記第１のテーブルの係数を前記第２のテーブルの係数補正値により補正させる係数補正ステップと、
前記係数補正手段により補正された係数により前記補正対象の半波長における各サンプル値を補正させるサンプル補正ステップとを、
有する音声信号処理コンピュータプログラムが提供される。
【００１６】
また本発明によれば、デジタル音声信号の半波長における補正対象の現サンプルと１サンプル前の差分に対して乗算する係数を記憶する第１のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと１サンプル前の差分に応じて前記第１のテーブルの係数を補正するための係数補正値を記憶する第２のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと１サンプル前の差分を検出し、その検出結果に応じて前記第１のテーブルの係数を前記第２のテーブルの係数補正値により補正する係数補正手段と、
前記係数補正手段により補正された係数を前記補正対象の半波長における現サンプルと１サンプル前の差分に対して乗算し、乗算結果を現サンプルに加算して現サンプルを補正するサンプル補正手段とを、
備えた音声信号処理装置が提供される。
【００１７】
また本発明によれば、コンピュータに、
デジタル音声信号の半波長における補正対象の現サンプルと１サンプル前の差分に対して乗算する係数を第１のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと１サンプル前の差分に応じて前記第１のテーブルの係数を補正するための係数補正値を第２のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと１サンプル前の差分を検出し、その検出結果に応じて前記第１のテーブルの係数を前記第２のテーブルの係数補正値により補正させる係数補正ステップと、
前記係数補正手段により補正された係数を前記補正対象の半波長における現サンプルと１サンプル前の差分に対して乗算し、乗算結果を現サンプルに加算して現サンプルを補正させるサンプル補正ステップとを、
有する音声信号処理コンピュータプログラムが提供される。
【００１８】
【発明の実施の形態】
（第１の実施の形態）
第１の実施の形態を図１〜図９に基づき説明する。
この実施の形態では、本発明の音声信号処理装置はパーソナルコンピュータ（以下、ＰＣと呼ぶ）により実施される。このため、以下に説明するように、ＰＣ及びこのＰＣに接続された周辺装置は協働して、デジタル音声信号を取得し、この信号に本発明の音声信号処理を施し、処理した音声信号を再生する音声再生装置として機能する。また、本発明の音声信号処理方法は、上記ＰＣで実行されるソフトウェアにより実現される。なお、下記の構成によれば、携帯型プレーヤが周辺装置の１つとしてＰＣに接続されるので、ＰＣそれ自体ではなく、この携帯型プレーヤに、本発明に係る音声信号処理を実行させるようにしてもよい。
【００１９】
図１は、ＰＣ及びその周辺装置から成る音声再生装置を示す。最初に、この装置の接続関係の概要から説明する。この音声再生装置は、ＰＣ１と、このＰＣ１に接続されたディスプレイ２と、キーボード３と、半導体メモリ５を搭載した携帯型プレーヤ４と、アンプ７とＣＤ−ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｃＲｅａｄＯｎｌｙＭｅｍｏｒｙ）ドライブ９とを備える。携帯型プレーヤ４はヘッドホン６に接続される。アンプ７はスピーカ８に接続される。ＣＤ−ＲＯＭドライブ９には、記録媒体としてのＣＤ−ＲＯＭ１０が挿入される。
【００２０】
ＰＣ１は、図１に示すように、所定のプログラムに従って演算及び処理を行うＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１１を備え、このＣＰＵ１１がバスを介してメモリ１２（ＲＯＭ，ＲＡＭ）、ＨＤＤ（ＨａｒｄＤｉｓｃＤｒｉｖｅ）１３、及びインターフェース（Ｉ／Ｆ）１４に接続されている。このインターフェース１４は、バスを介してキーボードコントローラ１５、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）Ｉ／Ｆ１６（又はパラレルＩ／Ｆ、シリアルＩ／Ｆなど）、及び音声出力Ｉ／Ｆ１７に接続されている。このうち、キーボードコントローラ１５はキーボード３に接続される一方で、ＵＳＢＩ／Ｆ１６及び音声出力Ｉ／Ｆ１７は前述した携帯型プレーヤ４及びアンプ７にそれぞれ接続されている。なお、オペレータが操作する入力装置は、キーボード３の代わりに、タッチパネルで構成してもよい。その場合には、キーボードコントローラ１５はタッチパネルコントローラで置換される。
【００２１】
インターフェース１４は更に別のバスを介してディスプレイコントローラ１８及びＰＣＭＣＩＡ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒＭｅｍｏｒｙＣａｒｄＩｎｔｅｒｎａｔｉｏｎａｌＡｓｓｏｃｉａｔｉｏｎ）Ｉ／Ｆ１９に接続されている。このうち、ディスプレイコントローラ１８はディスプレイ２に接続され、ＰＣＭＣＩＡＩ／Ｆ１９はＣＤ−ＲＯＭドライブ９に接続されている。
【００２２】
なお、ＰＣＭＣＩＡＩ／Ｆ１９には、ＣＤ−ＲＯＭドライブ９の代わりに、ＣＤ−ＲＷ、ＤＶＤ−ＲＯＭ、ＤＶＤ−ＲＡＭ、ＤＶＤ−ＲＷ、ＭＯなどの記録媒体からデータを読み込むドライブを接続してもよい。これにより、ＣＤ−ＲＯＭ１０の代わりに、ＣＤ−ＲＷ、ＤＶＤ−ＲＯＭ、ＤＶＤ−ＲＡＭ、ＤＶＤ−ＲＷ、ＭＯなどの記録媒体を用いることができる。また、ＰＣＭＣＩＡＩ／Ｆ１９には、フラッシュメモリドライブ、無線Ｉ／Ｆカード、モデムカードなどが接続されることもある。
【００２３】
これにより、ＣＤ−ＲＯＭ１０などの蓄積媒体に記録されているＰＣＭフォーマットやＭＰ３フォーマットなどの音声データがＣＤ−ＲＯＭドライブ９から読み込まれ、直接もしくはいったん、ＨＤＤ１３に、例えばＷＡＶＥファイルやＭＰ３ファイルとして蓄積される。この蓄積ファイルは、音声出力Ｉ／Ｆ１７によりアナログ信号に変換されてからアンプ７に出力される。このアナログ信号はアンプ７で増幅されてスピーカ８から音声として出力される。なお、音声データは、インターネットなどから入手してＨＤＤ１３に蓄積しておいてもよい。
【００２４】
また、ＵＳＢＩ／Ｆ１６に接続された携帯型プレーヤ４には、半導体メモリ５が内蔵もしくは取り出し可能に設けられている。これにより、ＰＣ１のＨＤＤ１３などに蓄積されているＭＰ３ファイルの音声データは、携帯型プレーヤ４の半導体メモリ５に転送され、携帯型プレーヤ４で再生可能になる。この携帯型プレーヤ４には、図示しないが、ＣＰＵ及びＭＰ３などの音声データの再生プログラムが記録されているＲＯＭなどが内蔵されており、これにより、半導体メモリ５に記録された音声データを再生することができる。この携帯型プレーヤ４の音声データは、通常ヘッドホン６を介して再生される。
【００２５】
なお、半導体メモリ５が携帯型プレーヤ４に着脱自在に挿入可能な場合は、ＰＣ１に設けられた半導体メモリドライブ（図示せず）に直接挿入して、このドライブを介して半導体メモリ５に音声データを転送させることができる。この場合、その半導体メモリ５を携帯型プレーヤ４に挿入して音声を再生することができる。また、携帯型プレーヤ４が録音可能な構成を有している場合、携帯型プレーヤ４はＰＣ１に接続することなく、録音した音声データを再生するようにしてもよい。
【００２６】
このようなＰＣ１もしくは携帯型プレーヤ４において、音声データは図２に示すような手順により再生される。図２において、ＨＤＤ１３、ＣＤ−ＲＯＭ（又はＣＤ−ＲＷ、ＤＶＤ−ＲＯＭ、ＤＶＤ−ＲＡＭ、ＤＶＤ−ＲＷ、ＭＯなど）３、半導体メモリ５などの蓄積媒体２１に記録されている音声データは、ＰＣ１もしくは携帯型プレーヤ４のＩ／Ｆ２２を介して読み出され、ＭＰ３などの圧縮されている音声データが読み出された場合は、デコーダ２３によりデコードされてＰＣＭデータが出力される。このＰＣＭデータは、本発明の主要部分である音質改善手段２４に供給されて音質改善が行われてからＤ／Ａ変換回路２５に出力され、アナログ信号として、アンプ７とスピーカ８やヘッドホン６などの音声再生手段２６に出力されて再生される。
【００２７】
次に、本発明の主要部分である音質改善手段２４における具体的な改善方法について図３及び図４と共に説明する。なお、この音質改善手段２４は、ＨＤＤ１３又は半導体メモリ（ＲＯＭ）５に記憶されてＣＰＵ１１で動作する処理プログラムの機能として実現され、ＣＰＵ１１として動作周波数８００ＭＨｚの３２ｂｉｔＲＩＳＣプロセッサで実時間出力可能な処理プログラムを実施の形態として説明する。また、処理にあたっては、入力波形データ及び処理に必要な各種フラグやカウント値などのデータがメモリ（ＲＡＭ）１２に一時的に記憶される。
【００２８】
まず、図３では示されていないがデコーダ２３から出力されたサンプリング周波数ｆｓのリニアＰＣＭデータのビット数が、音質改善手段２４が処理するビット数のデータＦｓ２に変換するスケーリング処理を行う。なお、ビット数が同じであればこのスケーリング処理は行わない。このデータＦｓ２は極性検出回路３３に供給され、データＦｓ２の波形（横軸に時間、縦軸に音の大きさをとってグラフ化したときの音声波形）を監視して、上限値から下限値、及び下限値から上限値までの補正対象の半波長におけるサンプル数をカウントし、Ｆｓ２ＣＯＵＮＴとしてテーブル生成回路３５に出力する。
【００２９】
テーブル生成回路３５は補正対象の半波長におけるサンプル数Ｐｒｅ０と、その前の半波長におけるサンプル数Ｐｒｅ１と、更にその前の半波長におけるサンプル数Ｐｒｅ２に応じて、データＦｓ２に重み付けする係数を適応的に変化させたＴａｂｌｅＤａｔａ（以下に示す係数テーブル（Ｃ））を出力データ生成回路３６に出力する。テーブル生成回路３５には図４に詳しく示すようにゲインバンクテーブル３５ａと、ゲインテーブル（Ａ）と、係数補正テーブル（Ｂ）と、係数テーブル（Ｃ）が設けられている（図中は単にテーブルと示す）。ゲインテーブル（Ａ）には図５に詳しく示すように、従来例と同様に半波長におけるサンプル数に応じて個々のサンプル位置ｎ＝２〜１６の係数が一義的に決められて記憶される。また、ゲインテーブル（Ａ）は２種類あり、波形が増加傾向にある場合（下限値から上限値までの半波長）のテーブルＡ’と、波形が減少傾向にある場合（上限値から下限値までの半波長）のテーブルＡ”により構成される。
【００３０】
係数補正テーブル（Ｂ）は複数の係数補正テーブルにより構成され、各係数補正テーブルには、上記の３つの連続する各半波長におけるサンプル数Ｐｒｅ０、Ｐｒｅ１、Ｐｒｅ２に応じて＜歪み感＞、＜余韻感＞、＜解像感、定位＞の問題をそれぞれ防止するようにゲインテーブル（Ａ）の係数を補正するための係数補正値が記憶されている。複数の係数補正テーブル（Ｂ）の一例として、図６（ａ）は解像度を強調するためのテーブルを示し、図６（ｂ）は余韻感を強調するためのテーブルを示している。
ゲインバンクテーブル３５ａには、図７、図８に示すように上記の３つの連続する各半波長におけるサンプル数Ｐｒｅ０、Ｐｒｅ１、Ｐｒｅ２に応じて係数補正テーブル（Ｂ）内のテーブルを選択するためのデータがあらかじめ記憶されている。そして、半波長毎に係数補正テーブル（Ｂ）内のテーブルが選択されてその係数補正値がゲインテーブル（Ａ）の係数と乗算されてゲインテーブル（Ａ）の係数が補正される。乗算結果は係数テーブル（Ｃ）にセットされ、係数テーブル（Ｃ）の係数データが出力データ生成回路３６に印加される。ここで、係数テーブル（Ｃ）はゲインテーブル（Ａ）と同様に、データＦｓ２が増加傾向にある場合のテーブルＣ’と、減少傾向にある場合のテーブルＣ”により構成されている（後述）。
【００３１】
また、データＦｓ２は差分データ算出回路（差分データ算出手段）３４にも供給され、現在のデータＦｓ２と１Ｆｓ前のデータ（Ｆｓ２’とする）との差分データが算出されてＦｓ２Ｄｉｆｆｅｒｅｎｃｅとして出力される。なお、差分データ算出回路３４には１以上のサンプリングデータを記憶しておく機能を有しており、記憶してある前のサンプリングデータＦｓ２’から現在のデータＦｓ２を減算して、その音の大きさの差分データ（Ｆｓ２Ｄｉｆｆｅｒｅｎｃｅ）を出力データ生成回路３６に出力している。
【００３２】
そして、出力データ生成回路（出力データ生成手段）３６には、データＦｓ２と、差分データ算出回路３４から出力されるＦｓ２Ｄｉｆｆｅｒｅｎｃｅと、係数テーブル（Ｃ）から出力される補正データ（ＴａｂｌｅＤａｔａ）とが供給され、元々の信号成分であるＦｓ２に重み付けされた差分データを加算することにより、補正されたＰＣＭ信号Ｆｓ３を生成して出力することができる。この動作を式で示すと式（１）に示すようになる。
【００３３】
Ｆｓ３＝Ｆｓ２＋（Ｆｓ２Ｄｉｆｆｅｒｅｎｃｅ ×
補正データＴａｂｌｅＤａｔａ） …（１）
【００３４】
上記した音声処理装置の音声処理方法について、その主要部である音質改善手段２４の動作について図９及び図１０に示すフローチャートを参照しながら、より詳細に説明する。図９に示すフローチャートにおいて、差分データ算出回路３４では、供給されたデータＦｓ２（ＰＣＭ（Ｚ^０））を１サンプル前のデータＦｓ２であるＰＣＭ（Ｚ^−１）と比較する（ステップ１０１）。供給されたデータＰＣＭ（Ｚ^０）の方が大きければ（ステップ１０１→Ｙｅｓ）、データが増加方向にあるので、供給されたデータＰＣＭ（Ｚ^０）から１サンプル前のデータＰＣＭ（Ｚ^−１）を減算して差分データＰＣＭＲＥＦ（Ｚ^０）を求めるとともに極性データＰＯＬＡ（Ｚ^０）に増加を示すＴＲＵＥを格納する（ステップ１０２）。
【００３５】
他方、供給されたデータＰＣＭ（Ｚ^０）の方が小さければ（ステップ１０１→Ｎｏ）、データが減少方向にあるので１サンプル前のデータＰＣＭ（Ｚ^−１）から供給されたデータＰＣＭ（Ｚ^０）を減算して差分データＰＣＭＲＥＦ（Ｚ^０）を求めるとともに極性データＰＯＬＡ（Ｚ^０）に減少を示すＦＡＬＳＥを格納する（ステップ１０３）。この差分データＰＣＭＲＥＦ（Ｚ^０）は、（１）式ではＦｓ２Ｄｉｆｆｅｒｅｎｃｅとして表記されたデータである。
【００３６】
極性検出回路３３では、まず、半波長においてカウントするサンプル数の最大値ＦＳＵＰＭＡＸ＝１６、最小値ＦＳＵＰＭＩＮ＝２とする（ステップ１０４−１）。次いで、１サンプル前の極性データＰＯＬＡ（Ｚ^−１）と算出した極性データＰＯＬＡ（Ｚ^０）とを比較して、１サンプル前のデータに対して極性が変化しているかどうかを判断する（ステップ１０４−２）。極性データが同じであり、極性が変化していないと判断した場合には（ステップ１０４−２→Ｙｅｓ）、データの波形の傾きが変化していないことになるので、次サンプルの処理のためにデータＰＣＭ（Ｚ^０）及び極性データＰＯＬＡ（Ｚ^０）を格納した後（ステップ１０５）、サンプル数でカウントしている波形頂点間隔ＦＳＣＯＵＮＴの値に１を加算して、出力データ生成回路３６のオン／オフフラグＦＳＵＰＳＷをオフ（ＦＡＬＳＥ）にしておく（ステップ１０６）。このＦＳＣＯＵＮＴは、前記（１）式ではＦｓ２ＣＯＵＮＴとして表記された値である。
【００３７】
他方、ステップ１０４−２において極性データが異なる場合は（ステップ１０４−２→Ｎｏ）、極性が変化しており、データの波形の傾きが変化していることになるので、次サンプルの処理のためにデータＰＣＭ（Ｚ^０）及び極性データＰＯＬＡ（Ｚ^０）を格納した後（ステップ１０７）、実時間処理可能な最大処理Ｆｓ値を超えていないかどうかの判断を行う（ステップ１０８）。
【００３８】
つまり、ステップ１０８では、波形頂点間隔ＦＳＣＯＵＮＴの値が２よりも大きく実時間処理可能な最大処理Ｆｓ値であるＦＳＴＢＬＭＡＸ以下の範囲内にあるかどうかを判断し、範囲内にあれば（ステップ１０８→Ｙｅｓ）、波形頂点間隔ＦＳＣＯＵＮＴの値に１を加算して、出力データ生成回路３６のオン／オフフラグＦＳＵＰＳＷをオン（ＴＲＵＥ）にする（ステップ１０９）。他方、波形頂点間隔ＦＳＣＯＵＮＴの値が範囲外にある場合は（ステップ１０８→Ｎｏ）、各種の値を初期化するとともに出力データ生成回路３６のオン／オフフラグＦＳＵＰＳＷをオフ（ＦＡＬＳＥ）にする異常処理を行う（ステップ１１０）。
【００３９】
そして、ステップ１１１−１において出力データ生成回路３６のオン／オフフラグＦＳＵＰＳＷがＴＲＵＥの場合には（ステップ１１１−１→Ｙｅｓ）、
ＧａｉｎＡＤＪＨｉｓｔ（Ｚ^−２）＝ＧａｉｎＡＤＪＨｉｓｔ（Ｚ^−１）
ＧａｉｎＡＤＪＨｉｓｔ（Ｚ^−１）＝ＧａｉｎＡＤＪＨｉｓｔ（Ｚ^−０）
Ｐｒｅ２＝ＧａｉｎＡＤＪＨｉｓｔ（Ｚ^−２）
Ｐｒｅ１＝ＧａｉｎＡＤＪＨｉｓｔ（Ｚ^−１）
にセットし（ステップ１１１−２）、出力データ生成回路３６による処理を行うようにする。他方、出力データ生成回路３６のオン／オフフラグＦＳＵＰＳＷがＦＡＬＳＥの場合には（ステップ１１１−１→Ｎｏ）、出力データ生成回路３６による処理をキャンセルする（図１０参照）。
【００４０】
次に図１０に示すフローチャートにおいて、まず、出力データ生成回路３６では、波形頂点間隔ＦＳＣＯＵＮＴの値から１を減算した値をＢＰに格納する（ステップ１１２−１）。次いでテーブル生成回路３５ではステップ１１２−２〜１１２−４において係数テーブル（Ｃ）（＝Ｃ’＋Ｃ”）を生成する。この処理では、まず、
ＧａｉｎＡＤＪＨｉｓｔ（Ｚ^−０）＝ＢＰ
ｎ＝ＢＰ
Ｐｒｅ０＝ＧａｉｎＡＤＪＨｉｓｔ（Ｚ^−０）
係数補正テーブル（Ｂ）（Ｚ^−ｎ）
＝ゲインバンクテーブル（Ｐｒｅ２，Ｐｒｅ１，Ｐｒｅ０）
にセットする（ステップ１１２−２）。
【００４１】
次いでＰＯＬＡ（Ｚ^−０）＝ＴＲＵＥか否かを判断する（ステップ１１２−３）。そして、Ｙｅｓの場合にはデータＦｓ２が増加傾向にある場合のテーブルＣ’を
係数テーブル（Ｃ’）
＝ゲインテーブル（Ａ’）（Ｚ^−ｎ）
×係数補正テーブル（Ｂ）（Ｚ^−ｎ）
により算出し（ステップ１１２−４）、他方、Ｎｏの場合にはデータＦｓ２が減少傾向にある場合のテーブルＣ”を
係数テーブル（Ｃ”）
＝ゲインテーブル（Ａ”）（Ｚ^−ｎ）
×係数補正テーブル（Ｂ）（Ｚ^−ｎ）
により算出する（ステップ１１２−５）。次いでＦＳＵＰＭＩＮ≦ｎ≦ＦＳＵＰＭＡＸか否かを判断し（ステップ１１２−６）、Ｙｅｓであればステップ１１２−３に戻り、他方、Ｎｏであればステップ１１３に進む。
【００４２】
出力データ生成回路３６では、まず、ステップ１１３においてＢＰの値をｎとする。このとき、ＢＰ及びｎの値は、データ波形の頂点から頂点までのサンプル数を示す値と一致する。そして、極性データＰＯＬＡ（Ｚ^０）が増加方向（ＴＲＵＥ）を示している場合には（ステップ１１４→Ｙｅｓ）、データＦｓ２が増加傾向にある場合の係数テーブルＣ’を用いて、サンプルデータ位置を示すｎの値と波形頂点間隔ＦＳＣＯＵＮＴの値とで参照し、係数テーブルＣ’の係数を差分データＰＣＭＲＥＦ（Ｚ^−ｎ）に掛けた値を補正値として、ｎ番目のサンプルデータＰＣＭ（Ｚ^−ｎ）に加算して補正出力データとして出力する（ステップ１１５）。そして、ｎの値を１ずつ減算しながらｎ＝０になるまで繰り返し補正を行ってデータを出力する（ステップ１１６→Ｙｅｓ→ステップ１１７）。
【００４３】
また、極性データＰＯＬＡ（Ｚ^０）が減少方向（ＦＡＬＳＥ）を示している場合には（ステップ１１４→Ｎｏ）、減少傾向にある場合のテーブルＣ”の係数を差分データＰＣＭＲＥＦ（Ｚ^−ｎ）に掛けた値を補正値として、ｎ番目のサンプルデータＰＣＭ（Ｚ^−ｎ）に加算して補正出力データとして出力する（ステップ１１８）。そして、ｎの値を１ずつ減算しながらｎ＝０になるまで繰り返し補正を行ってデータを出力する（ステップ１１９→Ｙｅｓ→ステップ１２０）。
【００４４】
ステップ１１６又はステップ１１９において、ｎ＝０になると出力データ生成回路３６での処理は終了する。そして、順次、出力データ生成回路３６から出力されてくる補正出力データは、再スケーリング処理が施され、Ｄ／Ａ変換回路２５へ出力される。
【００４５】
以上のようにして音声データの補正を行う際の具体例を図１１に示す。また係数テーブルＣ’、Ｃ”の一部をそれぞれ図１２（ａ）、（ｂ）に示す。図１２には波形頂点間隔が３〜６（２Ｆｓ〜５Ｆｓ）の各場合についてのデータ波形例とその補正個所、補正値（ａ〜ｄ）と係数テーブル（Ｃ）の値（α〜θ）、補正後の出力データ例を表したものである。
【００４６】
波形頂点間隔が３（２Ｆｓ）の場合を例にして説明すると、データ波形が増加している場合は図１２（ａ）に示すテーブルＣ’を使用する。そして、データ波形が増加している部分の波形頂点間隔をカウントすると（Ｃ→Ｂ→Ａ）となり、ＦＳＣＯＵＮＴ＝３となる。また、ｎ＝ＢＰ＝ＦＳＣＯＵＮＴ−１＝２となる。そして、ｎ＝２で波形頂点間隔が３のときのテーブルＣ’の値は１／４であり、データＢの補正値は図８中、ａで示す式から導かれ、出力ＰＣＭデータは（Ｂ＋ａ）となる。また、ｎ＝１で波形頂点間隔が３のときのテーブルＣ’の値は０であるので波形データＣの補正値も０になり、出力ＰＣＭデータはＣのままとなる。
【００４７】
同様に、データ波形が減少している場合は図１２（ｂ）に示すテーブルＣ”を使用する。そして、データ波形が減少している部分の波形頂点間隔をカウントすると（Ｅ→Ｄ→Ｃ）となり、ＦＳＣＯＵＮＴ＝３、ｎ＝ＢＰ＝２となる。そして、ｎ＝２で波形頂点間隔が３のときのテーブルＣ”の値は−１／４（＝β）であり、データＤの補正値は図１１中、ｂで示す式から導かれ、出力ＰＣＭデータは（Ｄ＋ｂ）となる。なお、テーブルＣ”から得た値が−１／４であるので、実際にはＰＣＭデータＤから補正値を減算して出力ＰＣＭデータを得ることになる。また、ｎ＝１で波形頂点間隔が３のときの補正テーブルＣ”の値は０であるので波形データＡの補正値も０になり、出力ＰＣＭデータはＡのままとなる。
【００４８】
同様に、ＦＳＣＯＵＮＴにより波形頂点間隔を検出することができるので、波形が増加方向にあるときにはテーブルＣ’を用い、減少方向にあるときにはテーブルＣ”を用いて、ＦＳＣＯＵＮＴとそのときのｎの値から補正テーブルデータを得、これと差分データとを用いて波形データを補正することにより、音質の向上を果たすことができる。
【００４９】
そして、上記実例では、３２ｂｉｔＲＩＳＣプロセッサを用いて実時間処理することを想定しており、より高速なＣＰＵを使用する場合は、より高次のＦＳＣＯＵＮＴまで使用したり、補正テーブルデータとして桁数の大きい小数を用いて補正値を計算したりすることにより、より高音質な出力データを得ることも可能になる。なお、ＦＳＣＯＵＮＴ＝７（６Ｆｓ）とした場合には、補正個所が波形の増加方向と減少方向でそれぞれ１箇所ずつ増えるので、補正データもその分増えることになる。
【００５０】
以上説明したように、ゲインテーブル（Ａ）には、補正対象の半波長のみのサンプル数のみに基づく固定の係数を記憶し、係数補正テーブル（Ｂ）には、前述した＜歪み感＞、＜余韻感＞、＜解像感、定位＞の問題を防止するような係数補正値を記憶して、これによりゲインテーブル（Ａ）を補正することにより、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる。また、アップサンプリングを行わなくても音質を改善することができ、アップサンプリングを行えば更に音質を改善することができる。
【００５１】
また、差分データ算出回路３４が補正対象の半波長、及びそれより前の半波長における各サンプル間の差分を検出して、＜歪み感＞、＜余韻感＞、＜解像感、定位＞の問題を防止するような係数補正値によりゲインテーブル（Ａ）を補正することにより、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる。また、アップサンプリングを行わなくても音質を改善することができ、アップサンプリングを行えば更に音質を改善することができる。
【００５２】
ここで、上述した実施の形態では、処理内容をブロックに示して説明したが、実際にはソフトウェアによる処理が可能であり、本願発明を実施する際に新たなハードウェアや部品を必要としないので、本発明を適用可能な製品の種類が広がり、またコスト的にも優位である。
【００５３】
さらに、サンプリングレートが低く、低ビットレートのＰＣＭ音声データを高音質化することができるので、記憶容量に制限のある半導体メモリに音声デ−タを記録する場合や、データ転送速度に制限のあるネットワークを介した音楽配信などにおいても、非常に利用価値の高い音質改善技術を提供することができる。
【００５４】
さらに、ＨｉＦｉオーディオの分野だけでなく、更に低ビットレートで音声信号が利用される携帯電話機、ＰＨＳ、インターネット電話、半導体音声レコーダなどの各種の再生装置に本願発明を適用することにより、再生音声の明瞭度を向上させることができるという効果がある。
【００５５】
また、本発明に係る音質改善のための音声信号処理は、上述したように、非圧縮状態のＰＣＭ（リニアＰＣＭ）データに施される。このため、この音声信号処理はあらゆるフォーマットのデータに適用可能である。圧縮されているＰＣＭデータはデコードした状態で、この音声信号処理に付される。非圧縮のＰＣＭデータはそのまま、この音声信号処理に付される。したがって、重み付け及び処理帯域のパラメータを適宜変更することで、音質の劣化状態に応じた最適な音質向上効果が得られる。非圧縮データのファイル形式としては、ＭＰ３、ＷＭＡ、ＡＡＣ、ＲｅａｌＡｕｄｉｏなどの種々のものがあり、これらファイル形式の音声データにも、本発明の音声信号処理が適用可能である。
【００５６】
【発明の効果】
以上説明したように本発明によれば、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる。また、アップサンプリングを行わなくても音質を改善することができ、アップサンプリングを行えば更に音質を改善することができる。
【図面の簡単な説明】
【図１】本発明の音声信号処理装置を機能的に有する、第１の実施の形態に係る音声再生装置の例を示す構成図である。
【図２】第１の実施の形態における音声再生装置の再生系の例を示す構成図である。
【図３】第１の実施の形態で実施される音質改善のための音声信号処理を説明するブロックである。
【図４】図３のテーブル作成回路のテーブル及び処理を説明するための図である。
【図５】図４のゲインテーブルの構成例を示す図である。
【図６】図４の係数補正テーブルの構成例を示す図である。
【図７】図４のゲインバンクテーブルの構成例を示す図である。
【図８】図４のゲインバンクテーブルの構成例を示す図である。
【図９】第１の実施の形態で実行される音声信号処理の一例を図１０と共に示すフローチャート図である。
【図１０】第１の実施の形態で実行される音声信号処理の一例を図９と共に示すフローチャート図である。
【図１１】第１の実施の形態で実行される音声信号処理の変換アルゴリズムを説明するための図である。
【図１２】図４の係数テーブルの係数を説明するための図である。
【符号の説明】
３３極性検出回路
３４差分データ算出回路
３５テーブル生成回路（係数補正手段）
３５ａゲインバンクテーブル
３６出力データ生成回路（サンプル補正手段）
Ａゲインテーブル（第１のテーブル）
Ｂ係数補正テーブル（第２のテーブル）
Ｃ係数テーブル

Claims

デジタル音声信号の半波長における各サンプル数及びサンプル位置に応じた係数を記憶する第１のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて前記第１のテーブルの係数を補正するための係数補正値を記憶する第２のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数を検出し、その検出結果に応じて前記第１のテーブルの係数を前記第２のテーブルの係数補正値により補正する係数補正手段と、
前記係数補正手段により補正された係数により前記補正対象の半波長における各サンプル値を補正するサンプル補正手段とを、
備えた音声信号処理装置。
コンピュータに、
デジタル音声信号の半波長における各サンプル数及びサンプル位置に応じた係数を第１のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて前記第１のテーブルの係数を補正するための係数補正値を第２のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数を検出し、その検出結果に応じて前記第１のテーブルの係数を前記第２のテーブルの係数補正値により補正させる係数補正ステップと、
前記係数補正手段により補正された係数により前記補正対象の半波長における各サンプル値を補正させるサンプル補正ステップとを、
有する音声信号処理コンピュータプログラム。
デジタル音声信号の半波長における補正対象の現サンプルと１サンプル前の差分に対して乗算する係数を記憶する第１のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと１サンプル前の差分に応じて前記第１のテーブルの係数を補正するための係数補正値を記憶する第２のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと１サンプル前の差分を検出し、その検出結果に応じて前記第１のテーブルの係数を前記第２のテーブルの係数補正値により補正する係数補正手段と、
前記係数補正手段により補正された係数を前記補正対象の半波長における現サンプルと１サンプル前の差分に対して乗算し、乗算結果を現サンプルに加算して現サンプルを補正するサンプル補正手段とを、
備えた音声信号処理装置。
コンピュータに、
デジタル音声信号の半波長における補正対象の現サンプルと１サンプル前の差分に対して乗算する係数を第１のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと１サンプル前の差分に応じて前記第１のテーブルの係数を補正するための係数補正値を第２のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと１サンプル前の差分を検出し、その検出結果に応じて前記第１のテーブルの係数を前記第２のテーブルの係数補正値により補正させる係数補正ステップと、
前記係数補正手段により補正された係数を前記補正対象の半波長における現サンプルと１サンプル前の差分に対して乗算し、乗算結果を現サンプルに加算して現サンプルを補正させるサンプル補正ステップとを、
有する音声信号処理コンピュータプログラム。