JP2004163681A - 音声信号処理装置及び音声信号処理コンピュータプログラム - Google Patents

音声信号処理装置及び音声信号処理コンピュータプログラム Download PDF

Info

Publication number
JP2004163681A
JP2004163681A JP2002329774A JP2002329774A JP2004163681A JP 2004163681 A JP2004163681 A JP 2004163681A JP 2002329774 A JP2002329774 A JP 2002329774A JP 2002329774 A JP2002329774 A JP 2002329774A JP 2004163681 A JP2004163681 A JP 2004163681A
Authority
JP
Japan
Prior art keywords
sample
coefficient
wavelength
corrected
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002329774A
Other languages
English (en)
Other versions
JP4224807B2 (ja
Inventor
Kazuhito Okayama
一仁 岡山
Toshiharu Kuwaoka
俊治 桑岡
Isao Hijikata
勲 土方
Ryoichi Nagata
良一 永田
Haruyuki Mori
晴之 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2002329774A priority Critical patent/JP4224807B2/ja
Priority to US10/703,588 priority patent/US7424332B2/en
Publication of JP2004163681A publication Critical patent/JP2004163681A/ja
Application granted granted Critical
Publication of JP4224807B2 publication Critical patent/JP4224807B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10037A/D conversion, D/A conversion, sampling, slicing and digital quantisation or adjusting parameters thereof
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止し、また、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調する。
【解決手段】係数補正テーブル(B)は複数の係数補正テーブルにより構成され、各係数補正テーブルには、3つの連続する各半波長におけるサンプル数Pre0、Pre1、Pre2に応じて<歪み感>、<余韻感>、<解像感、定位>の問題をそれぞれ防止するようにゲインテーブル(A)の係数を補正するための係数補正値が記憶されている。半波長毎に係数補正テーブル内のテーブルが選択されて係数補正値がゲインテーブルの係数と乗算されてゲインテーブルの係数が補正されて係数テーブル(C)にセットされ、係数テーブルの係数により各サンプルが補正される。
【選択図】 図4

Description

【0001】
【発明の属する技術分野】
本発明は、デジタル音声信号の音質を改善する音声信号処理装置及び音声信号処理コンピュータプログラムに関する。
【0002】
【従来の技術】
一般に、アナログ音声信号をA/D変換したPCM音声データは量子化誤差を含むので、そのままD/A変換してスピーカにより再生しても原音を忠実に再生することができない。また、PCM音声データを更に非可逆圧縮方式で圧縮すると、再生した音声は、更に原音から遠ざかる。
【0003】
そこで、デジタル音声信号を原音に近づける従来の方法としては、例えば特許文献1及び後述する式(1)に示すように補正対象の現サンプル値と1サンプル前の値の差分を算出し、この成分に係数を乗算し、この乗算結果を現サンプル値に加算することにより現サンプルのゲインを補正している。この場合、特許文献1では、PCM音声データの補正対象である頂点間(上限値から下限値まで、及び下限値から上限値までの半波長)のサンプル数を検出し、サンプル数に応じた係数をその半波長における各PCM音声データに乗算して重み付けする方法が提案されている。
【0004】
【特許文献1】
特開2002−169597号公報
【0005】
図5はその重み付け係数が記憶されたゲインテーブル(A)を示し、ゲインテーブル(A)にはあらかじめ、半波長におけるサンプル数に応じたその半波長における各PCM音声データの係数が記憶されている。この各PCM音声データの係数は、経験により半波長におけるサンプル数(FS)と各サンプル位置nに応じて最適になるようにあらかじめ固定で設定され、一例としては半波長におけるサンプル数(ゲインテーブル(A)のアドレス)としては2〜16個であり、それぞれの係数α(ゲインテーブル(A)のデータ)はサンプル数と同じ数である。また、ゲインテーブル(A)は2種類あり、波形が増加傾向にある場合(下限値から上限値までの半波長)のテーブルA’と、波形が減少傾向にある場合(上限値から下限値までの半波長)のテーブルA”により構成される。
【0006】
また、特許文献1では、上記の重み付けを行う前に原データをアップサンプリングし、重み付け後にダウンサンプリングしている。この場合には、図5に示すゲインテーブル(A)には、アップサンプリングしたPCM音声データに対する係数があらかじめ固定で設定され、4倍にアップサンプリングする場合のサンプル数(アドレス)は、図5に示す従来例と対応させると、サンプル数FS及びサンプル位置nの最大値は2〜16×4個である。したがって、図5に示すテーブル(A)よりゲインを細かに補正して音質を改善することができる。
【0007】
【発明が解決しようとする課題】
しかしながら、上記従来例では、補正対象の半波長のみのサンプル数のみに基づいて固定の係数で一義的に重み付けするので、以下に示す<歪み感>、<余韻感>、<解像感、定位>、<ハイサンプリング>について問題点がある。また、補正対象の半波長のみのサンプル数のみに基づいて補正対象の現サンプル値と1サンプル前の値の差分に固定の係数で一義的に重み付けするので、同様な問題点がある。
【0008】
<歪み感>
まず、半波長毎に比較的高いレベルで連続する音源に対しては過剰な重み付けが連続する状態(補正過多状態)となり、聴感上の歪み感として表れるという問題点がある。ここで、このような音源の例としては、ベル、チャイム、鉄琴、シンセサイザなどであって、半波長におけるサンプル数FSが2〜3個(f=7kHz〜10kHz)の繰り返し信号である。
【0009】
<余韻感>
逆に、音源としてボーカルやピアノなどのほとんどのアコースティック楽器は、倍音を多く含むので、上記従来例のように補正対象の半波長のみのサンプル数のみに基づいて固定の係数で一義的に重み付けすると、重み付けが不足した状態となり、聴感上余韻が足りない感じとして表れるという問題点がある。ここで、このような音源は、半波長におけるサンプル数が6個以下(f=4kHz以下)であって繰り返し信号でない音である。また、その波形は複雑であり、その繰り返し周波数は検出されにくい。
【0010】
<解像感、定位>
さらに、繰り返し信号でない音源として、ハイハットやシンバルなどのリズム系楽器やシンセサイザで効果を付加した電子楽器系楽曲に対しては、解像感、定位の強調度が足りない感じとして表れるという問題点がある。ここで、このような音源は、半波長におけるサンプル数が3個以上(f=7kHz以上)であって、その波形は複雑であり、その繰り返し周波数は検出されにくい。
【0011】
<ハイサンプリング>
また、上記従来例では、アップサンプリングを行わない方法は、行う方法より音質改善効果が少ないという問題点がある。
【0012】
本発明は上記従来例の問題点に鑑み、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる音声信号処理装置及び音声信号処理コンピュータプログラムを提供することを目的とする。
本発明はまた、アップサンプリングを行わなくても音質を改善することができる音声信号処理装置及び音声信号処理プログラムを提供することを目的とする。
本発明はまた、アップサンプリングを行えば更に音質を改善することができる音声信号処理装置及び音声信号処理コンピュータプログラムを提供することを目的とする。
【0013】
【課題を解決するための手段】
本発明は上記目的を達成するために、補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて重み付け係数を補正するようにしたものである。
また、本発明は上記目的を達成するために、補正対象の半波長、及びそれより前の半波長におけるサンプル間の差分に応じて重み付け係数を補正するようにしたものである。
上記発明により、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる。また、アップサンプリングを行わなくても音質を改善することができ、アップサンプリングを行えば更に音質を改善することができる。
【0014】
すなわち本発明によれば、デジタル音声信号の半波長における各サンプル数及びサンプル位置に応じた係数を記憶する第1のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて前記第1のテーブルの係数を補正するための係数補正値を記憶する第2のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正する係数補正手段と、
前記係数補正手段により補正された係数により前記補正対象の半波長における各サンプル値を補正するサンプル補正手段とを、
備えた音声信号処理装置が提供される。
【0015】
また本発明によれば、コンピュータに、
デジタル音声信号の半波長における各サンプル数及びサンプル位置に応じた係数を第1のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて前記第1のテーブルの係数を補正するための係数補正値を第2のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正させる係数補正ステップと、
前記係数補正手段により補正された係数により前記補正対象の半波長における各サンプル値を補正させるサンプル補正ステップとを、
有する音声信号処理コンピュータプログラムが提供される。
【0016】
また本発明によれば、デジタル音声信号の半波長における補正対象の現サンプルと1サンプル前の差分に対して乗算する係数を記憶する第1のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分に応じて前記第1のテーブルの係数を補正するための係数補正値を記憶する第2のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正する係数補正手段と、
前記係数補正手段により補正された係数を前記補正対象の半波長における現サンプルと1サンプル前の差分に対して乗算し、乗算結果を現サンプルに加算して現サンプルを補正するサンプル補正手段とを、
備えた音声信号処理装置が提供される。
【0017】
また本発明によれば、コンピュータに、
デジタル音声信号の半波長における補正対象の現サンプルと1サンプル前の差分に対して乗算する係数を第1のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分に応じて前記第1のテーブルの係数を補正するための係数補正値を第2のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正させる係数補正ステップと、
前記係数補正手段により補正された係数を前記補正対象の半波長における現サンプルと1サンプル前の差分に対して乗算し、乗算結果を現サンプルに加算して現サンプルを補正させるサンプル補正ステップとを、
有する音声信号処理コンピュータプログラムが提供される。
【0018】
【発明の実施の形態】
(第1の実施の形態)
第1の実施の形態を図1〜図9に基づき説明する。
この実施の形態では、本発明の音声信号処理装置はパーソナルコンピュータ(以下、PCと呼ぶ)により実施される。このため、以下に説明するように、PC及びこのPCに接続された周辺装置は協働して、デジタル音声信号を取得し、この信号に本発明の音声信号処理を施し、処理した音声信号を再生する音声再生装置として機能する。また、本発明の音声信号処理方法は、上記PCで実行されるソフトウェアにより実現される。なお、下記の構成によれば、携帯型プレーヤが周辺装置の1つとしてPCに接続されるので、PCそれ自体ではなく、この携帯型プレーヤに、本発明に係る音声信号処理を実行させるようにしてもよい。
【0019】
図1は、PC及びその周辺装置から成る音声再生装置を示す。最初に、この装置の接続関係の概要から説明する。この音声再生装置は、PC1と、このPC1に接続されたディスプレイ2と、キーボード3と、半導体メモリ5を搭載した携帯型プレーヤ4と、アンプ7とCD−ROM(Compact Disc Read Only Memory)ドライブ9とを備える。携帯型プレーヤ4はヘッドホン6に接続される。アンプ7はスピーカ8に接続される。CD−ROMドライブ9には、記録媒体としてのCD−ROM10が挿入される。
【0020】
PC1は、図1に示すように、所定のプログラムに従って演算及び処理を行うCPU(Central Processing Unit)11を備え、このCPU11がバスを介してメモリ12(ROM,RAM)、HDD(Hard Disc Drive)13、及びインターフェース(I/F)14に接続されている。このインターフェース14は、バスを介してキーボードコントローラ15、USB(Universal Serial Bus)I/F16(又はパラレルI/F、シリアルI/Fなど)、及び音声出力I/F17に接続されている。このうち、キーボードコントローラ15はキーボード3に接続される一方で、USBI/F16及び音声出力I/F17は前述した携帯型プレーヤ4及びアンプ7にそれぞれ接続されている。なお、オペレータが操作する入力装置は、キーボード3の代わりに、タッチパネルで構成してもよい。その場合には、キーボードコントローラ15はタッチパネルコントローラで置換される。
【0021】
インターフェース14は更に別のバスを介してディスプレイコントローラ18及びPCMCIA(Personal Computer Memory Card International Association)I/F19に接続されている。このうち、ディスプレイコントローラ18はディスプレイ2に接続され、PCMCIAI/F19はCD−ROMドライブ9に接続されている。
【0022】
なお、PCMCIAI/F19には、CD−ROMドライブ9の代わりに、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、MOなどの記録媒体からデータを読み込むドライブを接続してもよい。これにより、CD−ROM10の代わりに、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、MOなどの記録媒体を用いることができる。また、PCMCIAI/F19には、フラッシュメモリドライブ、無線I/Fカード、モデムカードなどが接続されることもある。
【0023】
これにより、CD−ROM10などの蓄積媒体に記録されているPCMフォーマットやMP3フォーマットなどの音声データがCD−ROMドライブ9から読み込まれ、直接もしくはいったん、HDD13に、例えばWAVEファイルやMP3ファイルとして蓄積される。この蓄積ファイルは、音声出力I/F17によりアナログ信号に変換されてからアンプ7に出力される。このアナログ信号はアンプ7で増幅されてスピーカ8から音声として出力される。なお、音声データは、インターネットなどから入手してHDD13に蓄積しておいてもよい。
【0024】
また、USBI/F16に接続された携帯型プレーヤ4には、半導体メモリ5が内蔵もしくは取り出し可能に設けられている。これにより、PC1のHDD13などに蓄積されているMP3ファイルの音声データは、携帯型プレーヤ4の半導体メモリ5に転送され、携帯型プレーヤ4で再生可能になる。この携帯型プレーヤ4には、図示しないが、CPU及びMP3などの音声データの再生プログラムが記録されているROMなどが内蔵されており、これにより、半導体メモリ5に記録された音声データを再生することができる。この携帯型プレーヤ4の音声データは、通常ヘッドホン6を介して再生される。
【0025】
なお、半導体メモリ5が携帯型プレーヤ4に着脱自在に挿入可能な場合は、PC1に設けられた半導体メモリドライブ(図示せず)に直接挿入して、このドライブを介して半導体メモリ5に音声データを転送させることができる。この場合、その半導体メモリ5を携帯型プレーヤ4に挿入して音声を再生することができる。また、携帯型プレーヤ4が録音可能な構成を有している場合、携帯型プレーヤ4はPC1に接続することなく、録音した音声データを再生するようにしてもよい。
【0026】
このようなPC1もしくは携帯型プレーヤ4において、音声データは図2に示すような手順により再生される。図2において、HDD13、CD−ROM(又はCD−RW、DVD−ROM、DVD−RAM、DVD−RW、MOなど)3、半導体メモリ5などの蓄積媒体21に記録されている音声データは、PC1もしくは携帯型プレーヤ4のI/F22を介して読み出され、MP3などの圧縮されている音声データが読み出された場合は、デコーダ23によりデコードされてPCMデータが出力される。このPCMデータは、本発明の主要部分である音質改善手段24に供給されて音質改善が行われてからD/A変換回路25に出力され、アナログ信号として、アンプ7とスピーカ8やヘッドホン6などの音声再生手段26に出力されて再生される。
【0027】
次に、本発明の主要部分である音質改善手段24における具体的な改善方法について図3及び図4と共に説明する。なお、この音質改善手段24は、HDD13又は半導体メモリ(ROM)5に記憶されてCPU11で動作する処理プログラムの機能として実現され、CPU11として動作周波数800MHzの32bit RISCプロセッサで実時間出力可能な処理プログラムを実施の形態として説明する。また、処理にあたっては、入力波形データ及び処理に必要な各種フラグやカウント値などのデータがメモリ(RAM)12に一時的に記憶される。
【0028】
まず、図3では示されていないがデコーダ23から出力されたサンプリング周波数fsのリニアPCMデータのビット数が、音質改善手段24が処理するビット数のデータFs2に変換するスケーリング処理を行う。なお、ビット数が同じであればこのスケーリング処理は行わない。このデータFs2は極性検出回路33に供給され、データFs2の波形(横軸に時間、縦軸に音の大きさをとってグラフ化したときの音声波形)を監視して、上限値から下限値、及び下限値から上限値までの補正対象の半波長におけるサンプル数をカウントし、Fs2COUNTとしてテーブル生成回路35に出力する。
【0029】
テーブル生成回路35は補正対象の半波長におけるサンプル数Pre0と、その前の半波長におけるサンプル数Pre1と、更にその前の半波長におけるサンプル数Pre2に応じて、データFs2に重み付けする係数を適応的に変化させたTable Data(以下に示す係数テーブル(C))を出力データ生成回路36に出力する。テーブル生成回路35には図4に詳しく示すようにゲインバンクテーブル35aと、ゲインテーブル(A)と、係数補正テーブル(B)と、係数テーブル(C)が設けられている(図中は単にテーブルと示す)。ゲインテーブル(A)には図5に詳しく示すように、従来例と同様に半波長におけるサンプル数に応じて個々のサンプル位置n=2〜16の係数が一義的に決められて記憶される。また、ゲインテーブル(A)は2種類あり、波形が増加傾向にある場合(下限値から上限値までの半波長)のテーブルA’と、波形が減少傾向にある場合(上限値から下限値までの半波長)のテーブルA”により構成される。
【0030】
係数補正テーブル(B)は複数の係数補正テーブルにより構成され、各係数補正テーブルには、上記の3つの連続する各半波長におけるサンプル数Pre0、Pre1、Pre2に応じて<歪み感>、<余韻感>、<解像感、定位>の問題をそれぞれ防止するようにゲインテーブル(A)の係数を補正するための係数補正値が記憶されている。複数の係数補正テーブル(B)の一例として、図6(a)は解像度を強調するためのテーブルを示し、図6(b)は余韻感を強調するためのテーブルを示している。
ゲインバンクテーブル35aには、図7、図8に示すように上記の3つの連続する各半波長におけるサンプル数Pre0、Pre1、Pre2に応じて係数補正テーブル(B)内のテーブルを選択するためのデータがあらかじめ記憶されている。そして、半波長毎に係数補正テーブル(B)内のテーブルが選択されてその係数補正値がゲインテーブル(A)の係数と乗算されてゲインテーブル(A)の係数が補正される。乗算結果は係数テーブル(C)にセットされ、係数テーブル(C)の係数データが出力データ生成回路36に印加される。ここで、係数テーブル(C)はゲインテーブル(A)と同様に、データFs2が増加傾向にある場合のテーブルC’と、減少傾向にある場合のテーブルC”により構成されている(後述)。
【0031】
また、データFs2は差分データ算出回路(差分データ算出手段)34にも供給され、現在のデータFs2と1Fs前のデータ(Fs2’とする)との差分データが算出されてFs2Differenceとして出力される。なお、差分データ算出回路34には1以上のサンプリングデータを記憶しておく機能を有しており、記憶してある前のサンプリングデータFs2’から現在のデータFs2を減算して、その音の大きさの差分データ(Fs2Difference)を出力データ生成回路36に出力している。
【0032】
そして、出力データ生成回路(出力データ生成手段)36には、データFs2と、差分データ算出回路34から出力されるFs2Differenceと、係数テーブル(C)から出力される補正データ(Table Data)とが供給され、元々の信号成分であるFs2に重み付けされた差分データを加算することにより、補正されたPCM信号Fs3を生成して出力することができる。この動作を式で示すと式(1)に示すようになる。
【0033】
Fs3 = Fs2 + (Fs2Difference ×
補正データTable Data) …(1)
【0034】
上記した音声処理装置の音声処理方法について、その主要部である音質改善手段24の動作について図9及び図10に示すフローチャートを参照しながら、より詳細に説明する。図9に示すフローチャートにおいて、差分データ算出回路34では、供給されたデータFs2(PCM(Z))を1サンプル前のデータFs2であるPCM(Z−1)と比較する(ステップ101)。供給されたデータPCM(Z)の方が大きければ(ステップ101→Yes)、データが増加方向にあるので、供給されたデータPCM(Z)から1サンプル前のデータPCM(Z−1)を減算して差分データPCMREF(Z)を求めるとともに極性データPOLA(Z)に増加を示すTRUEを格納する(ステップ102)。
【0035】
他方、供給されたデータPCM(Z)の方が小さければ(ステップ101→No)、データが減少方向にあるので1サンプル前のデータPCM(Z−1)から供給されたデータPCM(Z)を減算して差分データPCMREF(Z)を求めるとともに極性データPOLA(Z)に減少を示すFALSEを格納する(ステップ103)。この差分データPCMREF(Z)は、(1)式ではFs2Differenceとして表記されたデータである。
【0036】
極性検出回路33では、まず、半波長においてカウントするサンプル数の最大値FSUPMAX=16、最小値FSUPMIN=2とする(ステップ104−1)。次いで、1サンプル前の極性データPOLA(Z−1)と算出した極性データPOLA(Z)とを比較して、1サンプル前のデータに対して極性が変化しているかどうかを判断する(ステップ104−2)。極性データが同じであり、極性が変化していないと判断した場合には(ステップ104−2→Yes)、データの波形の傾きが変化していないことになるので、次サンプルの処理のためにデータPCM(Z)及び極性データPOLA(Z)を格納した後(ステップ105)、サンプル数でカウントしている波形頂点間隔FSCOUNTの値に1を加算して、出力データ生成回路36のオン/オフフラグFSUPSWをオフ(FALSE)にしておく(ステップ106)。このFSCOUNTは、前記(1)式ではFs2COUNTとして表記された値である。
【0037】
他方、ステップ104−2において極性データが異なる場合は(ステップ104−2→No)、極性が変化しており、データの波形の傾きが変化していることになるので、次サンプルの処理のためにデータPCM(Z)及び極性データPOLA(Z)を格納した後(ステップ107)、実時間処理可能な最大処理Fs値を超えていないかどうかの判断を行う(ステップ108)。
【0038】
つまり、ステップ108では、波形頂点間隔FSCOUNTの値が2よりも大きく実時間処理可能な最大処理Fs値であるFSTBLMAX以下の範囲内にあるかどうかを判断し、範囲内にあれば(ステップ108→Yes)、波形頂点間隔FSCOUNTの値に1を加算して、出力データ生成回路36のオン/オフフラグFSUPSWをオン(TRUE)にする(ステップ109)。他方、波形頂点間隔FSCOUNTの値が範囲外にある場合は(ステップ108→No)、各種の値を初期化するとともに出力データ生成回路36のオン/オフフラグFSUPSWをオフ(FALSE)にする異常処理を行う(ステップ110)。
【0039】
そして、ステップ111−1において出力データ生成回路36のオン/オフフラグFSUPSWがTRUEの場合には(ステップ111−1→Yes)、
GainADJHist(Z−2)=GainADJHist(Z−1
GainADJHist(Z−1)=GainADJHist(Z−0
Pre2=GainADJHist(Z−2
Pre1=GainADJHist(Z−1
にセットし(ステップ111−2)、出力データ生成回路36による処理を行うようにする。他方、出力データ生成回路36のオン/オフフラグFSUPSWがFALSEの場合には(ステップ111−1→No)、出力データ生成回路36による処理をキャンセルする(図10参照)。
【0040】
次に図10に示すフローチャートにおいて、まず、出力データ生成回路36では、波形頂点間隔FSCOUNTの値から1を減算した値をBPに格納する(ステップ112−1)。次いでテーブル生成回路35ではステップ112−2〜112−4において係数テーブル(C)(=C’+C”)を生成する。この処理では、まず、
GainADJHist(Z−0)=BP
n=BP
Pre0=GainADJHist(Z−0
係数補正テーブル(B)(Z−n
=ゲインバンクテーブル(Pre2,Pre1,Pre0)
にセットする(ステップ112−2)。
【0041】
次いでPOLA(Z−0)=TRUEか否かを判断する(ステップ112−3)。そして、Yesの場合にはデータFs2が増加傾向にある場合のテーブルC’を
係数テーブル(C’)
=ゲインテーブル(A’)(Z−n
×係数補正テーブル(B)(Z−n
により算出し(ステップ112−4)、他方、Noの場合にはデータFs2が減少傾向にある場合のテーブルC”を
係数テーブル(C”)
=ゲインテーブル(A”)(Z−n
×係数補正テーブル(B)(Z−n
により算出する(ステップ112−5)。次いでFSUPMIN≦n≦FSUPMAXか否かを判断し(ステップ112−6)、Yesであればステップ112−3に戻り、他方、Noであればステップ113に進む。
【0042】
出力データ生成回路36では、まず、ステップ113においてBPの値をnとする。このとき、BP及びnの値は、データ波形の頂点から頂点までのサンプル数を示す値と一致する。そして、極性データPOLA(Z)が増加方向(TRUE)を示している場合には(ステップ114→Yes)、データFs2が増加傾向にある場合の係数テーブルC’を用いて、サンプルデータ位置を示すnの値と波形頂点間隔FSCOUNTの値とで参照し、係数テーブルC’の係数を差分データPCMREF(Z−n)に掛けた値を補正値として、n番目のサンプルデータPCM(Z−n)に加算して補正出力データとして出力する(ステップ115)。そして、nの値を1ずつ減算しながらn=0になるまで繰り返し補正を行ってデータを出力する(ステップ116→Yes→ステップ117)。
【0043】
また、極性データPOLA(Z)が減少方向(FALSE)を示している場合には(ステップ114→No)、減少傾向にある場合のテーブルC”の係数を差分データPCMREF(Z−n)に掛けた値を補正値として、n番目のサンプルデータPCM(Z−n)に加算して補正出力データとして出力する(ステップ118)。そして、nの値を1ずつ減算しながらn=0になるまで繰り返し補正を行ってデータを出力する(ステップ119→Yes→ステップ120)。
【0044】
ステップ116又はステップ119において、n=0になると出力データ生成回路36での処理は終了する。そして、順次、出力データ生成回路36から出力されてくる補正出力データは、再スケーリング処理が施され、D/A変換回路25へ出力される。
【0045】
以上のようにして音声データの補正を行う際の具体例を図11に示す。また係数テーブルC’、C”の一部をそれぞれ図12(a)、(b)に示す。図12には波形頂点間隔が3〜6(2Fs〜5Fs)の各場合についてのデータ波形例とその補正個所、補正値(a〜d)と係数テーブル(C)の値(α〜θ)、補正後の出力データ例を表したものである。
【0046】
波形頂点間隔が3(2Fs)の場合を例にして説明すると、データ波形が増加している場合は図12(a)に示すテーブルC’を使用する。そして、データ波形が増加している部分の波形頂点間隔をカウントすると(C→B→A)となり、FSCOUNT=3となる。また、n=BP=FSCOUNT−1=2となる。そして、n=2で波形頂点間隔が3のときのテーブルC’の値は1/4であり、データBの補正値は図8中、aで示す式から導かれ、出力PCMデータは(B+a)となる。また、n=1で波形頂点間隔が3のときのテーブルC’の値は0であるので波形データCの補正値も0になり、出力PCMデータはCのままとなる。
【0047】
同様に、データ波形が減少している場合は図12(b)に示すテーブルC”を使用する。そして、データ波形が減少している部分の波形頂点間隔をカウントすると(E→D→C)となり、FSCOUNT=3、n=BP=2となる。そして、n=2で波形頂点間隔が3のときのテーブルC”の値は−1/4(=β)であり、データDの補正値は図11中、bで示す式から導かれ、出力PCMデータは(D+b)となる。なお、テーブルC”から得た値が−1/4であるので、実際にはPCMデータDから補正値を減算して出力PCMデータを得ることになる。また、n=1で波形頂点間隔が3のときの補正テーブルC”の値は0であるので波形データAの補正値も0になり、出力PCMデータはAのままとなる。
【0048】
同様に、FSCOUNTにより波形頂点間隔を検出することができるので、波形が増加方向にあるときにはテーブルC’を用い、減少方向にあるときにはテーブルC”を用いて、FSCOUNTとそのときのnの値から補正テーブルデータを得、これと差分データとを用いて波形データを補正することにより、音質の向上を果たすことができる。
【0049】
そして、上記実例では、32bit RISCプロセッサを用いて実時間処理することを想定しており、より高速なCPUを使用する場合は、より高次のFSCOUNTまで使用したり、補正テーブルデータとして桁数の大きい小数を用いて補正値を計算したりすることにより、より高音質な出力データを得ることも可能になる。なお、FSCOUNT=7(6Fs)とした場合には、補正個所が波形の増加方向と減少方向でそれぞれ1箇所ずつ増えるので、補正データもその分増えることになる。
【0050】
以上説明したように、ゲインテーブル(A)には、補正対象の半波長のみのサンプル数のみに基づく固定の係数を記憶し、係数補正テーブル(B)には、前述した<歪み感>、<余韻感>、<解像感、定位>の問題を防止するような係数補正値を記憶して、これによりゲインテーブル(A)を補正することにより、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる。また、アップサンプリングを行わなくても音質を改善することができ、アップサンプリングを行えば更に音質を改善することができる。
【0051】
また、差分データ算出回路34が補正対象の半波長、及びそれより前の半波長における各サンプル間の差分を検出して、<歪み感>、<余韻感>、<解像感、定位>の問題を防止するような係数補正値によりゲインテーブル(A)を補正することにより、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる。また、アップサンプリングを行わなくても音質を改善することができ、アップサンプリングを行えば更に音質を改善することができる。
【0052】
ここで、上述した実施の形態では、処理内容をブロックに示して説明したが、実際にはソフトウェアによる処理が可能であり、本願発明を実施する際に新たなハードウェアや部品を必要としないので、本発明を適用可能な製品の種類が広がり、またコスト的にも優位である。
【0053】
さらに、サンプリングレートが低く、低ビットレートのPCM音声データを高音質化することができるので、記憶容量に制限のある半導体メモリに音声デ−タを記録する場合や、データ転送速度に制限のあるネットワークを介した音楽配信などにおいても、非常に利用価値の高い音質改善技術を提供することができる。
【0054】
さらに、HiFiオーディオの分野だけでなく、更に低ビットレートで音声信号が利用される携帯電話機、PHS、インターネット電話、半導体音声レコーダなどの各種の再生装置に本願発明を適用することにより、再生音声の明瞭度を向上させることができるという効果がある。
【0055】
また、本発明に係る音質改善のための音声信号処理は、上述したように、非圧縮状態のPCM(リニアPCM)データに施される。このため、この音声信号処理はあらゆるフォーマットのデータに適用可能である。圧縮されているPCMデータはデコードした状態で、この音声信号処理に付される。非圧縮のPCMデータはそのまま、この音声信号処理に付される。したがって、重み付け及び処理帯域のパラメータを適宜変更することで、音質の劣化状態に応じた最適な音質向上効果が得られる。非圧縮データのファイル形式としては、MP3、WMA、AAC、Real Audioなどの種々のものがあり、これらファイル形式の音声データにも、本発明の音声信号処理が適用可能である。
【0056】
【発明の効果】
以上説明したように本発明によれば、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる。また、アップサンプリングを行わなくても音質を改善することができ、アップサンプリングを行えば更に音質を改善することができる。
【図面の簡単な説明】
【図1】本発明の音声信号処理装置を機能的に有する、第1の実施の形態に係る音声再生装置の例を示す構成図である。
【図2】第1の実施の形態における音声再生装置の再生系の例を示す構成図である。
【図3】第1の実施の形態で実施される音質改善のための音声信号処理を説明するブロックである。
【図4】図3のテーブル作成回路のテーブル及び処理を説明するための図である。
【図5】図4のゲインテーブルの構成例を示す図である。
【図6】図4の係数補正テーブルの構成例を示す図である。
【図7】図4のゲインバンクテーブルの構成例を示す図である。
【図8】図4のゲインバンクテーブルの構成例を示す図である。
【図9】第1の実施の形態で実行される音声信号処理の一例を図10と共に示すフローチャート図である。
【図10】第1の実施の形態で実行される音声信号処理の一例を図9と共に示すフローチャート図である。
【図11】第1の実施の形態で実行される音声信号処理の変換アルゴリズムを説明するための図である。
【図12】図4の係数テーブルの係数を説明するための図である。
【符号の説明】
33 極性検出回路
34 差分データ算出回路
35 テーブル生成回路(係数補正手段)
35a ゲインバンクテーブル
36 出力データ生成回路(サンプル補正手段)
A ゲインテーブル(第1のテーブル)
B 係数補正テーブル(第2のテーブル)
C 係数テーブル

Claims (4)

  1. デジタル音声信号の半波長における各サンプル数及びサンプル位置に応じた係数を記憶する第1のテーブルと、
    前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて前記第1のテーブルの係数を補正するための係数補正値を記憶する第2のテーブルと、
    前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正する係数補正手段と、
    前記係数補正手段により補正された係数により前記補正対象の半波長における各サンプル値を補正するサンプル補正手段とを、
    備えた音声信号処理装置。
  2. コンピュータに、
    デジタル音声信号の半波長における各サンプル数及びサンプル位置に応じた係数を第1のテーブルに記憶させるステップと、
    前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて前記第1のテーブルの係数を補正するための係数補正値を第2のテーブルに記憶させるステップと、
    前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正させる係数補正ステップと、
    前記係数補正手段により補正された係数により前記補正対象の半波長における各サンプル値を補正させるサンプル補正ステップとを、
    有する音声信号処理コンピュータプログラム。
  3. デジタル音声信号の半波長における補正対象の現サンプルと1サンプル前の差分に対して乗算する係数を記憶する第1のテーブルと、
    前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分に応じて前記第1のテーブルの係数を補正するための係数補正値を記憶する第2のテーブルと、
    前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正する係数補正手段と、
    前記係数補正手段により補正された係数を前記補正対象の半波長における現サンプルと1サンプル前の差分に対して乗算し、乗算結果を現サンプルに加算して現サンプルを補正するサンプル補正手段とを、
    備えた音声信号処理装置。
  4. コンピュータに、
    デジタル音声信号の半波長における補正対象の現サンプルと1サンプル前の差分に対して乗算する係数を第1のテーブルに記憶させるステップと、
    前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分に応じて前記第1のテーブルの係数を補正するための係数補正値を第2のテーブルに記憶させるステップと、
    前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正させる係数補正ステップと、
    前記係数補正手段により補正された係数を前記補正対象の半波長における現サンプルと1サンプル前の差分に対して乗算し、乗算結果を現サンプルに加算して現サンプルを補正させるサンプル補正ステップとを、
    有する音声信号処理コンピュータプログラム。
JP2002329774A 2002-11-13 2002-11-13 音声信号処理装置及び音声信号処理コンピュータプログラム Expired - Lifetime JP4224807B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002329774A JP4224807B2 (ja) 2002-11-13 2002-11-13 音声信号処理装置及び音声信号処理コンピュータプログラム
US10/703,588 US7424332B2 (en) 2002-11-13 2003-11-10 Audio signal processing apparatus and related computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002329774A JP4224807B2 (ja) 2002-11-13 2002-11-13 音声信号処理装置及び音声信号処理コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2004163681A true JP2004163681A (ja) 2004-06-10
JP4224807B2 JP4224807B2 (ja) 2009-02-18

Family

ID=32290050

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002329774A Expired - Lifetime JP4224807B2 (ja) 2002-11-13 2002-11-13 音声信号処理装置及び音声信号処理コンピュータプログラム

Country Status (2)

Country Link
US (1) US7424332B2 (ja)
JP (1) JP4224807B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008209646A (ja) * 2007-02-26 2008-09-11 Sony Corp 雑音低減装置及び雑音低減方法
JP2010019901A (ja) * 2008-07-08 2010-01-28 Victor Co Of Japan Ltd ディジタル音響信号処理方法及び処理装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005259220A (ja) * 2004-03-10 2005-09-22 Matsushita Electric Ind Co Ltd 再生装置及びその制御方法
US7653447B2 (en) * 2004-12-30 2010-01-26 Mondo Systems, Inc. Integrated audio video signal processing system using centralized processing of signals
US8880205B2 (en) * 2004-12-30 2014-11-04 Mondo Systems, Inc. Integrated multimedia signal processing system using centralized processing of signals
US8015590B2 (en) * 2004-12-30 2011-09-06 Mondo Systems, Inc. Integrated multimedia signal processing system using centralized processing of signals
US7825986B2 (en) * 2004-12-30 2010-11-02 Mondo Systems, Inc. Integrated multimedia signal processing system using centralized processing of signals and other peripheral device
US9124365B2 (en) * 2013-03-15 2015-09-01 Cellco Partnership Enhanced mobile device audio performance

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169597A (ja) * 2000-09-05 2002-06-14 Victor Co Of Japan Ltd 音声信号処理装置、音声信号処理方法、音声信号処理のプログラム、及び、そのプログラムを記録した記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008209646A (ja) * 2007-02-26 2008-09-11 Sony Corp 雑音低減装置及び雑音低減方法
JP2010019901A (ja) * 2008-07-08 2010-01-28 Victor Co Of Japan Ltd ディジタル音響信号処理方法及び処理装置

Also Published As

Publication number Publication date
US7424332B2 (en) 2008-09-09
JP4224807B2 (ja) 2009-02-18
US20040098150A1 (en) 2004-05-20

Similar Documents

Publication Publication Date Title
KR101310231B1 (ko) 저음 증강 장치 및 방법
US8204239B2 (en) Audio processing method and audio processing apparatus
JP2008085412A (ja) オーディオ再生装置
JP2008103880A (ja) オーディオ再生装置
JP4760278B2 (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム
JP2002215195A (ja) 音楽信号処理装置
JP2002015522A (ja) 音声帯域拡張装置及び音声帯域拡張方法
JP4224807B2 (ja) 音声信号処理装置及び音声信号処理コンピュータプログラム
JP2008058470A (ja) 音声信号処理装置、音声信号再生システム
JP3888239B2 (ja) デジタル音声処理方法及び装置、並びにコンピュータプログラム
TWI228705B (en) Musical tone generating apparatus, musical tone generating method, and computer-readable recording medium for recording a program for implementing the method
JP2002189498A (ja) デジタル音声処理装置及びコンピュータプログラム記録媒体
JP2002169597A (ja) 音声信号処理装置、音声信号処理方法、音声信号処理のプログラム、及び、そのプログラムを記録した記録媒体
JP2010268446A (ja) デジタルデータ処理装置
JP4787316B2 (ja) デジタル信号処理装置及び倍音生成方法
US7518056B2 (en) Optimisation of MIDI file reproduction
KR20100024727A (ko) 휴대 단말기의 음원 재생 장치 및 음원 재생 방법
JP2006005807A (ja) 音響信号処理方法、音響信号処理装置、音響信号処理システム及びコンピュータプログラム
US8195317B2 (en) Data reproduction apparatus and data reproduction method
JP2004157295A (ja) 音響再生装置および演奏データの補正方法
JP4900062B2 (ja) 音声信号処理装置、音声再生装置および音声信号処理方法
US7151215B2 (en) Waveform adjusting system for music file
EP1519619B1 (en) Loudspeaker sensitive sound reproduction
JP4715385B2 (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム
JP4815986B2 (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050330

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081031

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4224807

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121205

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121205

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131205

Year of fee payment: 5

EXPY Cancellation because of completion of term