JP4123486B2 - デジタル音声処理方法及びデジタル音声処理装置、並びにコンピュータプログラム - Google Patents

デジタル音声処理方法及びデジタル音声処理装置、並びにコンピュータプログラム Download PDF

Info

Publication number
JP4123486B2
JP4123486B2 JP2007086005A JP2007086005A JP4123486B2 JP 4123486 B2 JP4123486 B2 JP 4123486B2 JP 2007086005 A JP2007086005 A JP 2007086005A JP 2007086005 A JP2007086005 A JP 2007086005A JP 4123486 B2 JP4123486 B2 JP 4123486B2
Authority
JP
Japan
Prior art keywords
peak
value
sample
correction target
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007086005A
Other languages
English (en)
Other versions
JP2008112130A (ja
Inventor
俊治 桑岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2007086005A priority Critical patent/JP4123486B2/ja
Priority to US11/882,569 priority patent/US8532801B2/en
Publication of JP2008112130A publication Critical patent/JP2008112130A/ja
Application granted granted Critical
Publication of JP4123486B2 publication Critical patent/JP4123486B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、デジタル音声信号の再生音質を改善するデジタル音声信号処理方法及びデジタル音声処理装置、並びにコンピュータプログラムに関する。
従来例として、例えば下記の特許文献1、2には、アナログ音声信号を所定のサンプリング周波数及び所定の量子化ビット数でデジタル化すると、サンプリング周波数の2分の1以上の帯域がカットされ、また、量子化ビット数に応じた量子化誤差を有するので、このデジタル音声信号の再生音質を改善する方法が開示されている。
この方法では、処理対象のデジタル音声信号の極大値と極小値の間のサンプル数に応じた各係数と、極大値及び極小値と各1サンプル前の値との差分をそれぞれ乗算し、各乗算結果を極大値に加算し、かつ極小値から減算する。この方法によれば、処理対象のデジタル音声信号の極大値が大きくなり、極小値が小さくなるとともに、よりサイン波に近づくので、再生音のメリハリ、歯切れが向上して、シャープで、リアリティ、明瞭度などのある再生音を得ることができる。
特許第3659489号公報(請求項1) 特開2004−21224号公報(要約書)
ところで、近年、デジタルテレビ放送やインターネットなどで配信されるデジタル音声信号は、非可逆方式で圧縮されており、可聴周波数帯域fa=20Hz〜20kHz内の高域がカット(例えばデジタルテレビ放送などで利用されているAAC方式では16kHz以上がカット、携帯端末などで利用されているMP3方式では8kHz以上がカット)されている。しかしながら、上記の従来例では、極大値と極小値のみを補正するので、上記の従来例を適用しても、カットされている高域を補正することができず、このため、元のデジタル音声信号、さらにはその元のアナログ音声信号に近づけることができないという問題点がある。
また、圧縮音声信号のみならず、数十年も前に録音された古いアナログ音声信号や、何回もダビングされたアナログ音声信号は通常、極大値及び極小値とその近傍のレベルが低下しているが、上記の従来例を適用してそのPCM信号の極大値と極小値のみを補正しても、その元のアナログ音声信号に近づけることができないという問題点がある。
本発明は上記従来例の問題点に鑑み、高域がカットされる圧縮方式で圧縮されているデジタル音声信号や、劣化しているアナログ音声信号を元の音声信号に近づけることができ、シャープで、リアリティ、明瞭度などのある再生音を得ることができるデジタル音声信号処理方法及びデジタル音声処理装置、並びにコンピュータプログラムを提供することを目的とする。
本発明のデジタル音声信号処理方法は上記目的を達成するために、
処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプルと、前記第2のピークとその前後のサンプルの各補正対象サンプルの補正係数、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記第1のピークとその前後のサンプルの各補正対象サンプルの補正係数を求めるステップと、
前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前後のサンプルを含む各補正対象サンプルの値に対しては加算するとともに、前記極小値とその前後のサンプルを含む各補正対象サンプルの値は対しては減算するステップとを、
有する。
また、本発明のデジタル音声処理装置は上記目的を達成するために、
処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求める手段と、
前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出する手段と、
前記第1、第2のピーク値の間のピーク間差分を求める手段と、
前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプルと、前記第2のピークとその前後のサンプルの各補正対象サンプルの補正係数、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記第1のピークとその前後のサンプルの各補正対象サンプルの補正係数をあらかじめ記憶する記憶手段と、
前記求めたピーク間サンプル数に応じた前記補正対象サンプルと各補正サンプルの補正係数を前記記憶手段から求める手段と、
前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算する手段と、
前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前後の各補正対象サンプルに対しては加算するとともに、前記極小値とその前後の各補正対象サンプルに対しては減算する手段とを、
有する。
また、本発明のコンピュータプログラムは上記目的を達成するために、
処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプルと、前記第2のピークとその前後のサンプルの各補正対象サンプルの補正係数、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記第1のピークとその前後のサンプルの各補正対象サンプルの補正係数を求めるステップと、
前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前後のサンプルを含む各補正対象サンプルの値に対しては加算するとともに、前記極小値とその前後のサンプルを含む各補正対象サンプルの値に対しては減算するステップとを、
コンピュータに実行させる。
また、本発明は上記目的を達成するために、
デジタル音声情報をエンコーダにより圧縮する前に、前記エンコーダの圧縮による前記デジタル音声情報の極大値と極小値及びその前後のサンプルの劣化度合いをプリ・エンファシス処理するデジタル音声処理方法において、
処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
前記エンコーダの圧縮による前記デジタル音声情報の前記極大値と前記極小値及びその前後のサンプルの劣化度合いと、前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプルと、前記第2のピークとその前後のサンプルの各補正対象サンプルの補正係数、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記第1のピークとその前後のサンプルの各補正対象サンプルの補正係数を求めるステップと、
前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前後のサンプルを含む各補正対象サンプルの値に対しては加算するとともに、前記極小値とその前後のサンプルを含む各補正対象サンプルの値に対しては減算して前記エンコーダに出力するステップとを、
有する。
また、本発明は上記目的を達成するために、
デジタル音声情報をエンコーダにより圧縮する前に、前記エンコーダの圧縮による前記デジタル音声情報の極大値と極小値及びその前後のサンプルの劣化度合いをプリ・エンファシス処理するデジタル音声処理装置において、
処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求める手段と、
前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出する手段と、
前記第1、第2のピーク値の間のピーク間差分を求める手段と、
前記エンコーダの圧縮による前記デジタル音声情報の前記極大値と前記極小値及びその前後のサンプルの劣化度合いと、前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプルと、前記第2のピークとその前後のサンプルの各補正対象サンプルの補正係数、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記第1のピークとその前後のサンプルの各補正対象サンプルの補正係数を求める手段と、
前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算する手段と、
前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前後のサンプルを含む各補正対象サンプルの値に対しては加算するとともに、前記極小値とその前後のサンプルを含む各補正対象サンプルの値に対しては減算して前記エンコーダに出力する手段とを、
有する。
また、本発明は上記目的を達成するために、
デジタル音声情報をエンコーダにより圧縮する前に、前記エンコーダの圧縮による前記デジタル音声情報の極大値と極小値及びその前後のサンプルの劣化度合いをプリ・エンファシス処理するコンピュータプログラムにおいて、
処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
前記エンコーダの圧縮による前記デジタル音声情報の前記極大値と前記極小値及びその前後のサンプルの劣化度合いと、前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプルと、前記第2のピークとその前後のサンプルの各補正対象サンプルの補正係数、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記第1のピークとその前後のサンプルの各補正対象サンプルの補正係数を求めるステップと、
前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前後のサンプルを含む各補正対象サンプルの値に対しては加算するとともに、前記極小値とその前後のサンプルを含む各補正対象サンプルの値に対しては減算して前記エンコーダに出力するステップとを、
コンピュータに実行させる。
また、本発明のデジタル音声処理方法は上記目的を達成するために、
処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプル、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記補正対象サンプルの各補正係数を求めるステップと、
前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前若しくは前記極大値の前、又は前記極大値の後若しくは前記極大値とその後を含む各補正対象サンプルの値に対しては加算するとともに、前記極小値の後若しくは前記極小値と前記極小値の後、又は極小値の前若しくは前記極小値と前を含む各補正対象サンプルの値に対しては減算するステップとを、
有する。
また、本発明のデジタル音声処理装置は上記目的を達成するために、
処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求める手段と、
前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出する手段と、
前記第1、第2のピーク値の間のピーク間差分を求める手段と、
前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプル、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記補正対象サンプルの各補正係数を求める手段と、
前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算する手段と、
前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前若しくは前記極大値の前、又は前記極大値の後若しくは前記極大値とその後を含む各補正対象サンプルの値に対しては加算するとともに、前記極小値の後若しくは前記極小値と前記極小値の後、又は極小値の前若しくは前記極小値と前を含む各補正対象サンプルの値に対しては減算する手段とを、
有する。
また、本発明のコンピュータプログラムは上記目的を達成するために、
処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプル、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記補正対象サンプルの各補正係数を求めるステップと、
前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前若しくは前記極大値の前、又は前記極大値の後若しくは前記極大値とその後を含む各補正対象サンプルの値に対しては加算するとともに、前記極小値の後若しくは前記極小値と前記極小値の後、又は極小値の前若しくは前記極小値と前を含む各補正対象サンプルの値に対しては減算するステップとを、
コンピュータに実行させる。
また、本発明は上記目的を達成するために、
デジタル音声情報をエンコーダにより圧縮する前に、前記エンコーダの圧縮による前記デジタル音声情報の極大値と極小値及びその前後のサンプルの劣化度合いをプリ・エンファシス処理するデジタル音声処理方法において、
処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
前記エンコーダの圧縮による前記デジタル音声情報の前記極大値と前記極小値及びその前後のサンプルの劣化度合いと、前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプル、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記補正対象サンプルの各補正係数を求めるステップと、
前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前若しくは前記極大値の前、又は前記極大値の後若しくは前記極大値とその後を含む各補正対象サンプルの値に対しては加算するとともに、前記極小値の後若しくは前記極小値と前記極小値の後、又は極小値の前若しくは前記極小値と前を含む各補正対象サンプルの値に対しては減算するステップとを、
有する。
また、本発明は上記目的を達成するために、
デジタル音声情報をエンコーダにより圧縮する前に、前記エンコーダの圧縮による前記デジタル音声情報の極大値と極小値及びその前後のサンプルの劣化度合いをプリ・エンファシス処理するデジタル音声処理装置において、
処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求める手段と、
前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出する手段と、
前記第1、第2のピーク値の間のピーク間差分を求める手段と、
前記エンコーダの圧縮による前記デジタル音声情報の前記極大値と前記極小値及びその前後のサンプルの劣化度合いと、前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプル、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記補正対象サンプルの各補正係数を求める手段と、
前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算する手段と、
前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前若しくは前記極大値の前、又は前記極大値の後若しくは前記極大値とその後を含む各補正対象サンプルの値に対しては加算するとともに、前記極小値の後若しくは前記極小値と前記極小値の後、又は極小値の前若しくは前記極小値と前を含む各補正対象サンプルの値に対しては減算する手段とを、
有する。
デジタル音声情報をエンコーダにより圧縮する前に、前記エンコーダの圧縮による前記デジタル音声情報の極大値と極小値及びその前後のサンプルの劣化度合いをプリ・エンファシス処理するコンピュータプログラムにおいて、
処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
前記エンコーダの圧縮による前記デジタル音声情報の前記極大値と前記極小値及びその前後のサンプルの劣化度合いと、前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプル、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記補正対象サンプルの各補正係数を求めるステップと、
前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前若しくは前記極大値の前、又は前記極大値の後若しくは前記極大値とその後を含む各補正対象サンプルの値に対しては加算するとともに、前記極小値の後若しくは前記極小値と前記極小値の後、又は極小値の前若しくは前記極小値と前を含む各補正対象サンプルの値に対しては減算するステップとを、
コンピュータに実行させる。
本発明によれば、デジタル音声情報において、その極大値と極小値及びその前後のサンプルの劣化度合いに応じて補正するので、高域がカットされる圧縮方式で圧縮されているデジタル音声信号や、劣化しているアナログ音声信号を元の音声信号に近づけることができ、シャープで、リアリティ、明瞭度などのある再生音を得ることができる。
<第1の実施の形態>
以下、図面を参照して本発明の実施の形態について説明する。図1は本発明に係るデジタル音声処理装置の第1の実施の形態を示すブロック図、図2は図1のテーブルの構成を示す説明図、図3は図1のピーク検出部とピーク間サンプル数検出部の処理を示す説明図、図4は図1のピーク間差分値算出部の処理を示す説明図、図5、図6は図1の加算部の処理を示す説明図、図7は補正前と補正後の音声信号を示す波形図である。
図1に示すデジタル音声処理装置は、1種類の圧縮方式に対応した構成を示し、例えばデジタルテレビ放送受信機に搭載されて、16kHz以上がカットされているAAC方式の信号を処理したり、携帯端末に搭載されて、8kHz以上がカットされているMP3方式の信号を処理することを想定している。この装置は、デコード部2、ピーク検出部3、ピーク間サンプル数検出部4、テーブル5、ピーク間差分値算出部6、乗算部7及び加算部8を有する。デコード部2は上述のAAC方式やMP3方式などの1種類の圧縮方式に対応し、また、テーブル5も同様に、上述の1種類の圧縮方式によりカットされた高域を補正するように設けられている(図2参照)。
図1において、圧縮音声データはデコード部2によりPCM信号に伸長され、このPCM信号が処理対象のデジタル音声信号としてピーク検出部3(及び加算部8)に印加される。ピーク検出部3は図3に示すように処理対象のデジタル音声信号の極大値と極小値を検出し、また、ピーク間サンプル数検出部4は図3に示すように、ピーク検出部3により検出された極大値から極小値までの間隔と極小値から極大値までの間隔(ピーク間サンプル数)を検出する。ここで、このピーク間サンプル数は、デジタル音声信号の90°分のサンプル数であり、低周波数ほど多く、高周波数ほど少ない。ちなみに、可聴周波数帯域fa=20Hz〜20kHzをサンプリング周波数fs=44.1kHzでA/D変換(20kHzを超える帯域はカット)した信号の場合には、ピーク間サンプル数は、20Hzで1000個、20kHzで1個である。
図2に示すテーブル5について詳しく説明する。まず、ピーク間サンプル数=4の場合とは、ピーク間サンプル数=5、6、7〜の場合より音声周波数faが高域側にあることを示し、この場合には補正対象サンプル数=1(演算係数=1/32)であるので、極大値/極小値のみを補正し、その前後のサンプルは補正しない。次のピーク間サンプル数=5の場合とは、ピーク間サンプル数=4の場合より周波数faが低いことを示し、この場合には補正対象サンプル数=1(演算係数=1/16)であるので、極大値/極小値のみを補正するが、演算係数が大きくなる。
次のピーク間サンプル数=6の場合は、さらに周波数faが低く、補正対象サンプル数=5(=2+3)(演算係数=1/14)であるので、後の第2のピーク値とその前の2サンプルの合計3サンプル、及び前の第1のピーク値の後の2サンプル(すなわち総合計は5サンプル)を補正する。さらに、演算係数=1/14は、第2のピーク値とその前の2サンプルの合計3サンプルと、第2のピーク値とその後の第3のピーク値の間のピーク間サンプル数により数が決まる補正対象サンプルについて用いる。
次のピーク間サンプル数=7の場合は、さらに周波数faが低く、補正対象サンプル数=9(=4+5)(演算係数=1/8)であるので、演算係数が大きくなる。また、後の第2のピーク値とその前の4サンプルの合計5サンプル、及び前の第1のピーク値の後の4サンプル(すなわち総合計は9サンプル)を補正する。演算係数=1/8は、第2のピーク値とその前の4サンプルの合計5サンプルと、第2のピーク値とその後の第3のピーク値の間のピーク間サンプル数により数が決まる補正対象サンプルについて用いる。なお、図2は補正内容を単に説明するためであって、本発明を限定するものではない。ただし、音声周波数faが低いほど、補正対象サンプル数が多くなる。
図1に戻り、ピーク間差分値算出部6は図4に示すように、ピーク検出部3により検出された極大値と極小値の間の差分(ピーク間差分値)を算出し、乗算部7は、テーブル5から読み出された補正対象サンプル数に応じた各サンプルについて、ピーク間差分値とテーブル5から読み出された各係数を乗算する。次いで、加算部8は、この乗算結果を、極大値を挟む各補正対象サンプルについては図5のA×αに示すように加算し、また、極小値を挟む各補正対象サンプルからは、図6のB×αに示すようにこの乗算結果を減算する。これにより、図7に示すように圧縮によりカットされた高域や、極大値と極小値及びその前後のサンプルの劣化が補正される。
図8〜図10を参照してコンピュータプログラムについて説明する。図8は図1のデコード部2を除く、ピーク検出部3、ピーク間サンプル数検出部4、テーブル5、ピーク間差分値算出部6、乗算部7及び加算部8の処理を示し、図9、図10は図8の処理内容を詳しく示す。ここで、図9、図10における丸付き数字は、本明細書では括弧付き数字で示す。まず、ステップS1では、図9(1)、(3)に示すように処理対象のデジタル音声信号のサンプルデータとその1つ前のサンプルデータの各値を比較して大小を判別する。次にステップS2では、大が続き小に変化したとき、及び小が続き大に変化したとき、図9(2)、(4)に示すように波形のピーク部分(極大値、極小値)とする。次にステップS3では、図9(5)に示すように1つ前の波形のピーク部分と今回の波形のピーク部分の間のサンプル数を検出してこれをピーク間サンプル数とする。このピーク間サンプル数は、極大値→極小値間サンプル数、極小値→極大値間サンプル数であり、音声周波数faの90°分のサンプル数に対応する。次にステップS4では、図9(6)に示すように1つ前の波形のピーク部分のデータ値と今回の波形のピーク部分のデータ値の差分値を検出してこれをピーク間差分値(図6に示す極大値→極小値間差分値B、図5に示す極小値→極大値間差分値A)とする。
次にステップS5では、図2に示すようにあらかじめ決められたテーブルにより、ピーク間サンプル数に一致した演算係数αと補正対象サンプル数を検出する。次にステップS6では、例えば図10(7)に示すようにピーク間差分値AにステップS5の演算係数αを乗算して補正データを算出する。次にステップS7では、図10(8)に示すようにピーク部分を中心にステップS5の補正対象サンプル数分のサンプルデータにステップS6の補正データを加算する。また、ピーク値が極小値である場合には、例えばピーク間差分値Bに演算係数αを乗算した補正データを減算する。以下、この動作を繰り返す(ステップS8)。
<第2の実施の形態>
ここで、デジタルテレビ放送受信機や携帯端末に本発明を適用する場合、これらの機器は通常、図1に示すデコード部2をあらかじめ備えているので、第2の実施の形態として、図1に示すデコード部2を除く構成でもよい。
<第3の実施の形態>
第1の実施の形態では、1種類の圧縮方式に対応した構成を説明したが、本発明の第3の実施の形態は、複数種類の圧縮方式に対応した構成を示す。図11はその構成を示し、テーブル選択部1と複数のデコード部2aが追加されている。また、テーブル5aの構成が異なり、図12に示すように、複数種類の圧縮方式のそれぞれに対応して複数設けられている。そして、テーブル選択部1は、処理対象のデジタル音声信号の圧縮方式に基づいてテーブル5aのいずれか1つを選択し、テーブル選択部1により選択されたテーブル5aのいずれか1つから、このピーク間サンプル数に応じた演算係数と補正対象サンプル数が読み出され、演算係数と補正対象サンプル数は乗算部7に、補正対象サンプル数は加算部8に印加される。
また、この構成では、処理対象は圧縮音声信号のみならず、数十年も前に録音されたり、何回もダビングされて、極大値及び極小値とその近傍のレベルが低下(劣化)しているアナログ音声信号を処理することができる。この場合には、点線で示すように、このアナログ音声信号のPCM信号をピーク検出部3に入力し、さらにオペレータがその劣化度合いに応じてテーブル5aのいずれか1つを選択することにより、アナログ音声信号の劣化を補正することができる。
<第4の実施の形態>
第1〜第3の実施の形態の利用分野は、いずれも受け手側のユーザ機器(デジタルテレビ放送受信機や携帯端末)を想定しているので、ユーザの負担が増加する。また、携帯端末にあっては、プロバイダ側が高音質の音楽などをユーザの負担なしに配信して販売を促進したい場合に適用することができない。そこで、第4の実施の形態として、図13は送信側の構成を示す。図1に示したピーク検出部3、ピーク間サンプル数検出部4、テーブル5、ピーク間差分値算出部6、乗算部7及び加算部8は、圧縮部であるエンコーダ10の前段に設けられ、また、ピーク検出部3の入力信号はPCM信号である。エンコーダ10は、前述したようにその圧縮方式から原信号の極大値及び極小値とその近傍のレベルを低下(劣化)させるので、この劣化分を前もって、図1に示した構成により補正して、いわゆるプリ・エンファシス処理する。したがって、このプリ・エンファシス処理した信号をエンコーダ10で圧縮すると、その信号の極大値及び極小値とその近傍のレベルは、デ・エンファシス処理した原信号と同等となる。したがって、この信号をユーザ機器側に送信してデコード部2でデコードすると、ユーザ機器側は何も処理することなく、劣化のない原信号を再生することができる。
<第1〜第4の実施の形態のまとめ>
ここで、図14は上記の第1〜第4の実施の形態による補正対象サンプルと、各補正対象サンプルに用いる係数(図2に示すテーブル5の内容)を示している。上記の第1〜第4の実施の形態では、隣接する前のピーク値P0(図14では極小値)とその後のピーク値P1(極大値)の間のピーク間サンプル数a(補正対象サンプル数=7=3+4とする)に対する補正対象サンプルとして、ピーク(P0)後の3サンプルS5、S6、S7、及びピーク値P1のサンプルS1とその前の3サンプルS4、S3、S2(総合計7サンプル)を決定する。そして、サンプル数aの場合の係数を用いるサンプルは、ピーク値P1のサンプルS1とその前のサンプルS4、S3、S2と、ピーク値P1の後のサンプルとしてピーク値P1とその後のピーク値(不図示)の間のピーク間サンプル数bにより数が決まる補正対象サンプル(S8、S9…)である。
<第1〜第4の実施の形態の変形例>
変形例(1)
図15は第1〜第4の実施の形態の変形例(1)による補正対象サンプルと、各補正対象サンプルに用いる係数(図2に示すテーブル5の内容)を示している。この変形例では、まず、補正対象サンプルについては上記の第1〜第4の実施の形態と同様に、隣接する前のピーク値P0(図15では極小値)とその後のピーク値P1(極大値)の間のピーク間サンプル数a(補正対象サンプル数=7=3+4とする)に対する補正対象サンプルとして、ピーク値P0の後の3サンプルS5、S6、S7、及びピーク値P1のサンプルS1とその前の3サンプルS4、S3、S2(総合計7サンプル)を決定する。そして、この変形例(1)では、サンプル数aの場合の係数を用いるサンプルは、この補正対象サンプルそのもの、すなわちサンプルS5、S6、S7、S4、S3、S2、S1である。
変形例(2)
変形例(2)では、図14(補正対象サンプル数=7=3+4とする)において、補正対象サンプルについては、前のピーク値P0のサンプルS0とその後の3サンプルS5、S6、S7(合計4サンプル)及び後のピーク値P1の前の3サンプルS4、S3、S2(総合計7サンプル)を補正対象サンプルとする。また、係数を用いるサンプルについては、前のピークP0のサンプルS0と、その前のサンプルと、後の3サンプルS5、S6、S7について用いる。
変形例(3)
この変形例(3)では、図15(補正対象サンプル数=7=3+4とする)において、補正対象サンプルについては、変形例(2)と同様に、前のピーク値P0のサンプルS0とその後の3サンプルS5、S6、S7(合計4サンプル)及び後のピークP1の前の3サンプルS4、S3、S2(総合計7サンプル)を補正対象サンプルとする。また、係数については、変形例(1)と同様に、この補正対象サンプルそのものに対して、すなわちサンプルS0、S5、S6、S7、S4、S3、S2について用いる。
ここで、ピーク間サンプル数a(及びb)を求める際の計算対象サンプルは、図14、図15では、前のピークP0から後のピークP1の前のサンプルS2まで(P1−S2)としているが、単に周波数を検出するのが目的であるので、これには限定されない。すなわち、前のピークP0から後のピークP1まで(P0−P1)でもよく、前のピークP0の次のサンプルS5から後のピークP1まで(S5−P1)でもよく、前のピークP0の次のサンプルS5から後のピークP1の前のサンプルS2まで(S5−S2)でもよい。
本発明に係るデジタル音声処理装置の第1の実施の形態を示すブロック図である。 図1のテーブルの構成を示す説明図である。 図1のピーク検出部とピーク間サンプル数検出部の処理を示す説明図である。 図1のピーク間差分値算出部の処理を示す説明図である。 図1の加算部の加算処理を示す説明図である。 図1の加算部の減算処理を示す説明図である。 補正前と補正後の音声信号を示す波形図である。 本発明に係るコンピュータプログラムを示すフローチャートである。 図8のコンピュータプログラムの処理内容を詳しく示す説明図である。 図8のコンピュータプログラムの処理内容を詳しく示す説明図である。 本発明に係るデジタル音声処理装置の第3の実施の形態を示すブロック図である。 図11のテーブルによる補正後の音声信号を示す波形図である。 本発明に係るデジタル音声処理装置の第4の実施の形態を示すブロック図である。 第1〜第4の実施の形態による補正対象サンプルと係数を示す説明図である。 第1〜第4の実施の形態の変形例による補正対象サンプルと係数を示す説明図である。
符号の説明
1 テーブル選択部
2、2a デコード部
3 ピーク検出部
4 ピーク間サンプル数検出部
5、5a テーブル
6 ピーク間差分値算出部
7 乗算部
8 加算部
10 エンコーダ

Claims (15)

  1. 処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
    前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
    前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
    前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプルと、前記第2のピークとその前後のサンプルの各補正対象サンプルの補正係数、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記第1のピークとその前後のサンプルの各補正対象サンプルの補正係数を求めるステップと、
    前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
    前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前後のサンプルを含む各補正対象サンプルの値に対しては加算するとともに、前記極小値とその前後のサンプルを含む各補正対象サンプルの値に対しては減算するステップとを、
    有するデジタル音声処理方法。
  2. 処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求める手段と、
    前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出する手段と、
    前記第1、第2のピーク値の間のピーク間差分を求める手段と、
    前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプルと、前記第2のピークとその前後のサンプルの各補正対象サンプルの補正係数、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記第1のピークとその前後のサンプルの各補正対象サンプルの補正係数をあらかじめ記憶する記憶手段と、
    前記求めたピーク間サンプル数に応じた前記補正対象サンプルと各補正サンプルの補正係数を前記記憶手段から求める手段と、
    前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算する手段と、
    前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前後の各補正対象サンプルに対しては加算するとともに、前記極小値とその前後の各補正対象サンプルに対しては減算する手段とを、
    有するデジタル音声処理装置。
  3. 処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
    前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
    前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
    前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプルと、前記第2のピークとその前後のサンプルの各補正対象サンプルの補正係数、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記第1のピークとその前後のサンプルの各補正対象サンプルの補正係数を求めるステップと、
    前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
    前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前後のサンプルを含む各補正対象サンプルの値に対しては加算するとともに、前記極小値とその前後のサンプルを含む各補正対象サンプルの値に対しては減算するステップとを、
    コンピュータに実行させるコンピュータプログラム。
  4. デジタル音声情報をエンコーダにより圧縮する前に、前記エンコーダの圧縮による前記デジタル音声情報の極大値と極小値及びその前後のサンプルの劣化度合いをプリ・エンファシス処理するデジタル音声処理方法において、
    処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
    前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
    前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
    前記エンコーダの圧縮による前記デジタル音声情報の前記極大値と前記極小値及びその前後のサンプルの劣化度合いと、前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプルと、前記第2のピークとその前後のサンプルの各補正対象サンプルの補正係数、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記第1のピークとその前後のサンプルの各補正対象サンプルの補正係数を求めるステップと、
    前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
    前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前後のサンプルを含む各補正対象サンプルの値に対しては加算するとともに、前記極小値とその前後のサンプルを含む各補正対象サンプルの値に対しては減算して前記エンコーダに出力するステップとを、
    有するデジタル音声処理方法。
  5. デジタル音声情報をエンコーダにより圧縮する前に、前記エンコーダの圧縮による前記デジタル音声情報の極大値と極小値及びその前後のサンプルの劣化度合いをプリ・エンファシス処理するデジタル音声処理装置において、
    処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求める手段と、
    前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出する手段と、
    前記第1、第2のピーク値の間のピーク間差分を求める手段と、
    前記エンコーダの圧縮による前記デジタル音声情報の前記極大値と前記極小値及びその前後のサンプルの劣化度合いと、前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプルと、前記第2のピークとその前後のサンプルの各補正対象サンプルの補正係数、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記第1のピークとその前後のサンプルの各補正対象サンプルの補正係数を求める手段と、
    前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算する手段と、
    前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前後のサンプルを含む各補正対象サンプルの値に対しては加算するとともに、前記極小値とその前後のサンプルを含む各補正対象サンプルの値に対しては減算して前記エンコーダに出力する手段とを、
    有するデジタル音声処理装置。
  6. デジタル音声情報をエンコーダにより圧縮する前に、前記エンコーダの圧縮による前記デジタル音声情報の極大値と極小値及びその前後のサンプルの劣化度合いをプリ・エンファシス処理するコンピュータプログラムにおいて、
    処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
    前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
    前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
    前記エンコーダの圧縮による前記デジタル音声情報の前記極大値と前記極小値及びその前後のサンプルの劣化度合いと、前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプルと、前記第2のピークとその前後のサンプルの各補正対象サンプルの補正係数、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記第1のピークとその前後のサンプルの各補正対象サンプルの補正係数を求めるステップと、
    前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
    前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前後のサンプルを含む各補正対象サンプルの値に対しては加算するとともに、前記極小値とその前後のサンプルを含む各補正対象サンプルの値に対しては減算して前記エンコーダに出力するステップとを、
    コンピュータに実行させるコンピュータプログラム。
  7. 処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
    前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
    前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
    前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプル、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記補正対象サンプルの各補正係数を求めるステップと、
    前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
    前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前若しくは前記極大値の前、又は前記極大値の後若しくは前記極大値とその後を含む各補正対象サンプルの値に対しては加算するとともに、前記極小値の後若しくは前記極小値と前記極小値の後、又は極小値の前若しくは前記極小値と前を含む各補正対象サンプルの値に対しては減算するステップとを、
    有するデジタル音声処理方法。
  8. 処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求める手段と、
    前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出する手段と、
    前記第1、第2のピーク値の間のピーク間差分を求める手段と、
    前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプル、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記補正対象サンプルの各補正係数を求める手段と、
    前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算する手段と、
    前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前若しくは前記極大値の前、又は前記極大値の後若しくは前記極大値とその後を含む各補正対象サンプルの値に対しては加算するとともに、前記極小値の後若しくは前記極小値と前記極小値の後、又は極小値の前若しくは前記極小値と前を含む各補正対象サンプルの値に対しては減算する手段とを、
    有するデジタル音声処理装置。
  9. 処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
    前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
    前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
    前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプル、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記補正対象サンプルの各補正係数を求めるステップと、
    前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
    前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前若しくは前記極大値の前、又は前記極大値の後若しくは前記極大値とその後を含む各補正対象サンプルの値に対しては加算するとともに、前記極小値の後若しくは前記極小値と前記極小値の後、又は極小値の前若しくは前記極小値と前を含む各補正対象サンプルの値に対しては減算するステップとを、
    コンピュータに実行させるコンピュータプログラム。
  10. デジタル音声情報をエンコーダにより圧縮する前に、前記エンコーダの圧縮による前記デジタル音声情報の極大値と極小値及びその前後のサンプルの劣化度合いをプリ・エンファシス処理するデジタル音声処理方法において、
    処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
    前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
    前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
    前記エンコーダの圧縮による前記デジタル音声情報の前記極大値と前記極小値及びその前後のサンプルの劣化度合いと、前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプル、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記補正対象サンプルの各補正係数を求めるステップと、
    前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
    前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前若しくは前記極大値の前、又は前記極大値の後若しくは前記極大値とその後を含む各補正対象サンプルの値に対しては加算するとともに、前記極小値の後若しくは前記極小値と前記極小値の後、又は極小値の前若しくは前記極小値と前を含む各補正対象サンプルの値に対しては減算して前記エンコーダに出力するステップとを、
    有するデジタル音声処理方法。
  11. デジタル音声情報をエンコーダにより圧縮する前に、前記エンコーダの圧縮による前記デジタル音声情報の極大値と極小値及びその前後のサンプルの劣化度合いをプリ・エンファシス処理するデジタル音声処理装置において、
    処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求める手段と、
    前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出する手段と、
    前記第1、第2のピーク値の間のピーク間差分を求める手段と、
    前記エンコーダの圧縮による前記デジタル音声情報の前記極大値と前記極小値及びその前後のサンプルの劣化度合いと、前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプル、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記補正対象サンプルの各補正係数を求める手段と、
    前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算する手段と、
    前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前若しくは前記極大値の前、又は前記極大値の後若しくは前記極大値とその後を含む各補正対象サンプルの値に対しては加算するとともに、前記極小値の後若しくは前記極小値と前記極小値の後、又は極小値の前若しくは前記極小値と前を含む各補正対象サンプルの値に対しては減算して前記エンコーダに出力する手段とを、
    有するデジタル音声処理装置。
  12. デジタル音声情報をエンコーダにより圧縮する前に、前記エンコーダの圧縮による前記デジタル音声情報の極大値と極小値及びその前後のサンプルの劣化度合いをプリ・エンファシス処理するコンピュータプログラムにおいて、
    処理対象のデジタル音声情報の時間的に前後するサンプル値を比較することにより極大値と極小値を含むピーク値を求めるステップと、
    前記求めた各ピーク値に基づいて、隣接する前の第1のピーク値とその後の第2のピーク値の間のピーク間サンプル数を検出するステップと、
    前記第1、第2のピーク値の間のピーク間差分を求めるステップと、
    前記エンコーダの圧縮による前記デジタル音声情報の前記極大値と前記極小値及びその前後のサンプルの劣化度合いと、前記ピーク間サンプル数に応じた、前記第1のピークの後のサンプル及び前記第2のピークとその前のサンプルを含む補正対象サンプル、又は前記第1のピークとその後のサンプル及び前記第2のピークの前のサンプルを含む補正対象サンプルと、前記補正対象サンプルの各補正係数を求めるステップと、
    前記各補正対象サンプルについて、前記ピーク間差分の値と前記各補正係数をそれぞれ乗算するステップと、
    前記各乗算の結果をそれぞれ、前記求めた各ピーク値のうち、前記極大値とその前若しくは前記極大値の前、又は前記極大値の後若しくは前記極大値とその後を含む各補正対象サンプルの値に対しては加算するとともに、前記極小値の後若しくは前記極小値と前記極小値の後、又は極小値の前若しくは前記極小値と前を含む各補正対象サンプルの値に対しては減算して前記エンコーダに出力するステップとを、
    コンピュータに実行させるコンピュータプログラム。
  13. 前記補正対象サンプルと各補正サンプルの補正係数は、前記処理対象のデジタル音声情報の前記極大値と前記極小値及びその前及び/又は後のサンプルの劣化度合いに応じて複数設けられて、その1つが選択可能であることを特徴とする請求項1又は7に記載のデジタル音声処理方法。
  14. 前記補正対象サンプルと各補正サンプルの補正係数は、前記処理対象のデジタル音声情報の前記極大値と前記極小値及びその前及び/又は後のサンプルの劣化度合いに応じて複数設けられて、その1つが選択可能であることを特徴とする請求項2又は8に記載のデジタル音声処理装置。
  15. 前記補正対象サンプルと各補正サンプルの補正係数は、前記処理対象のデジタル音声情報の前記極大値と前記極小値及びその前及び/又は後のサンプルの劣化度合いに応じて複数設けられて、その1つが選択可能であることを特徴とする請求項3又は9に記載のコンピュータプログラム。
JP2007086005A 2006-10-02 2007-03-28 デジタル音声処理方法及びデジタル音声処理装置、並びにコンピュータプログラム Active JP4123486B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007086005A JP4123486B2 (ja) 2006-10-02 2007-03-28 デジタル音声処理方法及びデジタル音声処理装置、並びにコンピュータプログラム
US11/882,569 US8532801B2 (en) 2006-10-02 2007-08-02 Method and apparatus for processing digital audio signal and related computer program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006271293 2006-10-02
JP2007086005A JP4123486B2 (ja) 2006-10-02 2007-03-28 デジタル音声処理方法及びデジタル音声処理装置、並びにコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2008112130A JP2008112130A (ja) 2008-05-15
JP4123486B2 true JP4123486B2 (ja) 2008-07-23

Family

ID=39262010

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007086005A Active JP4123486B2 (ja) 2006-10-02 2007-03-28 デジタル音声処理方法及びデジタル音声処理装置、並びにコンピュータプログラム

Country Status (2)

Country Link
US (1) US8532801B2 (ja)
JP (1) JP4123486B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5023794B2 (ja) * 2007-04-27 2012-09-12 株式会社Jvcケンウッド デジタル音声処理装置及びデジタル音声処理プログラム
JP5023812B2 (ja) * 2007-05-30 2012-09-12 株式会社Jvcケンウッド デジタル音声処理装置及びデジタル音声処理プログラム
US8185815B1 (en) * 2007-06-29 2012-05-22 Ambrosia Software, Inc. Live preview
GB2451828A (en) * 2007-08-13 2009-02-18 Snell & Wilcox Ltd Digital audio processing method for identifying periods in which samples may be deleted or repeated unobtrusively
JP4985570B2 (ja) * 2008-07-08 2012-07-25 株式会社Jvcケンウッド ディジタル音響信号処理方法及び処理装置
JP5392057B2 (ja) * 2009-12-22 2014-01-22 株式会社Jvcケンウッド 音声処理装置、音声処理方法および音声処理プログラム
JP5556673B2 (ja) 2011-01-11 2014-07-23 株式会社Jvcケンウッド 音声信号補正装置、音声信号補正方法及びプログラム
JP5569436B2 (ja) * 2011-03-04 2014-08-13 株式会社Jvcケンウッド 音声信号補正装置、音声信号補正方法及びプログラム
JP6105929B2 (ja) * 2012-12-27 2017-03-29 キヤノン株式会社 音声処理装置及びその制御方法
WO2016063645A1 (ja) * 2014-10-23 2016-04-28 株式会社Jvcケンウッド デジタル音声処理装置、デジタル音声処理方法、デジタル音声処理プログラム
JP6844504B2 (ja) * 2017-11-07 2021-03-17 株式会社Jvcケンウッド デジタル音声処理装置、デジタル音声処理方法、及びデジタル音声処理プログラム
JP7251400B2 (ja) * 2019-08-08 2023-04-04 株式会社Jvcケンウッド デジタル音声処理装置、デジタル音声処理方法、及びデジタル音声処理プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1569225A1 (en) * 1997-10-22 2005-08-31 Victor Company Of Japan, Limited Audio information processing method, audio information processing apparatus, and method of recording audio information on recording medium
JP3659489B2 (ja) * 2000-12-20 2005-06-15 日本ビクター株式会社 デジタル音声処理装置及びコンピュータプログラム記録媒体
JP3888239B2 (ja) 2002-06-20 2007-02-28 日本ビクター株式会社 デジタル音声処理方法及び装置、並びにコンピュータプログラム

Also Published As

Publication number Publication date
JP2008112130A (ja) 2008-05-15
US20080082189A1 (en) 2008-04-03
US8532801B2 (en) 2013-09-10

Similar Documents

Publication Publication Date Title
JP4123486B2 (ja) デジタル音声処理方法及びデジタル音声処理装置、並びにコンピュータプログラム
US11557304B2 (en) Methods and apparatus for performing variable block length watermarking of media
US9704494B2 (en) Down-mixing compensation for audio watermarking
JP5414684B2 (ja) 音声透かし、透かし検出、および透かし抽出を実行する方法および装置
JP5538501B2 (ja) デジタル信号プロセサ
US20170061975A1 (en) Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8355908B2 (en) Audio signal processing device for noise reduction and audio enhancement, and method for the same
JP2007288468A (ja) オーディオ出力装置、パラメータ算出方法
JP2011232754A (ja) オーディオ透かしデコーディングを遂行する方法、装置及び製造物品
JP2015531084A5 (ja)
JP3888239B2 (ja) デジタル音声処理方法及び装置、並びにコンピュータプログラム
US6759585B2 (en) Musical-file-processing apparatus, musical-file-processing method and musical-file-processing method program
JP4224807B2 (ja) 音声信号処理装置及び音声信号処理コンピュータプログラム
US20090165635A1 (en) Digital signal processor and a method for producing harmonic sound
JP2009229921A (ja) 音響信号分析装置
JP5023794B2 (ja) デジタル音声処理装置及びデジタル音声処理プログラム
US10068582B2 (en) Digital audio processing apparatus, digital audio processing method, and digital audio processing program
JP5103606B2 (ja) 信号処理装置
JP5556673B2 (ja) 音声信号補正装置、音声信号補正方法及びプログラム
US8022289B2 (en) Harmonic sound generator and a method for producing harmonic sound
US6654723B1 (en) Transmission system with improved encoder and decoder that prevents multiple representations of signal components from occurring
JP6675806B2 (ja) 違法コンテンツ検知装置、違法コンテンツ検知方法およびプログラム
JP4633022B2 (ja) 楽曲編集装置、及び楽曲編集プログラム。
JP6256293B2 (ja) デジタル音声処理装置、デジタル音声処理方法、デジタル音声処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080208

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20080208

TRDD Decision of grant or rejection written
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20080407

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080411

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080424

R151 Written notification of patent or utility model registration

Ref document number: 4123486

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 5