JP5556673B2 - 音声信号補正装置、音声信号補正方法及びプログラム - Google Patents

音声信号補正装置、音声信号補正方法及びプログラム Download PDF

Info

Publication number
JP5556673B2
JP5556673B2 JP2011003403A JP2011003403A JP5556673B2 JP 5556673 B2 JP5556673 B2 JP 5556673B2 JP 2011003403 A JP2011003403 A JP 2011003403A JP 2011003403 A JP2011003403 A JP 2011003403A JP 5556673 B2 JP5556673 B2 JP 5556673B2
Authority
JP
Japan
Prior art keywords
difference value
value
audio signal
difference
correction coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011003403A
Other languages
English (en)
Other versions
JP2012145716A (ja
Inventor
真巳 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2011003403A priority Critical patent/JP5556673B2/ja
Priority to US13/346,256 priority patent/US8989405B2/en
Priority to EP12150803.0A priority patent/EP2474977B1/en
Publication of JP2012145716A publication Critical patent/JP2012145716A/ja
Application granted granted Critical
Publication of JP5556673B2 publication Critical patent/JP5556673B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音声信号補正装置、音声信号補正方法及びプログラムに関する。
ドラム等の打楽器を打撃した際に生じる衝撃音(以下、アタック音という)は、音の立ち上がりが早く、瞬時に音量(レベル)が変化する。このような音を一旦録音し、再生出力する場合、アタック音が生じたタイミングに瞬時にスピーカが振動しなかったり、復号した音声信号が劣化していたりして、音の立ち上りが遅く、よって、アタック音より立ち上がりが遅い緩やかな音に聞こえる場合がある。この現象が発生する原因としては、スピーカのコイルの巻き数が少ないこと、スピーカを構成するコーン紙が歪んでいること、音声をデジタル化する際の量子化誤差、音声をデジタル圧縮する際の高調波カット等、があげられる。
このアタック音が劣化するという問題を解決するために、音声信号波形の極大と極小を検出し、該極大と極小との間に存在するデジタルデータの数(サンプル数)を検出するとともに極大と極小の値の差分を算出してこれらの値に基づいてテーブルを参照して補正係数を求め、補正係数により波形を補正して音声を再生することでアタック音を強調するアタック音強調装置が提案されている(特許文献1参照)。
特開2008−112130号公報
特許文献1に記載のアタック音強調装置は、データベースに記憶されているサンプルデータに基づいて波形を補正する。このため、補正後のアタック音が元の音声信号の波形に近いとは必ずしもいえない。このため、依然として、音の立ち上がりが遅く、緩やかな音にしか聞こえない場合や、違和感のある音となる場合がある。また、データベースに記憶されているサンプルデータを参照するなど、処理に時間がかかるため、アタック音の再生が遅延し、結果的に、原音を適切に再現することができない場合がある。
このため、アタック音はシャープさに欠け、リアリティに欠けるといった印象を与えることがあった。
本発明は、上記実情に鑑みてなされたものであり、デジタル化や圧縮化により劣化等したアタック音部分を含む音声信号を元の音声信号に近づける補正をすることができる音声信号補正装置、音声信号補正方法及びプログラムを提供することを目的とする。
本発明の第1の観点にかかる音声信号補正装置は、
デジタルステレオ音声信号の左チャネルの音量を示す第1のデジタル音声信号の入力データの値とi(iは自然数)サンプル期間前の入力データの値との差に相当する第1の差分値を求め、前記求められた第1の差分値の絶対値を求める第1の差分値取得手段と、
前記デジタルステレオ音声信号の右チャネルの音量を示す第2のデジタル音声信号の入力データの値とj(jは自然数)サンプル期間前の入力データの値との差に相当する第2の差分値を求め、前記求められた第2の差分値の絶対値を求める第2の差分値取得手段と、
前記第1の差分値取得手段により得られた前記第1の差分値の絶対値と前記第2の差分値取得手段により得られた前記第2の差分値の絶対値とを第1の比率で加算して、第1の補正係数を求め、前記第1の差分値の絶対値と前記第2の差分値の絶対値とを第2の比率で加算して、第2の補正係数を求める補正係数取得手段と、
前記補正係数取得手段により求められた前記第1の補正係数を前記第1のデジタル音声信号に乗算して、前記第1のデジタル音声信号を補正し、前記補正係数取得手段により求められた前記第2の補正係数を前記第2のデジタル音声信号に乗算して、前記第2のデジタル音声信号を補正し、それぞれ出力する補正手段と
を備え
前記補正係数取得手段は、前記第1の差分値と前記第2の差分値とを、前記第1の差分値が前記第2の差分値よりも大きい比率で加算して、前記第1の補正係数を求め、前記第1の差分値と前記第2の差分値とを、前記第2の差分値が前記第1の差分値よりも大きい比率で加算して、前記第2の補正係数を求める、
ことを特徴とする。
また、前記補正係数取得手段により求められる前記第1の補正係数と前記第2の補正係数の変動を抑える時定数調整手段をさらに備えてもよい。
本発明の第2の観点にかかる音声信号補正方法は、
デジタルステレオ音声信号の左チャネルの音量を示す第1のデジタル音声信号の入力データの値と所定サンプル期間前の入力データの値との差に相当する第1の差分値を求め、前記求められた第1の差分値の絶対値を求める第1の差分値取得ステップと、
前記デジタルステレオ音声信号の右チャネルの音量を示す第2のデジタル音声信号の入力データの値と所定サンプル期間前の入力データの値との差に相当する第2の差分値を求め、前記求められた第2の差分値の絶対値を求める第2の差分値取得ステップと、
前記第1の差分値の絶対値前記第2の差分値の絶対値とを第1の比率で加算して、第1の補正係数を求め、前記第1の差分値の絶対値と前記第2の差分値の絶対値とを第2の比率で加算して、第2の補正係数を求める補正係数取得ステップと、
前記第1の補正係数を前記第1のデジタル音声信号に乗算して出力し、前記第2の補正係数を前記第2のデジタル音声信号に乗算して出力する出力ステップと
を備え
前記補正係数取得ステップでは、前記第1の差分値と前記第2の差分値とを、前記第1の差分値が前記第2の差分値よりも大きい比率で加算して、前記第1の補正係数を求め、前記第1の差分値と前記第2の差分値とを、前記第2の差分値が前記第1の差分値よりも大きい比率で加算して、前記第2の補正係数を求める、
ことを特徴とする。
本発明の第3の観点にかかるプログラムは、
コンピュータに、
デジタルステレオ音声信号の左チャネルの音量を示す第1のデジタル音声信号の入力データの値と所定サンプル期間前の入力データの値との差に相当する第1の差分値を求め、前記求められた第1の差分値の絶対値を求める第1の差分値取得手順と、
前記デジタルステレオ音声信号の右チャネルの音量を示す第2のデジタル音声信号の入力データの値と所定サンプル期間前の入力データの値との差に相当する第2の差分値を求め、前記求められた第2の差分値の絶対値を求める第2の差分値取得手順と、
前記第1の差分値の絶対値前記第2の差分値の絶対値とを第1の比率で加算して、第1の補正係数を求め、前記第1の差分値の絶対値と前記第2の差分値の絶対値とを第2の比率で加算して、第2の補正係数を求める補正係数取得手順と、
前記第1の補正係数を前記第1のデジタル音声信号に乗算して出力し、前記第2の補正係数を前記第2のデジタル音声信号に乗算して出力する出力手順と
を実行させ
前記補正係数取得手順では、前記第1の差分値と前記第2の差分値とを、前記第1の差分値が前記第2の差分値よりも大きい比率で加算して、前記第1の補正係数を求め、前記第1の差分値と前記第2の差分値とを、前記第2の差分値が前記第1の差分値よりも大きい比率で加算して、前記第2の補正係数を求める、
ことを特徴とする。
本発明によれば、デジタル化や圧縮化により劣化等したアタック音部分を含む音声信号を元の音声信号に近づける補正をすることができる。
本発明の一実施形態に係るオーディオ再生装置の構成を示すブロック図である。 図1の装置におけるDSPの構成の一例を示すブロック図である。 図1の装置によるアタック音強調処理を説明するための図である。 図1の装置におけるデコーダから出力される音声信号の一例を示す図である。 図1の装置におけるDSPから出力される音声信号の一例を示す図である。 図4と図5の音声信号を重ねた図である。 図1の装置におけるDSPの構成の一例を示すブロック図である。 時定数τを任意の値に設定する構成を例示すブロック図である。 図1の装置におけるアタック音強調処理についてのフローチャートである。
(第1の実施形態)
以下に、本発明の実施形態に係る、音声信号補正機能(例えば、アタック音強調機能)を備えるオーディオ再生装置について図1を参照して説明する。
本実施の形態に係るオーディオ再生装置1は、例えば、デジタルテレビ放送受信機に搭載され、16kHz以上がカットされているAAC(Advanced Audio Coding、先進的音響符号)方式の信号を処理したり、携帯端末に搭載し、8kHz以上がカットされているMP3(MPEG audio layer-3)方式の信号を処理したりすることを想定しており、音源装置100、デコーダ110、DSP120、DAC130及びスピーカ140から構成されている。
音源装置100は、デジタルテレビ放送受信機から構成され、16kHz以上がカットされているAAC(Advanced Audio Coding、先進的音響符号)方式の信号を出力する。或いは、MP3プレーヤから構成され、8kHz以上がカットされているMP3方式の信号を出力する。即ち、音源装置100は、高域成分がカットされた非可逆圧縮音声データを出力する。
音源装置100は、左(L)チャネルと右(R)チャネルの非可逆圧縮音声データを出力する。
デコーダ110は、上述のAAC方式やMP3方式などのうちの1種類の圧縮方式に対応し、音源装置100から供給されたLチャネルとRチャネルの非可逆圧縮音声データを、それぞれの圧縮方式に対応した伸長方式で伸長し、PCM(Pulse Code Modulation、パルス符号変調)のデジタル音声信号にする。伸長されたデジタル音声信号は、DSP120に出力される。伸長されたデジタル音声信号も、高周波成分が欠けたものとなる。
DSP(Digital Signal Processor)120は、デジタル信号処理を行うための演算処理装置であり、デコーダ110により伸長されたLチャネルとRチャネルのデジタル音声信号を、アタック音を強調したデジタル音声信号データに補正して、DAC130に出力する。
DAC(Digital Analog Converter)130は、デジタル音声信号をアナログ音声信号に変換する装置であり、DSP120から供給されたLチャネルとRチャネルの補正済デジタル音声信号をアナログ音声信号に変換し、スピーカ140に出力する。
スピーカ140は、DAC130から供給されたアナログ音声信号を実際の音に変換して音声を出力する。
ここで、DSP120の構成について、図2を参照して更に詳しく説明する。
DSP120は、左チャネルの音声信号SLについて、入力された音声信号SLのデータ(信号素片)を1倍するバッファ111、遅延素子113の出力信号を−1倍するバッファ112、入力された左チャネル音声信号SLを1サンプリング期間遅延して1サンプル前の信号を出力する遅延素子113、バッファ111と112の出力信号を加算する加算器114、加算器114の出力信号を絶対値化する絶対値回路115、絶対値回路115の出力信号を一定の比で増幅するバッファ116と117、バッファ116の出力信号と後述する右チャネルのバッファ127の出力信号とを加算する加算器118、加算器118の出力信号を左チャネルの音声信号SLに乗じてDSP120の左チャネル側の補正済出力SLとする乗算器119を備える。
左チャネルを構成する上述の各部をより詳細に説明する。
ここで、左チャネルの音声信号SLのタイミングtにおけるデータ(信号素片)をSL(t)、その1サンプリング期間前のデータをSL(t−1)とすると、バッファ111は、SL(t)を出力する。
バッファ112は、遅延素子113の出力データSL(t−1)を−1倍して、−SL(t−1)を出力する。
遅延素子113は、データSL(t)の1サンプリング期間前のデータSL(t−1)を出力する。
加算器114は、バッファ111の出力するデータSL(t)とバッファ112の出力するデータ−SL(t−1)を加算し、SL(t)−SL(t−1)を出力する。
絶対値回路115は、加算器114の出力するデータの絶対値|SL(t)−SL(t−1)|を出力する。
バッファ116は、絶対値回路115の出力データ|SL(t)−SL(t−1)|に所定の乗数Aを乗算してA・|SL(t)−SL(t−1)|を出力する。また、バッファ117は、絶対値回路115の出力データ|SL(t)−SL(t−1)|に所定の乗数Bを乗算してB・|SL(t)−SL(t−1)|を出力する。ここで、A>Bであることが望ましい。
加算器118は、バッファ116の出力データA・|SL(t)−SL(t−1)|と、後述するRチャネルのバッファ127の出力データB・|SR(t)−SR(t−1)|と、を加算し、A・|SL(t)−SL(t−1)|+B・|SR(t)−SR(t−1)|を出力する。
乗算器119は、LチャネルのデータSL(t)と加算器118の出力データA・|SL(t)−SL(t−1)|+B・|SR(t)−SR(t−1)|を乗算し、SL(t)・{A・|SL(t)−SL(t−1)|+B・|SR(t)−SR(t−1)|}をDSP120の左チャネル側の出力データとする。
DSP120は、Rチャネルについて、Lチャネルと同様に、入力された音声信号SRのデータを1倍するバッファ121、遅延素子123の出力信号を−1倍するバッファ122、入力された右チャネル音声信号SRを1サンプリング期間遅延して1サンプル前の信号を出力する遅延素子123、バッファ121と122の出力信号を加算する加算器124、加算器124の出力信号を絶対値化する絶対値回路125、絶対値回路125の出力信号を一定の比で増幅するバッファ126と127、バッファ126の出力信号と左チャネルのバッファ117の出力信号とを加算する加算器128、加算器128の出力信号を右チャネル音声信号SRに乗じてDSP120の右チャネル側の補正済出力SRとする乗算器129を備える。
右チャネルを構成する上述の各部をより詳細に説明する。
遅延素子123は、データSR(t)の1サンプリング期間前のデータSR(t−1)を出力する。
バッファ122は、遅延素子123の出力データSR(t−1)を−1倍して、−SR(t−1)を出力する。
加算器124は、バッファ121の出力するデータSR(t)とバッファ122の出力するデータ−SR(t−1)を加算し、SR(t)−SR(t−1)を出力する。
絶対値回路125は、加算器124の出力するデータの絶対値|SR(t)−SR(t−1)|を出力する。
バッファ126は、絶対値回路125の出力データ|SR(t)−SR(t−1)|に乗数Aを乗算してA・|SR(t)−SR(t−1)|を出力する。また、バッファ127は、絶対値回路125の出力データ|SR(t)−SR(t−1)|に所定の乗数Bを乗算してB・|SR(t)−SR(t−1)|を出力する。
加算器128は、バッファ126の出力データA・|SR(t)−SR(t−1)|と、左チャネルのバッファ117の出力データB・|SL(t)−SL(t−1)|と、を加算し、A・|SR(t)−SR(t−1)|+B・|SL(t)−SL(t−1)|を出力する。
乗算器129は、右チャネルのデータSR(t)と加算器128の出力データA・|SR(t)−SR(t−1)|+B・|SL(t)−SL(t−1)|を乗算し、積SR(t)・{A・|SR(t)−SR(t−1)|+B・|SL(t)−SL(t−1)|}をDSP120の左チャネル側の出力データとする。
次に、オーディオ再生装置1の動作を説明する。
音源装置100は、左(L)チャネルと右(R)チャネルの非可逆圧縮音声データを出力する。
デコーダ110は、音源装置100からの左(L)チャネルと右(R)チャネルの非可逆圧縮音声データをデコードし、左(L)チャネルと右(R)チャネルのデジタル音声信号SLとSRに伸長して、DSP120に入力する。
DSP120は、入力されたデジタル音声信号をアタック音が強調されたデジタル音声信号に補正し、出力する。
ここで、左チャネルを例に考えると、タイミングtにおいて音声信号SLのデータSL(t)はバッファ111により1倍される。遅延素子113が保持している1サンプル前のデジタル信号SL(t−1)がバッファ112により−1倍される。バッファ111及び112の出力信号は、加算器114により加算され、SL(t)−SL(t−1)となる。即ち、左チャネルの入力信号SLについて、今回のデータと1サンプル前のデータとの差分xL(t)が得られる。差分xL(t)は、絶対値回路115により絶対値化され|xL(t)|となる。絶対値化された差分|xL(t)|は、バッファ116によりA倍(例えば、0.8倍)に増幅され、A・|xL(t)|となる。加算器118の出力信号は、バッファ116の出力信号と右チャネルの音声信号SRの1サンプル前のデータとの差分xRの絶対値|xR(t)|をB倍に増幅した(例えば、0.2倍)信号B・|xR(t)|とを加算器118により加算し、A・|xL(t)|+B・|xR(t)|となる。加算器118の出力信号は、乗算器119によりデータSL(t)に乗算される。これにより、音声信号SL(t)のレベルが補正され、補正された信号が出力される。
この処理が、順次入力されるデジタル音声データSL(t)、SL(t+1)、SL(t+2)...について実行され、そのレベル調整が行われる。
右チャネルの音声信号SRについても、各要素123〜129により、左チャネルの音声信号と同様にして、音声信号SR(t)のレベルが、サンプル前のデジタル信号との差分xR(t)の絶対値をA倍に増幅した信号と左チャネルの音声信号SLの差分xLの絶対値|xL(t)|をB倍(例えば、0.2倍)で増幅した信号とに基づいて音声信号SRのレベルが補正され、補正された信号が出力される。
スピーカ140は、左チャネルの音声信号と右チャネルの音声信号とを、それぞれ、音に変換して放音する。
ここで、絶対値回路115及び125が出力する差分の絶対値|xL(t)|と|xR(t)|は、1サンプル前の音声データSL(t−1)、SR(t−1)に対する現在の音声データSL(t)、SR(t)の変化量を表すが、この変化量が正で大きいとき、すなわち音が大きく立ち上がるときは、左チャネルの音声データSL(t)に、左チャネルの差分xL(t)の絶対値と右チャネルの音声信号SRに基づく差分xR(t)の絶対値とを重み付け加算した値が乗算されるので、出力される音声信号のレベルは大きくなる。音の立ち上りが小さいときも、同様の処理が実行されるが、差分xL(t)、xR(t)の絶対値が小さいため、出力される音声信号のレベルはほとんど大きくならない。
また、差分のxL(t)とxR(t)とが負でその絶対値が大きいときも出力される音声信号のレベルが大きくなるが同様に処理する。
以上説明したオーディオ再生装置1によるアタック音強調処理によりどのようにアタック音が強調されるかを具体的に説明する。
まず、図3の実線に示すような左チャネルの元波形の信号がLチャネルに入力されたと仮定する。この元波形は、例えば、MP3方式で圧縮された非可逆圧縮音声データがMP3デコーダでデコードされてPCM(Pulse Code Modulation)音声に変換されたものであり、高域が失われ、迫力が無くなった状態のものである。
ここで、DSP120のアタック音強調機能により、現(t)サンプルの波形レベルSL(t)と1つ前(t−1)のサンプルの波形レベルSL(t−1)との差{SL(t)−SL(t−1)}が求められる。さらに、加工処理により、現サンプルのサンプル値が{SL(t)・{A・|SL(t)−SL(t−1)|+B・|SR(t)−SR(t−1)|}に修正される。これにより、図3に示すように、現サンプルのサンプル値が増大される。この修正された値を有する音声データがDAC130に出力される。これにより、アタック音強調加工後のアナログ波形は、実線で示す波形から破線で示す波形に変化し、アタック音が強調されたものとなる。
この修正後の音が出力されることで、シャープで迫力あるアタック音が再生される。
以上説明したオーディオ再生装置1のアタック音強調機能により、どの程度アタック音が強調されるかを説明する。
図4は、デコーダ110から出力される一連の音声信号の一例を示す。なお、横軸は時間[秒]であり、縦軸はレベルを表す。一方、図5は、図4に示す音声信号の入力に対して、DSP120から出力される対応する一連の音声信号を示す。
図6は、図4と図5を重ねた図であり、図中の灰色の曲線CAは、デコーダ110から出力される音声信号を表しており、その背後に重なった黒色の曲線CBはDSP120から出力される音声信号を表している。曲線CAで1サンプル前のデータに対し、レベルが大きく増大しているデータについては、レベルがより大きくなるように補正されていることがわかる。
よって、本実施形態のオーディオ再生装置1によれば、音の立ち上がりが早くて瞬時に音量が変化するアタック音の場合、レベルが瞬時に大きく増大し、よりシャープで明瞭なアタック音として再生される。
また、DSP120において、フィルタを使用していないので、位相による遅れや位相周りを生じさせることなく、かつ、非常に軽い処理によって音声信号をリアルタイムに補正することができる。また、音の立ち上りが大きいときに、レベルがより大きくなるような補正を行うようにしているので、スピーカ140の変換損失等の特性を考慮した出力を行うことができる。また、帰還回路が無いので、発振することなく、安定した出力を得ることができる。さらに、左右片方の音声信号のレベル差のみに基づいて音声信号を補正するのではなく、左右両方の音声信号のレベル差に基づいて音声信号を補正しているので、音像が左右にぶれることなくかつレベルが瞬時に大きくなるよう補正することができるため、よりリアルにアタック音を再生することができる。
すなわち、本実施形態のオーディオ再生装置1は、音声信号のアタック音部分をより原音(元の音声信号)の波形に近づける補正をして、アタック音をよりシャープで明瞭にかつリアリティのある音として再生することができる。また、本実施形態のオーディオ再生装置1は、アタック音をより原音に近い形態で再生することができる。
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。
本実施形態に係るオーディオ再生装置2の基本構成は、第1の実施形態に係るオーディオ再生装置1の基本構成と同一であり、図1に示されている。
ただし、DSP120の機能構成は第1の実施形態と異なっており、図7に示すとおり、第1の実施形態のDSP120の構成に対して、時定数回路11Aと12Aが追加された構成を有している。
時定数回路11Aは加算器118と乗算器119との間に、時定数回路12Aは加算器128と乗算器129との間に設けられており、時定数回路11Aは、加算器118の出力信号を入力し、反応速度を変化させて乗算器119に信号を出力し、時定数回路12Aは、加算器128の出力信号を入力し、反応速度を変化させて乗算器129に信号を出力する。
反応速度を遅らせる手法は任意である。例えば、時定数回路11A、11Bは、入力データを遅延して出力してもよい。また、時定数回路11A、11Bは、例えば、入力データを積分して出力したり、入力信号の高周波分を抑圧して出力したりしてもよい。
本実施形態の動作は、第1の実施形態における動作と基本的に同じであるが、本実施形態の構成にすると、信号の立ち上がりの早さ(反応速度)を変化させることができる。すなわち、動特性を変化させることができる。つまり差分xL(t)とxR(t)のレベル差が大きいとき、検出したときから加工し、加工し始めてから一定時間の間で徐々に加工量を減らすという変化を調節するということである。そして、時定数回路11A、12Aの時定数を調整することにより、以下のような効果を得ることができる。
すなわち、時定数を小さくして反応速度を早くすると、信号の立ち上がりが早くなるため、アタック音など急激に変化する音を適切に出力することができるが、音声の再現性が低下してしまう。
これに対して、時定数を大きくして反応速度を遅くすると、信号の立ち上がりが遅くなるため、アタック音など急激に変化する音を最適には出力することができなくなるが、音声の再現性が向上する。
ここで言及している再現性とは立ち上がりしているポイントのみ加工すると加工以降の音のつながりが崩れ、違和感が出やすくなり、立ち上がりしているポイントと、その後の音を加工するとつながりがスムーズになり違和感がなくなる、ということである。
図8に示すように、設定回路12を配置し、時定数回路11A、11Bの時定数τを適宜変更設定できるように構成してもよい。
設定回路12は、例えば、ユーザからの入力指示により、応答して時定数τを設定する。設定回路12は、例えば、ユーザからのユーザIDの入力に応答して、ユーザIDに予め対応付けられている時定数τを設定する。
或いは、設定回路12は、例えば、音源装置100から供給される再生信号のジャンル情報に基づいて、ジャンルに予め対応付けられている時定数τを設定する。
本実施形態に係る機器によれば、高音域の抜けの度合いや曲のジャンルなどに応じて、ユーザの好みに合致した反応速度に設定することができる。
(第3の実施形態)
第1および第2の実施形態では、DSP120を用いてオーディオ再生装置を実現したが、通常のプロセッサ(CPU)を使用しても、同様の機能が実現可能である。この場合、オーディオ再生装置内に後述する処理を実行させるプログラムを記憶したRAM、ROM等の記憶媒体を配置することが望ましく、CPU、RAM及びROMが協働して動作することで、後述する処理を実現する。
この場合の回路構成は、DSP120をCPUに置換する以外は図1に示す構成と共通である。
次に、本実施形態におけるCPUの動作であるアタック音強調処理について図9を参照して説明する。
まず、タイミングを示す変数tに0を代入する(ステップS101)。
次に、左右それぞれの音声信号SL(t)とSR(t)を入力し、変数tと関連づけて記憶する(ステップS102)。
変数tが0かどうか判別する(ステップS103)。
変数tが0であると判別した場合(ステップS103:YES)、左右各チャネルの音声データが1つしかなく、差分を求めることができないため、tを+1して(ステップS104)、ステップS102からの処理を再度実行する。
これに対して、ステップS103で、変数tが0でないと判別した場合(ステップS103:NO)、左右両チャネルについて、今回取得した音声データSL(t)とSR(t)と1サンプル前に入力された音声信号データSL(t−1)、SR(t−1)との差分の絶対値xL(t)=|SL(t)−SL(t−1)|とXR(t)=|SR(t)−SR(t−1)|を算出する(ステップS105)。
次に、左チャネルと右チャネルを組み合わせて乗数ML(t)=A・xL(t)+B・xRとMR(t)=A・xR(t)+B・xLを求め、記憶する(ステップS106)。
次に、乗数MLとMRのうち、時定数τに対応するものを選択する。例えば、時定数τがnサンプリングクロック期間の場合、ML(t−n)、MR(t−n)を選択する(ステップS107)。
続いて、選択したML(t−n)、MR(t−n)を、入力音声データSL(t)、SR(t)に乗算することにより、出力信号OL(t)とOR(t)を求める(ステップS108)。
続いて、次サンプルの音声データが存在するかどうか判別する(ステップS109)。
そして、次サンプルの音声データが存在すると判別した場合(ステップS109:YES)、ステップS102にリターンして、上述の処理を再度実行し、次サンプルの音声データが存在しないと判別した場合(ステップS109:NO)、アタック音強調処理を終了する。
このような構成によっても、非可逆性圧縮等の原因により劣化したアタック音を強調した補正を行うことができる。
なお、本発明は上記実施形態に限定されることなく、適宜変形して実施することができる。
上記実施の形態においては、左チャネル音声信号SLと右チャネルの音声信号SRの変換を抽出するための、連続する2つの音声データ間の差分を求めているが、この発明はこれに限定されず、左チャネル音声信号と右チャネル音声信号SRの変化量を表す実質的な差分値を求めることができれば、その手法は任意である。
例えば、左右のチャンネルにおいて、遅延素子を複数段(n個)ずつ設け、1サンプル前、2サンプル前、・・・、nサンプル前のデータそれぞれとの差分を総合的に考慮して出力信号を補正してもよい。
具体的には、例えば、遅延素子113をシーケンシャルに複数配置し、加算器114が、xL(t)=W1・(SL(t)−SL(t−1))+W2・(SL(t−1)−SL(t−2))+・・・+Wn・(SL(t−n+1)−SL(t−n))を求めて出力するように構成してもよい。同様に、加算器114が、xL(t)=W1・(SL(t)−SL(t−1))+W2・(SL(t)−SL(t−2))+・・・+Wn・(SL(t)−SL(t−n))を求めて出力するように構成してもよい。なお、重みW1〜Wnは、任意に設定される。右チャネルの加算器124についても同様である。
さらに、加算器114がΣWij・{(SL(t−i)−SL(t−j))(i=0〜n+1、j=1〜n;i<j)を求めるようにしてもよい。
また、例えば、1〜nサンプル前のデータそれぞれとの差分の平均値や最大値を差分xとして適用して出力信号を補正するようにしてもよい。
絶対値回路115、125を取り除くことも可能である。
定数AとBは、上述した例に限定されず、任意に変更可能である。ただし、A>Bの関係を維持することが望ましい。また、左チャネル用と右チャネル用で異なる定数(比率)を使用することも可能である。
上記実施形態においては、入力した音声信号と加算器118,128で得られた補正係数を乗算しているが、得られた補正係数を基礎として、他の要素を加味して得られた値を乗算するようにしてもよい。例えば、加算器118、128で得られた値に所定のバイアス値を加算した値を補正係数とし、これを入力音声信号に乗算してもよい。
また、音源装置100から供給される音声データが非可逆圧縮音声データであるか可逆圧縮音声データであるかを判別し、非可逆圧縮音声データである場合には、図2又は図6に例示するアタック補正回路で補正を施してアタック音を強調し、可逆圧縮音声データである場合には、アタック補正回路をスルーする(補正を施さない)、ように切り替えるスイッチを配置してもよい。
また、本実施形態に係るオーディオ再生装置1、2は、専用のシステムや回路によらず、通常のコンピュータシステムを用いて実現可能である。たとえば、上述の動作を実行するためのプログラムを、コンピュータが読み取り可能な記録媒体(フレキシブルディスク、CD−ROM、DVD−ROM等)に格納して配布し、このプログラムをコンピュータにインストールすることにより、上述の処理を実行するオーディオ再生装置1、2を構成してもよい。また、インターネット等の通信ネットワーク上のサーバ装置が有する記憶装置にこのプログラムを格納しておき、通常のコンピュータシステムがダウンロード等することでオーディオ再生装置1、2を構成してもよい。
また、オーディオ再生装置1、2の機能を、OS(オペレーティングシステム)とアプリケーションプログラムの分担、またはOSとアプリケーションプログラムとの協働により実現する場合などには、アプリケーションプログラム部分のみを記録媒体や記憶装置に格納してもよい。
また、搬送波にプログラムを重畳し、通信ネットワークを介して配信することも可能である。たとえば、通信ネットワーク上の掲示板(BBS:Bulletin Board System)にこのプログラムを掲示し、ネットワークを介してプログラムを配信してもよい。そして、このプログラムを起動し、OSの制御下で、他のアプリケーションプログラムと同様に実行することにより、上述の処理を実行できるように構成してもよい。
1、2 オーディオ再生装置
11A、12A 時定数回路
12 設定回路
100 音源装置
110 デコーダ
111、112、116、117、121、122、126、127 バッファ
113、123 遅延素子
114、118,124、128 加算器
115、125 絶対値回路
119、129 乗算器
120 DSP
130 DAC
140 スピーカ

Claims (4)

  1. デジタルステレオ音声信号の左チャネルの音量を示す第1のデジタル音声信号の入力データの値とi(iは自然数)サンプル期間前の入力データの値との差に相当する第1の差分値を求め、前記求められた第1の差分値の絶対値を求める第1の差分値取得手段と、
    前記デジタルステレオ音声信号の右チャネルの音量を示す第2のデジタル音声信号の入力データの値とj(jは自然数)サンプル期間前の入力データの値との差に相当する第2の差分値を求め、前記求められた第2の差分値の絶対値を求める第2の差分値取得手段と、
    前記第1の差分値取得手段により得られた前記第1の差分値の絶対値と前記第2の差分値取得手段により得られた前記第2の差分値の絶対値とを第1の比率で加算して、第1の補正係数を求め、前記第1の差分値の絶対値と前記第2の差分値の絶対値とを第2の比率で加算して、第2の補正係数を求める補正係数取得手段と、
    前記補正係数取得手段により求められた前記第1の補正係数を前記第1のデジタル音声信号に乗算して、前記第1のデジタル音声信号を補正し、前記補正係数取得手段により求められた前記第2の補正係数を前記第2のデジタル音声信号に乗算して、前記第2のデジタル音声信号を補正し、それぞれ出力する補正手段と
    を備え
    前記補正係数取得手段は、前記第1の差分値と前記第2の差分値とを、前記第1の差分値が前記第2の差分値よりも大きい比率で加算して、前記第1の補正係数を求め、前記第1の差分値と前記第2の差分値とを、前記第2の差分値が前記第1の差分値よりも大きい比率で加算して、前記第2の補正係数を求める、
    ことを特徴とする音声信号補正装置。
  2. 前記補正係数取得手段により求められる前記第1の補正係数と前記第2の補正係数の変動を抑える時定数調整手段をさらに備える、
    ことを特徴とする請求項に記載の音声信号補正装置。
  3. デジタルステレオ音声信号の左チャネルの音量を示す第1のデジタル音声信号の入力データの値と所定サンプル期間前の入力データの値との差に相当する第1の差分値を求め、前記求められた第1の差分値の絶対値を求める第1の差分値取得ステップと、
    前記デジタルステレオ音声信号の右チャネルの音量を示す第2のデジタル音声信号の入力データの値と所定サンプル期間前の入力データの値との差に相当する第2の差分値を求め、前記求められた第2の差分値の絶対値を求める第2の差分値取得ステップと、
    前記第1の差分値の絶対値前記第2の差分値の絶対値とを第1の比率で加算して、第1の補正係数を求め、前記第1の差分値の絶対値と前記第2の差分値の絶対値とを第2の比率で加算して、第2の補正係数を求める補正係数取得ステップと、
    前記第1の補正係数を前記第1のデジタル音声信号に乗算して出力し、前記第2の補正係数を前記第2のデジタル音声信号に乗算して出力する出力ステップと
    を備え
    前記補正係数取得ステップでは、前記第1の差分値と前記第2の差分値とを、前記第1の差分値が前記第2の差分値よりも大きい比率で加算して、前記第1の補正係数を求め、前記第1の差分値と前記第2の差分値とを、前記第2の差分値が前記第1の差分値よりも大きい比率で加算して、前記第2の補正係数を求める、
    ことを特徴とする音声信号補正方法。
  4. コンピュータに、
    デジタルステレオ音声信号の左チャネルの音量を示す第1のデジタル音声信号の入力データの値と所定サンプル期間前の入力データの値との差に相当する第1の差分値を求め、前記求められた第1の差分値の絶対値を求める第1の差分値取得手順と、
    前記デジタルステレオ音声信号の右チャネルの音量を示す第2のデジタル音声信号の入力データの値と所定サンプル期間前の入力データの値との差に相当する第2の差分値を求め、前記求められた第2の差分値の絶対値を求める第2の差分値取得手順と、
    前記第1の差分値の絶対値前記第2の差分値の絶対値とを第1の比率で加算して、第1の補正係数を求め、前記第1の差分値の絶対値と前記第2の差分値の絶対値とを第2の比率で加算して、第2の補正係数を求める補正係数取得手順と、
    前記第1の補正係数を前記第1のデジタル音声信号に乗算して出力し、前記第2の補正係数を前記第2のデジタル音声信号に乗算して出力する出力手順と
    を実行させ
    前記補正係数取得手順では、前記第1の差分値と前記第2の差分値とを、前記第1の差分値が前記第2の差分値よりも大きい比率で加算して、前記第1の補正係数を求め、前記第1の差分値と前記第2の差分値とを、前記第2の差分値が前記第1の差分値よりも大きい比率で加算して、前記第2の補正係数を求める、
    ことを特徴とするコンピュータプログラム。
JP2011003403A 2011-01-11 2011-01-11 音声信号補正装置、音声信号補正方法及びプログラム Active JP5556673B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011003403A JP5556673B2 (ja) 2011-01-11 2011-01-11 音声信号補正装置、音声信号補正方法及びプログラム
US13/346,256 US8989405B2 (en) 2011-01-11 2012-01-09 Audio signal correction apparatus, audio signal correction method, and audio signal correction program
EP12150803.0A EP2474977B1 (en) 2011-01-11 2012-01-11 Audio signal correction apparatus, audio signal correction method, and audio signal correction program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011003403A JP5556673B2 (ja) 2011-01-11 2011-01-11 音声信号補正装置、音声信号補正方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2012145716A JP2012145716A (ja) 2012-08-02
JP5556673B2 true JP5556673B2 (ja) 2014-07-23

Family

ID=45464428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011003403A Active JP5556673B2 (ja) 2011-01-11 2011-01-11 音声信号補正装置、音声信号補正方法及びプログラム

Country Status (3)

Country Link
US (1) US8989405B2 (ja)
EP (1) EP2474977B1 (ja)
JP (1) JP5556673B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6105929B2 (ja) * 2012-12-27 2017-03-29 キヤノン株式会社 音声処理装置及びその制御方法
US10332543B1 (en) * 2018-03-12 2019-06-25 Cypress Semiconductor Corporation Systems and methods for capturing noise for pattern recognition processing

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4405831A (en) * 1980-12-22 1983-09-20 The Regents Of The University Of California Apparatus for selective noise suppression for hearing aids
US5692050A (en) * 1995-06-15 1997-11-25 Binaura Corporation Method and apparatus for spatially enhancing stereo and monophonic signals
JP4165578B2 (ja) * 1997-02-25 2008-10-15 日本ビクター株式会社 デジタルオーディオ信号処理用記録媒体、デジタルオーディオ信号用の通信方法及び受信方法、並びにデジタルオーディオ記録媒体
WO2000057671A2 (de) * 1999-03-19 2000-09-28 Siemens Aktiengesellschaft Verfahren und einrichtung zum aufnehmen und bearbeiten von audiosignalen in einer störschallerfüllten umgebung
TW510143B (en) * 1999-12-03 2002-11-11 Dolby Lab Licensing Corp Method for deriving at least three audio signals from two input audio signals
US7630507B2 (en) * 2002-01-28 2009-12-08 Gn Resound A/S Binaural compression system
US7353169B1 (en) * 2003-06-24 2008-04-01 Creative Technology Ltd. Transient detection and modification in audio signals
JP2006100869A (ja) * 2004-09-28 2006-04-13 Sony Corp 音声信号処理装置および音声信号処理方法
KR100636241B1 (ko) * 2005-06-16 2006-10-19 삼성전자주식회사 능동적 로드 검출 스위칭 모드 파워 서플라이 및 그 스위칭방법
JP2007036710A (ja) 2005-07-27 2007-02-08 Victor Co Of Japan Ltd アタック信号増幅デジタル信号処理装置
JP4479644B2 (ja) * 2005-11-02 2010-06-09 ソニー株式会社 信号処理装置および信号処理方法
JP4123486B2 (ja) 2006-10-02 2008-07-23 日本ビクター株式会社 デジタル音声処理方法及びデジタル音声処理装置、並びにコンピュータプログラム
JP5023812B2 (ja) * 2007-05-30 2012-09-12 株式会社Jvcケンウッド デジタル音声処理装置及びデジタル音声処理プログラム
JP2010020122A (ja) * 2008-07-11 2010-01-28 Victor Co Of Japan Ltd ディジタル音響信号処理方法及び処理装置
JP4811475B2 (ja) * 2009-02-27 2011-11-09 ソニー株式会社 録音装置、録音方法、音声信号補正回路及びプログラム
JP2010219836A (ja) * 2009-03-17 2010-09-30 Kenwood Corp 音声信号補正装置及び方法

Also Published As

Publication number Publication date
US20120177220A1 (en) 2012-07-12
US8989405B2 (en) 2015-03-24
EP2474977A1 (en) 2012-07-11
EP2474977B1 (en) 2017-10-04
JP2012145716A (ja) 2012-08-02

Similar Documents

Publication Publication Date Title
JP4747835B2 (ja) オーディオ再生の効果付加方法およびその装置
US9014397B2 (en) Signal processing device and signal processing method
JP2008134582A (ja) 音声処理方法および音声処理装置
WO2012111043A1 (ja) 信号処理方法、信号処理装置、再生装置およびプログラム
JPWO2009004718A1 (ja) 楽音強調装置、楽音強調方法、楽音強調プログラムおよび記録媒体
KR20130007439A (ko) 신호 처리 장치, 신호 처리 방법 및 프로그램
KR20140017639A (ko) 부가적인 출력 채널들을 제공하기 위하여 스테레오 출력 신호를 발생시키기 위한 장치와 방법 및 컴퓨터 프로그램
JP5556673B2 (ja) 音声信号補正装置、音声信号補正方法及びプログラム
JP3888239B2 (ja) デジタル音声処理方法及び装置、並びにコンピュータプログラム
JP2007329631A (ja) 音響補正装置
WO2009116150A1 (ja) 倍音生成装置、音響装置及び倍音生成方法
JP5565405B2 (ja) 音響処理装置および音響処理方法
WO2007116755A1 (ja) 倍音生成装置、デジタル信号処理装置及び倍音生成方法
JP4797065B2 (ja) オーディオ信号処理装置及びサラウンド信号生成方法等
JP5375861B2 (ja) オーディオ再生の効果付加方法およびその装置
JP5213733B2 (ja) 送信装置、受信装置、送信方法、受信方法
JP5611029B2 (ja) 音響装置及び出力音制御方法
JP5958378B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法およびプログラム
JP5145733B2 (ja) 音声信号処理装置および音声信号処理方法ならびにプログラム
JP4852612B2 (ja) 倍音生成装置及び倍音生成方法
JP5569436B2 (ja) 音声信号補正装置、音声信号補正方法及びプログラム
US11076252B2 (en) Audio signal processing apparatus and audio signal processing method
JP6313629B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法およびプログラム
JP6196437B2 (ja) 受信機、及びプログラム
JP2018088689A (ja) 楽曲再生装置及び音響信号処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130628

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140520

R150 Certificate of patent or registration of utility model

Ref document number: 5556673

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150