JP5136378B2 - 音響処理方法 - Google Patents

音響処理方法 Download PDF

Info

Publication number
JP5136378B2
JP5136378B2 JP2008313155A JP2008313155A JP5136378B2 JP 5136378 B2 JP5136378 B2 JP 5136378B2 JP 2008313155 A JP2008313155 A JP 2008313155A JP 2008313155 A JP2008313155 A JP 2008313155A JP 5136378 B2 JP5136378 B2 JP 5136378B2
Authority
JP
Japan
Prior art keywords
spectrum
band
attenuation amount
peak
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008313155A
Other languages
English (en)
Other versions
JP2010141396A (ja
Inventor
猛 大谷
太郎 外川
恭士 大田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008313155A priority Critical patent/JP5136378B2/ja
Priority to EP09176311A priority patent/EP2200340A1/en
Priority to US12/625,664 priority patent/US20100142727A1/en
Priority to KR1020090120981A priority patent/KR101084406B1/ko
Priority to CN2009102580195A priority patent/CN101751929B/zh
Publication of JP2010141396A publication Critical patent/JP2010141396A/ja
Application granted granted Critical
Publication of JP5136378B2 publication Critical patent/JP5136378B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/09Electronic reduction of distortion of stereophonic sound systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

本発明は、音響処理方法に関し、特に入力信号のダイナミックレンジを圧縮する音響処理方法に関する。
従来から、携帯端末などに内蔵されるスピーカを用いて大きな音を再生する場合、クリッピングによる音の歪みを抑えつつ出力する音声を大きくするため、ダイナミックレンジ圧縮という技術が研究されている。
ダイナミックレンジ圧縮とは入力信号の振幅範囲を小さくする技術である。図1は、従来技術におけるダイナミックレンジ圧縮の使用例を示す図である。図1に示すように、まず、ダイナミックレンジ圧縮部1は入力信号に対してダイナミックレンジ圧縮を行う。次に、D/A変換器2は、デジタルオーディオ信号をアナログオーディオ信号に変換する。次に、アンプ3は、アナログオーディオ信号をスピーカ4駆動用に増幅する。スピーカ4は、アンプ3により増幅されたアナログオーディオ信号を入力し再生する。
このダイナミックレンジ圧縮の一例として、入力信号のInput Levelを測定し、Input Levelが大きい部分を減衰させ、小さい部分を増幅する技術が開示されている(非特許文献1)。
図2は、従来技術(非特許文献1)におけるダイナミックレンジ圧縮の例を示す図である。図2に示す例では、音量の大きい部分Aを減衰させ、音量の小さい部分Bを増幅させて入力信号のゲインを制御してダイナミックレンジを圧縮し、クリッピングによる音の歪みを抑えつつ出力する音声を大きくすることができる。
「Dolby DigitalEncoding Technique 第2回『ダイナミック・レンジ・コンプレッションについて』」、[online]、インターネット<URL:http://www.dolby.co.jp/professional/studio/dvd_authoring03.html>
しかしながら、従来技術で求めたゲインを入力信号に乗算すると、クリッピングによる音の歪みを抑えることはできるが、時間領域で波形を変形させるので全周波数帯域に影響を及ぼし、音質が低下してしまうという問題がある。この問題について図3及び図4を用いて説明する。図3は、従来技術におけるゲイン制御前後の時間信号波形の一例を示す図である。図3に示すように、ゲイン制御後の時間信号Bは、ゲイン制御前の時間信号Aと比べて振幅範囲が狭くなっている。
図4は、従来技術におけるゲイン制御前後のスペクトル波形の一例を示す図である。図4に示すように、ゲイン制御後のパワースペクトルBは、ゲイン制御前のパワースペクトルAと比べて、高周波の領域において増幅される帯域が存在する。この増幅された帯域については、音声を再生した際、異音として知覚されてしまうため、音質が劣化することになる。
そこで、本発明は上記点に鑑みてなされたものであり、音質劣化を防ぎながら、ダイナミックレンジを圧縮することができる音響処理方法を提供することを目的とする。
本発明の実施の形態における一局面の音響処理方法は、入力信号を周波数変換してスペクトルを算出する周波数変換段階と、前記入力信号の最大振幅を取得する振幅取得段階と、前記最大振幅を用いて目標減衰量を算出する目標減衰量算出段階と、前記スペクトルのピーク帯域を算出するピーク算出段階と、前記目標減衰量と前記ピーク帯域とに基づいて、前記スペクトルの各帯域の減衰量を算出する減衰量算出段階と、前記各帯域の減衰量を用いて前記スペクトルを減衰させることにより前記スペクトルをレベル補正するレベル補正段階と、前記レベル補正段階によりレベル補正されたスペクトルを周波数逆変換して出力信号を算出する周波数逆変換段階とを有する。
また、本発明の実施の形態における他の局面の音響処理方法は、入力信号を周波数変換してスペクトルを算出する周波数変換段階と、前記スペクトルのピーク帯域を算出するピーク算出段階と、前記ピーク帯域のパワースペクトル値を用いて目標減衰量を算出する目標減衰量算出段階と、前記目標減衰量と前記ピーク帯域とに基づいて、前記スペクトルの各帯域の減衰量を算出する減衰量算出段階と、前記各帯域の減衰量を用いて前記スペクトルを減衰させることにより前記スペクトルをレベル補正するレベル補正段階と、前記レベル補正段階によりレベル補正されたスペクトルを周波数逆変換して出力信号を算出する周波数逆変換段階とを有する。
上述の如く、音質劣化を防ぎながら、ダイナミックレンジを圧縮することができる音響処理方法を提供することができる。
次に、本発明を実施するための最良の形態を、以下の実施例に基づき図面を参照しつつ説明していく。
[実施例1]
<主要構成>
図5は、実施例1における音響処理装置の一構成例を示す図である。図5に示す例では、音響処理装置をIP(Internet Protocol)電話機に適用することを想定している。図5に示す音響処理装置は、パケット受信部10、デコード部11、ダイナミックレンジ圧縮部12、アンプ13、スピーカ14を含む。
パケット受信部10は、音声信号を符号化したデータを有するパケットを、ネットワークを介して受信し、受信したパケットをデコード部11に出力する。デコード部11は、パケット受信部10から取得したパケットに含まれるデータを復号化し、復号化した音声信号をダイナミックレンジ圧縮部12に出力する。なお、このデコード部11はIP電話機に一般的に用いられるものであるため、その詳細な説明は省略する。
ダイナミックレンジ圧縮部12は、デコード部11から入力された音声信号(以下、入力信号という)のダイナミックレンジを圧縮する。ダイナミックレンジ圧縮の仕方については後述する。また、ダイナミックレンジ圧縮部12は、ダイナミックレンジが圧縮された音声信号をアンプ13に出力する。
アンプ13は、ダイナミックレンジ圧縮部12から入力された音声信号をスピーカ14駆動用に増幅し、増幅後の音声信号をスピーカ14に出力する。スピーカ14は、アンプ13から入力された音声信号を発音する。
次に、ダイナミックレンジ圧縮部12について図6を用いて詳細に説明する。図6は、実施例1におけるダイナミックレンジ圧縮部12の一構成例を示す図である。図6に示すダイナミックレンジ圧縮部12は、分割部121、最大振幅取得部122、目標ゲイン算出部123、周波数変換部124、パワースペクトル算出部125、スペクトルピーク算出部126、ゲイン算出部127、レベル補正部128、周波数逆変換部129を含む。
分割部121は、入力信号を取得してフレーム(一定時間)毎に分割する。分割後のフレームは、分割部121により最大振幅取得部122及び周波数変換部124に出力される。
最大振幅取得部122は、分割部121から入力されたフレーム内の入力信号における最大振幅値を式(1)により取得する。
Pmax=max(|x(n)|) 式(1)
ここで、Pmaxはフレーム内の最大振幅値、x(n)はフレーム内の入力信号を表す。また、最大振幅取得部122は、取得した最大振幅値Pmaxを目標ゲイン算出部123に出力する。
目標ゲイン算出部123は、最大振幅取得部122から入力された最大振幅値に基づいて目標減衰量(目標ゲイン値)を条件式(2)により算出する。以下、減衰量は、その単位についてデシベル(dB)を例にして説明する。
Figure 0005136378
ここで、G_targetは目標減衰量、THR1は第一の閾値を表す。第一の閾値はスピーカの特性に応じて事前に与えられる値である。また、目標ゲイン算出部123は、算出した目標減衰量をゲイン算出部127に出力する。
次に、周波数変換部124は、入力信号に対してフレーム毎に時間周波数変換を行う。時間周波数変換は、離散フーリエ変換(DFT)や高速フーリエ変換(FFT)など時間領域を周波数領域に変換できる変換式を用いる。実施例1ではFFT変換を用いることにする。なお、FFT変換は一般的な式を用いるため、その詳細な説明は省略し、FFT変換後のスペクトルをX(f)と表す。また、周波数変換部124は、周波数変換後のスペクトルX(f)を入力スペクトルとしてパワースペクトル算出部125及びレベル補正部128に出力する。
パワースペクトル算出部125は、周波数変換部124から入力された入力スペクトルからパワースペクトルを式(3)により算出する。
Figure 0005136378
ここで、Amp(f)はパワースペクトルを表し、パワースペクトルは対数パワースペクトルを表す。また、パワースペクトル算出部125は、算出したパワースペクトルをスペクトルピーク算出部126及びゲイン算出部127に出力する。
スペクトルピーク算出部126は、パワースペクトル算出部125から入力されたパワースペクトルに基づいて、スペクトルピークのパワースペクトル値(以下、単にパワー値ともいう)を式(4)により取得する。また、スペクトルピーク算出部126は、パワースペクトルに基づいてスペクトルピークの周波数を式(5)により算出する。
Amp_peak=max(Amp(f)) 式(4)
f_peak=argmax(Amp(f)) 式(5)
ここで、Amp_peakはスペクトルピークのパワー値、f_peakはスペクトルピークの周波数を表す。また、スペクトルピーク算出部126は、式(4)及び式(5)により求めたスペクトルピークのパワー値及び周波数をゲイン算出部127に出力する。
ゲイン算出部127は、パワースペクトル算出部125から入力されたパワースペクトルAmp(f)と、スペクトルピーク算出部126から入力されたスペクトルピークのパワー値Amp_peakと、目標ゲイン算出部123から入力された目標減衰量G_targetと、第二閾値とに基づいて、各周波数帯域の減衰量(ゲイン値)を以下の条件式(6)により算出する。
Figure 0005136378
ここで、G(f)は各周波数帯域の減衰量、THR2は第二閾値を表す。第二閾値は、スペクトルのパワー値を減衰させる範囲を決める値であり、予め与えられる値とする。
ここで、条件式(6)について図7を用いて説明する。図7は、パワースペクトルと減衰量との関係式を示す図である。つまり、図7は、条件式(6)を図式化した図である。図7に示すように、各周波数帯域での減衰量は、各周波数帯域におけるスペクトルのパワー値とスペクトルピークのパワー値との差分に比例して、目標減衰量から小さくなっている。
ただし、各スペクトルのパワー値とスペクトルピークのパワー値の差分が第二閾値以下であることを条件とし、この差分が第二閾値より大きい場合は減衰量を0とする。これより、目標減衰量が決まれば、各スペクトルのパワー値とスペクトルピークのパワー値の差分を求めるだけで各周波数帯域の減衰量を決めることができる。
なお、この差分が第二閾値よりも大きい場合に減衰量を0とする理由は、もともとの入力信号の振幅がそれほど大きくないところを減衰させる必要はないからである。図6に戻り、ゲイン算出部127は、算出した各周波数帯域での減衰量G(f)をレベル補正部128に出力する。
レベル補正部128は、周波数変換部124から入力された入力スペクトルと、ゲイン算出部127から入力された各周波数帯域での減衰量とに基づいて、式(7)により、レベル補正後のスペクトルを算出する。
Figure 0005136378
ここで、Y(f)はレベル補正後のスペクトルを表す。図8は、実施例1における入力スペクトルとレベル補正後のスペクトルとの関係を示す図である。図8に示すように、ゲイン算出部127により求められた各周波数帯域の減衰量を入力スペクトルから減衰させることでレベル補正後のスペクトルが得られる。
また、図9は、図8に示した例における周波数毎のゲインを示す図である。図9に示すように、実施例1では、各スペクトルピークの周辺においてゲイン制御が行われる。図6に戻り、レベル補正部128は、算出したレベル補正後のスペクトルY(f)を周波数逆変換部129に出力する。
周波数逆変換部129は、レベル補正部128から入力されたレベル補正後のスペクトルに対して、周波数逆変換(この例ではIFFT変換)を行う。また、周波数逆変換部129は、周波数逆変換して得られた信号を出力信号としてアンプ13に出力する。以降、アンプ13により増幅された音声信号がスピーカ14より発音される。
<音響処理>
次に、実施例1における音響処理について図10及び図11を用いて説明する。図10は、実施例1における音響処理の一例を示すフローチャートである。ステップS11において、分割部121は、入力された入力信号をフレーム毎に分割し、分割したフレームを最大振幅取得部122及び周波数変換部124に出力する。ステップS12及びステップS13の処理と、ステップS14乃至ステップS16の処理は並行して行うことができ、まずステップS12側の処理について説明する。
ステップS12において、最大振幅取得部122は、入力されたフレーム単位の入力信号の最大振幅を式(1)により取得し、取得した最大振幅を目標ゲイン算出部123に出力する。ステップS13において、目標ゲイン算出部123は、入力された最大振幅を用いて式(2)により目標減衰量を算出し、算出した目標減衰量をゲイン算出部127に出力する。
次に、ステップS14側の処理ではステップS14において、周波数変換部124は、入力されたフレーム単位の入力信号に対して周波数変行い、入力スペクトルをパワースペクトル算出部125及びレベル補正部128に出力する。
ステップS15において、パワースペクトル算出部125は、入力された入力スペクトルから式(3)を用いてパワースペクトルを算出し、算出したパワースペクトルをスペクトルピーク算出部126及びゲイン算出部127に出力する。
ステップS16において、スペクトルピーク算出部126は、入力されたパワースペクトルからスペクトルピークのパワー値を式(4)により取得し、取得したパワー値をゲイン算出部127に出力する。また、スペクトルピーク算出部126は、スペクトルピークの周波数を式(5)により算出し、算出した周波数をゲイン算出部127に出力する。なお、実施例1においては、スペクトルピークの周波数は算出しなくてもよい。
ステップS17において、ゲイン算出部127は、パワースペクトル算出部125から入力されたパワースペクトルと、スペクトルピーク算出部126から入力されたスペクトルピークのパワー値と、目標ゲイン算出部123から入力された目標減衰量とに基づいて、条件式(6)により各周波数帯域の減衰量を算出する。ゲイン算出部127の詳細な処理内容については図11を用いて後述する。また、算出された各周波数帯域の減衰量はレベル補正部128に出力される。
ステップS18において、レベル補正部128は、周波数変換部124から入力された入力スペクトルに対し、ゲイン算出部127から入力された各周波数帯域の減衰量を減衰してレベル補正を行い、レベル補正後のスペクトルを周波数逆変換部129に出力する。
ステップS19において、周波数逆変換部129は、入力されたレベル補正後のスペクトルに対して周波数逆変換を行い、周波数逆変換後の信号を出力信号としてアンプ13に出力する。
次に、実施例1におけるゲイン算出処理について図11を用いて説明する。図11は、実施例1におけるゲイン算出処理を示すフローチャートである。なお、図11に示すステップS20乃至ステップS24の処理は全てゲイン算出部127が行う。
ステップS20において、まず、ゲイン算出部127は、各スペクトルのパワー値とスペクトルピークのパワー値との差分を算出する。ステップS21において、ステップS20で算出されたパワー値の差分が閾値以下であるか否かを判定する。
ステップS21の判定結果がYESの場合、ステップS22において、差分が算出されたパワースペクトルに対応する周波数帯域の減衰量を条件式(6)(図7参照)により算出する。また、ステップS21の判定結果がNOの場合、ステップS23において、その周波数帯域の減衰量を0とする。
ステップS24において、全ての周波数帯域で減衰量が算出されたかを判定し、判定結果がNOの場合ステップS20に戻り、判定結果がYESである場合ゲイン算出処理を終了し、図10に示す次のステップS18に進む。
以上、実施例1によれば、周波数領域でスペクトルピークを減衰させることにより、スペクトルの増幅による異音の発生を防ぎながら入力信号のダイナミックレンジを圧縮することができる。
また、スペクトルピークのパワー値における目標減衰量を決定し、各帯域のスペクトルの減衰量は、スペクトルピークのパワー値と各帯域のスペクトルのパワー値との差分と、目標減衰量とに応じて決める。これより、スペクトルピークに近いスペクトルについても音質劣化を防ぎながら減衰させることができる。
[実施例2]
<主要構成>
次に、実施例2における音響処理装置について説明する。図12は、実施例2における音響処理装置の一構成例を示す図である。図12に示す例では、音響処理装置を携帯端末に適用することを想定している。図12に示す音響処理装置は、デコード部20、ダイナミックレンジ圧縮部21、アンプ13、スピーカ14を含む。なお、図12に示す構成要素において図5に示す構成要素と同様の処理を行うものは同じ符号を付し、その説明を省略する。
図12に示すように、デコード部20は、音声通信網から送られてきた音声符号化信号(以下、受信信号という)を受信して、音声信号への復号化を行なう。このデコード部20は携帯端末に一般的に用いられるものであるため、その詳細な説明は省略する。また、デコード部20は、復号化した音声信号(入力信号)をダイナミックレンジ圧縮部21に出力する。
ダイナミックレンジ圧縮部21は、入力信号に対してダイナミックレンジを圧縮し、レベル補正後の音声信号をアンプ13に出力する。ダイナミックレンジ圧縮部12の主要構成については、図6と同様であるため、その説明を省略する。ただし、実施例2にいては、ゲイン算出部127の処理内容が実施例1とは異なるので、以下、ゲイン算出部127の処理内容を説明する。
ゲイン算出部127は、まず、スペクトルピーク算出部126から入力されたスペクトルピークの周波数と、目標ゲイン算出部127から入力された目標減衰量とから、各周波数帯域の減衰量を決定する。各周波数帯域の減衰量については以下の条件式(8)により決定する。
Figure 0005136378
ここで、S(f)はスペクトルピークと各スペクトルとの周波数の差分を表し、αは閾値を表す。この閾値αは、スペクトルピークの周波数からどれくらいの周波数帯域までスペクトルを減衰させるかを決める値である。
ここで、図13は、実施例2における各周波数帯域の減衰量を示す図である。つまり図13は、条件式(8)を図式化したものになる。これより、スペクトルピーク周辺のスペクトルを減衰させることができるので、スペクトルの増幅による音質劣化を防ぎながらダイナミックレンジを圧縮することができる。
図14は、実施例2における入力スペクトルとレベル補正後のスペクトルとの関係を示す図である。図14に示すように、ゲイン算出部127により求められた各周波数帯域の減衰量を入力スペクトルから減衰させることで、レベル補正後のスペクトルが得られる。また、図15は、図14に示した例における周波数毎のゲインを示す図である。図15に示すように、実施例2ではスペクトルピーク周辺においてゲイン制御が行われる。
<音響処理>
実施例2における音響処理における概要は図10に示した処理と同様であるため、その説明を省略する。ここでは、実施例2におけるゲイン算出処理について図16を用いて説明する。
図16は、実施例2におけるゲイン算出処理の一例を示すフローチャートである。図16に示す処理において、図11に示した処理と同様の処理を行うものは同じ符号を付し、その説明を省略する。なお、図16に示す処理は全てゲイン算出部127が行う。
ステップS30において、ゲイン算出部127は、スペクトルピークの周波数と任意のスペクトルの周波数との差分を算出する。ステップS31において、算出した周波数の差分が、所定範囲内であるか否かを判定する。図13に示す例でいうと所定範囲は−α≦S(f)≦αである。
ステップS31の判定結果がYESの場合、ステップS32において条件式(8)によりその周波数帯域の減衰量を算出する。ステップS31の判定結果がNOの場合、ステップS33においてその周波数帯域の減衰量を0とする。
以上、全ての周波数帯域の減衰量を算出した場合、ゲイン算出処理を終了する。なお、実施例2におけるゲイン算出処理のその他の例として、条件式(8)の処理をスペクトルピーク帯域周辺だけに行うのではなく、第2、第3などの各スペクトルピークにも同様に条件式(8)により減衰量を算出してもよい。これより、第2、第3などの各スペクトルピークのパワー値が大きい場合であっても、効率よくダイナミックレンジを圧縮することができる。
上述したその他の例の場合、条件式(8)をそのまま適用するのではなく、第2、第3と各スペクトルピークの順に、G_target及びαを小さくしてもよい。
以上、実施例2によれば、周波数領域でスペクトルピークを減衰させることにより、スペクトルの増幅による異音の発生を防ぎながら入力信号のダイナミックレンジを圧縮することができる。
また、スペクトルピークのパワー値における目標減衰量を決定し、各帯域のスペクトルの減衰量は、スペクトルピークの周波数と各帯域のスペクトルの周波数との差分と、目標減衰量とに応じて決める。これより、スペクトルピーク周辺のスペクトルについても音質劣化を防ぎながら減衰させることができる。
[実施例3]
<主要構成>
次に、実施例3における音響処理装置について説明する。実施例3における音響処理装置の適用例については実施例2と同様とし、主要構成については図6と同様とするため、これらの説明を省略する。ただし、実施例3におけるゲイン算出部127の処理内容が実施例1及び2とは異なるため、以下、ゲイン算出部127の処理内容について説明する。
ゲイン算出部127は、まず、スペクトルピーク算出部126から入力されたスペクトルピークのパワー値Amp_peakと、目標ゲイン算出部123から入力された目標減衰量G_targetとに基づいて、目標パワー値を式(9)により算出する。
Amp_target=Amp_peak−G_target 式(9)
ここで、Amp_targetは目標パワー値を表す。ゲイン算出部127は、各周波数帯域のスペクトルのパワー値が目標パワー値を超えないように各周波数帯域の減衰量を算出する。図17は、実施例3における入力スペクトルとレベル補正後のスペクトルとの関係を示す図である。図17に示すように、ゲイン算出部127により求められた各周波数帯域の減衰量を入力スペクトルから減衰させることでレベル補正後のスペクトルが得られる。また、図18は、図17に示した例における周波数毎のゲインを示す図である。図18に示すように、目標パワー値を超えた各スペクトルピークの周辺においてゲイン制御が行われる。
<音響処理>
実施例3における音響処理における概要は図10に示した処理と同様であるため、その説明を省略する。ここでは、実施例3におけるゲイン算出処理について図19を用いて説明する。
図19は、実施例3におけるゲイン算出処理の一例を示すフローチャートである。図19に示す処理において、図11に示した処理と同様の処理を行うものは同じ符号を付し、その説明を省略する。なお、図19に示す処理は全てゲイン算出部127が行う。
ステップS40において、ゲイン算出部127は、スペクトルピークのパワー値から目標減衰量を減算して目標パワー値を算出する。ステップS41において、任意の周波数帯域におけるスペクトルのパワー値が目標パワー値以上かつスペクトルピークであるか否かを判定する。
ステップS41の判定結果がYESの場合、ステップS42において、目標パワー値を超えないように、かつ、各スペクトルピークから緩やかな曲線となるようにその周波数帯域周辺の減衰量を算出する。ステップS41の判定結果がNOの場合、ステップS41に戻る。以上、全ての周波数帯域の減衰量を算出した場合、ゲイン算出処理を終了する。
以上、実施例3によれば、周波数領域でスペクトルピークを減衰させることにより、スペクトルの増幅による異音の発生を防ぎながら入力信号のダイナミックレンジを圧縮することができる。
また、スペクトルピークのパワー値における目標減衰量を決定し、各周波数帯域のスペクトルの減衰量は、スペクトルピークのパワー値を超えないように、かつ、各スペクトルピークから緩やかな曲線となるようにして決める。これより、スペクトルピーク周辺のスペクトルについても音質劣化を防ぎながら減衰させることができる。
[実施例4]
<主要構成>
次に、実施例4における音響処理装置について説明する。実施例4における音響処理装置の適用例については実施例1ないし3の何れかと同様とする。図20は、実施例4におけるダイナミックレンジ圧縮部の一構成例を示す図である。
実施例4において、上記実施例と異なるところは、目標減衰量の算出の仕方である。図20に示すように、目標ゲイン算出部130は、スペクトルピーク算出部126から入力されたスペクトルピークのパワー値Amp_peakから所定の閾値を減算することにより目標減衰量を算出する。所定の閾値については、上述した第一の閾値同様、スピーカの特性に応じて事前に与えられる値である。なお、目標減衰量が算出された後の処理は上記実施例と同様である。
<音響処理>
図21は、実施例4における音響処理の一例を示すフローチャートである。図21に示す処理において、図10と同じ処理を行うものは同じ符号を付し、その説明を省略する。実施例4における音響処理は、ステップS50における目標ゲイン算出処理が、ステップS16におけるスペクトルピーク算出処理の後に行われることが上記実施例とは異なる。目標ゲイン算出処理については、上述したとおりスペクトルピークのパワー値Amp_peakから所定の閾値を減算することにより目標減衰量を算出する。
実施例4におけるゲイン算出処理は、上記実施例で説明したゲイン算出処理のいずれを用いてもよい。以上、実施例4によれば、簡易な構成において上記実施例と同様の効果を得ることができる。なお、正確な音量制御を行いたい場合は、実施例1乃至3のいずれかを用い、簡易な構成で本発明の目的を達成したい場合は実施例4を用いればよい。
次に、上述した各実施例における変形例について説明する。図22は、本発明における音響処理を適用した変形例を示す図である。図22に示すように、上述した各実施例で説明した音響処理内容をコンピュータ31に実行させるためのプログラムとし、このプログラムをサーバ30からインストールして、コンピュータ31に実行させることにより上述した音響処理を実現させることも可能である。
また、このプログラムを記録媒体(CD−ROM32やSDカード34等)に記録し、このプログラムが記録された記録媒体をコンピュータ31や携帯端末33に読み取らせて、前述した音響処理を実現させることも可能である。なお、記録媒体は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。また、本発明は、携帯端末やIP電話機などの小さいスピーカを備えた機器に対して、その効果をより発揮する。
以上、本発明の好適な実施例により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。
以上の実施例に加えて、以下の付記を開示する。
(付記1)
入力信号を周波数変換してスペクトルを算出する周波数変換段階と、
前記入力信号の最大振幅を取得する振幅取得段階と、
前記最大振幅を用いて目標減衰量を算出する目標減衰量算出段階と、
前記スペクトルのピーク帯域を算出するピーク算出段階と、
前記目標減衰量と前記ピーク帯域とに基づいて、前記スペクトルの各帯域の減衰量を算出する減衰量算出段階と、
前記各帯域の減衰量を用いて前記スペクトルを減衰させることにより前記スペクトルをレベル補正するレベル補正段階と、
前記レベル補正段階によりレベル補正されたスペクトルを周波数逆変換して出力信号を算出する周波数逆変換段階と
を有する音響処理方法。
(付記2)
入力信号を周波数変換してスペクトルを算出する周波数変換段階と、
前記スペクトルのピーク帯域を算出するピーク算出段階と、
前記ピーク帯域のパワースペクトル値を用いて目標減衰量を算出する目標減衰量算出段階と、
前記目標減衰量と前記ピーク帯域とに基づいて、前記スペクトルの各帯域の減衰量を算出する減衰量算出段階と、
前記各帯域の減衰量を用いて前記スペクトルを減衰させることにより前記スペクトルをレベル補正するレベル補正段階と、
前記レベル補正段階によりレベル補正されたスペクトルを周波数逆変換して出力信号を算出する周波数逆変換段階と
を有する音響処理方法。
(付記3)
前記減衰量算出段階は、
前記ピーク帯域の減衰量を前記目標減衰量とし、前記ピーク帯域以外の帯域の減衰量を前記目標減衰量以下とする付記1又は2記載の音響処理方法。
(付記4)
前記減衰量算出段階は、
前記ピーク帯域と前記ピーク帯域以外の帯域とのパワースペクトル値の差に基づいて、前記ピーク帯域以外の帯域の減衰量を求める付記3記載の音響処理方法。
(付記5)
前記減衰量算出段階は、
前記パワースペクトル値の差が閾値以下である前記ピーク帯域以外の帯域の減衰量を、前記パワースペクトル値の差に比例して前記目標減衰量から小さくする付記4記載の音響処理方法。
(付記6)
前記減衰量算出段階は、
前記パワースペクトル値の差が前記閾値より大きい前記ピーク帯域以外の帯域の減衰量を0とする付記5記載の音響処理方法。
(付記7)
前記減衰量算出段階は、
前記ピーク帯域と前記ピーク帯域以外の帯域との周波数の差に基づいて、前記ピーク帯域以外の帯域の減衰量を求める付記3記載の音響処理方法。
(付記8)
前記減衰量算出段階は、
前記ピーク帯域以外の帯域に含まれる各ピーク帯域と、前記各ピーク帯域以外の帯域との周波数の差に基づいて、前記各ピーク帯域以外の帯域の減衰量を求める付記7記載の音響処理方法。
(付記9)
前記減衰量算出段階は、
前記周波数の差が閾値以下である前記ピーク帯域以外の帯域の減衰量を、前記周波数の差に比例して前記目標減衰量から小さくする付記7記載の音響処理方法。
(付記10)
前記減衰量算出段階は、
前記周波数の差が閾値以下である前記各ピーク帯域以外の帯域の減衰量を、前記周波数の差に比例して、前記目標減衰量から小さくする付記8記載の音響処理方法。
(付記11)
前記減衰量算出段階は、
前記周波数の差が前記閾値より大きい前記ピーク帯域以外の帯域の減衰量を0とする付記9記載の音響処理方法。
(付記12)
前記減衰量算出段階は、
前記周波数の差が前記閾値より大きい前記各ピーク帯域以外の帯域の減衰量を0とする付記10記載の音響処理方法。
(付記13)
前記減衰量算出段階は、
前記ピーク帯域のパワースペクトル値から前記目標減衰量を減衰させて目標パワースペクトル値を算出し、前記ピーク帯域以外の帯域のパワースペクトル値が前記目標パワースペクトル値以下となるよう前記ピーク帯域以外の帯域の減衰量を求める付記3記載の音響処理方法。
(付記14)
コンピュータに、
入力信号を周波数変換してスペクトルを算出する周波数変換段階と、
前記入力信号の最大振幅を取得する振幅取得段階と、
前記最大振幅を用いて目標減衰量を算出する目標減衰量算出段階と、
前記スペクトルのピーク帯域を算出するピーク算出段階と、
前記目標減衰量と前記ピーク帯域とに基づいて、前記スペクトルの各帯域の減衰量を算出する減衰量算出段階と、
前記各帯域の減衰量を用いて前記スペクトルを減衰させることにより前記スペクトルをレベル補正するレベル補正段階と、
前記レベル補正段階によりレベル補正されたスペクトルを周波数逆変換して出力信号を算出する周波数逆変換段階と
を実行させるための音響処理プログラム。
(付記15)
コンピュータに、
入力信号を周波数変換してスペクトルを算出する周波数変換段階と、
前記スペクトルのピーク帯域を算出するピーク算出段階と、
前記ピーク帯域のパワースペクトル値を用いて目標減衰量を算出する目標減衰量算出段階と、
前記目標減衰量と前記ピーク帯域とに基づいて、前記スペクトルの各帯域の減衰量を算出する減衰量算出段階と、
前記各帯域の減衰量を用いて前記スペクトルを減衰させることにより前記スペクトルをレベル補正するレベル補正段階と、
前記レベル補正段階によりレベル補正されたスペクトルを周波数逆変換して出力信号を算出する周波数逆変換段階と
を実行させるための音響処理プログラム。
(付記16)
入力信号を周波数変換してスペクトルを算出する周波数変換手段と、
前記入力信号の最大振幅を取得する振幅取得手段と、
前記最大振幅を用いて目標減衰量を算出する目標減衰量算出手段と、
前記スペクトルのピーク帯域を算出するピーク算出手段と、
前記目標減衰量と前記ピーク帯域とに基づいて、前記スペクトルの各帯域の減衰量を算出する減衰量算出手段と、
前記各帯域の減衰量を用いて前記スペクトルを減衰させることにより前記スペクトルをレベル補正するレベル補正手段と、
前記レベル補正手段によりレベル補正されたスペクトルを周波数逆変換して出力信号を算出する周波数逆変換手段と
を備える音響処理装置。
(付記17)
入力信号を周波数変換してスペクトルを算出する周波数変換手段と、
前記スペクトルのピーク帯域を算出するピーク算出手段と、
前記ピーク帯域のパワースペクトル値を用いて目標減衰量を算出する目標減衰量算出手段と、
前記目標減衰量と前記ピーク帯域とに基づいて、前記スペクトルの各帯域の減衰量を算出する減衰量算出手段と、
前記各帯域の減衰量を用いて前記スペクトルを減衰させることにより前記スペクトルをレベル補正するレベル補正手段と、
前記レベル補正手段によりレベル補正されたスペクトルを周波数逆変換して出力信号を算出する周波数逆変換手段と
を備える音響処理装置。
従来技術におけるダイナミックレンジ圧縮の使用例を示す図である。 従来技術におけるダイナミックレンジ圧縮の例を示す図である。 従来技術におけるゲイン制御前後の時間信号波形の一例を示す図である。 従来技術におけるゲイン制御前後のスペクトル波形の一例を示す図である。 実施例1における音響処理装置の一構成例を示す図である。 実施例1におけるダイナミックレンジ圧縮部の一構成例を示す図である。 パワースペクトルと減衰量との関係式を示す図である。 実施例1における入力スペクトルとレベル補正後のスペクトルとの関係を示す図である。 図8に示した例における周波数毎のゲインを示す図である。 実施例1における音響処理の一例を示すフローチャートである。 実施例1におけるゲイン算出処理を示すフローチャートである。 実施例2における音響処理装置の一構成例を示す図である。 実施例2における各周波数帯域の減衰量を示す図である。 実施例2における入力スペクトルとレベル補正後のスペクトルとの関係を示す図である。 図14に示した例における周波数毎のゲインを示す図である。 実施例2におけるゲイン算出処理の一例を示すフローチャートである。 実施例3における入力スペクトルとレベル補正後のスペクトルとの関係を示す図である。 図17に示した例における周波数毎のゲインを示す図である。 実施例3におけるゲイン算出処理の一例を示すフローチャートである。 実施例4におけるダイナミックレンジ圧縮部の一構成例を示す図である。 実施例4における音響処理の一例を示すフローチャートである。 本発明における音響処理を適用した変形例を示す図である。
符号の説明
1、12、21 ダイナミックレンジ圧縮部
2、13 D/A変換器
3、14 アンプ
4 スピーカ
10 パケット受信部
11、20 デコード部
121 分割部
122 最大振幅取得部
123、130 目標ゲイン算出部
124 周波数変換部
125 パワースペクトル算出部
126 スペクトルピーク算出部
127 ゲイン算出部
128 レベル補正部
129 周波数逆変換部
30 サーバ
31 情報処理装置
32 CD−ROM
33 携帯端末
34 SDカード

Claims (8)

  1. 入力信号を周波数変換してスペクトルを算出する周波数変換段階と、
    前記入力信号の最大振幅を取得する振幅取得段階と、
    前記最大振幅を用いて目標減衰量を算出する目標減衰量算出段階と、
    前記スペクトルのピーク帯域を算出するピーク算出段階と、
    前記目標減衰量と前記ピーク帯域とに基づいて、前記スペクトルの各帯域の減衰量を算出する減衰量算出段階と、
    前記各帯域の減衰量を用いて前記スペクトルを減衰させることにより前記スペクトルをレベル補正するレベル補正段階と、
    前記レベル補正段階によりレベル補正されたスペクトルを周波数逆変換して出力信号を算出する周波数逆変換段階と
    を有する音響処理方法。
  2. 入力信号を周波数変換してスペクトルを算出する周波数変換段階と、
    前記スペクトルのピーク帯域を算出するピーク算出段階と、
    前記ピーク帯域のパワースペクトル値を用いて目標減衰量を算出する目標減衰量算出段階と、
    前記目標減衰量と前記ピーク帯域とに基づいて、前記スペクトルの各帯域の減衰量を算出する減衰量算出段階と、
    前記各帯域の減衰量を用いて前記スペクトルを減衰させることにより前記スペクトルをレベル補正するレベル補正段階と、
    前記レベル補正段階によりレベル補正されたスペクトルを周波数逆変換して出力信号を算出する周波数逆変換段階と
    を有する音響処理方法。
  3. 前記減衰量算出段階は、
    前記ピーク帯域の減衰量を前記目標減衰量とし、前記ピーク帯域以外の帯域の減衰量を前記目標減衰量以下とする請求項1又は2記載の音響処理方法。
  4. 前記減衰量算出段階は、
    前記ピーク帯域と前記ピーク帯域以外の帯域とのパワースペクトル値の差に基づいて、前記ピーク帯域以外の帯域の減衰量を求める請求項3記載の音響処理方法。
  5. 前記減衰量算出段階は、
    前記パワースペクトル値の差が閾値以下である前記ピーク帯域以外の帯域の減衰量を、前記パワースペクトル値の差に比例して前記目標減衰量から小さくする請求項4記載の音響処理方法。
  6. 前記減衰量算出段階は、
    前記ピーク帯域と前記ピーク帯域以外の帯域との周波数の差に基づいて、前記ピーク帯域以外の帯域の減衰量を求める請求項3記載の音響処理方法。
  7. 前記減衰量算出段階は、
    前記周波数の差が閾値以下である前記ピーク帯域以外の帯域の減衰量を、前記周波数の差に比例して前記目標減衰量から小さくする請求項6記載の音響処理方法。
  8. 前記減衰量算出段階は、
    前記ピーク帯域のパワースペクトル値から前記目標減衰量を減衰させて目標パワースペクトル値を算出し、前記ピーク帯域以外の帯域のパワースペクトル値が前記目標パワースペクトル値以下となるよう前記ピーク帯域以外の帯域の減衰量を求める請求項3記載の音響処理方法。
JP2008313155A 2008-12-09 2008-12-09 音響処理方法 Expired - Fee Related JP5136378B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2008313155A JP5136378B2 (ja) 2008-12-09 2008-12-09 音響処理方法
EP09176311A EP2200340A1 (en) 2008-12-09 2009-11-18 Sound processing methods and apparatus
US12/625,664 US20100142727A1 (en) 2008-12-09 2009-11-25 Sound processing methods and apparatus
KR1020090120981A KR101084406B1 (ko) 2008-12-09 2009-12-08 음향 처리 방법
CN2009102580195A CN101751929B (zh) 2008-12-09 2009-12-09 声音处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008313155A JP5136378B2 (ja) 2008-12-09 2008-12-09 音響処理方法

Publications (2)

Publication Number Publication Date
JP2010141396A JP2010141396A (ja) 2010-06-24
JP5136378B2 true JP5136378B2 (ja) 2013-02-06

Family

ID=41718800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008313155A Expired - Fee Related JP5136378B2 (ja) 2008-12-09 2008-12-09 音響処理方法

Country Status (5)

Country Link
US (1) US20100142727A1 (ja)
EP (1) EP2200340A1 (ja)
JP (1) JP5136378B2 (ja)
KR (1) KR101084406B1 (ja)
CN (1) CN101751929B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2675063B1 (en) 2012-06-13 2016-04-06 Dialog Semiconductor GmbH Agc circuit with optimized reference signal energy levels for an echo cancelling circuit
JPWO2014115388A1 (ja) * 2013-01-22 2017-01-26 クラリオン株式会社 受信装置および受信装置の制御方法
US10283137B2 (en) * 2014-02-18 2019-05-07 Dolby Laboratories Licensing Corporation Device and method for tuning a frequency-dependent attenuation stage
JP2015192763A (ja) * 2014-03-31 2015-11-05 株式会社大都技研 遊技台
CN113661652A (zh) * 2020-01-07 2021-11-16 深圳市大疆创新科技有限公司 音频信号处理方法、相关装置及音响设备、存储介质
CN114176623B (zh) * 2021-12-21 2023-09-12 深圳大学 声音降噪方法、系统、降噪设备及计算机可读存储介质
FI20227155A1 (fi) * 2022-12-02 2024-06-03 Oeksound Oy Signaalinkäsittelymenetelmä

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2956642B2 (ja) * 1996-06-17 1999-10-04 ヤマハ株式会社 音場制御ユニットおよび音場制御装置
US7366315B2 (en) * 1999-02-05 2008-04-29 Hearworks Pty, Limited Adaptive dynamic range optimization sound processor
US7013011B1 (en) * 2001-12-28 2006-03-14 Plantronics, Inc. Audio limiting circuit
DE10232645A1 (de) 2002-07-18 2004-02-05 Harman/Becker Automotive Systems Gmbh (Straubing Division) Schaltungsanordnung zur Verringerung des Dynamikbereichs von Audiosignalen
JP2004061617A (ja) * 2002-07-25 2004-02-26 Fujitsu Ltd 受話音声処理装置
JP2005175674A (ja) * 2003-12-09 2005-06-30 Nec Corp 信号圧縮伸張装置および携帯通信端末装置
US8520861B2 (en) * 2005-05-17 2013-08-27 Qnx Software Systems Limited Signal processing system for tonal noise robustness
JP4206409B2 (ja) * 2006-03-16 2009-01-14 日本電信電話株式会社 音声処理装置、その方法、プログラム、及びそのプログラムを記録した記録媒体
US7983425B2 (en) * 2006-06-13 2011-07-19 Phonak Ag Method and system for acoustic shock detection and application of said method in hearing devices
JP5005614B2 (ja) 2008-05-27 2012-08-22 ヒアワークス プロプライアタリー リミティド 適応ダイナミックレンジ最適化サウンドプロセッサ

Also Published As

Publication number Publication date
KR101084406B1 (ko) 2011-11-18
CN101751929B (zh) 2012-11-21
EP2200340A1 (en) 2010-06-23
KR20100066394A (ko) 2010-06-17
US20100142727A1 (en) 2010-06-10
JP2010141396A (ja) 2010-06-24
CN101751929A (zh) 2010-06-23

Similar Documents

Publication Publication Date Title
KR102473598B1 (ko) 왜곡 감지, 방지, 및 왜곡-인지 베이스 강화
JP5136378B2 (ja) 音響処理方法
US9653091B2 (en) Echo suppression device and echo suppression method
JP5923994B2 (ja) 音声処理装置及び音声処理方法
JP2014514609A (ja) 改善されたオーディオのための統合されたサイコアコースティック・バス・エンハンスメント(pbe)
KR101855969B1 (ko) 오디오 신호를 압축하는 디지털 압축기
JP5626366B2 (ja) 音声制御装置、音声制御方法及び音声制御プログラム
CN110121133B (zh) 通过监测扬声器失真来动态校正输出电平以最小化失真
JP5223595B2 (ja) 音声処理回路及び音声処理方法
JP4843691B2 (ja) 信号特性変化装置
JP2014513320A (ja) オーディオ信号におけるドミナント周波数を減衰する方法及び装置
JP2008309955A (ja) ノイズサプレス装置
US9177566B2 (en) Noise suppression method and apparatus
JP4922427B2 (ja) 信号補正装置
JP5172580B2 (ja) 音補正装置及び音補正方法
JP4787316B2 (ja) デジタル信号処理装置及び倍音生成方法
WO2017183405A1 (ja) 音響処理装置および音響処理方法
KR20120091701A (ko) 오디오 신호 출력 방법 및 그에 따른 오디오 신호 출력 장치
JP2015215528A (ja) 音声強調装置、音声強調方法及びプログラム
JP6098038B2 (ja) 音声補正装置、音声補正方法及び音声補正用コンピュータプログラム
RU2819779C1 (ru) Усиление низких частот для громкоговорителей
CN116964964A (zh) 音频信号处理系统、扬声器和电子设备
US8948417B2 (en) Characteristic correcting device and characteristic correcting method
JP6160045B2 (ja) 調整装置および調整方法
JP2012039398A (ja) 音質調整装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110907

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121016

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121029

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151122

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees