JP6244652B2 - 音声処理装置及びプログラム - Google Patents
音声処理装置及びプログラム Download PDFInfo
- Publication number
- JP6244652B2 JP6244652B2 JP2013096864A JP2013096864A JP6244652B2 JP 6244652 B2 JP6244652 B2 JP 6244652B2 JP 2013096864 A JP2013096864 A JP 2013096864A JP 2013096864 A JP2013096864 A JP 2013096864A JP 6244652 B2 JP6244652 B2 JP 6244652B2
- Authority
- JP
- Japan
- Prior art keywords
- level
- subband
- signal
- reference level
- sound pressure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
そこで、本発明の目的は、音声の明瞭度を上げるための音声処理で、低い処理負荷で、音声信号の音圧レベルの変化を抑えて、違和感や不快感を低減するための技術を提供することである。
本発明では、入力音声信号を周波数軸上で分割したサブバンド信号のレベルが基準レベルを下回る量が大きい場合ほど、ゲイン係数を大きくするように設定する。このため、ゲイン制御においては、基準レベルへの寄与が相対的に大きいサブバンドのレベルについては、そのレベルの低下の割合を小さくし、基準レベルへの寄与が相対的に小さいサブバンドのレベルについては、そのレベルの低下の割合を大きくすることとなる。よって、本発明により、周波数エンベロープのピーク及びディップを強調することができる。
本発明によれば、複数のサブバンド信号の合計のレベルを、基準レベルとして算出するので、基準レベルとサブバンド信号のレベルとの差で定まるゲイン係数により、ゲイン制御を行えばよい。
本発明では、人間による音の感じ方と整合した方法でサブバンド信号への分割を行って、各サブバンド信号の音圧を制御することできる。
本発明では、時間軸上での音圧レベルの急激な変化を抑えるための処理を、サブバンド信号毎の設定に従って行うことができる。
また、本発明の音声処理装置において、前記基準レベル算出手段は、前記複数のサブバンド信号に対する共通の基準レベルを算出してもよい。
また、本発明のプログラムは、コンピュータを、入力音声信号を複数の周波数帯域毎のサブバンド信号に分割して出力する分割手段と、前記入力音声信号に基づいて、前記複数のサブバンド信号に対する基準レベルを算出する基準レベル算出手段と、前記分割手段により分割されたサブバンド信号毎に、当該サブバンド信号のレベルを低下させる割合を示すゲイン係数を、当該サブバンド信号のレベルが前記基準レベルを下回る量に応じて大きくするよう設定し、当該設定したゲイン係数で前記サブバンド信号のレベルを変更するゲイン制御手段として機能させるためのプログラムであって、前記基準レベル算出手段は、前記複数のサブバンド信号の合計のレベルを、前記基準レベルとして算出するプログラムである。
図1は、本発明の一実施形態に係る音声処理装置1の全体構成を示す図である。図1に示すように、音声処理装置1は、信号処理部10−1〜10−8と、基準音圧レベル算出部20と、加算器30とを備える。
信号処理部10−1〜10−8は、互いに同一の入力系統からの入力音声信号Sinに対して、音声の明瞭度を上げるための信号処理を施す。入力音声信号Sinは、ここではデジタル形式の音声信号であり、例えば、人間の音声を含む音声(例えば話し声や楽曲の歌唱音声)を表す。基準音圧レベル算出部20は、信号処理部10−1〜10−8と同一の入力系統からの入力音声信号Sinに基づいて、信号処理部10−1〜10−8での音声処理に用いられる基準音圧レベルRLを算出する(基準レベル算出手段)。基準音圧レベルRLは、ここでは、入力音声信号Sinの音声帯域での合計の音圧レベル(以下、トータルレベルともいう)である。音声帯域は、ここでは125Hz〜4000Hzの周波数帯域であり、例えば、第一フォルマント〜第四フォルマントを含む周波数帯域である。基準音圧レベル算出部20は、基準音圧レベルRLを、信号処理部10−1〜10−8のそれぞれへ供給する。基準音圧レベル算出部20は、ここでは、入力音声信号Sinのサンプル毎に、基準音圧レベルRLを繰り返し算出する。
以下では、BPF11−kによって抽出されるサブバンドのことを、「(低周波数側から)k番目のサブバンド」と称することがある。
Gp(k)=A(k)−RL ・・・(1)
ゲイン係数Gp(k)は、音圧レベルA(k)が、基準音圧レベルRLを下回る量が大きいほど、k番目のサブバンドの音圧レベルが低下させる割合を大きくするように作用する。基準音圧レベルRLは、信号処理部10−1〜10−8で共通に用いられるから、音圧レベルA(k)が小さいほど、ゲイン係数Gp(k)は大きくなる。すなわち、ゲイン係数算出部13−kは、音圧レベルA(k)が基準音圧レベルRLを下回る場合に、この音圧レベルA(k)と基準音圧レベルRLとの差の大きさに比例して、ゲイン係数Gp(k)を大きくするように設定する。
B(k)=Gp(k)+A(k) ・・・(2)
図2に示すように、この例では、1〜8番目のサブバンドの音圧レベルA(1)〜A(8)が、順に、−30dB,−20dB,−10dB,−40dB,−60dB,−30dB,−55dB,−45dBであるものとする。図2のグラフでは、入力音声信号Sinの周波数エンベロープを分かりやすくするために、各サブバンドに対応するプロット同士を実線で結んで表している。基準音圧レベルRLは、ここでは−6.06dBである。
ゲイン制御後の音圧レベルB(k)は、式(2)の関係により、ゲイン係数Gp(k)を、k番目のサブバンドの音圧レベルA(k)に加算した音圧レベルとなる。具体的には、1〜8番目のサブバンドの音圧レベルB(1)〜B(8)は、順に、−53.94dB,−33.94dB,−13.94dB,−73.94dB,−113.94dB,−53.94dB,−103.04dB,−83.94dBとなる。図2のグラフでは、ゲイン制御後の周波数エンベロープを分かりやすくするために、各サブバンドに対応するプロット同士を破線で結んで表している。
上述した実施形態の音声処理装置1では、信号処理部10−1〜10−8により、入力音声信号Sinを8つのサブバンド信号に分割していたが、7つ以下又は9つ以上のサブバンド信号に分割してもよい。ただし、サブバンド信号の数を少なくし過ぎると、周波数エンベロープのピーク及びディップの強調が不十分になる可能性があり、反対に、サブバンド信号の数を多くし過ぎると、信号処理部10−kの処理負荷の増大の原因となるので、これらの事情を考慮に入れて、適切な数に設定されるとよい。
また、BPF11−kからなるフィルタ群は、人間の聴覚機能に近い働きを持つ1/3オクターブバンドの等比帯域フィルタ群を用いて構成されてもよいし、1/3オクターブバンドよりは狭く、且つ、1/4オクターブバンドよりは広い帯域幅の帯域通過フィルタで構成されてもよい。
いずれの場合であっても、BPF11−kからなるフィルタ群は、低周波数方向のサブバンドほど帯域幅を狭くし、高周波方向のサブバンドほど帯域幅を広くするように構成される。
例えば、基準音圧レベル算出部20は、入力音声信号Sinにおける複数のサブバンド信号の音圧レベルの平均レベルを、基準音圧レベルRLとして算出してもよい。この基準音圧レベルRLを採用した場合であっても、信号処理部10−kでは、k番目のサブバンドの音圧レベルA(k)が基準音圧レベルRLを下回る量が大きいほど、ゲイン係数Gp(k)を大きくするとよい。
図3に示すように、この変形例の基準音圧レベルRLは平均レベルであるから、トータルレベルを採用した図2の場合に比べて、低い音圧レベルを示す。ただし、この場合であっても、信号処理部10−kが、基準音圧レベルRLを下回る音圧レベルのサブバンドについてゲイン係数Gp(k)を大きくして、ゲイン制御を行うことにより、周波数エンベロープのピーク及びディップを強調することができる。
例えば、基準音圧レベル算出部20は、各サブバンド信号の周波数に応じた重み付けを音圧レベルに与えた後、前述のトータルレベル又は平均レベルを用いた場合と同じ演算により、基準音圧レベルRLを算出してもよい。
また、基準音圧レベル算出部20は、複数のサブバンド信号の音圧レベルの中央値等、いずれか1つのサブバンド信号の音圧レベルを基準音圧レベルRLとすることも可能である。
少なくとも、基準音圧レベル算出部20がDCレベル値により基準音圧レベルRLを算出すれば、基準音圧レベル算出部20や信号処理部10−kでのレイテンシを小さくすることができる。
ここでは、信号処理部10−kは、音圧レベルA(k)が低い順に所定数(ここでは2つ)のサブバンドについて音圧レベルを低下させ、その他のサブバンドについては音圧レベルを変化させない。すなわち、信号処理部10−kが、基準音圧レベルRLを下回る一部のサブバンドについてのみ音圧レベルを低下させることによっても、周波数エンベロープのピーク及びディップを強調することができる。信号処理部10−kは、音圧レベルA(k)が低い順に1つのサブバンドについてのみ音圧レベルを低下させてもよく、音圧レベルA(k)が低い順にいくつのサブバンドの音圧レベルを低下させてもよい。
また、信号処理部10−kは、音圧レベルA(k)が閾値レベルを下回るサブバンドについてのみ、音圧レベルを低下させてもよい。
また、信号処理部10−kは、音圧レベルが低いサブバンドほどゲイン係数Gp(k)に大きな重み付けを与えてもよい。
信号処理部10−kは、入力音声信号Sinを音声帯域で複数のサブバンド信号に分割していたが、それよりも狭い周波数帯域で複数のサブバンド信号に分割してもよいし、更に広い周波数帯域で複数のサブバンド信号に分割してもよい。信号処理部10−kは、例えば、可聴域を含む周波数帯域を、複数のサブバンド信号に分割する。
上述した実施形態で説明したパラメータ(例えば、数式や各種周波数)はあくまで例示であり、本発明はこれに限定されない。
上述した実施形態において、音声処理装置1(信号処理部10−k)が実現する各機能は、複数のプログラムの組み合わせによって実現され、又は、複数のハードウェア資源の連係によって実現されうる。音声処理装置1の機能がプログラムを用いて実現される場合、このプログラムは、磁気記録媒体(磁気テープ、磁気ディスク(HDD(Hard Disk Drive)、FD(Flexible Disk))など)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータ読取り可能な記録媒体に記憶した状態で提供されてもよいし、ネットワークを介して配信されてもよい。また、本発明は、入力音声信号の明瞭度を上げるための音声明瞭化方法として実施することも可能である。
Claims (7)
- 入力音声信号を複数の周波数帯域毎のサブバンド信号に分割して出力する分割手段と、
前記入力音声信号に基づいて、前記複数のサブバンド信号に対する基準レベルを算出する基準レベル算出手段と、
前記分割手段により分割されたサブバンド信号毎に、当該サブバンド信号のレベルを低下させる割合を示すゲイン係数を、当該サブバンド信号のレベルが前記基準レベルを下回る量に応じて大きくするよう設定し、当該設定したゲイン係数で前記サブバンド信号のレベルを変更するゲイン制御手段と
を備え、
前記ゲイン制御手段は、前記分割手段により分割されたサブバンド信号のうち、レベルが前記基準レベルを上回るサブバンド信号については、当該サブバンド信号のレベルを変更しない、又は、当該基準レベルを下回るサブバンド信号よりも低い割合でレベルを低下させる
音声処理装置。 - 入力音声信号を複数の周波数帯域毎のサブバンド信号に分割して出力する分割手段と、
前記入力音声信号に基づいて、前記複数のサブバンド信号に対する基準レベルを算出する基準レベル算出手段と、
前記分割手段により分割されたサブバンド信号毎に、当該サブバンド信号のレベルを低下させる割合を示すゲイン係数を、当該サブバンド信号のレベルが前記基準レベルを下回る量に応じて大きくするよう設定し、当該設定したゲイン係数で前記サブバンド信号のレベルを変更するゲイン制御手段と
を備え、
前記基準レベル算出手段は、
前記複数のサブバンド信号の合計のレベルを、前記基準レベルとして算出する
音声処理装置。 - 前記サブバンド信号は、臨界帯域に基づいて、前記周波数帯域の幅がそれぞれ設定されている
請求項1又は2に記載の音声処理装置。 - 前記ゲイン制御手段は、
予め決められた期間毎に前記ゲイン係数を算出するとともに、当該ゲイン係数の時間軸上での変化を平滑化する処理を、前記サブバンド信号毎の設定に従って行う
請求項1から3のいずれか1項に記載の音声処理装置。 - 前記基準レベル算出手段は、前記複数のサブバンド信号に対する共通の基準レベルを算出する
請求項1に記載の音声処理装置。 - コンピュータを、
入力音声信号を複数の周波数帯域毎のサブバンド信号に分割して出力する分割手段と、
前記入力音声信号に基づいて、前記複数のサブバンド信号に対する基準レベルを算出する基準レベル算出手段と、
前記分割手段により分割されたサブバンド信号毎に、当該サブバンド信号のレベルを低下させる割合を示すゲイン係数を、当該サブバンド信号のレベルが前記基準レベルを下回る量に応じて大きくするよう設定し、当該設定したゲイン係数で前記サブバンド信号のレベルを変更するゲイン制御手段
として機能させるためのプログラムであって、
前記ゲイン制御手段は、前記分割手段により分割されたサブバンド信号のうち、レベルが前記基準レベルを上回るサブバンド信号については、当該サブバンド信号のレベルを変更しない、又は、当該基準レベルを下回るサブバンド信号よりも低い割合でレベルを低下させる
プログラム。 - コンピュータを、
入力音声信号を複数の周波数帯域毎のサブバンド信号に分割して出力する分割手段と、
前記入力音声信号に基づいて、前記複数のサブバンド信号に対する基準レベルを算出する基準レベル算出手段と、
前記分割手段により分割されたサブバンド信号毎に、当該サブバンド信号のレベルを低下させる割合を示すゲイン係数を、当該サブバンド信号のレベルが前記基準レベルを下回る量に応じて大きくするよう設定し、当該設定したゲイン係数で前記サブバンド信号のレベルを変更するゲイン制御手段
として機能させるためのプログラムであって、
前記基準レベル算出手段は、
前記複数のサブバンド信号の合計のレベルを、前記基準レベルとして算出する
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013096864A JP6244652B2 (ja) | 2013-05-02 | 2013-05-02 | 音声処理装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013096864A JP6244652B2 (ja) | 2013-05-02 | 2013-05-02 | 音声処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014219470A JP2014219470A (ja) | 2014-11-20 |
JP6244652B2 true JP6244652B2 (ja) | 2017-12-13 |
Family
ID=51937975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013096864A Expired - Fee Related JP6244652B2 (ja) | 2013-05-02 | 2013-05-02 | 音声処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6244652B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113450846B (zh) * | 2020-03-27 | 2024-01-23 | 上海汽车集团股份有限公司 | 一种声压级标定方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2563719B2 (ja) * | 1992-03-11 | 1996-12-18 | 技術研究組合医療福祉機器研究所 | 音声加工装置と補聴器 |
JP4214607B2 (ja) * | 1999-03-23 | 2009-01-28 | ソニー株式会社 | マイクロホン装置 |
JP2005175674A (ja) * | 2003-12-09 | 2005-06-30 | Nec Corp | 信号圧縮伸張装置および携帯通信端末装置 |
JP2008102551A (ja) * | 2007-12-27 | 2008-05-01 | Sony Corp | 音声信号の処理装置およびその処理方法 |
JP5151762B2 (ja) * | 2008-07-22 | 2013-02-27 | 日本電気株式会社 | 音声強調装置、携帯端末、音声強調方法および音声強調プログラム |
JP5115818B2 (ja) * | 2008-10-10 | 2013-01-09 | 国立大学法人九州大学 | 音声信号強調装置 |
US8787595B2 (en) * | 2008-10-17 | 2014-07-22 | Sharp Kabushiki Kaisha | Audio signal adjustment device and audio signal adjustment method having long and short term gain adjustment |
EP2487791A1 (en) * | 2009-10-07 | 2012-08-15 | Nec Corporation | Multiband compressor and adjustment method of same |
-
2013
- 2013-05-02 JP JP2013096864A patent/JP6244652B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014219470A (ja) | 2014-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7378515B2 (ja) | ヘッドマウントスピーカのためのオーディオエンハンスメント | |
KR101989062B1 (ko) | 오디오 신호를 향상시키기 위한 장치 및 방법 및 음향 향상 시스템 | |
JP5488389B2 (ja) | 音響信号処理装置 | |
US9214916B2 (en) | Acoustic processing device | |
KR101552750B1 (ko) | 파라미트릭 스테레오 변환 시스템 및 방법 | |
EP2629552B1 (en) | Audio surround processing system | |
JP6019969B2 (ja) | 音響処理装置 | |
JP6312826B2 (ja) | 補聴器システムの動作方法および補聴器システム | |
JP6479287B1 (ja) | オーディオ再生のためのサブバンド空間クロストークキャンセル | |
JP2003274492A (ja) | ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム | |
JP2009296298A (ja) | 音声信号処理装置および方法 | |
JP6244652B2 (ja) | 音声処理装置及びプログラム | |
JP5058844B2 (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
JP5202021B2 (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
JP7028613B2 (ja) | オーディオプロセッサおよびオーディオ再生装置 | |
CN109791773B (zh) | 音频输出产生系统、音频通道输出方法和计算机可读介质 | |
US10916257B2 (en) | Method and device for equalizing audio signals | |
JP2012100117A (ja) | 音響処理装置及び方法 | |
Zou et al. | Design of compensated multi-channel dynamic-range compressor for hearing aid devices using polyphase implementation | |
JP6531418B2 (ja) | 信号処理装置 | |
Vashkevich et al. | Speech enhancement in a smartphone-based hearing aid | |
Zou | Multi-Channel Dynamic-Range Compression Techniques for Hearing Devices | |
CN116964665A (zh) | 提高去混响的感知质量 | |
Brouckxon et al. | Design and evaluation of a microphone signal conditioning system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160322 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170418 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170531 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171017 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171030 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6244652 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |