JPH06175691A - 音声強調装置と音声強調方法 - Google Patents
音声強調装置と音声強調方法Info
- Publication number
- JPH06175691A JPH06175691A JP4351782A JP35178292A JPH06175691A JP H06175691 A JPH06175691 A JP H06175691A JP 4351782 A JP4351782 A JP 4351782A JP 35178292 A JP35178292 A JP 35178292A JP H06175691 A JPH06175691 A JP H06175691A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- spectrum
- output
- value
- emphasizing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【目的】 音声のフォルマントを強調することにより明
瞭度を改善する。 【構成】 入力信号は帯域分割フィルタ10に入力さ
れ、N個の周波数帯域に分割される。次に、レベル検出
器11−1〜11−Nにて各周波数帯域毎の平均レベル
を求め、それらをバッファメモリ12に蓄える。そし
て、畳み込み演算器15はデータ選択器13により選択
されたバッファメモリ12の内容と、係数記憶メモリ1
4の内容との畳み込み演算を行なう。その結果に非線形
処理器16は非線形処理を施す。次に、スイッチ17に
より選択された乗算器18−1〜18−Nは、帯域分割
フィルタ10の出力に非線形処理器16の出力を乗じ
る。最後に、加算器19は乗算手段18−1〜18−N
の全周波数帯域の出力を加算して出力する。 【効果】 入力信号のスペクトルのコントラストを強調
する値が得られ、非線形処理器によりスペクトルの過度
な強調を防止する。
瞭度を改善する。 【構成】 入力信号は帯域分割フィルタ10に入力さ
れ、N個の周波数帯域に分割される。次に、レベル検出
器11−1〜11−Nにて各周波数帯域毎の平均レベル
を求め、それらをバッファメモリ12に蓄える。そし
て、畳み込み演算器15はデータ選択器13により選択
されたバッファメモリ12の内容と、係数記憶メモリ1
4の内容との畳み込み演算を行なう。その結果に非線形
処理器16は非線形処理を施す。次に、スイッチ17に
より選択された乗算器18−1〜18−Nは、帯域分割
フィルタ10の出力に非線形処理器16の出力を乗じ
る。最後に、加算器19は乗算手段18−1〜18−N
の全周波数帯域の出力を加算して出力する。 【効果】 入力信号のスペクトルのコントラストを強調
する値が得られ、非線形処理器によりスペクトルの過度
な強調を防止する。
Description
【0001】
【産業上の利用分野】本発明は,音声信号の明瞭度を改
善する音声強調装置と音声強調方法に関するものであ
る。
善する音声強調装置と音声強調方法に関するものであ
る。
【0002】
【従来の技術】従来より、補聴器等において音声信号の
明瞭度を改善するために音声強調装置が利用されてい
る。
明瞭度を改善するために音声強調装置が利用されてい
る。
【0003】以下、図面を参照しながら、上述したよう
な従来の音声強調装置について説明を行う。
な従来の音声強調装置について説明を行う。
【0004】図6は従来の音声強調装置の構成図を示す
ものである。図6において、60はアナログ/ディジタ
ル変換器(以下、AD変換器と呼ぶ)、61はフォルマ
ント検出器、62はフォルマント強調フィルタ、63は
ディジタル/アナログ変換器(以下、DA変換器と呼
ぶ)である。
ものである。図6において、60はアナログ/ディジタ
ル変換器(以下、AD変換器と呼ぶ)、61はフォルマ
ント検出器、62はフォルマント強調フィルタ、63は
ディジタル/アナログ変換器(以下、DA変換器と呼
ぶ)である。
【0005】以上のように構成された音声強調装置につ
いて、以下その動作について説明する。
いて、以下その動作について説明する。
【0006】まず、入力信号はAD変換器60にてアナ
ログ信号からディジタル信号に変換される。次に、AD
変換器60の出力に基づいて、フォルマント抽出器61
は周波数軸上でエネルギーの集中しているフォルマント
を抽出する。そして、フォルマント強調フィルタ62は
フォルマント抽出器61が求めたフォルマントの情報に
基づいて、AD変換器60から出力される入力フォルマ
ントを強調するフィルタを形成する。最後に、DA変換
器63はフォルマント強調フィルタ62から出力される
ディジタル信号をアナログ信号に変換して出力する。
ログ信号からディジタル信号に変換される。次に、AD
変換器60の出力に基づいて、フォルマント抽出器61
は周波数軸上でエネルギーの集中しているフォルマント
を抽出する。そして、フォルマント強調フィルタ62は
フォルマント抽出器61が求めたフォルマントの情報に
基づいて、AD変換器60から出力される入力フォルマ
ントを強調するフィルタを形成する。最後に、DA変換
器63はフォルマント強調フィルタ62から出力される
ディジタル信号をアナログ信号に変換して出力する。
【0007】
【発明が解決しようとする課題】しかしながら、上記の
ような構成では、フォルマントの抽出が難しく、特に雑
音が重畳している環境では困難であるので、フォルマン
トが適切に強調できず、またフォルマントを抽出したと
してもフォルマントを強調しすぎて耳障りになることが
あるという課題を有していた。
ような構成では、フォルマントの抽出が難しく、特に雑
音が重畳している環境では困難であるので、フォルマン
トが適切に強調できず、またフォルマントを抽出したと
してもフォルマントを強調しすぎて耳障りになることが
あるという課題を有していた。
【0008】本発明は上記課題に鑑み、音声のフォルマ
ントを安定して強調することにより、音声の明瞭度を改
善することのできる音声強調装置を提供するものであ
る。
ントを安定して強調することにより、音声の明瞭度を改
善することのできる音声強調装置を提供するものであ
る。
【0009】
【課題を解決するための手段】この目的を達成するため
に本発明の音声強調装置は、入力信号を周波数軸上の成
分に変換する周波数分析手段と、前記周波数分析手段の
出力に基づき各周波数成分毎にスペクトルのピークとデ
ィップを強調する値を求めるスペクトル強調手段と、前
記スペクトル強調手段の各周波数成分毎の出力に非線形
処理を施す非線形処理手段と、前記周波数分析手段の出
力に前記非線形処理手段の出力を周波数成分毎に乗じる
乗算手段と、前記乗算手段の各周波数成分の出力を合成
して時間軸上の成分に戻す周波数合成手段とを備えた構
成としている。
に本発明の音声強調装置は、入力信号を周波数軸上の成
分に変換する周波数分析手段と、前記周波数分析手段の
出力に基づき各周波数成分毎にスペクトルのピークとデ
ィップを強調する値を求めるスペクトル強調手段と、前
記スペクトル強調手段の各周波数成分毎の出力に非線形
処理を施す非線形処理手段と、前記周波数分析手段の出
力に前記非線形処理手段の出力を周波数成分毎に乗じる
乗算手段と、前記乗算手段の各周波数成分の出力を合成
して時間軸上の成分に戻す周波数合成手段とを備えた構
成としている。
【0010】また、本発明の音声強調方法は、入力信号
を周波数分析して周波数上の成分に変換し、次にこの周
波数分析した結果に基づいて各周波数成分毎にスペクト
ルのピークとディップを強調する値を求め、そして各周
波数成分毎のスペクトルを強調する値に非線形処理を施
し、次に前記周波数分析した結果に前記非線形処理した
値を各周波数成分毎に乗じ、各周波数成分の乗算した結
果を合成して時間軸上の成分に戻すことを特徴とするも
のである。
を周波数分析して周波数上の成分に変換し、次にこの周
波数分析した結果に基づいて各周波数成分毎にスペクト
ルのピークとディップを強調する値を求め、そして各周
波数成分毎のスペクトルを強調する値に非線形処理を施
し、次に前記周波数分析した結果に前記非線形処理した
値を各周波数成分毎に乗じ、各周波数成分の乗算した結
果を合成して時間軸上の成分に戻すことを特徴とするも
のである。
【0011】
【作用】本発明は上記構成によって、スペクトルを強調
する値を求め、このスペクトルを強調する値に非線形処
理を施し、非線形処理された値を入力信号の各周波数成
分毎に乗じることにより、フォルマントが適切に強調さ
れ音声の明瞭度を改善することとなる。
する値を求め、このスペクトルを強調する値に非線形処
理を施し、非線形処理された値を入力信号の各周波数成
分毎に乗じることにより、フォルマントが適切に強調さ
れ音声の明瞭度を改善することとなる。
【0012】
【実施例】以下、本発明を実施例に基づいて説明する。
【0013】本発明は、フォルマントを強調することに
より音声の明瞭度を改善することのできる音声強調装置
を提供するものである。
より音声の明瞭度を改善することのできる音声強調装置
を提供するものである。
【0014】以下、本発明の一実施例について、図面を
参照しながら説明する。図1は本発明の一実施例におけ
る音声強調装置の構成図を示すものである。図1におい
て、10は帯域分割フィルタ、11−1〜11−Nは帯
域分割フィルタ10の出力を入力するレベル検出器、1
2はレベル検出器11−1〜11−Nの出力を記憶する
バッファメモリ、13はバッファメモリ12の出力を選
択的に読み出すデータ選択器、14はスペクトルのピー
クとディップを強調するための係数を記憶する係数記憶
メモリ、15はデータ選択器13の出力と係数記憶メモ
リ14の内容との畳み込み演算を行う畳み込み演算器、
16は畳み込み演算器15の出力に非線形処理を施す非
線形処理器、17は非線形処理器16の出力をデータ選
択器13と同期して切り替えるスイッチ、18−1〜1
8−Nは帯域分割フィルタ10の各周波数帯域の出力と
スイッチ17の出力との乗算を行う乗算器、19は乗算
器18−1〜18−Nの各周波数帯域の出力を入力して
加算する加算器である。
参照しながら説明する。図1は本発明の一実施例におけ
る音声強調装置の構成図を示すものである。図1におい
て、10は帯域分割フィルタ、11−1〜11−Nは帯
域分割フィルタ10の出力を入力するレベル検出器、1
2はレベル検出器11−1〜11−Nの出力を記憶する
バッファメモリ、13はバッファメモリ12の出力を選
択的に読み出すデータ選択器、14はスペクトルのピー
クとディップを強調するための係数を記憶する係数記憶
メモリ、15はデータ選択器13の出力と係数記憶メモ
リ14の内容との畳み込み演算を行う畳み込み演算器、
16は畳み込み演算器15の出力に非線形処理を施す非
線形処理器、17は非線形処理器16の出力をデータ選
択器13と同期して切り替えるスイッチ、18−1〜1
8−Nは帯域分割フィルタ10の各周波数帯域の出力と
スイッチ17の出力との乗算を行う乗算器、19は乗算
器18−1〜18−Nの各周波数帯域の出力を入力して
加算する加算器である。
【0015】以上のように構成された音声強調装置につ
いて、以下その動作について説明する。
いて、以下その動作について説明する。
【0016】まず、入力信号は帯域分割フィルタ10に
入力されて、N個の周波数帯域に分割される。次に、こ
の分割された各周波数帯域毎の平均レベルがレベル検出
器11−1〜11−Nにより求められる。そして、バッ
ファメモリ12はレベル検出器11−1〜11−Nの出
力を蓄える。一方、係数記憶メモリ14はスペクトルの
ピークとディップを強調するために、周波数軸に対して
2階微分して符号反転する特性の係数C(t)を記憶し
ている。この係数C(t)を(数6)に示す。ただし、
係数C(t)は全体のレベルを変化させないために、
(数7)の条件を満足するように設定する。
入力されて、N個の周波数帯域に分割される。次に、こ
の分割された各周波数帯域毎の平均レベルがレベル検出
器11−1〜11−Nにより求められる。そして、バッ
ファメモリ12はレベル検出器11−1〜11−Nの出
力を蓄える。一方、係数記憶メモリ14はスペクトルの
ピークとディップを強調するために、周波数軸に対して
2階微分して符号反転する特性の係数C(t)を記憶し
ている。この係数C(t)を(数6)に示す。ただし、
係数C(t)は全体のレベルを変化させないために、
(数7)の条件を満足するように設定する。
【0017】
【数6】
【0018】
【数7】
【0019】データ選択器13はスペクトルを強調する
周波数帯域fを中心として前後b個づつの平均レベルを
バッファメモリ12から選択して読み出す。次に、畳み
込み演算器15はデータ選択器13により選択されたバ
ッファメモリ12の内容と係数記憶メモリ14の内容と
の畳み込み演算を(数8)に示すように行い、スペクト
ルを強調する値E(f)(f:1〜N)を求める。
周波数帯域fを中心として前後b個づつの平均レベルを
バッファメモリ12から選択して読み出す。次に、畳み
込み演算器15はデータ選択器13により選択されたバ
ッファメモリ12の内容と係数記憶メモリ14の内容と
の畳み込み演算を(数8)に示すように行い、スペクト
ルを強調する値E(f)(f:1〜N)を求める。
【0020】
【数8】
【0021】非線形処理器16は、(数9)に示すよう
に畳み込み演算器15の出力E(f)に非線形処理を施
し、E’(f)を出力する。
に畳み込み演算器15の出力E(f)に非線形処理を施
し、E’(f)を出力する。
【0022】
【数9】
【0023】次に、スイッチ17はデータ選択器13と
同期して、非線形処理器16の出力を、スペクトルを強
調する周波数帯域fに切り替え、そして乗算器18−1
〜18−Nは、帯域分割フィルタ10の各周波数帯域の
出力にスイッチ17により選択された非線形処理器16
の出力E’(f)を乗算する。最後に、加算器19は乗
算手段18−1〜18−Nの全周波数帯域の出力を加算
して出力する。そして以上の処理を繰り返す。
同期して、非線形処理器16の出力を、スペクトルを強
調する周波数帯域fに切り替え、そして乗算器18−1
〜18−Nは、帯域分割フィルタ10の各周波数帯域の
出力にスイッチ17により選択された非線形処理器16
の出力E’(f)を乗算する。最後に、加算器19は乗
算手段18−1〜18−Nの全周波数帯域の出力を加算
して出力する。そして以上の処理を繰り返す。
【0024】図2は本実施例に係る係数記憶メモリ14
の記憶内容を一例を示すものである。この関数はガウス
の誤差関数の差の形になっており、生理学における神経
細胞の側抑制回路を模擬したものである。この関数を各
周波数帯域の平均レベルと畳み込むことにより、スペク
トルのピークの値はさらに大きくなり、スペクトルのデ
ィップの値はさらに小さくなるので、スペクトルのコン
トラストが強調されることとなる。
の記憶内容を一例を示すものである。この関数はガウス
の誤差関数の差の形になっており、生理学における神経
細胞の側抑制回路を模擬したものである。この関数を各
周波数帯域の平均レベルと畳み込むことにより、スペク
トルのピークの値はさらに大きくなり、スペクトルのデ
ィップの値はさらに小さくなるので、スペクトルのコン
トラストが強調されることとなる。
【0025】図3は本実施例に係る非線形処理器16の
入出力特性の一例を示すものである。このような特性を
有する非線形処理器に、畳み込み演算器15の結果を通
すことにより、上限として設定した値よりも入力値が大
きい場合にはその出力値を上限値に飽和させ、下限とし
て設定した値よりも入力値が小さい場合にはその出力値
を下限値に飽和させることができるので、スペクトルの
過度な強調を防止することができる。
入出力特性の一例を示すものである。このような特性を
有する非線形処理器に、畳み込み演算器15の結果を通
すことにより、上限として設定した値よりも入力値が大
きい場合にはその出力値を上限値に飽和させ、下限とし
て設定した値よりも入力値が小さい場合にはその出力値
を下限値に飽和させることができるので、スペクトルの
過度な強調を防止することができる。
【0026】図4は本実施例における各部の周波数特性
の例を示すものである。図4において、(a)は入力信
号の各周波数帯域の平均レベルL(f)を示し、(b)
はスペクトルを強調する値E(f)を示し、(c)は非
線形処理を施したスペクトルを強調する値E’(f)を
示し、(d)は入力信号の各周波数帯域に(c)の非線
形処理を施したスペクトルを強調する値E’(f)を乗
じた結果の平均レベルL’(f)を示す。この図より、
入力に比べて出力のスペクトルのコントラストが強調さ
れるのが理解される。
の例を示すものである。図4において、(a)は入力信
号の各周波数帯域の平均レベルL(f)を示し、(b)
はスペクトルを強調する値E(f)を示し、(c)は非
線形処理を施したスペクトルを強調する値E’(f)を
示し、(d)は入力信号の各周波数帯域に(c)の非線
形処理を施したスペクトルを強調する値E’(f)を乗
じた結果の平均レベルL’(f)を示す。この図より、
入力に比べて出力のスペクトルのコントラストが強調さ
れるのが理解される。
【0027】以上のように本実施例によれば、(数6)
に示すような、周波数軸に対して2階微分して符号反転
する特性の係数C(t)(t:−b〜+b)を記憶して
いる係数記憶メモリ14の内容を、入力信号の各周波数
帯域の平均レベルL(f)(f:1〜N)に(数8)に
基づいて畳み込むことにより、入力信号のスペクトルの
コントラストを強調する値E(f)(f:1〜N)が得
られ、この値を帯域分割された入力信号の第f帯域に乗
じることにより、音声のフォルマントの強調が安定に行
われ、明瞭度が改善されることとなり、値E(f)に非
線形処理を施して、上限値と下限値を持った値E’
(f)(f:1〜N)に変換することにより、スペクト
ルの過度な強調や抑圧が防がれることとなり、係数C
(t)を(数7)の条件を満足するように設定すること
により、全体のレベルを変化させることを防止できる。
に示すような、周波数軸に対して2階微分して符号反転
する特性の係数C(t)(t:−b〜+b)を記憶して
いる係数記憶メモリ14の内容を、入力信号の各周波数
帯域の平均レベルL(f)(f:1〜N)に(数8)に
基づいて畳み込むことにより、入力信号のスペクトルの
コントラストを強調する値E(f)(f:1〜N)が得
られ、この値を帯域分割された入力信号の第f帯域に乗
じることにより、音声のフォルマントの強調が安定に行
われ、明瞭度が改善されることとなり、値E(f)に非
線形処理を施して、上限値と下限値を持った値E’
(f)(f:1〜N)に変換することにより、スペクト
ルの過度な強調や抑圧が防がれることとなり、係数C
(t)を(数7)の条件を満足するように設定すること
により、全体のレベルを変化させることを防止できる。
【0028】なお、本実施例では本発明に係る周波数分
析手段を帯域分割フィルタとして説明したが、帯域分割
フィルタは高速フーリエ変換器などの直交変換器でも良
い。この場合は計算がより効率的に行われる。
析手段を帯域分割フィルタとして説明したが、帯域分割
フィルタは高速フーリエ変換器などの直交変換器でも良
い。この場合は計算がより効率的に行われる。
【0029】なお、本実施例では係数記憶メモリ14の
記憶内容である係数C(t)は全体のレベルを変化させ
ないために、(数7)の条件を満足するように設定して
いるが、(数10)のように係数C(t)の総和が1未
満になるような条件を満足するように設定しても良い。
この場合には、スペクトルが平坦な場合にはレベルが抑
圧されるので、入力信号に白色雑音が重畳しているよう
な時には、無音声区間で雑音が抑圧されて、S/N比が
改善されることとなる。
記憶内容である係数C(t)は全体のレベルを変化させ
ないために、(数7)の条件を満足するように設定して
いるが、(数10)のように係数C(t)の総和が1未
満になるような条件を満足するように設定しても良い。
この場合には、スペクトルが平坦な場合にはレベルが抑
圧されるので、入力信号に白色雑音が重畳しているよう
な時には、無音声区間で雑音が抑圧されて、S/N比が
改善されることとなる。
【0030】
【数10】
【0031】また、本実施例では係数記憶メモリ14の
記憶内容である係数C(t)は(数6)に示すような関
数で定義したが、周波数軸に対して2階微分して符号反
転する特性の関数であれば他のものでもかまわない。こ
の場合は関数の選択の仕方によって、計算がより効率的
に行われる。
記憶内容である係数C(t)は(数6)に示すような関
数で定義したが、周波数軸に対して2階微分して符号反
転する特性の関数であれば他のものでもかまわない。こ
の場合は関数の選択の仕方によって、計算がより効率的
に行われる。
【0032】以上本発明の実施例における音声強調装置
を説明したが、このような音声強調装置は、ソフトウェ
アで実現することもできる。以下、ソフトウェアで実現
する場合の処理フローについてフローチャートを用いて
説明する。
を説明したが、このような音声強調装置は、ソフトウェ
アで実現することもできる。以下、ソフトウェアで実現
する場合の処理フローについてフローチャートを用いて
説明する。
【0033】図5はそのフローチャートである。以下、
その流れについて説明する。まずステップ50で、入力
信号を周波数分析し、N個の周波数成分に分割する。次
に、ステップ51でこの各周波数成分の平均レベルL
(f)(f:1〜N)の算出を行い、ステップ52で、
(数6)に示すような、周波数軸に対して2階微分して
符号反転する特性の係数C(t)を用いて、その係数C
(t)を、スペクトルを強調する周波数fを中心として
前後b個づつの平均レベルに(数8)に示すように畳み
込み演算を行ない、スペクトルのピークとディップを強
調する値E(f)(f:1〜N)を求める。ただし、係
数C(t)は全体のレベルを変化させないために、(数
7)の条件を満足するように設定する。
その流れについて説明する。まずステップ50で、入力
信号を周波数分析し、N個の周波数成分に分割する。次
に、ステップ51でこの各周波数成分の平均レベルL
(f)(f:1〜N)の算出を行い、ステップ52で、
(数6)に示すような、周波数軸に対して2階微分して
符号反転する特性の係数C(t)を用いて、その係数C
(t)を、スペクトルを強調する周波数fを中心として
前後b個づつの平均レベルに(数8)に示すように畳み
込み演算を行ない、スペクトルのピークとディップを強
調する値E(f)(f:1〜N)を求める。ただし、係
数C(t)は全体のレベルを変化させないために、(数
7)の条件を満足するように設定する。
【0034】次に、ステップ53で、スペクトルを強調
する値E(f)(f:1〜N)に(数9)で示すような
入力に対して上限と下限を与える非線形処理を施し、
E’(f)(f:1〜N)を算出する。
する値E(f)(f:1〜N)に(数9)で示すような
入力に対して上限と下限を与える非線形処理を施し、
E’(f)(f:1〜N)を算出する。
【0035】そしてステップ54で、周波数分析された
周波数fの入力信号の成分にE’(f)(f:1〜N)
を乗じることにより音声強調を行い、ステップ55で、
周波数合成して時間軸波形に戻して出力し、ステップ5
0に戻って以上の処理を繰り返す。
周波数fの入力信号の成分にE’(f)(f:1〜N)
を乗じることにより音声強調を行い、ステップ55で、
周波数合成して時間軸波形に戻して出力し、ステップ5
0に戻って以上の処理を繰り返す。
【0036】以上のように本実施例によれば、ステップ
52で(数6)に示すような、周波数軸に対して2階微
分して符号反転する特性の係数C(t)を入力信号の各
周波数成分の平均レベルL(f)(f:1〜N)に(数
8)に基づいて畳み込むことにより、入力信号のスペク
トルのコントラストを強調する値E(f)(f:1〜
N)が得られ、ステップ54で、周波数分析された入力
信号の第f成分に乗じることにより、音声のフォルマン
トを安定して強調し、明瞭度が改善されることとなる。
また、ステップ53で、値E(f)に非線形処理を施し
て、上限値と下限値を持った値E’(f)(f:1〜
N)に変換することにより、スペクトルの過度な強調や
抑圧が防がれることとなり、係数C(t)を(数7)の
条件を満足するように設定することにより、全体のレベ
ルを変化させることなく音声の強調が行われる。
52で(数6)に示すような、周波数軸に対して2階微
分して符号反転する特性の係数C(t)を入力信号の各
周波数成分の平均レベルL(f)(f:1〜N)に(数
8)に基づいて畳み込むことにより、入力信号のスペク
トルのコントラストを強調する値E(f)(f:1〜
N)が得られ、ステップ54で、周波数分析された入力
信号の第f成分に乗じることにより、音声のフォルマン
トを安定して強調し、明瞭度が改善されることとなる。
また、ステップ53で、値E(f)に非線形処理を施し
て、上限値と下限値を持った値E’(f)(f:1〜
N)に変換することにより、スペクトルの過度な強調や
抑圧が防がれることとなり、係数C(t)を(数7)の
条件を満足するように設定することにより、全体のレベ
ルを変化させることなく音声の強調が行われる。
【0037】なお、本実施例では(数6)で示した係数
C(t)は全体のレベルを変化させないために、(数
7)の条件を満足するように設定しているが、(数1
0)のように係数C(t)の総和が1未満になるような
条件を満足するように設定しても良い。この場合はスペ
クトルが平坦な入力信号ではレベルが抑圧されるので、
入力信号に白色雑音が重畳しているような時には、無音
声区間で雑音が抑圧されて、S/N比が改善されること
となる。
C(t)は全体のレベルを変化させないために、(数
7)の条件を満足するように設定しているが、(数1
0)のように係数C(t)の総和が1未満になるような
条件を満足するように設定しても良い。この場合はスペ
クトルが平坦な入力信号ではレベルが抑圧されるので、
入力信号に白色雑音が重畳しているような時には、無音
声区間で雑音が抑圧されて、S/N比が改善されること
となる。
【0038】また、本実施例では係数C(T)は(数
6)に示すような関数で定義したが、周波数軸に対して
2階微分して符号反転する特性の関数であれば他の関数
を用いてもかまわない。この場合は関数の選択の仕方に
よって、計算がより効率的に行われる。
6)に示すような関数で定義したが、周波数軸に対して
2階微分して符号反転する特性の関数であれば他の関数
を用いてもかまわない。この場合は関数の選択の仕方に
よって、計算がより効率的に行われる。
【0039】
【発明の効果】以上の説明より明かなように本発明は、
入力信号を複数の周波数帯域に分割する帯域分割手段
と、前記帯域分割手段の各周波数帯域の出力の平均レベ
ルを求めるレベル検出手段と、前記レベル検出手段の出
力に基づきスペクトルのピークとディップを強調する値
を各周波数帯域毎に求めるスペクトル強調手段と、前記
スペクトル強調手段の各周波数帯域毎の出力に非線形処
理を施す非線形処理手段と、前記帯域分割手段の出力に
前記非線形処理手段の出力を各周波数帯域毎に乗じる乗
算手段と、前記乗算手段の全帯域の出力を加算する加算
手段とを備えて構成したことにより、例えば(数1)に
示すような周波数軸に対して2階微分して符号反転する
特性の係数を記憶している記憶手段の内容と入力信号の
各周波数帯域の平均レベルが(数4)に基づいて畳み込
まれることにより、入力信号のスペクトルのコントラス
トを強調する値E(f)(f:1〜N)が得られ、この
値を帯域分割された入力信号の第f帯域に乗じることに
より、音声のフォルマントの強調が安定に行われ、明瞭
度が改善されることとなる。また、スペクトル強調手段
の各周波数帯域毎の出力に非線形処理を施す非線形処理
手段を設けることにより、値E(f)に非線形処理が施
され、上限値と下限値を持った値E’(f)(f:1〜
N)に変換することにより、スペクトルの過度な強調や
抑圧が防がれることとなる。また、係数C(t)を(数
2)の条件を満足するように設定することにより、全体
のレベルを変化させることを防止することができる。さ
らに係数C(t)を(数3)の条件を満足するように設
定することにより、無音声区間の定常雑音を抑圧するこ
とができる、など優れた効果を発揮するものである。
入力信号を複数の周波数帯域に分割する帯域分割手段
と、前記帯域分割手段の各周波数帯域の出力の平均レベ
ルを求めるレベル検出手段と、前記レベル検出手段の出
力に基づきスペクトルのピークとディップを強調する値
を各周波数帯域毎に求めるスペクトル強調手段と、前記
スペクトル強調手段の各周波数帯域毎の出力に非線形処
理を施す非線形処理手段と、前記帯域分割手段の出力に
前記非線形処理手段の出力を各周波数帯域毎に乗じる乗
算手段と、前記乗算手段の全帯域の出力を加算する加算
手段とを備えて構成したことにより、例えば(数1)に
示すような周波数軸に対して2階微分して符号反転する
特性の係数を記憶している記憶手段の内容と入力信号の
各周波数帯域の平均レベルが(数4)に基づいて畳み込
まれることにより、入力信号のスペクトルのコントラス
トを強調する値E(f)(f:1〜N)が得られ、この
値を帯域分割された入力信号の第f帯域に乗じることに
より、音声のフォルマントの強調が安定に行われ、明瞭
度が改善されることとなる。また、スペクトル強調手段
の各周波数帯域毎の出力に非線形処理を施す非線形処理
手段を設けることにより、値E(f)に非線形処理が施
され、上限値と下限値を持った値E’(f)(f:1〜
N)に変換することにより、スペクトルの過度な強調や
抑圧が防がれることとなる。また、係数C(t)を(数
2)の条件を満足するように設定することにより、全体
のレベルを変化させることを防止することができる。さ
らに係数C(t)を(数3)の条件を満足するように設
定することにより、無音声区間の定常雑音を抑圧するこ
とができる、など優れた効果を発揮するものである。
【図1】本発明の一実施例における音声強調装置の構成
図
図
【図2】本発明の音声強調装置に係る係数記憶メモリに
記憶される内容C(t)の一例を示す特性図
記憶される内容C(t)の一例を示す特性図
【図3】本発明の音声強調装置に係る非線形処理器の一
例を示す特性図
例を示す特性図
【図4】本発明の一実施例における音声強調装置の各部
の周波数特性図
の周波数特性図
【図5】本発明の音声強調装置をソフトウェアで実現す
る場合の処理フローを示すフローチャート
る場合の処理フローを示すフローチャート
【図6】従来の音声強調装置の構成図
10 帯域分割フィルタ 11−1〜11−N レベル検出器 12 バッファメモリ 13 データ選択器 14 係数記憶メモリ 15 畳み込み演算器 16 非線形処理器 17 スイッチ 18−1〜18−N 乗算器 19 加算器
Claims (12)
- 【請求項1】入力信号を周波数軸上の成分に変換する周
波数分析手段と、前記周波数分析手段の出力に基づき各
周波数成分毎にスペクトルのピークとディップを強調す
る値を求めるスペクトル強調手段と、前記スペクトル強
調手段の各周波数成分毎の出力に非線形処理を施す非線
形処理手段と、前記周波数分析手段の出力に前記非線形
処理手段の出力を周波数成分毎に乗じる乗算手段と、前
記乗算手段の各周波数成分の出力を合成して時間軸上の
成分に戻す周波数合成手段とを備えたことを特徴とする
音声強調装置。 - 【請求項2】入力信号を複数の周波数帯域に分割する帯
域分割手段と、前記帯域分割手段の各周波数帯域の出力
の平均レベルを求めるレベル検出手段と、前記レベル検
出手段の出力に基づきスペクトルのピークとディップを
強調する値を各周波数帯域毎に求めるスペクトル強調手
段と、前記スペクトル強調手段の各周波数帯域毎の出力
に非線形処理を施す非線形処理手段と、前記帯域分割手
段の出力に前記非線形処理手段の出力を各周波数帯域毎
に乗じる乗算手段と、前記乗算手段の全帯域の出力を加
算する加算手段とを備えたことを特徴とする音声強調装
置。 - 【請求項3】スペクトル強調手段は、スペクトルを強調
するための特性を前もって記憶した記憶手段と、各周波
数帯域及びその前後の帯域におけるレベル検出手段の出
力と前記記憶手段の内容との畳み込み演算を行う畳み込
み手段とを有して構成されたことを特徴とする請求項2
記載の音声強調装置。 - 【請求項4】記憶手段は、周波数軸に対して2階微分し
て符号反転する特性を記憶していることを特徴とする請
求項3記載の音声強調装置。 - 【請求項5】記憶手段は、次式で示される係数C(t)
を記憶していることを特徴とする請求項3記載の音声強
調装置。 【数1】 - 【請求項6】記憶手段が記憶する係数C(t)は次式で
示される条件を満足するように設定することを特徴とす
る請求項5記載の音声強調装置。 【数2】 - 【請求項7】記憶手段が記憶する係数C(t)は次式で
示される条件を満足するように設定することを特徴とす
る請求項5記載の音声強調装置。 【数3】 - 【請求項8】非線形処理手段は、スペクトル強調手段の
出力が、所定の上限値よりも大きい場合には出力を前記
上限値に飽和させ、スペクトル強調手段の出力が、所定
の下限値よりも小さい場合には出力を前記下限値に飽和
させることを特徴とする請求項1または請求項2記載の
音声信号処理装置。 - 【請求項9】入力信号を周波数分析して周波数上の成分
に変換し、次にこの周波数分析した結果に基づいて各周
波数成分毎にスペクトルのピークとディップを強調する
値を求め、そして各周波数成分毎のスペクトルを強調す
る値に非線形処理を施し、次に前記周波数分析した結果
に前記非線形処理した値を各周波数成分毎に乗じ、各周
波数成分の乗算した結果を合成して時間軸上の成分に戻
すことを特徴とする音声強調方法。 - 【請求項10】入力信号を周波数分析し、次に周波数分
析した結果に基づき各周波数成分毎の平均レベルL
(f)を求め、そして前記平均レベルL(f)に基づい
て各周波数成分毎のスペクトルのピークとディップを強
調する値E(f)を求め、次に各周波数成分毎のスペク
トルを強調する値E(f)に非線形処理を施した値E’
(f)を求め、そして前記周波数分析した結果に前記非
線形処理した値E’(f)を各周波数成分毎に乗じ、各
周波数成分の乗算した結果を合成して時間軸上の成分に
戻すことを特徴とする音声強調方法。 - 【請求項11】スペクトルのピークとディップを強調す
る値E(f)は、次式に基づいて計算されることを特徴
とする請求項10記載の音声強調方法。 【数4】 但し、C(t)は(数1)を満足するものとする。 - 【請求項12】非線形処理は、次式に基づいて行われる
ことを特徴とする請求項10記載の音声強調方法。 【数5】
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4351782A JPH06175691A (ja) | 1992-12-07 | 1992-12-07 | 音声強調装置と音声強調方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4351782A JPH06175691A (ja) | 1992-12-07 | 1992-12-07 | 音声強調装置と音声強調方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06175691A true JPH06175691A (ja) | 1994-06-24 |
Family
ID=18419573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4351782A Pending JPH06175691A (ja) | 1992-12-07 | 1992-12-07 | 音声強調装置と音声強調方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06175691A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010072460A (ja) * | 2008-09-19 | 2010-04-02 | Oki Electric Ind Co Ltd | 音声通信装置及び音声通信プログラム |
WO2010064728A1 (en) * | 2008-12-04 | 2010-06-10 | Canon Kabushiki Kaisha | Convolution operation circuit and object recognition apparatus |
JP2011522294A (ja) * | 2008-05-29 | 2011-07-28 | クゥアルコム・インコーポレイテッド | スペクトルコントラスト強調のためのシステム、方法、装置、およびコンピュータプログラム製品 |
US8538749B2 (en) | 2008-07-18 | 2013-09-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for enhanced intelligibility |
JP2014219567A (ja) * | 2013-05-08 | 2014-11-20 | 日本放送協会 | 音声強調装置、及びプログラム |
-
1992
- 1992-12-07 JP JP4351782A patent/JPH06175691A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011522294A (ja) * | 2008-05-29 | 2011-07-28 | クゥアルコム・インコーポレイテッド | スペクトルコントラスト強調のためのシステム、方法、装置、およびコンピュータプログラム製品 |
US8538749B2 (en) | 2008-07-18 | 2013-09-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for enhanced intelligibility |
JP2010072460A (ja) * | 2008-09-19 | 2010-04-02 | Oki Electric Ind Co Ltd | 音声通信装置及び音声通信プログラム |
WO2010064728A1 (en) * | 2008-12-04 | 2010-06-10 | Canon Kabushiki Kaisha | Convolution operation circuit and object recognition apparatus |
JP2010134697A (ja) * | 2008-12-04 | 2010-06-17 | Canon Inc | コンボリューション演算回路、階層的コンボリューション演算回路及び物体認識装置 |
US8832004B2 (en) | 2008-12-04 | 2014-09-09 | Canon Kabushiki Kaisha | Convolution operation circuit and object recognition apparatus |
JP2014219567A (ja) * | 2013-05-08 | 2014-11-20 | 日本放送協会 | 音声強調装置、及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8489394B2 (en) | Method, apparatus, and computer program for suppressing noise | |
EP1774517B1 (en) | Audio signal dereverberation | |
JP4963787B2 (ja) | サブバンド音声信号のノイズ削減 | |
CN107004427B (zh) | 增强多声道音频信号内语音分量的信号处理装置 | |
US10811026B2 (en) | Noise suppression method, device, and program | |
US6370255B1 (en) | Loudness-controlled processing of acoustic signals | |
US20100179808A1 (en) | Speech Enhancement | |
US10382857B1 (en) | Automatic level control for psychoacoustic bass enhancement | |
US20040098431A1 (en) | Device and method for interpolating frequency components of signal | |
US4809331A (en) | Apparatus and methods for speech analysis | |
JPH06175691A (ja) | 音声強調装置と音声強調方法 | |
US6519342B1 (en) | Method and apparatus for filtering an audio signal | |
Moliner et al. | Virtual bass system with fuzzy separation of tones and transients | |
JPH0675595A (ja) | 音声加工装置と補聴器 | |
JP2830276B2 (ja) | 信号処理装置 | |
JPWO2019203127A1 (ja) | 情報処理装置、これを用いたミキシング装置、及びレイテンシ減少方法 | |
JPH08328593A (ja) | スペクトル分析方法 | |
JPH0318720B2 (ja) | ||
EP3783912B1 (en) | Mixing device, mixing method, and mixing program | |
JP6559576B2 (ja) | 雑音抑圧装置、雑音抑圧方法及びプログラム | |
JP2899434B2 (ja) | 音声信号処理装置 | |
JPH0627995A (ja) | 音声信号処理装置と音声信号処理方法 | |
KR950013556B1 (ko) | 음성신호처리장치 | |
JPH054355Y2 (ja) | ||
KR100587568B1 (ko) | 음성 향상 시스템 및 방법 |