JPH06175691A

JPH06175691A - 音声強調装置と音声強調方法

Info

Publication number: JPH06175691A
Application number: JP4351782A
Authority: JP
Inventors: Ryoji Suzuki; 良二鈴木
Original assignee: GIJUTSU KENKYU KUMIAI IRYO FUK; GIJUTSU KENKYU KUMIAI IRYO FUKUSHI KIKI KENKYUSHO
Current assignee: GIJUTSU KENKYU KUMIAI IRYO FUK; GIJUTSU KENKYU KUMIAI IRYO FUKUSHI KIKI KENKYUSHO
Priority date: 1992-12-07
Filing date: 1992-12-07
Publication date: 1994-06-24

Abstract

(57)【要約】【目的】音声のフォルマントを強調することにより明
瞭度を改善する。【構成】入力信号は帯域分割フィルタ１０に入力さ
れ、Ｎ個の周波数帯域に分割される。次に、レベル検出
器１１−１〜１１−Ｎにて各周波数帯域毎の平均レベル
を求め、それらをバッファメモリ１２に蓄える。そし
て、畳み込み演算器１５はデータ選択器１３により選択
されたバッファメモリ１２の内容と、係数記憶メモリ１
４の内容との畳み込み演算を行なう。その結果に非線形
処理器１６は非線形処理を施す。次に、スイッチ１７に
より選択された乗算器１８−１〜１８−Ｎは、帯域分割
フィルタ１０の出力に非線形処理器１６の出力を乗じ
る。最後に、加算器１９は乗算手段１８−１〜１８−Ｎ
の全周波数帯域の出力を加算して出力する。【効果】入力信号のスペクトルのコントラストを強調
する値が得られ、非線形処理器によりスペクトルの過度
な強調を防止する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は，音声信号の明瞭度を改
善する音声強調装置と音声強調方法に関するものであ
る。

【０００２】

【従来の技術】従来より、補聴器等において音声信号の
明瞭度を改善するために音声強調装置が利用されてい
る。

【０００３】以下、図面を参照しながら、上述したよう
な従来の音声強調装置について説明を行う。

【０００４】図６は従来の音声強調装置の構成図を示す
ものである。図６において、６０はアナログ／ディジタ
ル変換器（以下、ＡＤ変換器と呼ぶ）、６１はフォルマ
ント検出器、６２はフォルマント強調フィルタ、６３は
ディジタル／アナログ変換器（以下、ＤＡ変換器と呼
ぶ）である。

【０００５】以上のように構成された音声強調装置につ
いて、以下その動作について説明する。

【０００６】まず、入力信号はＡＤ変換器６０にてアナ
ログ信号からディジタル信号に変換される。次に、ＡＤ
変換器６０の出力に基づいて、フォルマント抽出器６１
は周波数軸上でエネルギーの集中しているフォルマント
を抽出する。そして、フォルマント強調フィルタ６２は
フォルマント抽出器６１が求めたフォルマントの情報に
基づいて、ＡＤ変換器６０から出力される入力フォルマ
ントを強調するフィルタを形成する。最後に、ＤＡ変換
器６３はフォルマント強調フィルタ６２から出力される
ディジタル信号をアナログ信号に変換して出力する。

【０００７】

【発明が解決しようとする課題】しかしながら、上記の
ような構成では、フォルマントの抽出が難しく、特に雑
音が重畳している環境では困難であるので、フォルマン
トが適切に強調できず、またフォルマントを抽出したと
してもフォルマントを強調しすぎて耳障りになることが
あるという課題を有していた。

【０００８】本発明は上記課題に鑑み、音声のフォルマ
ントを安定して強調することにより、音声の明瞭度を改
善することのできる音声強調装置を提供するものであ
る。

【０００９】

【課題を解決するための手段】この目的を達成するため
に本発明の音声強調装置は、入力信号を周波数軸上の成
分に変換する周波数分析手段と、前記周波数分析手段の
出力に基づき各周波数成分毎にスペクトルのピークとデ
ィップを強調する値を求めるスペクトル強調手段と、前
記スペクトル強調手段の各周波数成分毎の出力に非線形
処理を施す非線形処理手段と、前記周波数分析手段の出
力に前記非線形処理手段の出力を周波数成分毎に乗じる
乗算手段と、前記乗算手段の各周波数成分の出力を合成
して時間軸上の成分に戻す周波数合成手段とを備えた構
成としている。

【００１０】また、本発明の音声強調方法は、入力信号
を周波数分析して周波数上の成分に変換し、次にこの周
波数分析した結果に基づいて各周波数成分毎にスペクト
ルのピークとディップを強調する値を求め、そして各周
波数成分毎のスペクトルを強調する値に非線形処理を施
し、次に前記周波数分析した結果に前記非線形処理した
値を各周波数成分毎に乗じ、各周波数成分の乗算した結
果を合成して時間軸上の成分に戻すことを特徴とするも
のである。

【００１１】

【作用】本発明は上記構成によって、スペクトルを強調
する値を求め、このスペクトルを強調する値に非線形処
理を施し、非線形処理された値を入力信号の各周波数成
分毎に乗じることにより、フォルマントが適切に強調さ
れ音声の明瞭度を改善することとなる。

【００１２】

【実施例】以下、本発明を実施例に基づいて説明する。

【００１３】本発明は、フォルマントを強調することに
より音声の明瞭度を改善することのできる音声強調装置
を提供するものである。

【００１４】以下、本発明の一実施例について、図面を
参照しながら説明する。図１は本発明の一実施例におけ
る音声強調装置の構成図を示すものである。図１におい
て、１０は帯域分割フィルタ、１１−１〜１１−Ｎは帯
域分割フィルタ１０の出力を入力するレベル検出器、１
２はレベル検出器１１−１〜１１−Ｎの出力を記憶する
バッファメモリ、１３はバッファメモリ１２の出力を選
択的に読み出すデータ選択器、１４はスペクトルのピー
クとディップを強調するための係数を記憶する係数記憶
メモリ、１５はデータ選択器１３の出力と係数記憶メモ
リ１４の内容との畳み込み演算を行う畳み込み演算器、
１６は畳み込み演算器１５の出力に非線形処理を施す非
線形処理器、１７は非線形処理器１６の出力をデータ選
択器１３と同期して切り替えるスイッチ、１８−１〜１
８−Ｎは帯域分割フィルタ１０の各周波数帯域の出力と
スイッチ１７の出力との乗算を行う乗算器、１９は乗算
器１８−１〜１８−Ｎの各周波数帯域の出力を入力して
加算する加算器である。

【００１５】以上のように構成された音声強調装置につ
いて、以下その動作について説明する。

【００１６】まず、入力信号は帯域分割フィルタ１０に
入力されて、Ｎ個の周波数帯域に分割される。次に、こ
の分割された各周波数帯域毎の平均レベルがレベル検出
器１１−１〜１１−Ｎにより求められる。そして、バッ
ファメモリ１２はレベル検出器１１−１〜１１−Ｎの出
力を蓄える。一方、係数記憶メモリ１４はスペクトルの
ピークとディップを強調するために、周波数軸に対して
２階微分して符号反転する特性の係数Ｃ（ｔ）を記憶し
ている。この係数Ｃ（ｔ）を（数６）に示す。ただし、
係数Ｃ（ｔ）は全体のレベルを変化させないために、
（数７）の条件を満足するように設定する。

【００１７】

【数６】

【００１８】

【数７】

【００１９】データ選択器１３はスペクトルを強調する
周波数帯域ｆを中心として前後ｂ個づつの平均レベルを
バッファメモリ１２から選択して読み出す。次に、畳み
込み演算器１５はデータ選択器１３により選択されたバ
ッファメモリ１２の内容と係数記憶メモリ１４の内容と
の畳み込み演算を（数８）に示すように行い、スペクト
ルを強調する値Ｅ（ｆ）（ｆ：１〜Ｎ）を求める。

【００２０】

【数８】

【００２１】非線形処理器１６は、（数９）に示すよう
に畳み込み演算器１５の出力Ｅ（ｆ）に非線形処理を施
し、Ｅ’（ｆ）を出力する。

【００２２】

【数９】

【００２３】次に、スイッチ１７はデータ選択器１３と
同期して、非線形処理器１６の出力を、スペクトルを強
調する周波数帯域ｆに切り替え、そして乗算器１８−１
〜１８−Ｎは、帯域分割フィルタ１０の各周波数帯域の
出力にスイッチ１７により選択された非線形処理器１６
の出力Ｅ’（ｆ）を乗算する。最後に、加算器１９は乗
算手段１８−１〜１８−Ｎの全周波数帯域の出力を加算
して出力する。そして以上の処理を繰り返す。

【００２４】図２は本実施例に係る係数記憶メモリ１４
の記憶内容を一例を示すものである。この関数はガウス
の誤差関数の差の形になっており、生理学における神経
細胞の側抑制回路を模擬したものである。この関数を各
周波数帯域の平均レベルと畳み込むことにより、スペク
トルのピークの値はさらに大きくなり、スペクトルのデ
ィップの値はさらに小さくなるので、スペクトルのコン
トラストが強調されることとなる。

【００２５】図３は本実施例に係る非線形処理器１６の
入出力特性の一例を示すものである。このような特性を
有する非線形処理器に、畳み込み演算器１５の結果を通
すことにより、上限として設定した値よりも入力値が大
きい場合にはその出力値を上限値に飽和させ、下限とし
て設定した値よりも入力値が小さい場合にはその出力値
を下限値に飽和させることができるので、スペクトルの
過度な強調を防止することができる。

【００２６】図４は本実施例における各部の周波数特性
の例を示すものである。図４において、（ａ）は入力信
号の各周波数帯域の平均レベルＬ（ｆ）を示し、（ｂ）
はスペクトルを強調する値Ｅ（ｆ）を示し、（ｃ）は非
線形処理を施したスペクトルを強調する値Ｅ’（ｆ）を
示し、（ｄ）は入力信号の各周波数帯域に（ｃ）の非線
形処理を施したスペクトルを強調する値Ｅ’（ｆ）を乗
じた結果の平均レベルＬ’（ｆ）を示す。この図より、
入力に比べて出力のスペクトルのコントラストが強調さ
れるのが理解される。

【００２７】以上のように本実施例によれば、（数６）
に示すような、周波数軸に対して２階微分して符号反転
する特性の係数Ｃ（ｔ）（ｔ：−ｂ〜＋ｂ）を記憶して
いる係数記憶メモリ１４の内容を、入力信号の各周波数
帯域の平均レベルＬ（ｆ）（ｆ：１〜Ｎ）に（数８）に
基づいて畳み込むことにより、入力信号のスペクトルの
コントラストを強調する値Ｅ（ｆ）（ｆ：１〜Ｎ）が得
られ、この値を帯域分割された入力信号の第ｆ帯域に乗
じることにより、音声のフォルマントの強調が安定に行
われ、明瞭度が改善されることとなり、値Ｅ（ｆ）に非
線形処理を施して、上限値と下限値を持った値Ｅ’
（ｆ）（ｆ：１〜Ｎ）に変換することにより、スペクト
ルの過度な強調や抑圧が防がれることとなり、係数Ｃ
（ｔ）を（数７）の条件を満足するように設定すること
により、全体のレベルを変化させることを防止できる。

【００２８】なお、本実施例では本発明に係る周波数分
析手段を帯域分割フィルタとして説明したが、帯域分割
フィルタは高速フーリエ変換器などの直交変換器でも良
い。この場合は計算がより効率的に行われる。

【００２９】なお、本実施例では係数記憶メモリ１４の
記憶内容である係数Ｃ（ｔ）は全体のレベルを変化させ
ないために、（数７）の条件を満足するように設定して
いるが、（数１０）のように係数Ｃ（ｔ）の総和が１未
満になるような条件を満足するように設定しても良い。
この場合には、スペクトルが平坦な場合にはレベルが抑
圧されるので、入力信号に白色雑音が重畳しているよう
な時には、無音声区間で雑音が抑圧されて、Ｓ／Ｎ比が
改善されることとなる。

【００３０】

【数１０】

【００３１】また、本実施例では係数記憶メモリ１４の
記憶内容である係数Ｃ（ｔ）は（数６）に示すような関
数で定義したが、周波数軸に対して２階微分して符号反
転する特性の関数であれば他のものでもかまわない。こ
の場合は関数の選択の仕方によって、計算がより効率的
に行われる。

【００３２】以上本発明の実施例における音声強調装置
を説明したが、このような音声強調装置は、ソフトウェ
アで実現することもできる。以下、ソフトウェアで実現
する場合の処理フローについてフローチャートを用いて
説明する。

【００３３】図５はそのフローチャートである。以下、
その流れについて説明する。まずステップ５０で、入力
信号を周波数分析し、Ｎ個の周波数成分に分割する。次
に、ステップ５１でこの各周波数成分の平均レベルＬ
（ｆ）（ｆ：１〜Ｎ）の算出を行い、ステップ５２で、
（数６）に示すような、周波数軸に対して２階微分して
符号反転する特性の係数Ｃ（ｔ）を用いて、その係数Ｃ
（ｔ）を、スペクトルを強調する周波数ｆを中心として
前後ｂ個づつの平均レベルに（数８）に示すように畳み
込み演算を行ない、スペクトルのピークとディップを強
調する値Ｅ（ｆ）（ｆ：１〜Ｎ）を求める。ただし、係
数Ｃ（ｔ）は全体のレベルを変化させないために、（数
７）の条件を満足するように設定する。

【００３４】次に、ステップ５３で、スペクトルを強調
する値Ｅ（ｆ）（ｆ：１〜Ｎ）に（数９）で示すような
入力に対して上限と下限を与える非線形処理を施し、
Ｅ’（ｆ）（ｆ：１〜Ｎ）を算出する。

【００３５】そしてステップ５４で、周波数分析された
周波数ｆの入力信号の成分にＥ’（ｆ）（ｆ：１〜Ｎ）
を乗じることにより音声強調を行い、ステップ５５で、
周波数合成して時間軸波形に戻して出力し、ステップ５
０に戻って以上の処理を繰り返す。

【００３６】以上のように本実施例によれば、ステップ
５２で（数６）に示すような、周波数軸に対して２階微
分して符号反転する特性の係数Ｃ（ｔ）を入力信号の各
周波数成分の平均レベルＬ（ｆ）（ｆ：１〜Ｎ）に（数
８）に基づいて畳み込むことにより、入力信号のスペク
トルのコントラストを強調する値Ｅ（ｆ）（ｆ：１〜
Ｎ）が得られ、ステップ５４で、周波数分析された入力
信号の第ｆ成分に乗じることにより、音声のフォルマン
トを安定して強調し、明瞭度が改善されることとなる。
また、ステップ５３で、値Ｅ（ｆ）に非線形処理を施し
て、上限値と下限値を持った値Ｅ’（ｆ）（ｆ：１〜
Ｎ）に変換することにより、スペクトルの過度な強調や
抑圧が防がれることとなり、係数Ｃ（ｔ）を（数７）の
条件を満足するように設定することにより、全体のレベ
ルを変化させることなく音声の強調が行われる。

【００３７】なお、本実施例では（数６）で示した係数
Ｃ（ｔ）は全体のレベルを変化させないために、（数
７）の条件を満足するように設定しているが、（数１
０）のように係数Ｃ（ｔ）の総和が１未満になるような
条件を満足するように設定しても良い。この場合はスペ
クトルが平坦な入力信号ではレベルが抑圧されるので、
入力信号に白色雑音が重畳しているような時には、無音
声区間で雑音が抑圧されて、Ｓ／Ｎ比が改善されること
となる。

【００３８】また、本実施例では係数Ｃ（Ｔ）は（数
６）に示すような関数で定義したが、周波数軸に対して
２階微分して符号反転する特性の関数であれば他の関数
を用いてもかまわない。この場合は関数の選択の仕方に
よって、計算がより効率的に行われる。

【００３９】

【発明の効果】以上の説明より明かなように本発明は、
入力信号を複数の周波数帯域に分割する帯域分割手段
と、前記帯域分割手段の各周波数帯域の出力の平均レベ
ルを求めるレベル検出手段と、前記レベル検出手段の出
力に基づきスペクトルのピークとディップを強調する値
を各周波数帯域毎に求めるスペクトル強調手段と、前記
スペクトル強調手段の各周波数帯域毎の出力に非線形処
理を施す非線形処理手段と、前記帯域分割手段の出力に
前記非線形処理手段の出力を各周波数帯域毎に乗じる乗
算手段と、前記乗算手段の全帯域の出力を加算する加算
手段とを備えて構成したことにより、例えば（数１）に
示すような周波数軸に対して２階微分して符号反転する
特性の係数を記憶している記憶手段の内容と入力信号の
各周波数帯域の平均レベルが（数４）に基づいて畳み込
まれることにより、入力信号のスペクトルのコントラス
トを強調する値Ｅ（ｆ）（ｆ：１〜Ｎ）が得られ、この
値を帯域分割された入力信号の第ｆ帯域に乗じることに
より、音声のフォルマントの強調が安定に行われ、明瞭
度が改善されることとなる。また、スペクトル強調手段
の各周波数帯域毎の出力に非線形処理を施す非線形処理
手段を設けることにより、値Ｅ（ｆ）に非線形処理が施
され、上限値と下限値を持った値Ｅ’（ｆ）（ｆ：１〜
Ｎ）に変換することにより、スペクトルの過度な強調や
抑圧が防がれることとなる。また、係数Ｃ（ｔ）を（数
２）の条件を満足するように設定することにより、全体
のレベルを変化させることを防止することができる。さ
らに係数Ｃ（ｔ）を（数３）の条件を満足するように設
定することにより、無音声区間の定常雑音を抑圧するこ
とができる、など優れた効果を発揮するものである。

【図面の簡単な説明】

【図１】本発明の一実施例における音声強調装置の構成
図

【図２】本発明の音声強調装置に係る係数記憶メモリに
記憶される内容Ｃ（ｔ）の一例を示す特性図

【図３】本発明の音声強調装置に係る非線形処理器の一
例を示す特性図

【図４】本発明の一実施例における音声強調装置の各部
の周波数特性図

【図５】本発明の音声強調装置をソフトウェアで実現す
る場合の処理フローを示すフローチャート

【図６】従来の音声強調装置の構成図

【符号の説明】

１０帯域分割フィルタ１１−１〜１１−Ｎレベル検出器１２バッファメモリ１３データ選択器１４係数記憶メモリ１５畳み込み演算器１６非線形処理器１７スイッチ１８−１〜１８−Ｎ乗算器１９加算器

Claims

【特許請求の範囲】

【請求項１】入力信号を周波数軸上の成分に変換する周
波数分析手段と、前記周波数分析手段の出力に基づき各
周波数成分毎にスペクトルのピークとディップを強調す
る値を求めるスペクトル強調手段と、前記スペクトル強
調手段の各周波数成分毎の出力に非線形処理を施す非線
形処理手段と、前記周波数分析手段の出力に前記非線形
処理手段の出力を周波数成分毎に乗じる乗算手段と、前
記乗算手段の各周波数成分の出力を合成して時間軸上の
成分に戻す周波数合成手段とを備えたことを特徴とする
音声強調装置。
【請求項２】入力信号を複数の周波数帯域に分割する帯
域分割手段と、前記帯域分割手段の各周波数帯域の出力
の平均レベルを求めるレベル検出手段と、前記レベル検
出手段の出力に基づきスペクトルのピークとディップを
強調する値を各周波数帯域毎に求めるスペクトル強調手
段と、前記スペクトル強調手段の各周波数帯域毎の出力
に非線形処理を施す非線形処理手段と、前記帯域分割手
段の出力に前記非線形処理手段の出力を各周波数帯域毎
に乗じる乗算手段と、前記乗算手段の全帯域の出力を加
算する加算手段とを備えたことを特徴とする音声強調装
置。
【請求項３】スペクトル強調手段は、スペクトルを強調
するための特性を前もって記憶した記憶手段と、各周波
数帯域及びその前後の帯域におけるレベル検出手段の出
力と前記記憶手段の内容との畳み込み演算を行う畳み込
み手段とを有して構成されたことを特徴とする請求項２
記載の音声強調装置。
【請求項４】記憶手段は、周波数軸に対して２階微分し
て符号反転する特性を記憶していることを特徴とする請
求項３記載の音声強調装置。
【請求項５】記憶手段は、次式で示される係数Ｃ（ｔ）
を記憶していることを特徴とする請求項３記載の音声強
調装置。【数１】
【請求項６】記憶手段が記憶する係数Ｃ（ｔ）は次式で
示される条件を満足するように設定することを特徴とす
る請求項５記載の音声強調装置。【数２】
【請求項７】記憶手段が記憶する係数Ｃ（ｔ）は次式で
示される条件を満足するように設定することを特徴とす
る請求項５記載の音声強調装置。【数３】
【請求項８】非線形処理手段は、スペクトル強調手段の
出力が、所定の上限値よりも大きい場合には出力を前記
上限値に飽和させ、スペクトル強調手段の出力が、所定
の下限値よりも小さい場合には出力を前記下限値に飽和
させることを特徴とする請求項１または請求項２記載の
音声信号処理装置。
【請求項９】入力信号を周波数分析して周波数上の成分
に変換し、次にこの周波数分析した結果に基づいて各周
波数成分毎にスペクトルのピークとディップを強調する
値を求め、そして各周波数成分毎のスペクトルを強調す
る値に非線形処理を施し、次に前記周波数分析した結果
に前記非線形処理した値を各周波数成分毎に乗じ、各周
波数成分の乗算した結果を合成して時間軸上の成分に戻
すことを特徴とする音声強調方法。
【請求項１０】入力信号を周波数分析し、次に周波数分
析した結果に基づき各周波数成分毎の平均レベルＬ
（ｆ）を求め、そして前記平均レベルＬ（ｆ）に基づい
て各周波数成分毎のスペクトルのピークとディップを強
調する値Ｅ（ｆ）を求め、次に各周波数成分毎のスペク
トルを強調する値Ｅ（ｆ）に非線形処理を施した値Ｅ’
（ｆ）を求め、そして前記周波数分析した結果に前記非
線形処理した値Ｅ’（ｆ）を各周波数成分毎に乗じ、各
周波数成分の乗算した結果を合成して時間軸上の成分に
戻すことを特徴とする音声強調方法。
【請求項１１】スペクトルのピークとディップを強調す
る値Ｅ（ｆ）は、次式に基づいて計算されることを特徴
とする請求項１０記載の音声強調方法。【数４】但し、Ｃ（ｔ）は（数１）を満足するものとする。
【請求項１２】非線形処理は、次式に基づいて行われる
ことを特徴とする請求項１０記載の音声強調方法。【数５】