JPH0627995A - 音声信号処理装置と音声信号処理方法 - Google Patents

音声信号処理装置と音声信号処理方法

Info

Publication number
JPH0627995A
JPH0627995A JP4081670A JP8167092A JPH0627995A JP H0627995 A JPH0627995 A JP H0627995A JP 4081670 A JP4081670 A JP 4081670A JP 8167092 A JP8167092 A JP 8167092A JP H0627995 A JPH0627995 A JP H0627995A
Authority
JP
Japan
Prior art keywords
output
time constant
value
equation
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4081670A
Other languages
English (en)
Inventor
Ryoji Suzuki
良二 鈴木
Yoshiyuki Yoshizumi
嘉之 吉住
Tsuyoshi Mekata
強司 目方
Yoshinori Yamada
義則 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GIJUTSU KENKYU KUMIAI IRYO FUKUSHI KIKI KENKYUSHO
Original Assignee
GIJUTSU KENKYU KUMIAI IRYO FUKUSHI KIKI KENKYUSHO
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GIJUTSU KENKYU KUMIAI IRYO FUKUSHI KIKI KENKYUSHO filed Critical GIJUTSU KENKYU KUMIAI IRYO FUKUSHI KIKI KENKYUSHO
Priority to JP4081670A priority Critical patent/JPH0627995A/ja
Priority to US07/849,575 priority patent/US5408581A/en
Publication of JPH0627995A publication Critical patent/JPH0627995A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明は継時マスキングを補償することによ
り明瞭度を改善する音声信号処理装置と音声信号処理方
法を提供することを目的とする。 【構成】 係数計算手段11が入力信号のレベルの変化
を抑える値を求め、時定数手段12が係数計算手段11
の出力の立ち下がりに時定数を与える。非線形処理手段
13が時定数手段12の出力に上限と下限を設定し、第
1の遅延手段14は処理遅延を補償するために入力信号
に遅延を与える。そして第1の乗算手段15が第1の遅
延手段14の出力に非線形処理手段13の出力を乗じ
る。 【効果】 出力信号は入力信号に対してレベルの変化が
抑えられるので継時マスキングが防がれ、特に、レベル
の小さい子音等が強調される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声信号の明瞭度を改善
する音声信号処理装置と音声信号処理方法に関するもの
である。
【0002】
【従来の技術】従来より、難聴者に対して音声を聞き易
いように処理を行う音声信号処理方法が研究されてい
る。以下、図面を参照しながら、上述した従来の音声信
号処理方法について説明を行う。
【0003】図14は従来の音声信号処理方法のフロー
チャートを示すものである。以下その動作について説明
する。まず入力信号から子音の区間を検出する。次に入
力信号が子音区間ならば子音区間を増幅して出力する。
一方入力信号が子音区間でないならば入力信号をそのま
ま出力する。
【0004】図15はこのような従来の信号処理方法に
より音声信号を処理した結果を示すもので、図15
(a)が入力音声信号s(t)、図15(b)が上記信
号処理を施した結果得られる出力音声信号y(t)であ
る。
【0005】
【発明が解決しようとする課題】しかしながら、上記の
ような構成では子音区間の抽出が難しく、特に背景雑音
があるような場合にはその傾向が著しく、この結果、子
音を増幅しなかったり逆に子音以外の区間を増幅してし
まったりするという課題を有していた。
【0006】本発明は上記課題に鑑み、比較的簡単な処
理で、しかも安定に音声の明瞭度を改善することのでき
る音声信号処理装置と音声信号処理方法を提供するもの
である。
【0007】
【課題を解決するための手段】この目的を達成するため
に本発明の音声信号処理装置は、入力信号のレベルの変
化を抑える値を求める係数計算手段と、前記係数計算手
段の出力に時定数を与える時定数手段と、前記時定数手
段の出力に非線形処理を施す非線形処理手段と、処理遅
延を補償するために前記入力信号に遅延を与える第1の
遅延手段と、前記第1の遅延手段の出力に前記非線形処
理手段の出力を乗じる第1の乗算手段から構成されてい
る。
【0008】また、本発明の音声信号処理方法は、入力
信号の絶対値を求め、次にその時刻及びその前後の時刻
における入力信号の絶対値の情報に基づいて入力信号の
レベルの変化を抑える値A(t)を算出し、前記値A
(t)に時定数処理を施してさらに非線形処理を施し、
前記入力信号に前記非線形処理の結果を乗じて出力する
ことを特徴とする。
【0009】
【作用】本発明の音声信号処理装置は、第1の乗算手段
により第1の遅延手段の出力に非線形処理手段の出力を
乗じて出力することにより、入力信号のレベルの時間的
な変化が低減されて、子音のような小さいレベルの信号
が、母音のような大きいレベルの信号にマスキングされ
ることが防がれるので、明瞭度が改善されることとな
る。
【0010】また、本発明の音声信号処理方法によれ
ば、入力信号の絶対値を求め、その時刻t及びその前後
の時刻の入力信号の絶対値を用いて入力信号のレベルの
変化を抑える値A(t)を求め、値A(t)に時定数処
理を施した値A'(t)を求め、値A'(t)に非線形処
理を施した値A''(t)を求め、値A''(t)を入力信
号s(t)に乗じることにより、入力信号のレベルの変
化を抑えるので、子音のような小さいレベルの信号が、
母音のような大きいレベルの信号にマスキングされるこ
とが防がれ、明瞭度を改善することができる。
【0011】
【実施例】以下本発明の音声信号処理装置の一実施例に
ついて、図面を参照しながら説明する。
【0012】本発明は、相対的にレベルの低い子音など
を強調して、入力信号のレベルの時間的な変化を低減す
ることにより継時マスキングを防いで明瞭度を改善する
ことができ、かつ簡単なハードウェアで実現することの
できる音声信号処理装置を提供するものである。
【0013】図1は本発明の一実施例における音声信号
処理装置の構成図を示すものである。図1において、1
1は係数計算手段、12は時定数手段、13は非線形処
理手段、14は第1の遅延手段、15は第1の乗算手段
である。
【0014】以上のように構成された音声信号処理装置
について、以下その動作について説明する。
【0015】まず、入力信号s(t+b)が係数計算手
段11と第1の遅延手段14に入力される。次に係数計
算手段11が、その時刻t及びその前後の時刻の入力信
号に基づいて入力信号s(t)のレベルの変化を抑える
値A(t)を求める。そして時定数手段12が係数計算
手段11の出力A(t)に時定数を与えた値A'(t)
を求める。次に非線形処理手段13が時定数手段12の
出力A'(t)に非線形処理を施して値A''(t)を出
力する。そして第1の遅延手段14において上記処理に
要する時間bだけ入力信号に遅延を与える。次に第1の
乗算手段15が第1の遅延手段14の出力s(t)に非
線形処理手段13の出力A''(t)を乗じて出力する。
そして第1の遅延手段14が記憶している内容全体を1
サンプルずつ遅延させる。
【0016】図2は本発明の音声信号処理装置の一実施
例における係数計算手段11の構成図を示すものであ
る。図2において、21は絶対値手段、22は第2の遅
延手段、23は入力信号のレベルの変化を抑える値を算
出するための係数を記憶する第1の記憶手段、24は入
力信号のレベルを算出するための係数を記憶する第2の
記憶手段、25は第1の畳み込み演算手段、26は第2
の畳み込み演算手段、27は除算手段である。
【0017】以上のように構成された音声信号処理装置
の係数計算手段について、以下その動作について説明す
る。
【0018】まず絶対値手段21は入力信号s(t+
b)の絶対値を求めてその結果を第2の遅延手段22に
出力する。次に第2の遅延手段22は時刻t及びその前
後の時刻の絶対値手段21の出力(|s(t+b)|〜
|s(t−f)|)を記憶する。そして第1の畳み込み
演算手段25は第2の遅延手段22の内容(|s(t+
b)|〜|s(t−f)|)と第1の記憶手段23の内
容(C(−b)〜C(f))との畳み込み演算を行い、
レベルで正規化される前の、入力信号のレベルの変化を
抑える値M(t)を求める。次に第2の畳み込み演算手
段26は第2の遅延手段22の内容(|s(t+e)|
〜|s(t−e)|)と第2の記憶手段24の内容(E
(−e)〜E(e))との畳み込み演算を行い、時刻t
における入力信号のレベルL(t)を求める。次に除算
手段27が第1の畳み込み演算手段25の出力M(t)
を第2の畳み込み演算手段26の出力L(t)で除算す
ることにより、入力信号のレベルの変化を抑える値A
(t)を出力する。そして第2の遅延手段22の内容全
体を1サンプルずつ遅延させる。
【0019】図3は入力信号のレベル変化を抑える値M
(t)を算出するために第1の記憶手段23に記憶され
ている係数C(t)の特性を示したものである。この係
数C(t)を(数12)に示す。(数14)に示すよう
に、この係数C(t)を入力信号s(t)の絶対値に畳
み込むことにより、時刻tの前後のレベルが時刻tのレ
ベルよりも大きい場合にはM(t)の値が大きくなり、
時刻tの前後のレベルが時刻tのレベルよりも小さい場
合にはM(t)の値が小さくなるので、M(t)を入力
信号に乗じることにより入力信号のレベルが平滑化され
る。つまり係数C(t)は時間軸に対して2階微分をす
る特性である。ただし係数C(t)は全体のレベルを変
化させないために、(数13)の条件を満足するように
設定する。
【0020】
【数12】
【0021】
【数13】
【0022】
【数14】
【0023】図4は入力信号のレベル変化を抑える値M
(t)を算出するために第1の記憶手段23に記憶され
ている係数C(t)の別の特性を示したものである。こ
の係数C(t)を(数15)に示す。この図に示すよう
に、係数C(t)を時間軸に対して非対称にすることに
より、聴覚の継時マスキングがより忠実に補償されるこ
ととなる。(数17)に示すように、この係数C(t)
を入力信号s(t)の絶対値に畳み込むことにより、時
刻tの前後のレベルが時刻tのレベルよりも大きい場合
にはM(t)の値が大きくなり、時刻tの前後のレベル
が時刻tのレベルよりも小さい場合にはM(t)の値が
小さくなるので、M(t)を入力信号に乗じることによ
り入力信号のレベルが平滑化される。つまり係数C
(t)は時間軸に対して2階微分をする特性である。た
だし係数C(t)は全体のレベルを変化させないため
に、(数16)の条件を満足するように設定する。
【0024】
【数15】
【0025】
【数16】
【0026】
【数17】
【0027】図5は入力信号のレベル変化を抑える値M
(t)を算出するために第1の記憶手段23に記憶され
ている係数C(t)のさらに別の特性を示したものであ
る。この係数C(t)を(数18)に示す。この図に示
すように、係数C(t)を負の時間軸のみにすることに
より、母音の後の無音区間を増幅することが少なくなる
とともに、演算量が少なくなる。(数20)に示すよう
に、この係数C(t)を入力信号s(t)の絶対値に畳
み込むことにより、時刻tの後のレベルが時刻tのレベ
ルよりも大きい場合にはM(t)の値が大きくなり、時
刻tの後のレベルが時刻tのレベルよりも小さい場合に
はM(t)の値が小さくなるので、M(t)を入力信号
に乗じることにより入力信号のレベルが平滑化される。
つまり係数C(t)は入力信号の立ち上がりを時間軸に
対して2階微分をする特性である。ただし係数C(t)
は全体のレベルを変化させないために、(数19)の条
件を満足するように設定する。
【0028】
【数18】
【0029】
【数19】
【0030】
【数20】
【0031】図6は入力信号のレベルを求めるために第
2の記憶手段24に記憶されている係数E(t)の特性
を示したものである。この係数E(t)を(数21)に
示す。(数23)に示すように、この係数E(t)を入
力信号の絶対値に畳み込むことにより、絶対値化した入
力信号が平滑化されて、入力信号のレベルを求めること
ができる。つまり係数E(t)は時間軸に対して積分を
する特性である。ただし係数E(t)は全体のレベルを
変化させないために、(数22)の条件を満足するよう
に設定する。
【0032】
【数21】
【0033】
【数22】
【0034】
【数23】
【0035】図7は本発明の音声信号処理装置を構成す
る時定数手段12の一実施例における構成図を示すもの
である。図7において、71は第1の平滑化手段、72
は時定数手段の出力A'(t)に1サンプルの遅延を与
える第1の単位遅延手段、73は第1の単位遅延手段7
2の出力に係数α(0<α<1)を乗じる第2の乗算手
段、74は係数計算手段11の出力と第2の乗算手段7
3の出力とを選択する第1の切り替え手段、75は係数
計算手段11の出力と第1の単位遅延手段72の出力と
の比較を行い第1の切り替え手段74の制御を行う第1
の比較手段である。
【0036】以上のように構成された音声信号処理装置
の時定数手段について、以下その動作について説明す
る。
【0037】まず第1の単位遅延手段72は第1の切り
替え手段74の出力A'(t)に1サンプルの遅延を与
える。次に第2の乗算手段73は第1の単位遅延手段7
2の出力A'(t−1)に係数α(0<α<1)を乗じ
る。そして第1の比較手段75は係数計算手段11の出
力A(t)と第1の単位遅延手段72の出力A’(t−
1)との比較を行い、係数計算手段11の出力A(t)
の方が第1の単位遅延手段72の出力A'(t−1)よ
りも大きい場合には第1の切り替え手段74が係数計算
手段11の出力A(t)を選択するように制御をし、第
1の単位遅延手段72の出力A'(t−1)の方が係数
計算手段11の出力A(t)よりも大きい場合には第1
の切り替え手段74が第2の乗算手段73の出力α・
A'(t−1)を選択するように制御をする。
【0038】図8は本発明の音声信号処理装置を構成す
る非線形処理手段13の一実施例における構成図を示す
ものである。図8において、81は時定数手段12の出
力値A'(t)が所定の上限値を上回った場合に所定値
に飽和させる第1の飽和手段、82は値A'(t)が所
定の下限値を下回った場合に所定値に飽和させる第2の
飽和手段である。
【0039】以上のように構成された音声信号処理装置
の非線形処理手段について、以下その動作について説明
する。
【0040】まず第1の飽和手段81は時定数手段12
の出力値A'(t)が上限値Ahを越える場合には、値
A'(t)を上限値Ahに飽和させる。次に第2の飽和
手段81は値A'(t)が下限値Alを越えない場合に
は、値A'(t)を下限値Alに飽和させて、入力信号
のレベルの変化を抑える値A''(t)を出力する。図9
はこのような非線形処理手段13の入出力特性を示した
ものである。この値A''(t)を入力信号s(t)に乗
じることにより、過度な強調や抑制をすることなく入力
信号のレベルが平滑化される。
【0041】図10は本発明の音声信号処理装置を構成
する非線形処理手段13の別の構成図を示すものであ
る。図10において、101は上限値を出力する上限値
設定手段、102は時定数手段12の出力値A'(t)
が上限を上回った場合に飽和させる第1の飽和手段、1
03は値A'(t)が下限を下回った場合に飽和させる
第2の飽和手段である。
【0042】以上のように構成された音声信号処理装置
の非線形処理手段について、以下その動作について説明
する。
【0043】まず上限値設定手段101が時定数手段1
2の出力値A'(t)と下限値Alに基づいて上限値A
h(t)を出力する。次に第1の飽和手段102は値
A'(t)が上限値設定手段101が出力した上限値A
h(t)を越える場合には、値A'(t)を上限値Ah
(t)に飽和させる。次に第2の飽和手段103は値
A'(t)が下限値Alを越えない場合には、値A'
(t)を下限値Alに飽和させて、入力信号のレベルの
変化を抑える値A''(t)を出力する。
【0044】図11は上述した上限値設定手段101の
構成の一例を示すものである。図11において、111
は時定数手段12の出力値A'(t)と下限値Alとを
比較する第2の比較手段、112は値A'(t)を平滑
化する第2の平滑化手段、113は時定数手段12の出
力値A'(t)に(1−β)を乗じる第3の乗算手段、
114は第2の平滑化手段112の出力に単位遅延を施
す第2の単位遅延手段、115は第2の単位遅延手段1
14の出力に係数β(0≦β≦1)を乗じる第4の乗算
手段、116は第3の乗算手段113の出力と第4の乗
算手段115の出力とを加え合わせる加算手段、117
は第2の単位遅延手段114の出力と加算手段116の
出力との選択を行う第2の切り替え手段である。
【0045】以上のように構成された音声信号処理装置
の上限値設定手段について、以下その動作について説明
する。
【0046】まず、第2の比較手段111が時定数手段
12の出力値A'(t)と下限として設定した値Alと
の比較を行う。そして第2の比較手段111が時定数手
段12の出力の方が下限として設定した値Alよりも大
きいと判断した場合には、第2の比較手段111は第2
の切り替え手段117を端子a側に切り替え、第3の乗
算手段113、第2の単位遅延手段114、第4の乗算
手段115および加算手段116が時定数手段12の出
力を平滑化して上限値Ah(t)を出力する。また第2
の比較手段111が時定数手段12の出力の方が下限と
して設定した値Alよりも小さいと判断した場合には、
第2の比較手段111は第2の切り替え手段117を端
子b側に切り替え、第2の単位遅延手段114の出力を
上限値Ah(t)として出力して値を保持する。
【0047】このようにして得られた、入力信号のレベ
ルの変化を抑える値A''(t)と、第1の遅延手段14
から出力されるs(t)とを第1の乗算手段15にて乗
算し、出力信号y(t)を得る。
【0048】図12は本実施例における音声信号処理装
置により処理した効果を示すもので、図12(a)が入
力信号s(t)の信号波形図、図12(b)が出力信号
y(t)の信号波形図である。この図からも明らかなよ
うに、出力信号y(t)のレベルは入力信号s(t)の
レベルの小さい部分が増幅されたものとなっている。
【0049】以上のように本実施例によれば、係数計算
手段11が、その時刻及びその前後の時刻の入力信号に
基づいて入力信号のレベルの変化を抑える値A(t)を
求め、時定数手段12および非線形処理手段13を経由
した値A''(t)を第1の乗算手段15が第1の遅延手
段14の出力s(t)に乗じて出力することにより、入
力信号に比べて出力信号のレベルの変化が抑えられるの
で、子音のような小さいレベルの信号が、母音のような
大きいレベルの信号にマスキングされることが防がれ、
明瞭度を改善することができる。また、時定数手段12
が係数計算手段11の出力A(t)の立ち下がりに時定
数を与えた値A'(t)を出力することにより、増幅す
る区間が後方に伸び、子音だけでなく子音から母音への
過渡部も強調されるので明瞭度が一段と改善され、非線
形処理手段13が値A'(t)に非線形処理を施して上
限と下限を設けた値A''(t)を出力することにより、
過度の強調と抑圧が防がれるので、自然性を損なうこと
なく音声の強調を行うことができる。また、係数計算手
段11が入力信号のレベルの変化に対応した値A(t)
を出力するので、無音区間の定常雑音を増幅してしまう
ことはなく、さらに第1の記憶手段23が(数12)
(数15)もしくは(数18)で示される係数C(t)
を記憶し、第2の記憶手段24が(数21)で示される
係数E(t)を(数22)の条件で記憶し、第1の畳み
込み演算手段25が第2の遅延手段22の内容と第1の
記憶手段23の内容との畳み込み演算を行い、第2の畳
み込み演算手段26が第2の遅延手段22の内容と第2
の記憶手段24の内容との畳み込み演算を行い、除算手
段27が第1の畳み込み演算手段25の出力M(t)を
第2の畳み込み演算手段26の出力L(t)で除算する
ことにより、M(t)が入力信号のレベルで正規化され
た値A(t)となり、このA(t)は時刻tの前後のレ
ベルが時刻tのレベルよりも大きい場合には値が大きく
なり、時刻tの前後のレベルが時刻tのレベルよりも小
さい場合には値が小さくなるので、容易に入力信号のレ
ベルの変化を安定に抑える値A(t)を得ることができ
る。ここで第1の記憶手段23が(数15)で示される
係数C(t)を記憶した場合には、聴覚の継時マスキン
グがより忠実に補償されることとなる。またここで第1
の記憶手段23が(数18)で示される係数C(t)を
記憶した場合には、母音の後の無音区間を増幅すること
が少なくなるとともに、演算量も少なくなる。さらに非
線形処理手段13の上限値設定手段101が時定数手段
12の出力A'(t)を平滑化して上限値Ah(t)を
適応的に求めることにより、騒音の大きい環境において
は上限値Ah(t)が小さくなるので騒音を過度に増幅
することが防がれるとともに、非線形処理手段13の出
力A''(t)が上限値に飽和し易くなるので定常的な利
得の区間が長くなり自然性が損なわれにくくなる。
【0050】以下本発明の音声信号処理方法の一実施例
について、図面を参照しながら説明する。
【0051】本発明は、相対的にレベルの低い子音など
を強調して、入力信号のレベルの時間的な変化を低減す
ることにより継時マスキングを防いで明瞭度を改善する
ことができる音声信号処理方法を提供するものである。
【0052】図13は本発明の一実施例における音声信
号処理方法のフローチャートを示すものである。
【0053】以下その動作について説明する。まず時刻
(t+b)の入力信号s(t+b)を読み込む。次に入
力信号s(t+b)の絶対値|s(t+b)|を求め
る。そして(数24)、(数25)もしくは(数26)
に基づいて入力信号のレベルの変化を抑える値A(t)
を求める。(数24)のC(i)は(数12)で示すも
ので、(数25)のC(i)は(数15)で示すもので
あり、(数26)のC(i)は(数18)で示すもので
あり、E(i)は(数21)で示すものである。
【0054】
【数24】
【0055】
【数25】
【0056】
【数26】
【0057】次に(数27)に基づいてA(t)に時定
数を与えた値A'(t)を求める。そして(数28)に
基づいて非線形処理の上限値Ah(t)を求める。
【0058】
【数27】
【0059】
【数28】
【0060】次に(数29)に基づいてA'(t)に非
線形処理を施した値A''(t)を求める。そして(数3
0)に示すように入力信号s(t)にA''(t)を乗じ
て出力信号y(t)を得る。そして入力信号の絶対値を
1サンプルずつシフトする。次に入力信号を1サンプル
ずつシフトする。最後に時刻tを更新して先頭の処理に
戻る。
【0061】
【数29】
【0062】
【数30】
【0063】以上のように本実施例によれば、入力信号
の絶対値を求め、その時刻t及びその前後の時刻の入力
信号の絶対値を用いて(数24)、(数25)もしくは
(数26)に基づいて入力信号のレベルの変化を抑える
値A(t)を求め、値A(t)に時定数処理を施した値
A'(t)を求め、値A'(t)に非線形処理を施した値
A''(t)を求め、値A''(t)を入力信号s(t)に
乗じることにより、入力信号のレベルの変化を抑えるの
で、子音のような小さいレベルの信号が、母音のような
大きいレベルの信号にマスキングされることが防がれ、
明瞭度を改善することができ、また値A(t)は入力信
号のレベルの変化に対応した値なので、無音区間の定常
雑音を増幅してしまうことはない。そして時定数処理に
より値A(t)は立ち下がりに時定数を与えた値A'
(t)になり、増幅する区間が後方に伸び、子音だけで
なく子音から母音への過渡部も強調されるので明瞭度が
一段と改善される。また非線形処理により値A'(t)
は非線形処理を施されて上限と下限を設けた値A''
(t)になり、過度の強調と抑圧が防がれるので、自然
性を損なうことなく音声の強調を行うことができる。さ
らに非線形処理の上限値Ah(t)は時定数処理の出力
A'(t)を平滑化して適応的に求めることにより、騒
音の大きい環境においては上限値Ah(t)が小さくな
るので騒音を過度に増幅することが防がれるとともに、
非線形処理の結果A''(t)が上限値に飽和し易くなる
ので定常的な利得の区間が長くなり自然性が損なわれに
くくなる。
【0064】なお、本実施例では非線形処理の上限値A
h(t)を適応的に変えているが、(数31)に示すよ
うに固定定数としてもよい。この場合は演算量が少なく
なる。
【0065】
【数31】
【0066】
【発明の効果】本発明は、その時刻及びその前後の時刻
の入力信号に基づいて入力信号のレベルの変化を抑える
値を求める係数計算手段と、係数計算手段の出力に時定
数を与える時定数手段と、時定数手段の出力に非線形処
理を施す非線形処理手段と、第1の遅延手段の出力に非
線形処理手段の出力を乗じて出力する第1の乗算手段を
設けることにより、出力信号は入力信号に対してレベル
の変化が抑えられるので、子音のような小さいレベルの
信号が、母音のような大きいレベルの信号にマスキング
されることが防がれ、明瞭度を改善することができる。
また係数計算手段は入力信号のレベルの変化に対応した
値を出力するので、無音区間の定常雑音を増幅してしま
うこともない。そして第1の記憶手段が時間軸に対して
2階微分する特性を記憶し、第2の記憶手段が時間軸に
対して積分する特性を記憶し、絶対値手段が入力信号の
絶対値を求めて第2の遅延手段に出力し、第1の畳み込
み演算手段が第2の遅延手段の内容と第1の記憶手段の
内容との畳み込み演算を行い、第2の畳み込み演算手段
が第2の遅延手段の内容と第2の記憶手段の内容との畳
み込み演算を行い、除算手段が第1の畳み込み演算手段
の出力を第2の畳み込み演算手段の出力で除算すること
により、容易にレベルの変化を平滑化する値を求めるこ
とができる。また係数計算手段の出力の立ち下がりに時
定数を与える時定数手段を設けることにより、増幅する
区間が後方に伸び、子音だけでなく子音から母音への過
渡部も強調されるので明瞭度が一段と改善される。そし
て時定数手段の出力に非線形処理を施して上限と下限を
越える場合には飽和させる非線形処理手段を設けること
により、過度の強調と抑圧が防がれるので、自然性を損
なうことなく音声の強調を行うことができる。さらに時
定数手段の出力を平滑化して非線形処理の上限値を適応
的に求める上限値設定手段を設けることにより、騒音の
大きい環境においては上限値が小さくなるので騒音を過
度に増幅することが防がれるとともに、非線形処理手段
の出力が上限値に飽和し易くなるので定常的な利得の区
間が長くなり自然性が損なわれにくくなるなど、数々の
優れた効果を得ることができる音声信号処理装置を実現
できるものである。
【0067】また、本発明の音声信号処理方法によれ
ば、入力信号の絶対値を求め、その時刻t及びその前後
の時刻の入力信号の絶対値を用いて(数24)、(数2
5)もしくは(数26)に基づいて入力信号のレベルの
変化を抑える値A(t)を求め、値A(t)に時定数処
理を施した値A'(t)を求め、値A'(t)に非線形処
理を施した値A''(t)を求め、値A''(t)を入力信
号s(t)に乗じることにより、入力信号のレベルの変
化を抑えるので、子音のような小さいレベルの信号が、
母音のような大きいレベルの信号にマスキングされるこ
とが防がれ、明瞭度を改善することができる。また値A
(t)は入力信号のレベルの変化に対応した値なので、
無音区間の定常雑音を増幅してしまうことはない。そし
て値A(t)の立ち下がりに時定数を与えた値A'
(t)を求める時定数処理を設けることにより、増幅す
る区間が後方に伸び、子音だけでなく子音から母音への
過渡部も強調されるので明瞭度が一段と改善される。そ
して値A'(t)に非線形処理を施して上限と下限を設
けた値A''(t)を求める非線形処理を設けることによ
り、過度の強調と抑圧が防がれるので、自然性を損なう
ことなく音声の強調を行うことができる。さらに時定数
処理の出力A'(t)を平滑化して非線形処理の上限値
Ah(t)を適応的に求めることにより、騒音の大きい
環境においては上限値Ah(t)が小さくなるので騒音
を過度に増幅することが防がれるとともに、非線形処理
の結果A''(t)が上限値に飽和し易くなるので定常的
な利得の区間が長くなり自然性が損なわれにくくなるな
ど、数々の優れた効果を得ることができる音声信号処理
方法を実現できるものである。
【図面の簡単な説明】
【図1】本発明の一実施例における音声信号処理装置の
構成図
【図2】本発明の音声信号処理装置を構成する係数計算
手段の一実施例における構成図
【図3】本発明の音声信号処理装置を構成する第1の記
憶手段に記憶されているC(t)の一例を示す特性図
【図4】本発明の音声信号処理装置を構成する第1の記
憶手段に記憶されているC(t)の他の例を示す特性図
【図5】本発明の音声信号処理装置を構成する第1の記
憶手段に記憶されているC(t)の他の例を示す特性図
【図6】本発明の音声信号処理装置を構成する第2の記
憶手段に記憶されているE(t)の一例を示す特性図
【図7】本発明の音声信号処理装置を構成する時定数手
段の一構成例を示す構成図
【図8】本発明の音声信号処理装置を構成する非線形処
理手段の一構成例を示す構成図
【図9】本発明の音声信号処理装置を構成する非線形処
理手段の一例を示す特性図
【図10】本発明の音声信号処理装置を構成する非線形
処理手段の他の構成図
【図11】本発明の音声信号処理装置を構成する非線形
処理手段の他の構成図
【図12】本発明の一実施例における音声信号処理装置
の入力信号と出力信号の波形図
【図13】本発明の一実施例における音声信号処理方法
のフローチャート
【図14】従来の音声信号処理方法のフローチャート
【図15】従来の音声信号処理装置の入力信号と出力信
号の波形図
【符号の説明】
11 係数計算手段 12 時定数手段 13 非線形処理手段 14 第1の遅延手段 15 第1の乗算手段 21 絶対値手段 22 第2の遅延手段 23 第1の記憶手段 24 第2の記憶手段 25 第1の畳み込み演算手段 26 第2の畳み込み演算手段 27 除算手段 71 第1の平滑化手段 72 第1の単位遅延手段 73 第2の乗算手段 74 第1の切り替え手段 75 第1の比較手段 81、102 第1の飽和手段 82、103 第2の飽和手段 101 上限値設定手段 111 第2の比較手段 112 第2の平滑化手段 113 第3の乗算手段 114 第2の遅延手段 115 第4の乗算手段 116 加算手段 117 第2の切り替え手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 山田 義則 大阪府門真市大字門真1006番地 松下電器 産業株式会社内

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 入力信号のレベル変化を抑える値を求め
    る係数計算手段と、前記係数計算手段の出力に時定数を
    与える時定数手段と、前記時定数手段の出力に非線形処
    理を施す非線形処理手段と、処理遅延を補償するために
    上記入力信号を遅延させる第1の遅延手段と、前記第1
    の遅延手段の出力に前記非線形処理手段の出力を乗じる
    第1の乗算手段とを備えたことを特徴とする音声信号処
    理装置。
  2. 【請求項2】 係数計算手段は、入力信号の絶対値を求
    める絶対値手段と、前記絶対値手段の出力を記憶すると
    同時に遅延を与える第2の遅延手段と、前記入力信号の
    レベル変化を抑える値を算出するための係数を記憶する
    第1の記憶手段と、前記入力信号のレベルを算出するた
    めの係数を記憶する第2の記憶手段と、前記第2の遅延
    手段に記憶されている内容と前記第1の記憶手段に記憶
    されている内容との畳み込み演算を行う第1の畳み込み
    演算手段と、前記第2の遅延手段に記憶されている内容
    と前記第2の記憶手段に記憶されている内容との畳み込
    み演算を行う第2の畳み込み演算手段と、前記第1の畳
    み込み演算手段の出力を前記第2の畳み込み演算手段の
    出力で除算する除算手段とから構成されることを特徴と
    する請求項1記載の音声信号処理装置。
  3. 【請求項3】 第1の記憶手段は、時間軸に対して2階
    微分する特性を記憶していることを特徴とする請求項2
    記載の音声信号処理装置。
  4. 【請求項4】 第1の記憶手段は、次式で示される係数
    C(t)を記憶していることを特徴とする請求項2記載の音
    声信号処理装置。 【数1】
  5. 【請求項5】 第1の記憶手段は、次式で示される係数
    C(t)を記憶していることを特徴とする請求項2記載の音
    声信号処理装置。 【数2】
  6. 【請求項6】 第1の記憶手段は、次式で示される係数
    C(t)を記憶していることを特徴とする請求項2記載の音
    声信号処理装置。 【数3】
  7. 【請求項7】 第2の記憶手段は、時間軸に対して積分
    する特性を記憶していることを特徴とする請求項2記載
    の音声信号処理装置。
  8. 【請求項8】 第2の記憶手段は、次式で示される係数
    E(t)を記憶していることを特徴とする請求項2記載の音
    声信号処理装置。 【数4】
  9. 【請求項9】 時定数手段は、係数計算手段の出力と1
    サンプル前の前記時定数手段の出力との比較を行う第1
    の比較手段と、前記第1の比較手段が、1サンプル前の
    前記時定数手段の出力よりも前記係数計算手段の出力の
    方が大きいと判断した場合には前記係数計算手段の出力
    を前記時定数手段の出力とし、前記第1の比較手段が、
    前記係数計算手段の出力よりも1サンプル前の前記時定
    数手段の出力の方が大きいと判断した場合には1サンプ
    ル前の前記時定数手段の出力を平滑化して前記時定数手
    段の出力とする第1の平滑化手段とを有することを特徴
    とする請求項1記載の音声信号処理装置。
  10. 【請求項10】 時定数手段は、時定数手段の出力に1
    サンプルの遅延を与える第1の単位遅延手段と、係数計
    算手段の出力と前記第1の単位遅延手段の出力との比較
    を行う第1の比較手段と、前記第1の単位遅延手段の出
    力に係数α(0<α<1)を乗じる第2の乗算手段と、
    前記第1の比較手段が、前記第1の単位遅延手段の出力
    よりも前記係数計算手段の出力の方が大きいと判断した
    場合には前記係数計算手段の出力を前記時定数手段の出
    力とし、前記第1の比較手段が、前記係数計算手段の出
    力よりも前記第1の単位遅延手段の出力の方が大きいと
    判断した場合には前記第2の乗算手段の出力を前記時定
    数手段の出力とする切り替え手段とを有することを特徴
    とする請求項1記載の音声信号処理装置。
  11. 【請求項11】 非線形処理手段は、時定数手段の出力
    が上限値として設定した値よりも大きい場合には出力を
    前記上限値に飽和させる第1の飽和手段と、前記時定数
    手段の出力が下限値として設定した値よりも小さい場合
    には出力を下限値に飽和させる第2の飽和手段とを備え
    たことを特徴とする請求項1記載の音声信号処理装置。
  12. 【請求項12】 非線形処理手段は、時定数手段の出力
    に基づいて上限値を設定する上限値設定手段と、前記時
    定数手段の出力が前記上限値設定手段が設定した値より
    も大きい場合には出力を前記上限値に飽和させる第1の
    飽和手段と、前記時定数手段の出力が下限値として設定
    した値よりも小さい場合には出力を前記下限値に飽和さ
    せる第2の飽和手段とを備えたことを特徴とする請求項
    1記載の音声信号処理装置。
  13. 【請求項13】 上限値設定手段は、時定数手段の出力
    と下限値として設定した値との比較を行う第2の比較手
    段と、前記第2の比較手段が、前記時定数手段の出力の
    方が前記下限値として設定した値よりも大きいと判断し
    た場合には前記時定数手段の出力を平滑化して出力し、
    前記第2の比較手段が、係数計算手段の出力の方が下限
    値として設定した値よりも小さいと判断した場合には前
    記上限値設定手段の1サンプル前の出力を保持する第2
    の平滑化手段とを備えたことを特徴とする請求項12記
    載の音声信号処理装置。
  14. 【請求項14】 入力信号の絶対値を求め、次にその時
    刻及びその前後の時刻における入力信号の絶対値の情報
    に基づいて入力信号のレベルの変化を抑える値A(t)
    を算出し、前記値A(t)に時定数処理を施してさらに
    非線形処理を施し、前記入力信号に前記非線形処理の結
    果を乗じて出力することを特徴とする音声信号処理方
    法。
  15. 【請求項15】 入力信号のレベルの変化を抑える値A
    (t)は、次式に基づいて計算されることを特徴とする
    請求項14記載の音声信号処理方法。 【数5】 但し、C(t)は(数1)で表わされ、E(t)は(数4)で表
    わされるものとする。
  16. 【請求項16】 入力信号のレベルの変化を抑える値A
    (t)は、次式に基づいて計算されることを特徴とする
    請求項14記載の音声信号処理方法。 【数6】 但し、C(t)は(数2)で表わされ、E(t)は(数4)で表
    わされるものとする。
  17. 【請求項17】 入力信号のレベルの変化を抑える値A
    (t)は、次式に基づいて計算されることを特徴とする
    請求項14記載の音声信号処理方法。 【数7】 但し、C(t)は(数3)で表わされ、E(t)は(数4)で表
    わされるものとする。
  18. 【請求項18】 時定数処理は、次式に基づいて計算さ
    れることを特徴とする請求項14記載の音声信号処理方
    法。 【数8】
  19. 【請求項19】 非線形処理は、次式に基づいて行われ
    ることを特徴とする請求項14記載の音声信号処理方
    法。 【数9】
  20. 【請求項20】 非線形処理は、次式に基づいて行われ
    ることを特徴とする請求項14記載の音声信号処理方
    法。 【数10】 但し、 【数11】
JP4081670A 1991-03-14 1992-03-02 音声信号処理装置と音声信号処理方法 Pending JPH0627995A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP4081670A JPH0627995A (ja) 1992-03-02 1992-03-02 音声信号処理装置と音声信号処理方法
US07/849,575 US5408581A (en) 1991-03-14 1992-03-10 Apparatus and method for speech signal processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4081670A JPH0627995A (ja) 1992-03-02 1992-03-02 音声信号処理装置と音声信号処理方法

Publications (1)

Publication Number Publication Date
JPH0627995A true JPH0627995A (ja) 1994-02-04

Family

ID=13752783

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4081670A Pending JPH0627995A (ja) 1991-03-14 1992-03-02 音声信号処理装置と音声信号処理方法

Country Status (1)

Country Link
JP (1) JPH0627995A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007511793A (ja) * 2003-11-14 2007-05-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号処理システム及び方法
JP2008146083A (ja) * 1994-12-08 2008-06-26 Univ California 言語障害者間の語音の認識を向上させるための方法および装置
JP2010521012A (ja) * 2007-03-09 2010-06-17 スカイプ・リミテッド 音声符号化システム及び方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0619495A (ja) * 1991-03-14 1994-01-28 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho 音声信号処理装置と音声信号処理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0619495A (ja) * 1991-03-14 1994-01-28 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho 音声信号処理装置と音声信号処理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146083A (ja) * 1994-12-08 2008-06-26 Univ California 言語障害者間の語音の認識を向上させるための方法および装置
JP2007511793A (ja) * 2003-11-14 2007-05-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号処理システム及び方法
JP2010521012A (ja) * 2007-03-09 2010-06-17 スカイプ・リミテッド 音声符号化システム及び方法

Similar Documents

Publication Publication Date Title
JP3457293B2 (ja) 雑音抑圧装置及び雑音抑圧方法
JP3454190B2 (ja) 雑音抑圧装置および方法
EP1312162B1 (en) Voice enhancement system
EP2070191B1 (en) Audio-peak limiting in slow and fast stages
EP1774517B1 (en) Audio signal dereverberation
JP4747835B2 (ja) オーディオ再生の効果付加方法およびその装置
US5408581A (en) Apparatus and method for speech signal processing
AU721270B2 (en) Noise reduction apparatus and noise reduction method
JP2000330597A (ja) 雑音抑圧装置
JPH09258781A (ja) デジタル音声処理装置
JPH0627995A (ja) 音声信号処理装置と音声信号処理方法
JP2979119B2 (ja) 自動ダイナミック・レンジ制御回路
JPH04116698A (ja) 音声信号処理装置と音声信号処理方法
JPH09311696A (ja) 自動利得調整装置
JP2899434B2 (ja) 音声信号処理装置
JPH06289897A (ja) 音声信号処理装置
JPH0590899A (ja) デイジタル音声信号の周波数応答に作用する回路装置
Vickers The Non-flat and Continually Changing Frequency Response of Multiband Compressors
JP3102553B2 (ja) 音声信号処理装置
JP3255348B2 (ja) 遅延量制御装置及び音像制御装置
JPH06175691A (ja) 音声強調装置と音声強調方法
JP2009265422A (ja) 情報処理装置及び情報処理方法
JP2002278585A (ja) 雑音除去装置
JPH05249994A (ja) 音声強調装置
JP3460278B2 (ja) 雑音低減処理方法