JP5359744B2 - 音処理装置及びプログラム - Google Patents

音処理装置及びプログラム Download PDF

Info

Publication number
JP5359744B2
JP5359744B2 JP2009225287A JP2009225287A JP5359744B2 JP 5359744 B2 JP5359744 B2 JP 5359744B2 JP 2009225287 A JP2009225287 A JP 2009225287A JP 2009225287 A JP2009225287 A JP 2009225287A JP 5359744 B2 JP5359744 B2 JP 5359744B2
Authority
JP
Japan
Prior art keywords
band
signal
sound
noise
frequency band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009225287A
Other languages
English (en)
Other versions
JP2011075694A (ja
Inventor
弘美 青柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2009225287A priority Critical patent/JP5359744B2/ja
Publication of JP2011075694A publication Critical patent/JP2011075694A/ja
Application granted granted Critical
Publication of JP5359744B2 publication Critical patent/JP5359744B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は音処理装置及びプログラムに関し、例えば、電話端末において捕捉音声若しくは発音出力音声の明瞭度を向上させる場合に適用し得るものである。
雑音が重畳された音声は、明瞭度が下り発話内容が聴き取り難くなるなどの問題が生じる。これを解決するために、従来から、ノイズキャンセラ、ノイズサプレッサと称される技術が存在する。また、特許文献1に示されるような音声強調技術が存在する。前者は、雑音が重畳された音声から雑音部分を消去、抑圧することにより音声対雑音比(SN比)を向上させて明瞭度を向上させるものである。後者は、音声部分を強調することにより、音声対雑音比を向上させ明瞭度を向上させるものである。
特開平6−208395号公報
しかしながら、前者の方法では、消去、抑圧された後の雑音の周波数特性について特には考慮がなされず、レベルは下るものの異音が発生して、逆に聴感品質を劣化させる場合があった。また、後者の方法では、元々の音声が持つ周波数特性を過度に変形して歪感を増大させる場合があった。
本発明は、前述の課題に鑑みてなされたものであり、自然な聴感を保ちつつ信号対雑音比を向上させ、音信号(音声信号若しくは音響信号)の明瞭度を向上させる音処理装置及びプログラムを提供しようとしたものである。
第1の本発明は、入力された音信号に含まれている雑音成分の抑圧により信号対雑音比を向上させて音信号の明瞭度を向上させる音処理装置において、(1)人間の聴覚特性に基づいて決定された周波数帯域毎の雑音抑圧下限値を保持している抑圧下限保持手段と、(2)入力された上記音信号を帯域分割する帯域分割手段と、(3)上記各帯域分割信号の信号対雑音比を、周波数帯域によって定まる閾値と比較することにより、周波数帯域毎に、雑音成分の帯域か否かを判別する信号/雑音判定手段と、(4)雑音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが雑音抑圧下限値を上回っているか否かを判別し、上回っていると帯域分割信号の大きさを雑音抑圧下限値に一致するように変更し、上回っていないと帯域分割信号の大きさを維持させる制御手段と、(5)上記制御手段を介した全ての帯域分割信号を合成する帯域合成手段とを有することを特徴とする。
第2の本発明は、入力された音信号に含まれている音成分の強調により信号対雑音比を向上させて音信号の明瞭度を向上させる音処理装置において、(1)人間の聴覚特性に基づいて決定された周波数帯域毎の音強調上限値を保持している強調上限保持手段と、(2)入力された上記音信号を帯域分割する帯域分割手段と、(3)上記各帯域分割信号の信号対雑音比を、周波数帯域によって定まる閾値と比較することにより、周波数帯域毎に、音成分の帯域か否かを判別する信号/雑音判定手段と、(4)音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが音強調上限値を下回っているか否かを判別し、下回っていると帯域分割信号の大きさを音強調上限値に一致するように変更し、下回っていないと帯域分割信号の大きさを維持させる制御手段と、(5)上記制御手段を介した全ての帯域分割信号を合成する帯域合成手段とを有することを特徴とする。
第3の本発明は、入力された音信号に含まれている雑音成分の抑圧及び入力された音信号に含まれている音成分の強調により信号対雑音比を向上させて音信号の明瞭度を向上させる音処理装置において、(1)人間の聴覚特性に基づいて決定された周波数帯域毎の雑音抑圧下限値を保持している抑圧下限保持手段と、(2)人間の聴覚特性に基づいて決定された周波数帯域毎の音強調上限値を保持している強調上限保持手段と、(3)入力された上記音信号を帯域分割する帯域分割手段と、(4)上記各帯域分割信号の信号対雑音比を、周波数帯域によって定まる閾値と比較することにより、周波数帯域毎に、音成分の帯域か雑音成分の帯域を判別する信号/雑音判定手段と、(5)雑音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが雑音抑圧下限値を上回っているか否かを判別し、上回っていると帯域分割信号の大きさを雑音抑圧下限値に一致するように変更し、上回っていないと帯域分割信号の大きさを維持させると共に、音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが音強調上限値を下回っているか否かを判別し、下回っていると帯域分割信号の大きさを音強調上限値に一致するように変更し、下回っていないと帯域分割信号の大きさを維持させる制御手段と、(6)上記制御手段を介した全ての帯域分割信号を合成する帯域合成手段とを有することを特徴とする。
第4の本発明の音処理プログラムは、コンピュータを、(1)人間の聴覚特性に基づいて決定された周波数帯域毎の雑音抑圧下限値を保持している抑圧下限保持手段と、(2)入力された音信号を帯域分割する帯域分割手段と、(3)上記各帯域分割信号の信号対雑音比を、周波数帯域によって定まる閾値と比較することにより、周波数帯域毎に、雑音成分の帯域か否かを判別する信号/雑音判定手段と、(4)雑音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが雑音抑圧下限値を上回っているか否かを判別し、上回っていると帯域分割信号の大きさを雑音抑圧下限値に一致するように変更し、上回っていないと帯域分割信号の大きさを維持させる制御手段と、(5)上記制御手段を介した全ての帯域分割信号を合成する帯域合成手段として機能させ、(6)入力された音信号に含まれている雑音成分の抑圧により信号対雑音比を向上させて音信号の明瞭度を向上させることを特徴とする。
第5の本発明の音処理プログラムは、コンピュータを、(1)人間の聴覚特性に基づいて決定された周波数帯域毎の音強調上限値を保持している強調上限保持手段と、(2)入力された音信号を帯域分割する帯域分割手段と、(3)上記各帯域分割信号の信号対雑音比を、周波数帯域によって定まる閾値と比較することにより、周波数帯域毎に、音成分の帯域か否かを判別する信号/雑音判定手段と、(4)音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが音強調上限値を下回っているか否かを判別し、下回っていると帯域分割信号の大きさを音強調上限値に一致するように変更し、下回っていないと帯域分割信号の大きさを維持させる制御手段と、(5)上記制御手段を介した全ての帯域分割信号を合成する帯域合成手段として機能させ、(6)入力された音信号に含まれている音成分の強調により信号対雑音比を向上させて音信号の明瞭度を向上させることを特徴とする。
第6の本発明の音処理プログラムは、コンピュータを、(1)人間の聴覚特性に基づいて決定された周波数帯域毎の雑音抑圧下限値を保持している抑圧下限保持手段と、(2)人間の聴覚特性に基づいて決定された周波数帯域毎の音強調上限値を保持している強調上限保持手段と、(3)入力された音信号を帯域分割する帯域分割手段と、(4)上記各帯域分割信号の信号対雑音比を、周波数帯域によって定まる閾値と比較することにより、周波数帯域毎に、音成分の帯域か雑音成分の帯域を判別する信号/雑音判定手段と、(5)雑音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが雑音抑圧下限値を上回っているか否かを判別し、上回っていると帯域分割信号の大きさを雑音抑圧下限値に一致するように変更し、上回っていないと帯域分割信号の大きさを維持させると共に、音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが音強調上限値を下回っているか否かを判別し、下回っていると帯域分割信号の大きさを音強調上限値に一致するように変更し、下回っていないと帯域分割信号の大きさを維持させる制御手段と、(6)上記制御手段を介した全ての帯域分割信号を合成する帯域合成手段として機能させ、(7)入力された音信号に含まれている雑音成分の抑圧及び入力された音信号に含まれている音成分の強調により信号対雑音比を向上させて音信号の明瞭度を向上させることを特徴とする。
本発明によれば、自然な聴感を保ちつつ信号対雑音比を向上させ、音信号の明瞭度を向上させることができる。
第1の実施形態の音声処理装置100の機能的構成を示すブロック図である。 図1の利得変更回路の詳細構成を示すブロック図である。 図1の利得変更回路群への入力信号及び出力信号の周波数特性を示す説明図である。 第2の実施形態の音声処理装置100の機能的構成を示すブロック図である。 図4の利得変更回路の詳細構成を示すブロック図である。 図4の利得変更回路における音声強調上限値及び雑音抑圧下限値の組の変更の説明図である。
(A)第1の実施形態
以下、本発明による音処理装置及びプログラムを音声処理に適用した第1の実施形態を、図面を参照しながら詳述する。第1の実施形態の音処理装置(音声処理装置)は、例えば、電話端末のマイクロフォンが捕捉し、デジタル信号に変換された近端音声信号を処理する位置に介在され、又は、スピーカに与えるデジタル信号でなる遠端音声信号を処理する位置に介在される。
(A−1)第1の実施形態の構成
図1は、第1の実施形態の音声処理装置100の機能的構成を示すブロック図である。例えば、ソフトフォンは、コンピュータにソフトフォン用アプリケーションをインストールして構築されるものであるが、そのソフトフォン用アプリケーションの部分的プログラムとして第1の実施形態の音処理プログラム(音声処理プログラム)を適用し、第1の実施形態の音声処理装置100を構築しても良い。この場合であっても、機能的構成を図1で表すことができる。
図1において、第1の実施形態の音声処理装置100は、有音無音検出回路101、周波数帯域分割回路102、利得変更回路103−1〜103−M及び周波数帯域合成回路104を有する。
雑音が重畳されたデジタル信号でなる音声信号s(n)(但し、nは時刻を表すパラメータである)は、有音無音検出回路101及び周波数帯域分割回路102に入力される。
有音無音検出回路101は、入力音声信号s(n)が有音(有音区間)か無音(無音区間)かを判定するものである。有音無音検出回路101による判定方法としては既存の任意のものを適用できる。例えば、判定用の信号パワ閾値を持ち、入力音声信号s(n)のパワがこれを上回る場合に有音(V=1)、そうでない場合に無音(V=0)という結果を、利得変更回路103−1〜103−Mに出力する。
周波数帯域分割回路102は、入力音声信号s(n)をM個の周波数帯域に分割し、各帯域分割信号s1(n)〜sM(n)をそれぞれ、対応する利得変更回路103−1〜103−Mに出力するものである。
各利得変更回路103−m(mは1〜M)はそれぞれ、入力された帯域分割信号sm(n)に対する信号成分又は雑音成分の利得を制御し、音声明瞭度を高めるものである。この第1の実施形態の場合、利得変更回路103−mは、ISO(国際標準化機構)226等の人間の聴覚特性(ラウドネス曲線)に応じて、利得の制御限界が決定されている。
周波数帯域合成回路104は、利得変更回路103−1〜103−Mからの出力信号x1(n)〜xM(n)を合成し、合成後の音声信号x(n)を明瞭化された音声信号として出力するものである。
図2は、利得変更回路103−mの詳細構成を示すブロック図である。利得変更回路103−1〜103−Mは同様な構成を有するが、利得変更回路103−1〜103−Mは後述する限界値記憶部203に記憶されている音声強調上限値及び雑音抑圧下限値が異なっている。
図2において、利得変更回路103−mは、SN算出部200、SN閾値供給部201、音声/雑音判定部202、限界値記憶部203及び利得変更部204を有する。
SN算出部200は、入力された帯域分割信号sm(n)の音声対雑音比(SN比)snmを計算するものである。SN比snmの計算方法としては、既存のいかなる方法を適用したものであっても良く、一例を挙げれば以下の通りである。
帯域分割信号sm(n)のパワを計算し、信号パワsmpとする。無音時(V=0)の場合、例えば、雑音推定値smnpを(1)式に従って更新する(但し、0<α<1)。一方、有音時(V=1)の場合には、雑音推定値smnpの更新は実施しない。そして、SN比snmを(2)式に従って計算する。
smnp=α×smnp+(1−α)×smp …(1)
snm=10×log10(smp/smnp) …(2)
SN閾値供給部201は、SN比snmと比較されるSN閾値を音声/雑音判定部202に供給するものである。SN閾値供給部201は、無音時(V=0)の帯域分割信号sm(n)のパワの平均値を算出し、このパワ平均値に所定のオフセットを足し込んだものをSN閾値として音声/雑音判定部202に供給するようにしても良い。また、多くの人の音声信号を処理し、当該利得変更回路103−mが担当する帯域が音声帯域か雑音帯域かを切り分けることができるSN比の境界値を予め算出しておき、SN閾値供給部201にSN閾値として予め設定しておき、SN閾値供給部201は、予め設定されたSN閾値として音声/雑音判定部202に供給するようにしても良い。
音声/雑音判定部202は、SN算出部200が算出したSN比snmと、SN閾値供給部201から供給されたSN閾値との大小比較により、当該利得変更回路103−mが担当する帯域が、対象話者(の音声)の特徴から言えば、音声帯域又は雑音帯域になっているかを判定するものである。音声/雑音判定部202は、SN比snmがSN閾値を上回る場合には、当該利得変更回路103−mが担当する帯域が音声帯域であると判定し、そうでない場合には、当該利得変更回路103−mが担当する帯域が雑音帯域であると判定する。
限界値記憶部203には、当該利得変更回路103−mが担当する帯域が音声帯域である場合における音声強調の上限の限界利得(音声強調上限値)と、当該利得変更回路103−mが担当する帯域が雑音帯域である場合における雑音抑圧の下限の限界利得(雑音抑圧下限値)とを記憶しているものである。なお、限界値記憶部203には、音声強調上限値又は雑音抑圧下限値の一方のみを記憶し、他方は、記憶している値から所定量を減算又は加算することで得るようにしても良い。
後述する図3における音声強調上限曲線C11は、利得変更回路103−1〜103−Mにおける音声強調上限値を繋げ合わせた曲線であり、図3における雑音抑圧下限曲線C12は、利得変更回路103−1〜103−Mにおける雑音抑圧下限値を繋げ合わせた曲線である。これら曲線C1及びC2は、ISO(国際標準化機構)226等の人間の聴覚特性(ラウドネス曲線)に応じた曲線形状をしている。
利得変更部204は、音声/雑音判定部202による、当該利得変更回路103−mが担当する帯域が音声帯域又は雑音帯域という判定結果によって処理を切り替えるものである。
利得変更部204は、当該利得変更回路103−mが担当する帯域が音声帯域の場合には、入力された帯域分割信号sm(n)の利得が、限界値記憶部203に記憶されている音声強調上限値を下回っているか否かを判別する。ここで、帯域分割信号sm(n)の利得は帯域分割信号sm(n)のパワである。利得変更部204は、帯域分割信号sm(n)の利得が音声強調上限値を下回っていると、入力された帯域分割信号sm(n)を、利得が音声強調上限値に一致するように変更(増幅)して出力し、帯域分割信号sm(n)の利得が音声強調上限値以上であると、入力された帯域分割信号sm(n)を利得変更することなくそのまま通過させる。
利得変更部204は、当該利得変更回路103−mが担当する帯域が雑音帯域の場合には、入力された帯域分割信号sm(n)の利得が、限界値記憶部203に記憶されている雑音抑圧下限値を上回っているか否かを判別する。利得変更部204は、帯域分割信号sm(n)の利得が雑音抑圧下限値を上回っていると、入力された帯域分割信号sm(n)を、利得が雑音抑圧下限値に一致するように変更(減衰)して出力し、帯域分割信号sm(n)の利得が雑音抑圧下限値以下であると、入力された帯域分割信号sm(n)を利得変更することなくそのまま通過させる。
(A−2)第1の実施形態の動作
次に、第1の実施形態の音声処理装置100の動作を、図3に示す周波数特性図をも参照しながら説明する。
雑音が重畳されたデジタル信号でなる音声信号s(n)は、有音無音検出回路101及び周波数帯域分割回路102に入力される。
入力音声信号s(n)は、周波数帯域分割回路102によって、M個の周波数帯域に分割され、分割後の各帯域分割信号s1(n)〜sM(n)はそれぞれ、対応する利得変更回路103−1〜103−Mに与えられる。また、有音無音検出回路101によって、入力音声信号s(n)が有音か無音かが判定され、その判定結果も、利得変更回路103−1〜103−Mに与えられる。
利得変更回路103−m(mは1〜M)においては、SN算出部200によって、入力された帯域分割信号sm(n)のSN比snmが計算され、このSN比snmとSN閾値供給部201から供給されたSN閾値とが、音声/雑音判定部202によって比較され、当該利得変更回路103−mが担当する帯域が音声帯域又は雑音帯域になっているかが判定される。
当該利得変更回路103−mが担当する帯域が音声帯域と判定された場合には、利得変更部204によって、入力された帯域分割信号sm(n)の利得が、限界値記憶部203に記憶されている音声強調上限値を下回っているか否かが判別され、帯域分割信号sm(n)の利得が音声強調上限値を下回っていると、入力された帯域分割信号sm(n)は、その利得が音声強調上限値に一致するように変更(増幅)されて出力され、帯域分割信号sm(n)の利得が音声強調上限値以上であると、入力された帯域分割信号sm(n)は利得変更されることなくそのまま出力される。
一方、当該利得変更回路103−mが担当する帯域が雑音帯域の場合には、利得変更部204によって、入力された帯域分割信号sm(n)の利得が、限界値記憶部203に記憶されている雑音抑圧下限値を上回っているか否かが判別され、帯域分割信号sm(n)の利得が雑音抑圧下限値を上回っていると、入力された帯域分割信号sm(n)は、その利得が雑音抑圧下限値に一致するように変更(減衰)されて出力され、帯域分割信号sm(n)の利得が雑音抑圧下限値以下であると、入力された帯域分割信号sm(n)は利得変更されることなくそのまま出力される。
利得変更回路103−1〜103−Mからの出力信号x1(n)〜xM(n)は周波数帯域合成回路104によって合成され、合成後の音声信号x(n)が、明瞭化された音声信号として当該音声処理装置100から出力される。
図3(A)は、利得変更回路群103−1〜103−Mへ入力された帯域分割信号s1(n)〜sM(n)の利得を示し、図3(B)は、利得変更回路群103−1〜103−Mから出力された帯域分割信号x1(n)〜xM(n)の利得を示している。また、図3において、黒塗りの縦棒で利得を示す帯域は、内部の音声/雑音判定部202(202−1〜202−M)によって音声帯域と判定された帯域を示し、ハッチが付与された縦棒で利得を示す帯域は、内部の音声/雑音判定部202(202−1〜202−M)によって雑音帯域と判定された帯域を示している。
1番目の帯域は、図3(A)に示すように、雑音帯域と判定され、しかも、帯域分割信号s1(n)の利得が雑音抑圧下限値を上回っているので、図3(B)に示すように、帯域分割信号s1(n)は、その利得が雑音抑圧下限値に一致するように変更(減衰)され、変更後の帯域分割信号x1(n)が出力される。
5番目の帯域は、図3(A)に示すように、雑音帯域と判定されるが、帯域分割信号s5(n)の利得が雑音抑圧下限値以下であるので、図3(B)に示すように、帯域分割信号s5(n)はそのまま出力帯域分割信号x5(n)となる。
2番目の帯域は、図3(A)に示すように、音声帯域と判定され、しかも、帯域分割信号s2(n)の利得が音声強調上限値を下回っているので、図3(B)に示すように、帯域分割信号s2(n)は、その利得が音声強調上限値に一致するように変更(増幅)され、変更後の帯域分割信号x2(n)が出力される。
3番目の帯域は、図3(A)に示すように、音声帯域と判定されるが、帯域分割信号s3(n)の利得が音声強調上限値以上であるので、図3(B)に示すように、帯域分割信号s3(n)はそのまま出力帯域分割信号x3(n)となる。
(A−3)第1の実施形態の効果
第1の実施形態によれば、人間の聴覚特性に基づく音声強調上限値、雑音抑圧下限値を設け、音声強調の上限、雑音抑圧の下限を設定して、音声強調又は雑音抑圧を行うようにしたので、自然な聴感を保ちつつ音声対雑音比を向上させ、音声の明瞭度を向上させることができる。
(B)第2の実施形態
次に、本発明による音処理装置及びプログラムを音声処理に適用した第2の実施形態を、図面を参照しながら詳述する。
図4は、第2の実施形態の音声処理装置100Aの機能的構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。また、図5は、第2の実施形態における利得変更回路103A−mの詳細構成を示すブロック図であり、第1の実施形態に係る図4との同一、対応部分には同一、対応符号を付して示している。
第2の実施形態の音声処理装置100Aは、第1の実施形態と同様な有音無音検出回路101、周波数帯域分割回路102、利得変更回路103A−1〜103A−M及び周波数帯域合成回路104に加え、限界値変更指令回路105を有する。また、利得変更回路103A−m(mは1〜M)の内部構成が第1の実施形態と異なっている。利得変更回路103A−mは、第1の実施形態と同様に、SN算出部200、SN閾値供給部201、音声/雑音判定部202、限界値記憶部203A及び利得変更部204を有するが、限界値記憶部203Aが第1の実施形態のものと異なっている。
第2の実施形態における限界値記憶部203Aは、音声強調上限値及び雑音抑圧下限値の組を、複数組記憶しているものである。以下では、説明の簡単化のために、2組の音声強調上限値及び雑音抑圧下限値が限界値記憶部203Aに格納されているとする。2組のうち、一方の組の音声強調上限値及び雑音抑圧下限値は老人の聴覚特性を考慮したものとなっており、他方の組の音声強調上限値及び雑音抑圧下限値は老人以外の聴覚特性を考慮したものとなっている。
なお、第2の実施形態における限界値記憶部203Aは、ある組の音声強調上限値及び雑音抑圧下限値だけを記憶し、他の組の音声強調上限値及び雑音抑圧下限値は、記憶している値に所定の変換関数を適用して得るものであっても良い。
第2の実施形態で新たに設けられた限界値変更指令回路105は、利得変更回路103A−1〜103A−Mに対し、利得変更部204(204−1〜204−M)が利用する音声強調上限値及び雑音抑圧下限値の組を指令するものである。利得変更部204−1〜204−Mは、限界値変更指令回路105からの変更指令に対して連動して利用する組を変更するものである。
例えば、限界値変更指令回路105がプッシュスイッチ若しくはキーボード上の特定のキーを中心として構成され、プッシュスイッチ若しくは特定キーが操作される毎に、他方の組への切換えを指示するものであっても良い。また例えば、限界値変更指令回路105がディップスイッチ、若しくは、各組に対応した2つのキーを中心として構成され、ディップスイッチが操作されたり、選択中でない組に対応するキーが操作されたりした場合に、他方の組への切換えを指示するものであっても良い。
例えば、第2の実施形態の音声処理装置100Aがソフトフォンに組み込まれたものであって、マイクロフォンからの音声信号を処理する系に設けられた場合であれば、近端話者が、遠端話者が老人であると認識したときに、限界値変更指令回路105によって、老人の聴覚特性を考慮した音声強調上限値及び雑音抑圧下限値の組に変更させれば良い。また例えば、第2の実施形態の音声処理装置100Aがソフトフォンに組み込まれたものであって、スピーカへの音声信号を処理する系に設けられた場合であれば、近端話者は自己が老人であるときに、限界値変更指令回路105によって、老人の聴覚特性を考慮した音声強調上限値及び雑音抑圧下限値の組に変更させれば良い。
なお、限界値変更指令回路105は、入力された音声信号s(n)から、老人の音声か否かを自動判別する既存技術を適用したものであっても良い。
図6(A)は、老人以外の聴覚特性を考慮した音声強調上限値及び雑音抑圧下限値の組の選択状態を示しており、このような状態において、老人の聴覚特性を考慮した音声強調上限値及び雑音抑圧下限値の組への変更指令が生じると、図6(B)に実線で示す音声強調上限曲線C21及び雑音抑圧下限曲線C22で規定される音声強調上限値及び雑音抑圧下限値の組を、利得変更部204−1〜204−Mが利用する状態に切り替わる。
ここで、老人の聴覚特性を考慮した音声強調上限曲線C21及び雑音抑圧下限曲線C22は、ISO7029などに基づき、年齢による聴覚特性の違いを考慮して定められたものである。すなわち、人間の聴覚は、年齢と共に高い周波数が知覚されにくくなるため、これを考慮して、音声強調上限曲線C21及び雑音抑圧下限曲線C22においては、周波数が高い領域の音声強調上限値及び雑音抑圧下限値を、他の組に係る音声強調上限曲線C11及び雑音抑圧下限曲線C12より上昇させている。
図6の例では、音声強調上限曲線C11及び雑音抑圧下限曲線C12が有効な場合に比較し、老人の聴覚特性を考慮した音声強調上限曲線C21及び雑音抑圧下限曲線C22が有効な場合には、例えば、M番目の雑音帯域はその減衰量が少なくなり、また、(M−3)番目の音声帯域は増幅されなかったものから増幅対象に変化する。
(B−3)第2の実施形態の効果
第2の実施形態によっても、人間の聴覚特性に基づく音声強調上限値、雑音抑圧下限値を設け、音声強調の上限、雑音抑圧の下限を設定して、音声強調及び雑音抑圧を行うようにしたので、自然な聴感を保ちつつ音声対雑音比を向上させ、音声の明瞭度を向上させることができる。
さらに、第2の実施形態によれば、年齢と共に変化する人間の聴覚特性を考慮し、音声強調上限値及び雑音抑圧下限値の組を複数組設けて選択して使用できるようにしたので、第1の実施形態に比して、より聴取者に合わせて、音声の明瞭度を向上させることができる。
(C)他の実施形態
上記各実施形態では、雑音成分の抑圧と音声成分の強調とを併用して音声対雑音比(SN比)を向上させる音声処理装置を示したが、雑音成分の抑圧によって音声対雑音比を向上させる音声処理装置に本発明を適用することができ、また、音声成分の強調によって音声対雑音比を向上させる音声処理装置に本発明を適用することができる。
上記実施形態の説明では、音声処理装置を電話端末に適用する例を挙げたが、本発明の用途はこれに限定されるものではない。
また、上記各実施形態では音声信号を処理する音声処理装置に本発明を適用したものを示したが、音響信号(オーディオ信号)を処理する音響処理装置に本発明を適用することができる。特許請求の範囲における「音信号」は、音声信号又は音響信号を表している。
100、100A…音声処理装置、101…有音無音検出回路、102…周波数帯域分割回路、103−1〜103−M、103A−1〜103A−M…利得変更回路、104…周波数帯域合成回路、105…限界値変更指令回路、200…SN算出部、201…SN閾値供給部、202…音声/雑音判定部、203、203A…限界値記憶部、204…利得変更部。

Claims (9)

  1. 入力された音信号に含まれている雑音成分の抑圧により信号対雑音比を向上させて音信号の明瞭度を向上させる音処理装置において、
    人間の聴覚特性に基づいて決定された周波数帯域毎の雑音抑圧下限値を保持している抑圧下限保持手段と、
    入力された上記音信号を帯域分割する帯域分割手段と、
    上記各帯域分割信号の信号対雑音比を、周波数帯域によって定まる閾値と比較することにより、周波数帯域毎に、雑音成分の帯域か否かを判別する信号/雑音判定手段と、
    雑音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが雑音抑圧下限値を上回っているか否かを判別し、上回っていると帯域分割信号の大きさを雑音抑圧下限値に一致するように変更し、上回っていないと帯域分割信号の大きさを維持させる制御手段と、
    記制御手段を介した全ての帯域分割信号を合成する帯域合成手段と
    を有することを特徴とする音処理装置。
  2. 上記抑圧下限保持手段は、各周波数帯域の雑音抑圧下限値として、人間の聴覚の年齢変化特性に合わせた複数の値を保持し、複数の値から適用する値を選択する
    ことを特徴とする請求項1に記載の音処理装置。
  3. 入力された音信号に含まれている音成分の強調により信号対雑音比を向上させて音信号の明瞭度を向上させる音処理装置において、
    人間の聴覚特性に基づいて決定された周波数帯域毎の音強調上限値を保持している強調上限保持手段と、
    入力された上記音信号を帯域分割する帯域分割手段と、
    上記各帯域分割信号の信号対雑音比を、周波数帯域によって定まる閾値と比較することにより、周波数帯域毎に、音成分の帯域か否かを判別する信号/雑音判定手段と、
    音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが音強調上限値を下回っているか否かを判別し、下回っていると帯域分割信号の大きさを音強調上限値に一致するように変更し、下回っていないと帯域分割信号の大きさを維持させる制御手段と、
    記制御手段を介した全ての帯域分割信号を合成する帯域合成手段と
    を有することを特徴とする音処理装置。
  4. 上記強調上限保持手段は、各周波数帯域の音強調上限値として、人間の聴覚の年齢変化特性に合わせた複数の値を保持し、複数の値から適用する値を選択する
    ことを特徴とする請求項3に記載の音処理装置。
  5. 入力された音信号に含まれている雑音成分の抑圧及び入力された音信号に含まれている音成分の強調により信号対雑音比を向上させて音信号の明瞭度を向上させる音処理装置において、
    人間の聴覚特性に基づいて決定された周波数帯域毎の雑音抑圧下限値を保持している抑圧下限保持手段と、
    人間の聴覚特性に基づいて決定された周波数帯域毎の音強調上限値を保持している強調上限保持手段と、
    入力された上記音信号を帯域分割する帯域分割手段と、
    上記各帯域分割信号の信号対雑音比を、周波数帯域によって定まる閾値と比較することにより、周波数帯域毎に、音成分の帯域か雑音成分の帯域を判別する信号/雑音判定手段と、
    雑音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが雑音抑圧下限値を上回っているか否かを判別し、上回っていると帯域分割信号の大きさを雑音抑圧下限値に一致するように変更し、上回っていないと帯域分割信号の大きさを維持させると共に、音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが音強調上限値を下回っているか否かを判別し、下回っていると帯域分割信号の大きさを音強調上限値に一致するように変更し、下回っていないと帯域分割信号の大きさを維持させる制御手段と、
    記制御手段を介した全ての帯域分割信号を合成する帯域合成手段と
    を有することを特徴とする音処理装置。
  6. 上記抑圧下限保持手段は、各周波数帯域の雑音抑圧下限値として、人間の聴覚の年齢変化特性に合わせた複数の値を保持し、複数の値から適用する値を選択し、
    上記強調上限保持手段は、各周波数帯域の音強調上限値として、人間の聴覚の年齢変化特性に合わせた複数の値を保持し、複数の値から適用する値を選択する
    ことを特徴とする請求項5に記載の音処理装置。
  7. コンピュータを、
    人間の聴覚特性に基づいて決定された周波数帯域毎の雑音抑圧下限値を保持している抑圧下限保持手段と、
    入力された音信号を帯域分割する帯域分割手段と、
    上記各帯域分割信号の信号対雑音比を、周波数帯域によって定まる閾値と比較することにより、周波数帯域毎に、雑音成分の帯域か否かを判別する信号/雑音判定手段と、
    雑音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが雑音抑圧下限値を上回っているか否かを判別し、上回っていると帯域分割信号の大きさを雑音抑圧下限値に一致するように変更し、上回っていないと帯域分割信号の大きさを維持させる制御手段と、
    記制御手段を介した全ての帯域分割信号を合成する帯域合成手段と
    して機能させ、入力された音信号に含まれている雑音成分の抑圧により信号対雑音比を向上させて音信号の明瞭度を向上させることを特徴とする音処理プログラム。
  8. コンピュータを、
    人間の聴覚特性に基づいて決定された周波数帯域毎の音強調上限値を保持している強調上限保持手段と、
    入力された音信号を帯域分割する帯域分割手段と、
    上記各帯域分割信号の信号対雑音比を、周波数帯域によって定まる閾値と比較することにより、周波数帯域毎に、音成分の帯域か否かを判別する信号/雑音判定手段と、
    音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが音強調上限値を下回っているか否かを判別し、下回っていると帯域分割信号の大きさを音強調上限値に一致するように変更し、下回っていないと帯域分割信号の大きさを維持させる制御手段と、
    記制御手段を介した全ての帯域分割信号を合成する帯域合成手段と
    して機能させ、入力された音信号に含まれている音成分の強調により信号対雑音比を向上させて音信号の明瞭度を向上させることを特徴とする音処理プログラム。
  9. コンピュータを、
    人間の聴覚特性に基づいて決定された周波数帯域毎の雑音抑圧下限値を保持している抑圧下限保持手段と、
    人間の聴覚特性に基づいて決定された周波数帯域毎の音強調上限値を保持している強調上限保持手段と、
    入力された音信号を帯域分割する帯域分割手段と、
    上記各帯域分割信号の信号対雑音比を、周波数帯域によって定まる閾値と比較することにより、周波数帯域毎に、音成分の帯域か雑音成分の帯域を判別する信号/雑音判定手段と、
    雑音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが雑音抑圧下限値を上回っているか否かを判別し、上回っていると帯域分割信号の大きさを雑音抑圧下限値に一致するように変更し、上回っていないと帯域分割信号の大きさを維持させると共に、音成分と判定された周波数帯域に対して、その周波数帯域の帯域分割信号の大きさが音強調上限値を下回っているか否かを判別し、下回っていると帯域分割信号の大きさを音強調上限値に一致するように変更し、下回っていないと帯域分割信号の大きさを維持させる制御手段と、
    上記制御手段を介した全ての帯域分割信号を合成する帯域合成手段と
    して機能させ、入力された音信号に含まれている雑音成分の抑圧及び入力された音信号に含まれている音成分の強調により信号対雑音比を向上させて音信号の明瞭度を向上させることを特徴とする音処理プログラム。
JP2009225287A 2009-09-29 2009-09-29 音処理装置及びプログラム Active JP5359744B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009225287A JP5359744B2 (ja) 2009-09-29 2009-09-29 音処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009225287A JP5359744B2 (ja) 2009-09-29 2009-09-29 音処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2011075694A JP2011075694A (ja) 2011-04-14
JP5359744B2 true JP5359744B2 (ja) 2013-12-04

Family

ID=44019769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009225287A Active JP5359744B2 (ja) 2009-09-29 2009-09-29 音処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5359744B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5672437B2 (ja) * 2010-09-14 2015-02-18 カシオ計算機株式会社 雑音抑制装置、雑音抑制方法およびプログラム
JP6135106B2 (ja) * 2012-11-29 2017-05-31 富士通株式会社 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169599A (ja) * 2000-11-30 2002-06-14 Toshiba Corp ノイズ抑制方法及び電子機器
JP2008309955A (ja) * 2007-06-13 2008-12-25 Toshiba Corp ノイズサプレス装置

Also Published As

Publication number Publication date
JP2011075694A (ja) 2011-04-14

Similar Documents

Publication Publication Date Title
JP5293817B2 (ja) 音声信号処理装置及び音声信号処理方法
JP4913155B2 (ja) 音響エコーキャンセラ
US8630685B2 (en) Method and apparatus for providing sidetone feedback notification to a user of a communication device with multiple microphones
US7974428B2 (en) Hearing aid with acoustic feedback suppression
US8311234B2 (en) Echo canceller and communication audio processing apparatus
JP4649546B2 (ja) 補聴器
US8538052B2 (en) Generation of probe noise in a feedback cancellation system
US9313573B2 (en) Method and device for microphone selection
US20110150067A1 (en) Echo canceller for eliminating echo without being affected by noise
JP2003520469A (ja) 雑音低減装置及び方法
JP5834948B2 (ja) 残響抑制装置、残響抑制方法及び残響抑制用コンピュータプログラム
US11380312B1 (en) Residual echo suppression for keyword detection
JP2008216720A (ja) 信号処理の方法、装置、及びプログラム
CN106448691A (zh) 一种用于扩音通信系统的语音增强方法
WO2018167960A1 (ja) 音声処理装置、音声処理システム、音声処理方法、および音声処理プログラム
EP1515307B1 (en) Method and apparatus for audio coding with noise suppression
US8768406B2 (en) Background sound removal for privacy and personalization use
JP5359744B2 (ja) 音処理装置及びプログラム
JP2008072600A (ja) 音響信号処理装置、音響信号処理プログラム、音響信号処理方法
JP4527654B2 (ja) 音声通信装置
JPH09311696A (ja) 自動利得調整装置
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
JP5125931B2 (ja) 音声通信装置及び音声通信プログラム
JP5470729B2 (ja) 信号処理装置、信号処理方法
JP2001094370A (ja) 音声入出力方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130806

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130819

R150 Certificate of patent or registration of utility model

Ref document number: 5359744

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150