JP6967289B2

JP6967289B2 - ノイズ検出装置と音声信号出力装置

Info

Publication number: JP6967289B2
Application number: JP2018505226A
Authority: JP
Inventors: 靖仁菊原; 一浩鬼塚; 徹相川
Original assignee: Audio Technica KK
Current assignee: Audio Technica KK
Priority date: 2016-03-17
Filing date: 2016-10-28
Publication date: 2021-11-17
Anticipated expiration: 2036-10-28
Also published as: CN108370469A; JPWO2017158905A1; EP3432598A1; EP3432598B1; WO2017158905A1; EP3432598A4; US20180197525A1; CN108370469B; US10157603B2

Description

本発明は、ノイズ検出装置と音声信号出力装置に関する。

会議システムは、例えば、議会など、多人数が出席する会議などに用いられる。会議システムは、例えば、１つのコントロールユニットと、コントロールユニットに接続される複数のディスカッションユニットと、ディスカッションユニットに取り付けられるマイクロホンと、で構成される。コントロールユニットは、ディスカッションユニットの動作を管理すると共に、会議システム全体の動作を制御する。

ディスカッションユニットは、マイクロホンを介してディスカッションユニットの使用者の音声を収音して、その音声信号をコントロールユニットに送信する。ディスカッションユニットは、会議の参加者ごとに割り当てられる。

会議システムでは、参加者は、ディスカッションユニットを介して議長などの会議の進行役に対して発話要求を行う。発話要求は、使用者がディスカッションユニットの発話要求ボタンを押下して行う手動方式と、ディスカッションユニットが使用者の発話（音声）を自動的に検出して行う音声自動認識による自動方式と、のいずれか一方の方式により行われる。

音声自動認識は、机をペンで叩く音や、書類を触る音などのノイズを音声と誤検出する場合がある。この場合、使用者の意図しない発話要求が行われ、ノイズを会議場内に拡声してしまうなどの不具合が生じ得る。

これまでにも、音声自動認識において音声以外のノイズを音声と誤検出させないためのノイズ検出装置が提案されている（例えば、特許文献１参照）。

特許文献１に開示されたノイズ（音声）検出装置は、各次数の自己相関係数と閾値とを比較することで、無音と、低周波数領域（低域）の雑音と、高周波数領域（高域）の雑音と、をそれぞれ個別に検出可能である。

特開平６−８３３９１号公報

特許文献１に開示されたノイズ検出装置は、例えば、机をペンで叩く音などのような低域から高域までに亘り略同レベルの周波数スペクトルを有するインパルス性のノイズを検出することができる。しかし、特許文献１に開示されたノイズ検出装置は、例えば、紙を丸めた音などのようなインパルス性のノイズと高域のノイズとを合わせた複合的なノイズを検出することができない。

本発明は、以上のような従来技術の問題点を解消するためになされたもので、複合的なノイズを含む種々のノイズを精度よく検出可能なノイズ検出装置と音声信号出力装置とを提供することを目的とする。

本発明は、入力信号に含まれるノイズを検出する装置であって、入力信号が入力される複数の判別部を備えるノイズ判別部と、複数の判別部の各判別結果に基づいてノイズを判定するノイズ判定部と、を有してなり、ノイズ判別部は、入力信号の周波数成分に基づいてノイズの有無を判別する周波数成分判別部と、入力信号の時間変化に基づいてノイズの有無を判別する時間変化判別部と、入力信号の高域成分に基づいてノイズの有無を判別する高域成分判別部と、のうち、少なくとも２つを備え、ノイズ判定部は、複数の判別部の各判別結果に基づいて、ノイズを判定する、ことを特徴とする。

本発明によれば、複合的なノイズを含む種々のノイズを精度よく検出することができる。

本発明にかかる音声信号出力装置の実施の形態を示す機能ブロック図である。図１の音声信号出力装置の信号処理を示すフローチャートである。図２のＤＣ化処理のフローチャートである。図２の加工処理のフローチャートである。図２のスイッチ切替処理のうち、一部の処理を示すフローチャートである。図２のスイッチ切替処理のうち、別の一部の処理を示すフローチャートである。図２のスイッチ切替処理のうち、さらに別の一部の処理を示すフローチャートである。図２のスイッチ切替処理のうち、さらに別の一部の処理を示すフローチャートである。本発明にかかるノイズ検出装置の実施の形態を示す機能ブロック図である。図９のノイズ検出装置が備える周波数成分判別部の機能ブロック図である。図９のノイズ検出装置が備える時間変化判別部の機能ブロック図である。図９のノイズ検出装置が備える高域成分判別部の機能ブロック図である。図９のノイズ検出装置の信号処理を示すフローチャートである。図１３の周波数成分判別処理のフローチャートである。図１３の時間変化判別処理のフローチャートである。図１３の高域成分判別処理のフローチャートである。図９のノイズ検出装置に入力される入力信号の波形の一例を示す波形図である。

以下、図面を参照しながら、本発明にかかるノイズ検出装置と音声信号出力装置との実施の形態について説明する。

●音声信号出力装置●
先ず、本発明にかかる音声信号出力装置の実施の形態について説明する。

●音声信号出力装置の構成
図１は、本発明にかかる音声信号出力装置の実施の形態を示す機能ブロック図である。
音声信号出力装置１は、入力部１０と、入力信号判別部２０と、ノイズ検出部（ノイズ検出装置）３０と、遅延部４０と、切替部５０と、制御部６０と、出力部７０と、を有してなる。

入力部１０は、マイクロホン（不図示）と接続されて、マイクロホンからの入力信号ｓ１を受信する。入力信号ｓ１は、入力部１０から、入力信号判別部２０と、ノイズ検出部３０と、遅延部４０と、切替部５０と、に入力される。

入力信号判別部２０は、マイクロホンからの入力信号ｓ１の有無を判別する。入力信号判別部２０は、例えば、ハイパスフィルタ（不図示）と、ローパスフィルタ（不図示）と、整流器（不図示）と、比較部（不図示）と、を備える。マイクロホンからの入力信号ｓ１は、ハイパスフィルタとローパスフィルタと整流器とにより直流（ＤＣ）信号に変換される。比較部は、例えば、ＤＣ信号と、後述する所定の閾値Ｌ１と、を比較して、入力信号ｓ１の有無を判別する。比較部の判別結果ｓ２は、制御部６０に入力される。

なお、比較部は、例えば、音声信号出力装置１の外部に設置されたリファレンスマイクロホンからのリファレンス信号と、ＤＣ信号と、を比較してもよい。リファレンス信号は、例えば、空調の音などの環境起因の信号である。

ノイズ検出部３０は、本発明に係るノイズ検出装置である。ノイズ検出部３０は、マイクロホンから受信した入力信号ｓ１に含まれるノイズ起因の特徴を検出することにより、入力信号ｓ１に含まれるノイズを検出する。すなわち、ノイズ検出部３０は、入力信号ｓ１がノイズ起因の信号（以下「ノイズ信号」という。）か、音声起因の信号（以下「音声信号」という。）か、を判定する。ノイズ検出部３０の判定結果（検出結果）ｓ３は、制御部６０に入力される。ノイズ検出部３０の詳細は、後述する。ノイズは、例えば、机をペンで叩く音、紙をめくる音、くしゃみの音、手を叩く音、紙を丸める音などである。

遅延部４０は、入力部１０からの入力信号ｓ１を所定時間記憶して、入力信号ｓ１を所定時間遅延させた遅延信号ｓ４を生成して出力する。遅延部４０は、例えば、リングバッファを含む。遅延部４０の遅延信号ｓ４の生成は、遅延部４０に入力信号ｓ１が入力されている間、常に行われる。遅延信号ｓ４は、遅延部４０から切替部５０に入力される。

切替部５０は、制御部６０からの制御信号ｓ５（後述）に応じて、出力部７０へ出力する信号を入力信号ｓ１と遅延信号ｓ４のいずれか一方に切り替えると共に、出力部７０への信号の出力の有無を切り替える。切替部５０は、第１スイッチ部５１と第２スイッチ部５２とで構成される。

第１スイッチ部５１は、制御部６０からの制御信号ｓ５（後述）に応じて、切替部５０から出力部７０へ出力する信号を切り替える。第１スイッチ部５１は、接点Ｐ１と接点Ｐ２とを備える。接点Ｐ１は遅延部４０に接続される。接点Ｐ１には、遅延部４０からの遅延信号ｓ４が入力される。接点Ｐ２は入力部１０に接続される。接点Ｐ２には、入力部１０からの入力信号ｓ１が入力される。すなわち、切替部５０は、第１スイッチ部５１の接点を切り替えることにより、入力信号ｓ１と遅延信号ｓ４のいずれか一方を出力部７０へ出力する。音声信号出力装置１が初期状態のとき、第１スイッチ部５１の接点は接点Ｐ１である。

第２スイッチ部５２は、制御部６０からの制御信号ｓ５（後述）に応じて、出力部７０への信号の出力の有無を切り替える。第２スイッチ部５２は、例えば、ゲート回路である。すなわち、例えば、第２スイッチ部５２は、ゲートに高い電圧がかかると信号を流す状態（以下「ゲートオン」という。）となり、ゲートに低い電圧がかかると信号を遮断する状態（以下「ゲートオフ」という。）となる。第２スイッチ部５２がゲートオフのとき、切替部５０は、出力部７０へ信号を出力しない（ミュートオン）。第２スイッチ部５２がゲートオンのとき、切替部５０は、出力部７０へ信号を出力する（ミュートオフ）。音声信号出力装置１が初期状態のとき、第２スイッチ部５２はゲートオフである。

制御部６０は、入力信号判別部２０からの出力（判別結果ｓ２）と、ノイズ検出部３０からの出力（検出結果ｓ３）と、に基づいて、切替部５０の動作を制御する制御信号ｓ５を生成する。すなわち、制御部６０は、判別結果ｓ２と検出結果ｓ３とに基づいて、入力信号ｓ１と遅延信号ｓ４とのいずれか一方の出力部７０からの出力を制御する。

制御信号ｓ５は、例えば、第１スイッチ部５１の接点Ｐ１と接点Ｐ２とを切り替える信号や、第２スイッチ部５２のゲートオンとゲートオフとを切り替える信号である。制御信号ｓ５は、制御部６０から切替部５０に入力される。

出力部７０は、切替部５０からの入力信号ｓ１、または、切替部５０からの遅延信号ｓ４、のいずれか一方を出力信号として、例えば、音声信号出力装置１と接続するスピーカや通信回線などに出力する。

●音声信号出力装置の動作
次に、音声信号出力装置１の動作について説明する。

図２は、音声信号出力装置１の動作を示すフローチャートである。
入力部１０に入力された入力信号ｓ１は、入力部１０から入力信号判別部２０とノイズ検出部３０と遅延部４０と切替部５０とに入力される。音声信号出力装置１は、入力信号ｓ１のＤＣ化処理（ＳＴ１）と、入力信号ｓ１の加工処理（ＳＴ２）と、スイッチ切替処理（ＳＴ３）と、を実行する。スイッチ切替処理（ＳＴ３）は、入力信号ｓ１のＤＣ化処理（ＳＴ２）と入力信号ｓ１の加工処理（ＳＴ２）との後に実行される。

なお、本発明において、入力信号ｓ１のＤＣ化処理（ＳＴ１）と入力信号ｓ１の加工処理（ＳＴ２）とは、同時に実行される場合に限らず、いずれか一方の処理が先に実行されてもよい。

図３は、入力信号ｓ１のＤＣ化処理（ＳＴ１）のフローチャートである。
入力信号判別部２０は、入力信号ｓ１のＤＣ化処理を実行する（ＳＴ１）。ＤＣ化された入力信号（以下「ＤＣ信号」という。）は、入力信号判別部２０の比較部に入力される。比較部は、ＤＣ信号と、音声信号出力装置１が備える記憶部（不図示）に記憶された所定の閾値Ｌ１と、を比較する（ＳＴ１１）。閾値Ｌ１は、音声信号出力装置１が入力信号ｓ１の有無を判定するために用いる閾値である。ＤＣ信号が閾値Ｌ１よりも大きいとき（ＳＴ１１の「はい」）、入力信号判別部２０は、入力信号ｓ１が有る（有音）と判別する（ＳＴ１２）。一方、ＤＣ信号が閾値Ｌ１よりも小さいとき（ＳＴ１１の「いいえ」）、入力信号判別部２０は、入力信号ｓ１が無い（無音）と判別する（ＳＴ１３）。判別結果ｓ２は、入力信号判別部２０から制御部６０に入力される（ＳＴ１４）。

図４は、入力信号ｓ１の加工処理（ＳＴ２）のフローチャートである。
ノイズ検出部３０は、入力信号ｓ１の加工処理を実行する（ＳＴ２）。加工処理は、後述する処理ＳＴ１１１，ＳＴ１１２，ＳＴ１１３，ＳＴ１１４，ＳＴ１２１，ＳＴ１３１である。ノイズ検出部３０は、加工後の信号を用いてノイズの特徴を検出する（ＳＴ２１）。入力信号ｓ１にノイズ起因の特徴が検出されたとき（ＳＴ２１の「はい」）、ノイズ検出部３０は、入力信号ｓ１がノイズ信号であると判定する（ＳＴ２２）。一方、入力信号ｓ１にノイズ起因の特徴が検出されないとき（ＳＴ２１の「いいえ」）、ノイズ検出部３０は、入力信号ｓ１が音声信号であると判定する（ＳＴ２３）。検出結果ｓ３は、ノイズ検出部３０から制御部６０に入力される（ＳＴ２４）。ノイズ検出部３０の処理内容の詳細については、後述する。

図２に戻る。
次いで、制御部６０は、スイッチ切替処理（ＳＴ３）を実行する。スイッチ切替処理（ＳＴ３）は、入力信号判別部２０からの判別結果ｓ２と、ノイズ検出部３０からの検出結果ｓ３と、から制御信号ｓ５を生成して、切替部５０の第１スイッチ部５１と第２スイッチ部５２とを切り替える処理である。

図５は、スイッチ切替処理（ＳＴ３）のうち、一部の処理を示すフローチャートである。
先ず、制御部６０は、第２スイッチ部５２がゲートオンかゲートオフかを確認する（ＳＴ３１）。第２スイッチ部５２がゲートオフのとき（ＳＴ３１の「いいえ」）、制御部６０は、入力信号判別部２０の判別結果ｓ２から入力信号ｓ１の有無を確認する（ＳＴ３２）。

入力信号ｓ１が有る（有音）とき（ＳＴ３２の「はい」）、制御部６０は、ノイズ検出部３０の検出結果ｓ３から入力信号ｓ１が音声信号かノイズ信号かを確認する（ＳＴ３３）。入力信号ｓ１が音声信号のとき（ＳＴ３３の「はい」）、制御部６０は、第１スイッチ部５１の接点を接点Ｐ１に切り替えると共に第２スイッチ部５２をゲートオンに切り替える制御信号ｓ５を生成する（ＳＴ３４）。制御信号ｓ５は、制御部６０から切替部５０に入力される（ＳＴ３５）。その結果、第１スイッチ部５１の接点は接点Ｐ１となり、第２スイッチ部５２はゲートオン（ミュートオフ）となる。すなわち、切替部５０から出力部７０には、遅延信号ｓ４が入力される。つまり、音声信号出力装置１は、遅延信号ｓ４を出力信号として出力する。

一方、入力信号ｓ１が無い（無音）とき（ＳＴ３２の「いいえ」）、または、入力信号ｓ１がノイズ信号のとき（ＳＴ３３の「いいえ」）、制御部６０は、第１スイッチ部５１の接点を接点Ｐ１に切り替えると共に第２スイッチ部５２をゲートオフに維持する制御信号ｓ５を生成する（ＳＴ３６）。制御信号ｓ５は、制御部６０から切替部５０に入力される（ＳＴ３７）。その結果、第１スイッチ部５１の接点は接点Ｐ１となり、第２スイッチ部５２はゲートオフ（ミュートオン）となる。すなわち、切替部５０から出力部７０には、信号（遅延信号ｓ４）が入力されない。つまり、音声信号出力装置１は、信号を出力しない。

図６は、スイッチ切替処理（ＳＴ３）のうち、別の一部の処理を示すフローチャートである。同図は、スイッチ切替処理（ＳＴ３）のうち、第２スイッチ部５２がゲートオンのとき（ＳＴ３１の「はい」）の処理を示す。

第２スイッチ部５２がゲートオンのとき（ＳＴ３１の「はい」）、制御部６０は、入力信号判別部２０の判別結果ｓ２から入力信号ｓ１の有無を確認する（ＳＴ３８）。

入力信号ｓ１が有る（有音）とき（ＳＴ３８の「はい」）、制御部６０は、入力信号ｓ１の有無の確認（ＳＴ３８）を繰り返す。

入力信号ｓ１が無い（無音）とき（ＳＴ３８の「いいえ」）、制御部６０は、第１スイッチ部５１の接点が接点Ｐ１か接点Ｐ２かを確認する（ＳＴ３９）。

図７は、スイッチ切替処理（ＳＴ３）のうち、さらに別の一部の処理を示すフローチャートである。同図は、スイッチ切替処理（ＳＴ３）のうち、第１スイッチ部５１の接点が接点Ｐ１のとき（ＳＴ３９の「いいえ」）の処理を示す。

第１スイッチ部５１の接点が接点Ｐ１のとき（ＳＴ３９の「いいえ」）、制御部６０は、カウンタ（不図示）で無音時間をカウントする（ＳＴ４０）。

次いで、制御部６０は、カウンタのカウント値と、記憶部に記憶された所定の閾値Ｌ２と、を比較する（ＳＴ４１）。閾値Ｌ２は、例えば、音声信号出力装置１が参加者の息継ぎなどのタイミングを検出するために用いる閾値である。

カウント値が閾値Ｌ２より大きいとき（ＳＴ４１の「はい」）、制御部６０は、第１スイッチ部５１の接点を接点Ｐ２に切り替えると共に第２スイッチ部５２をゲートオンに維持する制御信号ｓ５を生成する（ＳＴ４２）。制御信号ｓ５は、制御部６０から切替部５０に入力される（ＳＴ４３）。その結果、第１スイッチ部５１の接点は接点Ｐ２となり、第２スイッチ部５２はゲートオン（ミュートオフ）を維持する。すなわち、切替部５０から出力部７０には、入力信号ｓ１が入力される。つまり、音声信号出力装置１は、リアルタイムな入力信号ｓ１を出力信号として出力する。

一方、カウント値が閾値Ｌ２より小さいとき（ＳＴ４１の「いいえ」）、制御部６０は、第１スイッチ部５１の接点を接点Ｐ１に維持すると共に第２スイッチ部５２をゲートオンに維持する制御信号ｓ５を生成する（ＳＴ４４）。制御信号ｓ５は、制御部６０から切替部５０に入力される（ＳＴ４５）。つまり、音声信号出力装置１は、遅延信号ｓ４を出力信号として出力する。

図８は、スイッチ切替処理（ＳＴ３）のうち、さらに別の一部の処理を示すフローチャートである。同図は、スイッチ切替処理（ＳＴ３）のうち、第１スイッチ部５１の接点が接点Ｐ２のとき（ＳＴ３９の「はい」）の処理を示す。

第１スイッチ部５１の接点が接点Ｐ２のとき（ＳＴ３９の「はい」）、制御部６０は、カウンタで無音時間をカウントする（ＳＴ４６）。

次いで、制御部６０は、カウンタのカウント値と、記憶部に記憶された所定の閾値Ｌ３と、を比較する（ＳＴ４７）。閾値Ｌ３は、音声信号出力装置１が参加者の発話が終了したか否かの判定に用いる閾値であり、閾値Ｌ２よりも大きい値である。

カウント値が閾値Ｌ３より大きいとき（ＳＴ４７の「はい」）、制御部６０は、第１スイッチ部５１の接点を接点Ｐ２に維持すると共に第２スイッチ部５２をゲートオフに切り替える制御信号ｓ５を生成する（ＳＴ４８）。制御信号ｓ５は、制御部６０から切替部５０に入力される（ＳＴ４９）。その結果、第１スイッチ部５１の接点は接点Ｐ２を維持し、第２スイッチ部５２はゲートオフ（ミュートオン）となる。すなわち、切替部５０から出力部７０には、信号（遅延信号ｓ４）が入力されない。つまり、音声信号出力装置１は、信号を出力しない。

カウント値が閾値Ｌ３よりも小さいとき（ＳＴ４７の「いいえ」）、制御部６０は、第１スイッチ部５１の接点を接点Ｐ２に維持すると共に、第２スイッチ部５２をゲートオンに維持する制御信号ｓ５を生成する（ＳＴ５０）。制御信号ｓ５は、制御部６０から切替部５０に入力される（ＳＴ５１）。

このように、第２スイッチ部５２がゲートオフのとき、音声信号出力装置１は、音声信号が入力されると遅延信号ｓ４を出力し（ミュートオフ）、ノイズ信号が入力されると信号を出力しない（ミュートオン）。すなわち、音声信号出力装置１は、音声信号を認識して出力信号を出力する音声自動認識機能を備える。

音声信号出力装置１は、無音時間が閾値Ｌ３より大きいとき、発話が終了したと判断して、信号を出力しない（ミュートオン）。音声信号出力装置１は、無音時間が閾値Ｌ２より大きく、かつ、閾値Ｌ３より小さいとき、息継ぎなどの短期の無音であると判断して、リアルタイムな入力信号ｓ１を出力する（ミュートオフ）。換言すれば、切替部５０は、入力信号判別部２０が入力部１０からの入力信号ｓ１が所定の時間（閾値Ｌ２より大きく、かつ、閾値Ｌ３より小さい時間）内に無いと判別したとき、入力部１０からの入力信号ｓ１を出力部７０に出力する。すなわち、音声信号出力装置１は、発話の頭出しでは遅延信号ｓ４を出力し、息継ぎなどのタイミングでリアルタイムな入力信号ｓ１に切り替えて出力する。つまり、音声信号出力装置１は、遅延部４０と、切替部５０と、制御部６０と、を備えることにより、ノイズの検出処理などで生じる音声信号のいわゆる頭欠けを防止する。

●まとめ
以上説明した実施の形態によれば、音声信号出力装置１は、ノイズ検出部３０の検出結果ｓ３に応じて出力信号（入力信号ｓ１または遅延信号ｓ４）の出力を制御可能である。

また、音声信号出力装置１は、遅延部４０と切替部５０とを備え、入力信号判別部２０からの判別結果ｓ２と、ノイズ検出部３０からの検出結果ｓ３と、に基づいて、切替部５０を切り替える。そのため、初期状態の音声信号出力装置１は、音声信号が入力されると遅延信号ｓ４を出力し（ミュートオフ）、ノイズ信号が入力されると信号を出力しない（ミュートオン）。

さらに、音声信号出力装置１は、発話の頭出しでは遅延信号ｓ４を出力し、入力信号判別部２０が息継ぎなどの無音を検出したときリアルタイムな入力信号ｓ１を出力する。すなわち、音声信号出力装置１は、ノイズ検出部３０の処理などで生じる音声信号のいわゆる頭欠けを防止する。

なお、本発明にかかる音声信号出力装置は、切替部５０が第２スイッチ部５２を備えるのに代えて、出力部７０が第２スイッチ部５２を備えてもよい。この場合、ゲートオンとゲートオフとを切り替える制御信号ｓ５は、制御部６０から出力部７０に入力される。

また、本発明にかかる音声信号出力装置において、制御部６０の構成は、本実施の形態の構成に限定されない。すなわち、例えば、制御部は、第１スイッチ部５１を制御する制御回路と、第２スイッチ部５２を制御する制御回路と、で構成されてもよい。

さらに、音声信号出力装置１は、ノイズ検出部３０がノイズを検出したとき、第２スイッチ部５２をゲートオンからゲートオフへと切り替えてもよい。すなわち、例えば、音声信号出力装置１は、ノイズ検出部３０がノイズを検出したとき、信号を出力しないように構成されてもよい。

●ノイズ検出装置●
次に、本発明にかかるノイズ検出装置の実施の形態について説明する。

以下の説明において、パワースペクトルは、信号の周波数帯域ごとのパワーを、周波数を横軸にしてグラフ化した波形図である。時間軸波形は、信号の時間ごとのパワー（振幅）を、時間を横軸にしてグラフ化した波形図である。

本発明にかかるノイズ検出装置は、先に説明した音声信号出力装置１を構成するノイズ検出部３０である。そこで、以下の説明において、本発明にかかるノイズ検出装置の符号は、ノイズ検出部３０と同一の符号「３０」を用いる。

●ノイズ検出装置の構成
図９は、本発明にかかるノイズ検出装置（ノイズ検出部）の実施の形態を示す機能ブロック図である。
ノイズ検出装置３０は、信号入力部３１と、周波数成分判別部３２と、時間変化判別部３３と、高域成分判別部３４と、論理和演算部３５と、信号出力部３６と、を有してなる。周波数成分判別部３２と、時間変化判別部３３と、高域成分判別部３４とは、本発明におけるノイズ判別部を構成する。すなわち、ノイズ判別部は、入力信号ｓ１が入力される複数（周波数成分判別部３２、時間変化判別部３３、高域成分判別部３４の３つ）の判別部を備える。

信号入力部３１は、例えば、音声信号出力装置１の入力部１０を介して、マイクロホンから出力された出力信号を入力信号ｓ１として受信する。入力信号ｓ１は、信号入力部３１から、周波数成分判別部３２と時間変化判別部３３と高域成分判別部３４のそれぞれに入力される。

図１０は、周波数成分判別部３２の機能ブロック図である。
通常、音声信号のパワースペクトルは、高域のパワーよりも中低域のパワーの方が大きい。周波数成分判別部３２は、入力信号ｓ１の周波数成分に基づいてノイズの有無を判別する。すなわち、周波数成分判別部３２は、入力信号ｓ１のパワースペクトルを、音声の特徴が現れる周波数帯域のパワースペクトルと、ノイズの特徴が現れる周波数帯域のパワースペクトルと、に分割する。周波数成分判別部３２は、２つのパワースペクトルを比較することで、入力信号ｓ１が音声信号かノイズ信号かを判別する。

ここで、音声の特徴が現れる周波数帯域は、例えば、１００Ｈｚ−１ｋＨｚ程度の音声の周波数を含む周波数帯域である。ノイズの特徴が現れる周波数帯域は、例えば、１ｋＨ−２ｋＨｚ程度の音声の周波数よりも高域の周波数帯域である。

周波数成分判別部３２は、第１ハイパスフィルタ３２ａと、第１ローパスフィルタ３２ｂと、第１二乗平均部３２ｃと、第２ハイパスフィルタ３２ｄと、第２ローパスフィルタ３２ｅと、第２二乗平均部３２ｆと、相対比較部３２ｇと、第１比較部３２ｈと、を備える。

第１ハイパスフィルタ３２ａは、入力信号ｓ１から音声の特徴が現れる周波数帯域よりも低域の信号を除去する。第１ローパスフィルタ３２ｂは、第１ハイパスフィルタ３２ａを通過した信号から、音声の特徴が現れる周波数帯域よりも高域の信号を除去する。すなわち、第１ハイパスフィルタ３２ａと第１ローパスフィルタ３２ｂとは、入力信号ｓ１から音声の特徴が現れる周波数帯域の信号を取り出す（通過させる）第１フィルタ部を構成する。

第１二乗平均部３２ｃは、第１フィルタ部を通過した音声の特徴が現れる周波数帯域の信号の所定サンプル数ｎ（例えば、ｎ＝１０）の二乗平均処理を行う。第１二乗平均部３２ｃは、この二乗平均処理により、音声の特徴が現れる周波数帯域の信号のパワースペクトル（以下「音声信号パワースペクトル」という。）を生成する。

第２ハイパスフィルタ３２ｄは、入力信号ｓ１からノイズの特徴が現れる周波数帯域よりも低域の信号を除去する。第２ローパスフィルタ３２ｅは、第２ハイパスフィルタ３２ｄを通過した信号から、ノイズの特徴が現れる周波数帯域よりも高域の信号を除去する。すなわち、第２ハイパスフィルタ３２ｄと第２ローパスフィルタ３２ｅとは、入力信号ｓ１からノイズの特徴が現れる周波数帯域の信号を取り出す（通過させる）第２フィルタ部を構成する。

第２二乗平均部３２ｆは、第２フィルタ部を通過したノイズの特徴が現れる周波数帯域の信号の所定サンプル数ｎ（例えば、ｎ＝１０）の二乗平均処理を行う。第２二乗平均部３２ｆは、この二乗平均処理により、ノイズの特徴が現れる周波数帯域の信号のパワースペクトル（以下「ノイズ信号パワースペクトル」という。）を生成する。

相対比較部３２ｇは、第１二乗平均部３２ｃが生成した音声信号パワースペクトルと、第２二乗平均部３２ｆが生成したノイズ信号パワースペクトルと、を比較して、その差分を算出する。相対比較部３２ｇは、算出された差分を第１比較部３２ｈに出力する。

第１比較部３２ｈは、相対比較部３２ｇが出力した差分と、ノイズ検出装置３０が備える記憶部（不図示）に記憶された所定の閾値Ｌ４と、を比較して、その結果を論理和演算部３５に出力する。閾値Ｌ４は、周波数成分判別部３２が、入力信号ｓ１が音声信号かノイズ信号かを判別するために用いる閾値である。

なお、周波数成分判別部３２の構成は、入力信号ｓ１のパワースペクトルを音声の特徴が現れる周波数帯域と、ノイズの特徴が現れる周波数帯域と、に分割可能であればよい。すなわち、例えば、第１フィルタ部と第２フィルタ部とは、バンドパスフィルタで構成されてもよい。

図１１は、時間変化判別部３３の機能ブロック図である。
通常、インパルス性のノイズの時間軸波形は、ノイズの発生直後に急峻に変動した後、所定の時間で減衰する。時間変化判別部３３は、入力信号ｓ１の時間変化に基づいてノイズの有無を判別する。すなわち、時間変化判別部３３は、インパルス性のノイズの時間軸波形を持つ信号の時間変化をカウントして、入力信号ｓ１が音声信号かノイズ信号かを判別する。

時間変化判別部３３は、第３二乗平均部３３ａと、第２比較部３３ｂと、カウンタ部３３ｃと、第３比較部３３ｄと、を備える。

第３二乗平均部３３ａは、入力信号ｓ１の所定サンプル数ｎ（例えば、ｎ＝１０）の二乗平均処理を行う。第３二乗平均部３３ａは、入力信号ｓ１の二乗平均処理により、入力信号ｓ１のパワースペクトル（以下「入力信号パワースペクトル」という。）を生成する。

第２比較部３３ｂは、第３二乗平均部３３ａが生成した入力信号パワースペクトルと、ノイズ検出装置３０が備える記憶部（不図示）に記憶された所定の閾値Ｌ５と、を比較して、その結果をカウンタ部３３ｃに出力する。閾値Ｌ５は、時間変化判別部３３が、入力信号ｓ１が音声信号か否かを判別するために用いる閾値である。

カウンタ部３３ｃは、第２比較部３３ｂにより所定の閾値Ｌ５を超えたと判断された信号の時間軸波形における時間変化（減衰する時間）をカウントして、その結果を第３比較部３３ｄに出力する。

第３比較部３３ｄは、カウンタ部３３ｃのカウント値と、ノイズ検出装置３０が備える記憶部（不図示）に記憶された所定の閾値Ｌ６と、を比較して、その結果を論理和演算部３５に出力する。閾値Ｌ６は、時間変化判別部３３が、入力信号ｓ１が音声信号かノイズ信号かを判別するために用いる閾値である。

図１２は、高域成分判別部３４の機能ブロック図である。
ノイズの周波数スペクトルの中には、高域のパワーが大きくなるものがある。高域成分判別部３４は、入力信号ｓ１の高域成分に基づいてノイズの有無を判別する。すなわち、高域成分判別部３４は、入力信号ｓ１からノイズの特徴が現れる高域の周波数帯域の信号を取り出し、その信号のパワーを検出して、入力信号ｓ１が音声信号かノイズ信号かを判別する。

高域成分判別部３４が取り出す高域の周波数帯域は、例えば、周波数成分判別部３２が取り出す高域の周波数帯域よりも高い周波数帯域である。

高域成分判別部３４は、第３ハイパスフィルタ３４ａと、第４比較部３４ｂと、を備える。

第３ハイパスフィルタ３４ａは、入力信号から高域のノイズの特徴が現れる周波数帯域よりも低域の信号を除去する。すなわち、第３ハイパスフィルタ３４ａは、入力信号ｓ１から高域のノイズの特徴が現れる周波数帯域の信号を取り出す（通過させる）第３フィルタ部を構成する。

なお、第３フィルタ部は、複数のハイパスフィルタで構成してもよい。すなわち、例えば、高域成分判別部３４がＦＰＧＡ（Field-Programmable Gate Array）で構成されて、ＦＰＧＡのリソースの制約上１つのハイパスフィルタで高次のフィルタが構成できないとき、第３フィルタ部は、直列に接続した２つのハイパスフィルタで構成されてもよい。

第４比較部３４ｂは、第３フィルタ部により取り出された高域のノイズの特徴が現れる周波数帯域の信号のパワースペクトルと、ノイズ検出装置３０が備える記憶部（不図示）に記憶された所定の閾値Ｌ７と、を比較して、その結果を論理和演算部３５に出力する。閾値Ｌ７は、高域成分判別部３４が、入力信号ｓ１が音声信号かノイズ信号かを判別するために用いる閾値である。

図９に戻る。
論理和演算部３５は、周波数成分判別部３２（第１比較部３２ｈ）の出力と、時間変化判別部３３（第３比較部３３ｄ）の出力と、高域成分判別部３４（第４比較部３４ｂ）の出力と、の論理和を演算する。論理和演算部３５は、第１比較部３２ｈの出力と第３比較部３３ｄの出力と第４比較部３４ｂの出力とのうち、いずれか１つの出力がノイズと判別された出力である場合に、入力信号ｓ１をノイズ信号と判定する。すなわち、論理和演算部３５は、複数の判別部の判別結果に基づいて、入力信号ｓ１からノイズを判定するノイズ判定部として機能する。

信号出力部３６は、論理和演算部３５の判定結果を出力する。

なお、各閾値Ｌ４−Ｌ７の値は、ノイズ検出装置３０による検出対象のノイズの周波数帯域に合せて適宜設定される。

●ノイズ検出装置の動作
次に、ノイズ検出装置３０の動作について説明する。

図１３は、ノイズ検出装置３０の信号処理を示すフローチャートである。
ノイズ検出装置３０は、信号入力部３１から入力信号ｓ１が入力されている間、周波数成分判別処理（ＳＴ１０１）と、時間変化判別処理（ＳＴ１０２）と、高域成分判別処理（ＳＴ１０３）と、を実行する。

図１４は、周波数成分判別処理（ＳＴ１０１）のフローチャートである。
周波数成分比較処理（ＳＴ１０１）は、低域から高域に亘り同レベルのパワーのパワースペクトルを持つノイズを検出する処理である。周波数成分判別処理（ＳＴ１０１）は、周波数成分判別部３２により実行される。

先ず、第１フィルタ部は、入力信号ｓ１から音声の特徴が現れる周波数帯域の信号を取り出す（ＳＴ１１１）。第１二乗平均部３２ｃは、音声の特徴が現れる周波数帯域の信号から音声信号パワースペクトルを生成する（ＳＴ１１２）。

同様に、第２フィルタ部は、入力信号ｓ１からノイズの特徴が現れる周波数帯域の信号を取り出す（ＳＴ１１３）。第２二乗平均部３２ｆは、ノイズの特徴が現れる周波数帯域の信号からノイズ信号パワースペクトルを生成する（ＳＴ１１４）。

次いで、相対比較部３２ｇは、音声信号パワースペクトルとノイズ信号パワースペクトルとを比較して、その差分を算出する（ＳＴ１１５）。差分は、例えば、音声信号パワースペクトルからノイズ信号パワースペクトルを減算することにより算出される。

次いで、第１比較部３２ｈは、相対比較部３２ｇが算出した差分と、所定の閾値Ｌ４と、を比較する（ＳＴ１１６）。差分が閾値Ｌ４よりも小さいとき（ＳＴ１１６の「はい」）、周波数成分判別部３２は、入力信号ｓ１をノイズ信号と判別する（ＳＴ１１７）。一方、差分が閾値Ｌ４よりも大きいとき（ＳＴ１１６の「いいえ」）、周波数成分判別部３２は、入力信号ｓ１を音声信号と判別する（ＳＴ１１８）。周波数成分判別部３２は、判別結果を論理和演算部３５に出力する（ＳＴ１１９）。

図１５は、時間変化判別処理（ＳＴ１０２）のフローチャートである。
時間変化判別処理（ＳＴ１０２）は、インパルス性のパワースペクトルを持つノイズを検出する処理である。時間変化判別処理（ＳＴ１０２）は、時間変化判別部３３により実行される。

先ず、第３二乗平均部３３ａは、入力信号パワースペクトルを生成する（ＳＴ１２１）。

次いで、第２比較部３３ｂは、入力信号パワースペクトルと、所定の閾値Ｌ５と、を比較する（ＳＴ１２２）。入力信号パワースペクトルが閾値Ｌ５よりも大きいとき（ＳＴ１２２の「はい」）、カウンタ部３３ｃは、閾値Ｌ５を超えた信号の時間軸波形における時間変化をカウントする（ＳＴ１２３）。一方、入力信号パワースペクトルが閾値Ｌ５よりも小さいとき（ＳＴ１２２の「いいえ」）、時間変化判別部３３は、入力信号ｓ１を音声信号と判別する（ＳＴ１２６）。

次いで、第３比較部３３ｄは、カウンタ部３３ｃのカウント値と、所定の閾値Ｌ６と、を比較する（ＳＴ１２４）。カウント値が閾値Ｌ６よりも小さいとき（ＳＴ１２４の「はい」）、時間変化判別部３３は、入力信号ｓ１をノイズ信号と判別する（ＳＴ１２５）。一方、カウント値が閾値Ｌ６よりも大きいとき（ＳＴ１２４の「いいえ」）、時間変化判別部３３は、入力信号ｓ１を音声信号と判別する（ＳＴ１２６）。時間変化判別部３３は、判別結果を論理和演算部３５に出力する（ＳＴ１２７）。

図１６は、高域成分判別処理（ＳＴ１０４）のフローチャートである。
高域成分判別処理（ＳＴ１０４）は、特に高域の変動が大きいノイズを検出する処理である。高域成分判別処理（ＳＴ１０４）は、高域成分判別部３４により実行される。

第３フィルタ部は、入力信号ｓ１から高域のノイズの特徴が現れる周波数帯域の信号を取り出す（ＳＴ１３１）。

次いで、第４比較部３４ｃは、高域のノイズの特徴が現れる周波数帯域の信号のパワースペクトルと、所定の閾値Ｌ７と、を比較する（ＳＴ１３２）。パワースペクトルが閾値Ｌ７よりも大きいとき（ＳＴ１３２の「はい」）、高域成分判別部３４は、入力信号ｓ１をノイズ信号と判別する（ＳＴ１３３）。一方、パワースペクトルが閾値Ｌ７よりも小さいとき（ＳＴ１３２の「いいえ」）、高域成分判別部３４は、入力信号ｓ１を音声信号と判別する（ＳＴ１３４）。高域成分判別部３４は、判別結果を論理和演算部３５に出力する（ＳＴ１３５）。

図１３に戻る。
論理和演算部３５は、周波数成分判別処理（ＳＴ１０１）の判別結果と、時間変化判別処理（ＳＴ１０２）の判別結果と、高域成分判別処理（ＳＴ１０３）の判別結果と、の論理和を演算して、論理和に基づいて入力信号ｓ１がノイズ信号か音声信号かを判定する（ＳＴ１０４）。

論理和演算部３５は、周波数成分判別処理（ＳＴ１０１）の判別結果と、時間変化判別処理（ＳＴ１０２）の判別結果と、高域成分判別処理（ＳＴ１０３）の判別結果と、のうち、いずれか１つの判別結果がノイズ信号との判別結果であったとき（ＳＴ１０４の「はい」）、入力信号ｓ１をノイズ信号と判定する（ＳＴ１０５）。一方、論理和演算部３５は、周波数成分判別処理（ＳＴ１０１）の判別結果と、時間変化判別処理（ＳＴ１０２）の判別結果と、高域成分判別処理（ＳＴ１０３）の判別結果とが、全て音声信号との判別結果であったとき（ＳＴ１０４の「いいえ」）、入力信号ｓ１を音声信号と判定する（ＳＴ１０６）。

ノイズ検出装置３０は、例えば、音声信号の出力を制限する回路などに判定結果を入力する（ＳＴ１０７）。

図１７は、入力信号ｓ１の波形の一例を示す波形図である。
同図は、インパルス性のノイズと、高域のノイズと、を合わせた複合的なノイズの例としての紙を丸める音による入力信号ｓ１の波形の一例を示す。同図の上側のグラフは、紙を丸める音の時間軸波形を、縦軸を信号レベル、横軸を時間、として示す。同図の下側のグラフは、紙を丸める音のパワースペクトルを、縦軸を信号レベル、横軸を周波数、として示す。同図の枠で囲まれた領域は、周波数成分判別処理（ＳＴ１０１）の対象となる領域Ｗ１と、時間変化判別処理（ＳＴ１０２）の対象となる領域Ｗ２１，Ｗ２２と、高域成分判別処理（ＳＴ１０３）の対象となる領域Ｗ３と、をそれぞれ示す。

領域Ｗ１と領域Ｗ３とは、図１７に示すパワースペクトルが低域から高域に亘り同レベルの波形となると共に、高域の変動が大きいことを示す。そのため、図１７に示すパワースペクトルを有する入力信号ｓ１は、周波数成分判別部３２と高域成分判別部３４とによりノイズ信号と判別される。

領域Ｗ２１に示されるインパルス性のノイズの時間軸波形は、短時間で減衰している。一方、領域Ｗ２２に示されるインパルス性のノイズの時間軸波形は、比較的長時間で減衰している。領域Ｗ２１のカウント値は、閾値Ｌ６よりも小さい。領域Ｗ２２のカウント値は、閾値Ｌ６よりも大きい。そのため、図１７に示す時間軸波形を有する入力信号ｓ１は、時間変化判別部３３により、領域Ｗ２１のカウント値からノイズ信号と判別される。

このように、ノイズ検出装置３０は、周波数成分判別部３２と、時間変化判別部３３と、高域成分判別部３４と、を組み合わせることにより、インパルス性のノイズと高域のノイズとが含まれた複合的なノイズを精度よく検出可能である。

●まとめ
以上説明した実施の形態によれば、ノイズ検出装置３０は、周波数成分判別部３２と、時間変化判別部３３と、高域成分判別部３４と、を備え、これらの各判別結果に基づいてノイズを検出する。そのため、本実施の形態にかかるノイズ検出装置３０は、様々な形状の波形となる複合的なノイズを精度よく検出可能である。

なお、以上説明した実施の形態においてノイズ判別部は、周波数成分判別部３２と時間変化判別部３３と高域成分判別部３４との３つの判別部で構成されるが、本発明におけるノイズ判別部の構成は、これに限定されない。すなわち、例えば、ノイズ判別部は、周波数成分判別部３２と時間変化判別部３３と高域成分判別部３４との３つの判別部のうち、少なくともいずれか２つの判別部で構成されてもよい。

１音声信号出力装置
１０入力部
２０入力信号判別部
３０ノイズ検出装置（ノイズ検出部）
３１信号入力部
３２周波数成分判別部
３３時間変化判別部
３４高域成分判別部
３５論理和演算部
３６信号出力部
４０遅延部
５０切替部
５１第１スイッチ部
５２第２スイッチ部
６０制御部
７０出力部
Ｐ１接点
Ｐ２接点
ｓ１入力信号
ｓ２判別結果（入力信号判別部）
ｓ３判定（検出）結果（ノイズ検出部）
ｓ４遅延信号
ｓ５制御信号

Claims

机上に設置されたマイクロホンからの入力信号に含まれるノイズを検出する装置であって、
前記入力信号が入力される複数の判別部を備えるノイズ判別部と、
前記複数の判別部の各判別結果に基づいて、前記入力信号がノイズ信号か音声信号かを判定するノイズ判定部と、
を有してなり、
前記ノイズ判別部は、
前記入力信号の周波数成分に基づいて前記ノイズの有無を判別する周波数成分判別部と、
前記入力信号の時間変化に基づいて前記ノイズの有無を判別する時間変化判別部と、
前記入力信号の高域成分に基づいて前記ノイズの有無を判別する高域成分判別部と、
を備え、
前記ノイズ判定部は、前記周波数成分判別部と前記時間変化判別部と前記高域成分判別部それぞれの前記判別結果の論理和に基づいて、前記入力信号が前記ノイズ信号か前記音声信号かを判定する、
ことを特徴とするノイズ検出装置。
机上に設置されたマイクロホンの出力が入力される入力部と、
前記入力部からの入力信号の有無を判別する入力信号判別部と、
前記入力信号に含まれるノイズを検出するノイズ検出部と、
前記入力信号判別部の判別結果と、前記ノイズ検出部の検出結果と、に基づいて、前記入力信号の出力を制御する制御部と、
を有してなり、
前記ノイズ検出部は、請求項１記載のノイズ検出装置である、
ことを特徴とする音声信号出力装置。
前記入力部から入力された前記入力信号を遅延させて出力する遅延部と、
前記遅延部からの遅延信号と、前記入力部からの前記入力信号と、が入力されて、前記遅延信号と前記入力信号のいずれか一方を出力する切替部と、
を備え、
前記制御部は、
前記ノイズ検出部が前記ノイズを検出しておらず、
前記入力信号判別部が、所定の時間内において、前記入力部からの前記入力信号が無いと判別したとき、
前記入力信号を出力するように前記切替部を制御する、
請求項２記載の音声信号出力装置。
前記切替部から入力される前記遅延信号または前記入力信号を、出力信号として出力する出力部、
を備え、
前記出力部は、前記ノイズ検出部が前記ノイズを検出したとき、前記出力信号を出力しない、
請求項３記載の音声信号出力装置。
前記制御部は、前記出力信号の前記出力部からの出力を制御する、
請求項４記載の音声信号出力装置。
前記制御部は、前記入力信号判別部の前記判別結果と前記ノイズ検出部の前記検出結果とに基づいて、前記遅延信号または前記入力信号のいずれか一方を前記出力部に入力するように前記切替部を制御する、
請求項４記載の音声信号出力装置。
前記制御部は、
前記入力信号判別部が第１閾値よりも長い時間、かつ、前記第１閾値よりも大きい第２閾値よりも短い時間、前記入力部からの前記入力信号が無いと判別したとき、前記入力信号を前記出力部に入力するように前記切替部を制御する、
請求項４記載の音声信号出力装置。
前記制御部は、
前記ノイズ検出部が前記ノイズを検出しておらず、
前記入力信号判別部が、前記所定の時間外において、前記入力部からの前記入力信号が無いと判別したとき、
前記遅延信号を出力するように前記切替部を制御する、
請求項３記載の音声信号出力装置。