JP6967289B2 - ノイズ検出装置と音声信号出力装置 - Google Patents

ノイズ検出装置と音声信号出力装置 Download PDF

Info

Publication number
JP6967289B2
JP6967289B2 JP2018505226A JP2018505226A JP6967289B2 JP 6967289 B2 JP6967289 B2 JP 6967289B2 JP 2018505226 A JP2018505226 A JP 2018505226A JP 2018505226 A JP2018505226 A JP 2018505226A JP 6967289 B2 JP6967289 B2 JP 6967289B2
Authority
JP
Japan
Prior art keywords
unit
signal
noise
input
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018505226A
Other languages
English (en)
Other versions
JPWO2017158905A1 (ja
Inventor
靖仁 菊原
一浩 鬼塚
徹 相川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Audio Technica KK
Original Assignee
Audio Technica KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Audio Technica KK filed Critical Audio Technica KK
Publication of JPWO2017158905A1 publication Critical patent/JPWO2017158905A1/ja
Application granted granted Critical
Publication of JP6967289B2 publication Critical patent/JP6967289B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/06Receivers
    • H04B1/10Means associated with receiver for limiting or suppressing noise or interference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2227/00Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
    • H04R2227/001Adaptation of signal processing in PA systems in dependence of presence of noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2227/00Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
    • H04R2227/009Signal processing in [PA] systems to enhance the speech intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、ノイズ検出装置と音声信号出力装置に関する。
会議システムは、例えば、議会など、多人数が出席する会議などに用いられる。会議システムは、例えば、1つのコントロールユニットと、コントロールユニットに接続される複数のディスカッションユニットと、ディスカッションユニットに取り付けられるマイクロホンと、で構成される。コントロールユニットは、ディスカッションユニットの動作を管理すると共に、会議システム全体の動作を制御する。
ディスカッションユニットは、マイクロホンを介してディスカッションユニットの使用者の音声を収音して、その音声信号をコントロールユニットに送信する。ディスカッションユニットは、会議の参加者ごとに割り当てられる。
会議システムでは、参加者は、ディスカッションユニットを介して議長などの会議の進行役に対して発話要求を行う。発話要求は、使用者がディスカッションユニットの発話要求ボタンを押下して行う手動方式と、ディスカッションユニットが使用者の発話(音声)を自動的に検出して行う音声自動認識による自動方式と、のいずれか一方の方式により行われる。
音声自動認識は、机をペンで叩く音や、書類を触る音などのノイズを音声と誤検出する場合がある。この場合、使用者の意図しない発話要求が行われ、ノイズを会議場内に拡声してしまうなどの不具合が生じ得る。
これまでにも、音声自動認識において音声以外のノイズを音声と誤検出させないためのノイズ検出装置が提案されている(例えば、特許文献1参照)。
特許文献1に開示されたノイズ(音声)検出装置は、各次数の自己相関係数と閾値とを比較することで、無音と、低周波数領域(低域)の雑音と、高周波数領域(高域)の雑音と、をそれぞれ個別に検出可能である。
特開平6−83391号公報
特許文献1に開示されたノイズ検出装置は、例えば、机をペンで叩く音などのような低域から高域までに亘り略同レベルの周波数スペクトルを有するインパルス性のノイズを検出することができる。しかし、特許文献1に開示されたノイズ検出装置は、例えば、紙を丸めた音などのようなインパルス性のノイズと高域のノイズとを合わせた複合的なノイズを検出することができない。
本発明は、以上のような従来技術の問題点を解消するためになされたもので、複合的なノイズを含む種々のノイズを精度よく検出可能なノイズ検出装置と音声信号出力装置とを提供することを目的とする。
本発明は、入力信号に含まれるノイズを検出する装置であって、入力信号が入力される複数の判別部を備えるノイズ判別部と、複数の判別部の各判別結果に基づいてノイズを判定するノイズ判定部と、を有してなり、ノイズ判別部は、入力信号の周波数成分に基づいてノイズの有無を判別する周波数成分判別部と、入力信号の時間変化に基づいてノイズの有無を判別する時間変化判別部と、入力信号の高域成分に基づいてノイズの有無を判別する高域成分判別部と、のうち、少なくとも2つを備え、ノイズ判定部は、複数の判別部の各判別結果に基づいて、ノイズを判定する、ことを特徴とする。
本発明によれば、複合的なノイズを含む種々のノイズを精度よく検出することができる。
本発明にかかる音声信号出力装置の実施の形態を示す機能ブロック図である。 図1の音声信号出力装置の信号処理を示すフローチャートである。 図2のDC化処理のフローチャートである。 図2の加工処理のフローチャートである。 図2のスイッチ切替処理のうち、一部の処理を示すフローチャートである。 図2のスイッチ切替処理のうち、別の一部の処理を示すフローチャートである。 図2のスイッチ切替処理のうち、さらに別の一部の処理を示すフローチャートである。 図2のスイッチ切替処理のうち、さらに別の一部の処理を示すフローチャートである。 本発明にかかるノイズ検出装置の実施の形態を示す機能ブロック図である。 図9のノイズ検出装置が備える周波数成分判別部の機能ブロック図である。 図9のノイズ検出装置が備える時間変化判別部の機能ブロック図である。 図9のノイズ検出装置が備える高域成分判別部の機能ブロック図である。 図9のノイズ検出装置の信号処理を示すフローチャートである。 図13の周波数成分判別処理のフローチャートである。 図13の時間変化判別処理のフローチャートである。 図13の高域成分判別処理のフローチャートである。 図9のノイズ検出装置に入力される入力信号の波形の一例を示す波形図である。
以下、図面を参照しながら、本発明にかかるノイズ検出装置と音声信号出力装置との実施の形態について説明する。
●音声信号出力装置●
先ず、本発明にかかる音声信号出力装置の実施の形態について説明する。
●音声信号出力装置の構成
図1は、本発明にかかる音声信号出力装置の実施の形態を示す機能ブロック図である。
音声信号出力装置1は、入力部10と、入力信号判別部20と、ノイズ検出部(ノイズ検出装置)30と、遅延部40と、切替部50と、制御部60と、出力部70と、を有してなる。
入力部10は、マイクロホン(不図示)と接続されて、マイクロホンからの入力信号s1を受信する。入力信号s1は、入力部10から、入力信号判別部20と、ノイズ検出部30と、遅延部40と、切替部50と、に入力される。
入力信号判別部20は、マイクロホンからの入力信号s1の有無を判別する。入力信号判別部20は、例えば、ハイパスフィルタ(不図示)と、ローパスフィルタ(不図示)と、整流器(不図示)と、比較部(不図示)と、を備える。マイクロホンからの入力信号s1は、ハイパスフィルタとローパスフィルタと整流器とにより直流(DC)信号に変換される。比較部は、例えば、DC信号と、後述する所定の閾値L1と、を比較して、入力信号s1の有無を判別する。比較部の判別結果s2は、制御部60に入力される。
なお、比較部は、例えば、音声信号出力装置1の外部に設置されたリファレンスマイクロホンからのリファレンス信号と、DC信号と、を比較してもよい。リファレンス信号は、例えば、空調の音などの環境起因の信号である。
ノイズ検出部30は、本発明に係るノイズ検出装置である。ノイズ検出部30は、マイクロホンから受信した入力信号s1に含まれるノイズ起因の特徴を検出することにより、入力信号s1に含まれるノイズを検出する。すなわち、ノイズ検出部30は、入力信号s1がノイズ起因の信号(以下「ノイズ信号」という。)か、音声起因の信号(以下「音声信号」という。)か、を判定する。ノイズ検出部30の判定結果(検出結果)s3は、制御部60に入力される。ノイズ検出部30の詳細は、後述する。ノイズは、例えば、机をペンで叩く音、紙をめくる音、くしゃみの音、手を叩く音、紙を丸める音などである。
遅延部40は、入力部10からの入力信号s1を所定時間記憶して、入力信号s1を所定時間遅延させた遅延信号s4を生成して出力する。遅延部40は、例えば、リングバッファを含む。遅延部40の遅延信号s4の生成は、遅延部40に入力信号s1が入力されている間、常に行われる。遅延信号s4は、遅延部40から切替部50に入力される。
切替部50は、制御部60からの制御信号s5(後述)に応じて、出力部70へ出力する信号を入力信号s1と遅延信号s4のいずれか一方に切り替えると共に、出力部70への信号の出力の有無を切り替える。切替部50は、第1スイッチ部51と第2スイッチ部52とで構成される。
第1スイッチ部51は、制御部60からの制御信号s5(後述)に応じて、切替部50から出力部70へ出力する信号を切り替える。第1スイッチ部51は、接点P1と接点P2とを備える。接点P1は遅延部40に接続される。接点P1には、遅延部40からの遅延信号s4が入力される。接点P2は入力部10に接続される。接点P2には、入力部10からの入力信号s1が入力される。すなわち、切替部50は、第1スイッチ部51の接点を切り替えることにより、入力信号s1と遅延信号s4のいずれか一方を出力部70へ出力する。音声信号出力装置1が初期状態のとき、第1スイッチ部51の接点は接点P1である。
第2スイッチ部52は、制御部60からの制御信号s5(後述)に応じて、出力部70への信号の出力の有無を切り替える。第2スイッチ部52は、例えば、ゲート回路である。すなわち、例えば、第2スイッチ部52は、ゲートに高い電圧がかかると信号を流す状態(以下「ゲートオン」という。)となり、ゲートに低い電圧がかかると信号を遮断する状態(以下「ゲートオフ」という。)となる。第2スイッチ部52がゲートオフのとき、切替部50は、出力部70へ信号を出力しない(ミュートオン)。第2スイッチ部52がゲートオンのとき、切替部50は、出力部70へ信号を出力する(ミュートオフ)。音声信号出力装置1が初期状態のとき、第2スイッチ部52はゲートオフである。
制御部60は、入力信号判別部20からの出力(判別結果s2)と、ノイズ検出部30からの出力(検出結果s3)と、に基づいて、切替部50の動作を制御する制御信号s5を生成する。すなわち、制御部60は、判別結果s2と検出結果s3とに基づいて、入力信号s1と遅延信号s4とのいずれか一方の出力部70からの出力を制御する。
制御信号s5は、例えば、第1スイッチ部51の接点P1と接点P2とを切り替える信号や、第2スイッチ部52のゲートオンとゲートオフとを切り替える信号である。制御信号s5は、制御部60から切替部50に入力される。
出力部70は、切替部50からの入力信号s1、または、切替部50からの遅延信号s4、のいずれか一方を出力信号として、例えば、音声信号出力装置1と接続するスピーカや通信回線などに出力する。
●音声信号出力装置の動作
次に、音声信号出力装置1の動作について説明する。
図2は、音声信号出力装置1の動作を示すフローチャートである。
入力部10に入力された入力信号s1は、入力部10から入力信号判別部20とノイズ検出部30と遅延部40と切替部50とに入力される。音声信号出力装置1は、入力信号s1のDC化処理(ST1)と、入力信号s1の加工処理(ST2)と、スイッチ切替処理(ST3)と、を実行する。スイッチ切替処理(ST3)は、入力信号s1のDC化処理(ST2)と入力信号s1の加工処理(ST2)との後に実行される。
なお、本発明において、入力信号s1のDC化処理(ST1)と入力信号s1の加工処理(ST2)とは、同時に実行される場合に限らず、いずれか一方の処理が先に実行されてもよい。
図3は、入力信号s1のDC化処理(ST1)のフローチャートである。
入力信号判別部20は、入力信号s1のDC化処理を実行する(ST1)。DC化された入力信号(以下「DC信号」という。)は、入力信号判別部20の比較部に入力される。比較部は、DC信号と、音声信号出力装置1が備える記憶部(不図示)に記憶された所定の閾値L1と、を比較する(ST11)。閾値L1は、音声信号出力装置1が入力信号s1の有無を判定するために用いる閾値である。DC信号が閾値L1よりも大きいとき(ST11の「はい」)、入力信号判別部20は、入力信号s1が有る(有音)と判別する(ST12)。一方、DC信号が閾値L1よりも小さいとき(ST11の「いいえ」)、入力信号判別部20は、入力信号s1が無い(無音)と判別する(ST13)。判別結果s2は、入力信号判別部20から制御部60に入力される(ST14)。
図4は、入力信号s1の加工処理(ST2)のフローチャートである。
ノイズ検出部30は、入力信号s1の加工処理を実行する(ST2)。加工処理は、後述する処理ST111,ST112,ST113,ST114,ST121,ST131である。ノイズ検出部30は、加工後の信号を用いてノイズの特徴を検出する(ST21)。入力信号s1にノイズ起因の特徴が検出されたとき(ST21の「はい」)、ノイズ検出部30は、入力信号s1がノイズ信号であると判定する(ST22)。一方、入力信号s1にノイズ起因の特徴が検出されないとき(ST21の「いいえ」)、ノイズ検出部30は、入力信号s1が音声信号であると判定する(ST23)。検出結果s3は、ノイズ検出部30から制御部60に入力される(ST24)。ノイズ検出部30の処理内容の詳細については、後述する。
図2に戻る。
次いで、制御部60は、スイッチ切替処理(ST3)を実行する。スイッチ切替処理(ST3)は、入力信号判別部20からの判別結果s2と、ノイズ検出部30からの検出結果s3と、から制御信号s5を生成して、切替部50の第1スイッチ部51と第2スイッチ部52とを切り替える処理である。
図5は、スイッチ切替処理(ST3)のうち、一部の処理を示すフローチャートである。
先ず、制御部60は、第2スイッチ部52がゲートオンかゲートオフかを確認する(ST31)。第2スイッチ部52がゲートオフのとき(ST31の「いいえ」)、制御部60は、入力信号判別部20の判別結果s2から入力信号s1の有無を確認する(ST32)。
入力信号s1が有る(有音)とき(ST32の「はい」)、制御部60は、ノイズ検出部30の検出結果s3から入力信号s1が音声信号かノイズ信号かを確認する(ST33)。入力信号s1が音声信号のとき(ST33の「はい」)、制御部60は、第1スイッチ部51の接点を接点P1に切り替えると共に第2スイッチ部52をゲートオンに切り替える制御信号s5を生成する(ST34)。制御信号s5は、制御部60から切替部50に入力される(ST35)。その結果、第1スイッチ部51の接点は接点P1となり、第2スイッチ部52はゲートオン(ミュートオフ)となる。すなわち、切替部50から出力部70には、遅延信号s4が入力される。つまり、音声信号出力装置1は、遅延信号s4を出力信号として出力する。
一方、入力信号s1が無い(無音)とき(ST32の「いいえ」)、または、入力信号s1がノイズ信号のとき(ST33の「いいえ」)、制御部60は、第1スイッチ部51の接点を接点P1に切り替えると共に第2スイッチ部52をゲートオフに維持する制御信号s5を生成する(ST36)。制御信号s5は、制御部60から切替部50に入力される(ST37)。その結果、第1スイッチ部51の接点は接点P1となり、第2スイッチ部52はゲートオフ(ミュートオン)となる。すなわち、切替部50から出力部70には、信号(遅延信号s4)が入力されない。つまり、音声信号出力装置1は、信号を出力しない。
図6は、スイッチ切替処理(ST3)のうち、別の一部の処理を示すフローチャートである。同図は、スイッチ切替処理(ST3)のうち、第2スイッチ部52がゲートオンのとき(ST31の「はい」)の処理を示す。
第2スイッチ部52がゲートオンのとき(ST31の「はい」)、制御部60は、入力信号判別部20の判別結果s2から入力信号s1の有無を確認する(ST38)。
入力信号s1が有る(有音)とき(ST38の「はい」)、制御部60は、入力信号s1の有無の確認(ST38)を繰り返す。
入力信号s1が無い(無音)とき(ST38の「いいえ」)、制御部60は、第1スイッチ部51の接点が接点P1か接点P2かを確認する(ST39)。
図7は、スイッチ切替処理(ST3)のうち、さらに別の一部の処理を示すフローチャートである。同図は、スイッチ切替処理(ST3)のうち、第1スイッチ51の接点が接点P1のとき(ST39の「いいえ」)の処理を示す。
第1スイッチ部51の接点が接点P1のとき(ST39の「いいえ」)、制御部60は、カウンタ(不図示)で無音時間をカウントする(ST40)。
次いで、制御部60は、カウンタのカウント値と、記憶部に記憶された所定の閾値L2と、を比較する(ST41)。閾値L2は、例えば、音声信号出力装置1が参加者の息継ぎなどのタイミングを検出するために用いる閾値である。
カウント値が閾値L2より大きいとき(ST41の「はい」)、制御部60は、第1スイッチ部51の接点を接点P2に切り替えると共に第2スイッチ部52をゲートオンに維持する制御信号s5を生成する(ST42)。制御信号s5は、制御部60から切替部50に入力される(ST43)。その結果、第1スイッチ部51の接点は接点P2となり、第2スイッチ部52はゲートオン(ミュートオフ)を維持する。すなわち、切替部50から出力部70には、入力信号s1が入力される。つまり、音声信号出力装置1は、リアルタイムな入力信号s1を出力信号として出力する。
一方、カウント値が閾値L2より小さいとき(ST41の「いいえ」)、制御部60は、第1スイッチ部51の接点を接点P1に維持すると共に第2スイッチ部52をゲートオンに維持する制御信号s5を生成する(ST44)。制御信号s5は、制御部60から切替部50に入力される(ST45)。つまり、音声信号出力装置1は、遅延信号s4を出力信号として出力する。
図8は、スイッチ切替処理(ST3)のうち、さらに別の一部の処理を示すフローチャートである。同図は、スイッチ切替処理(ST3)のうち、第1スイッチ51の接点が接点P2のとき(ST39の「はい」)の処理を示す。
第1スイッチ部51の接点が接点P2のとき(ST39の「はい」)、制御部60は、カウンタで無音時間をカウントする(ST46)。
次いで、制御部60は、カウンタのカウント値と、記憶部に記憶された所定の閾値L3と、を比較する(ST47)。閾値L3は、音声信号出力装置1が参加者の発話が終了したか否かの判定に用いる閾値であり、閾値L2よりも大きい値である。
カウント値が閾値L3より大きいとき(ST47の「はい」)、制御部60は、第1スイッチ部51の接点を接点P2に維持すると共に第2スイッチ部52をゲートオフに切り替える制御信号s5を生成する(ST48)。制御信号s5は、制御部60から切替部50に入力される(ST49)。その結果、第1スイッチ部51の接点は接点P2を維持し、第2スイッチ部52はゲートオフ(ミュートオン)となる。すなわち、切替部50から出力部70には、信号(遅延信号s4)が入力されない。つまり、音声信号出力装置1は、信号を出力しない。
カウント値が閾値L3よりも小さいとき(ST47の「いいえ」)、制御部60は、第1スイッチ部51の接点を接点P2に維持すると共に、第2スイッチ部52をゲートオンに維持する制御信号s5を生成する(ST50)。制御信号s5は、制御部60から切替部50に入力される(ST51)。
このように、第2スイッチ部52がゲートオフのとき、音声信号出力装置1は、音声信号が入力されると遅延信号s4を出力し(ミュートオフ)、ノイズ信号が入力されると信号を出力しない(ミュートオン)。すなわち、音声信号出力装置1は、音声信号を認識して出力信号を出力する音声自動認識機能を備える。
音声信号出力装置1は、無音時間が閾値L3より大きいとき、発話が終了したと判断して、信号を出力しない(ミュートオン)。音声信号出力装置1は、無音時間が閾値L2より大きく、かつ、閾値L3より小さいとき、息継ぎなどの短期の無音であると判断して、リアルタイムな入力信号s1を出力する(ミュートオフ)。換言すれば、切替部50は、入力信号判別部20が入力部10からの入力信号s1が所定の時間(閾値L2より大きく、かつ、閾値L3より小さい時間)内に無いと判別したとき、入力部10からの入力信号s1を出力部70に出力する。すなわち、音声信号出力装置1は、発話の頭出しでは遅延信号s4を出力し、息継ぎなどのタイミングでリアルタイムな入力信号s1に切り替えて出力する。つまり、音声信号出力装置1は、遅延部40と、切替部50と、制御部60と、を備えることにより、ノイズの検出処理などで生じる音声信号のいわゆる頭欠けを防止する。
●まとめ
以上説明した実施の形態によれば、音声信号出力装置1は、ノイズ検出部30の検出結果s3に応じて出力信号(入力信号s1または遅延信号s4)の出力を制御可能である。
また、音声信号出力装置1は、遅延部40と切替部50とを備え、入力信号判別部20からの判別結果s2と、ノイズ検出部30からの検出結果s3と、に基づいて、切替部50を切り替える。そのため、初期状態の音声信号出力装置1は、音声信号が入力されると遅延信号s4を出力し(ミュートオフ)、ノイズ信号が入力されると信号を出力しない(ミュートオン)。
さらに、音声信号出力装置1は、発話の頭出しでは遅延信号s4を出力し、入力信号判別部20が息継ぎなどの無音を検出したときリアルタイムな入力信号s1を出力する。すなわち、音声信号出力装置1は、ノイズ検出部30の処理などで生じる音声信号のいわゆる頭欠けを防止する。
なお、本発明にかかる音声信号出力装置は、切替部50が第2スイッチ52を備えるのに代えて、出力部70が第2スイッチ部52を備えてもよい。この場合、ゲートオンとゲートオフとを切り替える制御信号s5は、制御部60から出力部70に入力される。
また、本発明にかかる音声信号出力装置において、制御部60の構成は、本実施の形態の構成に限定されない。すなわち、例えば、制御部は、第1スイッチ部51を制御する制御回路と、第2スイッチ部52を制御する制御回路と、で構成されてもよい。
さらに、音声信号出力装置1は、ノイズ検出部30がノイズを検出したとき、第2スイッチ部52をゲートオンからゲートオフへと切り替えてもよい。すなわち、例えば、音声信号出力装置1は、ノイズ検出部30がノイズを検出したとき、信号を出力しないように構成されてもよい。
●ノイズ検出装置●
次に、本発明にかかるノイズ検出装置の実施の形態について説明する。
以下の説明において、パワースペクトルは、信号の周波数帯域ごとのパワーを、周波数を横軸にしてグラフ化した波形図である。時間軸波形は、信号の時間ごとのパワー(振幅)を、時間を横軸にしてグラフ化した波形図である。
本発明にかかるノイズ検出装置は、先に説明した音声信号出力装置1を構成するノイズ検出部30である。そこで、以下の説明において、本発明にかかるノイズ検出装置の符号は、ノイズ検出部30と同一の符号「30」を用いる。
●ノイズ検出装置の構成
図9は、本発明にかかるノイズ検出装置(ノイズ検出部)の実施の形態を示す機能ブロック図である。
ノイズ検出装置30は、信号入力部31と、周波数成分判別部32と、時間変化判別部33と、高域成分判別部34と、論理和演算部35と、信号出力部36と、を有してなる。周波数成分判別部32と、時間変化判別部33と、高域成分判別部34とは、本発明におけるノイズ判別部を構成する。すなわち、ノイズ判別部は、入力信号s1が入力される複数(周波数成分判別部32、時間変化判別部33、高域成分判別部34の3つ)の判別部を備える。
信号入力部31は、例えば、音声信号出力装置1の入力部10を介して、マイクロホンから出力された出力信号を入力信号s1として受信する。入力信号s1は、信号入力部31から、周波数成分判別部32と時間変化判別部33と高域成分判別部34のそれぞれに入力される。
図10は、周波数成分判別部32の機能ブロック図である。
通常、音声信号のパワースペクトルは、高域のパワーよりも中低域のパワーの方が大きい。周波数成分判別部32は、入力信号s1の周波数成分に基づいてノイズの有無を判別する。すなわち、周波数成分判別部32は、入力信号s1のパワースペクトルを、音声の特徴が現れる周波数帯域のパワースペクトルと、ノイズの特徴が現れる周波数帯域のパワースペクトルと、に分割する。周波数成分判別部32は、2つのパワースペクトルを比較することで、入力信号s1が音声信号かノイズ信号かを判別する。
ここで、音声の特徴が現れる周波数帯域は、例えば、100Hz−1kHz程度の音声の周波数を含む周波数帯域である。ノイズの特徴が現れる周波数帯域は、例えば、1kH−2kHz程度の音声の周波数よりも高域の周波数帯域である。
周波数成分判別部32は、第1ハイパスフィルタ32aと、第1ローパスフィルタ32bと、第1二乗平均部32cと、第2ハイパスフィルタ32dと、第2ローパスフィルタ32eと、第2二乗平均部32fと、相対比較部32gと、第1比較部32hと、を備える。
第1ハイパスフィルタ32aは、入力信号s1から音声の特徴が現れる周波数帯域よりも低域の信号を除去する。第1ローパスフィルタ32bは、第1ハイパスフィルタ32aを通過した信号から、音声の特徴が現れる周波数帯域よりも高域の信号を除去する。すなわち、第1ハイパスフィルタ32aと第1ローパスフィルタ32bとは、入力信号s1から音声の特徴が現れる周波数帯域の信号を取り出す(通過させる)第1フィルタ部を構成する。
第1二乗平均部32cは、第1フィルタ部を通過した音声の特徴が現れる周波数帯域の信号の所定サンプル数n(例えば、n=10)の二乗平均処理を行う。第1二乗平均部32cは、この二乗平均処理により、音声の特徴が現れる周波数帯域の信号のパワースペクトル(以下「音声信号パワースペクトル」という。)を生成する。
第2ハイパスフィルタ32dは、入力信号s1からノイズの特徴が現れる周波数帯域よりも低域の信号を除去する。第2ローパスフィルタ32eは、第2ハイパスフィルタ32dを通過した信号から、ノイズの特徴が現れる周波数帯域よりも高域の信号を除去する。すなわち、第2ハイパスフィルタ32dと第2ローパスフィルタ32eとは、入力信号s1からノイズの特徴が現れる周波数帯域の信号を取り出す(通過させる)第2フィルタ部を構成する。
第2二乗平均部32fは、第2フィルタ部を通過したノイズの特徴が現れる周波数帯域の信号の所定サンプル数n(例えば、n=10)の二乗平均処理を行う。第2二乗平均部32fは、この二乗平均処理により、ノイズの特徴が現れる周波数帯域の信号のパワースペクトル(以下「ノイズ信号パワースペクトル」という。)を生成する。
相対比較部32gは、第1二乗平均部32cが生成した音声信号パワースペクトルと、第2二乗平均部32fが生成したノイズ信号パワースペクトルと、を比較して、その差分を算出する。相対比較部32gは、算出された差分を第1比較部32hに出力する。
第1比較部32hは、相対比較部32gが出力した差分と、ノイズ検出装置30が備える記憶部(不図示)に記憶された所定の閾値L4と、を比較して、その結果を論理和演算部35に出力する。閾値L4は、周波数成分判別部32が、入力信号s1が音声信号かノイズ信号かを判別するために用いる閾値である。
なお、周波数成分判別部32の構成は、入力信号s1のパワースペクトルを音声の特徴が現れる周波数帯域と、ノイズの特徴が現れる周波数帯域と、に分割可能であればよい。すなわち、例えば、第1フィルタ部と第2フィルタ部とは、バンドパスフィルタで構成されてもよい。
図11は、時間変化判別部33の機能ブロック図である。
通常、インパルス性のノイズの時間軸波形は、ノイズの発生直後に急峻に変動した後、所定の時間で減衰する。時間変化判別部33は、入力信号s1の時間変化に基づいてノイズの有無を判別する。すなわち、時間変化判別部33は、インパルス性のノイズの時間軸波形を持つ信号の時間変化をカウントして、入力信号s1が音声信号かノイズ信号かを判別する。
時間変化判別部33は、第3二乗平均部33aと、第2比較部33bと、カウンタ部33cと、第3比較部33dと、を備える。
第3二乗平均部33aは、入力信号s1の所定サンプル数n(例えば、n=10)の二乗平均処理を行う。第3二乗平均部33aは、入力信号s1の二乗平均処理により、入力信号s1のパワースペクトル(以下「入力信号パワースペクトル」という。)を生成する。
第2比較部33bは、第3二乗平均部33aが生成した入力信号パワースペクトルと、ノイズ検出装置30が備える記憶部(不図示)に記憶された所定の閾値L5と、を比較して、その結果をカウンタ部33cに出力する。閾値L5は、時間変化判別部33が、入力信号s1が音声信号か否かを判別するために用いる閾値である。
カウンタ部33cは、第2比較部33bにより所定の閾値L5を超えたと判断された信号の時間軸波形における時間変化(減衰する時間)をカウントして、その結果を第3比較部33dに出力する。
第3比較部33dは、カウンタ部33cのカウント値と、ノイズ検出装置30が備える記憶部(不図示)に記憶された所定の閾値L6と、を比較して、その結果を論理和演算部35に出力する。閾値L6は、時間変化判別部33が、入力信号s1が音声信号かノイズ信号かを判別するために用いる閾値である。
図12は、高域成分判別部34の機能ブロック図である。
ノイズの周波数スペクトルの中には、高域のパワーが大きくなるものがある。高域成分判別部34は、入力信号s1の高域成分に基づいてノイズの有無を判別する。すなわち、高域成分判別部34は、入力信号s1からノイズの特徴が現れる高域の周波数帯域の信号を取り出し、その信号のパワーを検出して、入力信号s1が音声信号かノイズ信号かを判別する。
高域成分判別部34が取り出す高域の周波数帯域は、例えば、周波数成分判別部32取り出す高域の周波数帯域よりも高い周波数帯域である。
高域成分判別部34は、第3ハイパスフィルタ34aと、第4比較部34bと、を備える。
第3ハイパスフィルタ34aは、入力信号から高域のノイズの特徴が現れる周波数帯域よりも低域の信号を除去する。すなわち、第3ハイパスフィルタ34aは、入力信号s1から高域のノイズの特徴が現れる周波数帯域の信号を取り出す(通過させる)第3フィルタ部を構成する。
なお、第3フィルタ部は、複数のハイパスフィルタで構成してもよい。すなわち、例えば、高域成分判別部34がFPGA(Field-Programmable Gate Array)で構成されて、FPGAのリソースの制約上1つのハイパスフィルタで高次のフィルタが構成できないとき、第3フィルタ部は、直列に接続した2つのハイパスフィルタで構成されてもよい。
第4比較部34bは、第3フィルタ部により取り出された高域のノイズの特徴が現れる周波数帯域の信号のパワースペクトルと、ノイズ検出装置30が備える記憶部(不図示)に記憶された所定の閾値L7と、を比較して、その結果を論理和演算部35に出力する。閾値L7は、高域成分判別部34が、入力信号s1が音声信号かノイズ信号かを判別するために用いる閾値である。
図9に戻る。
論理和演算部35は、周波数成分判別部32(第1比較部32h)の出力と、時間変化判別部33(第3比較部33d)の出力と、高域成分判別部34(第4比較部34b)の出力と、の論理和を演算する。論理和演算部35は、第1比較部32hの出力と第3比較部33dの出力と第4比較部34bの出力とのうち、いずれか1つの出力がノイズと判別された出力である場合に、入力信号s1をノイズ信号と判定する。すなわち、論理和演算部35は、複数の判別部の判別結果に基づいて、入力信号s1からノイズを判定するノイズ判定部として機能する。
信号出力部36は、論理和演算部35の判定結果を出力する。
なお、各閾値L4−L7の値は、ノイズ検出装置30による検出対象のノイズの周波数帯域に合せて適宜設定される。
●ノイズ検出装置の動作
次に、ノイズ検出装置30の動作について説明する。
図13は、ノイズ検出装置30の信号処理を示すフローチャートである。
ノイズ検出装置30は、信号入力部31から入力信号s1が入力されている間、周波数成分判別処理(ST101)と、時間変化判別処理(ST102)と、高域成分判別処理(ST103)と、を実行する。
図14は、周波数成分判別処理(ST101)のフローチャートである。
周波数成分比較処理(ST101)は、低域から高域に亘り同レベルのパワーのパワースペクトルを持つノイズを検出する処理である。周波数成分判別処理(ST101)は、周波数成分判別部32により実行される。
先ず、第1フィルタ部は、入力信号s1から音声の特徴が現れる周波数帯域の信号を取り出す(ST111)。第1二乗平均部32cは、音声の特徴が現れる周波数帯域の信号から音声信号パワースペクトルを生成する(ST112)。
同様に、第2フィルタ部は、入力信号s1からノイズの特徴が現れる周波数帯域の信号を取り出す(ST113)。第2二乗平均部32fは、ノイズの特徴が現れる周波数帯域の信号からノイズ信号パワースペクトルを生成する(ST114)。
次いで、相対比較部32gは、音声信号パワースペクトルとノイズ信号パワースペクトルとを比較して、その差分を算出する(ST115)。差分は、例えば、音声信号パワースペクトルからノイズ信号パワースペクトルを減算することにより算出される。
次いで、第1比較部32hは、相対比較部32gが算出した差分と、所定の閾値L4と、を比較する(ST116)。差分が閾値L4よりも小さいとき(ST116の「はい」)、周波数成分判別部32は、入力信号s1をノイズ信号と判別する(ST117)。一方、差分が閾値L4よりも大きいとき(ST116の「いいえ」)、周波数成分判別部32は、入力信号s1を音声信号と判別する(ST118)。周波数成分判別部32は、判別結果を論理和演算部35に出力する(ST119)。
図15は、時間変化判別処理(ST102)のフローチャートである。
時間変化判別処理(ST102)は、インパルス性のパワースペクトルを持つノイズを検出する処理である。時間変化判別処理(ST102)は、時間変化判別部33により実行される。
先ず、第3二乗平均部33aは、入力信号パワースペクトルを生成する(ST121)。
次いで、第2比較部33bは、入力信号パワースペクトルと、所定の閾値L5と、を比較する(ST122)。入力信号パワースペクトルが閾値L5よりも大きいとき(ST122の「はい」)、カウンタ部33cは、閾値L5を超えた信号の時間軸波形における時間変化をカウントする(ST123)。一方、入力信号パワースペクトルが閾値L5よりも小さいとき(ST122の「いいえ」)、時間変化判別部33は、入力信号s1を音声信号と判別する(ST126)。
次いで、第3比較部33dは、カウンタ部33cのカウント値と、所定の閾値L6と、を比較する(ST124)。カウント値が閾値L6よりも小さいとき(ST124の「はい」)、時間変化判別部33は、入力信号s1をノイズ信号と判別する(ST125)。一方、カウント値が閾値L6よりも大きいとき(ST124の「いいえ」)、時間変化判別部33は、入力信号s1を音声信号と判別する(ST126)。時間変化判別部33は、判別結果を論理和演算部35に出力する(ST127)。
図16は、高域成分判別処理(ST104)のフローチャートである。
高域成分判別処理(ST104)は、特に高域の変動が大きいノイズを検出する処理である。高域成分判別処理(ST104)は、高域成分判別部34により実行される。
第3フィルタ部は、入力信号s1から高域のノイズの特徴が現れる周波数帯域の信号を取り出す(ST131)。
次いで、第4比較部34cは、高域のノイズの特徴が現れる周波数帯域の信号のパワースペクトルと、所定の閾値L7と、を比較する(ST132)。パワースペクトルが閾値L7よりも大きいとき(ST132の「はい」)、高域成分判別部34は、入力信号s1をノイズ信号と判別する(ST133)。一方、パワースペクトルが閾値L7よりも小さいとき(ST132の「いいえ」)、高域成分判別部34は、入力信号s1を音声信号と判別する(ST134)。高域成分判別部34は、判別結果を論理和演算部35に出力する(ST135)。
図13に戻る。
論理和演算部35は、周波数成分判別処理(ST101)の判別結果と、時間変化判別処理(ST102)の判別結果と、高域成分判別処理(ST103)の判別結果と、の論理和を演算して、論理和に基づいて入力信号s1がノイズ信号か音声信号かを判定する(ST104)。
論理和演算部35は、周波数成分判別処理(ST101)の判別結果と、時間変化判別処理(ST102)の判別結果と、高域成分判別処理(ST103)の判別結果と、のうち、いずれか1つの判別結果がノイズ信号との判別結果であったとき(ST104の「はい」)、入力信号s1をノイズ信号と判定する(ST105)。一方、論理和演算部35は、周波数成分判別処理(ST101)の判別結果と、時間変化判別処理(ST102)の判別結果と、高域成分判別処理(ST103)の判別結果とが、全て音声信号との判別結果であったとき(ST104の「いいえ」)、入力信号s1を音声信号と判定する(ST106)。
ノイズ検出装置30は、例えば、音声信号の出力を制限する回路などに判定結果を入力する(ST107)。
図17は、入力信号s1の波形の一例を示す波形図である。
同図は、インパルス性のノイズと、高域のノイズと、を合わせた複合的なノイズの例としての紙を丸める音による入力信号s1の波形の一例を示す。同図の上側のグラフは、紙を丸める音の時間軸波形を、縦軸を信号レベル、横軸を時間、として示す。同図の下側のグラフは、紙を丸める音のパワースペクトルを、縦軸を信号レベル、横軸を周波数、として示す。同図の枠で囲まれた領域は、周波数成分判別処理(ST101)の対象となる領域W1と、時間変化判別処理(ST102)の対象となる領域W21,W22と、高域成分判別処理(ST103)の対象となる領域W3と、をそれぞれ示す。
領域W1と領域W3とは、図17に示すパワースペクトルが低域から高域に亘り同レベルの波形となると共に、高域の変動が大きいことを示す。そのため、図17に示すパワースペクトルを有する入力信号s1は、周波数成分判別部32と高域成分判別部34とによりノイズ信号と判別される。
領域W21に示されるインパルス性のノイズの時間軸波形は、短時間で減衰している。一方、領域W22に示されるインパルス性のノイズの時間軸波形は、比較的長時間で減衰している。領域W21のカウント値は、閾値L6よりも小さい。領域W22のカウント値は、閾値L6よりも大きい。そのため、図17に示す時間軸波形を有する入力信号s1は、時間変化判別部33により、領域W21のカウント値からノイズ信号と判別される。
このように、ノイズ検出装置30は、周波数成分判別部32と、時間変化判別部33と、高域成分判別部34と、を組み合わせることにより、インパルス性のノイズと高域のノイズとが含まれた複合的なノイズを精度よく検出可能である。
●まとめ
以上説明した実施の形態によれば、ノイズ検出装置30は、周波数成分判別部32と、時間変化判別部33と、高域成分判別部34と、を備え、これらの各判別結果に基づいてノイズを検出する。そのため、本実施の形態にかかるノイズ検出装置30は、様々な形状の波形となる複合的なノイズを精度よく検出可能である。
なお、以上説明した実施の形態においてノイズ判別部は、周波数成分判別部32と時間変化判別部33と高域成分判別部34との3つの判別部で構成されるが、本発明におけるノイズ判別部の構成は、これに限定されない。すなわち、例えば、ノイズ判別部は、周波数成分判別部32と時間変化判別部33と高域成分判別部34との3つの判別部のうち、少なくともいずれか2つの判別部で構成されてもよい。
1 音声信号出力装置
10 入力部
20 入力信号判別部
30 ノイズ検出装置(ノイズ検出部)
31 信号入力部
32 周波数成分判別部
33 時間変化判別部
34 高域成分判別部
35 論理和演算部
36 信号出力部
40 遅延部
50 切替部
51 第1スイッチ部
52 第2スイッチ部
60 制御部
70 出力部
P1 接点
P2 接点
s1 入力信号
s2 判別結果(入力信号判別部)
s3 判定(検出)結果(ノイズ検出部)
s4 遅延信号
s5 制御信号

Claims (8)

  1. 机上に設置されたマイクロホンからの入力信号に含まれるノイズを検出する装置であって、
    前記入力信号が入力される複数の判別部を備えるノイズ判別部と、
    前記複数の判別部の各判別結果に基づいて前記入力信号がノイズ信号か音声信号かを判定するノイズ判定部と、
    を有してなり、
    前記ノイズ判別部は、
    前記入力信号の周波数成分に基づいて前記ノイズの有無を判別する周波数成分判別部と、
    前記入力信号の時間変化に基づいて前記ノイズの有無を判別する時間変化判別部と、
    前記入力信号の高域成分に基づいて前記ノイズの有無を判別する高域成分判別部と、
    備え、
    前記ノイズ判定部は、前記周波数成分判別部と前記時間変化判別部と前記高域成分判別部それぞれ前記判別結果の論理和に基づいて、前記入力信号が前記ノイズ信号か前記音声信号かを判定する、
    ことを特徴とするノイズ検出装置。
  2. 机上に設置されたマイクロホンの出力が入力される入力部と、
    前記入力部からの入力信号の有無を判別する入力信号判別部と、
    前記入力信号に含まれるノイズを検出するノイズ検出部と、
    前記入力信号判別部の判別結果と、前記ノイズ検出部の検出結果と、に基づいて、前記入力信号の出力を制御する制御部と、
    を有してなり、
    前記ノイズ検出部は、請求項1記載のノイズ検出装置である、
    ことを特徴とする音声信号出力装置。
  3. 前記入力部から入力された前記入力信号を遅延させて出力する遅延部と、
    前記遅延部からの遅延信号と、前記入力部からの前記入力信号と、が入力されて、前記遅延信号と前記入力信号のいずれか一方を出力する切替部と、
    を備え、
    前記制御部は、
    前記ノイズ検出部が前記ノイズを検出しておらず、
    前記入力信号判別部が、所定の時間内において、前記入力部からの前記入力信号が無いと判別したとき、
    前記入力信号を出力するように前記切替部を制御する、
    請求項2記載の音声信号出力装置。
  4. 前記切替部から入力される前記遅延信号または前記入力信号を、出力信号として出力する出力部、
    を備え、
    前記出力部は、前記ノイズ検出部が前記ノイズを検出したとき、前記出力信号を出力しない、
    請求項3記載の音声信号出力装置。
  5. 前記制御部は、前記出力信号の前記出力部からの出力を制御する、
    請求項4記載の音声信号出力装置。
  6. 前記制御部は、前記入力信号判別部の前記判別結果と前記ノイズ検出部の前記検出結果とに基づいて、前記遅延信号または前記入力信号のいずれか一方を前記出力部に入力するように前記切替部を制御する、
    請求項4記載の音声信号出力装置。
  7. 前記制御部は、
    前記入力信号判別部が第1閾値よりも長い時間、かつ、前記第1閾値よりも大きい第2閾値よりも短い時間、前記入力部からの前記入力信号が無いと判別したとき、前記入力信号を前記出力部に入力するように前記切替部を制御する、
    請求項4記載の音声信号出力装置。
  8. 前記制御部は、
    前記ノイズ検出部が前記ノイズを検出しておらず、
    前記入力信号判別部が、前記所定の時間外において、前記入力部からの前記入力信号が無いと判別したとき、
    前記遅延信号を出力するように前記切替部を制御する、
    請求項3記載の音声信号出力装置。
JP2018505226A 2016-03-17 2016-10-28 ノイズ検出装置と音声信号出力装置 Active JP6967289B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016054380 2016-03-17
JP2016054380 2016-03-17
PCT/JP2016/082022 WO2017158905A1 (ja) 2016-03-17 2016-10-28 ノイズ検出装置と音声信号出力装置

Publications (2)

Publication Number Publication Date
JPWO2017158905A1 JPWO2017158905A1 (ja) 2019-01-24
JP6967289B2 true JP6967289B2 (ja) 2021-11-17

Family

ID=59851813

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018505226A Active JP6967289B2 (ja) 2016-03-17 2016-10-28 ノイズ検出装置と音声信号出力装置

Country Status (5)

Country Link
US (1) US10157603B2 (ja)
EP (1) EP3432598B1 (ja)
JP (1) JP6967289B2 (ja)
CN (1) CN108370469B (ja)
WO (1) WO2017158905A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318129B2 (en) 2011-07-18 2016-04-19 At&T Intellectual Property I, Lp System and method for enhancing speech activity detection using facial feature detection
GB201801532D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Methods, apparatus and systems for audio playback
GB201801526D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Methods, apparatus and systems for authentication
GB201801874D0 (en) * 2017-10-13 2018-03-21 Cirrus Logic Int Semiconductor Ltd Improving robustness of speech processing system against ultrasound and dolphin attacks
US11735189B2 (en) 2018-01-23 2023-08-22 Cirrus Logic, Inc. Speaker identification
US10915614B2 (en) 2018-08-31 2021-02-09 Cirrus Logic, Inc. Biometric authentication
US10776073B2 (en) * 2018-10-08 2020-09-15 Nuance Communications, Inc. System and method for managing a mute button setting for a conference call
CN111199751B (zh) * 2020-03-04 2021-04-13 北京声智科技有限公司 一种麦克风的屏蔽方法、装置和电子设备

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3211398B2 (ja) * 1992-09-04 2001-09-25 松下電器産業株式会社 テレビ会議用発言音声検出装置
JPH0744996A (ja) * 1993-07-30 1995-02-14 Aiwa Co Ltd ノイズ低減回路
KR101237628B1 (ko) 2004-09-17 2013-02-27 인피늄 인터내셔날 리미티드 연료유의 개선법
JP4862316B2 (ja) 2005-08-10 2012-01-25 Jfeスチール株式会社 ラミネート金属板
JP5000936B2 (ja) * 2006-06-27 2012-08-15 オンセミコンダクター・トレーディング・リミテッド マルチパスノイズ検出装置及びfm受信装置
JP4868999B2 (ja) * 2006-09-22 2012-02-01 富士通株式会社 音声認識方法、音声認識装置及びコンピュータプログラム
US20090154726A1 (en) * 2007-08-22 2009-06-18 Step Labs Inc. System and Method for Noise Activity Detection
JP5257366B2 (ja) * 2007-12-19 2013-08-07 富士通株式会社 雑音抑圧装置、雑音抑圧制御装置、雑音抑圧方法及び雑音抑圧プログラム
JP5389524B2 (ja) * 2009-05-14 2014-01-15 セミコンダクター・コンポーネンツ・インダストリーズ・リミテッド・ライアビリティ・カンパニー 遅延回路
JP2012027186A (ja) * 2010-07-22 2012-02-09 Sony Corp 音声信号処理装置、音声信号処理方法及びプログラム
CN102741918B (zh) * 2010-12-24 2014-11-19 华为技术有限公司 用于话音活动检测的方法和设备
JP2014123011A (ja) * 2012-12-21 2014-07-03 Sony Corp 雑音検出装置および方法、並びに、プログラム
EP2953383B1 (en) * 2014-06-06 2019-08-07 Nxp B.V. Signal processing circuit

Also Published As

Publication number Publication date
CN108370469A (zh) 2018-08-03
JPWO2017158905A1 (ja) 2019-01-24
EP3432598A1 (en) 2019-01-23
EP3432598B1 (en) 2022-03-02
WO2017158905A1 (ja) 2017-09-21
EP3432598A4 (en) 2019-10-16
US20180197525A1 (en) 2018-07-12
CN108370469B (zh) 2020-10-30
US10157603B2 (en) 2018-12-18

Similar Documents

Publication Publication Date Title
JP6967289B2 (ja) ノイズ検出装置と音声信号出力装置
JP7004332B2 (ja) 音声信号処理装置
JP4236726B2 (ja) 音声活動検出方法及び音声活動検出装置
US4696041A (en) Apparatus for detecting an utterance boundary
JP2011221544A (ja) 2つのスイッチオフ規準を持つ音声検出装置
GB2573173A (en) Processing audio signals
WO2019145708A1 (en) Speaker identification
JPH0713586A (ja) 音声判別装置と音響再生装置
WO2016046421A1 (en) Method and apparatus for voiced speech detection
CN107274895B (zh) 一种语音识别设备及方法
JP2006330389A (ja) 音声認識装置
CN111028831B (zh) 一种语音唤醒方法及装置
JP5375423B2 (ja) 音声認識システム、音声認識方法および音声認識プログラム
JP2011027757A (ja) オーディオ機器用音声認識装置
US20040121812A1 (en) Method of performing speech recognition in a mobile title line communication device
JP6616182B2 (ja) 話者認識装置、判別値生成方法及びプログラム
JP2019132997A (ja) 音声処理装置、方法およびプログラム
EP4004907B1 (en) Multi-device wakeword detection
Dekens et al. On Noise Robust Voice Activity Detection.
JPH08130723A (ja) テレビ会議システム話者判別装置
Srinivasan et al. Presence detection using wideband audio-ultrasound sensor
JPH04152397A (ja) 音声認識装置
JPH0535294A (ja) 音声認識装置
JP2666317B2 (ja) 多地点間映像会議システムの映像画面切替え方法
JP2847408B2 (ja) スケルチ制御信号発生回路

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181109

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190911

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200714

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210316

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210506

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210928

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211018

R150 Certificate of patent or registration of utility model

Ref document number: 6967289

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150