JP2009031706A - 電子機器及びこれに用いる音声信号処理方法 - Google Patents

電子機器及びこれに用いる音声信号処理方法 Download PDF

Info

Publication number
JP2009031706A
JP2009031706A JP2007219488A JP2007219488A JP2009031706A JP 2009031706 A JP2009031706 A JP 2009031706A JP 2007219488 A JP2007219488 A JP 2007219488A JP 2007219488 A JP2007219488 A JP 2007219488A JP 2009031706 A JP2009031706 A JP 2009031706A
Authority
JP
Japan
Prior art keywords
signal
sound
waveform
applause
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007219488A
Other languages
English (en)
Other versions
JP4985230B2 (ja
Inventor
Hirokazu Oguri
洋和 大栗
Masahiro Kitaura
正博 北浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2007219488A priority Critical patent/JP4985230B2/ja
Publication of JP2009031706A publication Critical patent/JP2009031706A/ja
Application granted granted Critical
Publication of JP4985230B2 publication Critical patent/JP4985230B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

【課題】電子機器本体からの音や周囲の雑音に埋もれた電子機器の制御に用いる拍手音等を正しく検出する。
【解決手段】電子機器は、電子機器から発生する第1の音声信号に基づく第1の音波を出力するスピーカ122と、第1の音波に、電子機器を制御するために発生させた音波が重畳した第2の音波を収音し、第2の音声信号を出力するマイク101を備える。第1の波形生成器125、126は、第1の音声信号に基づいて第1の波形信号を生成し、第2の波形生成器105、106は、第2の音声信号に基づいて第2の波形信号を生成する。波形整形器128は、第1の波形信号を時間軸方向に拡大した第3の波形信号を出力し、減算器130は第2の波形信号から第3の波形信号を減算する。
【選択図】図1

Description

本発明は電子機器及び電子機器に用いる音声信号処理方法に係り、電子機器本体から出力される音声信号と電子機器の外部から入力される音声信号とを処理する電子機器及びこれに用いる音声信号処理方法に関する。
現在使われているテレビジョン受像機やオーディオ機器、エアーコンディショナーなどの電子機器は、本体の操作ボタンに触れるか、リモートコントローラ(以下、リモコン)を使って操作するのが一般的である。前者の場合は制御対象の電子機器の本体まで近付かなければならず、電子機器が操作者から遠くにある場合は制御が非常に面倒になる。この問題は後者のようにリモコンを用いることで解決される。
しかし、一度リモコンを手に取ってしまえばその後は移動を必要とせずに制御できるが、リモコンが操作者の近くにない場合はリモコンのある場所を探して取りに行かなくてはならない。これは、継続して制御を行うわけではなく何か一つ手軽に制御をしたい場合、例えばとりあえず電源だけを入れたいという場合などでは、操作者に煩わしさを感じさせてしまう。また、リモコンを使いたいがリモコンが見つからないという状況も多々起こり得る。
特許文献1(特開平03−54989号公報)や特許文献2(特開平03−184497号公報)には、リモコンに代わって拍手音で電子機器を制御する方法が記載されている。
特開平03−54989号公報 特開平03−184497号公報
拍手音で電子機器を制御する場合、電子機器本体から出力される音や電子機器の周囲で発生する音に、拍手音がかき消されてしまい、思い通りに制御できないという問題がある。また、電子機器本体から出力される音を拍手音として検出し、誤動作が起こるという問題もある。
ところで、拍手音で電子機器(例えばテレビジョン受像機(以下、テレビ))を制御する場合、図17(A)に示すようにテレビ1201の電源がオフ状態の時は、制御を正常に行うことができる。一方で同図(B)に示すように、テレビ1201の電源がオン状態のときには、拍手音だけでなく、同時に視聴中の番組やコンテンツの音声(以降本体音と呼ぶ)がスピーカ1202から出力されてマイク101にて収音されるので、拍手音が本体音に埋もれてしまい、制御を妨害してしまう可能性がある。
また、本体音による誤動作が起こる可能性もある。例えば視聴中の番組内で拍手が起こった場合、あるレベル以上の音量であれば、拍手音として検出してしまい、その拍手が所定の回数だけ続いて、誤動作が起きる可能性がある。
この問題に対応するために、電子機器の電源がオンの時には拍手音による制御を禁止することもできるが、その場合拍手音で行える操作は、電源がオフの時の制御のみ、例えば電源オフから電源オンするだけに限られてしまい、活用の範囲が狭くなってしまい、この機能にとって大きな制約になる。
本発明は以上の点に鑑みなされたもので、拍手音等による電子機器の制御において電子機器本体からの音や周囲の雑音に埋もれた拍手音を検出でき、誤動作の少ない電子機器及び電子機器の音声信号処理方法を提供することを目的とする。
上記した課題を解決するために、本発明は次の(a)〜(f)を提供する。
(a)電子機器から発生する第1の音声信号を電気−音響変換して出力するスピーカ(122)と、前記スピーカから発せられた前記第1の音声信号に基づく第1の音波に、前記電子機器を制御するために発生させた音波が重畳した第2の音波を収音して音響−電気変換して第2の音声信号を出力する収音器(101)と、前記第1の音声信号に所定の信号処理を施して第1の波形信号を生成する第1の波形生成器(125、126)と、前記収音器から出力された第2の音声信号に所定の信号処理を施して第2の波形信号を生成する第2の波形生成器(105、106)と、前記第1の波形信号を時間軸方向に拡大して第3の波形信号として出力する波形整形器(128)と、前記第2の波形信号から前記第3の波形信号を減算する減算器(130)とを備えることを特徴とする電子機器。
(b)前記第1の波形生成器は、前記第1の音声信号よりオフセット成分を除去した音声信号を生成する第1のオフセット成分除去部(105)と、前記第1のオフセット成分除去部から出力された音声信号を絶対値化して前記第1の波形信号を出力する第1の絶対値化回路(106)とを備え、前記第2の波形生成器は、前記第2の音声信号よりオフセット成分を除去した音声信号を生成する第2のオフセット成分除去部(125)と、前記第2のオフセット成分除去部から出力された音声信号を絶対値化して前記第2の波形信号を出力する第2の絶対値化回路(126)とを備えることを特徴とする(a)記載の電子機器。
(c)前記波形整形器は、前記第1の波形信号を所定の時間保持する複数の保持器(152〜152)と、前記複数の保持器から出力された複数の前記第1の波形信号の最大値を抽出し、抽出した前記複数の最大値を時系列的に合成して前記第3の波形信号を生成する抽出器(153)とを備えることを特徴とする(a)または(b)に記載の電子機器。
(d)電子機器から発生する第1の音声信号を電気−音響変換して第1の音声信号として出力する電気−音響変換ステップと、前記第1の音声信号に基づく第1の音波に、前記電子機器を制御するために発生させた音波が重畳した第2の音波を収音する収音ステップと、前記第2の音波を音響−電気変換して第2の音声信号を出力する音響−電気変換ステップと、前記第1の音声信号に所定の信号処理を施して第1の波形信号を生成する第1の波形生成ステップと、前記第2の音声信号に所定の信号処理を施して第2の波形信号を生成する第2の波形生成ステップと、前記第1の波形信号を時間軸方向に拡大して第3の波形信号として出力する波形整形ステップと、前記第2の波形信号から前記第3の波形信号を減算する減算ステップとを含むことを特徴とする音声信号処理方法。
(e)前記第1の波形生成ステップは、前記第1の音声信号よりオフセット成分を除去した音声信号を生成する第1のオフセット成分除去ステップと、前記第1のオフセット成分除去ステップで出力された音声信号を絶対値化して前記第1の波形信号を出力する第1の絶対値化ステップとを含み、前記第2の波形生成ステップは、前記第2の音声信号よりオフセット成分を除去した音声信号を生成する第2のオフセット成分除去ステップと、前記第2のオフセット成分除去ステップで出力された音声信号を絶対値化して前記第2の波形信号を出力する第2の絶対値化ステップとを含むことを特徴とする(d)記載の音声信号処理方法。
(f)複数の前記第1の波形信号をそれぞれ所定の時間保持する保持ステップと、前記複数の第1の波形信号の各最大値を抽出し、抽出した前記複数の最大値を時系列的に合成して前記第3の波形信号を生成する抽出ステップとを含むことを特徴とする(d)または(e)に記載の音声信号処理方法。
本発明によれば、電子機器本体から発生する音や周囲の雑音等を除去することで、入力された音声信号から拍手音を検出できる。
(第1の実施の形態)
図1は本発明になる電子機器の第1の実施の形態を示すブロック図である。第1の実施の形態の電子機器は、例えばテレビであり、操作者により発生させられた互いに所定の時間間隔を設けた一連の音波(例えば拍手音)により制御される。
図1において電子機器は、操作者の拍手音を収音するマイクロフォン(以下、マイクと略す)101と、マイク101からのアナログ音声信号を増幅するアンプ102と、アンプ102から出力されたアナログ音声信号をディジタル音声信号に変換するA/Dコンバータ103と、A/Dコンバータ103から出力されたディジタル音声信号をソフトウェア処理により信号処理して拍手音を検出した後、本実施の形態特有の所定の判定処理を行って制御信号を生成して出力する中央処理装置(CPU)104とを備える。
更に、電子機器内の公知の音声検波回路からの音声信号(テレビデコード音)を増幅する本体アンプ121と、本体スピーカ122と、本体アンプ121からの音声信号を増幅するアンプ123と、アンプ123から出力されたアナログ音声信号をディジタル音声信号に変換するA/Dコンバータ124とを備える。
マイク101は電子機器の外で発生した音波を収音する収音器である。マイク101は収音した音波を音響−電気変換してアナログ音声信号を出力する。アナログ音声信号は、アンプ102で後段のA/Dコンバータ103によるA/D変換のダイナミックレンジに対して最適な振幅レベルに増幅された後、A/Dコンバータ103に供給される。A/Dコンバータ103は、アナログ音声信号をディジタル音声信号へ変換し、CPU104に供給する。
本体アンプ121は、電子機器から発生するテレビデコード音を増幅し、本体スピーカ122及びアンプ123へ供給する。本体スピーカ122は、供給された音声信号を電気−音響変換して電子機器の外部へ出力する。アンプ123は供給された音声信号を増幅し、A/Dコンバータ124へ供給する。A/Dコンバータ124は、アナログ音声信号をディジタル音声信号へ変換し、CPU104に供給する。
CPU104は、供給されたディジタル音声信号に基づいて電子機器を制御する制御信号を生成し、出力する。CPU104は、マイク101から収音された音波に基づく音声信号に処理を施すオフセット成分除去部105と絶対値化回路106と、電子機器から発生する音声信号に処理を施すオフセット成分除去部125と絶対値化回路126とを備える。更に、絶対値化回路106、126から出力された音声信号を処理する本体音除去回路107、エッジ信号抽出器108、エッジパルス生成器109及び判定処理部112を備える。
オフセット成分除去部105は、A/Dコンバータ103から供給されたディジタル音声信号よりオフセット成分を除去した音声信号を生成する。オフセット成分については後述する。絶対値化回路106は、オフセット成分除去部105から出力された音声信号を絶対値化する。オフセット成分除去部105及び絶対値化回路106は、マイク101から出力された音声信号に信号処理を施して、波形信号を生成する波形生成器である。
オフセット成分除去部125は、A/Dコンバータ124から供給されたディジタル音声信号よりオフセット成分を除去した音声信号を生成する。絶対値化回路126は、オフセット成分除去部125から出力された音声信号を絶対値化する。オフセット成分除去部125及び絶対値化回路126は、電子機器本体から発生された音声信号に信号処理を施して、波形信号を生成する波形生成器である。
オフセット成分除去部105、125はそれぞれ同一構成である。例えば、入力されるディジタル音声信号に対して、低域フィルタ(LPF)で高周波数成分を減衰させた音声信号を生成し、減算器において入力されたディジタル音声信号から高周波数成分を減衰させた音声信号を差し引くことにより、ディジタル音声信号が有しているオフセット成分を取り除く。LPFは時定数を大きくしておくことで追従が遅くなり、入力されたディジタル音声信号のおおよその平均値を求めることで、無信号時のレベルを安定化させることができる。無信号時のレベルは、後段の絶対値化する際の基準レベルであるゼロレベルとなる。
本体音除去回路107は、絶対値化回路106及び絶対値化回路126から供給された音声信号に基づいて、電子機器本体から発生された音声信号を除去した音声信号を生成する。本体音除去回路107は、後述するように、波形整形フィルタ128、遅延器129、減算器130、及びコアリング処理部131を備える。
エッジ信号抽出器108は、本体音除去回路107から出力された音声信号に基づいてエッジ信号を生成し、エッジパルス生成器109はエッジ信号に基づいてエッジパルスを生成する。なお、エッジ信号抽出器108は後述する理由から2入力である。
判定処理部112は、カウンタ110及び判定処理回路111とを備える。判定処理回路111は、エッジパルスとカウンタ110からのカウンタ値とに基づいて各種フラグを生成し、制御信号を出力する。
なお、本実施の形態では、A/Dコンバータ103、124から出力されたディジタル音声信号の処理は、CPU104によるソフトウェアで行う構成としているが、その一部又は全部をハードウェアで構成してもよい。ハードウェアで構成した場合には、電子機器のスタンバイ時にも所望の制御を実行させることが容易となる。
次に、図1に示した第1の実施の形態について、処理の順を追って詳しく説明する。図2は、マイク101で収音される音波の波形信号とアンプ102で増幅された音声信号の波形信号と、電子機器から発生する音声信号(テレビデコード音)に基づいて本体スピーカ122から発せられる音波の波形信号とアンプ123で増幅された音声信号の波形信号とを示す図である。
実際の波形信号は、図2のそれぞれの波形信号201〜204のように様々な周波数成分・振幅からなっているが、図示を簡単にするため以降は波形信号の包絡線で表すこととする。ただし、処理は実際の波形信号に対して施される。
図2において、テレビデコード音は本体スピーカ122から出力するのに適したレベルに本体アンプ121で増幅され、本体スピーカ122で電気−音響変換されて波形信号202として出力される。また、本体アンプ121で増幅された音声信号は更にアンプ123で増幅され、波形信号201としてA/Dコンバータ124に供給される。波形信号201のテレビデコード音は、本体音除去回路107において後述するように使用される。
波形信号203は、本体スピーカ122から発せられた音声信号(波形信号202)に基づく音波に電子機器を制御するために発生させた拍手音の音波が重畳したものである。波形信号203の音波に基づく音声信号をアンプ102で増幅すると、波形信号204となる。
ここで、波形信号202と波形信号203の振幅レベルは大きく異なる場合が多い。このため、アンプ102で波形信号203を、アンプ123で波形信号202を、以降の処理を行うのに適したレベルに調整する。なお、ゲインは1以下もありえる。
ここでいう適したレベルとは、A/Dコンバータ103に入力される波形信号204のうち本体音成分に基づく波形信号の平均的な振幅と、A/Dコンバータ124に入力される波形信号201の平均的な振幅とが同程度であることを指す。
本実施の形態では、アンプ123のゲインは波形信号が適したレベルになるように固定するものとしたが、波形信号203と波形信号202の振幅値の差分によって動的にゲインを変化させて調整してもよい。
なお、本体アンプ121で増幅される前の音声信号をA/Dコンバータ124に供給してもよいが、本体スピーカ122から出力される波形信号の振幅と本体アンプ121で増幅される前の波形信号の振幅とが比例関係であること、すなわち音量制御後の音声信号であることが条件となる。この場合も既述したように適したレベルになるように増幅する必要がある。
アンプ102で適したレベルに増幅された波形信号204及び、アンプ123で適したレベルに増幅された波形信号201は、それぞれA/Dコンバータ103、124でアナログ値からディジタル値へ変換される。ディジタル値へ変換された波形信号204は、オフセット成分除去部105及び絶対値化回路106で処理を施され、後述する波形信号301となる。同様に、波形信号201は、オフセット除去部125及び絶対値化回路126で処理を施され、後述する波形信号302となる。
次に、図3を用いて図1に示す本体音除去回路107とエッジ信号抽出器108について説明する。なお、以降の処理は全てA/D変換周期TAD毎に行われるものである。
図3において、本体音除去回路107は既述したように、絶対値化回路106から供給される波形信号301を受け取る遅延器129と、絶対値化回路126から供給される波形信号302を受け取る波形整形フィルタ128と、減算器130とコアリング処理部131とを備える。上記のとおり、波形信号301はマイク101で収音された音波に基づくものであり、波形信号302は電子機器から発せられた音波に基づくものである。
ここで、本体音除去回路107において波形信号301から波形信号302を差し引くことで、マイク101によって収音された音声信号のうち、電子機器から発された音声信号である本体音成分を除去したい。しかし、波形信号301から波形信号302を単純に差し引くだけでは、波形信号301に含まれる本体音成分を充分に除去することは難しい。これは、波形信号301に含まれる本体音成分と、波形信号302とは元々同じ信号ではあるものの、本体スピーカ122からマイク101に至る経路の伝送特性により、周波数成分や振幅が異なるためである。
波形信号301に含まれる本体音成分と波形信号302とを一致させるには、上記した伝送特性を求める必要があるが、伝送特性は本体スピーカ122とマイク101の位置関係や周囲の環境によって左右される。また、伝送特性を動的に求めるには大規模な回路と処理量が必要となり、実際には困難である。
そこで、本実施の形態では、波形信号301から本体音成分を充分に除去できるよう、波形信号302を波形整形フィルタ(波形整形器)128によって整形する。波形整形フィルタ128は、波形信号302を後述するように時間軸方向に拡大して、波形信号304として出力する。更に、簡単な回路で波形整形フィルタ128を実現する。
図4は、図1及び図3中の波形整形フィルタ128の構成と処理内容の一例を示す。波形整形フィルタ128は、入力信号の低域周波数成分を周波数選択する低域フィルタ(LPF)150と、LPF150の出力信号に対して後述する所定の処理を行う幅広処理部151と、幅広処理部151から出力された信号に対して所定の乗算係数k1を乗算する乗算器154とを備えている。
図4において幅広処理部151は、縦続接続された、各々遅延時間TADのN個の遅延器152〜152と、遅延器152〜152からの各出力信号とLPF150からの出力信号とから最大値を抽出する最大値抽出器153とからなる。幅広処理部151は、入力された信号のピーク値をN・TADの時間、保持するピークホールド回路を構成している。
かかる構成の波形整形フィルタ128に、図4に示す波形信号401が入力された場合について説明する。まず、波形整形フィルタ128に入力された波形信号401をLPF150で処理する。LPF150は入力信号の低域周波数成分を周波数選択するので、波形信号401を形成していた成分のうち、比較的周波数の高い成分は除去されて周波数の低い成分のみが残る。従って、波形信号401の包絡線に遅れて追従した波形信号402のような形の信号が、LPF150から出力される。
次に、幅広処理部151で、波形信号402を時間軸方向に拡大する処理を施す。本実施の形態では、幅広処理部151に入力された波形信号402をN個の遅延器152〜152で時間TADずつ順次遅延させ、波形信号402と波形信号402を遅延させたN個の波形信号403から最大値抽出器153で最大値を抽出する。遅延器152〜152は、各々入力された信号を遅延時間TAD保持する保持器である。最大値抽出器153は、抽出した最大値を時系列的に合成して波形信号404を生成し、出力する。出力波形信号404は入力波形信号402よりも時間軸方向に幅広である。
最後に、波形信号404は乗算器154でk1倍され、波形整形フィルタ128の出力波形信号として出力される。乗算器154の出力波形信号が、図3の出力波形信号304に相当する。
再び図3を用いて説明する。波形信号302を波形整形フィルタ128を通過させることで生じた遅延の分、波形信号301に遅延器129で適切な遅延を加え、波形信号303とする。波形信号301と波形信号303とは同じである。減算器130は、波形信号303から波形整形フィルタ128から出力された波形信号304を減算する。これにより減算器130は、マイク101が収音した音波に基づく波形信号303から本体音成分を除去した波形信号を出力することができる。
図4の幅広処理部151で波形信号302の振幅の大きい部分を時間軸方向に拡大することにより、波形信号301に含まれる拍手音以外の比較的振幅の大きなパルス性の成分まで十分に除去することが可能となる。乗算器154の定数値k1は、本体音成分がほぼ除去できるように、波形信号304の振幅が波形信号303の本体音成分の振幅よりも大きくなるような値にする。ただし、波形信号304の振幅をあまり大きくすると、波形信号303の拍手音成分が残らなくなり、拍手音を検出できなくなってしまうので、これらの条件を満たすような適切な値を選ぶ必要がある。
減算器130から出力された波形信号は、コアリング処理部131で、ある閾値よりも小さい値を“0”とするコアリング処理が施される。これにより、残っている細かいノイズが除去され、波形信号305のような拍手音成分だけを残した波形が生成される。
次に、エッジ信号抽出器108で波形信号305からエッジ信号のみを抽出する処理を行う。エッジ信号抽出器108には第一の入力と第二の入力の2つの入力があり、本実施の形態では本体音除去回路107から出力される波形信号305が、第一の入力、第二の入力となっている。
エッジ信号抽出器108は、LPF141と、乗算器142と、減算器143とコアリング処理部144とを備える。第一の入力は減算器143に、第二の入力はLPF141に対する入力である。LPF141は、波形信号305の高周波数成分を減衰させた波形信号306を生成する。LPF141は、適切な遅延と波形を得ることが目的である。乗算器142は、波形信号306に定数値k2を乗算し、波形信号307を生成する。減算器143は、波形信号305から波形信号307を減算する。
減算器143による減算の結果、波形信号305の周波数の高い立ち上がり部分はそのまま残るが、波形信号305に含まれる話し声や周囲のノイズなどの比較的周波数の低い音に波形信号307が充分に追従しているため、それ以外の部分は負に落ち込む。
コアリング処理部144は、減算器143から出力された波形信号に対してある閾値よりも小さい入力値に対する出力値を“0”とするコアリング処理を施し、波形信号308のような急峻なエッジのみを持つ波形信号を生成する。コアリング処理部144の閾値を、“0”ではなく、適切な正の値を設定することで、残っている小さなノイズ除去も可能となる。
エッジパルス生成器109は、エッジ信号抽出器108から出力された波形信号308(エッジ信号)に基づいてエッジパルスを生成する。ここで、エッジ信号を単にレベルスライスしてエッジパルスを生成することもできる。しかしながら、ノイズへの耐性やエッジ信号に対する感度をより向上させるため、本実施の形態では図5で示す方法を用いる。
図5に示す波形信号451は、図3の波形信号308を拡大したものであり、丸印は各サンプリングデータを示す。エッジパルス生成器109はサンプリングデータを保持するN個のメモリ(rm〜rmN-1)からなるリングメモリ452を備える。
現在時刻をt=0とすると、メモリrmには波形信号451におけるt=−N・Δtのサンプリングデータが保存され、メモリrmにはt=(−N+1)・Δtの値が保存される。同様に、波形信号451におけるt=(−N+2)・Δt、…、t=0の各サンプリングデータが、メモリrm、…、rmに順に保存される。リングメモリ452には、現在時刻t=0から過去N回分のサンプリングデータが保存される。なお、ΔtはA/Dコンバータ103、124でのA/D変換の周期である。
続いてt=Δtの時刻では、波形信号451におけるt=Δtのサンプリングデータがメモリrmに上書きされ更新される。すなわち現在時刻t=Δtにおいて最も古い時点のサンプリングデータ(ここでは、t=−N・Δt)を記憶しているメモリに、現在時刻のサンプリングデータが記憶される。メモリのrmからrmまではt=0に記憶した値と同じ値を保持している。同様に、Δt毎にメモリは順次一つずつ更新され、現在時刻から過去N回分の値を参照することができる。
エッジパルス生成器109は、このようなリングメモリ452において記憶されたN個のサンプリングデータのうち、記憶された時点が古いほうから順にx個(xはNよりも小さい)を加重平均したsumと、現在の値も含めた記憶された時点が新しいほうから順にx個を加重平均したsumとが、
sum−sum>yth
を満たすとき、エッジ信号が入力されたとみなし、図3の波形信号309のような所定のパルス幅を有するエッジパルスを出力する。本実施形態では、係数を1/4として加重平均値を求めた。なお、古い順からx個のサンプリングデータを記録した時点と現時点の値も含めた新しい順からx個のサンプリングデータを記録した時点とは時間的な間(間隙)があるようにxを設定する。すなわち、x+x<Nの関係となるような値とする。
本実施の形態では、上記したように間隙を設けたが、古い順からx個のサンプリングデータを記録した時点と現時点の値も含めた新しい順からx個のサンプリングデータを記録した時点とが隣接するようにxを設定してもよい。このときは、x+x=Nの関係となる。
ここで、コアリング処理部144でコアリング処理されて得られた波形信号308は、一つの大きなエッジだけを有するのではなく、図5に示す波形信号451のように実際には波形がうねっている。よってエッジパルス生成器109は、所定のパルス幅を有するエッジパルスを出力することにより不感帯を設け、一つの拍手に対して何度も検出してしまうことを避けている。
上記したythはエッジ検出の閾値であり、小さいほど拍手音を検出し易くなるが、周囲の雑音などでの誤検出も多くなる。一方で、ythが大きいほど誤検出は少なくなるが、拍手音も検出されにくくなる。そこで、拍手音を的確に検出でき、誤検出を極力少なくできるythを設定する。
この実施の形態のように、エッジパルス生成器109は波形の振幅値一つではなく、x個の値を加重平均化したsum、sumから差分を求めるため、波形がなまっていてもエッジ信号の差分値が大きくなり好ましい。また、リンギングやノイズに対する耐性が高く、良好なエッジ検出処理が可能となっている。
次に、図1に示す判定処理部112について詳しく説明する。判定処理部112は前述したように、エッジパルス生成器109から出力されるエッジパルスとカウンタ110からのカウント値とに基づいて、本実施の形態特有の判定処理を行う。
図6は判定処理部112の制御方法(判定処理アルゴリズム)を表したタイミングチャートである。図6は、電子機器を制御するために発生させる音波(拍手音)の回数が3回の場合を示した。以下に概要を説明する。
図6において、電子機器を制御するために発生させる拍手音や拍手音に類似したノイズが未発生状態である期間がtとなると、判定処理回路111は図6(C)に示す静寂フラグFを生成する。静寂フラグFが生成された後、マイク101がユーザにより発せられた第1の音波である拍手音を収音する。この第1の音波は、ユーザが電子機器を制御するために発生させようとする互いに所定の時間間隔を設けた一連の音波の、最初の音波である。エッジパルス生成器109は、図6(A)に示す第1の音波に対応した第1のエッジパルス501を生成する。判定処理回路111は、エッジパルス生成器109が第1のエッジパルス501を生成した第1の時点から、第1の所定の時間tが経過した後に、一連の音波の2回目の音波である第2の音波が発生されたか否かを検出するための図6(B)に示す時間幅tを有する2回目の拍手音用のゲート504を生成する。
次に、ユーザがゲート504内で一連の音波の第2の音波を発生させる。エッジパルス生成器109は、図6(A)に示す第2の音波に対応した第2のエッジパルス502を生成する。判定処理回路111は、エッジパルス生成器109が第2のエッジパルス502を生成した第2の時点から、第2の所定の時間tIN−(t/2)が経過した後に、一連の音波の3回目の音波である第3の音波が発生されたか否かを検出するための図6(B)に示す時間幅tを有する3回目の拍手音用のゲート505を生成する。
続いてユーザがゲート505内で一連の音波の第3の音波を発生させる。エッジパルス生成器109は、図6(A)に示す第3の音波に対応した第3のエッジパルス503を生成する。判定処理回路111は、エッジパルス生成器109が第3のエッジパルス503を生成した第3の時点から、第3の所定の時間tIN+(t/2)が経過した後に、マイク101への音波の入力が停止したことを示す無音フラグFを生成する。また判定処理回路111は、無音フラグFを生成したことによりマイク101への音波の入力が停止したことを確定する。
次に判定処理部112の判定動作を、順を追って説明する。本実施の形態では、図6における静寂フラグF、フラグF〜F、無音フラグFが全てセットされる構成例を好ましい制御方法とする。
まず、判定処理部112の判定処理回路111は、図6(C)に示す静寂フラグFがセットされているかどうか判定する。静寂フラグFがセットされておらず、かつ、図6(A)に示すエッジパルスFが“0”である状態から、カウンタ110がカウントを開始する。カウント値は、カウント開始時刻(t=0)から図6(I)に示すように増加し、判定処理回路111はカウント値が規定値に達するまでの一定期間t、図6(A)に示すようにエッジパルスFがセットされない状態(論理0の状態)が続くか否かを判定する。
エッジパルスFがセットされない状態が一定期間t続くと、判定処理回路111は静寂とみなして図6(C)に示すように静寂フラグFがセットされる(論理1となる)。これによりカウンタ110の時刻tが“0”にリセットされ、一連の判定動作がスタートする。
一定期間tが経過せず静寂フラグFがセットされないうちに、エッジパルスFがセットされた場合は、カウンタ110は時刻tを“0”にリセットし、再度カウントを始める。なお、オーバーフローを防ぐため、図6(I)に示すようにカウンタ110にはリミッタ値を設けておく。
静寂フラグFがセットされると、カウンタ110の時刻tは“0”からインクリメントされる。このとき、静寂フラグFが“1”で、かつ、後述する1回目の拍手音のフラグFが初期値の“0”の状態で、1回目の拍手音に基づくエッジパルスFの入力待ち状態となる。
1回目の拍手音に基づくエッジパルスFが図6(A)に501で示すように入力されると、エッジパルスFが“1”であると判定され、判定処理回路111は1回目の拍手音のフラグFを図6(D)に示すようにセットして(論理“1”として)、1回目の拍手と判定する。カウンタ110は時刻tを再び“0”にセットして、エッジパルスFの立ち上がりでカウンタ110は、図6(I)に示すように再びカウントを開始する。
その後、静寂フラグFとフラグFが“1”で、かつ、後述する2回目の拍手音のフラグFが初期値の“0”の状態で、2回目の拍手音に基づくエッジパルスFの入力待ち状態となる。判定処理回路111は、2回目の拍手音に基づくエッジパルスFが図6(A)に502で示すように入力されて、エッジパルスFが“1”であると判定すると、エッジパルスFの立ち上がり時点tが、t≧t、かつ、t<t+tであるかを判定する。
つまり判定処理回路111は、2回目の拍手音に基づくエッジパルスFの立ち上がり時点tが、図6(B)に示す時間幅tを持つ2回目の拍手音用のゲート504(ゲートフラグF)内であるかどうか判定し、ゲート504内であれば、図6(E)に示すように2回目の拍手音のフラグFがセットされる。同時に、1回目の拍手音に基づくエッジパルスFの立ち上がり時点から2回目の拍手音に基づくエッジパルスFの立ち上がり時点tまでの値(時間)を、1回目の拍手音と2回目の拍手音のインターバル期間tINとして記憶し、カウンタ110は時刻tをt=0にリセットして再度カウントを始める。
次に、静寂フラグFと各回の拍手音のフラグFとFとが“1”で、かつ、後述する3回目の拍手音のフラグFが初期値の“0”の状態で、3回目の拍手音に基づくエッジパルスFが図6(A)に503で示すように入力されると、判定処理回路111はエッジパルスFが“1”であると判定する。更に3回目の拍手音に基づくエッジパルスFの立ち上がり時点tが、t≧tIN−(t/2)、かつ、t<tIN+(t/2)であるかを判定する。
つまり判定処理回路111は、3回目の拍手音に基づくエッジパルスFの立ち上がり時点tが、図6(B)に示す時間幅tより小なる時間幅tを持つ3回目の拍手音用のゲート505(ゲートフラグF)内であるかどうか判定し、ゲート505内であれば、図6(F)に示すように3回目の拍手音のフラグFをセットする。さらに、3回目の拍手音のフラグFがセットされた後、再度カウンタ110をt=0にリセットしてカウントを始める。なお、3回目の拍手音用のゲート505は、2回目の拍手音のフラグFが立ち上がった時点からインターバル期間tINからt/2の時間を減じた時間が経過した後立ち上がるようにセットする。
この時点では、静寂フラグF、拍手音フラグF、F、Fはすべて論理“1”であり、また、4回目の拍手音のフラグFが初期値の“0”の状態である。この状態で時刻tはインクリメントされ、t≧tIN+(t/2)となるまでエッジパルスFがセットされない状態が続くと、図6(G)に示すように、無音フラグFがセットされる。
判定処理回路111は、無音フラグFをセットし、マイク101への音波の入力が停止したことを確定する。
そして、静寂フラグF、各拍手音のフラグF〜F、無音フラグFが全てセットされ、本実施の形態の構成例を満たすため、図6(H)に示すように判定フラグFが一定期間tだけ出力される。ここで、制御のための拍手音が正しく入力されたとして、一連の判定動作が完了する。判定処理部112は一定期間t経過後、全てのフラグとカウント値を“0”にリセットし、カウンタ110は再度カウントし始め、次の判定動作に備える。
以上が、本実施の形態の判定処理部112の判定動作である。
なお判定処理部112は、2回目の拍手音に基づくエッジパルスF(502)が入力されない状態が(t+t)の時間継続した場合は、入力失敗と判定して静寂フラグFとインターバル期間tINと1回目の拍手音のフラグFをリセットする。
同様に、3回目の拍手音に基づくエッジパルスF(503)が入力されない状態が、tIN+(t/2)の時間継続した場合は、入力失敗と判定して静寂フラグFとインターバル期間tINと拍手音フラグF、Fをリセットする。
また、3回目の拍手音のフラグFをセットした後、tIN+(t/2)の時間経過する前に、エッジパルスFが入力されたときには、予め定めた拍手音の回数より多いので、やはり入力失敗と判定する。
本実施の形態によれば、1回目の拍手音に対応した第1のエッジパルス501が生成された時点から2回目の拍手音に対応した第2のエッジパルス502が生成された時点までのインターバル期間tINを、3回目の拍手音が発生されたか否かを検出するためのゲート505を生成する際に反映させている。従って、3回目の拍手音用のゲート505は、第2のエッジパルス502が生成された時点からインターバル期間tINから3回目の拍手音用ゲート505の時間幅tの1/2の時間を減じた時間が経過した後に生成される。
図6では図示していないが、拍手音を発生させる回数を4回以上とした場合にも、4回目以降の第n(nは4以上の整数)の拍手音を検出するための第m(mは3以上の整数でnより1小さい数)のゲートを、既述した3回目の拍手音用ゲート505と同様に1または複数生成すればよい。第mのゲートは、3回目の拍手音用ゲート505と第nの拍手音が発生されたか否かを検出するための第mのゲートとにおける、隣接するゲートの間隔をインターバル期間tINから3回目の拍手音用ゲート505の時間幅tの1/2の時間を減じた時間とするよう、それぞれ生成される。
このように、インターバル期間tINを3回目以降の拍手音を検出するためのゲートを生成する際に反映させることで、3回目の拍手音用のゲート以降の隣接する拍手音用のゲート(ゲートフラグF)を生成する間隔が等間隔になるように調整できる。
また本実施形態では、2回目の拍手音用のゲート504の時間幅tを比較的長く設定することで、ユーザの様々な拍手のペースに対応することができる。更に、インターバル期間tINを反映させることで、3回目以降の拍手音用のゲートの時間幅tを時間幅tより小さい幅とすることができる。インターバル期間tINによりユーザが拍手音を発生させる間隔が判定でき、より小さい時間幅tであっても拍手音を充分に検出できるためである。時間幅tを小さくできることで、意図せずに発してしまった拍手音や、不定期に飛び込んでくる周囲のノイズ等による誤動作を減らすことができる。
判定処理部112は、マイク101に収音された一連の音波に基づくエッジパルスFの数及び、発生する間隔を判定条件としている。更に正確な判定を必要とする際には、一連の音波の発生前における音波の未発生状態(静寂フラグF)及び一連の音波の発生後における音波の未発生状態(無音フラグF)を判定条件としている。
なお、静寂フラグFまたは無音フラグFのどちらか一方を含んだ判定条件、あるいは、いずれのフラグも含まない判定条件としてもよく、これらの場合判定処理部112の判定動作が簡易になる。
しかしながら静寂フラグF及び無音フラグFを判定条件とすると、ユーザは所定回数だけ拍手すれば、所定回数+2回分の判定が行われることになり、ユーザに拍手回数が増える負担を課すことなく、判定処理部112の判定動作はより誤動作の少ないものとなり好ましい。更に、周囲で発生する音等への耐性も、他の判定条件の場合より高くなり好ましい。
人によってやり易い拍手のペースは様々であり、例えば、拍手を比較的ゆっくりしたペースで行う人では、図7(A)に701〜703で示すように各エッジパルスFが比較的長い間隔を空けて入力される。それに伴い、3回目の拍手音用のゲートフラグF(705)、は図7(B)に示すように生成される。また例えば、拍手を比較的速いペースで行う人では、図7(C)に708〜710で示すように各エッジパルスFが比較的短い間隔で入力され、3回目の拍手音用のゲートフラグF(712)は図7(D)に示すように生成される。
図7(A)、(C)のいずれの場合にも、1回目と2回目の拍手音のインターバル期間tINを、2回目の拍手音に対応した第2のエッジパルス702、709が発生した時点から3回目の拍手音用ゲート705、712を立ち上げるまでの期間に反映させるようにしているので、本実施の形態であれば、拍手の間隔のばらつきにも対応することができる。
ただし、どんなペースでも許してしまうと、誤動作の原因となるため、1回目の拍手から最後の拍手までの時間をある程度決めておいた方がよい。具体的には、図7のような3回拍手の場合、1回目から3回目までの拍手を3秒程度の間に行えば正しく判定できるように、t及びtを設定するとよい。
なお、本実施の形態では3回の拍手をもって制御する場合を示したが、これに限定するものではない。回数を多くすれば、それだけ判定条件が厳しくなるので、誤動作への耐性は高くなる。しかし、あまり多いとユーザは煩わしさを感じ、また失敗することも多くなるため、3〜4回が適度であるといえる。
また、拍手回数を少なくした場合、例えば2回の場合では、3回以上の場合のようにインターバル期間tINを反映するというアルゴリズムを適用できなくなる。その場合誤動作への耐性は低くなってしまうものの、既述したように拍手音の発生する前後の静寂状態を判定条件に加えることで、2+2回の判定が行われ、2回の拍手のみに基づく判定を行う場合よりも、はるかに高い耐性を得ることができる。
図8は、ゲートフラグFがセットされている期間外に、エッジパルスFが生成され、入力が失敗となる場合のタイミングチャートを示す。図8(A)に801で示す1回目の拍手音に基づくエッジパルスFが生成され、図8(B)に804で示す2回目の拍手音用のゲートフラグFが生成され、図8(A)に802で示す2回目の拍手音に基づくエッジパルスFが生成される。また、図8(C)、(D)、(E)に示すように静寂フラグF、フラグF、フラグFがセットされる。
ここまでは図6と同じであるが、図8(A)に803で示す3回目の拍手音に基づくエッジパルスFが、図8(B)に示す3回目の拍手音用のゲート805の外でセットされている。
この場合、これは意図せずに発した音や周囲からのノイズとみなされ、入力は失敗となり、図8(F)、(G)に示すようにフラグF、無音フラグFはセットされない。従って判定動作は終了となり、図8(H)に示すように判定フラグFは出力されない。判定フラグFが出力されずに終了となった場合、判定処理部112はその時点で全てのフラグとカウンタを0にリセットし、カウンタ110は時刻tを再カウントし始め、次の判定動作スタートに備える。
すなわち、本実施の形態では、ゲート期間外にエッジパルスFが1回でも入力された場合には、制御のための拍手の入力は失敗とみなすようにしているため、より拍手音の検出を正確に行うことができる。
なお、本体音が出ていない場合及び本体電源オフ時は、図1及び図3に示した本体音除去回路107に入力される波形信号302は、ほぼゼロ又は多少のノイズ成分を持ったものである。従って、本実施の形態の電子機器は、本体音除去回路107を備えていない構成の電子機器と同様の動作をする。
以上の処理により、テレビや音響機器などの本体音による誤動作を減らすことができる。更に、本体のスピーカから本体音が出力されて、マイクから入力される音に本体音の成分が含まれていても、拍手音が本体音よりもある程度大きければ、拍手音として検出することができ、検出した拍手音に基づいて制御信号を生成することができる。
(第2の実施の形態)
次に、本発明の第2の実施の形態について説明する。図9は本発明になる電子機器の第2の実施の形態の要部のブロック図を示す。同図中、図3と同一構成部分には同一符号を付し、その説明を省略する。
第1の実施の形態では、LPF141にコアリング処理部131から出力された波形信号305を供給していたが、第2の実施の形態では、エッジ信号抽出器108’のLPF141に遅延器129から出力された波形信号303を供給する。
制御対象の電子機器から本体音が出力されている場合、第1の実施の形態により、ほぼ本体音の影響はなくなり、誤動作を起こすことなく拍手音による制御が可能である。しかし、本体スピーカ122から出力される音が非常に大きい場合などに、稀に本体音除去回路107において本体音が十分に除去されず、図1及び図3のエッジ信号抽出器108内の処理では除去しきれない程のパルス性のノイズが残る場合がある。ノイズが除去されきらない場合、エッジパルス生成器109で、ノイズを拍手音として誤認識してしまうおそれがある。
そこで、第2の実施の形態では、前述したように、LPF141に供給される第二の入力を遅延器129から出力された波形信号303とすることで、このような状況を回避するようにしたものである。
図9において、エッジ信号抽出器108’に対する2入力のうち、第一の入力は第1の実施の形態と同じ本体音除去回路107の出力波形信号305を用いる。第二の入力は既述したように、本体音除去回路107の出力波形信号305ではなく、波形信号303を用いる。波形信号303は、マイク101により収音された音声信号に基づく信号であり、電子機器から発せられる本体音に基づく音声信号を含んだ信号である。
波形信号303はLPF141により高域周波数成分が減衰された後、乗算器142で定数値k2を乗算され波形信号310となる。減算器143は、第一の入力側の波形信号305から波形信号310を減算し、コアリング処理部144はその波形信号をコアリング処理する。
これにより、エッジ信号抽出器108’での処理において、エッジ信号抽出処理だけでなく2回目の本体音除去処理が行われることになるので、大きな振幅のパルス性のノイズも十分除去され、誤動作への耐性もより上がることになる。ただし、検出するべき拍手音成分を必要以上に削ってしまう可能性もあるため、図4に示した波形整形フィルタ128内の乗算器154の係数値k1と、図9に示すエッジ信号抽出器108’内の乗算器142の係数値k2とを適切な値に設定する必要がある。
(第3の実施の形態)
拍手音により電子機器を制御するとき、周囲に拍手音以外に大きなノイズがある場合、拍手音が周囲の音に埋もれてしまい、検出ができなくなってしまう可能性がある。また、例えば大音量で音楽を聞いている場合などでは、その音楽の中で拍手音と似た音(振幅値や周波数帯域など)が鳴った場合、拍手音と認識してしまい、誤動作を起こす可能性もある。
ここでは、このような拍手音以外の周囲の音により、拍手による制御が困難となる、または誤動作につながる可能性がある状態を、騒音状態と呼ぶことにする。
そこで、第3の実施の形態では、騒音状態かどうかを判断し、騒音状態と判断した場合は、拍手による電子機器の制御を禁止する機能を実現する。
拍手音はインパルス的な波形を示すので、ほぼ全ての周波数帯域にわたって信号成分を持っている。この特徴を利用して、入力された音を帯域フィルタで複数の帯域に分割し、それぞれに対して第1の実施の形態のような拍手音検出処理を行えば、拍手音とその他の音、例えばある特定の帯域にしか存在しない音との区別ができる。帯域の分割数が多いほど、区別の精度は上がる。ここでは、最も簡単な、帯域を2分割する例について説明する。
図10は本発明になる電子機器の第3の実施の形態を示すブロック図である。同図中、図1と同一構成部分には同一符号を付し、その説明を省略する。第1の実施の形態ではオフセット成分除去部105、125の後段に絶対値化回路106、126をそれぞれ設けていたが、第3の実施の形態ではオフセット成分除去部105、125の後段に、帯域分割処理部161、164及び以降の回路ブロックをそれぞれ設けた。
第3の実施の形態の電子機器は、図10に示すように帯域分割処理部161の後段に、高域成分絶対値化部162と低域成分絶対値化部163とを備え、帯域分割処理部164の後段に、高域成分絶対値化部165と低域成分絶対値化部166とを備える。更に、高域成分絶対値化部162、165の後段には高域成分本体音除去部167と高域成分拍手音検出処理部169とを備え、低域成分絶対値化部163、166の後段には低域成分本体音除去部168と低域成分拍手音検出処理部170とを備える。また、騒音状態検出部171と判定処理部172も備える。判定処理部172は、第1の実施の形態の判定処理部112と同様の構成である。
オフセット成分除去部105、125からそれぞれ出力されたディジタル音声信号は、帯域分割処理部161、164により周波数帯域が2分割されて高域周波数成分と低域周波数成分とされる。帯域分割処理部161、164はそれぞれ同一構成で、例えば低域フィルタ(LPF)と減算器とからなる。
LPFは、オフセット成分除去部105、125でオフセット成分を除去した信号の低域周波数成分(以下、低域成分)を取り出して出力する。減算器は、LPFより出力された低域成分を、オフセット成分除去部105、125から出力されたオフセット成分を除去した信号から差し引く。従って減算器は、オフセット成分を除去した信号中の低域成分が減衰された、すなわち、高域フィルタ特性が付与された高域周波数成分(以下、高域成分)を出力する。
帯域分割処理部161、164内のLPFとしては、後段で拍手音に基づくエッジの立ち上がりを検出することに配慮して、周波数の遷移域がある程度急峻でリンギングが少ない特性であることが好ましい。またLPFは、消費電力を抑えてサンプリング周期内で処理が完結するためにできるだけタップ係数が少ないフィルタ方式であることが望ましく、例えば、最大平坦ハーフバンドFIRフィルタ(Maximum Flat Half Band Finite Impulse Response Filter)を用いる。
帯域分割処理部161、164から出力された高域成分は高域成分絶対値化部162、165にそれぞれ供給されて絶対値化され、また、帯域分割処理部161、164から出力された低域成分は低域成分絶対値化部163、166にそれぞれ供給されて絶対値化される。高域成分絶対値化部162、165で絶対値化された2つの高域成分は高域成分本体音除去部167に供給され、低域成分絶対値化部163、166で絶対値化された2つの低域成分は低域成分本体音除去部168に供給される。
高域成分本体音除去部167と低域成分本体音除去部168の構成は、図1に示した本体音除去回路107と同一構成である。ただし、入力される信号が高域成分または低域成分である点が異なる。高域成分本体音除去部167と低域成分本体音除去部168は、本体音除去回路107と同様の処理により入力信号(高域成分、低域成分)に含まれる本体音成分を除去する。
高域成分拍手音検出処理部169は、高域成分本体音除去部167からの本体音成分が除去された高域成分(高域成分絶対値)が供給され、その中の拍手音を検出して高域成分のエッジパルスFPHを生成する。一方、低域成分拍手音検出処理部170は、低域成分本体音除去部168からの本体音成分が除去された低域成分(低域成分絶対値)が供給され、その中の拍手音を検出して低域成分のエッジパルスFPLを生成する。
高域成分拍手音検出処理部169及び低域成分拍手音検出処理部170は、いずれも図1に示したエッジ信号抽出器108とエッジパルス生成器109とよりなる構成であり、その動作は既に説明したのでここではその説明を省略する。
図10の騒音状態検出部171は、高域成分本体音除去部167から出力された高域成分絶対値と低域成分本体音除去部168から出力された低域成分絶対値との、いずれか一方又は両方に基づき、周囲に拍手音以外に連続した大きな音が存在するかどうかを判断し、判定処理部172へ判断結果を出力する。判定処理部172は、図1に示した判定処理部112と略同様に、カウンタと判定処理回路とから構成されている。
ここで、騒音状態検出部171は次に説明する1〜4のいずれかの動作を行う。
(1)低域成分絶対値について適切な閾値を設定して低域成分のみで騒音状態を検出する。(2)高域成分絶対値について適切な閾値を設定して高域成分のみで騒音状態を検出する。(3)低域成分絶対値と高域成分絶対値のそれぞれについて適切な閾値を設定してそれぞれ騒音状態を検出し、どちらか一方又は両方が騒音状態として検出されるときに騒音状態と判定する(一方/両方にするかは判定の厳しさに反映される)。(4)低域成分と高域成分の騒音状態検出対象値(それぞれ絶対値化後の値)を加算又はある比率を掛け合わせたものを加算し(例えば、α×低域成分絶対値+β×高域成分絶対値)、この値に適切な閾値を設定して騒音状態を判定する。
次に、騒音状態検出部171の検出動作について、図11を併せ参照して説明する。図11(A)は騒音状態検出部171に供給される騒音状態での絶対値化後の波形信号1002の様子を表す。入力された波形信号1002における拍手音の成分1001は、騒音状態による成分に埋もれてしまい、第1の実施の形態での処理で検出することは難しい。
そこで、本実施の形態では図11に示すように、まず波形信号1002に対して、適切な閾値1003を設ける。そして、波形信号1002の値から閾値1003を引いた値を変数とし、変数を累積して変数sumとする。波形信号1002の値が閾値1003未満であれば、負の値の加算、つまり変数sumからの減算となる。
図11(A)で加算と記した範囲では、閾値1003よりも大きい値が入力されているので、閾値1003との差分を変数sumに加算し、減算と記した範囲では、閾値1003よりも入力された値が小さいので、差分を変数sumより減算している。このときの変数sumを図11(B)で示す。
次に、変数sumに対しても適切な閾値1004を設け、この閾値1004よりも変数sumが大きい場合、騒音状態検出部171は、この状態を騒音状態とみなし、拍手制御禁止フラグFを判定処理部172へ出力する。ここで、波形信号1002の値が閾値1003を越え続けると、変数sumは加算され続けるので、オーバーフローを防ぐために変数sumに対して図11(B)に示すようにリミッタ1005を設けている。また変数sumの下限値は0とする。
図10の判定処理部172内の判定処理回路は、拍手制御禁止フラグFが入力されない場合は、第1の実施の形態の判定処理回路111と同様の判定動作を行う。一方で、拍手制御禁止フラグFが入力された場合は、判定動作を停止するなどして、拍手制御を禁止することで、周囲のノイズによる誤動作を防ぐ。また、拍手制御禁止フラグFがセットされた場合には、ユーザが拍手制御を受け付けない状態であることを認知できるよう、画面に所定の表示を行ったり、スピーカから所定の音声を発生させたりすると良い。
図11において、波形信号1002の値に対して、レベルスライスして判定を行うと、拍手音の成分は立ち上がりに大きな振幅を持っているので、拍手音自身で拍手制御禁止フラグFがセットされてしまう。しかし、本実施の形態のように、波形信号1002の値ではなく、その累積値の変数sumに対して判定を行うことで、連続的な大きな周囲の音に対してのみ、拍手制御禁止フラグFを立てることができる。
図12は3回拍手をして電子機器を制御する場合の評価の一例を示し、「○」は各エッジパルスがゲート期間内に検出された場合を示し、「×」はエッジパルスが検出されなかった場合を示す。
図12の例では、2回目の拍手に基づく高域エッジパルスFPHが検出できなかったが、低域エッジパルスFPLは全ての拍手に基づいたものが検出できた。ここでは評価の仕方として、1回目の拍手を全ての始まりとし、誤検出を避けることを重要視して、高域エッジパルスFPHと低域エッジパルスFPLの両方の論理積を1回目の拍手の演算結果として算出している。
一方、2回目の拍手及び3回目の拍手の演算結果は高域エッジパルスFPHと低域エッジパルスFPLの論理和をとって算出する。そして、第1の評価としては、1回目から3回目までの拍手音に基づくエッジパルスの演算結果があることを確認する。第2の評価は、2回目と3回目の拍手におけるエッジパルスFPH、FPLの検出回数の総和を評価する。エッジパルスFPH、FPLが完全に検出されれば検出回数は4回であるが、ここでは認識率を高めるため検出回数が3回以上であれば認識を確定させることにしている。このような処理とするのは誤認識に対する耐性を高めるためである。
例えば、電子機器の警告音などビープ音と呼ばれる電子音などは、特定の周波数成分を有している。従って拍手と同じように例えばビープ音が3回繰り返されると、エッジパルスを検出し区別がつかなくなる。このような場合を想定しても、図12の評価方法によれば、全3回の拍手の内1回は既述したように論理積を見ているので、高域エッジパルスFPHと低域エッジパルスFPLの両方が同時に立っていることが必要とされ、ビープ音のような電子音に対して誤認識を避けることができるものである。ビープ音と呼ばれる電子音などは、特定の周波数成分を有しているため、高域エッジパルスFPHと低域エッジパルスFPLの両方が同時に立つことはないからである。
なお、評価の仕方は図12に示した方式のみでなく、全ての回数の拍手において演算内容を高域エッジパルスFPHと低域エッジパルスFPLの論理積とする厳しい評価もできる。
また、全ての回数の拍手において演算内容を高域エッジパルスFPHと低域エッジパルスFPLの論理和としてエッジパルスの検出回数の総和を評価することも可能である。検出精度を向上させるか、誤認識に対する耐性を高めるかは、環境に応じて設定されることが好ましい。
判定処理部172は、騒音検出部171から拍手制御禁止フラグFが入力されない場合は、第1の実施の形態の判定処理回路111と同様の判定動作を行う。一方で、拍手制御禁止フラグFが入力された場合は、判定動作を停止するなどして、拍手制御を禁止することで、周囲のノイズによる誤動作を防ぐ。また、拍手制御禁止フラグFがセットされた場合には、ユーザが拍手制御を受け付けない状態であることを認知できるよう、画面に所定の表示を行ったり、スピーカから所定の音声を発生させたりすると良い。
以上のように、拍手制御禁止フラグFを導入することにより、図11(A)で表されるような、連続した大きなノイズが存在する場合の誤動作を防ぐことができる。更に、前述したユーザが禁止状態を認知できるような表示等があれば、拍手制御ができない状態なのにむやみに拍手せずに済む。また、騒音の原因になるものが例えば音楽であれば、それを止めるなどの対応をとることができるようになる。
(第4の実施の形態)
次に、本発明の第4の実施の形態について説明する。第1の実施の形態では、ある決められた回数(第1の実施の形態では3回)のみの拍手音を判定する判定処理部112の制御方法(判定処理アルゴリズム)を示した。しかし、ある決められた回数のみについてしか判定できないと、この拍手音による電子機器制御を実際に用いる場合、電子機器の状態に応じて制御を変えたとしても、その時点では一種類の制御しかできないことになる。これは、本発明を用いるにあたり、大きな制約となってしまう。
数種類の拍手の回数を識別し、各回数に応じた制御動作をそれぞれ設定できれば、利用の幅も広がる。そこで、本実施の形態では、数種類の拍手回数を判定する制御方法を説明する。
図13は、本実施の形態の一実施例として、3回と4回の拍手を判定する制御方法を示す。図13(A)は3回の拍手で制御する場合、図13(B)は4回の拍手で制御する場合のエッジパルスFを示す。3回目の拍手まで入力が完了している状態、つまり図6に示した静寂フラグF及び各拍手音フラグF〜Fがセットされている状態までは、第1の実施の形態と同じなので説明及び図示を省略し、3回目の拍手音に基づくエッジパルスFの出力以降の判定処理部112(または172)の動作について説明する。
図13(A)に示すように、判定処理回路111が3回目の拍手音に基づくエッジパルスFを、図13(C)に示す3回目の拍手音のゲート1301の中で検出すると、カウンタ110はt=0から再カウントを始める。この後、図13(C)のT1及びT2の期間内(t<tIN+(t/2))にエッジパルスFが生成されず、t≧tIN+(t/2)となると、既述した3回の拍手の判定条件を満たし、入力成功となる。これは、第1の実施の形態の通りである。
一方で、図13(C)のT1及びT2の期間内(t<tIN+(t/2))の間にエッジパルスFが検出された場合、3回目の拍手の後、所定期間エッジパルスFが検出されないという条件を満たしていないので、3回の拍手による制御は失敗となる。
図13(B)に示す4回の拍手の場合は、図13(A)と同様に3回目の拍手音に基づくエッジパルスFが、図13(C)に示す3回目の拍手音のゲート1301の中で検出されると、カウンタ110はt=0から再カウントを始める。続いて判定処理回路111は、4回目の拍手音が発生されたか否かを検出するためのゲート1302を、エッジパルス生成器109が3回目の拍手音に基づくエッジパルスFを生成した時点tから、所定の時間tIN−(t/2)が経過した後に生成する。
ここで、図13(C)に示す各期間T1〜T3において4回目の拍手音に基づくエッジパルスFが生成された場合をそれぞれ説明する。
まず、ゲート1302の外である期間T1(t<tIN−(t/2))に4回目の拍手音に基づくエッジパルスFが生成されると、4回の拍手による制御は失敗となる。
ゲート1302内である期間T2、つまりt≧tIN−(t/2)、かつ、t<tIN+(t/2)の間に4回目の拍手音に基づくエッジパルスFが生成されると、判定処理回路111は4回目の拍手音に基づく音波が発生されたことを検出する。4回目の拍手音に基づくエッジパルスFが生成された時点tから、T3の期間であるtIN+(t/2)が経過するまでエッジパルスFが生成されないことが確認されると、4回の拍手の判定条件を満たし、4回の拍手による制御は成功となる。
なお、ゲート1302の外である期間T3に4回目の拍手音に基づくエッジパルスFが生成されても、4回の拍手による制御は失敗となる。既に3回目の拍手音に基づくエッジパルスFを生成した時点tから、tIN+(t/2)が経過しているため、4回目の音波が入力されたとしても認識されない。
本実施例のように3回または4回の拍手で制御する設定となっている場合には、既述したように3回の拍手の判定条件を満たしているため、3回の拍手による制御と判定される。
以上で、3回の拍手音と4回の拍手音とがそれぞれ判定される条件を別々に考えたが、これらをまとめると、それぞれの判定条件は、図14に示したようになる。図14において、「○」はその期間内にエッジパルスFが一度セットされること、「×」はその期間内にエッジパルスFが一度もセットされないこと、「−」は無関係であることを表す。
期間T1内でエッジパルスFがセットされた場合、拍手回数が3回、4回のどちらの判定条件にも一致しないので、入力失敗となる。期間T2内でエッジパルスFがセットされなければ3回の拍手と判定され、期間T2内でエッジパルスFがセットされた場合は、3回の拍手である可能性はなくなる。更に期間T2内でエッジパルスFがセットされ、期間T3内でエッジパルスFがセットされなければ、4回の拍手と判定される。
以上の判定動作を実現することにより、3回と4回の拍手を識別することができる。また、この判定方法は、理論上、回数や回数の種類を限定するものではないため、広く応用することができる。すなわち、例えば、3以上の複数種類の拍手回数を識別することも可能である。
以上説明した本発明の各実施の形態による拍手音により電子機器を制御する一例として、テレビジョン受像機(以下、テレビと略す)を制御する実施例を図15に示す。同図中、図1、図2、図10と同一構成部分には同一符号を付してある。
図15(A)は電源オフ時、図15(B)は電源オン時のテレビ201をそれぞれ示している。テレビ201の正面上部にはマイク101が設けられており、正面下部には本体スピーカ122が設けられている。また、マイク101の隣には発光色が異なる複数の発光ダイオード(LED)からなるインジケータ202が設けられている。インジケータ202は、ユーザに対して、現在マイク101から入力されている音が、どのような状態かを示すものである。
マイク101は、拍手音をよく拾える位置に設置するのが望ましく、図15(A)、(B)のようにテレビ201の上部中央に設置してもよいし、他の場所でもよい。しかしながら、本体スピーカ122とマイク101の距離や角度、使用環境によって、マイク101に回り込む本体音の周波数成分や振幅に差異が生じ、本体音除去のためのパラメータが変わる可能性があるので、マイク101の位置は可変ではなく固定されている方が望ましい。
拍手3回での制御を電子機器の電源オンと電源オフとに割り当てた場合、図15(B)の電源オン時に本体音による誤動作や操作制御の妨害が起きることが予想される。これに対応するには、電源オン時にはマイク101に入力された音量が設定した閾値を超える場合は拍手制御を禁止するといったような、ユーザにとっての利便性を犠牲にする方法しかなかった。
しかし、本発明によれば、図15(A)の電源オフ時でも、図15(B)の電源オン時でも、本体音除去回路107や本体音除去部167、168により本体音が除去されるので、ユーザが電源のオン/オフの違いを意識する必要なく、同じように拍手音で制御ができる。
また、電子機器は通常、電源オフ時は内部のマイコンがスタンバイ状態やストップモードと呼ばれる状態になっており、通常動作時と比べ、クロック周波数を下げたり、クロックの供給をストップしたりしている。この状態で、既述した処理をソフトウェアで行うのは難しいので、例えば、全ての処理をハードウェアで行い、マイコンへ割り込み信号として信号を入力する等の対応が必要となる。
図16はテレビ201の制御に対して、異なる回数の拍手を、それぞれ別の制御に割り当てた場合の実施例を示す。同図中、図15と同一構成部分には同一符号を付し、その説明を省略する。ここでは、4回の拍手を電源オン/オフに、3回の拍手をチャンネルのアップに割り当てた。
これにより、図16(A)に示すように、テレビ201が電源オフの状態で拍手が4回されると、テレビ201に内蔵された本発明の実施の形態の電子機器がその4回の拍手音を識別して得た制御信号により、テレビ201は図16(B)に示すように電源オンの状態へ遷移する。また、図16(B)に示すテレビ201が電源オンの状態で拍手が4回されると、テレビ201は図16(A)に示すように、電源オフの状態へ遷移する。
また、図16(B)に示すテレビ201が電源オンの状態で拍手が3回されると、テレビ201は現在視聴しているチャンネルから一つアップして、図16(C)に示すようにアップ後のチャンネルを受信するように操作制御される。
このように、拍手の回数毎に異なる制御ができるためには、図13及び図14と共に説明した第4の実施の形態の構成が必要であり、この実施の形態を適用することでテレビ視聴時にも本体音に影響されることなく、拍手音制御が可能である。
以上より、第1〜第4の実施の形態の電子機器及びその音声信号処理方法を用いると、本体音に影響されることなく拍手音による電子機器制御を行える。なお、第1〜第4の実施の形態では、3回以上の拍手の判定について説明したが、1回または2回の拍手でも、電子機器制御に用いることは可能である。しかし、3回未満の拍手では、単純に判定の回数が少ないことに加え、第1の実施の形態で説明した、1回目と2回目の拍手のインターバル期間を次のインターバル期間へ反映するという制御方法が適用できないため、3回以上の場合と比べて大幅に誤動作が多くなってしまう。よって、以上の実施の形態で説明したように、拍手の回数は3回以上が現実的であるといえる。
なお、以上の実施の形態及び実施例では、ユーザ(操作者)が発生させた拍手音によって電子機器を制御する説明をしたが、これに限るものではない。ユーザは電子機器を制御するための音波を所定回数発生させればよく、音波発生方法としては拍手以外の方法(例えば、ユーザが手に持った物体を最寄りの位置にある机などの何かに叩いて発する打撃音その他)も本発明に含まれる。
また、CPU104をソフトウェアで動作させて上記の各実施の形態を実現させるコンピュータプログラムも本発明に包含されるものである。このコンピュータプログラムは、記録媒体からコンピュータに取り込まれてもよいし、通信ネットワークを介して配信されてコンピュータにダウンロードされてもよい。
本発明の第1の実施の形態の電子機器のブロック図である。 本体スピーカ122から出力される音とマイク101へ入力される音の、アンプで増幅される前後の波形信号を表す図である。 図1中の本体音除去回路107及びエッジ信号抽出器108の構成と処理内容の一例を示す図である。 図1中の波形整形フィルタ128の構成と処理内容の一例を示す図である。 図1中のエッジパルス発生器109の処理内容を示す図である。 本発明の第1の実施の形態の制御方法を説明するタイミングチャートである。 本発明の第1の実施の形態の制御方法が様々な拍手のペースに対応できることを示した図である。 本発明の第1の実施の形態の制御方法において、失敗と判定される例を示した図である。 本発明の第2の実施の形態のエッジ信号抽出器108’での処理内容を示す図である。 本発明の第3の実施の形態の電子機器のブロック図である。 図10中の騒音状態検出部171の動作を説明する図である。 図10中の判定処理部172による3回拍手をして認識を確定させる場合の評価を示す図である。 本発明の第4の実施の形態の制御方法を説明するタイミングチャートである。 本発明の第4の実施の形態の電子機器で行う判定条件を説明する図である。 本発明を用いてテレビの電源オン/オフを制御する実施例を説明する図である。 本発明を用いてテレビの異なる制御を行う実施例を説明する図である。 テレビを拍手で制御する場合の課題を説明する図である。
符号の説明
101 マイク
102、123 アンプ
103、124 A/Dコンバータ
104 中央処理装置(CPU)
105、125 オフセット成分除去部
106、126 絶対値化回路
107 本体音除去回路
108、108’ エッジ信号抽出器
109 エッジパルス生成器
110 カウンタ
111 判定処理回路
112 判定処理部
121 本体アンプ
122 本体スピーカ
128 波形整形フィルタ
129、152〜152 遅延器
130 減算器
131、144 コアリング処理部
141、150 低域フィルタ(LPF)
142、154 乗算器
151 幅広処理部
153 最大値抽出器
161、164 帯域分割処理部
162、165 高域成分絶対値化部
163、166 低域成分絶対値化部
167 高域成分本体音除去部
168 低域成分本体音除去部
169 高域成分拍手音検出処理部
170 低域成分拍手音検出処理部
171 騒音状態検出部
172 判定処理部
201 テレビ

Claims (6)

  1. 電子機器から発生する第1の音声信号を電気−音響変換して出力するスピーカと、
    前記スピーカから発せられた前記第1の音声信号に基づく第1の音波に、前記電子機器を制御するために発生させた音波が重畳した第2の音波を収音して音響−電気変換して第2の音声信号を出力する収音器と、
    前記第1の音声信号に所定の信号処理を施して第1の波形信号を生成する第1の波形生成器と、
    前記収音器から出力された第2の音声信号に所定の信号処理を施して第2の波形信号を生成する第2の波形生成器と、
    前記第1の波形信号を時間軸方向に拡大して第3の波形信号として出力する波形整形器と、
    前記第2の波形信号から前記第3の波形信号を減算する減算器と
    を備えることを特徴とする電子機器。
  2. 前記第1の波形生成器は、
    前記第1の音声信号よりオフセット成分を除去した音声信号を生成する第1のオフセット成分除去部と、前記第1のオフセット成分除去部から出力された音声信号を絶対値化して前記第1の波形信号を出力する第1の絶対値化回路とを備え、
    前記第2の波形生成器は、
    前記第2の音声信号よりオフセット成分を除去した音声信号を生成する第2のオフセット成分除去部と、前記第2のオフセット成分除去部から出力された音声信号を絶対値化して前記第2の波形信号を出力する第2の絶対値化回路とを備える
    ことを特徴とする請求項1記載の電子機器。
  3. 前記波形整形器は、
    前記第1の波形信号を所定の時間保持する複数の保持器と、
    前記複数の保持器から出力された複数の前記第1の波形信号の最大値を抽出し、抽出した前記複数の最大値を時系列的に合成して前記第3の波形信号を生成する抽出器とを備える
    ことを特徴とする請求項1または2に記載の電子機器。
  4. 電子機器から発生する第1の音声信号を電気−音響変換して第1の音声信号として出力する電気−音響変換ステップと、
    前記第1の音声信号に基づく第1の音波に、前記電子機器を制御するために発生させた音波が重畳した第2の音波を収音する収音ステップと、
    前記第2の音波を音響−電気変換して第2の音声信号を出力する音響−電気変換ステップと、
    前記第1の音声信号に所定の信号処理を施して第1の波形信号を生成する第1の波形生成ステップと、
    前記第2の音声信号に所定の信号処理を施して第2の波形信号を生成する第2の波形生成ステップと、
    前記第1の波形信号を時間軸方向に拡大して第3の波形信号として出力する波形整形ステップと、
    前記第2の波形信号から前記第3の波形信号を減算する減算ステップと
    を含むことを特徴とする音声信号処理方法。
  5. 前記第1の波形生成ステップは、
    前記第1の音声信号よりオフセット成分を除去した音声信号を生成する第1のオフセット成分除去ステップと、前記第1のオフセット成分除去ステップで出力された音声信号を絶対値化して前記第1の波形信号を出力する第1の絶対値化ステップとを含み、
    前記第2の波形生成ステップは、
    前記第2の音声信号よりオフセット成分を除去した音声信号を生成する第2のオフセット成分除去ステップと、前記第2のオフセット成分除去ステップで出力された音声信号を絶対値化して前記第2の波形信号を出力する第2の絶対値化ステップとを含む
    ことを特徴とする請求項4記載の音声信号処理方法。
  6. 複数の前記第1の波形信号をそれぞれ所定の時間保持する保持ステップと、
    前記複数の第1の波形信号の各最大値を抽出し、抽出した前記複数の最大値を時系列的に合成して前記第3の波形信号を生成する抽出ステップとを含む
    ことを特徴とする請求項4または5に記載の音声信号処理方法。
JP2007219488A 2006-08-28 2007-08-27 電子機器及びこれに用いる音声信号処理方法 Active JP4985230B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007219488A JP4985230B2 (ja) 2006-08-28 2007-08-27 電子機器及びこれに用いる音声信号処理方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2006230879 2006-08-28
JP2006230879 2006-08-28
JP2007173784 2007-07-02
JP2007173784 2007-07-02
JP2007219488A JP4985230B2 (ja) 2006-08-28 2007-08-27 電子機器及びこれに用いる音声信号処理方法

Publications (2)

Publication Number Publication Date
JP2009031706A true JP2009031706A (ja) 2009-02-12
JP4985230B2 JP4985230B2 (ja) 2012-07-25

Family

ID=39197771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007219488A Active JP4985230B2 (ja) 2006-08-28 2007-08-27 電子機器及びこれに用いる音声信号処理方法

Country Status (2)

Country Link
US (1) US8103504B2 (ja)
JP (1) JP4985230B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010211001A (ja) * 2009-03-11 2010-09-24 Victor Co Of Japan Ltd 電子機器の制御方法及び電子機器の制御装置
JP2011061394A (ja) * 2009-09-09 2011-03-24 Victor Co Of Japan Ltd 電子機器およびその制御方法
US8762145B2 (en) 2009-11-06 2014-06-24 Kabushiki Kaisha Toshiba Voice recognition apparatus

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5326934B2 (ja) * 2009-01-23 2013-10-30 株式会社Jvcケンウッド 電子機器
EP2214165A3 (en) * 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
KR20110065095A (ko) * 2009-12-09 2011-06-15 삼성전자주식회사 디바이스를 제어하는 방법 및 그 장치
US9087520B1 (en) * 2012-12-13 2015-07-21 Rawles Llc Altering audio based on non-speech commands
US10091980B1 (en) * 2015-06-05 2018-10-09 Thomas Paul Cogley Bed bug detector system
US10736309B1 (en) * 2018-11-27 2020-08-11 Thomas Paul Cogley Bed bug detector system

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62149000A (ja) * 1985-12-23 1987-07-02 日本電気株式会社 音声分析装置
JPH03192239A (ja) * 1989-09-26 1991-08-22 Konica Corp カメラ
JPH096340A (ja) * 1995-01-12 1997-01-10 Blue Chip Music Gmbh 音の開始と終わりを認識するための方法及び装置
JPH10223103A (ja) * 1997-02-12 1998-08-21 Mitsubishi Electric Corp 電気機器の遠隔オン/オフ制御方法及び装置
JP2007140102A (ja) * 2005-11-18 2007-06-07 Alpine Electronics Inc 音声補正システムおよびこれに用いる適応フィルタ
JP2008172766A (ja) * 2006-12-13 2008-07-24 Victor Co Of Japan Ltd 電子機器の制御方法及び制御装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54131921A (en) * 1978-04-03 1979-10-13 Keio Giken Kogyo Kk Electronic keyboard instrument
JPS599699A (ja) * 1982-07-07 1984-01-19 日産自動車株式会社 自動車の車室内音場制御装置
JPH0354989A (ja) 1989-07-24 1991-03-08 Matsushita Electric Ind Co Ltd リモコン装置
JPH03184497A (ja) 1989-12-13 1991-08-12 Matsushita Electric Ind Co Ltd リモコン装置
JP2877265B2 (ja) 1991-08-01 1999-03-31 三菱重工業株式会社 排水処理設備
JPH06318424A (ja) 1993-03-12 1994-11-15 Kitagawa Ind Co Ltd 音感知作動スイッチと該スイッチを応用した非常用電灯及びリモコンホルダ
US6737572B1 (en) * 1999-05-20 2004-05-18 Alto Research, Llc Voice controlled electronic musical instrument
US20040203697A1 (en) * 2002-08-22 2004-10-14 James Finn Ultra wideband remote control system and method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62149000A (ja) * 1985-12-23 1987-07-02 日本電気株式会社 音声分析装置
JPH03192239A (ja) * 1989-09-26 1991-08-22 Konica Corp カメラ
JPH096340A (ja) * 1995-01-12 1997-01-10 Blue Chip Music Gmbh 音の開始と終わりを認識するための方法及び装置
JPH10223103A (ja) * 1997-02-12 1998-08-21 Mitsubishi Electric Corp 電気機器の遠隔オン/オフ制御方法及び装置
JP2007140102A (ja) * 2005-11-18 2007-06-07 Alpine Electronics Inc 音声補正システムおよびこれに用いる適応フィルタ
JP2008172766A (ja) * 2006-12-13 2008-07-24 Victor Co Of Japan Ltd 電子機器の制御方法及び制御装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010211001A (ja) * 2009-03-11 2010-09-24 Victor Co Of Japan Ltd 電子機器の制御方法及び電子機器の制御装置
JP2011061394A (ja) * 2009-09-09 2011-03-24 Victor Co Of Japan Ltd 電子機器およびその制御方法
US8762145B2 (en) 2009-11-06 2014-06-24 Kabushiki Kaisha Toshiba Voice recognition apparatus

Also Published As

Publication number Publication date
US8103504B2 (en) 2012-01-24
JP4985230B2 (ja) 2012-07-25
US20080052079A1 (en) 2008-02-28

Similar Documents

Publication Publication Date Title
JP5115058B2 (ja) 電子機器の制御装置及び電子機器の制御方法
JP4985230B2 (ja) 電子機器及びこれに用いる音声信号処理方法
US8401201B2 (en) Sound processing apparatus and method
US8917885B2 (en) Loop gain estimating apparatus and howling preventing apparatus
JP2008172766A (ja) 電子機器の制御方法及び制御装置
JP2008166897A5 (ja)
TW200514022A (en) Acoustic processing system, acoustic processing device, acoustic processing method, acoustic processing program, and storage medium
US8488825B2 (en) Hearing aid and hearing aid system
US10551973B2 (en) Method of controlling a mobile device
US20170168158A1 (en) Ultrasonic noise based sonar
JP2012027186A (ja) 音声信号処理装置、音声信号処理方法及びプログラム
US20230026347A1 (en) Methods for reducing error in environmental noise compensation systems
JP2015206974A (ja) 報知音感知装置、報知音感知方法及びプログラム
CN114207712A (zh) 多设备唤醒词检测
JP2019528526A5 (ja)
US9351089B1 (en) Audio tap detection
JP6072791B2 (ja) スイッチングのためのデジタルスイッチ信号シーケンス、デジタルスイッチ信号シーケンスをデジタルオーディオ情報信号に含めるための装置、および、スイッチ信号シーケンスを伴う情報信号を受信するための装置
CN100527185C (zh) 电子设备及其使用的声音信号处理方法
US9384641B2 (en) Glass breakage detection system and method
JP2008299477A (ja) 電子機器の制御方法、制御装置及び制御プログラム
JP5381256B2 (ja) ハウリング防止装置
WO2018077800A1 (en) Acoustic signaling
JP5083141B2 (ja) 電子機器の制御装置及び電子機器の制御方法
JP5168199B2 (ja) 電子機器の制御方法及び電子機器の制御装置
US12136432B2 (en) Methods for reducing error in environmental noise compensation systems

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100909

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20111012

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120403

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120416

R150 Certificate of patent or registration of utility model

Ref document number: 4985230

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3