JP2009031706A - 電子機器及びこれに用いる音声信号処理方法 - Google Patents
電子機器及びこれに用いる音声信号処理方法 Download PDFInfo
- Publication number
- JP2009031706A JP2009031706A JP2007219488A JP2007219488A JP2009031706A JP 2009031706 A JP2009031706 A JP 2009031706A JP 2007219488 A JP2007219488 A JP 2007219488A JP 2007219488 A JP2007219488 A JP 2007219488A JP 2009031706 A JP2009031706 A JP 2009031706A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- sound
- waveform
- applause
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims description 9
- 238000007493 shaping process Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims description 128
- 230000005236 sound signal Effects 0.000 claims description 112
- 238000006243 chemical reaction Methods 0.000 claims description 25
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 238000001514 detection method Methods 0.000 description 31
- 238000000034 method Methods 0.000 description 30
- 230000007257 malfunction Effects 0.000 description 18
- 238000005070 sampling Methods 0.000 description 14
- 230000015654 memory Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000011156 evaluation Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000002238 attenuated effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000000630 rising effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
【解決手段】電子機器は、電子機器から発生する第1の音声信号に基づく第1の音波を出力するスピーカ122と、第1の音波に、電子機器を制御するために発生させた音波が重畳した第2の音波を収音し、第2の音声信号を出力するマイク101を備える。第1の波形生成器125、126は、第1の音声信号に基づいて第1の波形信号を生成し、第2の波形生成器105、106は、第2の音声信号に基づいて第2の波形信号を生成する。波形整形器128は、第1の波形信号を時間軸方向に拡大した第3の波形信号を出力し、減算器130は第2の波形信号から第3の波形信号を減算する。
【選択図】図1
Description
この問題に対応するために、電子機器の電源がオンの時には拍手音による制御を禁止することもできるが、その場合拍手音で行える操作は、電源がオフの時の制御のみ、例えば電源オフから電源オンするだけに限られてしまい、活用の範囲が狭くなってしまい、この機能にとって大きな制約になる。
(a)電子機器から発生する第1の音声信号を電気−音響変換して出力するスピーカ(122)と、前記スピーカから発せられた前記第1の音声信号に基づく第1の音波に、前記電子機器を制御するために発生させた音波が重畳した第2の音波を収音して音響−電気変換して第2の音声信号を出力する収音器(101)と、前記第1の音声信号に所定の信号処理を施して第1の波形信号を生成する第1の波形生成器(125、126)と、前記収音器から出力された第2の音声信号に所定の信号処理を施して第2の波形信号を生成する第2の波形生成器(105、106)と、前記第1の波形信号を時間軸方向に拡大して第3の波形信号として出力する波形整形器(128)と、前記第2の波形信号から前記第3の波形信号を減算する減算器(130)とを備えることを特徴とする電子機器。
(b)前記第1の波形生成器は、前記第1の音声信号よりオフセット成分を除去した音声信号を生成する第1のオフセット成分除去部(105)と、前記第1のオフセット成分除去部から出力された音声信号を絶対値化して前記第1の波形信号を出力する第1の絶対値化回路(106)とを備え、前記第2の波形生成器は、前記第2の音声信号よりオフセット成分を除去した音声信号を生成する第2のオフセット成分除去部(125)と、前記第2のオフセット成分除去部から出力された音声信号を絶対値化して前記第2の波形信号を出力する第2の絶対値化回路(126)とを備えることを特徴とする(a)記載の電子機器。
(c)前記波形整形器は、前記第1の波形信号を所定の時間保持する複数の保持器(1521〜152N)と、前記複数の保持器から出力された複数の前記第1の波形信号の最大値を抽出し、抽出した前記複数の最大値を時系列的に合成して前記第3の波形信号を生成する抽出器(153)とを備えることを特徴とする(a)または(b)に記載の電子機器。
(d)電子機器から発生する第1の音声信号を電気−音響変換して第1の音声信号として出力する電気−音響変換ステップと、前記第1の音声信号に基づく第1の音波に、前記電子機器を制御するために発生させた音波が重畳した第2の音波を収音する収音ステップと、前記第2の音波を音響−電気変換して第2の音声信号を出力する音響−電気変換ステップと、前記第1の音声信号に所定の信号処理を施して第1の波形信号を生成する第1の波形生成ステップと、前記第2の音声信号に所定の信号処理を施して第2の波形信号を生成する第2の波形生成ステップと、前記第1の波形信号を時間軸方向に拡大して第3の波形信号として出力する波形整形ステップと、前記第2の波形信号から前記第3の波形信号を減算する減算ステップとを含むことを特徴とする音声信号処理方法。
(e)前記第1の波形生成ステップは、前記第1の音声信号よりオフセット成分を除去した音声信号を生成する第1のオフセット成分除去ステップと、前記第1のオフセット成分除去ステップで出力された音声信号を絶対値化して前記第1の波形信号を出力する第1の絶対値化ステップとを含み、前記第2の波形生成ステップは、前記第2の音声信号よりオフセット成分を除去した音声信号を生成する第2のオフセット成分除去ステップと、前記第2のオフセット成分除去ステップで出力された音声信号を絶対値化して前記第2の波形信号を出力する第2の絶対値化ステップとを含むことを特徴とする(d)記載の音声信号処理方法。
(f)複数の前記第1の波形信号をそれぞれ所定の時間保持する保持ステップと、前記複数の第1の波形信号の各最大値を抽出し、抽出した前記複数の最大値を時系列的に合成して前記第3の波形信号を生成する抽出ステップとを含むことを特徴とする(d)または(e)に記載の音声信号処理方法。
図1は本発明になる電子機器の第1の実施の形態を示すブロック図である。第1の実施の形態の電子機器は、例えばテレビであり、操作者により発生させられた互いに所定の時間間隔を設けた一連の音波(例えば拍手音)により制御される。
図1において電子機器は、操作者の拍手音を収音するマイクロフォン(以下、マイクと略す)101と、マイク101からのアナログ音声信号を増幅するアンプ102と、アンプ102から出力されたアナログ音声信号をディジタル音声信号に変換するA/Dコンバータ103と、A/Dコンバータ103から出力されたディジタル音声信号をソフトウェア処理により信号処理して拍手音を検出した後、本実施の形態特有の所定の判定処理を行って制御信号を生成して出力する中央処理装置(CPU)104とを備える。
更に、電子機器内の公知の音声検波回路からの音声信号(テレビデコード音)を増幅する本体アンプ121と、本体スピーカ122と、本体アンプ121からの音声信号を増幅するアンプ123と、アンプ123から出力されたアナログ音声信号をディジタル音声信号に変換するA/Dコンバータ124とを備える。
本体アンプ121は、電子機器から発生するテレビデコード音を増幅し、本体スピーカ122及びアンプ123へ供給する。本体スピーカ122は、供給された音声信号を電気−音響変換して電子機器の外部へ出力する。アンプ123は供給された音声信号を増幅し、A/Dコンバータ124へ供給する。A/Dコンバータ124は、アナログ音声信号をディジタル音声信号へ変換し、CPU104に供給する。
オフセット成分除去部105は、A/Dコンバータ103から供給されたディジタル音声信号よりオフセット成分を除去した音声信号を生成する。オフセット成分については後述する。絶対値化回路106は、オフセット成分除去部105から出力された音声信号を絶対値化する。オフセット成分除去部105及び絶対値化回路106は、マイク101から出力された音声信号に信号処理を施して、波形信号を生成する波形生成器である。
オフセット成分除去部105、125はそれぞれ同一構成である。例えば、入力されるディジタル音声信号に対して、低域フィルタ(LPF)で高周波数成分を減衰させた音声信号を生成し、減算器において入力されたディジタル音声信号から高周波数成分を減衰させた音声信号を差し引くことにより、ディジタル音声信号が有しているオフセット成分を取り除く。LPFは時定数を大きくしておくことで追従が遅くなり、入力されたディジタル音声信号のおおよその平均値を求めることで、無信号時のレベルを安定化させることができる。無信号時のレベルは、後段の絶対値化する際の基準レベルであるゼロレベルとなる。
エッジ信号抽出器108は、本体音除去回路107から出力された音声信号に基づいてエッジ信号を生成し、エッジパルス生成器109はエッジ信号に基づいてエッジパルスを生成する。なお、エッジ信号抽出器108は後述する理由から2入力である。
実際の波形信号は、図2のそれぞれの波形信号201〜204のように様々な周波数成分・振幅からなっているが、図示を簡単にするため以降は波形信号の包絡線で表すこととする。ただし、処理は実際の波形信号に対して施される。
波形信号203は、本体スピーカ122から発せられた音声信号(波形信号202)に基づく音波に電子機器を制御するために発生させた拍手音の音波が重畳したものである。波形信号203の音波に基づく音声信号をアンプ102で増幅すると、波形信号204となる。
ここでいう適したレベルとは、A/Dコンバータ103に入力される波形信号204のうち本体音成分に基づく波形信号の平均的な振幅と、A/Dコンバータ124に入力される波形信号201の平均的な振幅とが同程度であることを指す。
なお、本体アンプ121で増幅される前の音声信号をA/Dコンバータ124に供給してもよいが、本体スピーカ122から出力される波形信号の振幅と本体アンプ121で増幅される前の波形信号の振幅とが比例関係であること、すなわち音量制御後の音声信号であることが条件となる。この場合も既述したように適したレベルになるように増幅する必要がある。
図3において、本体音除去回路107は既述したように、絶対値化回路106から供給される波形信号301を受け取る遅延器129と、絶対値化回路126から供給される波形信号302を受け取る波形整形フィルタ128と、減算器130とコアリング処理部131とを備える。上記のとおり、波形信号301はマイク101で収音された音波に基づくものであり、波形信号302は電子機器から発せられた音波に基づくものである。
波形信号301に含まれる本体音成分と波形信号302とを一致させるには、上記した伝送特性を求める必要があるが、伝送特性は本体スピーカ122とマイク101の位置関係や周囲の環境によって左右される。また、伝送特性を動的に求めるには大規模な回路と処理量が必要となり、実際には困難である。
図4において幅広処理部151は、縦続接続された、各々遅延時間TADのN個の遅延器1521〜152Nと、遅延器1521〜152Nからの各出力信号とLPF150からの出力信号とから最大値を抽出する最大値抽出器153とからなる。幅広処理部151は、入力された信号のピーク値をN・TADの時間、保持するピークホールド回路を構成している。
最後に、波形信号404は乗算器154でk1倍され、波形整形フィルタ128の出力波形信号として出力される。乗算器154の出力波形信号が、図3の出力波形信号304に相当する。
エッジ信号抽出器108は、LPF141と、乗算器142と、減算器143とコアリング処理部144とを備える。第一の入力は減算器143に、第二の入力はLPF141に対する入力である。LPF141は、波形信号305の高周波数成分を減衰させた波形信号306を生成する。LPF141は、適切な遅延と波形を得ることが目的である。乗算器142は、波形信号306に定数値k2を乗算し、波形信号307を生成する。減算器143は、波形信号305から波形信号307を減算する。
コアリング処理部144は、減算器143から出力された波形信号に対してある閾値よりも小さい入力値に対する出力値を“0”とするコアリング処理を施し、波形信号308のような急峻なエッジのみを持つ波形信号を生成する。コアリング処理部144の閾値を、“0”ではなく、適切な正の値を設定することで、残っている小さなノイズ除去も可能となる。
図5に示す波形信号451は、図3の波形信号308を拡大したものであり、丸印は各サンプリングデータを示す。エッジパルス生成器109はサンプリングデータを保持するN個のメモリ(rm0〜rmN-1)からなるリングメモリ452を備える。
続いてt=Δtの時刻では、波形信号451におけるt=Δtのサンプリングデータがメモリrm1に上書きされ更新される。すなわち現在時刻t=Δtにおいて最も古い時点のサンプリングデータ(ここでは、t=−N・Δt)を記憶しているメモリに、現在時刻のサンプリングデータが記憶される。メモリのrm2からrm0まではt=0に記憶した値と同じ値を保持している。同様に、Δt毎にメモリは順次一つずつ更新され、現在時刻から過去N回分の値を参照することができる。
sum1−sum0>yth
を満たすとき、エッジ信号が入力されたとみなし、図3の波形信号309のような所定のパルス幅を有するエッジパルスを出力する。本実施形態では、係数を1/4として加重平均値を求めた。なお、古い順からx個のサンプリングデータを記録した時点と現時点の値も含めた新しい順からx個のサンプリングデータを記録した時点とは時間的な間(間隙)があるようにxを設定する。すなわち、x+x<Nの関係となるような値とする。
本実施の形態では、上記したように間隙を設けたが、古い順からx個のサンプリングデータを記録した時点と現時点の値も含めた新しい順からx個のサンプリングデータを記録した時点とが隣接するようにxを設定してもよい。このときは、x+x=Nの関係となる。
上記したythはエッジ検出の閾値であり、小さいほど拍手音を検出し易くなるが、周囲の雑音などでの誤検出も多くなる。一方で、ythが大きいほど誤検出は少なくなるが、拍手音も検出されにくくなる。そこで、拍手音を的確に検出でき、誤検出を極力少なくできるythを設定する。
図6において、電子機器を制御するために発生させる拍手音や拍手音に類似したノイズが未発生状態である期間がtsとなると、判定処理回路111は図6(C)に示す静寂フラグFsを生成する。静寂フラグFsが生成された後、マイク101がユーザにより発せられた第1の音波である拍手音を収音する。この第1の音波は、ユーザが電子機器を制御するために発生させようとする互いに所定の時間間隔を設けた一連の音波の、最初の音波である。エッジパルス生成器109は、図6(A)に示す第1の音波に対応した第1のエッジパルス501を生成する。判定処理回路111は、エッジパルス生成器109が第1のエッジパルス501を生成した第1の時点から、第1の所定の時間t1が経過した後に、一連の音波の2回目の音波である第2の音波が発生されたか否かを検出するための図6(B)に示す時間幅t2を有する2回目の拍手音用のゲート504を生成する。
続いてユーザがゲート505内で一連の音波の第3の音波を発生させる。エッジパルス生成器109は、図6(A)に示す第3の音波に対応した第3のエッジパルス503を生成する。判定処理回路111は、エッジパルス生成器109が第3のエッジパルス503を生成した第3の時点から、第3の所定の時間tIN+(t3/2)が経過した後に、マイク101への音波の入力が停止したことを示す無音フラグFNを生成する。また判定処理回路111は、無音フラグFNを生成したことによりマイク101への音波の入力が停止したことを確定する。
まず、判定処理部112の判定処理回路111は、図6(C)に示す静寂フラグFSがセットされているかどうか判定する。静寂フラグFSがセットされておらず、かつ、図6(A)に示すエッジパルスFPが“0”である状態から、カウンタ110がカウントを開始する。カウント値は、カウント開始時刻(t=0)から図6(I)に示すように増加し、判定処理回路111はカウント値が規定値に達するまでの一定期間tS、図6(A)に示すようにエッジパルスFPがセットされない状態(論理0の状態)が続くか否かを判定する。
エッジパルスFPがセットされない状態が一定期間tS続くと、判定処理回路111は静寂とみなして図6(C)に示すように静寂フラグFSがセットされる(論理1となる)。これによりカウンタ110の時刻tが“0”にリセットされ、一連の判定動作がスタートする。
1回目の拍手音に基づくエッジパルスFPが図6(A)に501で示すように入力されると、エッジパルスFPが“1”であると判定され、判定処理回路111は1回目の拍手音のフラグF1を図6(D)に示すようにセットして(論理“1”として)、1回目の拍手と判定する。カウンタ110は時刻tを再び“0”にセットして、エッジパルスFPの立ち上がりでカウンタ110は、図6(I)に示すように再びカウントを開始する。
つまり判定処理回路111は、2回目の拍手音に基づくエッジパルスFPの立ち上がり時点tが、図6(B)に示す時間幅t2を持つ2回目の拍手音用のゲート504(ゲートフラグFG)内であるかどうか判定し、ゲート504内であれば、図6(E)に示すように2回目の拍手音のフラグF2がセットされる。同時に、1回目の拍手音に基づくエッジパルスFPの立ち上がり時点から2回目の拍手音に基づくエッジパルスFPの立ち上がり時点tまでの値(時間)を、1回目の拍手音と2回目の拍手音のインターバル期間tINとして記憶し、カウンタ110は時刻tをt=0にリセットして再度カウントを始める。
つまり判定処理回路111は、3回目の拍手音に基づくエッジパルスFPの立ち上がり時点tが、図6(B)に示す時間幅t2より小なる時間幅t3を持つ3回目の拍手音用のゲート505(ゲートフラグFG)内であるかどうか判定し、ゲート505内であれば、図6(F)に示すように3回目の拍手音のフラグF3をセットする。さらに、3回目の拍手音のフラグF3がセットされた後、再度カウンタ110をt=0にリセットしてカウントを始める。なお、3回目の拍手音用のゲート505は、2回目の拍手音のフラグF2が立ち上がった時点からインターバル期間tINからt3/2の時間を減じた時間が経過した後立ち上がるようにセットする。
判定処理回路111は、無音フラグFNをセットし、マイク101への音波の入力が停止したことを確定する。
以上が、本実施の形態の判定処理部112の判定動作である。
同様に、3回目の拍手音に基づくエッジパルスFP(503)が入力されない状態が、tIN+(t3/2)の時間継続した場合は、入力失敗と判定して静寂フラグFSとインターバル期間tINと拍手音フラグF1、F2をリセットする。
また、3回目の拍手音のフラグF3をセットした後、tIN+(t3/2)の時間経過する前に、エッジパルスFPが入力されたときには、予め定めた拍手音の回数より多いので、やはり入力失敗と判定する。
図6では図示していないが、拍手音を発生させる回数を4回以上とした場合にも、4回目以降の第n(nは4以上の整数)の拍手音を検出するための第m(mは3以上の整数でnより1小さい数)のゲートを、既述した3回目の拍手音用ゲート505と同様に1または複数生成すればよい。第mのゲートは、3回目の拍手音用ゲート505と第nの拍手音が発生されたか否かを検出するための第mのゲートとにおける、隣接するゲートの間隔をインターバル期間tINから3回目の拍手音用ゲート505の時間幅t3の1/2の時間を減じた時間とするよう、それぞれ生成される。
また本実施形態では、2回目の拍手音用のゲート504の時間幅t2を比較的長く設定することで、ユーザの様々な拍手のペースに対応することができる。更に、インターバル期間tINを反映させることで、3回目以降の拍手音用のゲートの時間幅t3を時間幅t2より小さい幅とすることができる。インターバル期間tINによりユーザが拍手音を発生させる間隔が判定でき、より小さい時間幅t3であっても拍手音を充分に検出できるためである。時間幅t3を小さくできることで、意図せずに発してしまった拍手音や、不定期に飛び込んでくる周囲のノイズ等による誤動作を減らすことができる。
なお、静寂フラグFSまたは無音フラグFNのどちらか一方を含んだ判定条件、あるいは、いずれのフラグも含まない判定条件としてもよく、これらの場合判定処理部112の判定動作が簡易になる。
しかしながら静寂フラグFS及び無音フラグFNを判定条件とすると、ユーザは所定回数だけ拍手すれば、所定回数+2回分の判定が行われることになり、ユーザに拍手回数が増える負担を課すことなく、判定処理部112の判定動作はより誤動作の少ないものとなり好ましい。更に、周囲で発生する音等への耐性も、他の判定条件の場合より高くなり好ましい。
図7(A)、(C)のいずれの場合にも、1回目と2回目の拍手音のインターバル期間tINを、2回目の拍手音に対応した第2のエッジパルス702、709が発生した時点から3回目の拍手音用ゲート705、712を立ち上げるまでの期間に反映させるようにしているので、本実施の形態であれば、拍手の間隔のばらつきにも対応することができる。
ここまでは図6と同じであるが、図8(A)に803で示す3回目の拍手音に基づくエッジパルスFPが、図8(B)に示す3回目の拍手音用のゲート805の外でセットされている。
次に、本発明の第2の実施の形態について説明する。図9は本発明になる電子機器の第2の実施の形態の要部のブロック図を示す。同図中、図3と同一構成部分には同一符号を付し、その説明を省略する。
第1の実施の形態では、LPF141にコアリング処理部131から出力された波形信号305を供給していたが、第2の実施の形態では、エッジ信号抽出器108’のLPF141に遅延器129から出力された波形信号303を供給する。
そこで、第2の実施の形態では、前述したように、LPF141に供給される第二の入力を遅延器129から出力された波形信号303とすることで、このような状況を回避するようにしたものである。
波形信号303はLPF141により高域周波数成分が減衰された後、乗算器142で定数値k2を乗算され波形信号310となる。減算器143は、第一の入力側の波形信号305から波形信号310を減算し、コアリング処理部144はその波形信号をコアリング処理する。
拍手音により電子機器を制御するとき、周囲に拍手音以外に大きなノイズがある場合、拍手音が周囲の音に埋もれてしまい、検出ができなくなってしまう可能性がある。また、例えば大音量で音楽を聞いている場合などでは、その音楽の中で拍手音と似た音(振幅値や周波数帯域など)が鳴った場合、拍手音と認識してしまい、誤動作を起こす可能性もある。
ここでは、このような拍手音以外の周囲の音により、拍手による制御が困難となる、または誤動作につながる可能性がある状態を、騒音状態と呼ぶことにする。
拍手音はインパルス的な波形を示すので、ほぼ全ての周波数帯域にわたって信号成分を持っている。この特徴を利用して、入力された音を帯域フィルタで複数の帯域に分割し、それぞれに対して第1の実施の形態のような拍手音検出処理を行えば、拍手音とその他の音、例えばある特定の帯域にしか存在しない音との区別ができる。帯域の分割数が多いほど、区別の精度は上がる。ここでは、最も簡単な、帯域を2分割する例について説明する。
第3の実施の形態の電子機器は、図10に示すように帯域分割処理部161の後段に、高域成分絶対値化部162と低域成分絶対値化部163とを備え、帯域分割処理部164の後段に、高域成分絶対値化部165と低域成分絶対値化部166とを備える。更に、高域成分絶対値化部162、165の後段には高域成分本体音除去部167と高域成分拍手音検出処理部169とを備え、低域成分絶対値化部163、166の後段には低域成分本体音除去部168と低域成分拍手音検出処理部170とを備える。また、騒音状態検出部171と判定処理部172も備える。判定処理部172は、第1の実施の形態の判定処理部112と同様の構成である。
LPFは、オフセット成分除去部105、125でオフセット成分を除去した信号の低域周波数成分(以下、低域成分)を取り出して出力する。減算器は、LPFより出力された低域成分を、オフセット成分除去部105、125から出力されたオフセット成分を除去した信号から差し引く。従って減算器は、オフセット成分を除去した信号中の低域成分が減衰された、すなわち、高域フィルタ特性が付与された高域周波数成分(以下、高域成分)を出力する。
高域成分拍手音検出処理部169及び低域成分拍手音検出処理部170は、いずれも図1に示したエッジ信号抽出器108とエッジパルス生成器109とよりなる構成であり、その動作は既に説明したのでここではその説明を省略する。
(1)低域成分絶対値について適切な閾値を設定して低域成分のみで騒音状態を検出する。(2)高域成分絶対値について適切な閾値を設定して高域成分のみで騒音状態を検出する。(3)低域成分絶対値と高域成分絶対値のそれぞれについて適切な閾値を設定してそれぞれ騒音状態を検出し、どちらか一方又は両方が騒音状態として検出されるときに騒音状態と判定する(一方/両方にするかは判定の厳しさに反映される)。(4)低域成分と高域成分の騒音状態検出対象値(それぞれ絶対値化後の値)を加算又はある比率を掛け合わせたものを加算し(例えば、α×低域成分絶対値+β×高域成分絶対値)、この値に適切な閾値を設定して騒音状態を判定する。
図11(A)で加算と記した範囲では、閾値1003よりも大きい値が入力されているので、閾値1003との差分を変数sumに加算し、減算と記した範囲では、閾値1003よりも入力された値が小さいので、差分を変数sumより減算している。このときの変数sumを図11(B)で示す。
図12の例では、2回目の拍手に基づく高域エッジパルスFPHが検出できなかったが、低域エッジパルスFPLは全ての拍手に基づいたものが検出できた。ここでは評価の仕方として、1回目の拍手を全ての始まりとし、誤検出を避けることを重要視して、高域エッジパルスFPHと低域エッジパルスFPLの両方の論理積を1回目の拍手の演算結果として算出している。
また、全ての回数の拍手において演算内容を高域エッジパルスFPHと低域エッジパルスFPLの論理和としてエッジパルスの検出回数の総和を評価することも可能である。検出精度を向上させるか、誤認識に対する耐性を高めるかは、環境に応じて設定されることが好ましい。
次に、本発明の第4の実施の形態について説明する。第1の実施の形態では、ある決められた回数(第1の実施の形態では3回)のみの拍手音を判定する判定処理部112の制御方法(判定処理アルゴリズム)を示した。しかし、ある決められた回数のみについてしか判定できないと、この拍手音による電子機器制御を実際に用いる場合、電子機器の状態に応じて制御を変えたとしても、その時点では一種類の制御しかできないことになる。これは、本発明を用いるにあたり、大きな制約となってしまう。
数種類の拍手の回数を識別し、各回数に応じた制御動作をそれぞれ設定できれば、利用の幅も広がる。そこで、本実施の形態では、数種類の拍手回数を判定する制御方法を説明する。
一方で、図13(C)のT1及びT2の期間内(t<tIN+(t3/2))の間にエッジパルスFPが検出された場合、3回目の拍手の後、所定期間エッジパルスFPが検出されないという条件を満たしていないので、3回の拍手による制御は失敗となる。
ここで、図13(C)に示す各期間T1〜T3において4回目の拍手音に基づくエッジパルスFPが生成された場合をそれぞれ説明する。
ゲート1302内である期間T2、つまりt≧tIN−(t3/2)、かつ、t<tIN+(t3/2)の間に4回目の拍手音に基づくエッジパルスFPが生成されると、判定処理回路111は4回目の拍手音に基づく音波が発生されたことを検出する。4回目の拍手音に基づくエッジパルスFPが生成された時点tから、T3の期間であるtIN+(t3/2)が経過するまでエッジパルスFPが生成されないことが確認されると、4回の拍手の判定条件を満たし、4回の拍手による制御は成功となる。
本実施例のように3回または4回の拍手で制御する設定となっている場合には、既述したように3回の拍手の判定条件を満たしているため、3回の拍手による制御と判定される。
期間T1内でエッジパルスFPがセットされた場合、拍手回数が3回、4回のどちらの判定条件にも一致しないので、入力失敗となる。期間T2内でエッジパルスFPがセットされなければ3回の拍手と判定され、期間T2内でエッジパルスFPがセットされた場合は、3回の拍手である可能性はなくなる。更に期間T2内でエッジパルスFPがセットされ、期間T3内でエッジパルスFPがセットされなければ、4回の拍手と判定される。
図15(A)は電源オフ時、図15(B)は電源オン時のテレビ201をそれぞれ示している。テレビ201の正面上部にはマイク101が設けられており、正面下部には本体スピーカ122が設けられている。また、マイク101の隣には発光色が異なる複数の発光ダイオード(LED)からなるインジケータ202が設けられている。インジケータ202は、ユーザに対して、現在マイク101から入力されている音が、どのような状態かを示すものである。
しかし、本発明によれば、図15(A)の電源オフ時でも、図15(B)の電源オン時でも、本体音除去回路107や本体音除去部167、168により本体音が除去されるので、ユーザが電源のオン/オフの違いを意識する必要なく、同じように拍手音で制御ができる。
このように、拍手の回数毎に異なる制御ができるためには、図13及び図14と共に説明した第4の実施の形態の構成が必要であり、この実施の形態を適用することでテレビ視聴時にも本体音に影響されることなく、拍手音制御が可能である。
また、CPU104をソフトウェアで動作させて上記の各実施の形態を実現させるコンピュータプログラムも本発明に包含されるものである。このコンピュータプログラムは、記録媒体からコンピュータに取り込まれてもよいし、通信ネットワークを介して配信されてコンピュータにダウンロードされてもよい。
102、123 アンプ
103、124 A/Dコンバータ
104 中央処理装置(CPU)
105、125 オフセット成分除去部
106、126 絶対値化回路
107 本体音除去回路
108、108’ エッジ信号抽出器
109 エッジパルス生成器
110 カウンタ
111 判定処理回路
112 判定処理部
121 本体アンプ
122 本体スピーカ
128 波形整形フィルタ
129、1521〜152N 遅延器
130 減算器
131、144 コアリング処理部
141、150 低域フィルタ(LPF)
142、154 乗算器
151 幅広処理部
153 最大値抽出器
161、164 帯域分割処理部
162、165 高域成分絶対値化部
163、166 低域成分絶対値化部
167 高域成分本体音除去部
168 低域成分本体音除去部
169 高域成分拍手音検出処理部
170 低域成分拍手音検出処理部
171 騒音状態検出部
172 判定処理部
201 テレビ
Claims (6)
- 電子機器から発生する第1の音声信号を電気−音響変換して出力するスピーカと、
前記スピーカから発せられた前記第1の音声信号に基づく第1の音波に、前記電子機器を制御するために発生させた音波が重畳した第2の音波を収音して音響−電気変換して第2の音声信号を出力する収音器と、
前記第1の音声信号に所定の信号処理を施して第1の波形信号を生成する第1の波形生成器と、
前記収音器から出力された第2の音声信号に所定の信号処理を施して第2の波形信号を生成する第2の波形生成器と、
前記第1の波形信号を時間軸方向に拡大して第3の波形信号として出力する波形整形器と、
前記第2の波形信号から前記第3の波形信号を減算する減算器と
を備えることを特徴とする電子機器。 - 前記第1の波形生成器は、
前記第1の音声信号よりオフセット成分を除去した音声信号を生成する第1のオフセット成分除去部と、前記第1のオフセット成分除去部から出力された音声信号を絶対値化して前記第1の波形信号を出力する第1の絶対値化回路とを備え、
前記第2の波形生成器は、
前記第2の音声信号よりオフセット成分を除去した音声信号を生成する第2のオフセット成分除去部と、前記第2のオフセット成分除去部から出力された音声信号を絶対値化して前記第2の波形信号を出力する第2の絶対値化回路とを備える
ことを特徴とする請求項1記載の電子機器。 - 前記波形整形器は、
前記第1の波形信号を所定の時間保持する複数の保持器と、
前記複数の保持器から出力された複数の前記第1の波形信号の最大値を抽出し、抽出した前記複数の最大値を時系列的に合成して前記第3の波形信号を生成する抽出器とを備える
ことを特徴とする請求項1または2に記載の電子機器。 - 電子機器から発生する第1の音声信号を電気−音響変換して第1の音声信号として出力する電気−音響変換ステップと、
前記第1の音声信号に基づく第1の音波に、前記電子機器を制御するために発生させた音波が重畳した第2の音波を収音する収音ステップと、
前記第2の音波を音響−電気変換して第2の音声信号を出力する音響−電気変換ステップと、
前記第1の音声信号に所定の信号処理を施して第1の波形信号を生成する第1の波形生成ステップと、
前記第2の音声信号に所定の信号処理を施して第2の波形信号を生成する第2の波形生成ステップと、
前記第1の波形信号を時間軸方向に拡大して第3の波形信号として出力する波形整形ステップと、
前記第2の波形信号から前記第3の波形信号を減算する減算ステップと
を含むことを特徴とする音声信号処理方法。 - 前記第1の波形生成ステップは、
前記第1の音声信号よりオフセット成分を除去した音声信号を生成する第1のオフセット成分除去ステップと、前記第1のオフセット成分除去ステップで出力された音声信号を絶対値化して前記第1の波形信号を出力する第1の絶対値化ステップとを含み、
前記第2の波形生成ステップは、
前記第2の音声信号よりオフセット成分を除去した音声信号を生成する第2のオフセット成分除去ステップと、前記第2のオフセット成分除去ステップで出力された音声信号を絶対値化して前記第2の波形信号を出力する第2の絶対値化ステップとを含む
ことを特徴とする請求項4記載の音声信号処理方法。 - 複数の前記第1の波形信号をそれぞれ所定の時間保持する保持ステップと、
前記複数の第1の波形信号の各最大値を抽出し、抽出した前記複数の最大値を時系列的に合成して前記第3の波形信号を生成する抽出ステップとを含む
ことを特徴とする請求項4または5に記載の音声信号処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007219488A JP4985230B2 (ja) | 2006-08-28 | 2007-08-27 | 電子機器及びこれに用いる音声信号処理方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006230879 | 2006-08-28 | ||
JP2006230879 | 2006-08-28 | ||
JP2007173784 | 2007-07-02 | ||
JP2007173784 | 2007-07-02 | ||
JP2007219488A JP4985230B2 (ja) | 2006-08-28 | 2007-08-27 | 電子機器及びこれに用いる音声信号処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009031706A true JP2009031706A (ja) | 2009-02-12 |
JP4985230B2 JP4985230B2 (ja) | 2012-07-25 |
Family
ID=39197771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007219488A Active JP4985230B2 (ja) | 2006-08-28 | 2007-08-27 | 電子機器及びこれに用いる音声信号処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8103504B2 (ja) |
JP (1) | JP4985230B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010211001A (ja) * | 2009-03-11 | 2010-09-24 | Victor Co Of Japan Ltd | 電子機器の制御方法及び電子機器の制御装置 |
JP2011061394A (ja) * | 2009-09-09 | 2011-03-24 | Victor Co Of Japan Ltd | 電子機器およびその制御方法 |
US8762145B2 (en) | 2009-11-06 | 2014-06-24 | Kabushiki Kaisha Toshiba | Voice recognition apparatus |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5326934B2 (ja) * | 2009-01-23 | 2013-10-30 | 株式会社Jvcケンウッド | 電子機器 |
EP2214165A3 (en) * | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
KR20110065095A (ko) * | 2009-12-09 | 2011-06-15 | 삼성전자주식회사 | 디바이스를 제어하는 방법 및 그 장치 |
US9087520B1 (en) * | 2012-12-13 | 2015-07-21 | Rawles Llc | Altering audio based on non-speech commands |
US10091980B1 (en) * | 2015-06-05 | 2018-10-09 | Thomas Paul Cogley | Bed bug detector system |
US10736309B1 (en) * | 2018-11-27 | 2020-08-11 | Thomas Paul Cogley | Bed bug detector system |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62149000A (ja) * | 1985-12-23 | 1987-07-02 | 日本電気株式会社 | 音声分析装置 |
JPH03192239A (ja) * | 1989-09-26 | 1991-08-22 | Konica Corp | カメラ |
JPH096340A (ja) * | 1995-01-12 | 1997-01-10 | Blue Chip Music Gmbh | 音の開始と終わりを認識するための方法及び装置 |
JPH10223103A (ja) * | 1997-02-12 | 1998-08-21 | Mitsubishi Electric Corp | 電気機器の遠隔オン/オフ制御方法及び装置 |
JP2007140102A (ja) * | 2005-11-18 | 2007-06-07 | Alpine Electronics Inc | 音声補正システムおよびこれに用いる適応フィルタ |
JP2008172766A (ja) * | 2006-12-13 | 2008-07-24 | Victor Co Of Japan Ltd | 電子機器の制御方法及び制御装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS54131921A (en) * | 1978-04-03 | 1979-10-13 | Keio Giken Kogyo Kk | Electronic keyboard instrument |
JPS599699A (ja) * | 1982-07-07 | 1984-01-19 | 日産自動車株式会社 | 自動車の車室内音場制御装置 |
JPH0354989A (ja) | 1989-07-24 | 1991-03-08 | Matsushita Electric Ind Co Ltd | リモコン装置 |
JPH03184497A (ja) | 1989-12-13 | 1991-08-12 | Matsushita Electric Ind Co Ltd | リモコン装置 |
JP2877265B2 (ja) | 1991-08-01 | 1999-03-31 | 三菱重工業株式会社 | 排水処理設備 |
JPH06318424A (ja) | 1993-03-12 | 1994-11-15 | Kitagawa Ind Co Ltd | 音感知作動スイッチと該スイッチを応用した非常用電灯及びリモコンホルダ |
US6737572B1 (en) * | 1999-05-20 | 2004-05-18 | Alto Research, Llc | Voice controlled electronic musical instrument |
US20040203697A1 (en) * | 2002-08-22 | 2004-10-14 | James Finn | Ultra wideband remote control system and method |
-
2007
- 2007-08-24 US US11/892,577 patent/US8103504B2/en active Active
- 2007-08-27 JP JP2007219488A patent/JP4985230B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62149000A (ja) * | 1985-12-23 | 1987-07-02 | 日本電気株式会社 | 音声分析装置 |
JPH03192239A (ja) * | 1989-09-26 | 1991-08-22 | Konica Corp | カメラ |
JPH096340A (ja) * | 1995-01-12 | 1997-01-10 | Blue Chip Music Gmbh | 音の開始と終わりを認識するための方法及び装置 |
JPH10223103A (ja) * | 1997-02-12 | 1998-08-21 | Mitsubishi Electric Corp | 電気機器の遠隔オン/オフ制御方法及び装置 |
JP2007140102A (ja) * | 2005-11-18 | 2007-06-07 | Alpine Electronics Inc | 音声補正システムおよびこれに用いる適応フィルタ |
JP2008172766A (ja) * | 2006-12-13 | 2008-07-24 | Victor Co Of Japan Ltd | 電子機器の制御方法及び制御装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010211001A (ja) * | 2009-03-11 | 2010-09-24 | Victor Co Of Japan Ltd | 電子機器の制御方法及び電子機器の制御装置 |
JP2011061394A (ja) * | 2009-09-09 | 2011-03-24 | Victor Co Of Japan Ltd | 電子機器およびその制御方法 |
US8762145B2 (en) | 2009-11-06 | 2014-06-24 | Kabushiki Kaisha Toshiba | Voice recognition apparatus |
Also Published As
Publication number | Publication date |
---|---|
US8103504B2 (en) | 2012-01-24 |
JP4985230B2 (ja) | 2012-07-25 |
US20080052079A1 (en) | 2008-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5115058B2 (ja) | 電子機器の制御装置及び電子機器の制御方法 | |
JP4985230B2 (ja) | 電子機器及びこれに用いる音声信号処理方法 | |
US8401201B2 (en) | Sound processing apparatus and method | |
US8917885B2 (en) | Loop gain estimating apparatus and howling preventing apparatus | |
JP2008172766A (ja) | 電子機器の制御方法及び制御装置 | |
JP2008166897A5 (ja) | ||
TW200514022A (en) | Acoustic processing system, acoustic processing device, acoustic processing method, acoustic processing program, and storage medium | |
US8488825B2 (en) | Hearing aid and hearing aid system | |
US10551973B2 (en) | Method of controlling a mobile device | |
US20170168158A1 (en) | Ultrasonic noise based sonar | |
JP2012027186A (ja) | 音声信号処理装置、音声信号処理方法及びプログラム | |
US20230026347A1 (en) | Methods for reducing error in environmental noise compensation systems | |
JP2015206974A (ja) | 報知音感知装置、報知音感知方法及びプログラム | |
CN114207712A (zh) | 多设备唤醒词检测 | |
JP2019528526A5 (ja) | ||
US9351089B1 (en) | Audio tap detection | |
JP6072791B2 (ja) | スイッチングのためのデジタルスイッチ信号シーケンス、デジタルスイッチ信号シーケンスをデジタルオーディオ情報信号に含めるための装置、および、スイッチ信号シーケンスを伴う情報信号を受信するための装置 | |
CN100527185C (zh) | 电子设备及其使用的声音信号处理方法 | |
US9384641B2 (en) | Glass breakage detection system and method | |
JP2008299477A (ja) | 電子機器の制御方法、制御装置及び制御プログラム | |
JP5381256B2 (ja) | ハウリング防止装置 | |
WO2018077800A1 (en) | Acoustic signaling | |
JP5083141B2 (ja) | 電子機器の制御装置及び電子機器の制御方法 | |
JP5168199B2 (ja) | 電子機器の制御方法及び電子機器の制御装置 | |
US12136432B2 (en) | Methods for reducing error in environmental noise compensation systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100909 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20111012 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120302 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120403 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120416 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4985230 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150511 Year of fee payment: 3 |