JP2010193426A

JP2010193426A - 電子機器

Info

Publication number: JP2010193426A
Application number: JP2009194922A
Authority: JP
Inventors: Masahiro Kitaura; 正博北浦
Original assignee: Victor Company of Japan Ltd
Current assignee: Victor Company of Japan Ltd
Priority date: 2009-01-23
Filing date: 2009-08-26
Publication date: 2010-09-02
Anticipated expiration: 2029-08-26
Also published as: EP2211337B1; EP2211337A1; US8189430B2; US20100188929A1; JP5326934B2

Abstract

【課題】音を用いて電子機器を操作する新たな手法により、電子機器の様々な機能を遠隔から操作することが可能となる。
【解決手段】本発明のテレビジョン受像機１００は、入力された音波を音声信号に変換する２以上の集音部１１４と、音声信号が入力されると、２以上の集音部への音波到達時刻に基づいて、テレビジョン受像機１００に対する音声信号の音源の方向を特定し、その方向に対応した角度を導出する音源導出部１７８と、音源導出部が導出した第１の音波の音源の角度を基準角度として記憶部１０４に記憶させ、記憶部が基準角度を記憶している状態で音源導出部が導出した第２の音波の音源の基準角度からの相対角度を導出する相対導出部１８０と、相対導出部が導出した相対角度に応じて自機を制御する操作制御部１８２と、を備えることを特徴とする。
【選択図】図３

Description

本発明は、リモートコントローラを用いずとも遠隔から操作可能な電子機器に関する。

従来、テレビジョン受像機やオーディオ機器、エアコンなどの電子機器を操作する場合、ユーザは、本体に設けられた操作ボタンを直接操作していた。しかし、電子機器がユーザから遠くにある場合、ユーザは、わざわざ電子機器本体まで近づかなければならず、非常に面倒であった。そこで、電子機器とは別体のリモートコントローラ（以下、単にリモコンと称する）が装備されるようになり、ユーザは電子機器本体から離れていても電子機器を操作することができるようになった。

上述したように、一度リモコンを介して操作を行えばその後ユーザは移動せずとも電子機器を操作できる。しかし、リモコンがユーザの近くにない場合、ユーザはリモコンのある場所まで移動しなければならない。従って、リモコンとの距離によっては電子機器本体以上の移動を要し、例えば電源投入のみといった所望する操作量に拘わらずユーザに煩わしさを感じさせてしまうおそれがあった。また、リモコンは比較的小型であるため、どこに置いてあるか分からなくなる場合があり、この場合ユーザがリモコンを探さなければ操作ができないといった状況も起こり得る。

そこで、リモコンのような遠隔操作装置を使わずに人間が発することのできる音でテレビジョン装置を操作する提案がなされている（例えば、特許文献１）。

特開２００６−３２４９５２号公報

上述した音で電子機器を操作する技術は、ユーザが発する音声でユーザの位置を特定し、特定した位置に、テレビジョン装置のディスプレイを向けることができる。しかし、近年の高機能化に伴いリモコンで操作可能な機能は多種多様に亘るため、上述した技術を利用してディスプレイの方向は変えることができてもリモコンの代役を果たすことはできない。従って、ユーザがリモコンの代替として音を利用して電子機器を操作する場合、電子機器に対して複数の操作をそれぞれ実行できることが好ましい。

このためには、音を発生させる回数やパターンを変化させることが考えられるが、複数の操作を実行するにはこれらを組み合わせるだけでは足りない虞がある。従って、ユーザの操作性向上および複数の操作を実現するための操作の多様化を目的とした音を用いた新たな操作手法が求められる。

そこで本発明は、音を用いて電子機器を操作する新たな手法により、電子機器の様々な機能を遠隔から操作することができ、操作性に優れた電子機器を提供することを目的とする。

上記課題を解決するために、本発明の電子機器の代表的な構成は、音波を用いて制御する電子機器において、入力された音波を音声信号に変換する２以上の集音部と、音声信号が入力されると、２以上の集音部への音波到達時刻に基づいて、電子機器に対する音波の音源の方向を特定し、その方向に対応した角度を導出する音源導出部と、音源導出部が導出した第１の音波の音源の角度を基準角度として記憶部に記憶させ、記憶部が基準角度を記憶している状態で音源導出部が導出した第２の音波の音源の基準角度からの相対角度を導出する相対導出部と、相対導出部が導出した相対角度に応じて電子機器を制御する操作制御部と、である。

本発明では、少なくとも２つ集音部を備える構成により、電子機器に対する音波の音源の方向を特定し、その方向に対応した角度を確実に導出することができる。また、所定の基準設定期間内、例えば電源投入時に入力された第１の音波の音源の角度を基準角度として記憶させ、基準角度を記憶している状態で入力された第２の音波の音源の角度を、基準角度からの相対角度として導出することで、相対導出部は、ユーザが最初に音を発生させた角度（基準角度）を基準として、それ以降に音を発生させた角度を相対的に導出することが可能となる。そして、操作制御部が、導出された相対角度に応じて自機を制御する構成により、ユーザは、音を発生する角度を手元で変えるだけで電子機器の様々な機能を実行することができる。

上記操作制御部は、相対導出部が導出した相対角度が、基準角度を基準とした複数の範囲のいずれに含まれるかを判断し、範囲に応じて電子機器を制御してもよい。

これにより、操作制御部は、排他的な複数の範囲に応じて複数の機能を実行させることができ、ユーザに複数の機能を選択させることが可能となる。

上記操作制御部は、相対導出部が導出した相対角度が、基準角度を基準とした有効範囲内であれば、電子機器を制御してもよい。

自機を制御可能な範囲を、基準角度を基準とした有効範囲に制限する構成により、有効範囲外で発生した音の誤認識による電子機器の誤作動を防止することが可能となる。

上記課題を解決するために、本発明の電子機器の他の代表的な構成は、音波を用いて制御する電子機器において、入力された音波を音声信号に変換する３以上の集音部と、音声信号が入力されると、３以上の集音部への音波到達時刻に基づいて、電子機器に対する音声信号の音源の位置を導出する音源導出部と、音源導出部が導出した第１の音波の音源の位置を基準位置として記憶部に記憶させ、記憶部が基準位置を記憶している状態で音源導出部が導出した第２の音波の音源の基準位置からの相対位置を導出する相対導出部と、相対導出部が導出した相対位置に応じて電子機器を制御する操作制御部と、である。

本発明では、少なくとも３つ集音部を備える構成により、電子機器に対する音波の音源の位置を確実に導出することができる。また、所定の基準設定期間内、例えば電源投入時に入力された第１の音波の音源の位置を基準位置として記憶し、基準位置を記憶している状態で入力された第２の音波の音源の位置を、基準位置からの相対位置として導出することで、相対導出部は、ユーザが最初に音を発生させた位置（基準位置）を基準として、それ以降に音を発生させた位置を相対的に導出することが可能となる。そして、操作制御部が、導出された相対位置に応じて自機を制御する構成により、ユーザは、音を発生させる位置を手元で変えるだけで電子機器の様々な機能を実行することができる。

上記操作制御部は、相対導出部が導出した相対位置が、基準位置を基準とした複数の範囲のいずれに含まれるかを判断し、範囲に応じて電子機器を制御してもよい。

これにより、操作制御部は、排他的な複数の範囲の数に応じて、複数の機能を実行させることができ、ユーザに複数の機能を選択させることが可能となる。

上記操作制御部は、相対導出部が導出した相対位置が、基準位置を基準とした有効範囲内であれば、電子機器を制御してもよい。

基準位置を基準として有効に自機を制御可能な有効範囲を制限する構成により、範囲外で発生した音の誤認識による電子機器の誤作動を防止することが可能となる。

上記有効範囲は、基準位置の角度換算値より小さい第１所定角度以上、基準位置の角度換算値より大きい第２所定角度以下、かつ、基準位置と当該電子機器との距離より大きい第１所定距離以下の範囲であってもよい。

有効範囲を、角度（画面の垂線からの角度）と距離（画面からの距離）、ここでは基準位置の角度換算値より小さい第１所定角度以上、基準位置の角度換算値より大きい第２所定角度以下、かつ、基準位置と当該電子機器との距離より大きい第１所定距離以下の範囲に制限することにより、音の誤認識を高精度で回避することができる。

上記有効範囲は、基準位置を中心とした所定半径内の範囲であってもよい。

自機を制御可能な有効範囲を、基準位置を中心とした所定半径内の範囲とする構成により、ユーザに有効範囲を認識させやすく、より利便性を向上することができる。

当該電子機器は、モニタと、音声信号を生成すべき角度または位置と操作制御部の制御内容とを関連付けてモニタに表示する内容表示制御部と、相対導出部が導出した相対角度または相対位置をモニタに表示する相対表示制御部と、をさらに備えてもよい。

内容表示制御部を備える構成により、ユーザが所望する制御を実行するために生成すべき音声信号の角度または位置をユーザに視認させることができる。また相対表示制御部を備える構成により、ユーザが発生させた音源の角度または位置をユーザに視覚を通じて報知することが可能となる。従って、ユーザは、所望する制御を実行するために生成すべき音声信号の角度または位置と、自身が発生させた音の角度または位置との隔たりを確実に視認することが可能となり、音声信号を生成すべき角度または位置の校正をユーザに促すことができる。

当該電子機器は、スピーカと、音声信号を生成すべき角度または位置と操作制御部の制御内容とを関連付けてスピーカから出力する内容出力制御部と、相対導出部が導出した相対角度または相対位置をスピーカを通じて音像定位する相対定位制御部と、をさらに備えてもよい。

内容出力制御部を備える構成により、ユーザが所望する制御を実行するために生成すべき音声信号の角度または位置を音をもってユーザに報知することができる。また相対定位制御部を備える構成により、ユーザが発生させた音源の角度または位置をユーザに聴覚を通じて報知することが可能となる。従って、ユーザは、所望する制御を実行するために生成すべき音声信号の角度または位置と、自身が発生させた音の角度または位置との隔たりを確実に把握することが可能となり、音声信号を生成すべき角度または位置の校正をユーザに促すことができる。

以上説明したように本発明にかかる電子機器は、音を用いて電子機器を操作する新たな手法により、電子機器の様々な機能を遠隔から操作することが可能となる。

第１の実施形態にかかる電子機器としてのテレビジョン受像機の使用形態図である。集音部に入力された音波の音源の方向を特定し、その方向に対応した角度を導出する方法を説明するための説明図である。第１の実施形態にかかるテレビジョン受像機のハードウェア構成を示した機能ブロック図である。第１の実施形態にかかる音声処理部のハードウェア構成を示した機能ブロック図である。第１の実施形態にかかる判定処理部のハードウェア構成を示した機能ブロック図である。判定処理部の判定処理アルゴリズムを説明するためのタイミングチャートである。判定処理部の判定処理アルゴリズムを説明するためのタイミングチャートである。判定処理部の判定処理アルゴリズムを説明するためのタイミングチャートである。時間差分算出部の回路系統図である。音源導出部が算出する角度θについてまとめた図である。第１の実施形態で用いた式をシュミレーションした図である。第１の実施形態にかかるテレビジョン受像機の拍手音による操作を説明するための説明図である。選択アップダウンモードにおける制御内容の実行を説明するための説明図である。「チャンネル」が選択された以降の制御内容の実行を説明するための説明図である。相対表示制御部によるモニタの表示を説明するための説明図である。第２の実施形態にかかるテレビジョン受像機の概略的なハードウェア構成を示した機能ブロック図である。第２の実施形態にかかる音源導出部が集音部に入力された音波の音源の位置を導出する方法を説明するための説明図である。オフセットを加味して式（５）をシミュレーションした図である。第２の実施形態にかかる音源の位置の特定を説明するための説明図である。第２の実施形態にかかる有効範囲の設定方法の例を説明するための説明図である。第２の実施形態にかかる選択アップダウンモードにおける制御内容の実行を説明するための説明図である。集音部を８つ有するテレビジョン受像機について説明するための説明図である。

以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書および図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。

(第１の実施形態)
図１は、本実施形態にかかる電子機器としてのテレビジョン受像機１００の使用形態図であり、特に図１（ａ）は、本実施形態にかかるテレビジョン受像機１００を、図１（ｂ）は、従来のテレビジョン受像機１０を示す。ここでは、電子機器としてテレビジョン受像機１００を挙げて説明するが、パーソナルコンピュータ、音楽プレイヤー、カーナビゲーション、ゲーム機器、ＤＶＤプレイヤー等、モニタを有する様々な電子機器を用いることができる。

図１（ｂ）に示すように、従来のテレビジョン受像機１０は、ユーザ（視聴者）によるリモコン１４への操作入力に応じて遠隔制御される。しかし、リモコン１４がユーザの近くにない場合、ユーザはリモコン１４のある場所まで移動しなければならない。従って、ユーザは、リモコン１４との距離によってはテレビジョン受像機１０本体との距離以上の移動を要し、所望する操作量に拘わらずユーザに煩わしさを感じさせてしまうおそれがあった。

一方、図１（ａ）に示すように、本実施形態にかかるテレビジョン受像機１００は、図１（ｂ）に示すリモコン１４を利用せずとも、ユーザが発する拍手音等に基づいて、電源のオン／オフ（ＯＮ／ＯＦＦ）やメニュー機能の表示、メニュー機能の選択等の様々な機能を遠隔から操作することができる。

第１の実施形態のテレビジョン受像機１００は、音源のテレビジョン受像機１００に対する角度を算出するために左右両端に集音部１１４ａ、１１４ｂを備えている。ここでは、まず、ユーザが拍手を遂行した場合の、テレビジョン受像機１００に対する拍手音の音源の方向（角度）を特定する原理を説明する。

図２は、集音部１１４ａ、１１４ｂに入力された音波の音源の方向を特定し、その方向に対応した角度を導出する方法を説明するための説明図である。図２中、ユーザが音（本実施形態では拍手音）を発生させる位置、即ち集音部１１４に入力される音波の音源の位置を黒丸Ｐで示す。

テレビジョン受像機１００に入力される音波の音源の角度（到来の角度）の算出方法においては、テレビジョン受像機１００の通常の視認距離が画面高の３倍から５倍程度である事と、上記音源の角度の算出精度とのバランスを鑑みると、到来する拍手音を点Ｐから発せられる平面波として近似することができる。拍手音を平面波とした場合、拍手音の音源である点Ｐからテレビジョン受像機１００の中心点Ｄ（図２中白丸で示す）へ向かう平面波は、第１の集音部１１４ａの点Ｂに到達するとき、線分ＰＤに直交した線分ＢＣの点Ｃに到達する。

音源である点Ｐからの拍手音は厳密には球面波であり、図２ではＢ点とＣ点を通過する円弧（図２中破線で示す）を描くことになる。上記の平面波で近似した場合と球面波とした場合の誤差は、第２の集音部１１４ｂの位置を点Ａとし、Ｂ点とＣ点を通過する球面波線と線分ＡＰとの交点をＥ点としたときの、線分ＡＣと線分ＡＥとの僅かな差となる。この差は本実施形態で求められる精度では無視することが可能な程度の差なので、平面波による近似で十分な精度を確保できる。従って、拍手音を、点Ｐを含む線分から発せられる平面波として近似した場合、線分ＡＣの距離ｄｄが集音部１１４ａと集音部１１４ｂとの間に対する平面波の到達距離差となり、２つの集音部１１４ａ、１１４ｂがそれぞれ集音した音声信号から距離ｄｄに相当する時間差が得られ、拍手音の音源の角度を以下のようにして算出することができる。

時刻をｔとして、第１の集音部１１４ａから得られる拍手音の受信信号をｓ_１（ｔ）、第２の集音部１１４ｂに得られる受信信号をｓ_２（ｔ）、集音部１１４間の拍手音の音波到達時間差をｔ_ｄｄとすると、これらは、式（１）の関係を有する。
ｓ_２（ｔ）＝ｓ_１（ｔ−ｔ_ｄｄ）式（１）

ここで、音速をｃ、集音部１１４ａと集音部１１４ｂとの距離をｍｄ、拍手音（音源）Ｐの垂線からの角度をθとすると、式（２）の関係が生じる。
ｔ_ｄｄ＝ｍｄ・sinθ／ｃ式（２）
従って、ユーザが発する拍手音の音源の方向に対応した角度θは、式（３）から算出できる。
θ＝ａｒｃｓｉｎ(ｔ_ｄｄ・ｃ／ｍｄ) 式（３）

ここで、ｍｄは例えば、４２インチのテレビジョン受像機１００で約１００ｃｍとなり、音速ｃは約３４０ｍ／ｓである。従って、テレビジョン受像機１００では、音波到達時間差ｔ_ｄｄを計測すればユーザが発する拍手音の音源の方向に対応した角度θを求めることができる。

以下に本実施形態にかかる電子機器としてのテレビジョン受像機１００の具体的な構成について詳述する。

（テレビジョン受像機１００）
図３は、本実施形態にかかるテレビジョン受像機１００のハードウェア構成を示した機能ブロック図である。図３に示すように、テレビジョン受像機１００は、システム制御部１０２と、記憶部１０４と、アンテナ１０６と、番組受信部１０８と、モニタ１１０と、２つのスピーカ１１２（図３中１１２ａ、１１２ｂで示す）と、２つの集音部１１４（図３中１１４ａ、１１４ｂで示す）と、本体アンプ１１６と、出力アンプ１１８と、集音アンプ１２０（図３中１２０ａ、１２０ｂで示す）と、音声処理部１５０と、グラフィックス生成部１２２と、映像混合部１２４と、音生成部１２６と、音声混合部１２８と、を含んで構成される。

システム制御部１０２は、中央処理装置（ＣＰＵ）を含む半導体集積回路によりテレビジョン受像機１００全体を管理および制御する。記憶部１０４は、ＲＯＭ、ＲＡＭ、ＥＥＰＲＯＭ、不揮発性ＲＡＭ、フラッシュメモリ、ＨＤＤ等で構成され、システム制御部１０２で処理されるプログラム等を記憶する。また、本実施形態において記憶部１０４は、後述する相対導出部１８０が導出した基準角度を記憶する。

番組受信部１０８は、チューナ等で構成され、例えば放送局１４０からの放送電波（圧縮されたＲＦ信号）を、アンテナ１０６や有線ケーブル（図示せず）を通じて受信し、さらにデコード（復調）する。そして、番組受信部１０８は、後述する集音部１１４へのユーザによる拍手音の入力に応じてその放送電波から任意のチャンネルを選択する。

モニタ１１０は、映像混合部１２４が出力した映像信号に基づいて、番組受信部１０８で受信した放送電波、メニュー画像等を表示する。

スピーカ１１２は、テレビジョン受像機１００の両端に設けられ、音声混合部１２８が出力した音声信号に基づいて、番組受信部１０８で受信した放送電波の音声信号や、操作音、アラーム音等を出力する。

集音部１１４は、マイク等の音認識手段で構成され、入力された音波を、後述する音声処理部１５０内で処理可能な音声信号に変換し集音アンプ１２０に出力する。本実施形態において集音部１１４は、テレビジョン受像機１００の両端にそれぞれ設けられており、例えばモニタ１１０のサイズが約４２インチである場合には２つの集音部１１４ａと集音部１１４ｂとの距離は約１００ｃｍとなり、モニタ１１０のサイズが約２６インチである場合、約６０ｃｍとなる。ここで、音声信号は、人間が意思を伝達するために口から発する音だけでなく、拍手音、叩音、破裂音等の音を含む。上述したように本実施形態では特に拍手音を挙げて説明する。ユーザがモニタ１１０の正面側に位置するとき、集音部１１４ａはモニタ１１０に向かって左端に、集音部１１４ｂは右端に設置される。以下の説明に用いられる左、右は、特に記載がない場合、モニタ１１０に向かって右側を右、左側を左とする。

集音アンプ１２０は、集音部１１４ごとに設けられ、集音部１１４が変換した音声信号を増幅して音声処理部１５０に出力する。

音声処理部１５０は、集音アンプ１２０から入力された音声信号に基づいて、音声信号の音源のテレビジョン受像機１００に対する角度を特定する。

図４は、本実施形態にかかる音声処理部１５０のハードウェア構成を示した機能ブロック図である。図４に示すように、集音部１１４ａ、１１４ｂに入力された音波は音声信号に変換され（音響―電気変換）、集音アンプ１２０ａ、１２０ｂで所定の振幅まで増幅された後、Ａ／Ｄコンバータ１５２ａ、１５２ｂに入力されアナログ信号からデジタル信号に変換される。Ａ／Ｄコンバータ１５２ａ、１５２ｂでデジタル化された音声信号は、ソフトウェア処理またはハードウェア処理にて以降の機能ブロックの内容に添って信号処理されるが、ここではその処理手法を限定せず、既存の様々な方法を適用可能とすることができる。

図４中、波形＃１に示すように、Ａ／Ｄコンバータ１５２ａ、１５２ｂで得られるデジタル信号は、Ａ／Ｄコンバータ１５２のダイナミックレンジ（図４中ＤＲで示す）内であって、無音時のレベルのオフセット成分（図４中ＯＳで示す）に相当する振幅を中心にした波形である。実際の拍手音の波形は、複雑な信号成分とその包絡線として捉えられるデジタル音声信号となる。音の信号の波形は本来様々な周波数成分を含んでいるが、本実施形態では、処理負荷を軽減するため、拍手音の波形を構成する信号成分から得られる包絡線信号を用いている。以下の説明では、実際の波形の包絡線を用いて説明する。

Ａ／Ｄコンバータ１５２ａ、１５２ｂから出力されたデジタル音声信号は、オフセット成分除去部１５４ａ、１５４ｂにおける所定のハイパスフィルタを通じてオフセット成分が除去された後、絶対値化回路１５６ａ、１５６ｂにより絶対値化される。こうして波形＃２が得られる。

一方、図３におけるアンテナ１０６から受信された放送電波の音声信号は、番組受信部１０８において復調され、さらに本体アンプ１１６において増幅されて、スピーカ１１２で音波に変換（電気−音響変換）される。このとき、スピーカ１１２から空間に放射された音波は、回り込んで集音部１１４ａ、１１４ｂに入力される。つまり、絶対値化回路１５６ａ、１５６ｂで得られた図４の波形＃２は、集音部１１４ａ、１１４ｂで捉えられる拍手音とスピーカ１１２から出力された音波との混合波となる。

そこで、本体音除去部１５８ａ、１５８ｂは、絶対値化回路１５６ａ、１５６ｂの出力信号から、本体アンプ１１６の出力信号を減算し、スピーカ１１２から出力された音波に相当する信号を除去する。本体アンプ１１６の出力信号は、出力アンプ１１８、Ａ／Ｄコンバータ１５２ｃ、オフセット成分除去部１５４ｃ、絶対値化回路１５６ｃを介して本体音除去部１５８ａ、１５８ｂにフィードバックされる。

絶対値化回路１５６ｃの出力信号は、例えば図４中波形＃３で示すものとなり、波形＃２から拍手音の波形を除いた波形に近いものとなる。本体音除去部１５８ａ、１５８ｂは波形＃２から波形＃３を減算することにより、スピーカ１１２から回り込んで集音部１１４ａ、１１４ｂに入力される音波を除去することができる。本実施形態では、本体音除去部１５８ａ、１５８ｂは、波形＃２から、スピーカ１１２から集音部１１４ａ、１１４ｂまでの空間を伝わってくる伝送路の特性を考慮して整形された波形＃３を、本体音除去部１５８ａ、１５８ｂが減算する。図４の波形＃２は、一方の集音部１１４ａからの音声信号伝送系における絶対値化回路１５６ａの出力波形を示しているが、絶対値化回路１５６ｂの出力波形も同様の軌跡で表される。

本体音除去部１５８ａ、１５８ｂから出力された音声信号には、まだ拍手音以外の音や除去しきれなかった微少な放送電波の音声信号が混入しているが、拍手音はインパルス性が高い音なのでエネルギーが大きく、またその周波数成分は可聴周波数帯域全域に亘っているため、エッジ成分を捉えることで、拍手音を他の信号成分と区別することができる。エッジ信号抽出部１６０ａ、１６０ｂは、本体音除去部１５８ａ、１５８ｂから出力された音声信号からエッジ成分を抽出し、その出力として波形＃４に示すようなエッジ信号を得る。

エッジパルス生成部１６２ａ、１６２ｂは、波形＃４のエッジ信号をトリガとして、所定幅（所定長）のエッジパルス（図４中、波形＃５で示す）を生成し、それを拍手音の検出信号、即ちエッジパルスであるエッジ検出フラグＦｐ１、Ｆｐ２として判定処理部１６８へ出力する。本実施形態では、テレビジョン受像機１００に向かって左端に配置された集音部１１４ａに入力された拍手音のエッジ検出フラグをＦｐ１とし、テレビジョン受像機１００に向かって右端に配置された集音部１１４ｂに入力された拍手音のエッジ検出フラグをＦｐ２とする。

騒音状態検出部１６４は、本体音除去部１５８ａ、１５８ｂの各出力音声信号の合成信号に対し、テレビジョン受像機１００の環境下（ユーザがいる環境下）の騒音レベルを検出して、テレビジョン受像機１００の周囲が、拍手音の識別が困難な不適切な環境であると判断した場合、騒音状態フラグを発生させて判定処理部１６８へ出力する。

判定処理部１６８は、エッジパルス生成部１６２ａ、１６２ｂから同一幅のエッジ検出フラグＦｐ１、Ｆｐ２を得て、以下に詳述する判定処理アルゴリズムに従い音源の角度等を導出する。本実施形態にかかる判定処理部１６８は、拍手音が所定の回数得られていること、３回以上の拍手音が入力された際はその拍手音が略等間隔で入力されていること、システム制御部１０２から出力されるモードに添って判定信号を出力すること、騒音状態検出部１６４から騒音状態フラグが入力されているときは認識操作を停止させて判定信号の出力を禁止し制御信号を発行しないようにすること、Ｆｐ１、Ｆｐ２の時間差データを求めて出力することを役割としている。

図５は、本実施形態にかかる判定処理部１６８のハードウェア構成を示した機能ブロック図である。図６、図７および図８は、判定処理部１６８の判定処理アルゴリズムを説明するためのタイミングチャートであり、特に図６および図７は、拍手１回を通じて左右の角度を導出する詳細なアルゴリズムを、図８は、拍手の回数を把握する包括的なアルゴリズムを説明している。

図５に示すように、判定処理部１６８は、エッジパルス合成部１７０、音声信号判定部１７２、第１のカウンタ１７４ａ、時間差分算出部１７６、音源導出部１７８、および第２のカウンタ１７４ｂと、を含んで構成される。

エッジパルス合成部１７０は、ユーザによって拍手音が発生させられると、図４のエッジパルス生成部１６２ａ、１６２ｂから図６（Ａ）に示すエッジ検出フラグＦｐ１と、図６（Ｂ）に示すエッジ検出フラグＦｐ２とを受信し、その２つのエッジ検出フラグＦｐ１、Ｆｐ２を合成して（本実施形態では論理和を取って）、図６（Ｇ）に示すパルス（合成エッジ検出フラグ）を出力する。ここで、図６（Ｄ）は、図６（Ａ）に示すエッジ検出フラグＦｐ１を説明のため拡大して示したものであり、図６（Ｅ）は、図６（Ｂ）のエッジ検出フラグＦｐ２を拡大して示したものである。

図６（Ｃ）は、図６（Ｄ）〜図６（Ｊ）の信号処理を遂行する動作クロックを示す。テレビジョン受像機１００に対する音源の発生した角度によってエッジ検出フラグの検出時間は異なるものであり、集音部１１４ａからｔ_１１において得られるエッジ検出フラグＦｐ１（図６中（Ｄ））に対して、エッジ検出フラグＦｐ２（図６中（Ｅ））の立ち上がりがｔ_１２と遅れているのは、拍手音の到来方向がテレビジョン受像機１００から見て右側（モニタ１１０に向かって左側）であることを意味する。

本実施形態において、エッジパルス合成部１７０は、エッジ検出フラグＦｐ１とエッジ検出フラグＦｐ２との合成に論理和を用いているため、集音部１１４の片側から拍手音が検出されなくとも拍手音として認識されることとなるが、論理和の代わりに論理積（図６の（Ｆ））を用いてもよい。論理積を用いることで、片側のエッジ検出フラグ（パルス）が検出されない場合、合成出力をゼロとして判定処理部１６８の処理を制限することができる。論理和を用いるか論理積を用いるかは、認識率を上げることを優先するか、誤認識に対する耐性を確保することを優先するかによって任意に設定可能である。

音声信号判定部１７２には、エッジパルス合成部１７０から図６（Ｇ）に示す合成エッジ検出フラグが供給されると共に、騒音状態検出部１６４からの騒音状態検出フラグやシステム制御部１０２からのモードが入力される。かかるモードは、自機の制御の状態を踏まえてシステム制御部１０２から入力される信号であり、本実施形態では、オン／オフモードと選択アップダウンモードの２つのモードに大別される。オン／オフモードは待機電源を含む主電源により維持され、複数回の拍手音に応じてモニタ１１０の電源のオン／オフ（オン３回、オフ４回）を受け付ける。選択アップダウンモードは１または複数回の拍手音に応じて自機の機能選択を受け付ける。オン／オフモードから選択アップダウンモードへの切り換え（以下、「メニュー機能をオンにする」と称する）は複数回の拍手音によってなされ、選択アップダウンモードからオン／オフモードへの切り換えはタイムアウト等によって為される。ここでは、主にオン／オフモードについて説明する。

第１のカウンタ１７４ａは、時間軸方向の状態遷移を管理し、音声信号判定部１７２に入力される複数のエッジフラグの周期や特定の領域を捕捉するゲートパルスなどを発生させる。

ここで、図８を用い、音声信号判定部１７２による複数の拍手音に対する包括的な処理を説明する。図８（ａ）および（ｂ）は、図６（Ａ）、（Ｂ）に示すタイミングで拍手音が３回入力された場合、電源をオンまたはメニュー機能をオンにする際のエッジ検出フラグＦｐ１、Ｆｐ２を示している。図８（ａ）および（ｂ）中、４回目の拍手音に相当する箇所には、エッジ検出フラグＦｐ１、Ｆｐ２を破線で示しており、本実施形態ではかかる４回目のエッジ検出フラグＦｐ１、Ｆｐ２が検出されないことを確認して３回の拍手音であることを確定している。

図８（ｃ）は、図５のエッジパルス合成部１７０において、図８（ａ）、（ｂ）に示す２つのエッジ検出フラグＦｐ１、Ｆｐ２を合成して得られた合成エッジ検出フラグ（図６（Ｇ）および図７（Ｇ））を示す。音声信号判定部１７２は、図８（ｃ）に示す合成エッジ検出フラグの１回目が入力された時点で、図８（ｄ）に示すように１回目検出フラグＦ１を設定すると共に、第１のカウンタ１７４ａをリセットして、クロックのカウントを開始させる。さらに、音声信号判定部１７２は、第１のカウンタ１７４ａによって示される所定幅ｔ_２のゲートパルスの期間内に合成エッジ検出フラグの２回目が入力された時点で、図８（ｅ）に示すように２回目検出フラグＦ２を設定する。

また、音声信号判定部１７２は、並行して、合成エッジ検出フラグの１回目の入力時点から２回目の入力時点までの時間をインターバル期間ｔ_Iとして記憶すると共に、第１のカウンタ１７４ａをリセットし、再びクロックをカウントさせる。

続いて、音声信号判定部１７２は、２回目検出フラグＦ２の設定時点からカウントした時刻ｔ_I−（ｔ_３／２）に立ち上がり、時刻ｔ_I＋（ｔ_３／２）に立ち下がるゲート幅ｔ_３を有するゲートパルスの期間内に合成エッジ検出フラグの３回目が入力された時点で、図８（ｆ）に示すように３回目検出フラグＦ３を設定すると共に、第１のカウンタ１７４ａをリセットし、再びクロックをカウントさせる。そして、音声信号判定部１７２は、第１のカウンタ１７４ａのカウント値に基づき、時間ｔ_I＋（ｔ_３／２）経過するまで合成エッジ検出フラグが入力されない状態が継続したことをもって、時間ｔ_I＋（ｔ_３／２）時点で図８（ｇ）に示す４回目のところに拍手が無い旨を示すフラグ（無音フラグ）Ｆｎを設定する。

そして、音声信号判定部１７２は、上記の各フラグＦ１、Ｆ２、Ｆ３、Ｆｎが揃ったところで３回拍手の条件が満たされたと判断し、３回拍手が確定したことを表す図８（ｈ）に示す判定フラグＦｊをシステム制御部１０２に出力する。

図５に示す時間差分算出部１７６は、エッジパルス生成部１６２ａ、１６２ｂから得られるエッジ検出フラグＦｐ１、Ｆｐ２に基づいて、集音部１１４ａ、１１４ｂに到来する拍手音の時間差を求め、その時間差を示す値を音源導出部１７８へ出力する。かかる時間差の導出アルゴリズムを図６および図７に戻って詳述する。拍手音の時間差は具体的に図６（Ｄ）に示すＦｐ１と、図６（Ｅ）に示すＦｐ２との時間差である。図６は拍手をするユーザが止まっている場合のタイミングチャートを示し、３回の拍手音の時間差は略同一であるとする。図６（Ａ）、（Ｂ）、（Ｄ）、（Ｅ）、（Ｇ）については、既に説明が為されているのでここでは説明の為されていない図６（Ｆ）、（Ｈ−１）、（Ｈ−２）、（Ｉ−１）、（Ｉ−２）、（Ｊ）について詳述する。

図６（Ｄ）および（Ｅ）に示す２つのエッジ検出フラグＦｐ１、Ｆｐ２の位相差が、時間差分値であり、図６（Ｅ）の矢印１に相当する。矢印１の時間差分値は図５に示す第２のカウンタ１７４ｂにてカウントされる。第２のカウンタ１７４ｂのカウント値は、本実施形態では図６（Ｃ）に示すクロックの数（クロック数）で表される。ここで、矢印１は１０クロックの時間差分値となる。図６（Ｆ）は図６（Ｄ）に示すエッジ検出フラグＦｐ１と図６（Ｅ）に示すエッジ検出フラグＦｐ２との論理積を取った信号である。この信号は、後述する第１の幅拡張部２０６ａにおける拡張時間となり、また、時間差分値としての第２のカウンタ１７４ｂのカウント値をホールド（維持）する期間となる。

矢印１の期間は、図６（Ｄ）、（Ｅ）に示すエッジ検出フラグＦｐ１、Ｆｐ２の差分を表した図６（Ｈ−１）に示すパルスの期間をカウントすることで求められる。図６（Ｈ−１）に示すパルスは、図６（Ｄ）に示すエッジ検出フラグＦｐ１が高レベル（論理「１」）で、図６（Ｅ）に示すエッジ検出フラグＦｐ２が低レベル（論理「０」）であるときに高レベルになるパルスであり、エッジ検出フラグＦｐ１がＦｐ２より先行していることも表している。エッジ検出フラグＦｐ１が先行するということは、本実施形態においてテレビジョン受像機１００のモニタ１１０に向かって左側（集音部１１４ａ側）から音波が到来していることである。

図６（Ｊ）は図５の第２のカウンタ１７４ｂのカウント値を示しており、図６（Ｈ−１）に示すパルスが高レベルとなる期間、カウント値はインクリメントされる。ここでは、図６（Ｈ−１）に示すパルスが立ち上がった時点ｔ_１１＝０からカウントして、パルスが立ち下がった時点ｔ_１２＝１０までのクロックを示す値がホールドされる。また、時間差分算出部１７６は、図６（Ｈ−１）のパルスを時間軸方向にパルス幅を拡張した図６（Ｉ−１）に示すパルスを生成する。かかる図６（Ｉ−１）に示すパルスはエッジ検出フラグＦｐ１の先行を示し、図６（Ｊ）に示すカウント値は時間差分値を表す。

図７は、エッジ検出フラグＦｐ２が先行する場合のタイミングチャートであり、その動作は図６の説明と実質的に等しいので、ここでは図６と異なる点を主として説明する。図７（Ａ）、（Ｂ）は、３回発生させられた拍手音に基づいて検出された拍手音エッジ検出フラグＦｐ１、Ｆｐ２のタイミングを示している。図７（Ｄ）に示すエッジ検出フラグＦｐ１と、図７（Ｅ）に示すエッジ検出フラグＦｐ２の位相差（時間差分値）が、所望する時間差分値であり、図７（Ｄ）の矢印２に相当する。

図７（Ｅ）に示すエッジ検出フラグＦｐ２は図７（Ｄ）に示すエッジ検出フラグＦｐ１より１０クロック分先行している。図７（Ｈ−２）に示すパルスは、図７（Ｄ）に示すエッジ検出フラグＦｐ１が低レベルで、図７（Ｅ）に示すエッジ検出フラグＦｐ２が高レベルであるときに高レベルになるパルスであり、かかるパルスが高レベルであることでエッジ検出フラグＦｐ２がＦｐ１より先行していることを表し、高レベルとなっている期間が時間差分長を表している。

図７（Ｊ）は図５の第２のカウンタ１７４ｂのカウント値を示しており、図７（Ｈ−２）に示すパルスが高レベルになる期間、カウント値はインクリメントされ、ここでは「０」から「１０」までカウントされた後ホールドされる。こうしてエッジ検出フラグＦｐ２がＦｐ１より先行している場合であっても図７（Ｊ）に示すカウント値によって時間差分値を取得することができる。

図９は、時間差分算出部１７６の回路系統図である。時間差分算出部１７６は、かかる回路系統を通じて図６および図７に表したタイミングチャートの各信号を出力する。図９中、括弧内のアルファベットは、図６、図７、図８に示したタイミングチャート中の対応するアルファベットのパルスを表している。以下、回路系統の動作を説明する。かかる回路系統の説明におけるパルス名は断らない限り図６および図７にアルファベットの大文字で示したパルス名を表している。

第１のＡＮＤ回路２００ａでは（Ｈ−１）に示すパルスが生成され、第２のＡＮＤ回路２００ｂでは（Ｈ−２）に示すパルスが生成され、第３のＡＮＤ回路２０２では（Ｆ）に示すパルスが生成され、第１のＯＲ回路２０４では（Ｈ−１）と（Ｈ−２）の論理和を示すパルスが生成される。

第１の幅拡張部２０６ａと第２の幅拡張部２０６ｂは、第３のＡＮＤ回路２０２の出力信号の高レベルの期間、ＡＮＤ回路２００ａ、２００ｂの各出力パルスのパルス幅を拡張して、（Ｉ−１）、（Ｉ−２）に示すパルスを生成する。第２のカウンタ１７４ｂのＣＥ（チップイネーブル）端子には、第１のＯＲ回路２０４から（Ｈ−１）と（Ｈ−２）の論理和を示すパルスが入力され、ＣＥ端子が高レベルになっている間、カウントが為される。一方、第２のカウンタ１７４ｂのＥＮ（イネーブル）端子には、第２のＯＲ回路２０８から（Ｉ−１）と（Ｉ−２）の論理和を示すパルスが入力され、所定期間カウンタの値がホールドされる。本実施形態ではＣＥとＥＮが共に低レベルのとき第２のカウンタ１７４ｂのカウント値がクリアされる。

図６および図７のタイミングチャートで示したように最終的に評価されるものはエッジ検出フラグＦｐ１、Ｆｐ２の前後関係と、その差分量である第２のカウンタ１７４ｂ出力の時間差分値を示すクロック数（カウント値）である。このエッジ検出フラグＦｐ１、Ｆｐ２の前後関係と時間差分値であるクロック数は、１回目保持部２１０、２回目保持部２１２および３回目保持部２１４に保持される。１回目保持部２１０に１回目の拍手音のエッジ検出フラグから得られた方向（前後関係）を示す（Ｉ−１）、（Ｉ−２）のパルス（または（Ｈ−１）、（Ｈ−２）のパルス）と（Ｊ）のカウント値とを保持する。

入力された拍手音が何回目のものであるかは、図８（ｄ）に示した１回目検出フラグＦ１、図８（ｅ）に示した２回目検出フラグＦ２、図８（ｆ）に示した３回目検出フラグＦ３とから導出することができる。例えば、１回目検出フラグＦ１のみが高レベルのとき１回目、１回目検出フラグＦ１、２回目検出フラグＦ２が高レベルのとき２回目、１回目検出フラグＦ１、２回目検出フラグＦ２、３回目検出フラグＦ３全てが高レベルのとき３回目と判断できる。

この何回目であるかを示す信号により識別される各回では、図６または図７で示した（Ｉ−１）、（Ｉ−２）および（Ｊ）がホールドされている、図６または図７で示した（Ｆ）に示すパルスの期間の特定のタイミングで、上記カウント値の保持を実行する。図６および図７ではこのタイミングをｔ_１３としている。そして、その保持した内容は図８（ｉ）に１回目の時間差分値、図８（ｊ）に２回目の時間差分値、図８（ｋ）に３回目の時間差分値として示される。以上が時間差分値の算出方法である。この算出方法により、時間差分算出部１７６は、図６または図７で示した（Ｉ−１）、（Ｉ−２）と、クロック数（時間差分値）を音源導出部１７８に出力し、音源導出部１７８はこれらを基に角度データθｊを出力する。

図５に示す音源導出部１７８は、上記時間差分値を用いて、テレビジョン受像機１００に対する拍手音の音源の角度を導出する。時間差分値としてのクロック数は、クロックの周期、即ち音のサンプリング周波数から一義的に求まるものである。ここで、クロックの周期をｔ_ｃ、クロック数をｎ（ｎは０以上の整数）とすると、上述した式（２）の集音部１１４間の拍手音の音波到達時間差ｔ_ｄｄは、以下の式（４）となる。
ｔ_ｄｄ＝ｎ・ｔ_ｃ式（４）

式（４）を上記式（３）に代入することで、角度θを求める以下の式（５）が得られる。
θ＝ａｒｃｓｉｎ(ｎ・ｔ_ｃ・ｃ／ｍｄ) 式（５）

このときサンプリングのクロック周波数を３２ｋＨｚとすると、角度θの最小分解角度は約０．６度となり、本実施形態では十分な精度を確保できる。

ここでの角度θは絶対値であり、左右の角度は図６および図７（Ｉ−１）、（Ｉ−２）に示す信号より得られる。角度θは、（Ｉ−１）に示す信号が高レベルで（Ｉ−２）に示す信号が低レベルのときはモニタ１１０に向かって左側の角度、（Ｉ−１）に示す信号が低レベルで（Ｉ−２）に示す信号が高レベルのときはモニタ１１０に向かって右側の角度となる。なお、この角度とは、図２に示したテレビジョン受像機１００の中心点Ｄを基準とした角度である。また、この角度は、（Ｉ−１）および（Ｉ−２）に示す各信号が共に低レベルのときは中央となる。ここでいう「中央」とはテレビジョン受像機１００の中心点Ｄ（モニタ１１０の中心点）からユーザ方向へ向かう垂線に相当する角度であり、そのときの角度θを０とする。また、（Ｉ−１）および（Ｉ−２）に示す各信号が共に高レベルのときは無効なデータとして扱われる。

図１０は、上述した音源導出部１７８が算出する角度θについてまとめた図である。音源の角度は、テレビジョン受像機１００の中心点Ｄからユーザ側に伸ばした垂線に対して、時計回りを負（−θｊ、左）、反時計回りを正（θｊ、右）として表している。

上記式（５）から理解できるように、求められる角度θは拍手音１回毎に得られる。本実施形態において、オン／オフモードで電源をオンしたり、メニュー機能をオンしたりする場合、３回の拍手音が入力されることから、３種類の角度が得られる。後述する基準角度は、ここで得られた角度を基に算出する。算出方法は、３つの角度の平均値を用いてもよく、３回目、即ち最後の拍手音により求められた角度を基にしてもよい。

図１１は、式（３）または式（５）をシミュレーションした図であり、特に図１１（ａ）は、テレビジョン受像機１００の中心（図２の中心点Ｄ）を座標の原点とした場合の音源の角度の等高線を示し、図１１（ｂ）は、図１１（ａ）の鳥瞰図を示す。

図１１（ａ）では、テレビジョン受像機１００を略鉛直上方向から見た場合の長手方向の延長線上の軸を横軸（Ｘ軸）とし、略水平面を縦軸（Ｙ軸）としている。等高線は、縦軸がテレビジョン受像機１００から３２０ｃｍまで、横軸はテレビジョン受像機１００の中心点Ｄを０とした場合の左右１６０ｃｍまでの各位置において放射状に広がっている。詳細には、９度毎に０度から９０度まで角度の絶対値（図１１中「Ｃ」を付して角度の値を示す）を示している。４５度（図１１中Ｃ４５で示す）のラインが横軸と縦軸ともに１６０ｃｍとなり理論値と略等しい結果が得られた。

上述したように本実施形態では、２つの集音部１１４ａ、１１４ｂは、約１００ｃｍ離隔してテレビジョン受像機１００の両端に設置されている。テレビジョン受像機１００から接近した範囲もしくは集音部１１４間は、テレビジョン受像機１００の中心点Ｄからの角度と一致しないが、両端に設置された集音部１１４から距離に相当する角度として実用上不都合なく算出される。

図１１（ｂ）に示すように、急激に音源の角度が変化している不連続なポイントは、テレビジョン受像機１００本体に設置された集音部１１４近辺なので実用上問題にはならない。このように、音源導出部１７８は、上述したように少なくとも２つ集音部１１４を備える構成により、音源の角度、即ちユーザの方向を確実に導出することが可能となる。

本実施形態において、図３に示したシステム制御部１０２は、相対導出部１８０、操作制御部１８２、内容表示制御部１８４、相対表示制御部１８６、内容出力制御部１８８、相対定位制御部１９０を備える。

相対導出部１８０は、所定の基準設定期間内に音源導出部１７８が導出した第１の音波（拍手音）の音源の角度を基準角度として記憶部１０４に記憶させる。本実施形態において所定の基準設定期間とは、テレビジョン受像機１００の電源がオンしている場合であって、メニュー機能を実行するためのＧＵＩ（Graphical User Interface）がモニタ１１０に表示されていない期間を示し、モニタ１１０にメニュー機能を実行するためのＧＵＩ(以下、単にメニュー画像と称する)が表示されることで終了する。また本実施形態において、３回の拍手音が入力された場合に所定の基準設定期間が終了し、基準角度は３回の拍手音からそれぞれ求めた音源の角度の平均値とする。

また相対導出部１８０は、記憶部１０４が基準角度を記憶している状態で音源導出部１７８が導出した第２の音波（拍手音）の音源の基準角度からの相対角度を導出する。本実施形態において、基準角度の記憶後には、制御を１つ行うために１回の拍手音に基づく音声信号が入力される。

操作制御部１８２は、集音部１１４に入力された音波に応じて自機を制御する。操作制御部１８２は、予め設定された有効範囲内において拍手音が発せられた場合にのみ、自機を制御する。かかる有効範囲は、例えばテレビジョン受像機１００を中心とした所定半径の略水平方向の円内や、テレビジョン受像機１００を中心としたモニタ１１０前面側の所定半径の半円内といった所定の範囲、所定半径の第１の半円より大きく第２の半円より小さい範囲内等と設定できる。また、有効範囲は、後述するように操作制御部１８２が制御する制御内容の種類の数が変わる毎に計算される任意の範囲と設定することもできる。操作制御部１８２が、かかる有効範囲内の任意の点を音源とした拍手音のみに応じて自機を制御する構成により、ドアの開閉や他の作業等を通じて発せられる音等、有効範囲外で発生した音によってテレビジョン受像機１００が誤作動してしまう可能性を低減させることが可能となる。

図１２は、本実施形態にかかるテレビジョン受像機１００の拍手音による操作を説明するための説明図である。図１２に示すように、本実施形態では、電源のオン／オフや制御内容の種類としてのメニュー画像の表示のオン（メニュー機能のオン）を複数回の拍手音から実行するオン／オフモード（図１２（ａ））、および操作制御部１８２の制御内容を１回の拍手音で実行する選択アップダウンモード（図１２（ｂ））の２つのモードに大別される。

かかるモードの選択は、モードを選択する際の自機の状態に応じてシステム制御部１０２がモードを選択する旨の信号を音声信号判定部１７２に出力することによって為される。詳細に、図１２（ａ）に示すオン／オフモードは、図１２（ｂ）に示す選択アップダウンモードが選択された期間以外のすべての期間において維持されているモードであり、選択アップダウンモードは、基準角度の記憶後の所定期間において設定され得るモードである。より詳細に、選択アップダウンモードは、テレビジョン受像機１００の電源がオンであり、かつ、メニュー画像がまだモニタ１１０に表示されていない期間（所定の基準設定期間）内に、集音部１１４に有効範囲内の任意の点を音源とする拍手音が所定の条件（本実施形態では略等間隔で３回）入力された場合に生じ、ユーザの拍手音入力に応じてメニュー機能（制御内容）を実行することができるモードである。本実施形態では、複数回の拍手音に基づく音声信号が入力されることを条件として、誤認識に対する耐性を向上させている。本実施形態においてオン／オフモードの際は、テレビジョン受像機１００を中心としたモニタ１１０前面側の所定半径の半円内を有効範囲とした。

図１２（ａ）に示すオン／オフモードにおける画像２３０は、電源がオフの状態（以下、単に電源オフ状態と称する）であるモニタ１１０の表示状態（何も表示されていない状態）を示している。電源オフ状態で集音部１１４に上記有効範囲内の任意の点を音源とする拍手音が３回、等間隔で入力されると、テレビジョン受像機１００は、電源がオンになった状態となり（以下、単に電源オン状態と称する）、モニタ１１０の表示状態は画像２３２の視聴状態となる。

電源オン状態において、ユーザが制御内容としての音量またはチャンネルの変更を所望する場合には、さらにユーザ入力により集音部１１４に有効範囲内の任意の点を音源とする拍手音（第１の音波）が略等間隔で３回入力される。かかる入力に応じて、内容表示制御部１８４は、操作制御部１８２の制御内容の種類を表す図１２（ｂ）に示すメニュー画像（画像２３４）をモニタ１１０に表示する。画像２３４には、操作制御部１８２の制御内容の種類を示す画像である例えば音量制御を示す画像、消音制御を示す画像およびチャンネル制御を示す画像が含まれる。

音源導出部１７８は、メニュー画像を表示させるために入力された拍手音（第１の音波）を基に、テレビジョン受像機１００に対する角度を導出し、かかる角度で画像２３４を表示させる際のユーザ（音源）の方向を特定する。相対導出部１８０は、音源導出部１７８が算出した角度を基準角度とし、記憶部１０４に記憶させる。

そして操作制御部１８２は、自機の状態が、制御内容を選択する状態にあることを判定し、選択アップダウンモードを選択する旨の信号を音声信号判定部１７２に出力することで、オン／オフモードから選択アップダウンモード（図１２（ｂ））へモードを移行する。

ここで、図３に示す内容表示制御部１８４は、上記ＧＵＩとして、ユーザが拍手音（第２の音波）を発生すべき角度と操作制御部１８２の制御内容の種類とを関連付けた画像をグラフィックス生成部１２２に生成させる。例えば図１２（ｂ）の画像２３４に示すように、内容表示制御部１８４が、音量制御を示す画像をモニタ１１０の、右に表示した場合、相対導出部１８０が導出した音源の角度が選択アップダウンモードの有効範囲における右側の範囲内であれば、即ちユーザが基準角度より所定の角度以上右側の任意の点を音源とする拍手音を発生させれば、操作制御部１８２は音量制御を選択する。ここで有効範囲は、オン／オフモードにおける有効範囲と同じでもよいし、オン／オフモードから選択アップダウンモードへ移行する際に範囲を制限してもよい。かかる有効範囲の制限方法については、後に詳述する。

本実施形態において内容表示制御部１８４は、さらに、消音制御を示す画像をモニタ１１０の中央に、チャンネル制御を示す画像をモニタ１１０の左に、と制御内容の種類と拍手音を生成すべき角度とを関連付けて表示する。内容表示制御部１８４を備える構成により、ユーザの所望する制御を実行するために生成すべき音声信号の角度をユーザに視認させることができる。

さらに内容出力制御部１８８は、ユーザが音声信号を生成すべき角度と操作制御部１８２の制御内容の種類とを関連付けた音声を音生成部１２６に生成させてスピーカ１１２から出力することができる。このとき、内容出力制御部１８８は、「音量は右」、「消音は中央」、「チャンネルは左」という音声をスピーカ１１２から出力する。モニタ１１０上の右の制御内容は右のスピーカ１１２から出力し、左の制御内容は左のスピーカ１１２から出力し、中央の制御内容は中央に音像を定位させるべく左右両方のスピーカ１１２から音量を等しくして音を出力すると好ましい。また、内容出力制御部１８８を備える構成により、ユーザの所望する制御を実行するために生成すべき音声信号の角度を、音をもって報知することができる。これにより、目の不自由な人でも、容易に操作することが可能となる。

ユーザに所望の制御を選択するための拍手音（第２の音波）を発生させる角度を知らせる方法として、画像の表示または指示音声の出力のいずれかを適宜選択すればよいし、双方を組み合わせてもよい。以下、選択アップダウンモードの一連の操作の流れを説明する。

図１３は、選択アップダウンモードにおける制御内容の実行を説明するための説明図であり、特に、図１３（ａ）は、所定の基準設定期間内に集音部１１４に拍手音が略等間隔で３回入力された直後のモニタ１１０の表示状態（図１２における画像２３４）を、図１３（ｂ）は、ユーザの拍手音入力に応じて制御内容を選択する形態を示す。図１３に示す基準角度ＤＣは、上述した音源導出部１７８を通じて式（５）により求められる。

図１３（ａ）に示すように、モニタ１１０にはメニュー画像（画像２３４）が表示され、具体的には、テレビジョン受像機１００に向かって、左側にチャンネル制御を示す画像、中央に消音制御を示す画像、右側に音量制御を示す画像が表示されている。上述したように、相対導出部１８０は、メニュー画像を表示するために入力された拍手音（第１の音波）に基づいて音源導出部１７８が算出したテレビジョン受像機１００に対する音源の角度ＤＣを、基準角度ＤＣとして記憶部１０４に記憶させる。図１３（ａ）に示す例では、拍手音の音源の角度ＤＣ、即ちテレビジョン受像機１００の中心点Ｄと拍手音の音源の位置Ｕとを結んだ線分ＤＵの角度ＤＣは、理解を容易にするためテレビジョン受像機１００の中心点Ｄからユーザ側に伸ばした垂線Ｄ１と同じとしたため０度となる。

相対導出部１８０が基準角度ＤＣを記憶部１０４に記憶させた状態で、図１３（ｂ）に示すようにモニタ１１０に表示された制御内容のうち所望の制御をユーザが選択するための拍手音（第２の音波）が発生させられると、音源導出部１７８は第２の音波音源の角度データを相対導出部１８０に供給する。相対導出部１８０は、第２の音波音源の角度データを基に、基準角度ＤＣに対する第２の音波の音源の相対角度を算出する。

本実施形態の操作制御部１８２は、選択アップダウンモードにおいて、上記オン／オフモードにおける有効範囲内であって、基準角度ＤＣを基準とした範囲内の任意の点を音源とする拍手音が集音部１１４に入力された場合にのみ、自機を制御する。また操作制御部１８２は、自機を制御可能な範囲を、基準角度を基準としたオン／オフモードで設定した有効範囲よりも狭い範囲にさらに制限して、範囲外で発生した音の誤認識によるテレビジョン受像機１００の誤作動を防止することが可能となる。

また本実施形態において、操作制御部１８２は、相対導出部１８０が導出した相対角度が基準角度ＤＣを基準とした複数の範囲（以下、選択範囲と称する）のいずれに含まれるかを判断し、その選択範囲に応じて制御を行う。図１３（ｂ）に示す例において、操作制御部１８２は、相対導出部１８０が導出した相対角度が、３つの選択範囲のいずれに含まれるかを判断し、かかる選択範囲に応じて３つの異なる制御のいずれか（チャンネル制御、消音制御、音量制御）を行う。

なお、有効範囲の制限および選択範囲の設定は、例えば図１３（ｂ）に示すように、まず、予め設定した角度を用い、基準角度に基づいて選択範囲を設定し、設定した選択範囲から有効範囲を制限してもよい。また、有効範囲の制限および選択範囲の設定は、まず、基準角度を基準として予め設定した角度で有効範囲を制限し、かかる制限された有効範囲を制御内容の種類の数に応じて分割して選択範囲を設定してもよい。以下に、まず、選択範囲を設定してから有効範囲を制限する方法を説明し、次に有効範囲を制限してから選択範囲を設定する方法について説明する。

本実施形態において、相対導出部１８０は、予め選択範囲を設定するための角度（基準角度）を記憶部１０４に記憶させておく。かかる選択範囲を設定するための角度θａｄは、基準角度ＤＣ上に位置するユーザの胸の前で拍手音が発生されたとして、左右に位置をずらせて無理なく拍手できる相対距離をｓｄ、テレビジョン受像機１００からユーザまでの距離をｄｄｃと想定した場合、以下に示す式（６）から算出できる。
θａｄ＝ａｒｃｔａｎ（ｓｄ／ｄｄｃ）式（６）

上記式（６）を用いて、ユーザが無理なく動かせる相対距離ｓｄを２０ｃｍ、テレビジョン受像機１００からの距離ｄｄｃを２ｍとして計算すると、角度θａｄは５．７度となり、相対導出部１８０は、選択範囲の角度を５．７度として予め記憶部１０４に記憶させておく。ここでは角度θａｄを５．７度に設定しているが、テレビジョン受像機１００の大きさや利用状況に応じて、その角度を任意に再設定することもでき、再設定された角度も同様に記憶部１０４に記憶される。

相対導出部１８０は、操作制御部１８２が制御する制御内容の種類の数をｎとすると、ｎ個分の選択範囲を、基準角度ＤＣを中心として設定する。図１３（ｂ）に示す例では、操作制御部１８２が制御する制御内容の種類の数が３であるため、相対導出部１８０は、基準角度ＤＣを含む中央の選択範囲ＣＡＤと、中央の選択範囲ＣＡＤの右側に隣接する右の選択範囲ＲＡＤと、中央の選択範囲ＣＡＤの左側に隣接する左の選択範囲ＬＡＤとを設定する。

ここでは、中央の選択範囲ＣＡＤは、基準角度ＤＣを中心とした角度θａｄを有する範囲と設定し、右の選択範囲ＲＡＤ、左の選択範囲ＬＡＤは中央の選択範囲ＣＡＤの左右外側の各範囲とした。操作制御部１８２が制御する内容が２種類の場合は、基準角度ＤＣを中心とし、基準角度ＤＣに対して右側を右の選択範囲ＲＡＤ、左側を左の選択範囲ＬＡＤと設定すればよい。

更に拍手音の集音精度を向上させる場合は、設定した各選択範囲のうち最も外側に位置する選択範囲の外側の境界（外側枠）を設定するとよい。例えば、図１３（ｂ）に示すように、相対導出部１８０は、右の選択範囲ＲＡＤおよび左の選択範囲ＬＡＤの中心をそれぞれ中央の選択範囲ＣＡＤの中心（基準角度ＤＣ）からθａｄの位置に設定し、設定した各中心を中心にしたθａｄの範囲をそれぞれ右の選択範囲ＲＡＤおよび左の選択範囲ＬＡＤとする。これにより、右の選択範囲ＲＡＤおよび左の選択範囲ＬＡＤの外側枠が設定される。従って相対導出部１８０が発生した拍手音を自機の制御に用いると判断する選択範囲は、図１３（ｂ）に示す有効範囲ＥＡに限定される。

図１３（ｂ）では、操作制御部１８２が行う制御の数が３つであるため、有効範囲ＥＡは、３θａｄの大きさを有する。本実施形態ではθａｄを５．７度と設定したので、有効範囲ＥＡは基準角度ＤＣを中心とした１７．１度の範囲である。

有効範囲ＥＡは、制御内容が奇数個の場合はモニタ１１０に表示されている複数の制御内容を示す画像のうち、中央の画像に対応する制御内容を選択するための選択範囲ＡＤが基準角度ＤＣを中心に位置するよう設定し、設定した中央の選択範囲ＡＤの両側に制御内容の数に対応して選択範囲ＡＤを設ければよい。上述したように、最も外側の選択範囲ＡＤの外側枠は、必要とする集音精度にあわせて設定すればよい。制御内容が偶数個の場合は、モニタ１１０に表示される複数の画像のうち中央に位置する２つの画像を選択するための２つの選択範囲Ａが基準角度ＤＣを中心として互いに接するよう設定する。

次に、上述した有効範囲の制限方法および選択範囲の設定方法の他の例（有効範囲を制限してから選択範囲を設定する方法）について説明する。

まず、相対導出部１８０は、基準角度ＤＣを基準とした所定の角度を有効範囲として設定する。所定の角度は予め記憶部１０４に記憶させておいてもよいし、後述する方法で算出してもよい。記憶部１０４が予め所定の角度を記憶している場合、ユーザが複数の制御内容の一つを選択するにあたり、無理なく手を動かすことができ、選択された制御内容が精度よく判別されるような角度を有効範囲とする。

次に相対導出部１８０は、操作制御部１８２が制御する制御内容数（ｎ）に応じて、有効範囲内をｎ分割する。例えば、制御内容数が３であるときは、有効範囲を３分割し、それぞれを各制御内容を選択するための選択範囲とする。

相対導出部１８０は、有効範囲の大きさを操作制御部１８２の制御内容数（ｎ）に応じて算出してもよい。有効範囲ＥＡは、上記式（６）を用いて算出できる角度θａｄにｎを乗じたｎθａｄとなる。

そして、相対導出部１８０は、制限した有効範囲を操作制御部１８２が制御する制御内容の種類の数分に分割した範囲を各制御内容を選択するための選択範囲として設定する。かかる分割は等分でも不等分でもよい。

そして、図１３（ｂ）に示すように、３つの制御内容（選択肢）のうちチャンネル制御を選択する場合、ユーザは基準角度ＤＣよりも左側であって、左の選択範囲ＬＡＤ内の任意の角度例えば角度ＤＬで拍手を１回する。そうすると、音声処理部１５０は、角度ＤＬにおける拍手を認識し、システム制御部１０２はチャンネル制御が選択されたと判断する。

図１４は、図１３（ｂ）においてチャンネル制御が選択された以降の制御内容の実行を説明するための説明図であり、ユーザの拍手音入力に応じて制御内容を選択する形態を示す。図１４に示す例では、操作制御部１８２が制御する制御内容の種類の数が２であるため、システム制御部１０２は、選択範囲ＡＤを２つ（図１４中、右の選択範囲ＲＡＤ、左の選択範囲ＬＡＤで示す）設定する。相対導出部１８０は、各選択範囲ＡＤを予め記憶された角度θａｄ（例えば５．７度）とし、有効範囲ＥＡをその角度θａｄに選択数２を乗じて導出する。また、他の例では、システム制御部１０２は、有効範囲ＥＡを予め記憶された角度（例えば１７．１度）とし、選択範囲ＡＤをその角度を選択数２で除算して導出する。ただし、選択数が１や２といった数値の場合、上記の計算に拘わらずさらに広い選択範囲ＡＤや有効範囲ＥＡを任意に設定してもよい。

図１３（ｂ）の状態でチャンネル制御が選択されるとモニタ１１０には、図１４に示すように画像２４０（図１２の画像２４０と同じ）が表示される。画像２４０における制御内容は、アップ制御とダウン制御の２つからなるため、操作制御部１８２は、基準角度ＤＣを基準として、右の選択範囲ＲＡＤおよび左の選択範囲ＬＡＤのいずれの選択範囲の任意の点を音源とする音声信号が入力されたかを判断し、その音声信号の音源が含まれる選択範囲に応じて自機を制御する。

図１４に示すように、例えばユーザが角度ＤＲで拍手したと相対導出部１８０が判断すると、モニタ１１０の右側にはチャンネルのアップ制御を示す画像が表示されているので、操作制御部１８２は、アップ制御が選択されたと判断する。そして、ユーザがアップさせたいチャンネル数だけ右側の選択範囲ＲＡＤ内で拍手をすると、操作制御部１８２は音声処理部１５０で認識された音声信号が入力された回数分だけチャンネルをアップさせ、そのチャンネルを示す画像（例えば「１：ＮＨＸ」等）をモニタ１１０に表示させる。なお、本実施形態では所望のチャンネルに到達後操作（拍手）をやめると所定の時間が経過した後、タイムアウトによりチャンネルのアップ制御を示す画像（画像２４０）は自動的にオフになり、モニタ１１０には画像２３２が表示される。

本実施形態にかかる選択アップダウンモードにおいて、操作制御部１８２は、拍手音が１回入力される毎に値をインクリメントまたはディクリメントすることで、チャンネルおよび音量のアップダウン制御（アップ制御ならびにダウン制御）を実行する。従って、画像２３４が表示された状態で、音量制御（右）が選択された場合、内容表示制御部１８４は音量制御にかかる画像２４２をモニタ１１０に表示し、操作制御部１８２は、チャンネル制御と同様に、拍手音が１回入力される毎に値をインクリメントまたはディクリメントすることで、音量のアップダウン制御を実行する。また、画像２３４が表示された状態で、消音制御（中央）が選択された場合に、内容表示制御部１８４は消音制御にかかる画像をモニタ１１０に表示し、操作制御部１８２は、消音制御を実行、即ち、スピーカ１１２からの音声出力を制限する。

本実施形態において、チャンネルと音量のアップダウン制御およびメニュー機能のオン（メニュー画像の表示）は、最後に入力された拍手音から所定時間経過するとタイムアウトにより自動的にオフされる。また消音状態（消音制御が選択された状態）は、有効範囲内の任意の点を音源とした拍手音が略等間隔で３回入力されると解除される。操作制御部１８２がタイムアウトしたと判断し、または操作制御部１８２が消音状態を解除することを示す拍手音の入力を検出し、その判断または検出に従って内容表示制御部１８４がメニュー画像の表示をオフするようグラフィックス生成部１２２を制御することでモニタ１１０の表示状態は画像２３２に戻る。システム制御部１０２は、オン／オフモードを選択する旨の信号を音声信号判定部１７２に出力することで、選択アップダウンモードからオン／オフモードへモードを移行する。そして、さらに有効範囲内の任意の点を音源とした拍手が略等間隔で４回入力されると、システム制御部１０２は電源をオフにする。従って、モニタ１１０には何も表示されなくなる（図１２中、画像２３０参照）。

上述したように、本実施形態において選択アップダウンモードは、メニュー機能がオンになってから（メニュー画像が表示されてから）所定時間を経過しても拍手音が入力されないとタイムアウトにより自動的にオン／オフモードへ移行するため、音の入力時間が制限され、集音部１１４に拍手音以外の他の音が入力される可能性が少ない。従って、選択アップダウンモードもオン／オフモードと同等の耐性を有することになる。

さらに、本実施形態にかかる選択アップダウンモードでは、有効範囲を制限することができる。これにより、選択アップダウンモードはオン／オフモードに比べて耐性を高くすることができ、操作制御部１８２は、選択アップダウンモードにおいて、１回の拍手音毎に制御を実行（確定）させたとしても十分な操作性を得ることができる。

図１５は、相対表示制御部１８６によるモニタ１１０の表示を説明するための説明図である。相対表示制御部１８６は、相対導出部１８０が導出した相対角度をグラフィックス生成部１２２に出力し、映像混合部１２４を介して、図１５の星印で示すようにその相対角度をモニタ１１０に表示する。これにより、ユーザが発生させた音源の角度をユーザに視覚を通じて報知することが可能となる。従って、ユーザは、所望する制御を実行するために生成すべき音声信号の角度と、自身が発生させた音の角度との隔たりを確実に視認することが可能となる。これにより、音声信号を生成すべき角度の校正をユーザに促すことができる。

また、図１５（ｂ）に示すように、相対導出部１８０が導出した相対角度がモニタ１１０に表示されたチャンネル制御を示す画像に相当する角度であり、これによりチャンネル制御が選択された場合、音声処理部１５０は、チャンネル制御が選択された旨の信号を内容表示制御部１８４へ出力し、内容表示制御部１８４は、チャンネル制御が選択されたことを示す画像をモニタ１１０に表示する。本実施形態では内容表示制御部１８４は、チャンネル制御が選択されたことを示す画像として、チャンネル制御を示す画像の周囲を黒枠で囲った画像をモニタ１１０に表示させているが、チャンネル制御を示す画像の表示を点滅させて表示させてもよい。また、内容出力制御部１８８が、チャンネル制御が選択されたことを確認できる確認音を、スピーカ１１２を介して音を出力してもよい。これにより、ユーザの操作入力が操作制御部１８２に認識されたことを適切にフィードバックすることができる。

相対定位制御部１９０は、相対導出部１８０が導出した相対角度を、音生成部１２６に出力し、音声混合部１２８に放送電波に含まれる音声信号と合成させて、スピーカ１１２を通じて音像定位する。

また、本実施形態において相対定位制御部１９０は、相対導出部１８０が導出した相対角度を音生成部１２６に出力し、音声混合部１２８およびスピーカ１１２を介して、音声として出力する。例えば、相対導出部１８０が導出した角度が基準角度よりも右側である場合、相対定位制御部１９０は、「右です」という音声をスピーカ１１２を介して出力する。さらに、相対導出部１８０が導出した角度が基準角度よりも右側であって、有効範囲を超えていた場合、相対定位制御部１９０は、「右に行き過ぎです」という音声をスピーカ１１２を介して出力してもよい。

また相対定位制御部１９０は、相対角度に相当する音の定位となるようにスピーカ１１２ａと１１２ｂのバランスを制御して報知音やビープ音を発生させる。これにより、ユーザに音で相対角度を適切にフィードバックすることができる。

さらに図１５（ｂ）に示すように、相対導出部１８０が導出した相対角度がモニタ１１０に表示されたチャンネル制御を示す画像に相当する角度であり、これによりチャンネル制御が選択された場合、音声処理部１５０は、チャンネル制御が選択された旨の信号を相対定位制御部１９０へ出力してもよい。相対定位制御部１９０は、チャンネル制御が選択されたことを示す音声例えば「チャンネルを選択しました」をスピーカ１１２から出力する。

これにより、ユーザが発生させた音源の角度をユーザに聴覚を通じて報知することが可能となる。従って、ユーザは、所望する制御を実行するために生成すべき音声信号の角度と、自身が発生させた音の角度との隔たりを確実に把握することが可能となる。これにより、音声信号を生成すべき角度または位置の校正をユーザに促すことができる。

ユーザに自身が発生させた音声信号の角度を報知する方法は、上記説明した画像表示または音像定位のいずれかを適宜選択すればよいし、双方を組み合わせてもよい。本実施形態では、より効果がある双方を組み合わせた構成でユーザに角度または位置の校正を促している。

以上説明したように、本実施形態にかかるテレビジョン受像機１００によれば、少なくとも２つ集音部１１４を備える構成により、テレビジョン受像機１００に対する音波の音源の角度を確実に導出することができる。また、所定の基準設定期間内に入力された第１の音波の音源の角度を基準角度として記憶させ、基準角度を記憶している状態で入力された第２の音波の音源の角度を、基準角度からの相対角度として導出することで、ユーザが最初に音を発生させた角度（基準角度）を基準として、それ以降に音を発生させた角度を相対的に導出することが可能となる。そして、操作制御部１８２が導出された相対角度に応じて自機を制御する構成により、ユーザは、音を発生する角度を変えるだけでテレビジョン受像機１００の様々な機能を実行させることができる。

（第２の実施形態）
上述した第１の実施形態によれば、メニュー画像２３４を表示させるために発生させた拍手音（第１の音波）の音源の角度を基準角度とし、基準角度からの次の拍手音（第２の音波）の音源の相対的な角度を導出することで、リモコンを用いずとも、ユーザは角度を変えて拍手音を発生させるだけで、様々な機能を実行させることができる電子機器（テレビジョン受像機１００）について説明した。

第２の実施形態では、ユーザが発生させる拍手音の角度に代えて、拍手音（音源）の位置をテレビジョン受像機５００に対する距離と角度より導出することで、自機の様々な機能を実行可能な電子機器としてのテレビジョン受像機５００について説明する。

（テレビジョン受像機５００）
図１６は、本実施形態にかかるテレビジョン受像機５００の概略的なハードウェア構成を示した機能ブロック図である。上述したテレビジョン受像機１００と実質的に等しい構成要素については、同一の符号を付して説明を省略し、第１の実施形態と相違する集音部５１４と、集音アンプ５２０と、音声処理部５５０と、判定処理部５６８と、音源導出部５７８とについて説明する。ここで、音声処理部５５０および判定処理部５６８は、音源導出部５７８の機能が異なるのみであり、他の構成要素は、図４および図５に示す構成要素と実質的に等しいので、説明を省略する。

図１６に示すように、テレビジョン受像機５００は、３つの集音部５１４（図１６中、５１４ａ、５１４ｂ、５１４ｃで示す）を備え、集音部５１４ごとに集音アンプ５２０（図１６中、５２０ａ、５２０ｂ、５２０ｃで示す）を備えている。少なくとも３つ集音部５１４を備える構成により、音源の位置を確実に導出することができる。本実施形態において集音部５１４ａは、ユーザがモニタ１１０正面側に位置するとき、モニタ１１０に向かって左端に、集音部５１４ｂは右端に設置され、集音部５１４ｃは集音部５１４ａと集音部５１４ｂの略中央に設置されている。

図１７は、本実施形態にかかる音源導出部５７８を用いた集音部５１４に入力された音波の音源の位置を導出する方法を説明するための説明図である。図１７に示すように、テレビジョン受像機５００は、集音部５１４を３つ備えているため、異なる２つの点（後述するＭＣ、ＭＲ、ＭＬのうちの２つ）に対するユーザの２つの角度を特定することができる。かかる角度を特定する方法は、上述した第１の実施形態で用いた方法（図２参照）と同様である。

テレビジョン受像機５００に向かって左側に設置された第１の集音部５１４ａとテレビジョン受像機５００に向かって右側に設置された第２の集音部５１４ｂとに入力された音波から求められる角度θｃｃは、集音部５１４ａ、５１４ｂの中心点（図１７中、ＭＣで示す）を支点として得られる。第１の集音部５１４ａと第３の集音部５１４ｃ（中央に設置されている集音部５１４）とに入力された音波から求められる角度θｌｃは、集音部５１４ａ、５１４ｃの中心点（図１７中、ＭＬで示す）を支点として得られる。そして第２の集音部５１４ｂと第３の集音部５１４ｃとに入力された音波から求められる角度θｒｃは集音部５１４ｂ、５１４ｃの中心点（図１７中、ＭＲで示す）を支点として得られる。

角度θｃｃは、集音部５１４ａ、５１４ｂ間距離がｍｄ（本実施形態では、１００ｃｍ）で、上述した式（５）で求められ、シミュレーションを行うと図１１に示す等高線および鳥瞰図と等しくなる。一方、第１の集音部５１４ａと第３の集音部５１４ｃの距離は、ｍｄ／２（本実施形態では、５０ｃｍ）となり、第２の集音部５１４ｂと第３の集音部５１４ｃの距離も同様にｍｄ／２（本実施形態では、５０ｃｍ）となる。

図１８は、集音部５１４間のオフセットを加味して式（５）をシミュレーションした図であり、２次元平面上の位置に対して集音部５１４ａ、５１４ｂ、５１４ｃから得られる２つの角度を等高線にして表したものである。但し左右の集音部５１４ａ、５１４ｂの中心は、テレビの中心の点ＭＣより左右にｍｄ／４オフセットするため、点ＭＣとは一致しない。図１８において、集音部５１４ａ、５１４ｃから得られる角度をＬを付して示し、集音部５１４ｂ、５１４ｃから得られる角度をＲを付して示す。図１８に示すように、導出された２つの角度を持った線分が交差している点の座標を求めることでユーザの位置を特定することができる。即ち、複数の集音部５１４と音源とから求められる複数の角度よりユーザの位置が求められる。

図１７および図１８に示すように、ユーザの位置（音源の位置）ＰＣは、上述した角度θｌｃ、θｃｃ、θｒｃの内、２つの角度に基づいて特定することができる。ここでは、誤差を少なくするために角度差がより大きくなるθｌｃ、θｒｃから導出することとする。ユーザの位置（音源の位置）における角度θｌｃ、θｒｃは、上述した式（２）および式（３）より求めることができる。音源の位置は、角度θｌｃをもった点ＭＬと点ＰＣを通過する線分（ＭＬ・ＰＣ）と、角度θｒｃをもった点ＭＲと点ＰＣを通過する線分（ＭＲ・ＰＣ）の交点となる。線分ＭＬ・ＰＣは、傾きを、ＡＬＣ＝ｔａｎ（θｌｃ）とすると、
ｙ＝ＡＬＣ・ｘ−（ｍｄ／４）・ＡＬＣ式（７）
となり、線分ＭＲ・ＰＣは、傾きをＡＲＣ＝ｔａｎ（θｒｃ）とすると、
ｙ＝ＡＲＣ・ｘ＋（ｍｄ／４）・ＡＲＣ式（８）
となる。

従って、交点の座標（ｘ、ｙ）は、
ｘ＝−（ｍｄ／４）（ＡＲＣ＋ＡＬＣ）／（ＡＲＣ−ＡＬＣ）式（９）
ｙ＝−（ｍｄ／２）・ＡＲＣ・ＡＬＣ／（ＡＲＣ−ＡＬＣ）式（１０）
となり、音源の位置ＰＣの座標（Ｘｃ、Ｙｃ）が求められる。従って、テレビジョン受像機５００の中心点Ｄ（本実施形態では、点ＭＣと略同一である）から音源ＰＣまでの距離ｄｄｃは、式（１１）で求められる。また点ＰＣと点ＭＣを通過する線分ＭＣ・ＰＣの傾きＡＣＣは、式（１２）となる。

式（１１）
ＡＣＣ＝ａｒｃｔａｎ（Ｙｃ／Ｘｃ）式（１２）となる。

本実施形態では、音源ＰＣの座標（位置）を線分ＭＬ・ＰＣと線分ＭＲ・ＰＣから求めたが、線分ＭＣ・ＰＣと他の線分との間で交点を求めることもできる。また複数の線分から複数の座標を求め、かかる複数の座標を平均することでその導出精度を上げることもできる。

図１９は、本実施形態にかかる音源の位置の特定を説明するための説明図である。本実施形態において、まずオン／オフモードにおいて音源導出部５７８は、所定の基準設定期間内に入力された拍手音より、基準位置ＰＣで示す音源の位置を導出する。図１９ではモニタ１１０に向かって基準位置ＰＣよりも右側の位置をＰＲ、左側の位置をＰＬで示す。

図１９に示すように、例えば、ユーザが基準位置ＰＣよりもモニタ１１０に向かって左側で拍手音を発生させた場合、かかる拍手音の音源の位置ＰＬは、式（９）および式（１０）から算出できる（図１９中、座標（Ｘｌ、Ｙｌ）で示す）。ここで用いる傾きは、図１９中、ＡＲＬおよびＡＬＬで示す。同様に、ユーザが基準位置ＰＣよりもモニタ１１０に向かって右側で拍手音を発生させた場合、かかる拍手音の音源の位置ＰＲも、式（９）および式（１０）から算出できる（図１９中、座標（Ｘｒ、Ｙｒ）で示す）。ここで用いる傾きは、図１９中、ＡＲＲおよびＡＬＲで示す。

図２０は、本実施形態にかかる有効範囲の制限方法の例を説明するための説明図である。操作制御部１８２は、第１の実施形態と同様に、選択アップダウンモードにおいて、集音部５１４に入力された拍手音の音源の位置がかかる有効範囲内に含まれる場合にのみ制御を実行する。また、図２０に示す例では、有効範囲および選択範囲の設定方法として、予め設定した値で有効範囲を制限してから選択範囲を設定する方法について説明する。

本実施形態における、有効範囲の角度方向（テレビジョン受像機５００の中心ＭＣを中心とした円周方向）の境界は、上述した第１の実施形態と同様に式（６）から得られる角度を利用することで、設定可能である。

図２０（ａ）に示すように、例えば、テレビジョン受像機５００と基準位置ＰＣとの距離ｄｄｃは、以下の式（１３）から算出することができる。
ｄｄｃ^２＝Ｘｃ^２＋Ｙｃ^２式（１３）

本実施形態では式（１３）よりユーザまでの距離ｄｄｃを把握できるので、より実質に合った角度θａｄを（６）式より設定することができる。

従って、上記式（６）に式（１３）で算出される距離ｄｄｃを代入し、ユーザが無理なく動かせる相対距離ｓｄを２０ｃｍとみなして計算すると、角度θａｄを算出することができる。そして、システム制御部１０２は、算出した選択範囲の角度θａｄを予め記憶部１０４に記憶させておく。ここでは、基準位置ＰＣが設定される度に、式（１３）から算出した距離ｄｄｃを用いて角度θａｄを設定するが、これに限らず、上記第１の実施形態と同様に、距離ｄｄｃを固定値として予め設定しておくこともできる。

そして、本実施形態において有効範囲の角度方向の境界は、上記第１の実施形態と同様に、選択範囲が３つの場合を説明する。従って、有効範囲は、記録部１０４に記録されたる角度θａｄに３を乗じた３θａｄとなり、テレビジョン受像機５００に対する基準位置ＰＣの角度である角度換算値θｃより小さい第１所定角度（例えばθ４）以上、基準位置ＰＣの角度換算値より大きい第２所定角度（例えばθ１）以下となる。

本実施形態では、ユーザのテレビジョン受像機５００に対する角度のみならず距離も特定できるので、有効範囲は、距離方向にも制限することができる。本実施形態において最も高精度に拍手音を集音したい場合、操作制御部１８２は、基準位置ＰＣとテレビジョン受像機５００（ＭＣ）との距離より大きい第１所定距離（例えばｒａ）以下、基準位置ＰＣとテレビジョン受像機５００（ＭＣ）との距離より小さい第２所定距離（例えばｒｂ）以上、の範囲を予め有効範囲として制限することができる。有効範囲の設定は、必要とする拍手音の集音精度にあわせて行えばよい。

ここで、第１所定距離をｒａ、第２所定距離をｒｂとすると、図２０（ａ）中、破線で示した線が、有効範囲の距離方向の境界となる。

有効範囲を基準位置ＰＣとテレビジョン受像機５００（ＭＣ）との距離より小さい第２所定距離以上とすることにより、スピーカ１１２から出力される放送電波に含まれる音声信号やテレビジョン受像機５００本体を触ったとき等に発生する音波に対する耐性を向上させることができる。

本実施形態においても、操作制御部１８２は、相対導出部１８０が導出した相対位置が、複数の選択範囲（図２０中、右の選択範囲、中央の選択範囲、左の選択範囲と示す）のいずれに含まれるかを判断し、その選択範囲に応じて自機を制御する。ここでは、有効範囲をテレビジョン受像機５００を中心とした円周方向に複数に分割して選択範囲を設定しているので、本実施形態において、距離方向の境界は、有効範囲と選択範囲とで等しくなる。

以下に、有効範囲の任意の点を音源とする拍手音が集音部５１４に入力された場合、かかる拍手音の音源がどの選択範囲に含まれるかを算出する方法について図２０（ａ）を用いて説明する。上述したように有効範囲は、基準位置ＰＣを中心とした角度３θａｄであるため、例えば有効範囲を円周方向に３つに分割する場合、選択範囲の境界は、θ１≧右の選択範囲＞θ２、θ２＞中央の選択範囲＞θ３、θ３＞左の選択範囲≧θ４となる。

選択範囲のそれぞれの境界、角度θ１、θ２、θ３、θ４は、基準位置ＰＣの角度換算値θｃおよび角度θａｄを用いて、以下の式（１４）〜式（１７）より相対導出部１８０が算出する。
θ１＝θｃ＋θａｄ×３／２式（１４）
θ２＝θｃ＋θａｄ／２式（１５）
θ３＝θｃ−θａｄ／２式（１６）
θ４＝θｃ−θａｄ×３／２式（１７）

上記式（１４）から式（１７）を用いて算出した、角度θ１、θ２、θ３、θ４を用いて、操作制御部１８２は、相対導出部１８０が導出した拍手音の音源の位置が、右の選択範囲、中央の選択範囲、左の選択範囲のいずれの選択範囲に含まれるかを判断することができる。なお、必要とする集音精度に応じて、θ１とθ４とを算出せず、有効範囲の境界（外枠）を設定しなくてもよい。

以上説明したように、基準位置ＰＣを基準として有効に自機を制御可能な範囲（有効範囲）を角度（画面の垂線からの角度）と距離（画面からの距離）によって制限する構成により、範囲外で発生した音の誤認識によるテレビジョン受像機５００の誤作動を防止することが可能となる。ここでは、基準位置ＰＣの角度換算値θｃより小さい第１所定角度θ４以上、基準位置ＰＣの角度換算値θｃより大きい第２所定角度θ１以下、かつ、基準位置ＰＣとテレビジョン受像機５００との距離ｄｄｃより大きい第１所定距離ｒａ以下の範囲を有効範囲とすることにより、音の誤認識を高精度で回避することができる。

また、図２０（ｂ）に示すように上記有効範囲の距離方向の境界を、基準位置ＰＣを中心とした所定半径内の範囲（図２０（ｂ）中破線で示す）とすることもできる。このとき所定半径ｒｄは、
ｒｄ^２＝（ｘ−Ｘｃ）^２＋（ｙ−Ｙｃ）^２式（１８）
と表すことができる。

ここで、半径ｒｄは、基準位置ＰＣとテレビジョン受像機５００との距離ｄｄｃより小さいとよい。かかる有効範囲の距離方向の境界を基準位置ＰＣを中心とした所定半径ｒｄ内の範囲とする構成により、ユーザに有効範囲を認識させやすく、より利便性を向上することができる。また、有効範囲の角度方向の境界は、図２０（ａ）を用いて説明した境界と実質的に等しいのでここではその説明を省略する。

図２１は、本実施形態にかかる選択アップダウンモードにおける制御内容の実行を説明するための説明図であり、図２１（ａ）は、オン／オフモードにおいて集音部５１４に拍手音が略等間隔で３回入力された直後のモニタ１１０の表示状態（図１２における画像２３４）を、図２１（ｂ）は、ユーザの拍手音入力に応じて制御内容を選択する形態を示す。図２１に示す基準位置ＰＣは、音源導出部５７８を通じて式（９）および式（１０）により求められる。かかるオン／オフモードおよび選択アップダウンモードは上述した第１の実施形態のオン／オフモードおよび選択アップダウンモードと同一である（図１２参照）。図２１中、モニタ１１０は、略正面から見た図であり、有効範囲は略鉛直上方向から見た図である。

図２１（ａ）に示すように、モニタ１１０にはメニュー画像２３４が表示され、テレビジョン受像機５００に向かって、左側にチャンネル制御を示す画像、中央に消音制御を示す画像、右側に音量制御を示す画像が表示されている。本実施形態において、相対導出部１８０は、メニュー画像を表示するために入力された拍手音の音源の位置ＰＣを、基準位置として記憶部１０４に記憶させる。

図２１（ｂ）に示すように、操作制御部１８２は、相対導出部１８０が導出した相対位置が、複数の選択範囲のいずれに含まれるかを判断し、その選択範囲に応じて自機を制御する。図２１（ｂ）では基準位置ＰＣを基準として、基準位置ＰＣを含む中央の選択範囲、中央の選択範囲の右側の右の選択範囲、および、中央の選択範囲の左側の左の選択範囲を３つの選択範囲を示している。

図２１（ｂ）に示すように、３つの制御内容（選択肢）の内、音量制御を選択する場合、ユーザは基準位置ＰＣよりも右側の例えば位置ＰＲで拍手を１回する。相対導出部１８０は、かかる位置ＰＲでの拍手を認識し、操作制御部１８２は音量制御を選択する。

本実施形態においても、相対表示制御部１８６は、相対導出部１８０が導出した相対位置（図２１中星印で示す）をモニタ１１０に表示する。さらに、相対導出部１８０が導出した相対位置がモニタ１１０の音量制御を示す画像の位置であり、これにより、音量制御が選択された場合、音声処理部５５０は、音量制御が選択された旨の信号を内容表示制御部１８４へ出力し、内容表示制御部１８４は、音量制御が選択されたことを示す画像をモニタ１１０に表示する。

以上説明したように、本実施形態にかかるテレビジョン受像機５００によれば、少なくとも３つ集音部５１４を備える構成により、テレビジョン受像機５００に対する音波の音源の位置を確実に導出することができる。また、所定の基準設定期間内、例えばメニュー画像をモニタ１１０に表示させるために入力された音波（第１の音波）の音源の位置を基準位置ＰＣとして記憶し、基準位置ＰＣを記憶している状態で入力された第２の音波の音源の位置を、基準位置ＰＣからの相対位置として導出することで、ユーザが最初に音を発生させた位置（基準位置ＰＣ）を基準として、それ以降に音を発生させた位置を相対的に導出することが可能となる。そして、操作制御部１８２が導出された相対位置に応じて自機を制御する構成により、ユーザは、音を発生させる位置を手元で変えるだけでテレビジョン受像機５００の様々な機能を実行することができる。

また、第１の実施形態と比較して、有効範囲をユーザの左右方向だけでなくテレビジョン受像機５００に向かって前後方向に設定する構成により、有効範囲をさらに絞ることが可能となり、範囲外で発生した音に対する耐性をさらに向上させることができる。

（第３の実施形態）
図２２は、集音部６１４を８つ有するテレビジョン受像機６００について説明するための説明図である。本実施形態において集音部６１４は、テレビジョン受像機６００のモニタ１１０の４角に１つずつと、長手方向の２辺の中央に１つずつ、短手方向の２辺の中央に１つずつの合計８つ設置されている。長手方向の１辺および短手方向の１辺に設けられた合計５つの集音部６１４で、水平方向だけでなく略鉛直方向の位置を算出することができる。これにより、有効範囲の分割数を増加させることができ、操作制御部１８２が実行可能な制御内容の種類（選択肢）を増加させることが可能となる。

また、本実施形態のように集音部６１４を８つにして、上述した第１および第２の実施形態のように選択肢を３つにすれば、拍手音の認識率および位置の算出の精度をさらに向上させることができる。

以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。

例えば、上述した音声処理部１５０は、予めユーザの拍手音を記憶部１０４に記憶させておき、かかる記憶した拍手音と集音部１１４に入力された拍手音を比較してもよいし、人間が発する拍手音が有する周波数帯域、音圧レベル、継続時間等をフィルタリングしてもよい。

本発明は、リモートコントローラを用いずとも遠隔から操作可能な電子機器に利用することができる。

１００、５００、６００ …テレビジョン受像機
１０４ …記憶部
１１０ …モニタ
１１２ …スピーカ
１１４、５１４、６１４ …集音部
１７８、５７８ …音源導出部
１８０ …相対導出部
１８２ …操作制御部
１８４ …内容表示制御部
１８６ …相対表示制御部
１８８ …内容出力制御部
１９０ …相対定位制御部

Claims

音波を用いて制御する電子機器において、
入力された音波を音声信号に変換する２以上の集音部と、
前記音声信号が入力されると、前記２以上の集音部への音波到達時刻に基づいて、前記電子機器に対する前記音波の音源の方向を特定し、その方向に対応した角度を導出する音源導出部と、
前記音源導出部が導出した第１の音波の音源の角度を基準角度として記憶部に記憶させ、前記記憶部が前記基準角度を記憶している状態で前記音源導出部が導出した第２の音波の音源の前記基準角度からの相対角度を導出する相対導出部と、
前記相対導出部が導出した相対角度に応じて前記電子機器を制御する操作制御部と、
を備えることを特徴とする電子機器。
前記操作制御部は、前記相対導出部が導出した相対角度が、前記基準角度を基準とした複数の範囲のいずれに含まれるかを判断し、前記範囲に応じて前記電子機器を制御することを特徴とする請求項１に記載の電子機器。
前記操作制御部は、前記相対導出部が導出した相対角度が、前記基準角度を基準とした有効範囲内であれば、前記電子機器を制御することを特徴とする請求項１または２に記載の電子機器。
音波を用いて制御する電子機器において、
入力された音波を音声信号に変換する３以上の集音部と、
前記音声信号が入力されると、前記３以上の集音部への音波到達時刻に基づいて、前記電子機器に対する前記音声信号の音源の位置を導出する音源導出部と、
前記音源導出部が導出した第１の音波の音源の位置を基準位置として記憶部に記憶させ、前記記憶部が前記基準位置を記憶している状態で前記音源導出部が導出した第２の音波の音源の前記基準位置からの相対位置を導出する相対導出部と、
前記相対導出部が導出した相対位置に応じて前記電子機器を制御する操作制御部と、
を備えることを特徴とする電子機器。
前記操作制御部は、前記相対導出部が導出した相対位置が、前記基準位置を基準とした複数の範囲のいずれに含まれるかを判断し、前記範囲に応じて前記電子機器を制御することを特徴とする請求項４に記載の電子機器。
前記操作制御部は、前記相対導出部が導出した相対位置が、前記基準位置を基準とした有効範囲内であれば、前記電子機器を制御することを特徴とする請求項４または５に記載の電子機器。
前記有効範囲は、前記基準位置の角度換算値より小さい第１所定角度以上、前記基準位置の角度換算値より大きい第２所定角度以下、かつ、前記基準位置と前記電子機器との距離より大きい第１所定距離以下の範囲であることを特徴とする請求項６に記載の電子機器。
前記有効範囲は、前記基準位置を中心とした所定半径内の範囲であることを特徴とする請求項６に記載の電子機器。
モニタと、
音声信号を生成すべき角度または位置と前記操作制御部の制御内容とを関連付けて前記モニタに表示する内容表示制御部と、
前記相対導出部が導出した相対角度または相対位置を前記モニタに表示する相対表示制御部と、
をさらに備えることを特徴とする請求項１から８のいずれか１項に記載の電子機器。
スピーカと、
音声信号を生成すべき角度または位置と前記操作制御部の制御内容とを関連付けて前記スピーカから出力する内容出力制御部と、
前記相対導出部が導出した相対角度または相対位置を前記スピーカを通じて音像定位する相対定位制御部と、
をさらに備えることを特徴とする請求項１から９のいずれか１項に記載の電子機器。