JP2017083216A - Sound operation system, operation method, and computer program - Google Patents
Sound operation system, operation method, and computer program Download PDFInfo
- Publication number
- JP2017083216A JP2017083216A JP2015209438A JP2015209438A JP2017083216A JP 2017083216 A JP2017083216 A JP 2017083216A JP 2015209438 A JP2015209438 A JP 2015209438A JP 2015209438 A JP2015209438 A JP 2015209438A JP 2017083216 A JP2017083216 A JP 2017083216A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- sound source
- target
- distance
- operation position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 46
- 238000004590 computer program Methods 0.000 title claims description 3
- 238000001514 detection method Methods 0.000 claims description 89
- 230000033001 locomotion Effects 0.000 claims description 35
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000011156 evaluation Methods 0.000 claims description 17
- 230000002123 temporal effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 4
- 210000003811 finger Anatomy 0.000 description 4
- 230000008034 disappearance Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000000245 forearm Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000001846 repelling effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
Images
Landscapes
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
Description
本発明は、単純な操作音で対象装置を制御する技術に関し、さらには、無指向性の操作音でユーザが意図する対象装置を特定する技術に関する。 The present invention relates to a technology for controlling a target device with a simple operation sound, and further to a technology for specifying a target device intended by a user with a non-directional operation sound.
テレビ、空調機、および照明器具といったホーム・アプライアンスは、専用のまたは集約した赤外線式のリモート・コントローラで制御することができる。近年、IoT(Internet of Things)およびM2M(Machine to Machine)といった、個別に稼働している機器をネットワークで接続し、各機器が生成したデータをリアルタイムで統合して機器の制御に利用するシステムが発展を遂げてきている。ホーム・アプライアンスは、IoT/M2Mシステムに組み込んだ携帯式電子機器を通じて制御することも可能である。 Home appliances such as televisions, air conditioners, and luminaires can be controlled by dedicated or integrated infrared remote controllers. In recent years, systems that individually operate devices such as IoT (Internet of Things) and M2M (Machine to Machine) are connected via a network, and data generated by each device is integrated in real time and used for device control. Has been developing. The home appliance can also be controlled through a portable electronic device built into the IoT / M2M system.
特許文献1は、携帯端末装置に入力した音声コマンドを音声認識して操作する方法を開示する。特許文献2は、VTRやテレビジョン受像機などを音声コマンドで操作する音声コマンド遠隔制御装置を開示する。同文献は、利用者が、所望の電子機器に操作部を向けて押ボタンスイッチを押した後に、その電子機器に対するコマンドを音声で入力すると、その音声信号が無線でベース部に送信されてVTRの再生動作が開始することを記載する。
ホーム・アプライアンスの操作における1つの課題として、操作を意図するユーザがその場ですみやかに操作できることを挙げることができる。専用のリモート・コントローラは、操作したい瞬間にユーザの手の届く範囲にあるとはいえず、さらにボタン操作は、すみやかな操作という要請に十分に応えることはできない。IoT/M2Mシステムを構成する携帯式電子機器から操作コマンドを送る方法も同様である。 One problem in the operation of the home appliance is that the user who intends to operate it can operate immediately on the spot. The dedicated remote controller cannot be said to be within the reach of the user's hand at the moment of operation, and the button operation cannot sufficiently meet the demand for prompt operation. The same applies to the method of sending an operation command from the portable electronic device constituting the IoT / M2M system.
このような課題に応える1つの方法として、カメラでユーザのジェスチャを撮影して操作する方法がある。また、音声認識装置を搭載するホーム・アプライアンスまたはIoT/M2Mシステムが、ユーザ発声した、「オープン」、「クローズ」などのような言語コマンドを認識して対応する操作をする方法もある。しかし、画像認識装置および音声認識装置はシステムの規模が大がかりであることや認識精度などの問題が残る。 One method for responding to such a problem is a method of photographing and manipulating a user's gesture with a camera. There is also a method in which a home appliance or an IoT / M2M system equipped with a voice recognition device recognizes a language command such as “open” or “close” uttered by a user and performs a corresponding operation. However, the image recognition apparatus and the voice recognition apparatus have problems such as the large scale of the system and the recognition accuracy.
そこで本発明の目的は、単純な操作音を利用して対象装置を操作する方法を提供することにある。さらに本発明の目的は、ユーザが意図するときにただちに対象装置を操作できる方法を提供することにある。さらに本発明の目的は、そのような方法を実現する音響操作システム、制御装置、ネットワーク・サーバ、携帯式電子機器およびコンピュータ・プログラムを提供することにある。 Therefore, an object of the present invention is to provide a method for operating a target apparatus using simple operation sounds. A further object of the present invention is to provide a method capable of operating a target device immediately when the user intends. It is another object of the present invention to provide an acoustic operation system, a control device, a network server, a portable electronic device, and a computer program that realize such a method.
本発明は、複数の対象装置の中から音響操作で選択した目的対象装置を操作する音響操作システムを提供する。音響操作システムは、第1の操作位置と第2の操作位置で音源が生成した操作音を検出する複数の対象マイクロフォンを利用して操作音のデータを受け取り、音源から対象マイクロフォンまでの操作音の伝搬時間に基づいて、第1の操作位置から対象マイクロフォンまでの第1の音源距離および第2の操作位置から対象マイクロフォンまでの第2の音源距離を計算する音源距離計算部と、第1の音源距離、第2の音源距離および第1の操作位置から第2の操作位置までの移動距離に基づいて選択した対象マイクロフォンに関連する目的対象装置を特定する対象装置特定部を有する。 The present invention provides an acoustic operation system for operating a target target device selected by acoustic operation from among a plurality of target devices. The acoustic operation system receives operation sound data using a plurality of target microphones that detect operation sounds generated by the sound source at the first operation position and the second operation position, and receives operation sound data from the sound source to the target microphone. A sound source distance calculation unit that calculates a first sound source distance from the first operation position to the target microphone and a second sound source distance from the second operation position to the target microphone based on the propagation time; and a first sound source A target device specifying unit that specifies a target device related to the target microphone selected based on the distance, the second sound source distance, and the moving distance from the first operation position to the second operation position;
操作音は空間において指向性を有しないが、音響操作システムは、第1の操作位置と第2の操作位置で発生した操作音の伝搬時間と移動距離を計算することで、操作音にユーザが意図する方向情報を抽出する。本発明では、音声認識をする必要がないため、指を鳴らしたり掌を叩いたりあるいは携帯式電子機器の筐体を叩いたりする単純なユーザの人体の動きによって操作音を生成するだけで実現できるため、ユーザがその場でただちに操作するのに都合がよい。なお、本発明ではユーザが発生する音声を単純な操作音として利用することもできる。対象マイクロフォンは、対象装置に搭載されていてもよい。 Although the operation sound does not have directivity in space, the acoustic operation system calculates the propagation time and movement distance of the operation sound generated at the first operation position and the second operation position, so that the user can obtain the operation sound. Extract the intended direction information. In the present invention, since it is not necessary to perform voice recognition, it can be realized only by generating an operation sound by a simple user's movement of the user, such as ringing a finger, hitting a palm, or hitting a casing of a portable electronic device. Therefore, it is convenient for the user to operate immediately on the spot. In the present invention, the voice generated by the user can be used as a simple operation sound. The target microphone may be mounted on the target device.
第2の操作位置は、目的対象装置に関連付けられた対象マイクロフォンから第1の操作位置に向かう方向に存在するように設定することができる。この場合、ユーザは第1の操作位置で音響操作をしたあとに、目的対象装置に関連付けられた対象マイクロフォンを目安にして第2の操作位置を選択することで、音響操作システムに容易に目的対象装置を選択する意思を伝えることができる。 The second operation position can be set so as to exist in a direction from the target microphone associated with the target target device toward the first operation position. In this case, after the user performs an acoustic operation at the first operation position, the user can easily select the second operation position using the target microphone associated with the target device as a guide, so that the user can easily perform the target operation on the acoustic operation system. Can communicate the intention of selecting a device.
音源距離計算部は、操作音の生成時刻と対象マイクロフォンが検出した操作音の検出時刻の時間差から第1の音源距離および第2の音源距離を計算することができる。また、音源距離計算部は、第1の操作位置および第2の操作位置において音源から既知の参照距離に配置した参照マイクロフォンを利用して操作音のデータを受信し、対象マイクロフォンが検出した操作音の検出時刻、参照マイクロフォンが検出した操作音の検出時刻および参照距離を利用して第1の音源距離および第2の音源距離を計算することができる。この場合、音源が生成した操作音の生成時刻を取得する必要がないため、指先や掌のような人体の部位を音源にすることが可能になる。 The sound source distance calculation unit can calculate the first sound source distance and the second sound source distance from the time difference between the operation sound generation time and the operation sound detection time detected by the target microphone. The sound source distance calculation unit receives operation sound data using a reference microphone disposed at a known reference distance from the sound source at the first operation position and the second operation position, and the operation sound detected by the target microphone. The first sound source distance and the second sound source distance can be calculated using the detected time, the detection time of the operation sound detected by the reference microphone, and the reference distance. In this case, since it is not necessary to acquire the generation time of the operation sound generated by the sound source, a human body part such as a fingertip or a palm can be used as the sound source.
参照マイクロフォンをユーザが装着するウェアラブル・デバイスに搭載し、音源をユーザの指先または掌とすることができる。この場合、第1の操作位置と第2の操作位置で参照距離を保ちながら音源を容易に第2の操作位置に移動させることができる。さらに、指先や掌による操作音の生成は、直感的かつ迅速な操作を可能にする。参照マイクロフォンをユーザが保持して使用する携帯式電子機器に搭載し、音源を携帯式電子機器の筐体の一部とすることができる。 The reference microphone can be mounted on a wearable device worn by the user, and the sound source can be the fingertip or palm of the user. In this case, the sound source can be easily moved to the second operation position while maintaining the reference distance between the first operation position and the second operation position. Furthermore, the operation sound generated by the fingertip or palm enables an intuitive and quick operation. The reference microphone can be mounted on a portable electronic device that is held and used by the user, and the sound source can be a part of the casing of the portable electronic device.
対象マイクロフォンおよび参照マイクロフォンが検出した雑音を含む検出音から操作音の時間的な発生パターンに基づいて音響操作の有効性を判断する音響操作認識部を備えれば、雑音による誤操作を防ぐことができる。音響操作認識部は、対象マイクロフォンが検出した検出音の検出時刻と参照マイクロフォンが検出した検出音の検出時刻の差に基づいて同一の発生音について対象マイクロフォンと参照マイクロフォンが検出した検出音のペアが操作音のペアを形成しないと判断したときに、音響操作を無効にすることができる。この場合、雑音を誤って操作音と認識したときや、対象マイクロフォンの音響データから操作音を認識できないようなときの誤操作を防ぐことができる。 Providing an acoustic operation recognition unit that determines the effectiveness of an acoustic operation based on a temporal generation pattern of an operation sound from detection sounds including noise detected by the target microphone and the reference microphone can prevent erroneous operation due to noise. . The acoustic operation recognizing unit generates a pair of detection sounds detected by the target microphone and the reference microphone for the same generated sound based on a difference between the detection time of the detection sound detected by the target microphone and the detection time of the detection sound detected by the reference microphone. When it is determined not to form a pair of operation sounds, the acoustic operation can be invalidated. In this case, it is possible to prevent erroneous operation when noise is mistakenly recognized as an operation sound or when the operation sound cannot be recognized from the acoustic data of the target microphone.
音響操作認識部は、参照マイクロフォンまたは対象マイクロフォンが検出した先行する検出音の検出時刻と後続の検出音の検出時刻の時間差が所定値以上のときに、当該検出音を破棄して検出音から雑音を取り除くことができる。音響操作システムは、第1の操作位置および第2の操作位置においてそれぞれ生成した複数個の操作音に対応する操作コマンドを目的対象装置に出力する操作コマンド生成部を有していてもよい。 When the time difference between the detection time of the preceding detection sound detected by the reference microphone or the target microphone and the detection time of the subsequent detection sound is equal to or greater than a predetermined value, the acoustic operation recognition unit discards the detection sound and generates noise from the detection sound. Can be removed. The acoustic operation system may include an operation command generation unit that outputs operation commands corresponding to a plurality of operation sounds respectively generated at the first operation position and the second operation position to the target device.
本発明の第2の態様は、複数の対象装置の中から選択した目的対象装置を音響操作に応じて音響操作システムが操作する方法を提供する。音源が第1の操作位置で生成した操作音と第2の操作位置で生成した操作音を複数の対象装置が検出する。つづいて音源から対象装置までの操作音の伝搬時間に基づいて、第1の操作位置から対象装置までの第1の音源距離および第2の操作位置から対象装置までの第2の音源距離を計算する。第1の操作位置と第2の操作位置の移動距離を取得する。つづいて、第1の音源距離、第2の音源距離および移動距離に基づいて目的対象装置を特定する。つづいて、目的対象装置に操作コマンドを送る。 A second aspect of the present invention provides a method in which an acoustic operation system operates a target target device selected from a plurality of target devices according to an acoustic operation. The plurality of target devices detect the operation sound generated by the sound source at the first operation position and the operation sound generated at the second operation position. Subsequently, based on the propagation time of the operation sound from the sound source to the target device, the first sound source distance from the first operation position to the target device and the second sound source distance from the second operation position to the target device are calculated. To do. The movement distance between the first operation position and the second operation position is acquired. Subsequently, the target device is specified based on the first sound source distance, the second sound source distance, and the movement distance. Subsequently, an operation command is sent to the target device.
第2の操作位置が、第1の操作位置から目的対象装置に向かう方向に存在する場合に、第1の音源距離と第2の音源距離の差から参照距離を減算した評価パラメータを所定の閾値と比較することで目的対象装置を特定することができる。あるいは複数の対象装置についてそれぞれ計算した評価パラメータを相互に比較することで目的対象装置を特定することができる。 When the second operation position is present in the direction from the first operation position toward the target device, an evaluation parameter obtained by subtracting the reference distance from the difference between the first sound source distance and the second sound source distance is set to a predetermined threshold value. The target device can be specified by comparing with. Alternatively, the target target device can be specified by comparing the evaluation parameters calculated for each of the plurality of target devices.
音源から既知の参照距離で操作音を検出した第1の検出時刻を取得し、複数の対象装置が操作音を検出した第2の検出時刻を取得し、第2の検出時刻と第1の検出時刻の差を計算して、第1の音源距離と第2の音源距離を計算することができる。第1の操作位置で第1の個数の操作音を検出し、第2の操作位置で第2の個数の操作音を検出し、第1の個数と第2の個数の組み合わせで複数の操作コマンドを生成し、第1の個数または第2の個数が所定値以上のときに音響操作を無効にすることができる。 The first detection time at which the operation sound is detected at a known reference distance from the sound source is acquired, the second detection time at which the plurality of target devices detect the operation sound is acquired, the second detection time and the first detection time By calculating the time difference, the first sound source distance and the second sound source distance can be calculated. A first number of operation sounds are detected at the first operation position, a second number of operation sounds are detected at the second operation position, and a plurality of operation commands are combined by combining the first number and the second number. And the acoustic operation can be disabled when the first number or the second number is equal to or greater than a predetermined value.
本発明により、単純な操作音を利用して対象装置を操作する方法を提供することができた。さらに本発明により、ユーザが意図するときにただちに対象装置を操作できるようにする方法を提供することができた。さらに本発明により、そのような方法を実現する音響操作システム、制御装置、ネットワーク・サーバおよび携帯式電子機器を提供することができた。 According to the present invention, it is possible to provide a method for operating a target apparatus using simple operation sounds. Furthermore, according to the present invention, it is possible to provide a method that allows the target device to be operated immediately when the user intends. Furthermore, according to the present invention, an acoustic operation system, a control device, a network server, and a portable electronic device that realize such a method can be provided.
[定義]
本願明細書で使用する用語の意味を説明する。操作音は、ユーザが音響操作により発生させる時間軸上での離散的な音を意味する。音響操作は、ユーザが第1の操作位置と第2の操作位置のそれぞれで1個または複数個の操作音を生成して複数の対象装置の中から操作を意図する目的対象装置を選択して制御する操作を意味する。発生音は、操作音と雑音を含んだ音響操作の実行環境で発生するすべての音を意味する。検出音は、音響操作システムが検出した発生音を意味する。
[Definition]
The meanings of terms used in this specification will be described. The operation sound means a discrete sound on the time axis that is generated by a sound operation by the user. In the acoustic operation, the user generates one or a plurality of operation sounds at each of the first operation position and the second operation position, and selects a target target device intended for the operation from the plurality of target devices. Means the operation to be controlled. The generated sound means all sounds generated in the acoustic operation execution environment including the operation sound and noise. The detected sound means a generated sound detected by the acoustic operation system.
[音響操作システム]
図1は、本実施の形態にかかる音響操作システム100の概要を説明するための図である。図2は、音響操作システム100を構成する参照デバイス15の一例を説明するための図である。ユーザ10が存在する3次元空間には、操作対象となる対象装置13a〜13e、ネットワーク・サーバ11および参照デバイス15が存在する。対象装置13a〜13eは特に限定する必要はないが、一例として、空調機、照明装置、テレビ、ドア施錠装置、およびカーテンなどのホーム・アプライアンスとすることができる。対象装置13a〜13eは、それぞれマイクロフォン201a〜201eを搭載している。
[Sound operation system]
FIG. 1 is a diagram for explaining the outline of the
マイクロフォン201a〜201eは必ずしも対象装置13a〜13eに搭載する必要はなく、対応する対象装置13a〜13eに接続され、かつ、ユーザにとって両者の関連性が理解できるようになっていればよい。以下においては、対象装置13a〜13e、およびマイクロフォン201a〜201eを個々に区別する必要がないときは、それらを総称して対象装置13、およびマイクロフォン201と記載することにする。対象装置13と記載した場合には、単一の対象装置を示す場合と複数の対象装置を示す場合がある。
The
ユーザ10は、複数の対象装置13のなかから選択した対象装置13d(たとえばテレビ)に、ネットワーク・サーバ11を通じてオン/オフや音量調整などの操作コマンドを送ろうとしている。対象装置13は、既存のリモート・コントローラやネットワーク・デバイスとの操作を併用してもよい。ユーザ10は、対象装置13dの選択と操作コマンドの送信を第1の操作位置18aと第2の操作位置18bにおける音響操作で行う。
The
ユーザ10と対象装置13dの間には、第1の操作位置18aで音響操作をした後に音響操作を行う第2の操作位置18bを決めるための仮想的な方向直線19を定義する。ユーザ10は、第1の操作位置18aで音響操作をした後に、方向直線19を意識しながら第2の操作位置18bを決めることができる。第1の操作位置18aと第2の操作位置18bの距離を移動距離d0ということにする。
A virtual directional
ユーザ10の手10aには、装着または保持といった態様で参照デバイス15が存在している。参照デバイス15はマイクロフォン301を搭載しており、操作音40を生成した音源17から各対象装置13までの距離を測定するための参照情報を提供する。参照デバイス15は、ユーザ10の手10aを音源にするのに都合がよく、かつ第1の操作場所18aから第2の操作場所18bまでの移動が容易な携帯式電子機器とすることができる。携帯式電子機器の一例として腕時計のように腕に装着するウェアラブル・デバイス15aを採用することができる(図2(A))。
The
図2でウェアラブル・デバイス15aは、マイクロフォン301aを実装している。参照デバイス15としてウェアラブル・デバイス15aを採用する場合は、ユーザが、親指に押し当てた中指をはじいて指を鳴らすことで、指先で操作音40aを生成する音源17aを構成することができる。音源17で発生した1個または複数個の操作音40aは、空中を球面状に伝搬してマイクロフォン301、201に到達する。
In FIG. 2, the
マイクロフォン301は、少なくともユーザが操作音40を生成する際に音源17から既知の参照距離rに存在すればよい。マイクロフォン201は音響操作の際に音源17から未知の距離に存在する。ウェアラブル・デバイス15aの場合は、音源17aとなる指先とマイクロフォン301aの参照距離rを一般的な人間の掌の大きさとしてあらかじめ想定しておくことができる。また、ウェアラブル・デバイス15aでは、空間をユーザ10が移動したり姿勢を変えたりしても参照距離rが変化しないので都合がよい。音源17aは、ユーザが指先に装着する器具や打楽器を利用して構成してもよい。
The
参照デバイス15としてのウェアラブル・デバイスは、めがねのように顔に装着したりベルトのように腰に装着したりするものでもよい。音源17aは、音響操作の際にマイクロフォン301aから既知の参照距離rに存在していれば指先に限定する必要はなく、ユーザ10の声でもよいしクラッピングする掌でもよい。このような音響操作は、リモート・コントローラやネットワーク・デバイスから操作するよりも、ユーザが意図するときにただちに直感的に行うことができる。参照デバイス15は、少なくとも操作音40を生成する際にマイクロフォン301が音源17から既知の参照距離rに存在するものであれば、ウェアラブル・デバイス15aに限定する必要はない。
The wearable device as the
図2(B)は、参照デバイス15の他の例としてユーザ10が手に保持して使用する携帯式電子機器15bを示している。携帯式電子機器15bは、マイクロフォン301bを搭載するスマートフォンやタブレット端末とすることができる。ユーザは、マイクロフォン301bから既知の参照距離にある筐体の所定の部位を指やペンで叩いて操作音40bを生成する。叩かれる筐体の所定の部位が音源17bとなる。操作音40bは空中を伝搬してマイクロフォン201に到達し、空中および筐体を伝搬してマイクロフォン301に到達する。
FIG. 2B shows a portable electronic device 15b that is held and used by the
音源17a、17bは、人体の単純な動作で操作音40a、40bを生成することができる。また、ウェアラブル・デバイス15aや携帯式電子機器15bは常にユーザの身近に存在する。したがって、ユーザが意図するときにただちに方向直線19上の第1の操作位置18a、第2の操作位置18bで音響操作をするのに都合がよい。また、音源17a、17bからマイクロフォン301a、301bまでの参照距離rは事前に想定でき、かつ、第1の操作位置18a、第2の操作位置18bで参照距離rを保つのに都合がよい。ただし、本発明は参照デバイス15および音源17をここに例示した範囲に限定するものではなく、本発明の思想を逸脱しない範囲で当業者が容易に想起できるさまざまな参照デバイス15および音源17を採用することができる。
The
図1に戻って、音響操作システム100は原理上、方向直線19上に複数の対象装置13が重なって存在しないことを前提にする。参照デバイス15と対象装置13は、無線ネットワークでネットワーク・サーバ11に接続している。無線ネットワークの規格は特に限定する必要はなく、無線LANやBluetooth(登録商標)などを採用することができる。なお、本発明は有線ネットワークの適用を排除しない。特にネットワーク・サーバ11と対象装置13は、位置を変化させる必要がないため、有線ネットワークで接続しても音響操作には支障がない。
Returning to FIG. 1, the
ネットワーク・サーバ11は、ネットワークを通じて参照デバイス15および対象装置13と操作音40の処理に必要なデータをリアルタイムで交換する。一例において、ネットワーク・サーバ11は、操作音40を処理して、対象装置13を操作するための操作コマンドを生成する。参照デバイス15、対象装置13およびネットワーク・サーバ11は、一例においてIoT/M2Mシステムとして構成することができる。他の例では、ネットワーク・サーバ11を利用しないで、操作音40の処理に必要なデータを参照デバイス15または対象装置13の一方が処理したり、両方で分散して処理したりすることもできる。
The
音源17で発生した操作音40は、ほぼ球面波となって対象装置13まで伝搬する。音源17は、無指向性の点音源とすることができる。音響操作システム100は、操作音40を時間軸上で離散的に存在する物理的な音として利用するため、操作音40はユーザ10と対象装置13を関連付けるための方向の情報を保有する必要がない。したがって、各対象装置13のマイクロフォン201が操作音40を検出しただけでは、ユーザ10が操作を意図する対象装置13dを特定することができない。ここで、たとえば同じ操作音40を検出するマイクロフォン201c、201dは音源17からの距離が相違するため伝搬時間に差が生ずることに着目する。本実施の形態では以下に説明するように、伝搬時間の差を利用して、方向直線19上に存在する対象装置13dとそれ以外の対象装置を区別して操作を意図する対象装置13dを特定する。
The
音響操作は、第1の操作位置18aおよび第2の操作位置で操作音40を生成する。ユーザ10は、第1の操作位置18aで1回目の操作音40を生成し、第1の操作位置18aと対象装置13dのマイクロフォン201dを結ぶ方向直線19上の第2の操作位置18bで2回目の操作音を生成する。このとき参照デバイス15のマイクロフォン301と音源17はともに既知の参照距離rを保ちながら第1の操作位置から第2の操作位置まで移動する。
The acoustic operation generates an
参照デバイス15および対象装置13は、同じ操作音40を異なる検出時刻で検出する。参照デバイス15と各対象装置13は操作音40を瞬時にデータ化してネットワーク・サーバ11に送る。ネットワーク・サーバ11は、第1の操作位置18aおよび第2の操作位置18bにおける音源17から各対象装置13が搭載するマイクロフォン201までの操作音の伝搬時間の差、および参照距離rに基づいて各マイクロフォン201と音源17の距離を計算することができる。各マイクロフォン201と音源17の距離を音源距離d(図3)という。音源距離dに対して対象装置13のサイズが十分に小さい場合は、音源距離dを対象装置13と音源17の距離として扱うことができる。
The
2つの操作位置18a、18bでそれぞれ計算した音源距離dは、ユーザが操作を意図する対象装置13dを他の対象装置から区別する情報を与える。ネットワーク・サーバ11は、特定した対象装置13dにあらかじめ定義した操作コマンドを送る。音響操作は、第1の操作位置18aおよび第2の操作位置18bでそれぞれ1個の操作音40を生成してもよい。
The sound source distance d calculated at each of the two
この場合、対象装置13に対して現在の状態を変更する1個の情報を操作コマンドで送ることができる。具体的には、動作している対象装置を停止させたり、停止している対象装置を動作させたりする操作コマンドを送ることができる。操作コマンドの数をさらに増やすために、第1の操作位置18aおよび第2の操作位置18bでそれぞれ連続的に複数個の操作音40を生成することができる。第1の操作位置18aと第2の操作位置18bのそれぞれにおける操作音40の数の複数の組み合わせに対して複数の操作コマンドを対応付けることができる。
In this case, one piece of information for changing the current state can be sent to the
[音源距離の計算]
つぎに図3を参照して、操作音40を検出して音源17から対象装置13までの音源距離dを計算する方法を説明する。操作音40の発生時刻をt0とし、音源17とマイクロフォン301の参照距離をrとし、音源17とマイクロフォン201の音源距離をdとする。図3(A)は、マイクロフォン301、音源17およびマイクロフォン201の空間的な位置関係に対応する図で、図3(B)はそれらを時間軸上に配置した図である。マイクロフォン301は少なくとも音響操作をする際に、音源17を中心とし参照距離rを半径とする円16上に存在する。
[Calculation of sound source distance]
Next, a method for detecting the
任意の発生時刻t0でユーザ10が音響操作をする。音源17で発生した操作音40は音速sで空間を伝搬する。マイクロフォン301は操作音40を検出時刻t1で検出し、マイクロフォン201は同じ操作音40を検出時刻t2で検出する。操作音40がマイクロフォン301まで伝搬する時間tt1は空気中の音速をsとしたとき、tt1=t1−t0=r/sとなる。したがって、ネットワーク・サーバ11はマイクロフォン301の検出音を利用すると操作音40の発生時刻t0を、t0=t1−r/sで計算することができる。操作音40がマイクロフォン201まで伝搬する時間tt2は、tt2=t2−t0=d/sとなる。したがってネットワーク・サーバ11は音源距離dを
d=(t2−t0)s (1)
で計算することができる。
The
Can be calculated with
式(1)で音源距離dを計算するネットワーク・サーバ11は、音源17が操作音40を生成する発生時刻t0を電気的に取得する必要がある。たとえば、参照デバイス15が、携帯式電子機器15bの場合は、音源17bの直下に操作音、振動、または圧力などを検知するセンサを設けて、センサが動作した時刻を発生時刻t0とすることができる。ここで、式(1)は、マイクロフォン301が検出した検出時刻t1を使って、
d=(t2−t1)s+r (2)
で計算することができる。
The
d = (t2-t1) s + r (2)
Can be calculated with
t2−t1は、音源17からマイクロフォン301およびマイクロフォン201までの操作音40の伝搬時間の差に相当する。式(2)は、操作音40のマイクロフォン201での検出時刻t2、マイクロフォン301での検出時刻t1、および参照距離rを取得すれば音源距離dを計算できることを示している。式(2)は、指先や掌のような発生時刻t0を計時することが困難な音源17を採用する場合でも適用できる。
t2−t1 corresponds to a difference in propagation time of the
参照デバイス15が携帯式電子機器13bの場合は、マイクロフォン301bから参照距離rの筐体の所定の位置を叩いたときに、操作音40bが空気中と筐体を伝搬する。マイクロフォン301bが筐体を伝搬する検出する操作音40を検出する場合は、筐体の媒質の音速をmとすれば、t0=t1−r/mとなり、ネットワーク・サーバ11は音源距離dを、
d=(t2−t1)s+rs/m (3)
で計算することができる。
In the case where the
d = (t2-t1) s + rs / m (3)
Can be calculated with
[ユーザの操作を意図する対象装置の特定]
図4は、音源距離dと移動距離d0から操作を意図する対象装置13dを特定する方法を説明するための図である。ここでは、操作を意図する対象装置13dを対象装置13cから区別する場合を例にして説明するが、対象装置13dを他の対象装置から区別する原理も同様に理解することができる。ユーザ10は、最初に任意の操作位置18aに音源17を位置付けて操作音40を生成する。
[Identification of target device intended for user operation]
FIG. 4 is a diagram for explaining a method of specifying the
任意の操作位置18aは、ユーザが操作を意図した場所として自由に選択することができる。ネットワーク・サーバ11は、図3を参照して説明した方法で、操作位置18aからマイクロフォン201c、201dまでの音源距離d1、d3を計算する。つぎにユーザ10は方向直線19上の対象装置13dに近い第2の操作位置18bに音源17を位置付けて操作音40を生成する。第2の操作位置18bは、第1の操作位置18aに対して、対象装置13dより遠い位置とすることもできる。移動距離d0はあらかじめ決めておいてもよいが、本実施の形態では任意の移動距離dを後に説明するように参照デバイス15を利用して、または他の方法でネットワーク・サーバ11が計測する。
The
第2の操作位置18bは、厳密に方向直線19上に存在する必要はない。第2の操作位置18bが方向直線17から離れるときの許容値は、音響操作システム100の対象装置13に対する分解能または対象装置13の相互間の距離に依存する。ネットワーク・サーバ11は図3で説明した方法で、第2の操作位置18bからマイクロフォン201c、201dまでの音源距離d2、d4を計算する。第1の操作位置18aにおける参照距離rと、第2の操作位置18bにおける参照距離rはネットワーク・サーバ11が距離を認識していれば異なる値でもよい。
The
ネットワーク・サーバ11は、音源距離d1、d2の差および音源距離d3、d4の差を計算する。ここで、音源距離d1、d2の差の絶対値および音源距離d3、d4の差の絶対値をそれぞれΔ12、Δ34とする。第2の操作位置18bがほぼ方向直線19上に存在すれば、対象装置13dに関するΔ12は、Δ12=abs(d1−d2)≒d0となる。また、対象装置13cに関するΔ34は、三角形の3つの辺の大小関係より、移動距離d0より小さくなって、Δ34=abs(d3−d4)≠d0となる。
The
ここで、Δ12およびΔ34と移動距離d0の差を評価パラメータZということにする。ユーザが操作を意図する対象装置13dの評価パラメータZは、他の対象装置13cの評価パラメータZよりも小さくなる。この性質を利用してネットワーク・サーバ11は、以下の方法で評価パラメータZから対象装置13dを特定することができる。
Here, the difference between Δ12 and Δ34 and the movement distance d0 is referred to as an evaluation parameter Z. The evaluation parameter Z of the
第1の方法では、ネットワーク・サーバ11が、第1の操作位置18aにおける音源距離をdpとし、第2の操作位置18bにおける音源距離をdqとして、すべての対象装置13について評価パラメータZを計算する。ネットワーク・サーバ11は、評価パラメータZに対して所定の閾値Thを設定して、式(4)を満たす対象装置13をユーザが操作を意図する対象装置13dであると認識することができる。
In the first method, the
Z=abs(dp−dq)−d0<Th (4)
式(4)は、評価パラメータZを閾値Thで絶対値評価しているため、ユーザが不用意に行った音響操作に対して、いずれの対象装置13も反応しないようにすることができる。他方で閾値Thを操作環境ごとに設定する必要があり、第2の操作位置18bが方向直線19から外れる程度によっては、対象装置13dを特定できない場合もでてくる。
Z = abs (dp−dq) −d0 <Th (4)
In Expression (4), since the absolute value of the evaluation parameter Z is evaluated with the threshold Th, it is possible to prevent any
第2の方法では、すべての対象装置13について計算した評価パラメータZの中で、式(5)を満たすように評価パラメータZが最小を示した対象装置13dを操作対象として特定することができる。
Z=abs(dp−dq)−d0=min (5)
式(5)は、評価パラメータZを相対値評価しているため、第2の操作位置18bが方向直線19から外れても、操作直線19に最も近いいずれかの対象装置13が特定される。ただし、ユーザが不用意に行った音響操作に対してもいずれかの対象装置13が反応することになる。いずれの特定方法を採用するかは、音響操作システム100を導入する環境に基づいて選択することができる。
In the second method, among the evaluation parameters Z calculated for all the
Z = abs (dp−dq) −d0 = min (5)
Since Expression (5) evaluates the evaluation parameter Z as a relative value, even if the
[音響操作システム]
図5は、音響操作システム100の構成の一例を説明するための概略の機能ブロック図である。音響操作システム100は一例において、複数の対象装置13、参照デバイス15およびネットワーク・サーバ11で構成する。音響操作システム100は、他の例において図10、図11を参照して説明するように、ネットワーク・サーバ11を利用しないで構成することもできる。対象装置13、参照デバイス15およびネットワーク・サーバ11はペアリングを完了すると、ネットワークを通じてデータ交換をして音響操作システム100としてまとまりのある動作をする。ネットワークを通じたデータ交換の速度は、音響が空間や個体媒質を伝搬する時間よりも十分に短い。
[Sound operation system]
FIG. 5 is a schematic functional block diagram for explaining an example of the configuration of the
複数の対象装置13はそれぞれ、操作音40を検出するマイクロフォン201、A/D変換部203、対象装置機能205、対象装置操作部207およびネットワーク・インターフェース209を備えている。対象装置機能205は、たとえば、テレビ、空調機といった各ホーム・アプライアンスの本来の機能に相当する。対象装置操作部207は、ネットワーク・サーバ11から操作コマンドを受け取って対象装置機能205を制御する。対象装置操作部207は、赤外線式のリモート・コントローラから操作信号を受け取って対象装置機能205を制御してもよい。
Each of the plurality of
参照デバイス15は、マイクロフォン301、A/D変換部303、モーション・センサ305、A/D変換部307およびネットワーク・インターフェース309を備えている。モーション・センサ305は、加速度、角速度および地磁気をそれぞれ3軸で検出する。モーション・センサ305は、第1の操作位置18aから第2の操作位置18bまでの移動距離d0を計測するための状態信号を出力する。A/D変換部203、303、307は、マイクロフォン201,301またはモーション・センサ305から受け取ったアナログ信号に対して標本化処理および量子化処理をしてディジタル・データに変換し、ネットワーク・サーバ11に出力する。
The
ネットワーク・サーバ11は、ネットワーク・インターフェース401、音響操作認識部403、移動距離計算部405、計時部407、音源距離計算部409、対象装置特定部411および操作コマンド生成部413を含んでいる。これらの要素は、OSやアプリケーション・プログラムのようなソフトウェア資源とそれらを実行するCPU、チップ・セット、およびシステム・メモリなどのハードウェア資源の協働で構成することができる。ソフトウェア資源は、あらかじめネットワーク・サーバ11の不揮発性メモリに格納したり、ネットワークを通じてダウンロードしたりすることができる。
The
音響操作認識部403は、複数の対象装置13および参照デバイス15から受け取った検出音の音響データから、有効な音響操作を認識する。音響操作認識部403は、有効な音響操作を認識したときに、各対象装置13の検出時刻t2および参照デバイス15の検出時刻t1を音源距離計算部409および移動距離計算部405に送る。音響操作認識部403は、第1の操作位置18aおよび第2の操作位置18bで行われたそれぞれの操作音40の数を操作コマンド生成部413に送る。
The acoustic
計時部407は時刻を計時して、音響操作認識部403に提供する。音源距離計算部409は、あらかじめ音速s、m、および参照距離rを取得している。音源距離計算部409は、図3を参照して説明した方法で、各対象装置13について第1の操作位置18aおよび第2の操作位置18bにおける音源距離dを計算する。
The
移動距離計算部405は、検出時刻t1、t2におけるモーション・センサ305の状態信号から計算した移動距離d0を対象装置特定部411に送る。対象装置特定部411は、評価パラメータZを使った絶対値評価または相対値評価でユーザが操作を意図する対象デバイス13dを特定してその識別子を出力する。操作コマンド生成部413は、音響操作認識部403から受け取った第1の操作位置18a、第2の操作位置18bのそれぞれの操作音40の個数と、対象装置特定部411から受け取った対象装置13dの識別子から操作コマンドを生成してネットワーク・インターフェース401を通じて対象装置操作部207に出力する。
The movement
たとえば第1の操作位置18a、第2の操作位置18bでそれぞれ1個または2個の操作音を生成するときは、2つの操作位置18a、18bで行う1回の音響操作で、(1個,1個)、(1個,2個)、(2個,1個)、(2個,2個)の4つの操作情報を生成することができる。操作コマンド生成部413は、あらかじめ各対象装置13について、操作情報と操作コマンドを対応づけておくことができる。
For example, when one or two operation sounds are generated at the
[音響操作の認識]
つぎに、音響操作認識部403の動作の一例を図6、図7、図8を参照して説明する。図6は、参照デバイス15および対象装置13が検出した検出音30の波形の一例を模式的に示した図である。図7は音響操作認識部403が、各対象装置13について音響操作の有効性を判断する方法を説明するための図である。図8は、音響操作認識部403が音響操作の有効性を判断する手順を説明するためのフローチャートである。
[Sound operation recognition]
Next, an example of the operation of the acoustic
マイクロフォン201、301が検出する検出音30には操作音40に加えて雑音も含まれている。また検出音30の音圧レベルが小さいと音響操作認識部403は操作音40を認識できない。したがって、誤操作を防ぐために雑音と操作音40を区別する必要がある。また、複数個の操作音40で複数の操作コマンドを生成する場合は、連続して生成される後続の操作音40と、第2の操作位置18bで生成される操作音40を区別する必要がある。音響操作認識部403は、対象装置13および参照デバイス15から受け取った雑音を含む検出音30から有効な操作音40を認識して検出時刻および操作音40の個数を抽出する。
The
図6は、操作位置18a、18bにおいてそれぞれ最大3個の操作音で構成する音響操作を例示して、検出音30から音響操作の有効性を判断する方法の一例を説明するための図である。図6は、第1の操作位置18aにおいて発生時刻t0で発生した連続する2個の発生音について、参照デバイス15が検出した検出音31a、32aと、対象装置13が検出した検出音31b、32bを示している。図6はまた、第2の操作位置18bにおいて発生時刻t00で発生した連続する3個の発生音について、参照デバイス15が検出した検出音33a〜35aと、対象装置13が検出した検出音33b〜35bを示している。
FIG. 6 is a diagram for explaining an example of a method for determining the effectiveness of the acoustic operation from the
この時点で音響操作認識部403は発生時刻t0、t00を認識せず、また、検出音30と操作場所18a、18bの関係を認識していない。音響操作認識部403は検出音30に対して、第1の操作位置18aおよび第2の操作位置18bで最初に検出した検出音31a、33aの検出時刻t0、t00からの経過時間に、それぞれの操作位置18a、18bで音響操作を完了するまでの閾値Th1を設定している。第1の操作位置18aおよび第2の操作位置18bを認識する方法は後に説明する。
At this time, the acoustic
また、音響操作認識部403は検出音30に対して、第1の操作位置18aで最初に検出した検出音31aの検出時刻t0からの経過時間に、第2の操作位置18bでの音響操作を開始および終了するまでの時間としての閾値Th2、Th3を設定している。最小の閾値Th2は、第1の操作位置18aから第2の操作位置18bまで音源17が移動するまでの移動時間の最小値に基づいて設定することができる。最大の閾値Th3は、第1の操作位置18aで音響操作をしたのちに第2の操作位置18bで音響操作をしない場合に、音響操作システム100が今回の音響操作をリセットするまでの許容時間に基づいて設定することができる。
In addition, the acoustic
図8のブロック501で音響操作認識部403はリセットされている。リセットされた音響操作認識部403は、リセット後に最初に取得した検出音31a、31bを、第1の操作位置18aで生成されたものとして扱う。音響操作認識部403は、各対象装置13および参照デバイス15から音響データを受信して検出音30の分析を開始する。ブロック503で音響操作認識部403は、時間軸上で離散的に存在する各検出音30の発生時刻と消滅時刻を特定するために、一例において振幅に対して所定の振幅レベル36を設定する。音響操作認識部403は、音源17から対象装置13までの音源距離dが長い場合に、必要に応じて音圧レベルの減衰を補正するために波形処理をすることができる。
In
音響操作認識部403は、振幅レベル36で各検出音30の検出時刻と消滅時刻を特定して持続時間wを計算する。音響操作認識部403は、あらかじめ音源17が生成する操作音40の持続時間や周波数成分などの特徴情報を登録しておく。音響操作認識部403は、検出音30の持続時間wに対して、下限の閾値Th4および上限の閾値Th5を設定し、
Th4<w≦Th5 (6)
を満たさない検出音を雑音とみなすことができる。音響操作認識部403は、登録した周波数成分と検出音30の周波数成分とを比較して操作音40か否かを認識する。音響操作認識部403は、ブロック551で持続時間wや周波数成分から操作音40として認識できない検出音30を雑音として破棄することができる。
The acoustic
Th4 <w ≦ Th5 (6)
Detected sound that does not satisfy can be regarded as noise. The acoustic
ブロック505で音響操作認識部403は、各検出音30の検出時刻に基づいて先行する検出音と後続の検出音の時間差aを計算する。図6では、検出音31a、32aの時間差a1、検出音33a、34aの時間差a2、検出音34a、35aの時間差a3を示している。対象装置13が検出した検出音についての時間差aも同様に計算することができる。なお、第1の操作位置18aで最後に検出した検出音32aと第2の操作位置18bで最初に検出した検出音33aの時間差は時間差aから除外する。
In
音響操作認識部403は、時間差aに対して最小の閾値Th6および最大の閾値Th7を設定する。最小の閾値Th6は、ユーザが連続的に操作音40を生成することができる最小の時間差に基づいて設定し、最大の閾値Th7は、閾値Th1と操作音の個数から設定することができる。音響操作認識部403は、
Th6<a≦Th7 (7)
の条件を満たさない後続の検出音30を雑音と見なしてブロック551で破棄することができる。
The acoustic
Th6 <a ≦ Th7 (7)
The
ここまでの手順で処理された検出音30は、操作音40であっても十分な音圧レベルがないために雑音として破棄されたり、ブロック503、505で分別できない雑音が混入していたりする可能性がある。本実施の形態では、さらに以下の手順を実行して音響操作認識部403が、検出音30の時間的発生パターンに基づいて音響操作の有効性を判断することができる。音響操作システム100は、図3を参照して説明したように音源距離dを計測するために、同一の操作音40について、参照デバイス15が検出した操作音40と各対象装置13が検出した操作音40で、操作音40のペアを形成する必要がある。
The detected
ブロック507で音響操作認識部403は、音響操作の有効性を判断するために、雑音を含む同一の発生音に対する検出音30のペア候補が操作音40のペアを形成するか否かを判断する。音響操作認識部403は、対象装置13で検出したたとえば検出音31bに対して、参照デバイス15が検出した先行する最も近い検出音(この場合検出音31a)を検出音30のペア候補として選択することができる。図6は、検出音30のペア候補(31a,31b)、(32a,32b)、(33a,33b)、(34a,34b)および(35a,35b)を示している。
In
音響操作システム100は、音響操作の利用環境における音源距離dの最大値を、あらかじめ想定することができる。音響操作認識部403は、検出音30のペア候補の有効性を判断するために、検出時刻の時間差(t2−t1)に対して最小の閾値Th8と最大の閾値Th9を設定する。最小の閾値Th8は、想定する最小の音源距離dと参照距離rとの差に基づいて設定することができる。最大の閾値値Th9は、想定する最大の音源距離dと参照距離rとの差に基づいて設定することができる。
The
音響操作認識部403は検出音30のペア候補が、
Th8<(t2−t1)≦Th9 (8)
を満たさないときに当該対象装置13については操作音40のペアが形成できないため、ブロック553で音響操作を無効として扱う。式(8)を満たす対象装置13については、ブロック509に移行する。図7(A)は、対象装置13が検出音31bを検出しないために、音響操作認識部403は、後続の検出音32bと先行する検出音31aによる検出音30のペア候補が有効でないことを示している。
The acoustic
Th8 <(t2-t1) ≦ Th9 (8)
Since the pair of operation sounds 40 cannot be formed for the
音響操作認識部403は、各対象装置13について、リセット後に最初に検出した検出音31a、31bおよび式(7)を満たす後続の検出音32a、32bを第1の操作位置18aで発生した検出音30とみなす。音響操作認識部403は、閾値Th1を経過した後に最初に検出した検出音33a、33bおよび式(7)を満たす後続の検出音34a、35a、34b、35bを第2の操作位置18bで発生した検出音30とみなす。ブロック509で音響操作認識部403は、第1の操作位置18aで最初に検出した検出音31aと第2の操作位置18bで最初に検出した検出音33aの時間差bを計算する。対象装置13についても同様に計算することができる。
The acoustic
音響操作認識部403は、時間差bが
Th2<b≦Th3 (9)
を満たさないときに当該対象装置13については、ブロック553で当該音響操作を無効として扱う。式(9)を満たす対象装置13については、ブロック511に移行する。図7(B)は、検出音33aを検出するまでの時間差bが長すぎて、当該対象装置13については、音響操作認識部403がリセットされるときの様子を示している。
In the acoustic
When the
ブロック511で音響操作認識部403は、検出時刻t1から閾値Th1の間に検出した検出音30の数および、検出時刻t00から閾値Th1の間に検出した検出音30の数を計算する。音響操作認識部403は、検出音30の数が設定した最大個数(この場合は3個)を超える場合は、雑音が混入しているとみなして、当該対象装置13については、ブロック553で音響操作を無効として扱う。最大個数以下の対象装置13については、ブロック513に移行する。図7(C)は、閾値Th1の間に、4個の検出音31a、32a、36a、37aが検出されて音響操作が無効になるときの様子を示している。
In
ブロック513で音響操作認識部403は、有効な音響操作を認識した対象装置13について図9のブロック607に移行する。ブロック553で音響操作認識部403は、有効な音響操作を認識しない対象装置13について音響操作認識部403をリセットして図9のブロック603に移行し、新たに第1の操作位置18aで音響操作が行われるまで待機する。ブロック503〜511の手順は、音響操作の環境に応じて適宜選択して採用することができる。また、処理の順番は図8に例示したものに限定する必要はなく、たとえば、ブロック503、505は順番を入れ替えてもよく、また、ブロック507〜511も順番を入れ替えてもよい。
In
[音響操作システムの動作]
図9は音響操作システム100の動作を説明するためのフローチャートである。ブロック601で対象装置13、ネットワーク・サーバ11および参照デバイス15が相手のネットワーク・アドレスを取得して相互認証を完了し、ネットワークを構築している。ブロック603で音響操作認識部403は発生時刻t0、t00で検出音30を受け取る。
[Operation of acoustic operation system]
FIG. 9 is a flowchart for explaining the operation of the
ブロック605で音響操作認識部403は、図8の手順で各対象装置13について音響操作の有効性を判断する。ブロック607で音響操作認識部403は、音響操作が有効であると認識した対象装置13について、たとえば図6に例示した検出音30に対応する操作音40を認識する。音響操作認識部403は、第1の操作位置18aおよび第2の操作位置18bに関する検出時刻t1、t2、t11、t12を音源距離計算部409と移動距離計算部405に送る。
In block 605, the acoustic
ブロック609で音響操作認識部403は、第1の操作位置18aにおける操作音40の個数(2個)と第2の操作位置18bにおける操作音40の個数(3個)を操作コマンド生成部413に送る。ブロック611で移動距離計算部405は、検出時刻t1、t22と、モーション・センサ305が出力した状態データから移動距離d0を計算して対象装置特定部411に送る。
In
ブロック613で音源距離計算部409が各対象装置13について式(1)〜(3)のいずれかを利用して、各対象装置13について、第1の操作位置18aおよび第2の操作位置18bにおける音源距離dを計算する。ブロック615で対象装置特定部411は、音響操作認識部403が有効な音響操作を認識した対象装置について式(4)または式(5)のいずれかを適用し、操作を意図している対象装置13dを特定する。ブロック617で操作コマンド生成部413は、特定した対象装置13dの対象装置操作部207に対して、操作音の個数の組み合わせに対応する操作コマンドを出力して音響操作システム100をリセットする。
In
音響操作システム100は、ネットワーク・サーバ11の機能を対象装置13および参照デバイス15に分散することができる。たとえば、音響操作認識部403、計時部407を対象装置13および参照デバイス15に分散して搭載することもできる。計時部407を対象装置13および参照デバイス15に分散するときは、必要に応じてNTPサーバや同期コマンドを使って、分散した計時部407のRTC(Real Time Clock)を同期することができる。計時部407を分散するときは、音響操作認識部403は、対象装置13と参照デバイス15から検出時刻t1、t2を受け取るようにしてもよい。移動距離計算部405は参照デバイス15に実装することもできる。
The
マイクロフォン301と移動距離d0を測定するデバイスは参照デバイス15から分離することができる。このとき移動距離d0をモーション・センサ305に代えてステレオ・カメラで計測するようにしてもよい。音響操作システム100の分解能は、対象装置13の相互間の距離に依存する。音源距離dの測定精度は要求される分解能に相応のものにすることができる。この場合、図2(A)に示したように指を鳴らして操作音40aを生成するときに、第1の操作位置18aを胸の近くに設定し、前腕を伸ばした位置を第2の操作位置18bに設定して、標準的な上腕の長さを移動距離d0に設定するようにしてもよい。
The
[音響操作システムの他の構成例]
図10、図11は、音響操作システム600、700の構成を説明するための概略の機能ブロック図である。図10、図11では、図5と同一の要素または図5から容易に機能が理解できる要素に同一の参照番号を付して説明を省略する。音響操作システム600、700はネットワーク・サーバ11を利用しないで構成している。音響操作システム600はネットワークで接続した、参照デバイス605と対象装置603で構成している。音響操作システム600では、ネットワーク・サーバの機能を参照デバイス605に組み込んでいる。ネットワーク・インターフェース607には、複数の対象装置603が接続される。
[Other examples of acoustic operation system]
10 and 11 are schematic functional block diagrams for explaining the configuration of the acoustic operation systems 600 and 700. FIG. 10 and 11, the same reference numerals are given to the same elements as those in FIG. 5 or elements whose functions can be easily understood from FIG. The acoustic operation systems 600 and 700 are configured without using the
音響操作システム700は、対象装置703と参照デバイス705で構成している。音響操作システム700では、ネットワーク・サーバの機能を対象装置703に組み込んでいる。ネットワーク・インターフェース309には、複数の対象装置703が接続される。音響操作システム600、700においても、参照デバイス605および対象装置703が搭載する機能を分散することができる。本発明は図5、図10、図11で説明した音響操作システム100、600、700に限定するものではなく、所定の機能を他の方法で分散したり類似の機能を採用したりする場合も本発明の思想を含み当業者が容易に想起できるものは本発明の範囲に含む。
The acoustic operation system 700 includes a target device 703 and a
これまで本発明について図面に示した特定の実施の形態をもって説明してきたが、本発明は図面に示した実施の形態に限定されるものではなく、本発明の効果を奏する限り、これまで知られたいかなる構成であっても採用することができることはいうまでもないことである。 Although the present invention has been described with the specific embodiments shown in the drawings, the present invention is not limited to the embodiments shown in the drawings, and is known so far as long as the effects of the present invention are achieved. It goes without saying that any configuration can be adopted.
10 ユーザ
11 ネットワーク・サーバ
100、600、700 音響操作システム
13、13a〜13e、603、703 対象装置
15、605、705 参照デバイス
15a ウェアラブル・デバイス(参照デバイス)
15b 携帯式電子機器(参照デバイス)
17、17a、17b 音源
18a 第1の操作位置
18b 第2の操作位置
19 方向直線
30、31a〜35a、31b〜35b 検出音
40、41a〜45a、41b〜45b 操作音
201、201a〜201e、301、301a、301b マイクロフォン
d 音源距離
r 参照距離
10
15b Portable electronic device (reference device)
17, 17a,
Claims (20)
第1の操作位置と第2の操作位置で音源が生成した操作音を検出する複数の対象マイクロフォンを利用して前記操作音のデータを受信し、前記音源から前記対象マイクロフォンまでの前記操作音の伝搬時間に基づいて、前記第1の操作位置から前記対象マイクロフォンまでの第1の音源距離および前記第2の操作位置から前記対象マイクロフォンまでの第2の音源距離を計算する音源距離計算部と、
前記第1の音源距離、前記第2の音源距離、および前記第1の操作位置から前記第2の操作位置までの移動距離に基づいて選択した対象マイクロフォンに関連付けられた前記目的対象装置を特定する対象装置特定部と
を有する音響操作システム。 An acoustic operation system for operating a target target device selected by acoustic operation from a plurality of target devices,
The operation sound data is received using a plurality of target microphones that detect operation sounds generated by the sound source at the first operation position and the second operation position, and the operation sounds from the sound source to the target microphone are received. A sound source distance calculator that calculates a first sound source distance from the first operation position to the target microphone and a second sound source distance from the second operation position to the target microphone based on a propagation time;
The target device associated with the target microphone selected based on the first sound source distance, the second sound source distance, and the movement distance from the first operation position to the second operation position is specified. An acoustic operation system having a target device specifying unit.
音源が生成した操作音を検出できるように第1の操作位置と第2の操作位置で前記音源から既知の参照距離に配置した参照マイクロフォンを搭載する参照デバイスから前記操作音のデータを受け取る第1のインターフェースと、
前記第1の操作位置および前記第2の操作位置で前記音源が生成した前記操作音を検出する対象マイクロフォンをそれぞれ搭載する複数の対象装置から前記操作音のデータを受け取る第2のインターフェースと、
前記操作音の前記音源から前記対象マイクロフォンまでの伝搬時間と前記音源から前記参照マイクロフォンまでの伝搬時間の差と前記参照距離に基づいて前記対象マイクロフォンと前記第1の操作位置との第1の音源距離および対象マイクロフォンと前記第2の操作位置との第2の音源距離を計算する音源距離計算部と、
前記第1の音源距離、前記第2の音源距離および前記第1の操作位置から前記第2の操作位置までの移動距離に基づいて選択した参照マイクロフォンを搭載する前記目的対象装置を特定する対象装置特定部と、
前記第2のインターフェースを通じて前記目的対象装置に操作コマンドを送る操作コマンド生成部と
を有するネットワーク・サーバ。 A network server capable of configuring an acoustic operation system for operating a target target device selected by acoustic operation from a plurality of target devices,
A first operation sound data is received from a reference device having a reference microphone disposed at a known reference distance from the sound source at the first operation position and the second operation position so that the operation sound generated by the sound source can be detected. And the interface
A second interface for receiving the operation sound data from a plurality of target devices each including a target microphone for detecting the operation sound generated by the sound source at the first operation position and the second operation position;
A first sound source between the target microphone and the first operation position based on a difference between a propagation time of the operation sound from the sound source to the target microphone, a propagation time from the sound source to the reference microphone, and the reference distance A sound source distance calculating unit for calculating a distance and a second sound source distance between the target microphone and the second operation position;
A target device that identifies the target target device on which the reference microphone selected based on the first sound source distance, the second sound source distance, and the moving distance from the first operation position to the second operation position is mounted A specific part,
A network server including an operation command generation unit that transmits an operation command to the target device through the second interface;
音源が生成した操作音を検出できるように第1の操作位置と第2の操作位置で前記音源から既知の参照距離に配置した参照マイクロフォンを搭載する参照デバイスから前記操作音のデータを受け取るインターフェースと、
前記操作音を検出する対象マイクロフォンと、
前記操作音の前記音源から前記対象マイクロフォンまでの伝搬時間と前記音源から前記参照マイクロフォンまでの伝搬時間の差と前記参照距離に基づいて前記対象マイクロフォンと前記第1の操作位置との第1の音源距離および前記対象マイクロフォンと前記第2の操作位置との第2の音源距離を計算する音源距離計算部と、
前記第1の音源距離、前記第2の音源距離および前記第1の操作位置から前記第2の操作位置までの移動距離に基づいて目的対象装置であることを認識する対象装置特定部と
を有する制御装置。 A control device mounted on a target device that can be operated by acoustic operation,
An interface for receiving the operation sound data from a reference device having a reference microphone disposed at a known reference distance from the sound source at the first operation position and the second operation position so that the operation sound generated by the sound source can be detected; ,
A target microphone for detecting the operation sound;
A first sound source between the target microphone and the first operation position based on a difference between a propagation time of the operation sound from the sound source to the target microphone, a propagation time from the sound source to the reference microphone, and the reference distance A sound source distance calculation unit for calculating a distance and a second sound source distance between the target microphone and the second operation position;
A target device specifying unit that recognizes the target device based on the first sound source distance, the second sound source distance, and a moving distance from the first operation position to the second operation position. Control device.
音源が生成した操作音を検出できるように第1の操作位置と第2の操作位置で前記音源から既知の参照距離に配置した参照マイクロフォンと、
それぞれ対象マイクロフォンを搭載する前記複数の対象装置から前記操作音のデータを受け取るインターフェースと、
前記操作音の前記音源から前記対象マイクロフォンまでの伝搬時間と前記音源から前記参照マイクロフォンまでの伝搬時間の差と前記参照距離に基づいて前記対象マイクロフォンと前記第1の操作位置との第1の音源距離および前記対象マイクロフォンと前記第2の操作位置との第2の音源距離を計算する音源距離計算部と、
前記第1の音源距離、前記第2の音源距離および前記第1の操作位置から前記第2の操作位置までの移動距離に基づいて選択した前記目的対象装置を特定する対象装置特定部と、
前記インターフェースを通じて前記目的対象装置に操作コマンドを送る操作コマンド生成部と
を有する携帯式電子機器。 A portable electric device capable of operating a target target device selected by acoustic operation from a plurality of target devices,
A reference microphone disposed at a known reference distance from the sound source at the first operation position and the second operation position so that the operation sound generated by the sound source can be detected;
An interface for receiving the operation sound data from the plurality of target devices each having a target microphone;
A first sound source between the target microphone and the first operation position based on a difference between a propagation time of the operation sound from the sound source to the target microphone, a propagation time from the sound source to the reference microphone, and the reference distance A sound source distance calculation unit for calculating a distance and a second sound source distance between the target microphone and the second operation position;
A target device specifying unit for specifying the target target device selected based on the first sound source distance, the second sound source distance, and the movement distance from the first operation position to the second operation position;
A portable electronic device comprising: an operation command generation unit that transmits an operation command to the target device through the interface.
音源が第1の操作位置で生成した操作音と第2の操作位置で生成した操作音を前記複数の対象装置が検出するステップと、
前記音源から前記対象装置までの前記操作音の伝搬時間に基づいて前記第1の操作位置から前記対象装置までの第1の音源距離および前記第2の操作位置から前記対象装置までの第2の音源距離を計算するステップと、
前記第1の操作位置と前記第2の操作位置の移動距離を取得するステップと、
前記第1の音源距離、前記第2の音源距離および前記移動距離に基づいて前記目的対象装置を特定するステップと
前記目的対象装置に操作コマンドを送るステップと
を有する方法。 A method in which an acoustic operation system operates a target target device selected from a plurality of target devices according to an acoustic operation,
The plurality of target devices detecting an operation sound generated by the sound source at the first operation position and an operation sound generated at the second operation position;
Based on the propagation time of the operation sound from the sound source to the target device, a first sound source distance from the first operation position to the target device and a second distance from the second operation position to the target device. Calculating the sound source distance;
Obtaining a moving distance between the first operation position and the second operation position;
A method comprising: specifying the target device based on the first sound source distance, the second sound source distance, and the moving distance; and sending an operation command to the target device.
前記目的対象装置を特定するステップが、前記第1の音源距離と前記第2の音源距離の差から前記参照距離を減算した評価パラメータを所定の閾値と比較するステップを含む請求項15に記載の方法。 The second operation position exists in a direction from the first operation position toward the target device;
16. The step of identifying the target device includes comparing an evaluation parameter obtained by subtracting the reference distance from a difference between the first sound source distance and the second sound source distance with a predetermined threshold value. Method.
前記目的対象装置を特定するステップが、前記複数の対象装置についてそれぞれ計算した前記評価パラメータを相互に比較するステップを含む請求項16に記載の方法。 The second operation position exists in a direction from the first operation position toward the target device;
The method according to claim 16, wherein identifying the target device includes comparing the evaluation parameters calculated for the plurality of target devices with each other.
前記音源から既知の参照距離で前記操作音を検出した第1の検出時刻を取得するステップと、
前記複数の対象装置がそれぞれ前記操作音を検出した第2の検出時刻を取得するステップと、
前記第2の検出時刻と前記第1の検出時刻の差を計算するステップと
を有する請求項15に記載の方法。 Calculating the first sound source distance and the second sound source distance;
Obtaining a first detection time at which the operation sound is detected at a known reference distance from the sound source;
Obtaining a second detection time at which each of the plurality of target devices detects the operation sound;
16. The method of claim 15, comprising calculating a difference between the second detection time and the first detection time.
前記第2の操作位置で第2の個数の操作音を検出するステップと、
前記第1の個数と前記第2の個数の組み合わせで複数の前記操作コマンドを生成するステップと、
前記第1の個数または前記第2の個数が所定値以上のときに前記音響操作を無効にするステップと
を有する請求項15に記載の方法。 Detecting a first number of operation sounds at the first operation position;
Detecting a second number of operation sounds at the second operation position;
Generating a plurality of the operation commands by a combination of the first number and the second number;
The method according to claim 15, further comprising disabling the acoustic operation when the first number or the second number is equal to or greater than a predetermined value.
音源が第1の操作位置で生成した操作音と第2の操作位置で生成した操作音を前記複数の対象装置が検出する機能と、
前記音源から前記対象装置までの前記操作音の伝搬時間に基づいて前記第1の操作位置から前記対象装置までの第1の音源距離および前記第2の操作位置から前記対象装置までの第2の音源距離を計算する機能と、
前記第1の操作位置と前記第2の操作位置の移動距離を取得する機能と、
前記第1の音源距離、前記第2の音源距離および前記移動距離に基づいて前記目的対象装置を特定する機能と
を実現させるためのコンピュータ・プログラム。 In an acoustic operation system for operating a target target device selected from a plurality of target devices in accordance with an acoustic operation,
A function of the plurality of target devices to detect an operation sound generated by the sound source at the first operation position and an operation sound generated at the second operation position;
Based on the propagation time of the operation sound from the sound source to the target device, a first sound source distance from the first operation position to the target device and a second distance from the second operation position to the target device. A function to calculate the sound source distance,
A function of acquiring a movement distance between the first operation position and the second operation position;
A computer program for realizing a function of specifying the target device based on the first sound source distance, the second sound source distance, and the moving distance.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015209438A JP6140385B2 (en) | 2015-10-25 | 2015-10-25 | Acoustic operation system, operation method, and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015209438A JP6140385B2 (en) | 2015-10-25 | 2015-10-25 | Acoustic operation system, operation method, and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017083216A true JP2017083216A (en) | 2017-05-18 |
JP6140385B2 JP6140385B2 (en) | 2017-05-31 |
Family
ID=58711734
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015209438A Active JP6140385B2 (en) | 2015-10-25 | 2015-10-25 | Acoustic operation system, operation method, and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6140385B2 (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1124694A (en) * | 1997-07-04 | 1999-01-29 | Sanyo Electric Co Ltd | Instruction recognition device |
US20020009972A1 (en) * | 2000-07-06 | 2002-01-24 | Brian Amento | Bioacoustic control system, method and apparatus |
JP2005284492A (en) * | 2004-03-29 | 2005-10-13 | Mitsubishi Electric Corp | Operating device using voice |
US20090109795A1 (en) * | 2007-10-26 | 2009-04-30 | Samsung Electronics Co., Ltd. | System and method for selection of an object of interest during physical browsing by finger pointing and snapping |
WO2011115060A1 (en) * | 2010-03-15 | 2011-09-22 | 日本電気株式会社 | Input device, input method and program |
EP2779020A2 (en) * | 2013-03-14 | 2014-09-17 | Intermec IP Corp. | Synthetic aperture RFID handheld with tag location capability |
-
2015
- 2015-10-25 JP JP2015209438A patent/JP6140385B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1124694A (en) * | 1997-07-04 | 1999-01-29 | Sanyo Electric Co Ltd | Instruction recognition device |
US20020009972A1 (en) * | 2000-07-06 | 2002-01-24 | Brian Amento | Bioacoustic control system, method and apparatus |
JP2005284492A (en) * | 2004-03-29 | 2005-10-13 | Mitsubishi Electric Corp | Operating device using voice |
US20090109795A1 (en) * | 2007-10-26 | 2009-04-30 | Samsung Electronics Co., Ltd. | System and method for selection of an object of interest during physical browsing by finger pointing and snapping |
WO2011115060A1 (en) * | 2010-03-15 | 2011-09-22 | 日本電気株式会社 | Input device, input method and program |
EP2779020A2 (en) * | 2013-03-14 | 2014-09-17 | Intermec IP Corp. | Synthetic aperture RFID handheld with tag location capability |
Also Published As
Publication number | Publication date |
---|---|
JP6140385B2 (en) | 2017-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9779734B2 (en) | Speech recognition system and method for recognizing a command to control a target | |
JP6553052B2 (en) | Gesture-interactive wearable spatial audio system | |
EP3790006A1 (en) | Voice control method, wearable apparatus, and terminal | |
EP3037946B1 (en) | Remote controller, information processing method and system | |
KR100793079B1 (en) | Wrist-wear user input apparatus and methods | |
US11009954B2 (en) | Haptics device for producing directional sound and haptic sensations | |
KR101720655B1 (en) | Device for provide the haptic feedback based on user behavior recognition and method thereof | |
US20210081044A1 (en) | Measurement of Facial Muscle EMG Potentials for Predictive Analysis Using a Smart Wearable System and Method | |
US9811311B2 (en) | Using ultrasound to improve IMU-based gesture detection | |
US11601806B2 (en) | Device, computer program and method | |
CN105100854B (en) | For controlling light calibration method, remote controler and smart television | |
TWI596378B (en) | Portable virtual reality system | |
CN110290576A (en) | Control method of electronic device and device | |
Li et al. | Enabling Voice-Accompanying Hand-to-Face Gesture Recognition with Cross-Device Sensing | |
KR20210000974A (en) | Method and apparatus for providing a service for electronic device by forming a zone | |
JP6140385B2 (en) | Acoustic operation system, operation method, and computer program | |
KR20180042454A (en) | Electromagnetic disturbance signal detection | |
WO2019054037A1 (en) | Information processing device, information processing method and program | |
JP2016122876A (en) | Display device, display system, air conditioner, illumination device, and display device control program | |
KR102045076B1 (en) | Ring type wireless controller apparatus and wireless control method using the same | |
JP6188151B2 (en) | Input system and input method capable of determining input information based on phase difference of signals propagated through body | |
JP6352774B2 (en) | Device selection method, terminal, computer program | |
US11662832B1 (en) | System and method for enhancing functionality of electronic devices | |
EP3951651A1 (en) | Method for fingerprint identification, terminal device and storage medium | |
WO2016151869A1 (en) | Information processing apparatus, information processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170430 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6140385 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |