JP2019528526A5 - - Google Patents

Download PDF

Info

Publication number
JP2019528526A5
JP2019528526A5 JP2019507755A JP2019507755A JP2019528526A5 JP 2019528526 A5 JP2019528526 A5 JP 2019528526A5 JP 2019507755 A JP2019507755 A JP 2019507755A JP 2019507755 A JP2019507755 A JP 2019507755A JP 2019528526 A5 JP2019528526 A5 JP 2019528526A5
Authority
JP
Japan
Prior art keywords
electronic device
remote control
frequencies
sound data
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019507755A
Other languages
English (en)
Other versions
JP6913745B2 (ja
JP2019528526A (ja
Filing date
Publication date
Priority claimed from US15/238,364 external-priority patent/US10506192B2/en
Application filed filed Critical
Publication of JP2019528526A publication Critical patent/JP2019528526A/ja
Publication of JP2019528526A5 publication Critical patent/JP2019528526A5/ja
Application granted granted Critical
Publication of JP6913745B2 publication Critical patent/JP6913745B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (21)

  1. 処理回路に方法を実行させるためのコンピュータプログラムであって、前記方法は、
    前記処理回路を含む第1の電子デバイスのカメラからビデオストリームを受信することを備え、前記カメラは、前記第1の電子デバイスのユーザの方向に向けられ、前記第1の電子デバイスは、第2の電子デバイスから離れてその近傍にあり、前記第2の電子デバイスは、知覚出力を作成するように構成され、前記方法はさらに、
    前記ビデオストリームのフレームのセットにわたって、前記ユーザによって行われたジェスチャを検出することと、
    前記ジェスチャを検出したことに応答して
    前記第1の電子デバイス内のリモートコントロールを、前記リモートコントロールが非アクティブ状態からアクティブ状態に遷移するようにアクティベートすることとを備え、前記リモートコントロールが前記アクティブ状態にあるときに、前記リモートコントロールは、前記第2の電子デバイスによって作成された前記知覚出力に対して変化をトリガするように構成されており、前記方法はさらに、
    音波から変換された音データを受信することと
    前記第1の電子デバイスと前記第2の電子デバイスとの間の距離を決定することと、
    前記リモートコントロールが前記アクティブ状態にあることに応答して、前記決定された距離に基づき、前記音データを、前記第2の電子デバイスの前記知覚出力を変化させるための予め定められたコマンドとして識別することと、
    前記リモートコントロールが前記アクティブ状態にあるときに前記ジェスチャが前記ユーザによって行われないことに応答して、前記リモートコントロールを前記非アクティブ状態へと遷移させるように、前記リモートコントロールを非アクティブ化することとを備える、コンピュータプログラム。
  2. 前記第1の電子デバイスはマイクロフォンをさらに含み、当該マイクロフォンは、その上に入射する音波を、前記第1の電子デバイスのメモリ内に記憶される音データへと変換するように構成されており、
    前記リモートコントロールが前記アクティブ状態にあることに応答して、前記方法はさらに
    記音データを、リモートコントロールデータに変換することとを備え、前記リモートコントロールデータが前記第2の電子デバイスによって受信されると、前記第2の電子デバイスは、前記第2の電子デバイスによって作成された前記知覚出力に対して前記変化をトリガし、前記方法はさらに、
    前記リモートコントロールデータを前記第2の電子デバイスに送信することを備える、請求項1に記載のコンピュータプログラム。
  3. 前記第2の電子デバイスによって作成された前記知覚出力は、発声音を含み、
    前記音データを、前記第2の電子デバイスの前記知覚出力を前記変化させるための前記予め定められたコマンドとして識別することは、フィルタ演算を行うことを含み、前記フィルタ演算は、前記発声音を前記マイクロフォン上に前記入射する音波からフィルタリングするように構成されている、請求項1または2に記載のコンピュータプログラム。
  4. 前記フィルタ演算を行うことは、前記リモートコントロールが前記アクティブ状態に遷移することに応答して、前記第2の電子デバイスに音量低下コマンドを送信することを含み、前記音量低下コマンドは、前記第2の電子デバイスによって受信されると、前記第2の電子デバイスに、より小さい振幅において前記発声音を作成させ、
    前記方法は、前記リモートコントロールが前記非アクティブ状態に遷移することに応答して、音量増大コマンドを前記第2の電子デバイスに送信することをさらに備え、前記音量増大コマンドは、前記第2の電子デバイスによって受信されると、前記第2の電子デバイスに、より大きい振幅において前記発声音を作成させる、請求項に記載のコンピュータプログラム。
  5. 前記方法はさらに、前記第2の電子デバイスによって作成された前記発声音の周波数のセットを取得することを備え、
    前記フィルタ演算を行うことは、
    前記マイクロフォンへ入力された前記音データの周波数のセットを取得することと、
    前記第2の電子デバイスによって作成された前記発声音の周波数の前記セットのうちのいくつかの前記周波数を、前記音データの周波数の前記セットから抑圧し、フィルタされた周波数のセットを形成することと、
    フィルタされた周波数の前記セットから、リモートコントロールデータが作成されるフィルタされた音データを形成することとを含む、請求項3または4に記載のコンピュータプログラム。
  6. 前記マイクロフォンへ入力された前記音データの周波数の前記セットを取得することは、
    指定した時間の間入力された前記音データを記録し、音のタイムウィンドウを生成することと、
    前記音のタイムウィンドウから周波数のセットを取得し、周波数のタイムウィンドウを形成することと、
    前記リモートコントロールが前記アクティブ状態にあるときに、前記指定した時間の間、音データを前記記録することを繰り返し、周波数のセットを取得し、前記記録された音データのスペクトログラムを形成することとを含む、請求項に記載のコンピュータプログラム。
  7. 前記マイクロフォンへ入力された前記音データの周波数の前記セットを取得することは、前記マイクロフォンへ入力された前記音データについてフーリエ変換演算を行うことを含む、請求項に記載のコンピュータプログラム。
  8. 前記第2の電子デバイスによって作成された前記発声音の周波数の前記セットのうちのいくつかの前記周波数を抑圧することは、
    前記第2の電子デバイスから前記発声音が伝播されたネットワーク信号の到来角(AOA)を決定することと、
    記AOAに基づき、前記第2の電子デバイスによって作成された前記発声音の周波数の前記セットのうちのいくつかの前記周波数の振幅および位相を作成することと、
    前記音データ入力の周波数の前記セットのうち、前記第2の電子デバイスによって作成された前記発声音の周波数の前記セットのうちのいくつかの前記周波数の前記振幅および位相に十分に近い振幅および位相を有する周波数のものを識別することとを含む、請求項に記載のコンピュータプログラム。
  9. 前記フィルタ演算は、前記第1の電子デバイスおよび前記第2の電子デバイスが配置される部屋によって作成される、前記マイクロフォン上に前記入射する音波からの音響ノイズをフィルタリングするように、さらに構成されている、請求項に記載のコンピュータプログラム。
  10. 前記フィルタ演算を行うことは、ノイズ周波数閾値よりも低い周波数を、前記マイクロフォンへ入力された前記音データからフィルタリングすることを含む、請求項に記載のコンピュータプログラム。
  11. 方法であって、
    第1の電子デバイスの処理回路によって、前記第1の電子デバイスのカメラからビデオストリームを受信することを備え、前記カメラは、前記第1の電子デバイスのユーザの方向に向けられ、前記第1の電子デバイスは、第2の電子デバイスから離れてその近傍にあり、前記第2の電子デバイスは、知覚出力を作成するように構成され、前記方法はさらに、
    前記処理回路によって、前記ビデオストリームのフレームのセットにわたって、前記ユーザによって行われたジェスチャを検出することと、
    前記ジェスチャを検出したことに応答して
    前記処理回路によって、前記第1の電子デバイス内のリモートコントロールを、前記リモートコントロールが非アクティブ状態からアクティブ状態に遷移するようにアクティベートすることとを備え、前記リモートコントロールが前記アクティブ状態にあるときに、前記リモートコントロールは、前記第2の電子デバイスによって作成された前記知覚出力に対して変化をトリガするように構成されており、前記方法はさらに、
    前記処理回路によって、音波から変換された音データを受信することと、
    前記処理回路によって、前記第1の電子デバイスと前記第2の電子デバイスとの間の距離を決定することと、
    前記リモートコントロールが前記アクティブ状態にあることに応答して、前記処理回路によって、前記決定された距離に基づき、前記音データを、前記第2の電子デバイスの前記知覚出力を変化させるための予め定められたコマンドとして識別することと、
    前記リモートコントロールが前記アクティブ状態にあるときに前記ジェスチャが前記ユーザによって行われないことに応答して、前記処理回路によって、前記リモートコントロールを前記非アクティブ状態へと遷移させるように、前記リモートコントロールを非アクティブ化することとを備える、方法。
  12. 前記第1の電子デバイスは、マイクロフォンをさらに含み、前記マイクロフォンは、当該マイクロフォン上に入射する音波を、前記第1の電子デバイスのメモリ内に記憶される音データへと変換するように構成されており、
    前記リモートコントロールが前記アクティブ状態にあることに応答して、前記方法はさらに、
    前記音データをリモートコントロールデータに変換することを備え、前記リモートコントロールデータが前記第2の電子デバイスによって受信されると、前記第2の電子デバイスは、前記第2の電子デバイスによって作成された前記知覚出力に対する前記変化をトリガさせ、前記方法はさらに、
    前記リモートコントロールデータを前記第2の電子デバイスに送信することを備える、請求項11に記載の方法。
  13. 前記第2の電子デバイスによって作成された前記知覚出力は、発声音を含み、
    前記音データを前記第2の電子デバイスの前記知覚出力を前記変化させるための前記予め定められたコマンドとして識別することは、フィルタ演算を行うことを含み、前記フィルタ演算は、前記発声音を前記マイクロフォン上に前記入射する音波からフィルタリングするように構成されている、請求項11に記載の方法。
  14. 前記フィルタ演算を行うことは、
    前記リモートコントロールが前記アクティブ状態に遷移したことに応答して、音量低下コマンドを前記第2の電子デバイスに送信することを含み、前記音量低下コマンドは、前記第2の電子デバイスによって受信されると、前記第2の電子デバイスに、より小さい振幅において前記発声音を作成させ、
    前記方法は、前記リモートコントロールが前記非アクティブ状態に遷移することに応答して、音量増大コマンドを前記第2の電子デバイスに送信することをさらに備え、前記音量増大コマンドは、前記第2の電子デバイスによって受信されると、前記第2の電子デバイスにより大きい振幅において前記発声音を作成させる、請求項13に記載の方法。
  15. 前記第2の電子デバイスによって作成された前記発声音の周波数のセットを取得することをさらに備え、
    前記フィルタ演算を行うことは、
    前記マイクロフォンへ入力される前記音データの周波数のセットを取得することと、
    前記音データの周波数の前記セットから、前記第2の電子デバイスによって作成された前記発声音の周波数の前記セットのうちのいくつかの前記周波数を抑圧し、フィルタされた周波数のセットを形成することと、
    フィルタされた周波数の前記セットから、リモートコントロールデータが作成されるフィルタされた音データを形成することとを含む、請求項13に記載の方法。
  16. システムであって、
    第1の電子デバイスおよび第2の電子デバイスを備え、前記第1の電子デバイスは、前記第2の電子デバイスから離れてその近傍にあり、前記第2の電子デバイスは、知覚出力を作成するように構成されており、前記第1の電子デバイスは、ネットワークインターフェース、カメラ、メモリ、および前記メモリに結合される処理回路を含み、前記処理回路は、
    前記カメラからビデオストリームを受信するように構成されており、前記カメラは、前記第1の電子デバイスのユーザの方向に向けられており、前記処理回路はさらに、
    前記ビデオストリームのフレームのセットにわたって、前記ユーザによって行われたジェスチャを検出するように構成されており
    前記ジェスチャを検出したことに応答して
    前記第1の電子デバイス内のリモートコントロールを、前記リモートコントロールが非アクティブ状態からアクティブ状態に遷移するようにアクティベートするように構成されており、前記リモートコントロールが前記アクティブ状態にあるときに、前記リモートコントロールは、前記第2の電子デバイスによって作成された前記知覚出力に対して変化をトリガするように構成されており前記処理回路はさらに、
    音波から変換された音データを受信し
    前記第1の電子デバイスと前記第2の電子デバイスとの間の距離を決定し、
    前記リモートコントロールが前記アクティブ状態にあることに応答して、前記決定された距離に基づき、前記音データを、前記第2の電子デバイスの前記知覚出力を変化させるための予め定められたコマンドとして識別し、
    前記リモートコントロールが前記アクティブ状態にあるときに前記ジェスチャが前記ユーザによって行われないことに応答して、前記リモートコントロールを前記非アクティブ状態へと遷移させるように、前記リモートコントロールを非アクティブ化することとを備える、システム。
  17. 前記音波から変換された前記音データを受信することは、
    指定した時間の間前記音データを記録し、音のタイムウィンドウを生成することと、
    前記音のタイムウィンドウから周波数のセットを取得し、周波数のタイムウィンドウを形成することと、
    前記リモートコントロールが前記アクティブ状態にあるときに、前記指定した時間の間、音データを前記記録することを繰り返し、周波数のセットを取得し、前記記録された音データのスペクトログラムを形成することとを含む、請求項1に記載のシステム。
  18. 前記音データは、周波数のセットを含み、
    前記音データを、前記第2の電子デバイスの前記知覚出力を変化させるための予め定められたコマンドとして識別することは、
    前記距離に基づき、前記第2の電子デバイスによって作成された前記発声音の前記周波数の前記セットのうちのいくつかの前記周波数の振幅および位相を作成することと、
    前記音データ入力の周波数の前記セットのうち、前記第2の電子デバイスによって作成された前記発声音の周波数の前記セットのうちのいくつかの前記周波数の前記振幅および位相に十分に近い振幅および位相を有する周波数のものを識別することとを含む、請求項1に記載のコンピュータプログラム。
  19. 処理回路に方法を実行させるためのコンピュータプログラムであって、前記方法は、
    前記処理回路を含む第1の電子デバイスのカメラからビデオストリームを受信することを備え、前記カメラは、前記第1の電子デバイスのユーザの方向に向けられており、前記第1の電子デバイスは、第2の電子デバイスから離れてその近傍にあり、前記第2の電子デバイスは、知覚出力を作成するように構成されており、前記方法はさらに、
    前記ビデオストリームのフレームのセットにわたって、前記ユーザによって行われたジェスチャを検出することと、
    前記ジェスチャを検出したことに応答して、
    前記第1の電子デバイス内のリモートコントロールを、前記リモートコントロールが非アクティブ状態からアクティブ状態に遷移するようにアクティベートすることとを備え、前記リモートコントロールが前記アクティブ状態にあるときに、前記リモートコントロールは、前記第2の電子デバイスによって作成された前記知覚出力に対して変化をトリガするように構成されており、前記方法はさらに、
    音波から変換された音データを受信することと、
    前記第2の電子デバイスから前記発声音が伝播されたネットワーク信号の到来角(AOA)を決定することと、
    前記リモートコントロールが前記アクティブ状態にあることに応答して、前記決定されたAOAに基づき、前記音データを、前記第2の電子デバイスの前記知覚出力を変化させるための予め定められたコマンドとして識別することと、
    前記リモートコントロールが前記アクティブ状態にあるときに前記ジェスチャが前記ユーザによって行われないことに応答して、前記リモートコントロールを前記非アクティブ状態へと遷移させるように、前記リモートコントロールを非アクティブ化することとを備える、コンピュータプログラム。
  20. 前記音データは、周波数のセットを含み、
    前記決定されたAOAに基づき、前記音データを、前記第2の電子デバイスの前記知覚出力を変化させるための予め定められたコマンドとして識別することはさらに、
    前記AOAに基づき、前記第2の電子デバイスによって作成された前記発声音の前記周波数の前記セットのうちのいくつかの前記周波数の振幅および位相を作成することと、
    前記音データ入力の周波数の前記セットのうち、前記第2の電子デバイスによって作成された前記発声音の周波数の前記セットのうちのいくつかの前記周波数の前記振幅および位相に十分に近い振幅および位相を有する周波数のものを識別することとを含む、請求項19に記載のコンピュータプログラム。
  21. 請求項1〜10,19および20のいずれかに記載のコンピュータプログラムを格納したメモリと、
    前記コンピュータプログラムを実行するための処理回路とを備える、装置。
JP2019507755A 2016-08-16 2017-08-11 ジェスチャによりアクティブ化されるリモートコントロール Active JP6913745B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/238,364 2016-08-16
US15/238,364 US10506192B2 (en) 2016-08-16 2016-08-16 Gesture-activated remote control
PCT/US2017/046494 WO2018034980A1 (en) 2016-08-16 2017-08-11 Gesture-activated remote control

Publications (3)

Publication Number Publication Date
JP2019528526A JP2019528526A (ja) 2019-10-10
JP2019528526A5 true JP2019528526A5 (ja) 2020-03-19
JP6913745B2 JP6913745B2 (ja) 2021-08-04

Family

ID=59702856

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019507755A Active JP6913745B2 (ja) 2016-08-16 2017-08-11 ジェスチャによりアクティブ化されるリモートコントロール

Country Status (7)

Country Link
US (1) US10506192B2 (ja)
EP (1) EP3482278B1 (ja)
JP (1) JP6913745B2 (ja)
KR (1) KR102258710B1 (ja)
CN (1) CN109564474B (ja)
DE (1) DE202017104587U1 (ja)
WO (1) WO2018034980A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018204223A1 (de) * 2018-03-20 2019-09-26 Audi Ag Mobile, portable Bedienvorrichtung zum Bedienen eines mit der Bedienvorrichtung drahtlos gekoppelten Geräts, und Verfahren zum Betreiben eines Geräts mithilfe einer mobilen, portablen Bedienvorrichtung
CN112489413B (zh) * 2020-11-27 2022-01-11 京东方科技集团股份有限公司 遥控器的控制方法及系统、存储介质、电子设备

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6501515B1 (en) * 1998-10-13 2002-12-31 Sony Corporation Remote control system
US6889191B2 (en) * 2001-12-03 2005-05-03 Scientific-Atlanta, Inc. Systems and methods for TV navigation with compressed voice-activated commands
US20050154588A1 (en) * 2001-12-12 2005-07-14 Janas John J.Iii Speech recognition and control in a process support system
CA2539442C (en) 2003-09-17 2013-08-20 Nielsen Media Research, Inc. Methods and apparatus to operate an audience metering device with voice commands
JP2005250233A (ja) * 2004-03-05 2005-09-15 Sanyo Electric Co Ltd ロボット装置
JP2007121576A (ja) * 2005-10-26 2007-05-17 Matsushita Electric Works Ltd 音声操作装置
JP2007189536A (ja) * 2006-01-13 2007-07-26 Matsushita Electric Ind Co Ltd 音響エコーキャンセラ装置、音響エコーキャンセル方法及び通話装置
JP5034607B2 (ja) * 2006-11-02 2012-09-26 株式会社日立製作所 音響エコーキャンセラシステム
US8126161B2 (en) * 2006-11-02 2012-02-28 Hitachi, Ltd. Acoustic echo canceller system
JP4877114B2 (ja) * 2007-07-13 2012-02-15 ヤマハ株式会社 音声処理装置およびプログラム
JP4431836B2 (ja) * 2007-07-26 2010-03-17 株式会社カシオ日立モバイルコミュニケーションズ 音声取得装置、雑音除去システム、及び、プログラム
US11012732B2 (en) 2009-06-25 2021-05-18 DISH Technologies L.L.C. Voice enabled media presentation systems and methods
US8428368B2 (en) * 2009-07-31 2013-04-23 Echostar Technologies L.L.C. Systems and methods for hand gesture control of an electronic device
KR101373285B1 (ko) 2009-12-08 2014-03-11 한국전자통신연구원 제스쳐 인식 기능을 갖는 휴대 단말기 및 이를 이용한 인터페이스 시스템
KR20120051212A (ko) * 2010-11-12 2012-05-22 엘지전자 주식회사 멀티미디어 장치의 사용자 제스쳐 인식 방법 및 그에 따른 멀티미디어 장치
US20130035086A1 (en) * 2010-12-22 2013-02-07 Logitech Europe S.A. Remote control system for providing content suggestions
CN102682589B (zh) * 2012-01-09 2015-03-25 西安智意能电子科技有限公司 一种用于对受控设备进行遥控的系统
KR101590332B1 (ko) 2012-01-09 2016-02-18 삼성전자주식회사 영상장치 및 그 제어방법
CN103294177B (zh) * 2012-02-29 2016-01-06 株式会社理光 光标移动控制方法和系统
WO2013168171A1 (en) * 2012-05-10 2013-11-14 Umoove Services Ltd. Method for gesture-based operation control
CN202617260U (zh) 2012-05-31 2012-12-19 无锡商业职业技术学院 一种基于手势控制电视机的装置
CN102866777A (zh) * 2012-09-12 2013-01-09 中兴通讯股份有限公司 一种数字媒体内容播放转移的方法及播放设备及系统
JP2014153663A (ja) * 2013-02-13 2014-08-25 Sony Corp 音声認識装置、および音声認識方法、並びにプログラム
US9417689B1 (en) * 2013-05-17 2016-08-16 Amazon Technologies, Inc. Robust device motion detection
WO2014190886A1 (zh) * 2013-05-27 2014-12-04 上海科斗电子科技有限公司 智能交互系统及其软件系统
CN103456299B (zh) * 2013-08-01 2016-06-15 百度在线网络技术(北京)有限公司 一种控制语音识别的方法和装置
US9357492B2 (en) 2013-08-05 2016-05-31 Qualcomm Incorporated WLAN-capable remote control device
US9390726B1 (en) 2013-12-30 2016-07-12 Google Inc. Supplementing speech commands with gestures
US10540979B2 (en) * 2014-04-17 2020-01-21 Qualcomm Incorporated User interface for secure access to a device using speaker verification
CN105258011A (zh) * 2014-07-16 2016-01-20 东莞勤上光电股份有限公司 一种具有综合智能控制功能的led落地灯
US9849588B2 (en) * 2014-09-17 2017-12-26 Brain Corporation Apparatus and methods for remotely controlling robotic devices
CN104811792A (zh) 2015-03-20 2015-07-29 无锡华海天和信息科技有限公司 一种通过手机声控电视盒子的系统及方法
CN105096580A (zh) * 2015-08-18 2015-11-25 金德奎 一种可控制家用电器的手势控制智能开关
US10048936B2 (en) * 2015-08-31 2018-08-14 Roku, Inc. Audio command interface for a multimedia device

Similar Documents

Publication Publication Date Title
US11017252B2 (en) Detection of liveness
US11705135B2 (en) Detection of liveness
US11023755B2 (en) Detection of liveness
US9723119B2 (en) Reduction of haptic noise feedback in system
US10586534B1 (en) Voice-controlled device control using acoustic echo cancellation statistics
US9958950B2 (en) Detector
US9007871B2 (en) Passive proximity detection
US20230000420A1 (en) On-ear detection
JP2008166897A5 (ja)
US20140201639A1 (en) Audio user interface apparatus and method
US10551973B2 (en) Method of controlling a mobile device
JP2011254188A5 (ja)
CN111355840A (zh) 用于移动设备的基于近超声的接近度感测
JP4985230B2 (ja) 電子機器及びこれに用いる音声信号処理方法
US20230290335A1 (en) Detection of live speech
JP5027127B2 (ja) 背景雑音に応じてバイブレータの動作を制御することによる移動通信装置の音声了解度の向上
EP4371112A1 (en) Speech enhancement
JP2019528526A5 (ja)
CN113314121B (zh) 无声语音识别方法、装置、介质、耳机及电子设备
CN104850278A (zh) 一种非触摸控制的一体机及其控制方法
CN114207712A (zh) 多设备唤醒词检测
KR20110065095A (ko) 디바이스를 제어하는 방법 및 그 장치
WO2019185015A1 (zh) 一种压电传感器信号噪声去除方法
CN111201568A (zh) 现场性的检测
EP4371311A1 (en) Data augmentation for speech enhancement