JP7242248B2 - 電子機器、その制御方法、およびそのプログラム - Google Patents

電子機器、その制御方法、およびそのプログラム Download PDF

Info

Publication number
JP7242248B2
JP7242248B2 JP2018205868A JP2018205868A JP7242248B2 JP 7242248 B2 JP7242248 B2 JP 7242248B2 JP 2018205868 A JP2018205868 A JP 2018205868A JP 2018205868 A JP2018205868 A JP 2018205868A JP 7242248 B2 JP7242248 B2 JP 7242248B2
Authority
JP
Japan
Prior art keywords
sound
external device
function
digital camera
communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018205868A
Other languages
English (en)
Other versions
JP2020071721A (ja
JP2020071721A5 (ja
Inventor
俊司 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2018205868A priority Critical patent/JP7242248B2/ja
Priority to US16/660,188 priority patent/US11393467B2/en
Priority to CN201911042671.3A priority patent/CN111128145A/zh
Publication of JP2020071721A publication Critical patent/JP2020071721A/ja
Publication of JP2020071721A5 publication Critical patent/JP2020071721A5/ja
Application granted granted Critical
Publication of JP7242248B2 publication Critical patent/JP7242248B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Description

本発明は、音声を認識できる電子機器に関する。
近年、音声を認識する技術が向上し、音声によって電子機器を操作できる音声アシスタント機能と呼ばれる技術が知られている。例えば、特許文献1には、マイクを介して入力された音声をネットワーク上で処理し、その音声に対して音声で応答するコミュニケーションロボットが開示されている。
特開2015-013351号公報
しかし、機器への指示を意図しない音声によって機器が動作することを防ぐために、ユーザは音声アシスタント機能を利用するときのみオンにし、それ以外のときは音声アシスタント機能をオフにするユースケースが存在する。このようなユースケースにおいて、機器の音声アシスタント機能がオフの場合、ユーザは手動で音声アシスタント機能をオンにする必要があるという課題があった。
そこで本発明は、ユーザは手動で操作しなくても、機器の音声アシスタント機能をオンにできるようにすることを目的とする。
上記目的を達成するために、本発明の電子機器は、音声を集音する集音手段と、外部機器と通信する第一の通信手段と、音声を認識するための前記外部機器の機能が有効か否かに関する情報を前記第一の通信手段を介して取得する取得手段と、前記取得手段によって取得した前記外部機器の前記機能の状態が有効ではない場合、前記外部機器に対する音声を含む所定の音声を前記集音手段を用いて集音したことに応じて、前記外部機器の前記機能を有効化するよう前記第一の通信手段を介して前記外部機器を制御する制御手段とを有し、前記制御手段は、前記外部機器の前記機能が有効である場合、前記外部機器に対する音声を含む所定の音声が前記集音手段によって集音された場合でも、前記外部機器に対する制御を行わないことを特徴とする。
本発明によれば、ユーザは手動で操作しなくても、機器の音声アシスタント機能をオンにできる。
第1の実施形態におけるシステム構成を示す図である。 第1の実施形態におけるスマートスピーカーの構成の一例を示すブロック図である。 第1の実施形態におけるデジタルカメラの構成の一例を示すブロック図である。 第1の実施形態におけるデジタルカメラの電力状態の一例を示す図である。 第1の実施形態におけるスマートスピーカーの遠隔制御機能を設定する処理の一例を示すシーケンス図である。 第1の実施形態における機器管理DBの一例を示す図である。 第1の実施形態における電力状態PS2の状態のスマートスピーカーがデジタルカメラの音声アシスタント機能の動作状態に関わる情報を取得する処理の一例を示すシーケンス図である。 第1の実施形態における電力状態PS1の状態のスマートスピーカーがデジタルカメラの音声アシスタント機能の動作状態に関わる情報を取得する処理の一例を示すシーケンス図である。 第1の実施形態におけるデジタルカメラの音声アシスタント機能がオフの状態における遠隔制御機能の処理の一例を示すシーケンス図である。 第1の実施形態におけるデジタルカメラの音声アシスタント機能がオンの状態における遠隔制御機能の処理の一例を示すシーケンス図である。 第1の実施形態におけるスマートスピーカーの遠隔制御機能の処理の一例を示すフローチャートである。 第1の実施形態におけるデジタルカメラの遠隔制御機能の処理の一例を示すフローチャートである。
以下、本発明の好ましい実施の形態を、図面を参照しながら詳細に説明する。
[第1の実施形態]
<システム構成>
図1は、本実施形態におけるシステム構成を示す図である。本実施形態におけるシステムは、スマートスピーカー100、デジタルカメラ200、無線LANルータ300、サーバ400、スマートフォン500によって構成される。
スマートスピーカー100は、音声アシスタント機能を有する電子機器である。音声アシスタント機能は、ユーザの音声の内容を解釈し、その内容に応じた処理を実行する機能である。一般的に音声アシスタント機能を有する電子機器は、集音した音声に含まれる所定の単語(いわゆるウェイクワード)を認識してから、そのウェイクワードに続く音声を解釈する。本実施形態においてスマートスピーカー100は、無線LANネットワークを介して接続したサーバ400へ集音した音声を送信し、サーバ400を利用して音声の内容を解釈する。本実施形態のスマートスピーカー100および後述するデジタルカメラ200は、ウェイクワードは機器内で認識し、そのウェイクワードに続く音声はサーバ400を利用して内容を解釈する。
スマートスピーカー100は商用電源等の外部電源から電力を供給されて動作する。スマートスピーカー100は無線LANルータ300およびサーバ400と接続した状態にある。また、スマートスピーカー100は、デジタルカメラ200との間で、Bluetooth(登録商標) Low Energyによる通信が可能である。スマートスピーカー100はデジタルカメラ200の音声アシスタント機能の動作状態に関わる情報を取得する。
デジタルカメラ200は、音声アシスタント機能を有する機器である。デジタルカメラ200は、リチウムイオン電池やバッテリ等の電池を有し、この電池から電力を供給され動作する。電池の蓄えられる電力量は有限であるため、ユーザはデジタルカメラ200の電力の消費をなるべく抑えたい。そのため、デジタルカメラ200は音声アシスタント機能および無線LAN機能を通常はオフにし、ユーザが必要に応じてそれらを有効化するものとする。本実施形態におけるデジタルカメラ200の構成は、例えばスマートフォン、タブレット端末等にも適用できる。
無線LANルータ300は、無線LANネットワークを形成する。スマートスピーカー100、デジタルカメラ200、および後述するスマートフォン500は、無線LANルータ300によって形成された無線LANネットワークを介して、無線LAN通信を行うことができる。またスマートスピーカー100およびデジタルカメラ200は無線LANルータ300を介してサーバ400と通信できる。
サーバ400は、音声の内容を認識するためのサービスを提供する。例えば、サーバ400は音声データを文字や文章に変換するサービス、文字や文章を解析してデジタルカメラ200への指示に変換するサービス、等のサービスを提供する。ユーザはサーバ400が提供するサービスを利用することで、このようなスマートフォンやデジタルカメラ等の持ち運び可能な電子機器では負荷が大きい処理を手軽に実行することができる。スマートスピーカー100およびデジタルカメラ200は、サーバ400が提供するサービスを利用して、音声を解析する。
スマートフォン500は、無線LAN通信を介してスマートスピーカー100の各種設定を実行する。つまり、スマートスピーカー100の各種設定を実行するためのアプリケーションが、スマートフォン500内にインストールされている。
図1に示したシステム構成において、本実施形態のスマートスピーカー100は、デジタルカメラ200の音声アシスタント機能の一部を遠隔制御する機能を有する。音声アシスタント機能が動作していないデジタルカメラ200にユーザが話しかけた場合に、スマートスピーカー100は集音したユーザの音声を受信し、デジタルカメラ200の音声アシスタント機能を有効化する。さらにスマートスピーカー100は集音した音声データをデジタルカメラ200に送信し、デジタルカメラ200に集音した音声に対応する機能を実行するよう遠隔制御することが可能である。遠隔制御の詳細は後述の図9および図10の説明に記載する。
<スマートスピーカー100の構成例>
図2は、スマートスピーカー100の構成の一例を示すブロック図である。
制御部101は、入力された信号やROM102に格納されるプログラムに従って、スマートスピーカー100の各部を制御する。制御部101は、例えば一つ又は複数のCPUやMPU等のプロセッサで構成される。なお、制御部101が機器全体を制御する代わりに、複数のハードウェアが処理を分担することで、機器全体を制御してもよい。
ROM102は、電気的に消去・記録可能な不揮発性のメモリであり、制御部101によって実行される後述のプログラム等が格納される。
RAM103は、揮発性メモリであり、制御部101がプログラムを実行するためのワークメモリや、各種データの一時格納領域等として使用される。
記録媒体104は、記録メディアである。記録媒体104は例えば、メモリーカード、フラッシュメモリ、ハードディスクで構成される。記録媒体104は、スマートスピーカー100に着脱可能なよう構成してもよいし、スマートスピーカー100に内蔵されていてもよい。すなわち、スマートスピーカー100は少なくとも記録媒体104にアクセスする手段を有していればよい。
操作部105は、ユーザの操作を受け付け、入力された情報を制御部101に通知する処理部である。操作部105は、例えばタッチパネル、ボタンスイッチ、十字キー等によって構成される。また操作部105は、ユーザがスマートスピーカー100の電源のオン/オフを指示するための電源スイッチを含む。
表示部106は、画像データや機器の動作状態等を表示するための処理部である。表示部106は、例えば液晶パネルやLED等によって構成される。なお、表示部106は必ずしもスマートスピーカー100が有する必要はない。スマートスピーカー100は表示部106と接続することができ、表示部106の表示を制御する表示制御機能を少なくとも有していればよい。
集音部107は、ユーザの音声を検出してデジタルデータに変換して、RAM103に記録する処理部である。集音部107は例えばマイクロフォンを有する。
音声出力部108は、RAM103に格納されたデータを音声に変換し、スピーカー等を介して外部に出力する処理部である。
無線LAN通信部109は、IEEE802.11の規格に準拠して無線通信を行う処理部である。無線LAN通信部109は、無線LANのSTA(ステーション)として動作し、無線LANルータ300によって形成される無線LANネットワークに接続して無線通信する。
BT通信部110は、Bluetoothの規格に準拠して無線通信を行う処理部である。本実施形態においてBluetooth通信(BT通信)は、Bluetoothのバージョン4.0以降に規定されているBluetooth Low Energy(以下、BLE)というモードを採用する。このBLE通信は、無線LAN通信と比べて通信可能な範囲が狭く(通信可能な距離が短い)、無線LAN通信と比べて通信速度が遅い。その一方で、BLE通信は、無線LAN通信と比べて消費電力が少ない。本実施形態においてBT通信部110はセントラルとして動作し、デジタルカメラ200との間で無線データ通信を行う。
内部バス120は、各処理部を互いに接続する。
ここで、BLE通信における通信機器の役割について説明する。BLE通信で接続する2つの通信機器は、それぞれセントラルとペリフェラルの役割に分かれる。BLE通信規格の接続形態はマスタースレーブ方式のスター型ネットワークである。セントラルとして動作する通信機器(以下、セントラル機器という)がマスターとなり、ペリフェラルとして動作する通信機器(以下、ペリフェラル機器という)がスレーブとなる。セントラル機器は、ペリフェラル機器のネットワークへの参加の管理やペリフェラル機器との無線接続における各種パラメータの設定等をする。セントラル機器は複数のペリフェラル機器と同時接続できるが、ペリフェラル機器は一度に1つのセントラル機器しか無線接続を確立することはできない。また、セントラル機器同士は無線接続を確立することはできず、無線接続を確立するためには片方がセントラル、もう片方がペリフェラルとならなければならない。以上、BLE通信における通信機器の役割について説明した。
本実施形態では、無線LAN通信部109により実現される通信の通信速度は、BT通信部110により実現される通信の通信速度よりも速い。また、無線LAN通信部109により実現される通信は、BT通信部110による通信よりも、通信可能な範囲が広い。
ここで、スマートスピーカー100は、常時、商用電源等の外部電源から電力を供給されているとする。
<デジタルカメラ200の構成例>
図3は、デジタルカメラ200の構成の一例を示すブロック図である。
制御部201は、入力された信号やROM202に格納されるプログラムに従って、デジタルカメラ200の各部を制御する。制御部201は、例えば一つ又は複数のCPUやMPU等のプロセッサで構成される。なお、制御部201が機器全体を制御する代わりに、複数のハードウェアが処理を分担することで、機器全体を制御してもよい。
ROM202は、電気的に消去・記録可能な不揮発性のメモリであり、制御部201によって実行される後述のプログラムが格納される。
RAM203は、揮発性メモリであり、制御部201がプログラムを実行するためのワークメモリや、各種データの一時格納領域等として使用される。
記録媒体204は、記録メディアである。記録媒体204は例えば、メモリーカード、フラッシュメモリ、ハードディスクで構成される。記録媒体204は、デジタルカメラ200に着脱可能なよう構成してもよいし、デジタルカメラ200に内蔵されていてもよい。すなわち、デジタルカメラ200は少なくとも記録媒体204にアクセスする手段を有していればよい。
操作部205は、ユーザの操作を受け付け、入力された情報を制御部201に通知する処理部である。操作部205は、例えばタッチパネル、ボタンスイッチ、十字キー等によって構成される。また操作部205は、ユーザがデジタルカメラ200の電源のオン/オフを指示するための電源スイッチを含む。
表示部206は、画像データや機器の動作状態等を表示するための処理部である。表示部206は、例えば液晶パネルやLED等によって構成される。なお、表示部206は必ずしもデジタルカメラ200が有する必要はない。デジタルカメラ200は表示部206と接続することができ、表示部206の表示を制御する表示制御機能を少なくとも有していればよい。
集音部207は、ユーザの音声を検出してデジタルデータに変換して、RAM203に記録する処理部である。集音部207は例えばマイクロフォンを介してユーザの音声を検出する。
音声出力部208は、RAM203に格納されたデータを音声に変換し、スピーカー等を介して外部に出力する処理部である。
無線LAN通信部209は、IEEE802.11の規格に準拠して無線通信を行う処理部である。無線LAN通信部209は、無線LANのSTA(ステーション)として動作し、無線LANルータ300によって形成される無線LANネットワークに接続して無線通信する。
BT通信部210は、Bluetoothの規格に準拠して無線通信を行う処理部である。BT通信部210は、ペリフェラルとして動作し、スマートスピーカー100との間でBLE通信を行う。
電源制御部211は、電源部212から各処理部への電力供給を制御する処理部である。
電源部212はデジタルカメラ200の各要素に電力を供給することができる。電源部212は例えば、リチウムイオン電池やバッテリ等である。
内部バス220は、各処理部を互いに接続する。
ここで、電源制御部211によるデジタルカメラ200の電源制御について、図4を用いて説明する。デジタルカメラ200は、上述したように電池で駆動する機器であり、低消費電力の実現のため、電源制御部211を有する。
図4は、デジタルカメラ200の電力状態の一例を示す図である。電力状態PS0は、デジタルカメラ200のすべての処理部に対して電力供給が行われていない状態、すなわちデジタルカメラ200の電源スイッチがオフされた状態である。電力状態PS1は、電源制御部211によって、集音部207、音声出力部208、および無線LAN通信部209に通電していない状態であり、電力状態PS0の次に消費電力を抑えた状態である。電力状態PS2は、すべての処理部に電力が供給されている状態である。デジタルカメラ200はユーザによる電源スイッチのオン操作によって電力状態PS0から電力状態PS2へ遷移する。デジタルカメラ200はユーザによる電源スイッチのオフ操作によって電力状態PS2または電力状態PS1から電力状態PS0へ遷移する。また、制御部201が電源制御部211に指示することで、デジタルカメラ200は電力状態PS1から電力状態PS2、または電力状態PS2から電力状態PS1へ遷移する。例えば、電力状態PS1の状態において、制御部201はBT通信部210を介して、スマートスピーカー100からの音声アシスタント機能の有効化を要求するパケットを受信した場合、電源制御部211に電力状態PS2に遷移するよう指示する。電源制御部211はその指示を受け、集音部207、音声出力部208、無線LAN通信部209に電力を供給する。逆に電源制御部が制御部201から電力状態PS2から電力状態PS1に遷移するよう指示された場合、集音部207、音声出力部208、無線LAN通信部209への電力の供給を停止する。
<スマートスピーカー100の遠隔制御機能を設定する処理のシーケンス>
図5はスマートスピーカー100の遠隔制御機能を設定する処理の一例を示すシーケンス図である。遠隔制御機能の詳細は、後述の図9および図10の説明に記載する。この処理を実行することで、スマートスピーカー100はデジタルカメラ200に対するユーザの音声をデジタルカメラ200の代わりに集音することができる。また、スマートスピーカー100がその集音した音声の音声データをデジタルカメラ200の音声アシスタント機能がオンになった後にデジタルカメラ200に送信することで、デジタルカメラ200はその音声データに基づいて、処理を実行することができる。
本処理は、スマートスピーカー100を設定するためのアプリケーションをユーザがスマートフォン500上で操作することで実行される。このアプリケーションはスマートフォン500にインストールされている。スマートフォン500は、そのユーザの操作に従ってスマートスピーカー100およびデジタルカメラ200と無線LAN通信し、上述した処理を実行する。
なお、スマートフォン500、スマートスピーカー100、およびデジタルカメラ200は、同一の無線LANネットワークに接続している。また、スマートフォン500は、無線LANネットワーク内においてスマートスピーカー100およびデジタルカメラ200を検出しており、それぞれの機器に対してアクセス可能な状態である。
ステップS501において、スマートフォン500は、無線LAN通信を介して、デジタルカメラ200に、デジタルカメラ200の情報の取得を要求するメッセージを送信する。デジタルカメラ200の情報は、例えばデジタルカメラ200の機器名、ウェイクワード、およびBDアドレスの情報である。ここで機器名とは、例えばデジタルカメラ200の名前としてユーザに設定された文字列である。ウェイクワードは、デジタルカメラ200の音声アシスタント機能を実行するための単語である。BDアドレスは、BLE通信において通信相手となる機器を識別するために使われる48ビットのアドレス情報である。このBDアドレスは機器ごとに異なる。
ステップS502において、デジタルカメラ200は、ステップS501において受信したメッセージの応答として、無線LAN通信を介して、デジタルカメラ200の情報をスマートフォン500に送信する。
ステップS503において、スマートフォン500は、無線LAN通信を介して、スマートスピーカー100に、遠隔制御機能の設定を開始することを要求するメッセージを送信する。本ステップにおいてスマートフォン500は、ステップS502で受信したデジタルカメラ200の機器名、ウェイクワード、BDアドレスの情報をスマートスピーカー100に送信する。
ステップS504において、スマートスピーカー100は、ステップS503において受信したデジタルカメラ200の情報を機器管理DBに登録する。機器管理DBは、機器名、ウェイクワード、BDアドレス、および音声アシスタント機能の動作状態に関わる情報を、機器ごとに管理するデータベース情報である。機器管理DBはROM202に格納される。ここで、図6(a)は、本ステップ終了時点での機器管理DBを示す。ID1はスマートスピーカー100の情報であり、ID2はデジタルカメラ200の情報である。本ステップではデジタルカメラ200の情報が登録される。
ステップS505において、スマートスピーカー100は、デジタルカメラ200との間でBLE通信の接続を確立させる。具体的には、スマートスピーカー100のBT通信部210が、ペリフェラル機器であるデジタルカメラ200から定期的に送信されているアドバタイズメッセージに対してBLE通信の接続を要求するメッセージを送信することで、BLE通信の接続を確立する。
ステップS506において、スマートスピーカー100は、BLE通信を介して、デジタルカメラ200によって提供される状態通知サービスを、ATTプロトコルを用いて検出する。状態通知サービスは音声アシスタント機能の動作状態がオンであるかオフであるかを定期的に通信相手に通知するサービスである。
ステップS507において、スマートスピーカー100は、BLE通信を介して、デジタルカメラ200に、ステップS506で検出した音声アシスタント機能の動作状態を通知するサービスの開始を要求する。
ステップS508において、デジタルカメラ200はスマートスピーカー100に対して状態通知サービスを開始する。状態通知サービスについては後述する。
ステップS509において、デジタルカメラ200は、BLE通信を介して、状態通知サービスを開始したことを示す通知をスマートスピーカー100に送信する。
ステップS510において、スマートスピーカー100は、無線LAN通信を介して、遠隔制御機能の設定が完了したことを示す通知を、スマートフォン500に送信する。
以上、図5を用いて、スマートスピーカー100の遠隔制御機能を設定する処理のシーケンスについて説明した。
なお、本実施形態では、スマートスピーカー100に遠隔制御機能を設定する処理を実行するためのアプリケーションはスマートフォン500にインストールされている構成としたが、必ずしもスマートフォン500にインストールされている必要はない。例えばスマートスピーカー100がWebアプリケーションを実行している状態において、ユーザはWebAPIを用いてスマートフォン500のWebクライアント機能(たとえばWebブラウザ)を介して本処理を実行してもよい。
また、本実施形態ではユーザはスマートフォン500を用いてスマートスピーカー100の本処理を実行したが、ユーザはデジタルカメラ200を用いてスマートスピーカー100に本処理を実行させてもよい。例えば、ユーザは本処理を実行するためのアプリケーションをデジタルカメラ200にインストールし、デジタルカメラ200を用いてスマートスピーカー100に本処理を実行させる。
<音声アシスタント機能の動作状態の情報を取得する処理のシーケンス>
図7および図8はスマートスピーカー100が、スマートスピーカー100がデジタルカメラ200の音声アシスタント機能の動作状態に関わる情報を取得する処理の一例について説明するシーケンス図である。
デジタルカメラ200はBLE通信を介して、音声アシスタント機能の動作状態を示す情報を定期的にスマートスピーカー100に送信する。例えばデジタルカメラ200は100ミリ秒ごとの間隔でスマートスピーカーに対して音声アシスタント機能の動作状態を示す情報を送信する。スマートスピーカー100は、デジタルカメラ200から受信した情報に基づいて、機器管理DBのデジタルカメラ200の音声アシスタント機能の動作状態を更新する。
また、本シーケンスにおけるデジタルカメラ200の動作は、図5で説明した状態通知サービスに相当する。図7および図8に示すシーケンスは、デジタルカメラ200が状態通知サービスを実行中に、音声アシスタント機能がオンまたはオフである場合の動作について示す。
まず、図7について説明する。本処理はデジタルカメラ200の電源がオンの場合に実行される。図7はデジタルカメラ200が電力状態PS2の状態におけるシーケンス図である。
ステップS701において、デジタルカメラ200は音声アシスタント機能をオンからオフに変更する。このとき、デジタルカメラ200の電力状態は電力状態PS2から電力状態PS1に遷移する。本ステップの動作が実行される条件は、例えば、ユーザがデジタルカメラ200を所定時間操作しなかった場合や、ユーザが操作部205等を介して手動で音声アシスタント機能を無効化した場合等である。
ステップS702において、デジタルカメラ200は、BLE通信を介して、スマートスピーカー100に、音声アシスタント機能がオフであることを示す状態通知メッセージを送信する。デジタルカメラ200はこの状態通知メッセージをステップS702以後も定期的に繰り返し送信する。
ステップS703において、スマートスピーカー100は、機器管理DBのデジタルカメラ200の音声アシスタント機能の動作状態を「オフ」に変更する。本ステップにより、機器管理DBは図6(b)に示す状態に更新される。
次に図8について説明する。図8はデジタルカメラ200が電力状態PS1の状態におけるシーケンス図である。
ステップS801において、デジタルカメラ200は音声アシスタント機能をオフからオンに変更する。このとき、デジタルカメラ200の電力状態は電力状態PS1から電力状態PS2に遷移する。本ステップの動作が開始する条件は、例えば、ユーザが操作部205等を介して手動で音声アシスタント機能を有効化した場合等である。
ステップS802において、デジタルカメラ200は、BLE通信を介して、スマートスピーカー100に、音声アシスタント機能がオンであることを示す状態通知メッセージを送信する。デジタルカメラ200はこの状態通知メッセージをステップS802以後も定期的に繰り返し送信する。
ステップS803において、スマートスピーカー100は、機器管理DBのデジタルカメラ200の音声アシスタント機能の動作状態を「オン」に変更する。本ステップにより、機器管理DBは図6(c)に示す状態に更新される。
以上、図7および図8を用いて、スマートスピーカー100が、デジタルカメラ200の音声アシスタント機能の動作状態に関わる情報を取得する処理のシーケンスについて、説明した。
<スマートスピーカー100の遠隔制御機能の処理のシーケンス>
図9および図10はスマートスピーカー100の遠隔制御機能の処理の一例を示すシーケンス図である。図9に示すシーケンスは、デジタルカメラ200の音声アシスタント機能がオフの状態でユーザが音声を発した場合の処理の一例を示す。図10に示すシーケンスは、デジタルカメラ200の音声アシスタント機能がオンの状態でユーザが音声を発した場合の処理の一例を示す。なお、本処理の実行前に、図5を用いて説明したスマートスピーカー100の遠隔制御機能を設定する処理は実施済みである。
まず図9について説明する。本処理の開始時において、デジタルカメラ200の音声アシスタント機能はオフであり、電力状態は電力状態PS1である。またスマートスピーカー100の機器管理DBの状態は、図6(b)に示す状態である。
本シーケンスは、例えばユーザがデジタルカメラ200に「ねぇトーマス、最後に撮影した写真を見せて」と発声したことをトリガに開始される。なお、ここでユーザは、スマートスピーカー100およびデジタルカメラ200に十分に声が届く範囲にいるものとする。
ステップS901において、スマートスピーカー100は、集音した音声に含まれるウェイクワードを検出する。例えばスマートスピーカー100は集音した音声から「トーマス」というウェイクワードを検出する。スマートスピーカー100はこの音声の音声データをRAM203に記憶する。
ステップS902において、スマートスピーカー100は、機器管理DBを参照し、ステップS901で検出したウェイクワードに該当するエントリが存在するか否かを判定する。例えばスマートスピーカー100は「トーマス」というウェイクワードがエントリに存在するか否かを判定する。検出したウェイクワードに該当するエントリが存在しなかった場合、スマートスピーカー100は処理を終了する。検出したウェイクワードに該当するエントリが存在すると判定した場合、スマートスピーカー100はステップS903に進む。
ステップS903において、スマートスピーカー100はステップS901で検出したウェイクワードに該当する機器が自機器(スマートスピーカー100)か外部機器かを判定する。自機器と判定した場合、スマートスピーカー100は自身の音声アシスタント機能を用いて集音した音声を解析し、その音声に対応する処理を実行する。外部機器と判定した場合、スマートスピーカー100はステップS904に進む。
ステップS904において、スマートスピーカー100は外部機器の音声アシスタント機能の動作状態がオンかオフかを判定する。例えば、本ステップでは機器管理DBが図6(b)で示す状態であるため、スマートスピーカー100はID2(デジタルカメラ)がウェイクワード「トーマス」に該当すると判定し、その音声アシスタント機能の動作状態はオフである、と判定する。
ステップS905において、スマートスピーカー100は、BLE通信を介して、デジタルカメラ200に対して、音声アシスタント機能の有効化を要求するメッセージを送信する。ここでスマートスピーカー100は、スマートスピーカー100が接続している無線LANネットワークに接続するための情報であるSSIDと暗号キーの情報を、本メッセージに含める。デジタルカメラ200は、このメッセージを受信し、音声アシスタント機能を有効化するための処理を開始する。なお、この無線LANネットワークは、図1で説明した無線LANルータ300によって形成された無線LANネットワークである。
ステップS906において、デジタルカメラ200は電力状態を電力状態PS1から電力状態PS2に遷移する。
ステップS907において、デジタルカメラ200は、ステップS905で受信したSSIDと暗号キーの情報を用いて、無線LANネットワークに接続する。またデジタルカメラ200は、無線LANネットワークを介してサーバ400を検出し、音声アシスタント機能を利用可能な状態にする。
ステップS908において、デジタルカメラ200は、BLE通信を介して、ステップS905で受信した要求が完了したことを通知するメッセージを、スマートスピーカー100に送信する。なお、本メッセージは、完了通知を示す情報に加え、デジタルカメラ200の音声アシスタント機能がオン状態である情報、および無線LAN通信を介してデジタルカメラ200にアクセスするための情報(デジタルカメラ200のIPアドレス等)を含む。
ステップS909において、スマートスピーカー100は、機器管理DBのID2(デジタルカメラ200)の音声アシスタント機能の動作状態を「オン」に変更する。本ステップにより、機器管理DBは図6(c)に示す状態となる。
ステップS910において、スマートスピーカー100は、無線LAN通信を介して、ステップS901で入力を検出した音声に対応する音声アシスタント機能の実行を要求するメッセージを、デジタルカメラ200に送信する。本メッセージは、ステップS901においてスマートスピーカー100が集音した音声の音声データを含む。
ステップS911において、デジタルカメラ200は、ステップS910のメッセージに応じて、音声アシスタント機能を実行する。具体的には、サーバ400を利用して、ステップS910で受信した音声データの「最後に撮影した写真を見せて」の部分を解釈して必要な処理を判定する。デジタルカメラ200は記録媒体204に最後に記録された静止画データを表示部206に表示し、ユーザへの応答として「はい、表示しました」という音声を出力する。
ステップS912において、デジタルカメラ200は、無線LAN通信を介して、ステップS910において受信したメッセージの要求が完了したことを示すメッセージを、スマートスピーカー100に送信する。
以上、ステップS901からステップS911までのステップが、ユーザの「ねぇトーマス、最後に撮影した写真を見せて」の音声に対応する音声アシスタント機能の処理に該当する。
次に図10について説明する。本処理の開始時において、デジタルカメラ200の音声アシスタント機能はオンであり、電力状態は電力状態PS2である。またスマートスピーカー100の機器管理DBの状態は、図6(c)に示す状態である。本シーケンスは、例えば図9に示した処理に続いて、ユーザがデジタルカメラ200に「ねぇトーマス、ひとつ前の写真を見せて」と発声したことをトリガに開始される。
ステップS1001において、スマートスピーカー100は、集音したユーザの音声からウェイクワードを検出する。例えばスマートスピーカー100は集音した音声から「トーマス」というウェイクワードを検出する。
ステップS1002において、スマートスピーカー100は、機器管理DBを参照し、ステップS1001で検出したウェイクワードに該当するエントリが存在するか否かを判定する。例えばスマートスピーカー100は「トーマス」というウェイクワードがエントリに存在するか否かを判定する。検出したウェイクワードに該当するエントリが存在しなかった場合、スマートスピーカー100は処理を終了する。
ステップS1003において、ステップS802において存在すると判定した場合、スマートスピーカー100はそのウェイクワードに該当する機器の音声アシスタント機能の動作状態がオンかオフかを判定する。例えば、本ステップでは機器管理DBが図6(c)で示す状態であるため、スマートスピーカー100はID2(デジタルカメラ)がウェイクワード「トーマス」に該当すると判定し、その音声アシスタント機能の動作状態はオンである、と判定する。この場合、スマートスピーカー100はデジタルカメラ200を遠隔制御する必要がないため、スマートスピーカー100は処理を終了する。
ステップS1004において、デジタルカメラ200は、集音部207を介して、音声入力を検出する。なお、説明の都合上、本ステップのステップ番号をS1004としているが、本ステップの処理はユーザの発声をトリガに実行される処理であり、スマートスピーカー100の処理とは独立して実行される。
ステップS1005において、デジタルカメラ200は、ステップS1004で集音した音声に応じて、音声アシスタント機能を実行する。例えば、ステップS1004で集音した音声の音声データの「ひとつ前の写真を見せて」の部分を解釈して必要な処理を判定し、デジタルカメラ200は記録媒体204の最後から二番目に記録された静止画データを表示部206に表示する。またデジタルカメラ200はユーザへの応答として「はい、表示しました」という音声を出力する。
以上、図9および図10を用いて、スマートスピーカー100の遠隔制御機能の処理シーケンスについて説明した。
なお、ステップS901で入力された音声に対応する音声アシスタント機能を実行する方法として、スマートスピーカー100が、無線LAN通信を介して、音声データをデジタルカメラ200に送信する方法について説明したが、他の方法も可能である。
他の方法として、WebAPIを利用する方法がある。デジタルカメラ200の各種機能をネットワーク経由で遠隔制御可能とするWebAPI機能が提供されている場合、スマートスピーカー100はステップS901で集音した音声を解析する。サーバ上で音声データをWebAPIに変換し、スマートスピーカー100はその変換したWebAPIをデジタルカメラ200に対して実行する構成でもよい。なお、音声データをWebAPIに変換する機能は、インターネット上のサーバによって提供される構成とし、スマートスピーカー100は当該サーバを利用する構成としてもよい。
また他の形態として、スマートスピーカー100が、ユーザの代わりとなって、音声出力部208を介して、ステップS801で入力された音声データを出力する構成としてもよい。
<スマートスピーカー100の遠隔制御機能の処理フロー>
図11はスマートスピーカー100の遠隔制御機能の処理の一例を示すフローチャートである。
ステップS1101において、制御部101は、集音部107を介して集音した音声に含まれるウェイクワードを検出する。制御部101は、集音した音声の音声データをRAM203に記録する。本ステップは、図9のステップS901に対応する。
ステップS1102において、制御部101は、ROM202に記録されている機器管理DBに、ステップS1101において検出したウェイクワードが登録されているか否か判定する。制御部101はウェイクワードが登録されていると判定した場合はステップS1103に進み、登録されていない判定した場合は処理を終了する。本ステップは、図9のステップS902に対応する。
ステップS1103において、制御部101は、ステップS1102において機器管理DBに登録されていると判定したウェイクワードに該当する機器を特定し、その機器が外部機器かどうかを判定する。制御部101は外部機器(デジタルカメラ200)であると判定した場合はステップS1104に進み、自機器であると判定した場合はステップS1108に進む。本ステップは、図9のステップS903に対応する。
ステップS1104において、制御部101は、ステップS1103においてデジタルカメラ200の音声アシスタント機能の動作状態がオンかオフかを判定する。制御部101は音声アシスタント機能の動作状態がオフであると判定した場合はステップS1105に進み、オンであると判定された場合は本処理を終了する。本ステップは、図9のステップS904に対応する。
ステップS1105において、制御部101は、BT通信部110を介して、デジタルカメラ200の音声アシスタント機能の有効化を要求するメッセージを送信する。本ステップは図9のステップS905に対応する。
ステップS1106において、制御部101はデジタルカメラ200からステップS1107に送信したメッセージの応答となる完了通知を所定時間内に受信したか否かを判定する。所定時間内にデジタルカメラ200から通知を受信した場合、制御部101はステップS1108に進み、所定時間内にデジタルカメラ200から通知を受信しない場合、制御部101はステップS1107に進む。本ステップは、図9のステップS908に対応する。
ステップS1107において、制御部101はデジタルカメラ200の音声アシスタント機能を有効化できないことをユーザに報知し、本処理を終了する。エラー処理は、例えば、音声出力部108や表示部106によって「デジタルカメラ200と通信できない」、「デジタルカメラ200が近くに存在しない」などのメッセージをユーザに報知する。
ステップS1108において、制御部101は機器管理DBを更新する。制御部101はデジタルカメラ200の音声アシスタント機能の動作状態を「オン」に変更する。本ステップは、図9のステップS909に対応する。
ステップS1109において、制御部101は、無線LAN通信部109を介して、ステップS1101で集音した音声に対応する音声アシスタント機能の実行を要求するメッセージをデジタルカメラ200に送信する。本ステップは、図9のステップS910に対応する。
ステップS1110において、制御部101は所定時間内にデジタルカメラ200から完了通知を受信したか否かを判定する。所定時間内に完了通知を受信した場合、制御部101は処理を終了する。所定時間経過してもデジタルカメラ200から完了通知を受信できない場合、またはエラー応答を受信した場合、制御部101はステップS1111に進む。本ステップは、図9のステップS912に対応する。
ステップS1111において、制御部101はユーザの音声による指示がデジタルカメラ200に実行されないことを報知し、本処理を終了する。エラー処理は、例えば、音声出力部108や表示部106によって「デジタルカメラ200と通信できない」、「デジタルカメラ200が近くに存在しない」「もう一度、声をかけてください」などのメッセージをユーザに報知する。
ステップS1112において、制御部101は、ステップS1101で集音した音声に対応する音声アシスタント機能を実行する。具体的には、制御部101は無線LAN通信部209を介してサーバ400を利用して、集音した音声の内容を解釈し、音声によって指示された処理を実行する。
以上、スマートスピーカー100の遠隔制御機能の処理フローについて、説明した。
<デジタルカメラ200の遠隔制御機能の処理フロー>
図12はデジタルカメラ200の遠隔制御機能の処理の一例を示すフローチャートである。本フローチャートは、デジタルカメラ200が起動することにより開始される。
ステップS1201において、制御部201は、音声アシスタント機能がオンかオフかを判定する。音声アシスタント機能がオンの場合、制御部201はステップS1209に進む。音声アシスタント機能がオフの場合、制御部201はステップS1202に進む。
ステップS1202において、制御部201はBT通信部210を介してスマートスピーカー100から音声アシスタント機能の有効化を要求するメッセージを受信したか否かを判断する。メッセージを受信した場合、制御部201はステップS1203に進む。メッセージを受信していない場合、制御部201はステップS1201に戻り、音声アシスタント機能の動作状態を判定する。
ステップS1203において、制御部201は電源制御部211を制御し、電力状態を電力状態PS1から電力状態PS2に遷移する。
ステップS1204において、制御部201はステップS1202において受信したメッセージに含まれるSSIDおよび暗号キーを用いて、無線LAN通信部209を介して無線LANネットワークに接続する。また、制御部201は無線LAN通信部209を介してサーバ400を検出し、音声アシスタント機能を利用可能な状態にする。
ステップS1205において、制御部201はBT通信部210を介してスマートスピーカー100に音声アシスタント機能を有効化したことを示す完了通知を送信する。
ステップS1206において、制御部201は無線LAN通信部209を介してスマートスピーカー100から音声データを受信したか否かを判断する。音声データを受信しない場合、制御部201は処理を終了し、音声アシスタント機能を有効化した状態で待機する。音声データを受信した場合、制御部201はステップS1207の処理に進む。
ステップS1207において、制御部201は受信した音声データを解析し、解析した結果に基づいて処理を実行する。
ステップS1208において、制御部201はスマートスピーカー100に無線LAN通信部209を介して、受信した音声データに基づいて処理を完了したことを示すメッセージを送信する。
以上、デジタルカメラ200の音声アシスタント機能がオフの場合を説明した。次にデジタルカメラ200の音声アシスタント機能がオンだった場合について説明する。
ステップS1209において、制御部201は音声を集音したか否かを判定する。音声を集音した場合、制御部201はステップS1210に進む。音声を集音しなかった場合、制御部201は処理を終了し、ユーザに指示されるまで待機する。
ステップS1210において、制御部201は集音した音声に基づいて、音声アシスタント機能を実行する。制御部201は集音した音声の音声データを解析し、解析した結果に基づいて処理を実行する。
以上、デジタルカメラ200の遠隔制御機能の処理フローについて説明した。
以上説明した実施形態により、デジタルカメラ200の音声アシスタント機能がオフの状態でもスマートスピーカー100が代わりに音声を集音することで、ユーザは音声アシスタント機能を利用することができる。これにより、ユーザはデジタルカメラ200の消費電力を抑えつつも音声アシスタント機能を利用することができる。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。

Claims (11)

  1. 音声を集音する集音手段と、
    外部機器と通信する第一の通信手段と、
    音声を認識するための前記外部機器の機能が有効か否かに関する情報を前記第一の通信手段を介して取得する取得手段と、
    前記取得手段によって取得した前記外部機器の前記機能の状態が有効ではない場合、前記外部機器に対する音声を含む所定の音声を前記集音手段を用いて集音したことに応じて、前記外部機器の前記機能を有効化するよう前記第一の通信手段を介して前記外部機器を制御する制御手段と
    を有し、
    前記制御手段は、前記外部機器の前記機能が有効である場合、前記外部機器に対する音声を含む所定の音声が前記集音手段によって集音された場合でも、前記外部機器に対する制御を行わないことを特徴とする電子機器。
  2. 第二の通信手段をさらに有し、
    前記第一の通信手段を介する通信は前記第二の通信手段を介する通信より消費電力が少ない
    ことを特徴とする請求項1に記載の電子機器。
  3. 前記制御手段は、前記機能が有効ではない状態にある前記外部機器に対して前記機能を有効化するよう前記第一の通信手段を介して制御した場合、前記所定の音声に含まれる前記外部機器に対する指示に関する情報を前記第二の通信手段を介して前記外部機器に送信する
    ことを特徴とする請求項に記載の電子機器。
  4. 前記制御手段は、前記機能が有効ではない状態にある前記外部機器に対して前記機能を有効化するよう前記第一の通信手段を介して制御した場合、前記外部機器の前記機能を有効化したことをユーザに報知する
    ことを特徴とする請求項1からのいずれか1項に記載の電子機器。
  5. 前記制御手段は、前記情報を前記第一の通信手段を介して所定の間隔で受信することを特徴とする請求項1からのいずれか1項に記載の電子機器。
  6. さらに音を出力する出力手段を有し、
    前記制御手段は、前記機能が有効ではない状態にある前記外部機器に対して前記機能を有効化するよう前記第一の通信手段を介して制御した場合、前記集音手段によって集音された前記所定の音声を前記出力手段によって出力する
    ことを特徴とする請求項1からのいずれか1項に記載の電子機器。
  7. 前記第一の通信手段は、Bluetooth(登録商標)の規格に準拠して通信することを特徴とする請求項1からのいずれか1項に記載の電子機器。
  8. 前記所定の音声は、前記外部機器を示す音声と、前記外部機器を制御するための音声と、を含むことを特徴とする請求項1からのいずれか1項に記載の電子機器。
  9. 前記電子機器は外部電源に接続し、外部電源から電力を供給することを特徴とする請求項1からのいずれか1項に記載の電子機器。
  10. 音声を集音する集音手段と、外部機器と通信する通信手段を有する電子機器の制御方法であって、
    音声を認識するための前記外部機器の機能が有効か否かに関する情報を前記通信手段を介して取得する取得ステップと、
    前記取得ステップにおいて取得した前記外部機器の前記機能の状態が有効ではない場合、前記外部機器に対する音声を含む所定の音声を前記集音手段を用いて集音したことに応じて、前記外部機器の前記機能を有効化するよう前記通信手段を介して前記外部機器を制御する制御ステップと、
    を有し、
    前記制御ステップでは、前記外部機器の前記機能が有効である場合、前記外部機器に対する音声を含む所定の音声が前記集音手段によって集音された場合でも、前記外部機器に対する制御を行わないことを特徴とする制御方法。
  11. コンピュータを請求項1から9のいずれか1項に記載の電子機器の各手段として機能させるための、コンピュータが読み取り可能なプログラム。
JP2018205868A 2018-10-31 2018-10-31 電子機器、その制御方法、およびそのプログラム Active JP7242248B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018205868A JP7242248B2 (ja) 2018-10-31 2018-10-31 電子機器、その制御方法、およびそのプログラム
US16/660,188 US11393467B2 (en) 2018-10-31 2019-10-22 Electronic device, control method, and storage medium
CN201911042671.3A CN111128145A (zh) 2018-10-31 2019-10-30 电子设备、控制方法和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018205868A JP7242248B2 (ja) 2018-10-31 2018-10-31 電子機器、その制御方法、およびそのプログラム

Publications (3)

Publication Number Publication Date
JP2020071721A JP2020071721A (ja) 2020-05-07
JP2020071721A5 JP2020071721A5 (ja) 2021-12-09
JP7242248B2 true JP7242248B2 (ja) 2023-03-20

Family

ID=70327094

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018205868A Active JP7242248B2 (ja) 2018-10-31 2018-10-31 電子機器、その制御方法、およびそのプログラム

Country Status (3)

Country Link
US (1) US11393467B2 (ja)
JP (1) JP7242248B2 (ja)
CN (1) CN111128145A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11289078B2 (en) * 2019-06-28 2022-03-29 Intel Corporation Voice controlled camera with AI scene detection for precise focusing
KR20220083199A (ko) * 2020-12-11 2022-06-20 삼성전자주식회사 전자장치 및 그 제어방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016151608A (ja) 2015-02-16 2016-08-22 アルパイン株式会社 電子装置、情報端末システム、音声認識機能の起動プログラムおよび音声認識機能の起動方法
US20170019580A1 (en) 2015-07-16 2017-01-19 Gopro, Inc. Camera Peripheral Device for Supplemental Audio Capture and Remote Control of Camera
JP2018517919A (ja) 2015-04-10 2018-07-05 華為技術有限公司Huawei Technologies Co.,Ltd. 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0911808B1 (en) * 1997-10-23 2002-05-08 Sony International (Europe) GmbH Speech interface in a home network environment
US20030069733A1 (en) * 2001-10-02 2003-04-10 Ryan Chang Voice control method utilizing a single-key pushbutton to control voice commands and a device thereof
US8155636B2 (en) * 2006-05-05 2012-04-10 Mediatek Inc. Systems and methods for remotely controlling mobile stations
JP5975947B2 (ja) 2013-07-08 2016-08-23 ユニロボット株式会社 ロボットを制御するためのプログラム、及びロボットシステム
EP3043348B1 (en) * 2013-09-03 2017-10-04 Panasonic Intellectual Property Corporation of America Voice interaction control method
KR102188090B1 (ko) * 2013-12-11 2020-12-04 엘지전자 주식회사 스마트 가전제품, 그 작동방법 및 스마트 가전제품을 이용한 음성인식 시스템
CN103729425B (zh) * 2013-12-24 2018-11-16 腾讯科技(深圳)有限公司 操作响应方法、客户端、浏览器及系统
US9691378B1 (en) * 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
CN105913847B (zh) * 2016-06-01 2020-10-16 北京京东尚科信息技术有限公司 语音控制系统、用户端设备、服务器和中央控制单元
US10271093B1 (en) * 2016-06-27 2019-04-23 Amazon Technologies, Inc. Systems and methods for routing content to an associated output device
CN107770223A (zh) * 2016-08-19 2018-03-06 深圳市轻生活科技有限公司 一种智能语音监护系统和方法
CN107872371A (zh) * 2016-09-23 2018-04-03 深圳市轻生活科技有限公司 与智能无线路由器配合使用的语音控制及其语音控制方法
US10672387B2 (en) * 2017-01-11 2020-06-02 Google Llc Systems and methods for recognizing user speech
KR20180084392A (ko) * 2017-01-17 2018-07-25 삼성전자주식회사 전자 장치 및 그의 동작 방법
CN108574515B (zh) * 2017-03-07 2021-07-30 中移(杭州)信息技术有限公司 一种基于智能音箱设备的数据分享方法、装置和系统
CN107180632A (zh) * 2017-06-19 2017-09-19 微鲸科技有限公司 语音控制方法、装置及可读存储介质
CN108419108A (zh) * 2018-03-06 2018-08-17 深圳创维数字技术有限公司 语音控制方法、装置、遥控器和计算机存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016151608A (ja) 2015-02-16 2016-08-22 アルパイン株式会社 電子装置、情報端末システム、音声認識機能の起動プログラムおよび音声認識機能の起動方法
JP2018517919A (ja) 2015-04-10 2018-07-05 華為技術有限公司Huawei Technologies Co.,Ltd. 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末
US20170019580A1 (en) 2015-07-16 2017-01-19 Gopro, Inc. Camera Peripheral Device for Supplemental Audio Capture and Remote Control of Camera

Also Published As

Publication number Publication date
JP2020071721A (ja) 2020-05-07
US11393467B2 (en) 2022-07-19
CN111128145A (zh) 2020-05-08
US20200135196A1 (en) 2020-04-30

Similar Documents

Publication Publication Date Title
CN105681969B (zh) 电子装置、音频装置、控制电子装置和音频装置电源的方法
KR100753780B1 (ko) 음성 입력 디바이스
EP2904486B1 (en) Handsfree device with continuous keyword recognition
CN103760969A (zh) 移动终端及语音控制应用程序的方法
WO2016061968A1 (zh) 语音控制方法及装置
EP4099690A1 (en) Enhanced video call method and system, and electronic device
JP2015008382A (ja) 携帯電子機器連携システム、情報提供装置、携帯電子機器、及び携帯電子機器用プログラム
CN105975063B (zh) 一种控制智能终端的方法和装置
CN104616652A (zh) 语音传输方法及装置
JP7242248B2 (ja) 電子機器、その制御方法、およびそのプログラム
CN110610699A (zh) 语音信号处理方法、装置、终端、服务器及存储介质
WO2017045190A1 (zh) 指导终端设备操作的方法、装置和设备
JP2018093433A (ja) 通信システム、画像形成装置とその制御方法、及びプログラム
US20100291913A1 (en) Remote control method between mobile phones
CN110765786B (zh) 翻译系统、耳机翻译方法及翻译设备
CN104917909A (zh) 基于通话的留言方法、装置、终端及服务器
US20170118586A1 (en) Voice data transmission processing method, terminal and computer storage medium
JP2015126524A (ja) 遠隔会議プログラム、端末装置および遠隔会議方法
KR20150088532A (ko) 통화 중 서비스 제공 장치 및 이를 이용하는 방법
JP2007041089A (ja) 情報端末および音声認識プログラム
JP6065768B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP7083956B2 (ja) 端末機器の制御方法
JP6031825B2 (ja) 楽曲データ出力システム
KR102093353B1 (ko) 서비스 제공 장치 및 방법
CN106131100A (zh) 用于模块远程请求处理的方法和设备

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211026

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230308

R151 Written notification of patent or utility model registration

Ref document number: 7242248

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151