JP7167104B2 - 音声機器及び音声機器のインタラクション方法、機器、記憶媒体 - Google Patents

音声機器及び音声機器のインタラクション方法、機器、記憶媒体 Download PDF

Info

Publication number
JP7167104B2
JP7167104B2 JP2020141881A JP2020141881A JP7167104B2 JP 7167104 B2 JP7167104 B2 JP 7167104B2 JP 2020141881 A JP2020141881 A JP 2020141881A JP 2020141881 A JP2020141881 A JP 2020141881A JP 7167104 B2 JP7167104 B2 JP 7167104B2
Authority
JP
Japan
Prior art keywords
user
control
control device
target application
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020141881A
Other languages
English (en)
Other versions
JP2021082251A (ja
Inventor
ジン ジャン
ウェイナン リ
インチャオ カオ
フェン リュウ
ユシン カオ
ジャン ユ
ホンウェイ カオ
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
シャンハイ シャオドゥ テクノロジー カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド, シャンハイ シャオドゥ テクノロジー カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
Publication of JP2021082251A publication Critical patent/JP2021082251A/ja
Application granted granted Critical
Publication of JP7167104B2 publication Critical patent/JP7167104B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/162Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Telephonic Communication Services (AREA)
  • Selective Calling Equipment (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephone Function (AREA)

Description

本願は、インタラクション技術分野に関し、特に、音声機器及び音声機器のインタラクション方法、機器、記憶媒体に関する。
人工スマート技術の迅速な発展に伴い、音声機器は機能が多様化になっており、広く応用されている。音声機器のインタラクションモードは音声機器の機能や応用に影響を及ぼす重要な要素の1つである。
関連技術において、音声機器のインタラクションモードは音声制御とタッチ制御とを含み、そのうち、音声制御は、ユーザが音声機器へ音声命令を送信し、音声機器が音声命令を認識して実行するプロセスを含み、タッチ制御は、ユーザがタッチスクリーンを操作することによって音声機器へ制御命令を送信し、音声機器が制御命令を認識して実行するプロセスを含む。
しかしながら、音声制御のインタラクションモードは集約操作シナリオに適せず、タッチ制御のインタラクションモードは遠隔操作シナリオに適せず、音声機器は従来のインタラクションモードがユーザの使用感に支障を与え、音声機器の革新と発展の需要を満たすことができない。
本願の実施例は、集約操作シナリオと遠隔操作シナリオに適されない従来の音声機器インタラクションモードの問題を解決するための音声機器及び音声機器のインタラクション方法、機器、記憶媒体を提供する。
第1の態様では、本願は、音声機器のインタラクション方法を提供し、前記方法は音声機器に適用され、前記音声機器が制御機器と通信的に接続され、前記方法は、
受信したウェイクアップメッセージに応答し、前記ウェイクアップメッセージで指示された第1の対象アプリケーションを開始するステップと、
受信した前記制御機器によって送信されたユーザの操作データに応答し、前記ユーザの操作データに応じて第1の制御命令を生成するステップと、
前記第1の制御命令に応じて、前記第1の対象アプリケーションが前記第1の制御命令で指示された操作を実行するように制御するステップと、を含む。
受信したウェイクアップメッセージに応じて、ウェイクアップメッセージで指示された第1の対象アプリケーションを開始することによって、ユーザが遠隔に制御して第1の対象アプリケーションを開始することが実現できる。受信した制御機器によって検出されたユーザの操作データに応じて、第1の対象アプリケーションが相応の操作を実行するように制御するための第1の制御命令を生成することによって、音声機器の第1の対象アプリケーションに対する遠隔制御を実現し、音声機器の遠隔操作シナリオを実現し、音声機器に対する集約操作シナリオに適用される。
さらに、受信したウェイクアップメッセージに応答するステップは、受信した前記制御機器のウェイクアップメッセージに応答することを含み、前記制御機器のウェイクアップメッセージは、ユーザが前記制御機器で第2の対象アプリケーションを開始するときに生成されるものであり、
前記第2の対象アプリケーションは、前記制御機器にインストールされた、前記第1の対象アプリケーションに対応し、且つ前記音声機器へデータを伝送できるアプリケーションソフトウェア又はアプリケーションプラグインである。
ユーザが制御機器で第2の対象アプリケーションを開始した後に、制御機器が、音声機器にインストールされている、第2の対象アプリケーションに対応する第1の対象アプリケーションをウェイクアップするためのウェイクアップメッセージを音声機器へ送信することによって、音声機器の第1の対象アプリケーションに対する遠隔ウェイクアップを実現し、音声機器に対する遠隔操作を実現する。
さらに、受信したウェイクアップメッセージに応答するステップは、受信したユーザのウェイクアップメッセージに応答することをさらに含み、
受信した前記ユーザのウェイクアップメッセージに応答し、前記ユーザのウェイクアップメッセージで指示された第1の対象アプリケーションを開始した後に、前記方法はさらに、
前記第1の対象アプリケーションのアイデンティティ識別子が指示されている開始命令をアプリケーションサーバに送信し、前記アプリケーションサーバが前記開始命令を前記端末機器に送信するステップであって、前記アプリケーションサーバと前記端末機器とは長い接続状態であるステップと、
前記端末機器が前記開始命令を受信した後に、前記開始命令に対応する前記第2の対象アプリケーションを開始するステップと、を含む。
ユーザが直接に音声機器へウェイクアップメッセージを入力し、音声機器がウェイクアップメッセージに応じて第1の対象アプリケーションを開始した後に、音声機器は、制御機器にインストールされている、第1の対象アプリケーションに対応する第2の対象アプリケーションを開始するための開始命令を制御機器へ送信し、音声機器中の第1の対象アプリケーションと制御機器中の第2の対象アプリケーションとを同期して開始することにより、ユーザの音声機器に対する後続の遠隔操作に実現の基礎を提供する。
さらに、前記音声機器には通信コントローラが設置され、受信した前記制御機器によって送信されたユーザの操作データに応答することは、
前記通信コントローラが受信した、前記制御機器によって送信されたユーザの操作データに応答することを含み、前記制御機器が無線ネットワークで前記ユーザの操作データを送信する。
音声機器には通信コントローラが設置され、音声機器と制御機器との間の直接データ伝送を実現でき、ユーザの音声機器に対する遠隔操作に実現の基礎を提供する。
さらに、前記ユーザの操作データは、
前記制御機器での前記ユーザによる音声入力、
前記制御機器のシミュレーションインタフェースでの前記ユーザによるタッチ入力、
前記制御機器での前記ユーザによるカメラ収集入力、及び
前記制御機器での前記ユーザによるセンサ収集入力のうちの任意の1つ又は任意の複数を含む。
利用可能なユーザの操作データが多様化され、制御機器のセンシング能力が十分に利用されるようになり、音声機器のインタラクション能力の向上、及び音声機器の技能種類の拡大には有利である。
さらに、前記方法はさらに、
前記制御機器によって送信された第2の制御命令を受信し、前記第2の制御命令に応じて、前記第1の対象アプリケーションが前記第2の制御命令で指示された操作を実行するように制御するステップを含み、前記第2の制御命令は、前記制御機器が検出されたユーザの操作データに応じて生成したものである。
制御機器は、検出されたユーザの操作データに応じて、第1の対象アプリケーションが相応の操作を実行するように制御するための第2の制御命令を直接に生成することができ、音声機器に対する遠隔制御モードが柔軟的であり、音声機器のインタラクション能力の向上には有利である。
さらに、前記音声機器は画面付き音声機器を含み、前記制御機器はモバイル通信端末を含む。
モバイル通信端末のセンシング能力を十分に利用することにより、画面付き音声機器のインタラクションパフォーマンスを効果的に向上させ、画面付き音声機器の技能種類が多様化される。
第2の態様では、本願は、音声機器を提供し、前記音声機器が制御機器と通信的に接続され、前記機器は、
受信したウェイクアップメッセージに応答し、前記ウェイクアップメッセージで指示された第1の対象アプリケーションを開始するための第1の処理ユニットと、
受信した前記制御機器によって送信されたユーザの操作データに応答し、前記ユーザの操作データに応じて第1の制御命令を生成するための第2の処理ユニットと、
前記第1の制御命令に応じ、前記第1の対象アプリケーションが前記第1の制御命令で指示された操作を実行するように制御するための第3の処理ユニットと、を含む。
さらに、第1の処理ユニットは、
受信した前記制御機器のウェイクアップメッセージに応答し、前記制御機器のウェイクアップメッセージで指示された第1の対象アプリケーションを開始するための第1の処理サブユニットを含み、
前記制御機器のウェイクアップメッセージは、ユーザが前記制御機器で第2の対象アプリケーションを開始するときに生成されたものであり、
前記第2の対象アプリケーションは、前記制御機器にインストールされた、前記第1の対象アプリケーションに対応し、且つ前記音声機器へデータを伝送できるアプリケーションソフトウェア又はアプリケーションプラグインである。
さらに、第1の処理ユニットはさらに、
受信したユーザのウェイクアップメッセージに応答し、前記ユーザのウェイクアップメッセージで指示された第1の対象アプリケーションを開始するための第2の処理サブユニットを含み、
前記機器はさらに、
前記第1の対象アプリケーションのアイデンティティ識別子が指示されている開始命令をアプリケーションサーバに送信し、前記アプリケーションサーバが前記開始命令を前記端末機器に送信し、前記アプリケーションサーバと前記端末機器とは長い接続状態であり、
前記端末機器が前記開始命令を受信した後に、前記開始命令に対応する前記第2の対象アプリケーションを開始するための第4の処理ユニットを含む。
さらに、前記音声機器には通信制御ユニットが設置され、前記第1の処理ユニットは、
前記通信制御ユニットが受信した、前記制御機器によって送信されたユーザの操作データに応答するためのものであり、前記制御機器が無線ネットワークで前記ユーザの操作データを送信する。
さらに、前記ユーザの操作データは、
前記制御機器での前記ユーザによる音声入力、
前記制御機器のシミュレーションインタフェースでの前記ユーザによるタッチ入力、
前記制御機器での前記ユーザによるカメラ収集入力、及び
前記制御機器での前記ユーザによるセンサ収集入力のうちの任意の1つ又は任意の複数を含む。
さらに、前記機器はさらに、
前記制御機器によって送信された第2の制御命令を受信し、前記第2の制御命令に応じ、前記第1の対象アプリケーションは前記第2の制御命令で指示された操作を実行するように制御するための第5の処理ユニットを含み、前記第2の制御命令は、前記制御機器が検出されたユーザの操作データに応じて生成されたものである。
さらに、前記音声機器は画面付き音声機器を含み、前記制御機器はモバイル通信端末を含む。
第3の態様では、本願は、電子機器を提供し、
少なくとも1つのプロセッサ、および
前記少なくとも1つのプロセッサと通信的に接続されたメモリを含み、
前記メモリには前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記少なくとも1つのプロセッサが第1の態様のいずれか1つの実施形態に記載の方法を実行できるように、前記命令が前記少なくとも1つのプロセッサによって実行される。
第4の態様では、本願は、コンピュータ命令が記憶されている非一時的なコンピュータ可読記憶媒体を提供し、前記コンピュータ命令が前記コンピュータに第1の態様のいずれか1つの実施形態に記載の方法を実行させるためのものである。
本願は、音声機器及び音声機器のインタラクション方法、機器、記憶媒体を開示しており、前記方法は音声機器に適用され、前記音声機器が制御機器と通信的に接続され、前記方法は、受信したウェイクアップメッセージに応答し、前記ウェイクアップメッセージで指示された第1の対象アプリケーションを開始するステップと、受信した前記制御機器によって送信されたユーザの操作データに応答し、前記ユーザの操作データに応じて第1の制御命令を生成するステップと、前記第1の制御命令に応じ、前記第1の対象アプリケーションが前記第1の制御命令で指示された操作を実行するように制御するステップと、を含む。音声機器の第1の対象アプリケーションに対するユーザの遠隔制御を実現し、音声機器の遠隔操作シナリオを実現するとともに、音声機器に対するユーザによる直接操作の必要がなくなり、音声機器の集約型操作シナリオに適用される。
上記代表的な形態が持つその他の効果について、以下、具体的な実施例に合わせて説明する。
図面は、本解決手段をよりよく理解するためのものであり、本願に対する限定を構成しない。
本願の実施例による1つの音声機器のインタラクション方法のフローチャートである。 本願の実施例による音声機器のインタラクションシナリオの概略図である。 本願の実施例による他の音声機器のインタラクション方法のフローチャートである。 本願の実施例による1つの音声機器の構造概略図である。 本願の実施例による他の音声機器の構造概略図である。 本願の実施例による1つの音声機器のインタラクション機器の構造概略図である。
以下、本願の例示的実施例を図面に合わせて説明し、理解しやすくするために本願の実施例の様々な詳細が含まれているが、それらは例示的なものにすぎないと見なされるべきである。したがって、当業者であれば、本明細書で説明する実施例に対して様々な変更や修正を行うことができ、本願の範囲と主旨から逸脱しないと意識すべきである。同様に、明瞭と簡潔のために、周知の機能と構造の説明は以下に省略されている。
本願にかかわる用語の解釈
通信的接続について:通信の伝送インタラクションにより、接続された機器の間で通信を構成し、通信的接続は、有線通信的な接続と無線通信的な接続とを含む。
SDKについて:Software Development Kit、ソフトウェア開発キット、開発ソフトウェアを支援するための関連ドキュメント、例及びツールのコレクションである。
通信コントローラについて:Communication Control Unit、データ通信システムにおいて、データ回路とホストとの間にあるデータ伝送を制御するための通信インタフェース機器のことを指し、略称CCUである。
Appについて:Applicationの略称で、アプリケーションソフトウェアである。
長い接続について:1つの接続では複数のパケットを連続的に送信することができ、接続保持期間内には、パケットが何1つも送信されなかった場合、両方ともリンク検出パケットを送信する必要があり、長い接続は、操作が頻繁である、ポイントツーポイントの通信に多く応用されている。
MD5アルゴリズムについて:Message-Digest Algorithm、メッセージダイジェストアルゴリズムは、広く利用されているパスワードハッシュ関数であり、情報伝送の完全性と一貫性を確保するための128ビット(16バイト)のハッシュ値(hash value)を生成することができる。
本願の応用シナリオについて:人工スマート技術の迅速な発展に伴い、音声機器は機能が多様化になっており、広く応用されている。音声機器のインタラクションモードは音声機器の機能や応用に影響を及ぼす重要な要素の1つである。関連技術において、音声機器のインタラクションモードは音声制御とタッチ制御とを含み、そのうち、音声制御は、ユーザが音声機器へ音声命令を送信し、音声機器が音声命令を認識して実行するプロセスを含み、タッチ制御は、ユーザがタッチスクリーンを操作することによって音声機器へ制御命令を送信し、音声機器が制御命令を認識して実行するプロセスを含む。
しかしながら、音声制御のインタラクションモードは集約操作シナリオに適せず、タッチ制御のインタラクションモードは遠隔操作シナリオに適せず、音声機器の従来のインタラクションモードはユーザの使用感に支障を与え、音声機器の革新と発展の需要を満たすことができない。
本願による音声機器及び音声機器のインタラクション方法、機器、記憶媒体は、上記技術問題を解决することを目的とする。
図1は、本願の実施例による1つの音声機器のインタラクション方法であり、本方法は音声機器に適用され、音声機器が制御機器と通信的に接続され、図1に示すように、該方法は、以下のステップを含む。
ステップ101において、受信したウェイクアップメッセージに応答し、ウェイクアップメッセージで指示された第1の対象アプリケーションを開始する。
音声機器はウェイクアップメッセージを受信した後に、受信したウェイクアップメッセージに応答し、ウェイクアップメッセージで指示された第1の対象アプリケーションを開始し、第1の対象アプリケーションは音声機器にインストールされたアプリケーションソフトウェアとアプリケーションプログラムとを含み、アプリケーションソフトウェアが音声機器にインストールされている、独立のAPPを含み、アプリケーションプログラムが音声機器にインストールされているプラグイン、ミニプログラムなどを含む。ウェイクアップメッセージには第1の対象アプリケーションのアイデンティティ識別子が含まれ、音声機器がウェイクアップメッセージ中のアイデンティティ識別子に応じ、アイデンティティ識別子に対応する第1の対象アプリケーションを開始する。ウェイクアップメッセージに含まれるアイデンティティ識別子は、第1の対象アプリケーションの唯一の識別コードであり、具体的に、第1の対象アプリケーションのアプリケーションパケット名またはMD5アルゴリズムなどであってもよい。例示的に、音声機器が受信したウェイクアップメッセージは、ユーザの音声命令「フルーツニンジャを開始する」であり、音声機器が音声命令中の主要な情報「フルーツニンジャ」を認識して抽出し、音声命令の意味情報を識別した後に、音声機器は音声命令に応じて対象アプリケーションを開始するための制御命令を生成し、制御命令に応じて「フルーツニンジャ」APPを開始する。ウェイクアップメッセージを受信し、ウェイクアップメッセージに応じてウェイクアップメッセージで指示された第1の対象アプリケーションを開始することにより、ユーザにとって、音声機器中の対象アプリケーションを遠隔に開始することが実現でき、音声機器に対する遠隔制御が実現される。
ステップ102において、受信した制御機器によって送信されたユーザの操作データに応答し、ユーザの操作データに応じて第1の制御命令を生成する。
本実施例において、具体的に、音声機器と制御機器とは通信的接続状態であり、通信的接続は主に、無線通信的接続を含み、無線通信的接続は、WIFI、セルラーネットワーク、ブルートゥース(登録商標)、赤外線、ネットワークホットスポットなどを含むが、それらに限定されない。音声機器には通信コントローラが設置され、通信コントローラが実現できる機能は、データ回路でのシリアルビットストリームをキャラクタに組み立て、またはキャラクタをシリアルビットストリームに分割することと、伝送コードと音声機器ホスト内部コードとの変換を実現し、これによって音声機器と制御機器との間の無線通信を実現する。
音声機器は制御機器によって送信されたユーザの操作データを受信し、ユーザの操作データは、ユーザが制御機器を操作するときに発したものであり、ユーザの操作データは、制御機器でのユーザによるキー入力、制御機器でのユーザによる音声入力、制御機器のシミュレーションインタフェースでのユーザによるタッチ入力、制御機器でのユーザによるカメラ収集入力、制御機器でのユーザによるセンサ収集入力のうちの任意の1つ又は任意の複数を含む。具体的に、制御機器でのユーザによるキー入力は、ユーザが制御機器のキー、ボタンを利用して入力された情報を含み、制御機器でのユーザによる音声入力は、ユーザが制御機器へ入力した音声情報を含み、制御機器のシミュレーションインタフェースでのユーザによるタッチ入力は、制御機器のシミュレーションインタフェースでのユーザによる手書き、タイピング、触れ押し、スライド、クリックなどの形態を用いたタッチ入力を含み、制御機器でのユーザによるカメラ収集入力は、ユーザが制御機器のカメラ収集によって発生した画像データ、ビデオデータなどを含み、制御機器でのユーザによるセンサ収集入力は、ユーザが制御機器のセンサ収集によって発生した位置、動作、変位、温度などのデータを含む。例示的に、ユーザの操作データは、スマートフォンにおけるジャイロによって検出されたユーザの体感データを含み、具体的に、ユーザ四肢の変位量、変位方向、速度、加速度などの情報を含む。音声機器が受信したユーザの操作データは、多様性と柔軟性があり、これは、音声機器の機能の更なる多様化と応用の更なる広範囲化には有利である。
図1aは、本願の実施例による音声機器のインタラクションシナリオの概略図であり、図1aに示すように、ユーザによって実行された制御機器に対する操作は揺動操作であり、制御機器は、ユーザの揺動操作による操作データを検出し、具体的に、揺動角度、揺動方向、揺動速度などの情報が含まれ、音声機器は、ユーザ揺動制御機器に応じて生成された操作データによって、第1の対象アプリケーションが相応の操作を実行するように制御するための第1の制御命令を生成するよう、制御機器は検出したユーザの操作データを音声機器に送信する。
制御機器によって送信されたユーザの操作データを取得した後に、音声機器が受信したユーザの操作データを認識し、ユーザの操作データに応じて第1の制御命令を生成する。具体的に、音声機器は、制御機器によって送信されたユーザの操作データで構成されたアレイを受信した後に、通信コントローラを利用してユーザの操作データで構成されたアレイを音声機器が認識できるデータに変換し、第1の制御命令を構成する。音声機器がユーザの操作データに応じて第1の制御命令を生成するプロセスは、従来技術を用いて実現されることができ、本願はここで繰り返して説明しない。
ステップ103において、第1の制御命令に応じ、第1の対象アプリケーションは第1の制御命令で指示された操作を実行するように制御する。
本実施例において、具体的に、音声機器は受信したユーザの操作データに応じ、第1の制御命令を生成し、第1の制御命令は、音声機器が直接読み取って実行する命令である。第1の対象アプリケーションは第1の制御命令で指示された操作を実行するように制御し、即ち、第1の対象アプリケーションが端末機器によって検出されたユーザの操作データに対応する操作を実行するように制御し、端末機器でのユーザによる操作が実現され、対応する操作に対する音声機器の第1の対象アプリケーションによる遠隔実行は、音声機器に対するユーザによる遠隔制御を実現し、音声機器に対する遠隔制御の応用シナリオに適用され、音声機器に対するユーザの直接操作を効果的に削減することができる。
本実施例は、音声機器のインタラクション方法を提供し、該方法は音声機器に適用され、受信したウェイクアップメッセージに応答することにより、ウェイクアップメッセージで指示された第1の対象アプリケーションを開始するステップと、受信した制御機器によって送信されたユーザの操作データに応答し、ユーザの操作データに応じて第1の制御命令を生成するステップと、第1の制御命令に応じ、第1の対象アプリケーションが第1の制御命令で指示された操作を実行するように制御するステップと、を含む。ウェイクアップメッセージを受信した後に、ウェイクアップメッセージで指示された第1の対象アプリケーションを開始することによって、音声機器の対象アプリケーションを遠隔に開始することを実現できる。端末機器によって送信されたユーザの操作データを受信した後に、受信したユーザの操作データに応じ第1の制御命令を生成し、第1の対象アプリケーションが第1の制御命令で指示された操作を実行するように制御することによって、制御機器側でユーザの操作データを検出することを実現し、ユーザの操作データを音声機器に送信することにより、音声機器は、第1の対象アプリケーションがユーザの操作データに対応する操作を実行するように制御することによって、音声機器のユーザによる遠隔制御を実現し、音声機器の遠隔操作シナリオを実現する。音声機器のユーザによる直接操作の必要がなくなり、かつユーザが音声機器を遠隔に操作する操作形態は、柔軟性と多様性があり、音声機器の集約型操作シナリオに適用される。
図2は、本願の実施例による他の音声機器のインタラクション方法のフローチャートであり、該方法は音声機器に適用され、図2に示すように、該方法は以下のステップを含む。
ステップ201において、受信した制御機器又はユーザのウェイクアップメッセージに応答し、ウェイクアップメッセージで指示された第1の対象アプリケーションを開始する。
選択的に、ステップ201は、受信した制御機器のウェイクアップメッセージに応答することを含み、制御機器のウェイクアップメッセージは、ユーザが制御機器で第2の対象アプリケーションを開始するときに生成されたものであり、第2の対象アプリケーションは、制御機器にインストールされた、第1の対象アプリケーションに対応し、且つ音声機器へデータを伝送できるアプリケーションソフトウェア又はアプリケーションプラグインである。
ユーザが制御機器で第2の対象アプリケーションを開始した後に、音声機器はウェイクアップメッセージを受信した後に、第2の対象アプリケーションに対応する第1の対象アプリケーションを開始するよう、第2の対象アプリケーションは音声機器と無線通信方式で接続を確立し、制御機器はウェイクアップメッセージを生成し、ウェイクアップメッセージを音声機器に送信する。第1の対象アプリケーションと第2の対象アプリケーションはそれぞれ、音声機器と制御機器にインストールされた、対応関係があるアプリケーションソフトウェア又はアプリケーションプラグインであり、1つの機器で1つの対象アプリケーションを開始した後に、もう1つの機器でもう1つの対象アプリケーションを同期して開始することを実現するために、第1の対象アプリケーションと第2の対象アプリケーションとに対して「同期開始」と「遠隔制御を許可」と類似するオプション設定を予め開始することを要求する。例えば、第1の対象アプリケーションは音声機器にインストールされている「フルーツニンジャ」のAPPであり、第2の対象アプリケーションは制御機器にインストールされている「フルーツニンジャ」のミニプログラムである。第2の対象アプリケーションが音声機器へデータを直接伝送でき、第2の対象アプリケーションには音声機器のソフトウェア開発キットSDKが集積され、または第2の対象アプリケーションが音声機器と直接通信できるアプリケーションソフトウェアにインストールされたアプリケーションプラグインであることを要求し、例示的に、音声機器はスマートスピーカーであり、制御機器はスマートフォンであり、第2の対象アプリケーションはスマートフォンにおけるスピーカー制御ソフトウェアにインストールされた「フルーツニンジャ」のミニプログラムであると、アプリケーションソフトウェアが音声機器と直接通信できるため、アプリケーションソフトウェアのもとにインストールされたアプリケーションプラグインも音声機器と直接通信できるようになり、このため第2の対象アプリケーションは音声機器へウェイクアップメッセージを直接送信することができる。
選択的に、ステップ201はさらに、受信したユーザのウェイクアップメッセージに応答することを含み、受信したユーザのウェイクアップメッセージに応答し、ユーザのウェイクアップメッセージで指示された第1の対象アプリケーションを開始した後に、本方法はさらに、第1の対象アプリケーションのアイデンティティ識別子が指示される開始命令をアプリケーションサーバに送信し、アプリケーションサーバが開始命令を端末機器に送信するステップであって、アプリケーションサーバと端末機器とは長い接続状態であるステップと、端末機器は開始命令を受信した後に、開始命令に対応する第2の対象アプリケーションを開始するステップと、を含む。
受信したウェイクアップメッセージがユーザのウェイクアップメッセージである場合、ユーザのウェイクアップメッセージで指示された第1の対象アプリケーションを開始する。ユーザのウェイクアップメッセージは、ユーザの音声命令と音声機器でのユーザによる操作命令を含み、ウェイクアップメッセージは、音声機器中の第1の対象アプリケーションを開始するように指示するためのものである。音声機器中の第1の対象アプリケーションを開始するのに成功した後に、ユーザが制御機器を介して音声機器を遠隔制御することを実現するために、このとき、第1の対象アプリケーションに対応する制御機器中の第2の対象アプリケーションを開始する必要がある。
音声機器に対するユーザのウェイクアップメッセージを受信した後に、制御機器中の第2の対象アプリケーションを同期して開始するために、音声機器は、無線ネットワークを介して第1の対象アプリケーションのアイデンティティ識別子が含まれた開始命令をクラウドプラットフォームに送信し、クラウドプラットフォームは開始命令をアプリケーションサーバに転送し、アプリケーションサーバと制御機器とは長い接続状態であり、アプリケーションサーバは開始命令を制御機器に転送し、制御機器は第1の対象アプリケーションのアイデンティティ識別子が含まれた開始命令を受信した後に、開始命令に対応する第2の対象アプリケーションを開始する。
ステップ202において、受信した制御機器によって送信されたユーザの操作データに応答し、ユーザの操作データに応じて第1の制御命令を生成する。
本実施例において、具体的に、ユーザが端末機器で操作するとき、端末機器は、音声機器が第1の対象アプリケーションが相応の操作を実行するように制御するための制御命令を生成するよう、ユーザの操作データを検出し、検出されたユーザの操作データを音声機器に送信し、音声機器の第1の対象アプリケーションに対するユーザの遠隔制御を実現する。
検出された、端末機器でのユーザによる操作データに応じ、第1の対象アプリケーションが相応の操作を実行するように制御するための制御命令を生成し、制御命令を生成する1つの形態は、端末機器は検出されたユーザの操作データを音声機器に送信し、音声機器は受信したユーザの操作データに応じ、第1の制御命令を生成し、第1の制御命令に応じて第1の対象アプリケーションがユーザの操作データに対応する操作を実行するように制御するプロセスを含む。制御命令を生成するもう1つの形態は、音声機器が第2の制御命令に応じて、第1の対象アプリケーションがユーザの操作データに対応する操作を実行するように制御するよう、端末機器は検出されたユーザの操作データに応じて、第2の制御命令を生成し、第2の制御命令を音声機器に送信するプロセスを含む。
例示的に、スマートフォンとスマートスピーカー中の「フルーツニンジャ」のAPPを開始した後に、ユーザがスマートフォンを手持ちしてシェイクの動作をし、スマートフォンに設置されたジャイロを利用してユーザの操作データを検出し、ユーザの操作データは、左から右へのユーザ体感変位方向、30センチの体感変位量、0.5メートル/秒の速度によって構成されたアレイであり、スマートフォンはユーザの操作データによって構成されたアレイをスマートスピーカーに送信し、スマートスピーカーは受信した、ユーザの操作データによって構成されたアレイに基づいて第1の制御命令を生成し、第1の制御命令に応じて「フルーツニンジャ」のAPP中のゲームオブジェクトが対応する操作を完成させるように制御する。
ステップ203において、第1の制御命令に応じ、第1の対象アプリケーションが第1の制御命令で指示された操作を実行するように制御する。
本実施例において、具体的に、音声機器は第1の制御命令に応じ、第1の対象アプリケーションが第1の制御命令で指示された操作を実行するように制御し、第1の対象アプリケーションが対応する操作を実行するとき、音声機器はライト級の操作データと操作結果とをアプリケーションサーバにアップロードすると同時に、アプリケーションサーバが配信する操作論理と操作内容を受信する。音声機器中の第1の対象アプリケーションは第1の制御命令で指示された操作を実行するとき、制御機器中の第2の対象アプリケーションは操作中という提示情報を表示する。
本実施例において、音声機器は画面付き音声機器を含み、例えば画面付きスマートスピーカー、スマートビデオスピーカーなどを含む。制御機器はモバイル通信端末を含み、例えばスマートフォン、タブレットなどを含む。ユーザはモバイル通信端末を利用することによって操作し、モバイル通信端末はユーザの操作データを収集し、収集したユーザの操作データを画面付きスマートスピーカーに送信し、画面付きスマートスピーカーは受信したユーザの操作データに応じて第1の制御命令を生成し、第1の制御命令に応じて対象アプリケーションが相応の操作を完成させるように制御し、例示的に、ユーザはハンドスティックを手に握ってゲームをし、ハンドスティックはユーザの体感情報を取得し、体感情報をゲーム機に送信することにより、ゲーム機はユーザの体感情報に基づいてゲームオブジェクトの操作を制御するための制御命令を生成する従来技術と比べて、本実施例において、ユーザはスマートフォンを手に握り、スマートフォンがハンドスティックの役目を果たしており、スマートフォンはユーザの体感情報を取得し、体感情報を画面付きスマートスピーカーに送信し、画面付きスマートスピーカーは体感情報に基づいてゲームオブジェクトの操作を制御するための第1の制御命令を生成する。本方法は、モバイル通信端末のセンシング能力を十分に利用しており、画面付き音声機器のインタラクションパフォーマンスを向上させ、画面付き音声機器の技能種類を多様化させる。
本実施例は、もう1つの音声機器のインタラクション方法を提供することにより、該方法は音声機器に適用され、受信した制御機器又はユーザのウェイクアップメッセージに応答することにより、ウェイクアップメッセージで指示された第1の対象アプリケーションを開始し、受信した制御機器によって送信されたユーザの操作データに応答し、ユーザの操作データに応じて第1の制御命令を生成し、第1の制御命令に応じ、第1の対象アプリケーションが第1の制御命令で指示された操作を実行するように制御する。ユーザは、音声機器中の第1の対象アプリケーションを直接ウェイクアップしてもよいが、制御機器中の第2の対象アプリケーションをウェイクアップすることにより、音声機器中の第1の対象アプリケーションを間接にウェイクアップしてもよく、音声機器の第1の対象アプリケーションに対する遠隔ウェイクアップが実現され、音声機器に対する遠隔操作が実現される。音声機器はユーザの操作データに応じて第1の対象アプリケーションが相応の操作を実行するように制御するための第1の制御命令を生成するよう、制御機器は制御機器でのユーザによる操作データを収集し、ユーザの操作データを音声機器に送信し、ユーザは、制御機器で操作することにより、音声機器の第1の対象アプリケーションに対する遠隔制御を実現し、音声機器の遠隔操作シナリオを実現する。音声機器のユーザによる直接操作の必要がなくて、音声機器中の対象アプリケーションが相応の操作を実現するように制御することができるようになり、音声機器の集約操作シナリオに適用され、音声機器に対するユーザの直接操作が効果的に削減され、ユーザの使用感の向上と音声機器の耐用年数の延びには有利である。制御機器のセンシング能力が十分に利用されるようになり、音声機器のインタラクション能力を向上させ、音声機器の技能種類が効果的に多様化され、音声機器機能の革新や発展には有利である。
図3は、本願の実施例による1つの音声機器の構造概略図であり、図3に示すように、該音声機器は、
受信したウェイクアップメッセージに応答し、ウェイクアップメッセージで指示された第1の対象アプリケーションを開始するための第1の処理ユニット1と、
受信した制御機器によって送信されたユーザの操作データに応答し、ユーザの操作データに応じて第1の制御命令を生成するための第2の処理ユニット2と、
第1の制御命令に応じ、第1の対象アプリケーションが第1の制御命令で指示された操作を実行するように制御するための第3の処理ユニット3と、を含む。
本実施例は、音声機器の構造概略図を提供し、音声機器は、受信したウェイクアップメッセージに応答し、ウェイクアップメッセージで指示された第1の対象アプリケーションを開始するための第1の処理ユニットと、受信した制御機器によって送信されたユーザの操作データに応答し、ユーザの操作データに応じて第1の制御命令を生成するための第2の処理ユニットと、第1の制御命令に応じ、第1の対象アプリケーションが第1の制御命令で指示された操作を実行するように制御するための第3の処理ユニットと、を含む。ウェイクアップメッセージを受信した後に、ウェイクアップメッセージで指示された第1の対象アプリケーションを開始することによって、音声機器の対象アプリケーションを遠隔に開始することを実現できる。端末機器によって送信されたユーザの操作データを受信した後に、受信したユーザの操作データに応じて第1の制御命令を生成し、第1の対象アプリケーションが第1の制御命令で指示された操作を実行するように制御することによって、制御機器側でユーザの操作データを検出することを実現し、ユーザの操作データを音声機器に送信し、音声機器は第1の対象アプリケーションがユーザの操作データに対応する操作を実行するように制御することにより、音声機器に対するユーザによる遠隔制御が実現され、音声機器の遠隔操作シナリオが実現される。音声機器に対するユーザによる直接操作の必要がなくなり、かつユーザが音声機器を遠隔に操作する操作形態は柔軟性と多様性があり、音声機器の集約型操作シナリオに適用される。
図4は、本願の実施例による他の音声機器の構造概略図であり、図3のうえで、図4に示すように、
第1の処理ユニット1は、
受信した制御機器のウェイクアップメッセージに応答し、制御機器のウェイクアップメッセージで指示された第1の対象アプリケーションを開始するための第1の処理サブユニット11を含み、
制御機器のウェイクアップメッセージは、ユーザが制御機器で第2の対象アプリケーションを開始するときに生成されたものであり、
第2の対象アプリケーションは、制御機器にインストールされた、第1の対象アプリケーションに対応し、且つ音声機器へデータを伝送できるアプリケーションソフトウェア又はアプリケーションプラグインである。
第1の処理ユニット1はさらに、
受信したユーザのウェイクアップメッセージに応答し、ユーザのウェイクアップメッセージで指示された第1の対象アプリケーションを開始するための第2の処理サブユニット12を含み、
音声機器はさらに、
第1の対象アプリケーションのアイデンティティ識別子が指示される開始命令をアプリケーションサーバに送信し、アプリケーションサーバが開始命令を端末機器に送信し、アプリケーションサーバと端末機器とは長い接続状態であり、
端末機器は開始命令を受信した後に、開始命令に対応する第2の対象アプリケーションを開始するための第4の処理ユニット4を含む。
音声機器には通信制御ユニットが設置され、第1の処理ユニット1は、
通信制御ユニットが受信した、制御機器によって送信されたユーザの操作データに応答するためのものであり、制御機器が無線ネットワークでユーザの操作データを送信する。
ユーザの操作データは、
制御機器でのユーザによる音声入力、
制御機器のシミュレーションインタフェースでのユーザによるタッチ入力、
制御機器でのユーザによるカメラ収集入力、及び
制御機器でのユーザによるセンサ収集入力のうちの任意の1つ又は任意の複数を含む。
音声機器はさらに、
制御機器によって送信された第2の制御命令を受信し、第2の制御命令に応じ、第1の対象アプリケーションが第2の制御命令で指示された操作を実行するように制御するための第5の処理ユニット5を含み、第2の制御命令は、制御機器が検出されたユーザの操作データに応じて生成されたものである。
音声機器は画面付き音声機器を含み、制御機器はモバイル通信端末を含む。
本実施例は、他の音声機器の構造概略図を提供し、音声機器は、受信したユーザ又は制御機器のウェイクアップメッセージに応答し、ウェイクアップメッセージで指示された第1の対象アプリケーションを開始するための第1の処理ユニットと、受信した制御機器によって送信されたユーザの操作データに応答し、ユーザの操作データに応じて第1の制御命令を生成するための第2の処理ユニットと、第1の制御命令に応じ、第1の対象アプリケーションが第1の制御命令で指示された操作を実行するように制御するための第3の処理ユニットと、を含む。ユーザは、音声機器中の第1の対象アプリケーションを直接ウェイクアップしてもよいが、制御機器中の第2の対象アプリケーションをウェイクアップすることにより、音声機器中の第1の対象アプリケーションを間接にウェイクアップしてもよく、音声機器の第1の対象アプリケーションに対する遠隔ウェイクアップが実現され、音声機器に対する遠隔操作が実現される。音声機器はユーザの操作データに応じて第1の対象アプリケーションが相応の操作を実行するように制御するための第1の制御命令を生成するよう、制御機器は制御機器でのユーザによる操作データを収集し、ユーザの操作データを音声機器に送信し、ユーザは、制御機器で操作することにより、音声機器の第1の対象アプリケーションに対する遠隔制御を実現し、音声機器の遠隔操作シナリオを実現する。音声機器に対するユーザによる直接操作の必要がなくて、音声機器中の対象アプリケーションが相応の操作を実現するように制御することができるようになり、音声機器の集約操作シナリオに適用され、音声機器に対するユーザの直接操作が効果的に削減され、ユーザの使用感の向上と音声機器の耐用年数の延びには有利である。制御機器のセンシング能力が十分に利用されるようになり、音声機器のインタラクション能力を向上させ、音声機器の技能種類が効果的に多様化され、音声機器機能の革新や発展には有利である。
本願の実施例によれば、本願はさらに、電子機器と可読記憶媒体とを提供する。
図5に示すように、本願の実施例の音声機器のインタラクション方法による電子機器のブロック図である。電子機器は、ラップトップコンピューター、デスクトップコンピューター、ワークベンチ、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピューター、その他の適切なコンピュータなど、様々な形のデジタルコンピューターを表すことを旨としている。電子機器はさらに、パーソナルデジタルアシスタント、セルラー電話、スマートフォン、ウェアラブルデバイス、その他の類似のコンピューティング機器など、様々な形のモバイルデバイスを表すこともできる。本明細書で示すコンポーネント、それらの接続と関係、及びそれらの機能は例示的ものにすぎず、かつ、本明細書で説明及び/又は要請する本願の実現を制限することを意図するものではない。
図5に示すように、該電子機器は、1つ又は複数のプロセッサ501、メモリ502、および高速インタフェースと低速インタフェースとが含まれる、各コンポーネントを接続するためのインタフェースを含む。各コンポーネントは、異なるバスを使用して相互に接続されており、かつ、汎用マザーボードにインストールされるか、または、必要に応じて他の形態でインストールされてもよい。プロセッサは、外部入力/出力装置(例えば、インタフェースに結合された表示デバイス)でグラフィカルユーザーインターフェイス(GUI)のグラフィック情報を表示するためにメモリ又はメモリ上に記憶された命令が含まれる、電子機器内で実行される命令を処理することができる。他の実施形態において、必要に応じて、複数のプロセッサ及び/又は複数のバスは、複数のメモリとともに使用することができる。同様に、複数の電子機器に接続することができ、各機器が必要な操作の一部を提供する(例えば、サーバアレイ、1つのグループのブレードサーバ、または、マルチプロセッサシステムとして作用する)。図5では、1つのプロセッサ501を例とする。
メモリ502は即ち、本願による非一時的なコンピュータ可読記憶媒体である。そのうち、少なくとも1つのプロセッサが本願による音声機器のインタラクション方法を実行するようにさせるために、メモリには少なくとも1つのプロセッサによって実行できる命令が記憶されている。本願の非一時的なコンピュータ可読記憶媒体にはコンピュータ命令を記憶しており、該コンピュータ命令がコンピュータに本願による音声機器のインタラクション方法を実行させるためのものである。
メモリ502は、非一時的なコンピュータ可読記憶媒体として、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能プログラム及びモジュール、例えば本願の実施例における音声機器のインタラクション方法に対応するプログラム命令/モジュール(例えば、図3に示すような第1の処理ユニット1、第2の処理ユニット2及び第3の処理ユニット3)を記憶するためのものである。プロセッサ501は、メモリ502に記憶された非一時的なソフトウェアプログラム、命令およびモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理を実行し、即ち、上記方法の実施例における音声機器のインタラクション方法を実現する。
メモリ502はプログラム記憶エリアとデータ記憶エリアとを含んでもよく、そのうち、プログラム記憶エリアは、操作システム、少なくとも1つの機能に必要なアプリケーションプログラムを記憶することができる。データ記憶エリアは、音声機器のインタラクション電子機器の使用によって作成されたデータなどを記憶することができる。なお、メモリ502は、高速ランダムアクセスメモリを含んでもよいが、少なくとも1つの磁気ディスク記憶デバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスなどの非一時的なメモリを含んでもよい。いくつかの実施例において、メモリ502は、プロセッサ501に対して遠隔に設置されたメモリを含んでもよく、これらの遠隔メモリは、ネットワークを介して音声機器のインタラクション電子機器に接続されることができる。上記ネットワークの実例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせを含むが、それらに限定されない。
音声機器のインタラクション方法の電子機器はさらに、入力装置503と出力装置504とを含んでもよい。プロセッサ501、メモリ502、入力装置503及び出力装置504はバスまたは他の方法を介して接続されることができ、図5では、バスを介して接続されることを例としている。
入力装置503は、入力された数字又はキャラクタ情報を受信し、音声機器のインタラクション電子機器のユーザ設定および機能制御に関連するキーシグナルの入力を呼び起こすことができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、インディケータロッド、1つ又は複数のマウスボタン、トラックボール、操縦ハンドルなどの入力装置であってもよい。出力装置504は、ディスプレイデバイス、補助照明装置(例えば、LED)と触感フィードバック装置(例えば、振動モータ)などを含んでもよい。該ディスプレイデバイスは、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ及びプラズマディスプレイを含んでもよいが、それらに限定されない。いくつかの実施形態において、ディスプレイデバイスはタッチスクリーンであってもよい。
本明細書で説明したシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はこれらの組み合わせで実現されることができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムで実施されることを含んでもよく、該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサが含まれたプログラマブルシステムで実行及び/又は解釈されることができ、該プログラマブルプロセッサは、特定用途向け、又は汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置から、データと命令を受信し、かつ、該記憶システム、該少なくとも1つの入力装置、及び該少なくとも1つの出力装置にデータと命令を伝送することができる。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとも呼ばれる)は、プログラマブルプロセッサの機械語命令を含み、かつ、アドバンスプロセス及び/又はオブジェクト指向型プログラミング言語、及び/又はアセンブリ言語/機械語を用いて、これらのコンピューティングプログラムを実施することができる。例えば、本明細書で使用された用語の「機械可読媒体」と「コンピュータ可読媒体」は、機械語命令及び/又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、デバイス、及び/又は装置(例えば磁気ディスク、光ディスク、メモリ、プログラマブルロジック装置(PLD))のことを指し、機械可読信号とされる機械語命令を受信する機械可読媒体を含む。用語の「機械可読信号」は、機械語命令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号のことを指す。
ユーザとのインタラクションを提供するために、本明細書で説明したシステムと技術は、情報をユーザにディスプレイするためのディスプレイ装置(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニター)、およびキーボードとポインティングデバイス(例えば、マウス又はトラックボール)を有するコンピュータで実施されることができ、該キーボードと該ポインティングデバイスとを通じ、ユーザは、入力をコンピュータに提供することができる。その他の種類の装置も、ユーザとのインタラクションを提供するためのものとして、使用されることができ、例えば、ユーザに提供されるフィードバックが任意の形の感覚フィードバック(視覚フィードバック、聴覚フィードバック、または触感フィードバックなど)であってもよく、かつ、任意の形(サウンド入力、音声入力、または触感入力を含む)をもって、ユーザからの入力を受信することができる。
本明細書で説明したシステムと技術は、バックグランドコンポーネントが含まれたコンピューティングシステム(例えば、データサーバとして作用する)で、またはミドルウェアコンポーネントが含まれたコンピューティングシステム(例えば、アプリケーションサーバ)で、またはフロントエンドコンポーネントが含まれたコンピューティングシステム(例えば、図形ユーザインタフェース、またはネットワークブラウザを備えたユーザコンピュータであり、ユーザが、該図形ユーザインタフェース、または該ネットワークブラウザを通じて本明細書で説明したシステムと技術の実施形態とインタラクションをする)で、またはこの種のバックグランドコンポーネント、ミドルウェアコンポーネント、またはフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施される。任意の形のまたは媒体のデジタルデータ通信(例えば、通信ネットワーク)を通じてシステムのコンポーネントを相互接続させることができる。通信ネットワークは、例示的に、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)及びインターネットを含む。
コンピューティングシステムは、クライアントとサーバとを含んでよい。クライアントとサーバとは一般的に、相互遠く離れており、通信ネットワークを通じてインタラクションをしている。対応するコンピュータで実行されるとともに、相互クライアント―サーバ関係を有するコンピュータプログラムにより、クライアントとサーバとの関係を築き上げる。
本願の実施例において、上記各実施例は、相互参照と参考することができ、同様又は類似したステップおよび用語は、繰り返して説明しない。
上記に示した様々な形のフローを用いて、ステップを改めて並べ替えるか、増加するか、又は削除することができると理解されるべきである。例えば、本願に記載した各ステップは、本願で開示された技術的解決手段によって期待される結果さえ実現されれば、並行して実行されてもよいが、順番に従って実行されてもよく、さらに順番を乱して実行されてもよく、本明細書はここで限定しない。
上記具体的な実施形態は、本願の保護範囲に対する制限を構成しない。当業者であれば、設計要求とその他の要素に基づいた修正、組み合わせ、下位組み合わせと代替が可能であると理解すべきである。本願の主旨と原則の範囲内に行われるすべての修正、等価置換及び改善が、いずれも本願の保護範囲に含まれるべきである。

Claims (13)

  1. 音声機器のインタラクション方法であって、前記方法は音声機器に適用され、前記音声機器が制御機器と通信的に接続され、前記方法は、
    受信したウェイクアップメッセージに応答し、前記ウェイクアップメッセージで指示された第1の対象アプリケーションを開始するステップであって、前記第1の対象アプリケーションは前記音声機器にインストールされているアプリケーションソフトウェア又はアプリケーションプラグインであるステップと、
    受信した前記制御機器によって送信されたユーザの操作データに応答し、前記ユーザの操作データを第1の制御命令に変換するステップであって、前記第1の制御命令は前記音声機器が直接読み取って実行する命令であるステップと、
    前記第1の制御命令に応じ、前記第1の対象アプリケーションが前記第1の制御命令で指示された操作を実行するように制御するステップと、を含み、
    受信したウェイクアップメッセージに応答するステップは、受信した前記制御機器のウェイクアップメッセージに応答することを含み、前記制御機器のウェイクアップメッセージは、ユーザが前記制御機器で第2の対象アプリケーションを開始するときに生成されたものであり、
    前記第2の対象アプリケーションは、前記制御機器にインストールされた、前記第1の対象アプリケーションに対応し、且つ前記音声機器へデータを伝送できるアプリケーションソフトウェア又はアプリケーションプラグインであることを特徴とする音声機器のインタラクション方法。
  2. 前記音声機器には通信コントローラが設置され、受信した前記制御機器によって送信されたユーザの操作データに応答することは、
    前記通信コントローラが受信した、前記制御機器によって送信されたユーザの操作データに応答することを含み、前記制御機器が無線ネットワークで前記ユーザの操作データを送信することを特徴とする請求項に記載の方法。
  3. 前記ユーザの操作データは、
    前記制御機器での前記ユーザによる音声入力、
    前記制御機器のシミュレーションインタフェースでの前記ユーザによるタッチ入力、
    前記制御機器での前記ユーザによるカメラ収集入力、
    前記制御機器での前記ユーザによるセンサ収集入力のうちの任意の1つ又は任意の複数を含むことを特徴とする請求項に記載の方法。
  4. 前記方法はさらに、
    前記制御機器によって送信された第2の制御命令を受信し、前記第2の制御命令に応じ、前記第1の対象アプリケーションが前記第2の制御命令で指示された操作を実行するように制御するステップを含み、前記第2の制御命令は、前記制御機器が検出されたユーザの操作データに応じて生成されたものであることを特徴とする請求項1~請求項のいずれか1項に記載の方法。
  5. 前記音声機器は画面付き音声機器を含み、前記制御機器はモバイル通信端末を含むことを特徴とする請求項1~請求項のいずれか1項に記載の方法。
  6. 音声機器であって、前記音声機器が制御機器と通信的に接続され、前記音声機器は、
    受信したウェイクアップメッセージに応答し、前記ウェイクアップメッセージで指示された第1の対象アプリケーションを開始するための第1の処理ユニットであって、前記第1の対象アプリケーションは前記音声機器にインストールされているアプリケーションソフトウェア又はアプリケーションプラグインである第1の処理ユニットと、
    受信した前記制御機器によって送信されたユーザの操作データに応答し、前記ユーザの操作データを第1の制御命令に変換するための第2の処理ユニットであって、前記第1の制御命令は前記音声機器が直接読み取って実行する命令である第2の処理ユニットと、
    前記第1の制御命令に応じ、前記第1の対象アプリケーションが前記第1の制御命令で指示された操作を実行するように制御するための第3の処理ユニットと、を含み、
    第1の処理ユニットは、
    受信した前記制御機器のウェイクアップメッセージに応答し、前記制御機器のウェイクアップメッセージで指示された第1の対象アプリケーションを開始するための第1の処理サブユニットを含み、
    前記制御機器のウェイクアップメッセージは、ユーザが前記制御機器で第2の対象アプリケーションを開始するときに生成されたものであり、
    前記第2の対象アプリケーションは、前記制御機器にインストールされた、前記第1の対象アプリケーションに対応し、且つ前記音声機器へデータを伝送できるアプリケーションソフトウェア又はアプリケーションプラグインであることを特徴とする音声機器。
  7. 前記音声機器には通信制御ユニットが設置され、前記第1の処理ユニットは、
    前記通信制御ユニットが受信した、前記制御機器によって送信されたユーザの操作データに応答するためのものであり、前記制御機器が無線ネットワークで前記ユーザの操作データを送信することを特徴とする請求項に記載の音声機器。
  8. 前記ユーザの操作データは、
    前記制御機器での前記ユーザによる音声入力、
    前記制御機器のシミュレーションインタフェースでの前記ユーザによるタッチ入力、
    前記制御機器での前記ユーザによるカメラ収集入力、及び
    前記制御機器での前記ユーザによるセンサ収集入力のうちの任意の1つ又は任意の複数を含むことを特徴とする請求項に記載の音声機器。
  9. 前記音声機器はさらに、
    前記制御機器によって送信された第2の制御命令を受信し、前記第2の制御命令に応じ、前記第1の対象アプリケーションが前記第2の制御命令で指示された操作を実行するように制御するための第5の処理ユニットを含み、前記第2の制御命令は、前記制御機器が検出されたユーザの操作データに応じて生成されたものであることを特徴とする請求項~請求項のいずれか1項に記載の音声機器。
  10. 前記音声機器は画面付き音声機器を含み、前記制御機器はモバイル通信端末を含むことを特徴とする請求項~請求項のいずれか1項に記載の音声機器。
  11. 電子機器であって、
    少なくとも1つのプロセッサ、及び
    前記少なくとも1つのプロセッサと通信的に接続されたメモリを含み、
    前記メモリには前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記少なくとも1つのプロセッサが請求項1~請求項のいずれか1項に記載の方法を実行できるようにさせるために、前記命令が前記少なくとも1つのプロセッサによって実行されることを特徴とする電子機器。
  12. コンピュータ命令が記憶された非一時的なコンピュータ可読記憶媒体であって、前記コンピュータ命令がコンピュータに請求項1~請求項のいずれか1項に記載の方法を実行させるためのものであることを特徴とする非一時的なコンピュータ可読記憶媒体。
  13. コンピュータプログラムであって、前記コンピュータプログラムがコンピュータで実行されると、前記コンピュータに請求項1~請求項のいずれか1項に記載の方法を実行させることを特徴とするコンピュータプログラム。
JP2020141881A 2020-01-07 2020-08-25 音声機器及び音声機器のインタラクション方法、機器、記憶媒体 Active JP7167104B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010014939.9 2020-01-07
CN202010014939.9A CN111367488B (zh) 2020-01-07 2020-01-07 语音设备及语音设备的交互方法、设备、存储介质

Publications (2)

Publication Number Publication Date
JP2021082251A JP2021082251A (ja) 2021-05-27
JP7167104B2 true JP7167104B2 (ja) 2022-11-08

Family

ID=71206168

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020141881A Active JP7167104B2 (ja) 2020-01-07 2020-08-25 音声機器及び音声機器のインタラクション方法、機器、記憶媒体

Country Status (3)

Country Link
US (1) US11430441B2 (ja)
JP (1) JP7167104B2 (ja)
CN (1) CN111367488B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114428655B (zh) * 2020-10-29 2023-10-27 荣耀终端有限公司 设备的远程控制方法、终端设备、系统和存储介质
CN114040377B (zh) * 2021-11-15 2024-02-23 青岛海尔科技有限公司 操作任务的执行方法和装置、存储介质及电子装置
CN114157584A (zh) * 2021-12-01 2022-03-08 北京百度网讯科技有限公司 云手机监控方法、装置、电子设备和存储介质
CN114531452B (zh) * 2022-01-27 2024-03-08 中汽创智科技有限公司 一种数据获取方法、装置、设备及存储介质
CN115514622B (zh) * 2022-11-18 2023-04-14 阿里巴巴(中国)有限公司 交互式对象处理方法、网络通信系统、设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013108851A (ja) 2011-11-21 2013-06-06 Alpine Electronics Inc 車載機器システム及びそれに用いられる車載機器
JP2017055936A (ja) 2015-09-16 2017-03-23 カシオ計算機株式会社 通信装置、通信方法及びプログラム
JP2018206441A (ja) 2018-09-25 2018-12-27 任天堂株式会社 情報処理システム、情報処理プログラム、情報処理方法、情報処理端末

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7421390B2 (en) * 2002-09-13 2008-09-02 Sun Microsystems, Inc. Method and system for voice control of software applications
CN101771765A (zh) 2008-12-29 2010-07-07 北大方正集团有限公司 实现交互语音响应的方法、装置和系统
US9842584B1 (en) * 2013-03-14 2017-12-12 Amazon Technologies, Inc. Providing content on multiple devices
WO2016017978A1 (en) * 2014-07-31 2016-02-04 Samsung Electronics Co., Ltd. Device and method for performing functions
US10978068B2 (en) * 2016-10-27 2021-04-13 Samsung Electronics Co., Ltd. Method and apparatus for executing application on basis of voice commands
US10847152B2 (en) * 2017-03-28 2020-11-24 Samsung Electronics Co., Ltd. Method for operating speech recognition service, electronic device and system supporting the same
US10540970B2 (en) * 2017-12-12 2020-01-21 Amazon Technologies, Inc. Architectures and topologies for vehicle-based, voice-controlled devices
CN108337362A (zh) * 2017-12-26 2018-07-27 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备和存储介质
CN108492827B (zh) * 2018-04-02 2019-07-30 百度在线网络技术(北京)有限公司 应用程序的唤醒处理方法、装置及存储介质
CN208369787U (zh) 2018-05-09 2019-01-11 惠州超声音响有限公司 一种与智能音响交互的系统
CN108877770B (zh) * 2018-05-31 2020-01-07 北京百度网讯科技有限公司 用于测试智能语音设备的方法、装置和系统
CN109391528A (zh) * 2018-08-31 2019-02-26 百度在线网络技术(北京)有限公司 语音智能设备的唤醒方法、装置、设备及存储介质
CN109920419B (zh) * 2019-03-05 2021-08-03 百度在线网络技术(北京)有限公司 语音控制方法和装置、电子设备及计算机可读介质
CN112289313A (zh) * 2019-07-01 2021-01-29 华为技术有限公司 一种语音控制方法、电子设备及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013108851A (ja) 2011-11-21 2013-06-06 Alpine Electronics Inc 車載機器システム及びそれに用いられる車載機器
JP2017055936A (ja) 2015-09-16 2017-03-23 カシオ計算機株式会社 通信装置、通信方法及びプログラム
JP2018206441A (ja) 2018-09-25 2018-12-27 任天堂株式会社 情報処理システム、情報処理プログラム、情報処理方法、情報処理端末

Also Published As

Publication number Publication date
JP2021082251A (ja) 2021-05-27
CN111367488B (zh) 2023-08-22
CN111367488A (zh) 2020-07-03
US11430441B2 (en) 2022-08-30
US20210193140A1 (en) 2021-06-24

Similar Documents

Publication Publication Date Title
JP7167104B2 (ja) 音声機器及び音声機器のインタラクション方法、機器、記憶媒体
CN106970790B (zh) 一种应用程序创建的方法、相关设备及系统
JP2021111359A (ja) 音声ウェイクアップ方法及び装置
WO2017028577A1 (zh) 群组聊天内容显示方法及装置
US20210168194A1 (en) App remote control method and related devices
JP2019536554A (ja) オブジェクト表示方法、端末デバイス、及びコンピュータ記憶媒体
JP7403648B2 (ja) 同期方法及び電子機器
WO2018077041A1 (zh) 应用运行的方法及装置
JP2015513815A (ja) デバイス制御方法および装置
KR20220092602A (ko) 애플리케이션 공유 방법, 전자기기 및 컴퓨터 판독가능 저장 매체
WO2017129053A1 (zh) 数据传输方法及装置
RU2632422C2 (ru) Способ и устройство для обработки пользовательского ввода
CN106293738B (zh) 一种表情图像的更新方法及装置
JP2018506118A (ja) ターゲット対象の動き軌道を決定するための方法およびデバイス、ならびに記憶媒体
KR20220154763A (ko) 이미지 처리 방법 및 전자 장비
WO2022156606A1 (zh) 信息处理方法、装置及电子设备
WO2019085533A1 (zh) 用于终端设备的应用处理的方法和终端设备
JP2024500263A (ja) クラウドコード開発システム、方法、装置、デバイス及び記憶媒体
US20180006836A1 (en) Communications control method, communications terminal, and storage medium
CN106330672B (zh) 一种即时通信方法及系统
CN111367444A (zh) 应用功能执行方法、装置、电子设备及存储介质
CN108429805B (zh) 一种文件下载处理方法、发送终端及接收终端
CN112308947A (zh) 一种动画的生成方法、装置及存储介质
WO2018209802A1 (zh) 一种显示设备标识的方法、移动终端及终端设备
WO2017211260A1 (zh) 一种访问数据的方法及相关设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200825

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20210531

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211026

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20211028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221026

R150 Certificate of patent or registration of utility model

Ref document number: 7167104

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150