JP7135063B2 - スマート音声機器の制御方法、装置、電子機器及び記憶媒体 - Google Patents

スマート音声機器の制御方法、装置、電子機器及び記憶媒体 Download PDF

Info

Publication number
JP7135063B2
JP7135063B2 JP2020214423A JP2020214423A JP7135063B2 JP 7135063 B2 JP7135063 B2 JP 7135063B2 JP 2020214423 A JP2020214423 A JP 2020214423A JP 2020214423 A JP2020214423 A JP 2020214423A JP 7135063 B2 JP7135063 B2 JP 7135063B2
Authority
JP
Japan
Prior art keywords
push information
smart
smart voice
file
voice device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020214423A
Other languages
English (en)
Other versions
JP2021174518A (ja
Inventor
ウェンユー ワン,
リャンチェン ウー,
レイ ツォン,
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
Publication of JP2021174518A publication Critical patent/JP2021174518A/ja
Application granted granted Critical
Publication of JP7135063B2 publication Critical patent/JP7135063B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • G06F3/147Digital output to display device ; Cooperation and interconnection of the display device with other functional units using display panels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0876Network architectures or network communication protocols for network security for authentication of entities based on the identity of the terminal or configuration, e.g. MAC address, hardware or software configuration or device fingerprint
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Power Engineering (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Automation & Control Theory (AREA)
  • Medical Informatics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本願は、コンピュータ技術の分野に関し、具体的には、音声技術の分野に関し、特にスマート音声機器の制御方法、装置、電子機器及び記憶媒体に関する。
現在、人工知能の急速な発展と人々の生活レベルの継続的な向上に伴い、スマート音声機器は家庭の必需品になっている。ユーザは、スマート音声機器と音声で対話したり、スマート音声機器で音楽やニュースなどを再生したりすることができる。
しかし、現在、音声対話はユーザの質問への回答などの方法に限られているため、ユーザのより高いニーズを満足させるためには、より豊富な音声対話方法を必要とする。
本願は、関連技術におけるスマート音声機器の音声対話方法が単一であるという問題を解決するために、スマート音声機器の制御方法、装置、電子機器及び記憶媒体を提供する。
第1態様によって提供されるスマート音声機器の制御方法は、目標ファイル識別子が含まれている再生命令を取得するステップと、前記目標ファイル識別子に対応する目標ファイルのファイル権限を決定するステップと、前記ファイル権限が前記スマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、前記スマート音声機器を制御して所定のプッシュ情報を再生するステップと、所定の期間内に前記プッシュ情報に関連付けられた音声データを取得した場合、前記目標ファイルを再生するステップと、を含む。
本願の実施例のスマート音声機器の制御方法は、まず、目標ファイル識別子が含まれている再生命令を取得し、続いて目標ファイル識別子に対応する目標ファイルのファイル権限を決定し、ファイル権限がスマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、スマート音声機器を制御して所定のプッシュ情報を再生し、所定の期間内にプッシュ情報に関連付けられた音声データを取得した場合、目標ファイルを再生する。これにより、ユーザが権限範囲外のファイルを使用することを利用して、ユーザに情報をプッシュすることを実現し、音声対話方法を充実させただけでなく、プッシュ情報に対するユーザの認知を深め、情報のプッシュ効果を向上させる。
第2態様によって提供されるスマート音声機器の制御装置は、目標ファイル識別子が含まれている再生命令を取得するための第1の取得モジュールと、前記目標ファイル識別子に対応する目標ファイルのファイル権限を決定するための第1の決定モジュールと、前記ファイル権限が前記スマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、前記スマート音声機器を制御して所定のプッシュ情報を再生するための制御モジュールと、所定の期間内に前記プッシュ情報に関連付けられた音声データを取得した場合、前記目標ファイルを再生するための再生モジュールと、を備える。
本願の実施例のスマート音声機器の制御装置は、目標ファイル識別子が含まれている再生命令を取得して、目標ファイル識別子に対応する目標ファイルのファイル権限を決定し、ファイル権限がスマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、スマート音声機器を制御して所定のプッシュ情報を再生し、所定の期間内にプッシュ情報に関連付けられた音声データを取得した場合、目標ファイルを再生する。これにより、ユーザが権限範囲外のファイルを使用することを利用して、ユーザに情報をプッシュすることを実現し、音声対話方法を充実させただけでなく、プッシュ情報に対するユーザの認知を深め、情報のプッシュ効果を向上させる。
第3態様によって提供される電子機器は、少なくとも1つのプロセッサと、該少なくとも1つのプロセッサに通信可能に接続されるメモリと、を備え、前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令が前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが上記の第1態様の実施例に記載のスマート音声機器の制御方法を実行する。
第4態様では、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、コンピュータプログラムが記憶され、前記コンピュータ命令は、コンピュータに上記の第1態様の実施例に記載のスマート音声機器の制御方法を実行させる。
第5態様では、コンピュータプログラムを提供し、前記コンピュータプログラムが、コンピュータに上記の第1態様の実施例に記載のスマート音声機器の制御方法を実行させる。
本願の実施例では、再生ファイルのファイル権限がユーザ権限とマッチングしない場合、スマート音声機器を制御して所定のプッシュ情報を再生することにより、ユーザが権限範囲外のファイルを使用することを利用して、ユーザに情報をプッシュすることを実現し、音声対話方法を充実させただけでなく、プッシュ情報に対するユーザの認知を深め、情報のプッシュ効果を向上させることにより、関連技術における、スマート音声機器の音声対話方法が単一であるという問題を解決した。
以下、具体的な実施例を参照しながら、上記の選択可能な方法が有している他の効果について説明する。
添付図面は、本技術案をより良く理解するためのものであり、本願を限定するものではない。
本願の実施例によって提供されるスマート音声機器の制御方法の概略フローチャートである。 本願の実施例によって提供される別のスマート音声機器の制御方法の概略フローチャートである。 本願の実施例によって提供される別のスマート音声機器の制御方法の概略フローチャートである。 本願の実施例によって提供される表示部材の表示の概略図である。 本願の実施例によって提供されるスマート音声機器の制御装置の概略構造図である。 本願の実施例によって提供される別のスマート音声機器の制御装置の概略構造図である。 本願の実施例によるスマート音声機器の制御方法の電子機器のブロック図である。
以下、添付図面を参照しながら、本願の例示的な実施例について説明し、ここで、理解を容易にするために、本願の実施例の様々な詳細が含まれているが、それらをただの例示的なものと見なすべきである。従って、当業者は、本願の範囲及び精神から逸脱せず、本明細書に説明した実施例に対して様々な変更及び修正を行うことができることを理解すべきである。同様に、明確かつ簡潔にするために、以下の説明では公知の機能及び構造に対する説明を省略した。
以下、添付図面を参照しながら、本願の実施例のスマート音声機器の制御方法、装置、電子機器及び記憶媒体について説明する。
本願の実施例は、関連技術におけるスマート音声機器の音声対話方法が単一であるという問題に対して、スマート音声機器の制御方法を提供した。
本願の実施例のスマート音声機器の制御方法は、ユーザが権限範囲外のファイルを使用することを利用して、ユーザに情報をプッシュすることを実現し、音声対話方法を充実させただけでなく、プッシュ情報に対するユーザの認識を深め、情報のプッシュ効果を向上させる。
図1は、本願の実施例によって提供されるスマート音声機器の制御方法の概略フローチャートである。
本願の実施例のスマート音声機器の制御方法は、スマート音声機器、例えばスマートスピーカー、パソコンなどの音声対話が可能な電子機器に適用され、ユーザが権限範囲外のファイルを使用することで、ユーザに情報をプッシュすることを実現する。
図1に示すように、当該スマート音声機器の制御方法は、以下のステップ101~ステップ104を含む。
ステップ101において、再生命令を取得し、再生命令には目標ファイル識別子が含まれている。
実際の応用において、ユーザは、スマート音声機器、例えばスマートスピーカーなどと音声対話を行うことができ、ユーザは音声でスマート音声機器を制御してファイルを再生することができ、例えば音声で歌を選択すること、音声で物語を選択することなどができる。
スマート音声機器が起動された後、ユーザは、音声で再生命令を入力することができ、例えば、音声で「歌Aを再生する」と入力し、このときにスマート音声機器はユーザによって入力された音声を収集し、それにより再生命令を取得する。ここで、再生命令には目標ファイル識別子が含まれており、ここの目標ファイル識別子は、目標ファイルの名称、目標ファイルのタイプなどであり得る。
例えば、ユーザが音声で「歌Aを再生する」と入力する場合、目標ファイル識別子はAであり、ユーザが音声で「童謡を再生する」という音声を入力する場合、目標ファイル識別子は「童謡」タイプの歌であり、ユーザが音声で「aの歌を再生する」と入力する場合、ここの歌手の名前であるaが目標ファイル識別子である。
または、再生命令は、スマート音声機器が自動的にトリガして取得したものであり、具体的には、前のファイルの再生が完了すると、あるファイルの再生が自動的にトリガされ、このときに再生命令を取得し、再生命令には当該ファイルのファイル識別子が含まれている。例えば、あるオーディオブック型小説の再生リストは、1つのチャプターの再生が完了するたびに、次のチャプターを自動的に再生するとき、次のチャプターの再生命令を取得することができる。
ステップ102において、目標ファイル識別子に対応する目標ファイルのファイル権限を決定する。
本実施例において、スマート音声機器によって再生されるファイルのファイル識別子とファイル権限との間の対応関係を予め設定して、ファイル権限データベースを取得することができる。ここで、ファイル権限は無料ファイル、VIPファイル、スーパーVIPファイルなどを含むか、又は、ファイル権限は無料ファイル、会員ファイルなどを含むか、又は、ファイル権限は一般ファイル、有料ファイルなどを含み、具体的なファイル権限は、必要に応じて分けることができ、本実施例ではこれに対して限定しない。
再生命令を取得した後、目標ファイル識別子に基づいて、ファイル権限データベースを照会することにより、目標ファイル識別子に対応する目標ファイルのファイル権限を決定する。
例えば、ユーザが音声で「歌手aの歌を再生する」と入力し、確認の結果、歌手aの歌の権限は無料再生である。
ステップ103において、ファイル権限が、スマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、スマート音声機器を制御して所定のプッシュ情報を再生する。
異なるユーザは、スマート音声機器に対して、使用時に異なる権限を有する。本実施例において、スマート音声機器を所有しているユーザの現在のユーザ権限は、ユーザのレベルで表すことができ、ユーザのレベルが高いほど、ユーザの権限も高い。例えば、ユーザレベルは、一般ユーザ、VIPユーザ、スーパーVIPユーザなどを含む。そうすると、ユーザの権限によって、享受する権利も異なる。
ユーザ権限は、ユーザとスマート音声機器との間の対話によって変化する可能性があるため、再生命令を取得するたびに、ユーザの現在のユーザ権限を取得する。
本実施例において、異なるユーザ権限で使用できるファイルのファイル権限を予め決定することができる。目標ファイルのファイル権限を決定した後、目標ファイルのファイル権限が、スマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしているか否かを判断し、具体的には、現在のユーザ権限で当該ファイル権限のファイルを使用できるか否かを判断することができる。
ファイル権限が、スマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしないことは、スマート音声機器を所有しているユーザが目標ファイルを使用できないことを説明し、即ち、スマート音声機器が目標ファイルを直接再生することができず、このとき、スマート音声機器を制御して所定のプッシュ情報を再生する。
ここで、プッシュ情報には、質問応答の文を含めることができ、広告主が掲載した広告であってもよく、他の内容であってもよく、必要に応じて予め設定することができる。
例えば、ユーザがスマートスピーカーに向かって音声で「歌Bを再生する」と入力すると、当該歌Bのファイル権限は会員歌であり、当該ユーザの現在のユーザ権限は一般ユーザであり、一般ユーザは歌Bを楽しむことができず、スマート音声機器は所定のプッシュ情報である「この歌は会員音楽であり、会員のみ楽しめます。今なら、特典があり、回答するだけで、特典を上げます。質問応答の対話を終わらせると、1日の会員権限を上げますよ。消費者権利保護日はいつですか?1つ目は3月15日であり、2つ目は4月15日であります」を再生する。
ステップ104において、所定の期間内にプッシュ情報に関連付けられた音声データを取得した場合、目標ファイルを再生する。
具体的には、スマート音声機器はプッシュ情報の再生を済んだ後に音声データを収集し、所定の期間内に音声データを収集した場合、音声データを認識し、音声データの内容とプッシュ情報との関連度を計算して、音声データがプッシュ情報に関連付けられているか否かを決定する。ここで、プッシュ情報に関連付けられた音声データは、例えば、プッシュ情報が質問文であり、音声データが回答に関連する文であり得る。
収集された音声データとプッシュ情報との関連度が所定の閾値より大きい場合、音声データがプッシュ情報と関連付けられていると考えられ、目標ファイルを再生する。収集された音声データがプッシュ情報に関連付けられていないか、又は関連がない場合、スマート音声機器は目標ファイルを再生しない。
つまり、スマート音声機器がプッシュ情報の再生を済んだ後、ユーザが所定の期間内に、音声でプッシュ情報に関連付けられた音声データを入力すると、スマート音声機器が目標ファイルを再生することにより、ユーザとスマート機器との対話を充実させただけでなく、ユーザに権限外のファイルを使用させ、ユーザ体験を向上させる。
例を挙げて説明すると、プッシュ情報が「今年の4月に歌手aはどの都市でコンサートを開きますか?1つ目はM市であり、2つ目はN市である」である場合、ユーザが30秒などの所定の期間内に正解を言えば、目標ファイルを再生する。
実際の応用において、所定の期間内にプッシュ情報に関連付けられた音声データを取得すると、ユーザ権限を高めることを予め規定する場合、対応する対話を完了した後、ユーザ権限を更新する必要がある。
例えば、プッシュ情報が「この歌は会員音楽であり、会員のみ楽しめます。今なら、特典があり、回答するだけで、特典を上げます。質問応答の対話を終わらせると、1日の会員権限を上げますよ。消費者権利保護日はいつですか?1つ目は3月15日であり、2つ目は4月15日であります」である場合、ユーザが20秒内に当該質問を完了すると、ユーザはその後の24時間以内では会員ユーザであるので、ユーザの権限は一般ユーザから会員ユーザに更新され、期間は対話を完了してから24時間である。
本願の実施例において、再生命令内のファイル権限と、スマート音声機器を所有しているユーザの現在のユーザ権限とをマッチングさせて、両者がマッチングしない場合、スマート音声機器を制御して所定のプッシュ情報を再生する。これにより、ユーザが権限範囲外のファイルを使用することを利用して、ユーザに情報をプッシュすることを実現することにより、音声対話方法を充実させただけでなく、プッシュ情報に対するユーザの認識を深め、情報のプッシュ効果を向上させる。
ユーザとスマート音声機器との対話効果を向上させるために、本願の一実施例において、スマート音声機器がプッシュ情報のいずれの回答の選択肢を取得した場合、目標ファイルを再生する。以下、図2を参照しながら説明し、図2は、本願の実施例によって提供される別のスマート音声機器の制御方法の概略フローチャートである。
図2に示すように、所定の期間内にプッシュ情報に関連付けられた音声データを取得するステップは、ステップ201~ステップ203を含む。
ステップ201において、所定のプッシュ情報に対応する候補回答文を解析して、目標文字セットを決定する。
本実施例において、各所定のプッシュ情報には、対応する候補回答文があり、ここでの候補回答文とは、プッシュ情報内の質問に対応する全ての回答選択肢であり得る。
具体的には、プッシュ情報には、質問及び候補回答文が含まれているため、候補回答文を解析して、目標文字セットを取得し、目標文字セットは各回答選択肢及び対応する回答を含み得る。
例えば、プッシュ情報が「消費者権利保護日はいつですか?1つ目は3月15日であり、2つ目は4月15日であります」である場合、「1つ目は3月15日であります」及び「2つ目は4月15日であります」はプッシュ情報に対応する候補回答文であり、当該候補回答文を解析して、目標文字セットである{1つ目:3月15日;2つ目:4月15日}を取得し、当該文字セットには2つの文字が含まれている。
ステップ202において、取得された音声データに対して音声認識を行う。
本実施例において、スマート音声機器が所定のプッシュ情報の再生を済んだ後、音声を収集し、所定の期間内に音声データを収集した場合、音声データに含まれている内容を決定するために、取得された音声データに対して音声認識を行う。
ステップ203において、所定の期間内に取得された音声データに目標文字セット内のいずれかの目標文字が含まれている場合、プッシュ情報に関連付けられた音声データを取得したと決定する。
取得された音声データに対する音声認識が完了した後、音声データの認識結果を目標文字セットとマッチングさせて、音声データに含まれている文字が目標文字セットの文字である場合、即ち音声データに目標文字セット内のいずれかの目標文字が含まれている場合、プッシュ情報に関連付けられた音声データを取得したとみなすことができる。
例えば、プッシュ情報が「今年の4月に歌手aはどの都市でコンサートを開きますか?1つ目はM市であり、2つ目はN市であります」であり、ユーザが30秒内などの所定の期間内に音声で「1つ目」、「2つ目」、「M市」、「N市」などのいずれか1つを入力する場合、当該プッシュ情報に関連付けられた音声データを取得したと決定することができる。明らかに、内容が「M市」の音声データ、又は「N市」の音声データ、又は「1つ目」の音声データ、又は「2つ目」の音声データなどは、いずれも当該プッシュ情報に関連付けられた音声データである。つまり、ユーザがそのうちのいずれかの回答選択肢を言い出すと、目標ファイルを再生する。
本実施例において、所定の期間内に取得された音声データに候補回答文に対応する目標文字セット内のいずれかの目標文字が含まれている場合、目標ファイルを再生する。
本願の実施例において、所定の期間内にプッシュ情報に関連付けられた音声データを取得した場合、所定のプッシュ情報に対応する候補回答文を解析することにより、目標文字セットを決定し、取得された音声データに対して音声認識を行い、所定の期間内に取得された音声データに目標文字セット内のいずれかの目標文字が含まれている場合、プッシュ情報に関連付けられた音声データを取得したと決定する。これにより、ユーザがプッシュ情報内のいずれかの回答を音声で回答した場合、目標ファイルを再生し、ユーザとスマート音声機器との対話効果、及びユーザがスマート音声機器を使用する積極性を向上させる。
実際の応用において、スマート音声機器がプッシュしようとするプッシュ情報が多く、再生しようとするファイルに関連するプッシュ情報に対するユーザの認知を深めるために、本願の一実施例において、上記のスマート音声機器を制御して所定のプッシュ情報をプッシュする前に、目標ファイルが属するファイルタイプに基づいて、所定のプッシュ情報を決定することができる。
例えば、ユーザが音声で「歌Cを再生する」と入力する場合、歌Cのタイプは民謡に属すると、所定のプッシュ情報は民謡に関連するものである。
本実施例において、目標ファイルが属するファイルタイプに基づいて、所定のプッシュ情報を決定した後、ファイル権限が、スマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、スマート音声機器を制御して目標ファイルが属するファイルタイプに基づいて決定された所定のプッシュ情報を再生する。
本願の実施例において、スマート音声機器を制御して所定のプッシュ情報を再生する前に、目標ファイルが属するファイルタイプに基づいて、所定のプッシュ情報を決定し、これにより、スマート音声機器を制御して目標ファイルが属するファイルタイプに関連するプッシュ情報を再生するため、目標ファイルに関連するプッシュ情報に対するユーザの認知を深め、プッシュ効果を向上させる。
プッシュ情報のプッシュ効果を向上させるために、本願の一実施例において、スマート音声機器を制御して所定のプッシュ情報を再生する前に、目標ファイルのファイル権限に基づいて、所定のプッシュ情報を決定することもできる。
具体的には、ファイル権限とプッシュ情報との間の対応関係を予め確立することができ、例えばファイル権限が高いほど、対応するプッシュ情報の難易度が高い。ここでの難易度とは、プッシュ情報に含まれている質問の難易度を言う。
例えば、ユーザが再生を要求した音楽が初級会員音楽である場合、プッシュ情報の難易度が低く、ユーザが再生を要求したものが中級会員音楽である場合、プッシュ情報の難易度が高くなる。
本実施例において、目標ファイルのファイル権限に基づいて、所定のプッシュ情報を決定した後、ファイル権限がスマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、スマート音声機器を制御して目標ファイルの権限に基づいて決定された所定のプッシュ情報を再生する。
本願の実施例において、スマート音声機器を制御して所定のプッシュ情報を再生する前に、目標ファイルのファイル権限に基づいて、所定のプッシュ情報を決定し、これにより、スマート音声機器を制御して目標ファイル権限に基づいて決定されたプッシュ情報を再生するため、対話効果及びプッシュ情報のプッシュ効果を向上させることができる。
プッシュ情報のプッシュ効果を向上させるために、本願の一実施例において、スマート音声機器を制御して所定のプッシュ情報を再生する前に、再生命令を取得した時間に基づいて、所定のプッシュ情報を決定することができる。
実際の応用において、通常、ユーザがスマート音声機器を使用する時間が異なり、ユーザが処理する事件も異なるため、関連するプッシュ情報をプッシュすることができる。具体的には、再生命令を取得した場合、再生命令を取得した時間を記録し、再生命令内の目標ファイルのファイル権限が、スマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、例えば朝、午前、午後などの、再生命令を取得した時間が属する期間を決定し、再生命令を取得した時間が属する期間に基づいて、所定のプッシュ情報を決定し、次に、スマート音声機器を制御して当該所定のプッシュ情報を再生する。
例えば、ユーザは、朝で洗顔しながら、スマート音声機器を使用する可能性があり、洗顔用品に関連する情報をプッシュしてもよい。また、例えば、夜にユーザがスマート音声機器を使用する場合、睡眠品質の向上に役立つ製品に関する情報をプッシュしてもよい。
本実施例において、再生命令を取得した時間に基づいて、所定のプッシュ情報を決定した後、ファイル権限が、スマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、スマート音声機器を制御して再生命令の時間に基づいて決定された所定のプッシュ情報を再生する。
本願の実施例において、スマート音声機器を制御して所定のプッシュ情報を再生する前に、再生命令の時間に基づいて、所定のプッシュ情報を決定するので、スマート音声機器を使用する期間に基づいて、対応する情報をプッシュし、プッシュ情報のプッシュ効果を向上させることができる。
さらに、プッシュ情報に対するユーザの認知を深めるために、本願の一実施例において、上記の所定の期間内にプッシュ情報に関連付けられた音声データを取得したステップの後に、プッシュ情報に対応する目標回答文を再生することができる。
ここで、プッシュ情報に対応する目標回答文とは、プッシュ情報に含まれている質問の正解として理解されてもよい。
本実施例において、再生命令内の目標ファイルのファイル権限が、スマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、スマート音声機器を制御して所定のプッシュ情報を再生し、所定の期間内にプッシュ情報に関連付けられた音声データを取得した後、プッシュ情報に対応する目標回答文を再生し、その後目標ファイルを再生する。
例えば、プッシュ情報が「今年の4月に歌手aはどの都市でコンサートを開きますか?1つ目はM市であり、2つ目はN市であります」であり、ユーザが音声で回答する場合、ユーザが回答した後、ユーザの回答が正解であるか否かを判断し、正解の場合、例えば「おめでとうございます。確かにM市でございます」などのユーザの回答が正解であるとの内容を再生し、間違っている場合、「実はM市ですよ」を再生する。
本願の実施例において、所定の期間内にプッシュ情報に関連付けられた音声データを取得した後、プッシュ情報に対応する目標回答文を再生するので、プッシュ情報に対するユーザの認知をさらに深め、情報のプッシュ効果を向上させる。
ユーザとスマート音声機器との間の対話効果を向上させるために、本願の一実施例において、スマート音声機器は、例えば表示画面のような表示部材を含んでもよく、プッシュ情報を再生する際に、表示部材にプッシュ情報を表示することもできる。以下に、図3を参照しながら説明し、図3は、本願の実施例によって提供される別のスマート音声機器の制御方法の概略フローチャートである。
図3に示すように、当該スマート音声機器の制御方法は、ステップ301~ステップ303を含む。
ステップ301において、再生命令を取得し、再生命令には目標ファイル識別子が含まれている。
ステップ302において、目標ファイル識別子に対応する目標ファイルのファイル権限を決定する。
本実施例において、ステップ301~ステップ302は上記のステップ101~102と類似するため、ここでは詳細な説明を省略する。
ステップ303において、ファイル権限がスマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、スマート音声機器を制御して所定のプッシュ情報を再生し、表示部材にプッシュ情報を表示する。
本実施例において、スマート音声機器は、表示画面などの表示部材を有し、目標ファイルのファイル権限が、スマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしないと決定された後、スマート音声機器を制御して所定のプッシュ情報を再生するだけでなく、表示部材にプッシュ情報を表示することもでき、ユーザがプッシュ情報を見やすくなる。
また、表示部材は、例えば目標ファイルの名前、対話時間、如何に音声で質問に回答するかなどのような提示情報も表示できる。
図4を例として説明すると、図4は、本願の実施例によって提供される表示部材の表示の概略図である。図4において、表示部材410に、「今年の4月に歌手aはどの都市でコンサートを開きますか?1、M市、2、N市」というプッシュ情報を表示する。同時に、表示部材410の左上隅に、スマート音声機器が間もなく再生する歌Dが表示され、ユーザが音声で「1つ目」又は「2つ目」を入力して質問に回答することができることを表示部材410の左下に提示し、表示部材410の右上隅に、ユーザに30秒内に質問を回答するように提示するための「30sスキップ」が表示され、回答しない場合、当該対話の質問回答をスキップする。
なお、図4は1つの例示にすぎず、本願を限定するものと見なしてはいけなく、具体的な需要に応じて表示部材に表示される内容及び表示位置を制御する。
ステップ304において、所定の期間内にプッシュ情報に関連付けられた音声データを取得した場合、目標ファイルを再生する。
本実施例において、ステップ304は上記のステップ104と類似するため、ここでは詳細な説明を省略する。
さらに、プッシュ情報の効果を向上させるために、スマート音声機器は目標ファイルを再生すると同時に、表示部材にプッシュ情報に対応する目標情報を表示することができる。例えば、スマートスピーカーによって再生されるプッシュ情報が、ある歯磨きのブランドに関するものである場合、スマートスピーカーが目標ファイルを再生する際に、スマートスピーカーの表示画面に当該ブランドの歯磨きの広告情報を表示することができるので、プッシュ情報のプッシュ効果を向上させる。
本願の実施例において、スマート音声機器は表示部材を含み、ファイル権限がスマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、表示部材にプッシュ情報を表示する。これにより、スマート音声機器は、プッシュ情報を再生すると同時に、表示部材にプッシュ情報を表示することもできるので、ユーザがプッシュ情報を正確に知ることができ、ユーザがプッシュ情報をはっきり聞けなかったり、覚えなかったりすることで、対話チャンスを逃すことを回避して、ユーザとスマート音声機器との間の対話効果を向上させる。
上記の実施例を実現するために、本願の実施例は、スマート音声機器の制御装置をさらに提供する。図5は、本願の実施例によって提供されるスマート音声機器の制御装置の概略構造図である。
図5に示すように、当該スマート音声機器の制御装置500は、第1の取得モジュール510、第1の決定モジュール520、制御モジュール530及び再生モジュール540を備える。
第1の取得モジュール510は、目標ファイル識別子が含めれている再生命令を取得する。
第1の決定モジュール520は、目標ファイル識別子に対応する目標ファイルのファイル権限を決定する。
制御モジュール530は、ファイル権限がスマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、スマート音声機器を制御して所定のプッシュ情報を再生する。
再生モジュール540は、所定の期間内にプッシュ情報に関連付けられた音声データを取得した場合、目標ファイルを再生する。
図6は、本願の実施例によって提供される別のスマート音声機器の制御装置の概略構造図である。本願の実施例の可能な一実施形態において、図6に示すように、当該装置は、第2の取得モジュール550をさらに備え、当該第2の取得モジュール550は、所定のプッシュ情報に対応する候補回答文を解析して、目標文字セットを決定するための第1の決定ユニット551と、取得された音声データに対して音声認識を行うための認識ユニット552と、所定の期間内に取得された音声データに目標文字セット内のいずれかの目標文字が含まれている場合、プッシュ情報に関連付けられた音声データを取得したと決定するための第2の決定ユニット553と、を備える。
本願の実施例の可能な一実施形態において、当該装置は、さらに、目標ファイルが属するファイルタイプに基づいて、所定のプッシュ情報を決定するための第2の決定モジュールを備える。
本願の実施例の可能な一実施形態において、当該装置は、さらに、目標ファイルのファイル権限に基づいて、所定のプッシュ情報を決定するための第3の決定モジュールを備える。
本願の実施例の可能な一実施形態において、当該装置は、さらに、再生命令を取得した時間に基づいて、所定のプッシュ情報を決定するための第4の決定モジュールを備える。
本願の実施例の可能な一実施形態において、上記の再生モジュール540は、さらに、プッシュ情報に対応する目標回答文を再生する。
本願の実施例の可能な一実施形態において、上記のスマート音声機器は表示部材を備え、当該装置は、さらに、ファイル権限がスマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、表示部材にプッシュ情報を表示するための表示モジュールを備えてもよい。
なお、前述のスマート音声機器の制御方法の実施例に対する解釈と説明は、本実施例のスマート音声機器の制御装置にも適用できるため、ここでは詳細な説明を省略する。
本願の実施例のスマート音声機器の制御装置は、目標ファイル識別子が含まれている再生命令を取得して、目標ファイル識別子に対応する目標ファイルのファイル権限を決定し、ファイル権限がスマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、スマート音声機器を制御して所定のプッシュ情報を再生し、所定の期間内にプッシュ情報に関連付けられた音声データを取得した場合、目標ファイルを再生する。これにより、ユーザが権限範囲外のファイルを使用することを利用して、ユーザに情報をプッシュすることを実現し、音声対話方法を充実させただけでなく、プッシュ情報に対するユーザの認知を深め、情報のプッシュ効果を向上させる。
本願の実施例によれば、本願は、電子機器及び読み取り可能な記憶媒体をさらに提供する。
本願の実施例によれば、本願は、コンピュータプログラムを提供し、コンピュータプログラムは、コンピュータに本願によって提供されるスマート音声機器の制御方法を実行させる。
図7に示すように、本願の実施例のスマート音声機器の制御方法による電子機器のブロック図である。電子機器は、例えばラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを意図している。電子機器は、さらに、例えばパーソナルデジタルプロセッサ、携帯電話、スマートフォン、ウエアラブル装置及び他の類似する計算装置などの様々な形式のモバイルデバイスを表し得る。本明細書に示す部材、それらの接続及び関係、並びにそれらの機能は、単なる例示であり、本明細書に説明及び/又は主張する本願の実施を制限することを意図していない。
図7に示すように、当該電子機器は、1つ又は複数のプロセッサ601と、メモリ602と、高速インターフェース及び低速インターフェースを備える、各部材を接続するインターフェースとを備える。各部材は、異なるバスを利用して互いに接続し、共通のマザーボードに取り付けられてもよく、必要に応じて他の方法で取り付けられてもよい。ブロセッサは、メモリ内又はメモリ上に記憶されて外部入力出力装置(例えば、インターフェースに結合された表示装置)にGUIのグラフィック情報を示すための命令を含む、電子機器内で実行可能な命令を処理することができる。他の実施形態において、必要があれば、複数のブロセッサ及び/又は複数本のバスと複数のメモリとを一緒に使用してもよい。同様に、複数の電子機器を接続してもよく、各装置は一部の必要な操作(例えば、サーバアレイ、1グループのブレードサーバ、又はマルチプロセッサシステムとする)を提供する。図7では、1つのプロセッサ601を例に挙げている。
メモリ602は、本願によって提供される非一時的なコンピュータ読み取り可能な記憶媒体である。ここで、前記メモリには、本願によって提供されるスマート音声機器の制御方法を前記少なくとも1つのプロセッサに実行させるための、少なくとも1つのプロセッサによって実行可能な命令が記憶されている。本願の非一時的なコンピュータ読み取り可能な記憶媒体には、本願によって提供されるスマート音声機器の制御方法をコンピュータに実行させるためのコンピュータ命令が記憶されている。
メモリ602は、非一時的なコンピュータ読み取り可能な記憶媒体として、例えば本願の実施例のスマート音声機器の制御方法に対応するプログラム命令/モジュール(例えば、図5に示す第1の取得モジュール510、第1の決定モジュール520、制御モジュール530及び再生モジュール540)などの、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶することが可能である。プロセッサ601は、メモリ602に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理を実行し、即ち、上記方法の実施例のスマート音声機器の制御方法を実施する。
メモリ602は、オペレーティングシステム及び少なくとも1つの機能に必要なアプリケーションプログラムを記憶することが可能なストレージプログラムエリアと、スマート音声機器の制御方法の電子機器の使用に応じて作成されたデータなどを記憶することが可能なストレージデータエリアとを含んでもよい。また、メモリ602は、高速ランダムアクセスメモリを備えてもよく、非一時的なメモリを備えてもよく、例えば少なくとも1つの磁気ディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートメモリデバイスがある。一部の実施例において、メモリ602は、プロセッサ601に対して遠隔に設置されたメモリを選択的に備えることができ、これらの遠隔メモリはネットワークを介してスマート音声機器の制御方法の電子機器に接続できる。上記ネットワークは、実例としてインターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせを含むが、これらに限定されない。
スマート音声機器の制御方法の電子機器は、入力装置603及び出力装置604をさらに備える。プロセッサ601、メモリ602、入力装置603及び出力装置604は、バス又は他の方法を介して接続してもよく、図7では、バスによる接続を例に挙げている。
入力装置603は、入力された数字や文字情報を受信し、スマート音声機器の制御方法の電子機器のユーザ設定及び機能制御に関するキー信号の入力を発生することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパネル、ポインティングスティック、1つ又は複数のマウスボタン、トラックボール、ジョイスティック等の入力装置がある。出力装置604は、表示装置、補助照明装置(例えば、LED)及び触覚フィードバック装置(例えば、振動モータ)などを含み得る。当該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ及びプラズマディスプレイを含み得るが、これらに限定されない。一部の実施形態において、表示装置はタッチスクリーンであってもよい。
本明細書で説明するシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせによって実現されることができる。これらの様々な実施形態は次のような方法を含み得る。少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムで実行及び/又は解釈され得る1つ又は複数のコンピュータプログラムで実施され、当該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信するとともに、データ及び命令を当該記憶システム、当該少なくとも1つの入力装置、及び当該少なくとも1つの出力装置に伝送することができる。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、ハイレベルプロセス及び/又はオブジェクト指向のプログラミング言語、及び/又はアセンブリ/機械語を利用してこれらのコンピューティングプログラムを実施してもよい。本明細書に使用されているような、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」の用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための如何なるコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号としての機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」の用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための如何なる信号を指す。
ユーザとの対話を提供するために、コンピュータ上で本明細書に説明したシステム及び技術を実施でき、当該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウスやトラックボールなど)とを有し、ユーザは当該キーボード及び当該ポインティングデバイスを介して入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインターアクションを提供するために用いることができ、例えば、ユーザに提供されるフィードバックは、如何なる形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、如何なる形式(音響入力、音声入力又は触覚入力を含む)でユーザからの入力を受信してもよい。
ここで説明されるシステム及び技術は、バックエンドユニットを含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェアユニットを含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンドユニットを含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータであり、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施方式とインタラクションする)、又はこのようなバックエンドユニットと、ミドルウェアユニットと、フロントエンドユニットの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットとを含む。
コンピュータシステムは、クライアント及びサーバを備え得る。クライアント及びサーバは、一般に、互いに離れていて、通常通信ネットワークを介してインタラクションする。クライアントとサーバとの関係は、対応するコンピュータ上で実行されるとともに互いにクライアント―サーバ関係を有するコンピュータプログラムによって生成される。
本願の実施例の技術的解決手段によれば、ユーザが権限範囲外のファイルを使用することを利用して、ユーザに情報をプッシュすることを実現し、音声対話方法を充実させただけでなく、プッシュ情報に対するユーザの認知を深め、情報のプッシュ効果を向上させる。
本明細書において、「第1」、「第2」の用語は、目的の説明のためにしか使用されず、相対的な重要性を明示または示唆するか、または、示された技術的特徴の数を暗示するものとして理解されるべきではない。したがって、「第1」及び「第2」によって限定される特徴は、少なくとも1つの当該特徴を明示または暗黙的に含む。本願の説明において、「複数」は、特に明確に限定しない限り、少なくとも2つ、例えば2つ、3つであることを意味する。
以上、本願の実施例を示し、説明したが、上記の実施例は例示的なものにすぎず、本願を限定するものとして理解してはいけなく、当業者であれば、本願の範囲内で上記の実施例に対して変更、修正、置換、及び変形を行えることが理解できる。

Claims (17)

  1. 目標ファイル識別子が含まれている再生命令を取得するステップと、
    前記目標ファイル識別子に対応する目標ファイルのファイル権限を決定するステップと、
    前記ファイル権限がスマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、前記スマート音声機器を制御して所定のプッシュ情報を再生するステップと、
    所定の期間内に前記プッシュ情報に関連付けられた音声データを取得した場合、前記目標ファイルを再生するステップと、
    を含むスマート音声機器の制御方法。
  2. 所定の期間内に前記プッシュ情報に関連付けられた音声データを取得するステップが、
    前記所定のプッシュ情報に対応する候補回答文を解析して、目標文字セットを決定するステップと、
    取得された音声データに対して音声認識を行うステップと、
    所定の期間内に取得された音声データに前記目標文字セット内のいずれかの目標文字が含まれている場合、前記プッシュ情報に関連付けられた音声データを取得したと決定するステップと、
    を含む請求項1に記載のスマート音声機器の制御方法。
  3. 前記スマート音声機器を制御して所定のプッシュ情報を再生するステップの前に、
    前記目標ファイルが属するファイルタイプに基づいて、前記所定のプッシュ情報を決定するステップを含む請求項1に記載のスマート音声機器の制御方法。
  4. 前記スマート音声機器を制御して所定のプッシュ情報を再生するステップの前に、
    前記目標ファイルのファイル権限に基づいて、前記所定のプッシュ情報を決定するステップを含む請求項1に記載のスマート音声機器の制御方法。
  5. 前記スマート音声機器を制御して所定のプッシュ情報を再生するステップの前に、
    前記再生命令を取得した時間に基づいて、前記所定のプッシュ情報を決定するステップを含む請求項1に記載のスマート音声機器の制御方法。
  6. 所定の期間内に前記プッシュ情報に関連付けられた音声データを取得するステップの後に、
    前記プッシュ情報に対応する目標回答文を再生するステップを含む請求項1から5のいずれか一項に記載のスマート音声機器の制御方法。
  7. 前記スマート音声機器が、表示部材を備え、
    前記ファイル権限が前記スマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、前記表示部材に前記プッシュ情報を表示するステップを含む請求項1から5のいずれか一項に記載のスマート音声機器の制御方法。
  8. 目標ファイル識別子が含まれている再生命令を取得するための第1の取得モジュールと、
    前記目標ファイル識別子に対応する目標ファイルのファイル権限を決定するための第1の決定モジュールと、
    前記ファイル権限がスマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、前記スマート音声機器を制御して所定のプッシュ情報を再生するための制御モジュールと、
    所定の期間内に前記プッシュ情報に関連付けられた音声データを取得した場合、前記目標ファイルを再生するための再生モジュールと、
    を備えるスマート音声機器の制御装置。
  9. 第2の取得モジュールを備え、
    該第2の取得モジュールが、
    前記所定のプッシュ情報に対応する候補回答文を解析して、目標文字セットを決定するための第1の決定ユニットと、
    取得された音声データに対して音声認識を行うための認識ユニットと、
    所定の期間内に取得された音声データに前記目標文字セット内のいずれかの目標文字が含まれている場合、前記プッシュ情報に関連付けられた音声データを取得したと決定するための第2の決定ユニットと、
    を備える請求項8に記載のスマート音声機器の制御装置。
  10. 前記目標ファイルが属するファイルタイプに基づいて、前記所定のプッシュ情報を決定するための第2の決定モジュールを備える請求項8に記載のスマート音声機器の制御装置。
  11. 前記目標ファイルのファイル権限に基づいて、前記所定のプッシュ情報を決定するための第3の決定モジュールを備える請求項8に記載のスマート音声機器の制御装置。
  12. 前記再生命令を取得した時間に基づいて、前記所定のプッシュ情報を決定するための第4の決定モジュールを備える請求項8に記載のスマート音声機器の制御装置。
  13. 前記再生モジュールが、前記プッシュ情報に対応する目標回答文を再生する請求項8から12のいずれか一項に記載のスマート音声機器の制御装置。
  14. 前記スマート音声機器が表示部材を備え、
    前記ファイル権限が前記スマート音声機器を所有しているユーザの現在のユーザ権限とマッチングしない場合、前記表示部材に前記プッシュ情報を表示するための表示モジュールを備える請求項8から12のいずれか一項に記載のスマート音声機器の制御装置。
  15. 少なくとも1つのプロセッサと、
    該少なくとも1つのプロセッサに通信可能に接続されるメモリと、
    を備え、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令が前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが請求項1から7のいずれか一項に記載のスマート音声機器の制御方法を実行する電子機器。
  16. コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ命令が、コンピュータに請求項1から7のいずれかに記載のスマート音声機器の制御方法を実行させる非一時的なコンピュータ読み取り可能な記憶媒体。
  17. コンピュータに請求項1から7のいずれか一項に記載のスマート音声機器の制御方法を実行させるコンピュータプログラム。
JP2020214423A 2020-04-28 2020-12-24 スマート音声機器の制御方法、装置、電子機器及び記憶媒体 Active JP7135063B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010350353.XA CN111600782B (zh) 2020-04-28 2020-04-28 智能语音设备的控制方法、装置、电子设备和存储介质
CN202010350353.X 2020-04-28

Publications (2)

Publication Number Publication Date
JP2021174518A JP2021174518A (ja) 2021-11-01
JP7135063B2 true JP7135063B2 (ja) 2022-09-12

Family

ID=72189460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020214423A Active JP7135063B2 (ja) 2020-04-28 2020-12-24 スマート音声機器の制御方法、装置、電子機器及び記憶媒体

Country Status (3)

Country Link
US (1) US20210335357A1 (ja)
JP (1) JP7135063B2 (ja)
CN (1) CN111600782B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112542168A (zh) * 2020-12-08 2021-03-23 维沃移动通信有限公司 语音控制方法及装置
CN114630155A (zh) * 2022-03-15 2022-06-14 广州方硅信息技术有限公司 基于用户身份的直播互动方法、系统、装置及计算机设备
CN115631752B (zh) * 2022-12-19 2023-02-28 深圳慢云智能科技有限公司 一种支持机器学习的智能设备ai语音控制方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016015073A (ja) 2014-07-03 2016-01-28 ソニー株式会社 情報処理装置、情報処理方法およびコンテンツ提供システム
JP2019212288A (ja) 2018-06-08 2019-12-12 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 情報を出力するための方法、及び装置
JP2020503783A (ja) 2016-12-30 2020-01-30 グーグル エルエルシー 音響導波管とヒートシンクを組み合わせたコンパクトなホームアシスタントの設計

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8812319B2 (en) * 2001-01-31 2014-08-19 Ibiometrics, Inc. Dynamic pass phrase security system (DPSS)
JP3979491B2 (ja) * 2001-08-09 2007-09-19 大宏電機株式会社 通信認証方法
JP5129748B2 (ja) * 2005-09-07 2013-01-30 ソニー株式会社 コンテンツをターゲット装置にダウンロードする方法及びシステム
CA2736133C (en) * 2008-09-05 2016-11-08 Auraya Pty Ltd Voice authentication system and methods
EP2646903B1 (en) * 2010-12-01 2021-09-08 Headwater Research LLC End user device that secures an association of application to service policy with an application certificate check
US9043887B2 (en) * 2012-12-31 2015-05-26 Apple Inc. Adaptive secondary authentication criteria based on account data
CN104065989B (zh) * 2013-03-21 2018-07-06 国民技术股份有限公司 播放终端及其语音控制方法
US9210156B1 (en) * 2014-06-16 2015-12-08 Lexisnexis Risk Solutions Inc. Systems and methods for multi-stage identity authentication
KR20160069286A (ko) * 2014-12-08 2016-06-16 엘지전자 주식회사 이동 단말기 및 그 제어 방법
US20190182176A1 (en) * 2016-12-21 2019-06-13 Facebook, Inc. User Authentication with Voiceprints on Online Social Networks
US10607148B1 (en) * 2016-12-21 2020-03-31 Facebook, Inc. User identification with voiceprints on online social networks
US11223699B1 (en) * 2016-12-21 2022-01-11 Facebook, Inc. Multiple user recognition with voiceprints on online social networks
KR102483834B1 (ko) * 2018-01-17 2023-01-03 삼성전자주식회사 음성 명령을 이용한 사용자 인증 방법 및 전자 장치
CN108366280A (zh) * 2018-01-29 2018-08-03 山东浪潮商用系统有限公司 一种通过声纹识别用户进行儿童锁设置的方法
KR102513297B1 (ko) * 2018-02-09 2023-03-24 삼성전자주식회사 전자 장치 및 전자 장치의 기능 실행 방법
CN108597526A (zh) * 2018-03-28 2018-09-28 上海与德科技有限公司 一种权限确认方法、装置、存储介质及智能音箱
CN108877790A (zh) * 2018-05-21 2018-11-23 江西午诺科技有限公司 音箱控制方法、装置、可读存储介质及移动终端
CN109151565B (zh) * 2018-09-04 2019-12-20 北京达佳互联信息技术有限公司 播放语音的方法、装置、电子设备及存储介质
CA3026936A1 (en) * 2018-12-07 2020-06-07 Banque Nationale Du Canada Systems and methods for performing automated interactive conversation with a user
CN110046486B (zh) * 2019-04-10 2021-02-26 芋头科技(杭州)有限公司 智能交互设备管控方法、系统以及控制器和介质
CN110211592A (zh) * 2019-05-17 2019-09-06 北京华控创为南京信息技术有限公司 智能语音数据处理装置及方法
CN110334500B (zh) * 2019-06-28 2022-04-12 百度在线网络技术(北京)有限公司 智能音箱的权限控制方法、装置、智能音箱及存储介质
CN110491389B (zh) * 2019-08-19 2021-12-14 效生软件科技(上海)有限公司 一种话务系统的声纹识别方法
CN110473541A (zh) * 2019-09-02 2019-11-19 广州番禺巨大汽车音响设备有限公司 一种基于人工智能的音响Alexa语音控制方法及系统
CN110534107A (zh) * 2019-09-11 2019-12-03 北京安云世纪科技有限公司 智能设备的语音控制方法、装置、系统及电子设备
US11468900B2 (en) * 2020-10-15 2022-10-11 Google Llc Speaker identification accuracy

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016015073A (ja) 2014-07-03 2016-01-28 ソニー株式会社 情報処理装置、情報処理方法およびコンテンツ提供システム
JP2020503783A (ja) 2016-12-30 2020-01-30 グーグル エルエルシー 音響導波管とヒートシンクを組み合わせたコンパクトなホームアシスタントの設計
JP2019212288A (ja) 2018-06-08 2019-12-12 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 情報を出力するための方法、及び装置

Also Published As

Publication number Publication date
CN111600782B (zh) 2021-05-18
JP2021174518A (ja) 2021-11-01
US20210335357A1 (en) 2021-10-28
CN111600782A (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
JP7135063B2 (ja) スマート音声機器の制御方法、装置、電子機器及び記憶媒体
US10049675B2 (en) User profiling for voice input processing
CN111033492A (zh) 为自动化助手提供命令束建议
KR101949308B1 (ko) 미디어 내의 오브젝트와 관련된 감정 정보
US11043216B2 (en) Voice feedback for user interface of media playback device
DE102017122513A1 (de) Erleichtern der Erzeugung und Wiedergabe von durch den Anwender aufgezeichneten Audiosignalen
US10313403B2 (en) Systems and methods for virtual interaction
JP2021111379A (ja) インタラクション情報推薦方法及び装置
CN109948151A (zh) 构建语音助手的方法
CN110311858A (zh) 一种发送会话消息的方法与设备
Armitage Spaces to fail in: negotiating gender, community and technology in Algorave
WO2023241360A1 (zh) 在线课堂的语音交互方法、装置、设备及存储介质
WO2021126867A1 (en) Providing enhanced content with identified complex content segments
JP2021043435A (ja) 音声スキル作成方法、音声スキル作成装置、電子機器及び記憶媒体
JP2021056989A (ja) 音声スキル推薦方法、装置、機器及び記憶媒体
Kruijff-Korbayová et al. An experiment setup for collecting data for adaptive output planning in a multimodal dialogue system
JP5068368B2 (ja) サービス提供方法、サーバー及びコンピュータプログラム
Sterkenburg et al. Auditory emoticons: Iterative design and acoustic characteristics of emotional auditory icons and earcons
Bressan et al. A multimodal interactive installation for collaborative music making: from preservation to enhanced user design
JPWO2019017027A1 (ja) 情報処理装置および情報処理方法
CN110704737B (zh) 线上教学资源的匹配方法、装置、设备和介质
CN113014994A (zh) 多媒体播放控制方法及装置、存储介质、电子设备
JP6382423B1 (ja) 情報処理装置、画面出力方法及びプログラム
CN114827701A (zh) 多媒体信息互动方法、装置、电子设备以及存储介质
JP6964918B1 (ja) コンテンツ作成支援システム、コンテンツ作成支援方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220802

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220831

R150 Certificate of patent or registration of utility model

Ref document number: 7135063

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150