JP6728540B2 - ウェイクアップ方法、デバイス及びシステム、クラウドサーバーと可読媒体 - Google Patents

ウェイクアップ方法、デバイス及びシステム、クラウドサーバーと可読媒体 Download PDF

Info

Publication number
JP6728540B2
JP6728540B2 JP2018047997A JP2018047997A JP6728540B2 JP 6728540 B2 JP6728540 B2 JP 6728540B2 JP 2018047997 A JP2018047997 A JP 2018047997A JP 2018047997 A JP2018047997 A JP 2018047997A JP 6728540 B2 JP6728540 B2 JP 6728540B2
Authority
JP
Japan
Prior art keywords
intelligent device
request
wake
cloud server
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018047997A
Other languages
English (en)
Other versions
JP2019015952A (ja
Inventor
チャン、シアンタン
ザオ、リーフェン
チェン、ロンジエ
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド, バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Publication of JP2019015952A publication Critical patent/JP2019015952A/ja
Application granted granted Critical
Publication of JP6728540B2 publication Critical patent/JP6728540B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3231Monitoring the presence, absence or movement of users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L15/222Barge in, i.e. overridable guidance for interrupting prompts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、コンピュータ応用技術分野に関し、特に、ウェイクアップ方法、知能デバイス、サーバー、デバイス及び可読媒体に関する。
科学技術の発展に伴って、ユーザーが知能デバイスをより便利に利用されるように、従来の多い知能デバイスはユーザーの音声入力をサポートしている。
知能デバイスが長い間オンライン状態にあると、知能デバイスの消費電力が大きくなり、寿命が短くなる。そのため、従来の知能デバイスは、動作しない時はスリープ状態になって、消費電力を節約する。ユーザーが知能デバイスを利用する必要がある時、ウェイクアップ単語で知能デバイスをウェイクアップすることができる。その後、知能デバイスは、音声識別状態に進入する。この状態で、知能デバイスは、ユーザーが入力した音声形式の要求を受信し、クラウドサーバーに協力して、ユーザーの音声を識別し、語義分析を行い、ユーザーが要求したサービスを満足させる。従来の技術で、ユーザーが知能デバイスをウェイクアップする時、ウェイクアップ単語を少なくとも2つ音声入力すると、第一回のウェイクアップ単語は知能デバイスをウェイクアップするに用いられると識別され、その後のウェイクアップ単語は音声要求の入力として識別され、その時、知能デバイスはクラウドサーバーに協力して、当該ウェイクアップ単語に基づいてユーザーが要求するサービスを照会する。
そのため、従来のウェイクアップ案によると、ウェイクアップする時にウェイクアップ単語を少なくとも二回入力すると、二回目のウェイクアップ単語はユーザーの音声要求であると誤認され、命令識別エラーを引き起こし、ユーザーの予期を満足させることができなくなる。
本発明は、命令識別の正確性を向上させ、ユーザーの予期を満足させるウェイクアップ方法、知能デバイス、サーバー、デバイス及び可読媒体を提供する。
本発明は、
知能デバイスが音声識別段階に進入した後、ユーザーが音声方式で入力した第一要求を受信し、
語義解析後の前記第一要求と予め格納したウェイクアップ単語が一致しているか否かを判断し、
一致していると、受信した前記第一要求が前記知能デバイスを再度ウェイクアップするに用いられるのを確定することを含む
ウェイクアップ方法を提供する。
さらに、好ましくは、前記の方法で、知能デバイスが音声識別段階に進入すると、ユーザーが音声方式で入力した第一要求を受信する前に、前記方法は、さらに、
前記ユーザーが音声方式で入力した第二要求を受信し、
前記第二要求に基づいて、ローカルのサービス情報ベースで前記第二要求に対応するサービスを照会して、前記第二要求に対応するサービス満足処理の実施を開始することを含み、
さらに、受信した前記第一要求が前記知能デバイスを再度ウェイクアップするに用いられるのを確定した後、前記方法は、さらに、
前記第二要求に対応するサービス満足処理を停止することを含む。
さらに、好ましくは、前記の方法で、知能デバイスが音声識別段階に進入する場合、ユーザーが音声方式で入力した第一要求を受信する前に、前記方法は、さらに、
前記ユーザーが音声方式で入力した第二要求を受信し、
クラウドサーバーに前記知能デバイス標識と前記第二要求を発送して、前記クラウドサーバーに前記知能デバイスで前記第二要求に対応するサービス満足処理を開始させることを含み、
さらに、受信した前記第一要求が前記知能デバイスを再度ウェイクアップするに用いられるのを確定した後、前記方法は、さらに、
前記クラウドサーバーに前記知能デバイス標識を持っている再度ウェイクアップ通知メッセージを発送して、前記クラウドサーバーに前記知能デバイス標識に基づいて、対応する前記知能デバイスを確定して再度ウェイクアップさせ、また前記第二要求に対応するサービス満足処理を停止し、又は、
前記クラウドサーバーに前記知能デバイス標識と前記第一要求を発送して、前記クラウドサーバーに前記知能デバイス標識に基づいて予め格納した前記知能デバイスのウェイクアップ単語を獲得させ、語義解析後の前記第一要求が予め格納した前記ウェイクアップ単語と一致しているか否かを判断させ、一致していると、受信した前記第一要求が前記知能デバイスを再度ウェイクアップするに用いられるのを確定し、前記第二要求に対応するサービス満足処理を停止させることを含む。
さらに、好ましくは、前記の方法で、前記ユーザーが音声方式で入力した第二要求を受信してから、クラウドサーバーに前記知能デバイス標識を持っている前記第二要求を発送する前に、前記方法は、さらに、
前記知能デバイスのローカルのサービス情報ベースで前記第二要求に対応するサービスを照会されなかったことを含む。
さらに、好ましくは、前記の方法で、クラウドサーバーに前記知能デバイス標識と前記第二要求を発送した後、前記方法は、さらに、
現在時刻と前記クラウドサーバーへ前記第二要求を発送する時刻の時間差を獲得し、
前記クラウドサーバーが発送した前記第二要求のサービスフィードバックを受信するまでに、前記ユーザーに前記時間差を表示し、サービスフィードバックを受信すると前記時間差の表示を取り消し、
前記ユーザーが表示された前記時間差に基づいて前記時間差が予め設定した時間長さより大きいことを確定した時に音声入力した前記ウェイクアップ単語を受信して、前記知能デバイスを再度ウェイクアップすることを含み、
または、クラウドサーバーに前記知能デバイス標識と前記第二要求を発送した後、前記方法は、さらに、
前記第二要求を発送した後の予め設定時間内で前記クラウドサーバーのサービスフィードバックを受信したか否かを検出し、
受信しなかったら、前記ユーザーに再度ウェイクアップの提示メッセージを表示し、
前記ユーザーが音声入力した前記ウェイクアップ単語を受信して、前記知能デバイスを再度ウェイクアップすることを含む。
本発明は、さらに、
知能デバイスが音声識別段階に進入した後、前記知能デバイスが発送した前記知能デバイス標識と前記知能デバイスが受信したユーザーが入力した第一要求を受信し、
前記知能デバイス標識に基づいて予め格納した前記知能デバイスのウェイクアップ単語を獲得し、
語義解析後の前記第一要求が予め格納した前記ウェイクアップ単語と一致しているか否かを判断し、
一致していると、受信した前記第一要求が前記知能デバイスを再度ウェイクアップするに用いられるのを確定することを含む
音声ウェイクアップ方法を提供する。
さらに、好ましくは、前記の方法で、前記知能デバイスが発送した前記知能デバイス標識と第一要求を受信する前に、前記方法は、さらに、
前記知能デバイスが発送した前記知能デバイス標識と前記知能デバイスが受信したユーザーが入力した第二要求を受信し、
前記知能デバイスで前記第二要求に対応するサービス満足処理の実施を開始し、
受信した前記第一要求が前記知能デバイスを再度ウェイクアップするに用いられるのを確定した後、前記方法は、さらに、
前記第二要求に対応するサービス満足処理を停止することを含む。
本発明は、
前記知能デバイスが音声識別段階に進入すると、ユーザーが音声方式で入力した第一要求を受信する受信モジュールと、
語義解析後の前記第一要求と予め格納したウェイクアップ単語が一致しているか否かを判断する判断モジュールと、
前記第一要求が予め格納した前記ウェイクアップ単語と一致していると、受信した前記第一要求が前記知能デバイスを再度ウェイクアップするに用いられるのを確定する確定モジュールとを含む
知能デバイスを提供する。
さらに、好ましくは、前記知能デバイスはさらにサービス満足処理モジュールを含み、
前記受信モジュールは、さらに、前記ユーザーが音声方式で入力した第二要求を受信し、
サービス満足処理モジュールは、前記第二要求に基づいて、ローカルのサービス情報ベースで前記第二要求に対応するサービスを照会して、前記第二要求に対応するサービス満足処理の実施を開始し、
さらに、前記サービス満足処理モジュールは、さらに前記第二要求に対応するサービス満足処理を停止する。
さらに、好ましくは、前記の知能デバイスは、さらに発送モジュールを含み、
前記受信モジュールは、さらに、前記ユーザーが音声方式で入力した第二要求を受信し、
前記発送モジュールは、クラウドサーバーに前記知能デバイス標識と前記第二要求を発送して、前記クラウドサーバーに前記知能デバイスで前記第二要求に対応するサービス満足処理を開始させ、
さらに、前記発送モジュールは、さらに、前記クラウドサーバーに前記知能デバイス標識を持っている再度ウェイクアップ通知メッセージを発送して、前記クラウドサーバーに前記知能デバイス標識に基づいて、対応する前記知能デバイスを確定して再度ウェイクアップさせ、また前記第二要求に対応するサービス満足処理を停止し、
又は、前記発送モジュールは、さらに、前記クラウドサーバーに前記知能デバイス標識と前記第一要求を発送して、前記クラウドサーバーに前記知能デバイス標識に基づいて予め格納した前記知能デバイスのウェイクアップ単語を獲得させ、語義解析後の前記第一要求が予め格納した前記ウェイクアップ単語と一致しているか否かを判断させ、一致していると、受信した前記第一要求が前記知能デバイスを再度ウェイクアップするに用いられるのを確定し、前記第二要求に対応するサービス満足処理を停止する。
さらに、好ましくは、前記の知能デバイスで、前記サービス満足処理モジュールは、さらに前記知能デバイスのローカルのサービス情報ベースで前記第二要求に対応するサービスを照会されなかった。
さらに、好ましくは、前記の知能デバイスは、さらに、獲得モジュールと表示モジュールとを含み、
前記獲得モジュールは、現在時刻と前記クラウドサーバーへ前記第二要求を発送する時刻の時間差を獲得し、
前記表示モジュールは、前記クラウドサーバーが発送した前記第二要求のサービスフィードバックを受信するまでに、前記ユーザーに前記時間差を表示し、サービスフィードバックを受信すると前記時間差の表示を取り消し、
前記受信モジュールは、さらに前記ユーザーが表示された前記時間差に基づいて前記時間差が予め設定した時間長さより大きいことを確定した時に音声入力した前記ウェイクアップ単語を受信して、前記知能デバイスを再度ウェイクアップし、
または、前記知能デバイスは、さらに、検出モジュールを含み、
前記検出モジュールは、前記第二要求を発送した後の予め設定時間内で前記クラウドサーバーのサービスフィードバックを受信したか否かを検出し、
前記表示モジュールは、さらに、前記検出モジュールが前記第二要求後の予め設定の時間長さ内で前記クラウドサーバーのサービスフィードバックを受信しなかったことを検出すると、前記ユーザーに再度ウェイクアップの提示メッセージを表示し、
前記受信モジュールは、さらに前記ユーザーが音声入力した前記ウェイクアップ単語を受信して、前記知能デバイスを再度ウェイクアップする。
本発明は、さらに、
知能デバイスが音声識別段階に進入した後、前記知能デバイスが発送した前記知能デバイス標識と前記知能デバイスが受信したユーザーが入力した第一要求を受信する受信モジュールと、
前記知能デバイス標識に基づいて予め格納した前記知能デバイスのウェイクアップ単語を獲得する獲得モジュールと、
語義解析後の前記第一要求が予め格納した前記ウェイクアップ単語と一致しているか否かを判断する判断モジュールと、
前記判断モジュールが語義解析後の前記第一要求と予め格納した前記ウェイクアップ単語が一致していることを判断すると、受信した前記第一要求が前記知能デバイスを再度ウェイクアップするに用いられるのを確定する確定モジュールとを含むクラウドサーバーを提供する。
さらに、好ましくは、前記のクラウドサーバーは、さらに、サービス満足処理モジュールを含み、
前記受信モジュールは、さらに前記知能デバイスが発送した前記知能デバイス標識と前記知能デバイスが受信したユーザーが入力した第二要求を受信し、
前記サービス満足処理モジュールは、前記知能デバイスで前記第二要求に対応するサービス満足処理の実施を開始し、
さらに、前記サービス満足処理モジュールは、さらに前記第二要求に対応するサービス満足処理を停止する。
本発明は、さらに、知能デバイスと前記クラウドサーバーとを含む音声ウェイクアップシステムを提供し、前記知能デバイスは、前記クラウドサーバーと通信接続し、前記知能デバイスは前記の知能デバイスを利用し、前記クラウドサーバーは前記クラウドサーバーを利用する。
本発明は、さらに、
一つ又は複数のプロセッサーと、
一つ又は複数のプログラムを格納するメモリとを含む知能デバイスを提供し、
前記一つ又は複数のプログラムが前記一つ又は複数のプロセッサーによって実行されると、前記一つ又は複数のプロセッサーが前記の音声ウェイクアップ方法を実現する。
本発明は、さらに、
一つ又は複数のプロセッサーと、
一つ又は複数のプログラムを格納するメモリとを含むクラウドサーバーを提供し、
前記一つ又は複数のプログラムが前記一つ又は複数のプロセッサーによって実行されると、前記一つ又は複数のプロセッサーが前記の音声ウェイクアップ方法を実現する。
本発明は、さらに、コンピュータープログラムを記憶するコンピュータ可読媒体を提供し、当該プログラムがプロセッサーによって実行されると、前記の音声ウェイクアップ方法を実現する。
本発明の音声ウェイクアップ方法、知能デバイス、サーバー、デバイス及び可読媒体は、前記技術案を利用して、知能デバイスが音声識別段階に進入した後、受信したユーザーの第一要求がウェイクアップ単語であると、当該第一要求に対してサービス満足処理を行わなく、当該第一要求が再度ウェイクアップであることを識別でき、命令識別エラーを引き起こしなく、ユーザーの予期を満足できる。本発明の音声ウェイクアップ方案は、ユーザーの要求を有効的に処理でき、ユーザーの使用体験度を有効的に向上させることができる。
本発明の音声ウェイクアップ方法の実施例一のフローチャートである。 本発明の音声ウェイクアップ方法の実施例二のフローチャートである。 本発明の音声ウェイクアップ方法の実施例三のシグナリング図である。 本発明の音声ウェイクアップ方法の実施例四のシグナリング図である。 本発明の知能デバイス実施例一の構造図である。 本発明の知能デバイス実施例二の構造図である。 本発明のクラウドサーバーの実施例一の構造図である。 本発明のクラウドサーバーの実施例二の構造図である。 本発明の音声ウェイクアップシステムの実施例の構造図である。 本発明の知能デバイス実施例の構造図である。 本発明で提供するクラウドサーバーの例示図である。
本発明の目的、技術案及び利得点をより明確にするために、以下では図面と具体的な実施例を結合して、本発明を詳細に記述する。
図1は、本発明の音声ウェイクアップ方法の実施例一のフローチャートである。図1に示すように、本実施例の音声ウェイクアップ方法は、具体的に以下のステップを含んでいる。
100、知能デバイスが音声識別段階に進入すると、ユーザーが音声方式で入力した第一要求を受信する。
本実施例の音声ウェイクアップ方法の実行主体は、知能デバイスであって、例えば、本実施例の知能デバイスは、携帯電話、タブレットコンピュータ又は、他のAndroid(登録商標)オペレーティングシステム(Operating System、OS)、IOSのOS又は、Linux(登録商標)埋め込み型OSをインストールしたハードウェアデバイスであっても良い。
本実施例の知能デバイスは利用される時、音声入力をサポートし、消費電力を減少するように、本実施例の知能デバイスは長い間利用しない場合スタンバイ状態にある。ユーザーは、知能デバイスにウェイクアップ単語を入力して、知能デバイスをウェイクアップしてもよい。そうすると、知能デバイスは、音声識別段階に進入する。
例えば、間閾値を設置し、知能デバイスが間閾値に時間長さ内に何れの音声入力受信しなかったら、その時、知能デバイスはスタンバイ段階に進入する。具体的に、間閾値は知能デバイスに格納されていてもよく、知能デバイス自体で間閾値の時間長さ内でユーザーの何れの音声入力を受信しなかったかを検出し、受信しなかったら、スタンバイ段階に進入する。
又は、知能デバイスと遠隔無線通信するクラウドサーバーによって当該予め設定時間閾値を格納してもよい。知能デバイスが動作する時、ユーザーの音声要求だけを受信し、その後、ユーザーの音声要求をクラウドサーバーへ発送して、クラウドサーバーによって処理する。知能デバイスに故障がなくネットワークが正常である時、クラウドサーバーが予め設定時間閾値の時間長さ内に知能デバイスが発送した何れの音声入力を受信しなかったら、ユーザーが予め設定時間閾値の時間長さ内に知能デバイスに何れの音声入力も発送しなかったことを確定できる。この時、クラウドサーバーは、知能デバイスにスリープに進入する指示メッセージを発送し、知能デバイスは受信した指示メッセージに基づいて、消費電力を低減し、スリープ段階に進入してもよい。
知能デバイスが音声識別段階に進入した後、知能デバイスはユーザーの音声要求を受信してから、単独にユーザーの音声要求を処理してもよく、クラウドサーバーに協力してユーザーの音声要求を処理してもよく、処理過程は、音声識別、語義解析及びサービス満足を含んでいてもよい。即ち、先ず、ユーザーが入力した音声を識別し、文字情報として識別し、その後、識別した文字情報を語義解析し、ユーザーの意図即ちユーザーの要求を分析し、最後に、ユーザーの要求に対応するサービスを確定して、ユーザーのサービスを満足させる。知能デバイスは、完全に解放してもよく、前記方式のように、ユーザーの音声要求を受信した後、直接にクラウドサーバーへ発送して、クラウドサーバーによって音声識別、語義解析及びサービス満足の処理を行う。又は、知能デバイスが所定の処理機能を有し、所定のサービス情報ベースを格納しており、音声識別、語義解析及びサービス満足は全部知能デバイスで行ってもよい。このようになると、知能デバイスに対する要求が高くなるので、知能デバイスだけによって語義識別と語義解析を行ってから、クラウドサーバーによってサービス満足処理を行っても良い。本実施例のサービス満足処理は、即ちユーザーへ当該要求を満足させるサービスを提供する処理過程である。例えば、要求は、「カメラを起動する」であり、「今日の金の価格」、「今日の為替レート」を照会する。
本実施例で、知能デバイスが音声識別と語義解析をすることができることを例とする。さらに、サービス満足は知能デバイス側で行ってもよく、クラウドサーバー側で行っても良い。知能デバイスはさらにウェイクアップ単語を受信した時、音声識別段階に進入した後、ユーザーが音声方式で入力した第一要求を受信する。その後、知能デバイスは、さらに、当該第一要求に対して音声識別と語義解析を行い、解析してから当該第一要求に対応する文字形式を獲得する。例えば、ユーザーが入力した音声形式の第一要求は、当該知能デバイスのウェイクアップ単語であると、対応する音声識別、語義解析後の第一要求は文字形式のウェイクアップ単語であってもよい。
101、語義解析後の第一要求と予め格納したウェイクアップ単語が一致しているか否かを判断し、一致していると、ステップ102を実行し、そうでないと、第一要求に対してサービス満足処理を行う。
102、受信した第一要求が知能デバイスを再度ウェイクアップするに用いられるのを確定する。
本実施例で、語義解析後の第一要求を予め格納したウェイクアップ単語と比較して、語義解析後の第一要求が予め格納したウェイクアップ単語と一致しているか否かを判断し、一致していると、当該第一要求が知能デバイスを再度ウェイクアップするに用いられることを確定する。そうでないと、第一要求に対してサービス満足処理を行う。
際の応用では、知能デバイスが受信した全部の第一要求をそれぞれ予め格納したウェイクアップ単語と比較し、それは処理効率の低下を引き起こす。そのため、先ず語義解析後の第一要求の文字数を獲得し、その文字数が予め格納したウェイクアップ単語の文字数と等しいと、語義解析後の第一要求を予め格納したウェイクアップ単語と比較し、両者が一致しているか否かを判断して、処理效率を向上できる。
本実施例の音声ウェイクアップ方法は、知能デバイスが音声識別段階に進入する場合、ユーザーが音声方式で入力した第一要求を受信し、語義解析後の前記第一要求と予め格納したウェイクアップ単語が一致しているか否かを判断し、一致していると、受信した前記第一要求が前記知能デバイスを再度ウェイクアップするに用いられるのを確定する。本実施例の技術方案は、知能デバイスが音声識別段階に進入した後、受信した第一要求がウェイクアップ単語であると、当該第一要求に対してサービス満足処理を行うことなく、当該第一要求が再度ウェイクアップであることを識別でき、命令識別エラーを引き起こさず、ユーザーの予期を満足できる。本実施例の音声ウェイクアップ方案は、ユーザーの要求を有効的に処理でき、ユーザーの使用体験度を有効的に向上させることができる。
好ましくは、前記図1に示す実施例のステップ100の「知能デバイスが音声識別段階に進入すると、ユーザーが音声方式で入力した第一要求を受信する」前に、さらに、ユーザーが音声方式で入力した第二要求を受信し、第二要求に基づいて、ローカルのサービス情報ベースで第二要求に対応するサービスを照会し、第二要求に対応するサービス満足処理の実施を開始する。
知能デバイスが音声識別段階に進入した後、知能デバイスはユーザーの音声要求を処理できる。例えば、知能デバイスはユーザーが音声方式で入力した第二要求を受信してもよい。その後、当該第二要求に対して音声識別、語義解析を行って、第二要求の文字数がウェイクアップ単語の文字数と等しくないことを確定する。その後、第二要求に対してサービス満足処理を始める。具体的に、知能デバイスのローカルのサービス情報ベースで当該第二要求に対応するサービスを照会し、ユーザーに当該サービスを提供する。例えば、ユーザーは、音声で「XXXに電話を掛けてください」を入力すると、この時、知能デバイスは、当該要求に対して音声識別と語義解析を行ってから、サービス情報ベースで当該「XXXに電話を掛けてください」に対応するサービスの起動方式を照会し、その後、ユーザーのために当該サービスを起動し、即ち連絡帳から直接にXXXの電話を照会し、電話を掛ける。知能デバイス側のサービス情報ベースには、サービスの名称例えば「電話を掛ける」、サービスの実現方式等の知能デバイス側で実現する全部のサービスの情報を含んでいてもよい。
この時、対応するテップ102で「受信した第一要求が知能デバイスを再度ウェイクアップするに用いられるのを確定する」の後に、さらに、第二要求に対応するサービス満足処理を停止することを含む。
即ち、ユーザーが第二要求を出した後、知能デバイスにウェイクアップ単語を発送し、その時、知能デバイスはユーザーが当該知能デバイスを再度ウェイクアップするのを必要とするのを確定し、その前に実現しなかったサービス満足処理は全部停止し、例えば、まだ当該第二要求のサービスの実現方式を照会していると、その時第二要求に対応するサービスの実現方式を照会することを停止し、現在第二要求に対応するサービスを提供していると、ユーザーに第二要求に対応するサービスを提供することを直ぐ停止する。
好ましくは、本実施例で、知能デバイスが第一要求と第二要求に対して音声識別及び語義解析を行わなく、直接にクラウドサーバーに第一要求と第二要求を発送する場合、音声活性検出(Voice activity detection、VAD)を考慮して、第一要求は第二要求を発送した後所定の時間閾値の後に発送されるべきであり、クラウドサーバーが当該第二要求を受信することを確保し、その時、第一要求を発送してもよい。所定の時間閾値は、実際の経験に基づいて選択すればよい。
前記実施例で、知能デバイスが音声識別、語義分析及びサービス満足を処理することを例とし、好ましくは、クラウドサーバーによってサービス満足処理を行ってもよく、具体的に、ステップ100で「知能デバイスが音声識別段階に進入する場合、ユーザーが音声方式で入力した第一要求を受信する」前に、さらに、ユーザーが音声方式で入力した第二要求を受信し、クラウドサーバーに知能デバイス標識と第二要求を発送して、クラウドサーバーに知能デバイスで第二要求に対応するサービス満足処理の実施を開始させる。
同じ理由によって、知能デバイスは第二要求を直接にクラウドサーバーに発送してもよく、第二要求を音声識別及び語義解析してから、第二要求の語義解析後の文字情報をクラウドサーバーへ発送してもよい。即ち、本実施例におけるサービス満足はクラウドサーバーの一側で実現し、音声識別及び語義分析は知能デバイス側で実現し、もちろん、実際の応用で、音声識別及び語義分析はクラウドサーバー側で実現してもよい。
さらに、ステップ102の「受信した第一要求が知能デバイスを再度ウェイクアップするに用いられるのを確定する」の後に、さらに、クラウドサーバーに知能デバイス標識を持っている再度ウェイクアップ通知メッセージを発送して、クラウドサーバーが知能デバイス標識に基づいて、対応する知能デバイスの再度ウェイクアップを確定するようにし、第二要求に対応するサービス満足処理を停止することを含んでいてもよい。
このような方式で、知能デバイスが音声識別及び語義解析を行い、クラウドサーバーがサービス満足処理を実現する。知能デバイスは、第一要求を受信してから初歩的な判断を行い、ユーザーが知能デバイスを再度ウェイクアップすることを必要としていることを確定し、この時、知能デバイスは、直接にクラウドサーバーへ知能デバイス標識を持っている再度ウェイクアップ通知メッセージを発送する。このようにして、クラウドサーバーは、受信した知能デバイス標識に基づいて、対応する知能デバイスの再度ウェイクアップを確定し、第二要求に対応するサービス満足処理を停止する。例えば、第二要求に対応するサービスの照会を停止し、又は、知能デバイスでユーザーへ第二要求に対応するサービスを提供することを停止する。
または、ステップ102で「受信した第一要求が知能デバイスを再度ウェイクアップするに用いられるのを確定する」の後に、さらに、クラウドサーバーへ知能デバイス標識と第一要求を発送して、クラウドサーバーに知能デバイス標識に基づいて予め格納した知能デバイスのウェイクアップ単語を獲得させ、語義解析後の前記第一要求と予め格納したウェイクアップ単語が一致しているか否かを判断し、一致していると、受信した第一要求が知能デバイスの再度ウェイクアップに用いられることを確定し、第二要求に対応するサービス満足処理を停止することを含む。例えば、第二要求に対応するサービスを停止することを含んでいてもよく、又は、知能デバイスでユーザーに第二要求に対応するサービスを提供することを停止することを含む。
このような方式と上の方式の区別点は、知能デバイスは自体検出の結果をクラウドサーバーへ発送しなく、直接にクラウドサーバーへ知能デバイス標識と第一要求を発送し、クラウドサーバーによって知能デバイス標識に基づいて予め格納した知能デバイスのウェイクアップ単語を獲得し、語義解析後の前記第一要求と予め格納したウェイクアップ単語が一致しているか否かを判断し、一致していると、受信した第一要求が知能デバイスの再度ウェイクアップに用いられるのを確定し、第二要求に対応するサービス満足処理を停止することである。
好ましくは、実際の応用で、知能デバイスとクラウドサーバーは何れもサービス満足を実現でき、知能デバイスは、ある簡単なローカルで実現できるオフラインのサービスの満足を実現でき、クラウドサーバーは、ある複雑な、ネットワークによってこそ実現できるオンラインのサービスの満足を実現する。この時、好ましくは、前記実施例でのステップ 「ユーザーが音声方式で入力した第二要求を受信した」後、ステップ「クラウドサーバーへ知能デバイス標識と第二要求を発送する」前に、さらに、知能デバイスのローカルのサービス情報ベースで第二要求に対応するサービスを照会しなかったステップを含んでいてもよい。知能デバイスのローカルのサービス情報ベースには、ただローカルで実現できるサービスの名称、例えば、ユーザーが今日の株価指数を照会しようとすると、知能デバイスのローカルでは実現できないので、この時「今日の株価」のサービス名称は、ローカルのサービス情報ベースに格納されていない。その時、知能デバイスのローカルで当該第二要求に対応するサービスの満足を実現できない時、クラウドサーバーに当該第二要求を発送して、クラウドサーバーに当該第二要求に対応するサービスの満足を実現させる。例えば、知能デバイスのローカルであるオフラインのサービス、例えば、電話掛け、あるアプリの開き等を実現する。クラウドサーバーではあるオンラインのサービス、例えば今日の株式市場の株価の傾向、今日の天気、今日の為替レート等を実現する。
さらに、好ましくは、前記実施例の技術案の上で、「クラウドサーバーへ知能デバイス標識と第二要求を発送した」後、さらに、現在時刻とクラウドサーバーへ第二要求を発送する時刻の時間差を獲得し、クラウドサーバーが発送した第二要求のサービスフィードバックを受信するまでにユーザーに時間差を表示し、クラウドサーバーが発送した第二要求のサービスフィードバックを受信してから時間差の表示を取り消し、ユーザーが音声入力したユーザーが表示した時間差によって時間差が予め設定した時間長さより長いことを確定した時に発したウェイクアップ単語を受信して、知能デバイスを再度ウェイクアップする。
このような実施形態で、ユーザーにより知能デバイスを再度ウェイクアップすることを確定し、その前の要求を取り消す。具体的に、知能デバイスがクラウドサーバーへ要求を発送するたびに、1つの時計カウンタを起動して、現在時刻とクラウドサーバーへ第二要求を発送した時刻の時間差をカウントする。同時に、知能デバイスのディスプレイでユーザーにその時間差を表示する。このようにして、ユーザーはこの要求を発してからどのぐらいの時間が過ぎたかを理解でき、知能デバイスがクラウドサーバーがフィードバックするこの要求に対応するサービスを受信すると、知能デバイスのディスプレイ上の時計カウンタの表示を取り消してもよい。時計カウンタに示した時間差が予め設定の時間長さ、例えば60sより長くなり、クラウドサーバーの何れのサービスフィードバックを受信しなく、知能デバイスのディスプレイにまだますます増加させる時間差を表示すると、この時、ユーザーはその前の要求を取り消し、知能デバイスを再度ウェイクアップしてもよい。具体的に、ユーザーが知能デバイスへウェイクアップ単語を音声入力し、独立に操作又はクラウドサーバーに協力して当該知能デバイスを再度ウェイクアップすることを実現し、再度ウェイクアップする前に要求したサービス満足処理を取り消す。
または、前記実施例の技術案の上で、「クラウドサーバーへ知能デバイス標識と第二要求を発送」した後、さらに、第二要求を発送した後の予め予定の時間長さ内にクラウドサーバーのサービスフィードバックを受信したか否かを検出し、受信しなかったら、ユーザーに再度ウェイクアップの提示メッセージを表示し、ユーザーが音声入力した前記ウェイクアップ単語を受信して、知能デバイスを再度ウェイクアップするステップを含む。
このような実現形態と前記実現形態の区別点は、前記実現方式は、ユーザーによって知能デバイスの再度ウェイクアップを触発することである。本実現形態では、知能デバイスが検出し、第二要求を発送した後の予め予定の時間長さ内にクラウドサーバーのサービスフィードバックを受信しなかったら、知能デバイスがユーザーに知能デバイスを再度ウェイクアップすることを提示する。その後、ユーザーがウェイクアップ単語を音声入力して、知能デバイスを再度ウェイクアップする。
前記実施例の音声ウェイクアップ方法は、必要な時に、知能端末にウェイクアップ単語を入力して、再度ウェイクアップし、音声識別であると誤認しないので、命令識別の正確性を保証でき、ユーザーの予期を満足させることができる。このため、前記実施例のウェイクアップ方案は、ユーザーの要求を有効的に処理でき、ユーザーの使用体験度を有効的に向上させることができる。
図2は、本発明の音声ウェイクアップ方法の実施例二のフローチャートである。図2に示すように、本実施例の音声ウェイクアップ方法、具体的に以下のステップを含む。
200、知能デバイスが音声識別段階に進入した後、知能デバイスが発送した知能デバイス標識と知能デバイスが受信したユーザーが入力した第一要求を受信する。
201、知能デバイス標識に基づいて,予め格納した知能デバイスのウェイクアップ単語を獲得する。
202、語義解析後の第一要求と予め格納したウェイクアップ単語が一致しているか否かを判断し、一致していると、ステップ203を実行し、そうでないと、第一要求に対してサービス満足処理を行う。
203、受信した第一要求が知能デバイスを再度ウェイクアップするに用いられるのを確定する。
本実施例の音声ウェイクアップ方法の実行主体は、クラウドサーバーである。本実施例で、クラウドサーバーは少なくとも音声識別段階のサービス満足の実現を提供する。音声識別と語義解析は知能デバイス側で実現してもよく、クラウドサーバー側で実現してもよい。知能デバイス側で実現すると、ステップ200で知能デバイスが発送した知能デバイスが既に音声識別と音声解析を行った後の文字形式の第一要求を受信し、この時、知能デバイス標識第一要求に添付されていてもよい。音声識別と語義解析がクラウドサーバー側で実現されると、ステップ200で受信する知能デバイスが発送した第一要求は音声形式であってもよく、こ時、音声形式の第一要求に対して音声識別と語義解析を行ってもよい。知能デバイス側で受信したユーザーが入力した第一要求は全部音声形式である。
本実施例のクラウドサーバーは数え切れない知能デバイスをサポートできるので、知能デバイスがクラウドサーバーへ発送したメッセージ毎全部当該知能デバイス標識を持っていなければならなく、クラウドサーバーがどの知能デバイスから発送したかを確定できるようにする。クラウドサーバーには知能デバイス毎のウェイクアップ単語が格納されており、ある知能デバイスの要求メッセージを受信してから、要求メッセージにおける当該知能デバイス標識に基づいて、予めに格納した当該知能デバイスのウェイクアップ単語を獲得してもよい。その後、語義解析後の前記第一要求と予め格納したウェイクアップ単語が一致しているか否かを判断し、一致していると、受信した第一要求が知能デバイスを再度ウェイクアップするに用いられるのを確定する。そうでないと、続いて第一要求に対してサービス満足処理を行う。
本実施例の音声ウェイクアップ方法が、クラウドサーバー側でウェイクアップ機能を実現し、実現原理が前記図1に示す実施例の技術案に類似し、詳細は前記図1に示す記載を参照してもよく、ここでは重複に記載しない。
本実施例の音声ウェイクアップ方法は、知能デバイスが音声識別段階に進入した後、クラウドサーバーが知能デバイスが発送した知能デバイス標識と知能デバイスが受信するユーザーが入力した第一要求を受信し、知能デバイス標識に基づいて予め格納した知能デバイスのウェイクアップ単語を獲得し、語義解析後の前記第一要求と予め格納したウェイクアップ単語が一致しているか否かを判断し、一致していると、受信した第一要求が知能デバイスを再度ウェイクアップするに用いられるのを確定する。本実施例の技術方案は、知能デバイスが音声識別段階に進入した後、受信した要求がウェイクアップ単語であると、当該要求に対してサービス満足処理を行うことなく、当該要求が再度ウェイクアップであることを識別でき、命令識別エラーを引き起こすことなく、ユーザーの予期を満足させることができ、本実施例の音声ウェイクアップ方案は、ユーザーの要求を有効的に処理でき、ユーザーの使用体験度を有効的に向上させることができる。
さらに、好ましくは、ステップ200で「知能デバイスが発送した知能デバイス標識と第一要求を受信する」前に、さらに、知能デバイスが発送した知能デバイス標識と知能デバイスが受信したユーザーが入力した第二要求を受信し、知能デバイスで第二要求に対応するサービス満足処理を実施することを開始することを含んでいてもよい。
ステップ203で「受信した第一要求が知能デバイスを再度ウェイクアップするに用いられるのを確定する」した後、さらに、第二要求に対応するサービス満足処理を停止することを含んでいてもよく、例えば、第二要求に対応するサービスを照会することを停止し、又は知能デバイスでユーザーに第二要求に対応するサービスを提供することを停止することを含んでいてもよい。
前記ステップの具体的な実現方式は前記知能デバイス側の技術案を参照してもよく、ここでは重複に記載しない。以上の記載によると、本発明の音声ウェイクアップ方法は、単独に知能デバイス側で実現してもよく、知能デバイスとクラウドサーバーの両側で実現してもよい。以下では、両側が結合したことを例とし、本発明の技術案を説明する。
図3は、本発明の音声ウェイクアップ方法の実施例三のシグナリング図である。図3に示すように、本実施例の音声ウェイクアップ方法は、具体的に以下のステップを含む。
300、知能デバイスがスタンバイ状態にある時、ユーザーは知能デバイスにウェイクアップ単語を音声入力する。
301、知能デバイスは、音声形式のウェイクアップ単語に対して音声識別と語義解析を行い、文字形式のウェイクアップ単語を獲得し、予め格納したウェイクアップ単語を獲得して、受信したウェイクアップ単語が予め格納したウェイクアップ単語と一致しているか否かを判断し確定し、知能デバイスをウェイクアップして、知能デバイスが音声識別段階に進入するようにする。
本実施例で、知能デバイスウェイクアップの1つの標識としては、ディスプレイが明るくなってもよい。
302、知能デバイスはディスプレイでユーザーに「既に音声識別段階に進入しました」を提示する。
303、知能デバイスが音声識別段階に進入した後、ユーザーは第二回に知能デバイスへウェイクアップ単語を音声入力する。
304、知能デバイスは第二回に受信したウェイクアップ単語を音声識別と語義解析を行い、語義解析後のウェイクアップ単語が予め格納したウェイクアップ単語と一致しているか否かを判断し確定して、ユーザーが知能デバイスを再度ウェイクアップすることを確定する。
即ち、ユーザーがまだ知能デバイスをウェイクアップしていると確定し、当該第二回のウェイクアップ単語は音声識別の命令として音声識別されない。
305、知能デバイスが音声識別段階に進入した後、ユーザーは、知能デバイスへ第一サービス要求を音声入力する。
306、知能デバイスは、第一サービス要求に対して音声識別と語義解析を行って、文字形式の第一サービス要求を獲得する。
307、知能デバイスはクラウドサーバーへ知能デバイス標識を持っている第一サービス要求を発送する。
308、クラウドサーバーは、第一サービス要求に基づいて対応するサービス結果を獲得する。
例えば、ユーザーが知能デバイスで「今日の天気はどうですか」との第一サービス要求を発すると、クラウドサーバーはネットワークにアクセスする。
309、クラウドサーバーは、知能デバイス標識に基づいて知能デバイスにサービス満足の結果を提供する。
310、知能デバイスはユーザーにサービス満足の結果を表示する。
本実施例は、知能デバイス側で音声識別と語義解析を行い、クラウドサーバーによりサービス満足を実現することを例とし、好ましくは、前記実施例で、知能デバイスは何れかの処理もしなく、完全に解放して、受信した全部の音声形式のウェイクアップ単語又は要求のみを全部直接にクラウドサーバーへ発送し、クラウドサーバーによって音声識別、語義解析及びサービス満足処理を行ってもよく、ここでは重複に記載しない。
本実施例の音声ウェイクアップ方法は、前記技術案を利用して、知能デバイスが音声識別段階に進入した後、ウェイクアップ単語を再度受信すると、当該ウェイクアップ単語に対してサービス満足処理をしなく、当該ウェイクアップ単語が知能デバイスの再度ウェイクアップを指示することを識別でき、命令識別エラーを引き起こさず、ユーザーの予期を満足させることができる。本実施例の音声ウェイクアップ方案は、ユーザーの要求を有効的に処理でき、ユーザーの使用体験度を有効的に向上させることができる。
図4は、本発明の音声ウェイクアップ方法の実施例四のシグナリング図である。図4に示すように、本実施例の音声ウェイクアップ方法は、具体的に以下のステップを含む。
400、知能デバイスがスタンバイ状態にある時、ユーザーは知能デバイスにウェイクアップ単語を音声入力する。
401、知能デバイスは、クラウドサーバーへ音声形式のウェイクアップ単語と知能デバイス標識を発送する。
402、クラウドサーバーは、音声形式のウェイクアップ単語に対して音声識別と語義解析を行って、文字形式のウェイクアップ単語を獲得し、知能デバイス標識に基づいて予め格納した当該知能デバイスに対応するウェイクアップ単語を獲得し、受信したウェイクアップ単語が予め格納したウェイクアップ単語と一致しているか否かを判断し確定する。
403、クラウドサーバーは知能デバイスへウェイクアップ提示を発送して、知能デバイスを音声識別段階に進入させる。
404、知能デバイスは、ディスプレイでユーザーに「既に音声識別段階に進入しました」 を提示する。
好ましくは、前記ステップ400に従って、ユーザーはウェイクアップ単語を再度入力し、対応するにステップ401-404の処理によって、ユーザーが知能デバイスを再度ウェイクアップすることを確定でき、当該ウェイクアップ単語は他の音声命令として識別されない。
405、知能デバイスが音声識別段階に進入した後、ユーザーが知能デバイスへ第一サービス要求を音声入力する。
406、知能デバイスは、クラウドサーバーへ音声形式の第一サービス要求と知能デバイス標識を発送する。
407、クラウドサーバーは、第一サービス要求に対してサービス満足処理を行う。
408、ユーザーは、知能デバイスにウェイクアップ単語を再度音声入力する。
409、知能デバイスは、クラウドサーバーへ音声形式のウェイクアップ単語と知能デバイス標識を発送する。
410、クラウドサーバーは音声形式のウェイクアップ単語を音声識別と語義解析して、文字形式のウェイクアップ単語を獲得し、知能デバイス標識に基づいて、予め格納した当該知能デバイスに対応するウェイクアップ単語を獲得し、受信したウェイクアップ単語が予め格納したウェイクアップ単語と一致しているか否かを判断し確定する。
411、クラウドサーバーはユーザーが知能デバイスを再度ウェイクアップすることを要求することを確定し、第一サービスに対するサービス満足処理を停止する。
412、クラウドサーバーが知能デバイスへ再度ウェイクアップ指示メッセージを発送する。
413、知能デバイスがユーザーに「既に再度ウェイクアップしました」を表示する。
本実施例で、知能デバイスは何れかの処理も行わなく、完全に解放し、ただ受信した全部の音声形式のウェイクアップ単語又は要求を、全部直接にクラウドサーバーへ発送して、クラウドサーバーで音声識別、語義解析及びサービス満足処理を行う。好ましくは、知能デバイス側で音声識別と語義解析を行い、クラウドサーバーはただサービス満足処理だけを実現してもよく、ここでは重複に記載しない。
本実施例の音声ウェイクアップ方法は、前記技術案を利用して、知能デバイスが音声識別段階に進入した後、第一要求に対してサービス満足処理を行った後、再度ウェイクアップ単語を受信すると、当該ウェイクアップ単語に対してサービス満足処理を、当該ウェイクアップ単語は知能デバイスの再度ウェイクアップを指示するに用いられることを識別でき、その前のサービス満足処理を停止し、識別エラーを引き起こさず、ユーザーの予期を満足させることができ、本実施例の音声ウェイクアップ方案は、ユーザーの要求を有効的に処理でき、ユーザーの使用体験度を有効的に向上させることができる。
図5は、本発明の知能デバイス実施例一の構造図である。図5に示すように、本実施例の知能デバイスは、具体的に、
知能デバイスが音声識別段階に進入すると、ユーザーが音声方式で入力した第一要求を受信する受信モジュール10と、
判断語義解析後の受信モジュール10が受信した第一要求と予め格納したウェイクアップ単語が一致しているか否かを判断する判断モジュール11と、
判断モジュール11が予め格納した前記ウェイクアップ単語と一致していると判断すると、受信した第一要求が知能デバイスを再度ウェイクアップするに用いられるのを確定する確定モジュール12とを含む。
本実施例の知能デバイスは、前記モジュールを利用して音声ウェイクアップ処理を実現する実現原理及び技術効果が前記関連方法の実施例の実現と同じであるので、詳細は前記関連方法の実施例の記載を参照してもよく、ここでは重複に記載しない。
図6は、本発明の知能デバイス実施例二の構造図である。図6に示すように、本実施例の知能デバイスは、前記図5に示す実施例の技術案の上で、さらに以下の技術案を含んでいてもよい。
図6に示すように、本実施例の知能デバイスは、さらにサービス満足処理モジュール13を含んでいてもよい。
ここで、受信モジュール10は、さらに、前記ユーザーが音声方式で入力した第二要求を受信する。
サービス満足処理モジュール13は、受信モジュール10が受信した前記第二要求に基づいて、ローカルのサービス情報ベースで前記第二要求に対応するサービスを照会して、前記第二要求に対応するサービス満足処理の実施を開始する。
さらに、サービス満足処理モジュール13は、さらに確定モジュール12が受信した第一要求が知能デバイスを再度ウェイクアップするに用いられるのを確定する時に、第二要求に対応するサービス満足処理を停止する。
さらに、好ましくは、図6に示すように、本実施例の知能デバイスは、さらに、発送モジュール14を含む。
受信モジュール10は、さらに、ユーザーが音声方式で入力した第二要求を受信する。
発送モジュール14は、クラウドサーバーに知能デバイス標識と受信モジュール10が受信した第二要求を発送して、クラウドサーバーに知能デバイス上で前記第二要求に対応するサービス満足処理を開始させる。
さらに、発送モジュール14は、さらに、クラウドサーバーに知能デバイス標識を持っている再度ウェイクアップ通知メッセージを発送して、クラウドサーバーが知能デバイス標識に基づいて、対応する知能デバイスの再度ウェイクアップを確定するようにし、第二要求に対応するサービス満足処理を停止する。
又は、発送モジュール14は、さらに、クラウドサーバーに知能デバイス標識と受信モジュール10が受信した第一要求を発送して、クラウドサーバーが知能デバイス標識に基づいて予め格納した知能デバイスのウェイクアップ単語を獲得し、語義解析後の前記第一要求と予め格納したウェイクアップ単語が一致しているか否かを判断し、一致していると、受信した第一要求が知能デバイスの再度ウェイクアップに用いられることを確定し、第二要求に対応するサービス満足処理を停止する。
さらに、好ましくは、本実施例の知能デバイスで、サービス満足処理モジュール13は、さらに前記知能デバイスのローカルのサービス情報ベースで第二要求に対応するサービスを照会されなかった。その時こそ発送モジュール14を触発して前記操作を実行させる。
さらに、好ましくは、図6に示すように、本実施例の知能デバイスは、さらに、獲得モジュール15と表示モジュール16とを含む。
獲得モジュール15は、現在時刻と発送モジュール14がクラウドサーバーへ第二要求を発送する時刻の時間差を獲得する。
表示モジュール16は、クラウドサーバーが発送した第二要求のサービスフィードバックを受信するまでに、ユーザーに獲得モジュール15が獲得した時間差を表示し、サービスフィードバックを受信すると時間差の表示を取り消す。
受信モジュール10は、さらにユーザーが表示された時間差に基づいて時間差が予め設定した時間長さより大きいことを確定した時に音声入力したウェイクアップ単語を受信して、知能デバイスを再度ウェイクアップする。
又は、好ましくは、図6に示すように、本実施例の知能デバイスは、さらに、検出モジュール17を含む。
検出モジュール17は、発送モジュール14が第二要求を発送した後の予め設定の時間長さ内に受信モジュール10がクラウドサーバーのサービスフィードバックを受信したか否かを検出する。
表示モジュール16は、さらに、検出モジュール17が第二要求を発送してからの予め設定の時間長さ内にクラウドサーバーのサービスフィードバックを受信しなかったことを検出すると、ユーザーへ再度ウェイクアップの提示メッセージを表示する。
受信モジュール10は、さらに、ユーザーが音声入力したウェイクアップ単語を受信して、知能デバイスを再度ウェイクアップさせる。
本実施例の知能デバイスに含まれる前記モジュールは、結合する方式で何れかに組合せて本発明の好ましい実施例を形成してもよく、ここでは重複に記載しない。
本実施例の知能デバイスは、前記モジュールを利用して音声ウェイクアップ処理を実現する実現原理及び技術効果が前記関連方法の実施例の実現と同じであるので、詳細は前記関連方法の実施例の記載を参照してもよく、ここでは重複に記載しない。
図7は、本発明のクラウドサーバーの実施例一の構造図である。図7に示すように、本実施例のクラウドサーバーは、具体的に以下のモジュールを含んでいる。
受信モジュール20は、知能デバイスが音声識別段階に進入した後、知能デバイスが発送した知能デバイス標識と知能デバイスが受信したユーザーが入力した第一要求を受信する。
獲得モジュール21は、受信モジュール20が受信した知能デバイス標識に基づいて、予め格納した知能デバイスのウェイクアップ単語を獲得する。
判断モジュール22は、語義解析後の受信モジュール20が受信した第一要求が獲得モジュール21が獲得した予め格納したウェイクアップ単語と一致しているか否かを判断する。
確定モジュール23は、判断モジュール22が語義解析後の前記第一要求が予め格納した前記ウェイクアップ単語と一致していると判断すると、受信した第一要求が知能デバイスを再度ウェイクアップするに用いられるのを確定する。
本実施例のクラウドサーバーで、前記モジュールを利用して音声ウェイクアップ処理を実現する実現原理及び技術効果が前記関連方法の実施例の実現と同じであるので、詳細は前記関連方法の実施例の記載を参照してもよく、ここでは重複に記載しない。
図8は、本発明のクラウドサーバーの実施例二の構造図である。図8に示すように、本実施例のクラウドサーバーは、前記図7に示す実施例の技術案の上で、さらに以下の技術案を含んでいてもよい。
図8に示すように、本実施例のクラウドサーバーは、さらに、サービス満足処理モジュール24を含む。
受信モジュール20は、さらに、知能デバイスが発送した知能デバイス標識と知能デバイスが受信したユーザーが入力した第二要求を受信する。
サービス満足処理モジュール24は、知能デバイスで受信モジュール20が受信した第二要求に対応するサービス満足処理の実施を開始する。
さらに、サービス満足処理モジュール24は、確定モジュール23が受信した第一要求が知能デバイスを再度ウェイクアップするに用いられるのを確定する時に用いられる。第二要求に対応するサービス満足処理を停止する。
本実施例のクラウドサーバーで、前記モジュールを利用して音声ウェイクアップ処理を実現する実現原理及び技術効果が前記関連方法の実施例の実現と同じであるので、詳細は前記関連方法の実施例の記載を参照してもよく、ここでは重複に記載しない。
図9は、本発明の音声ウェイクアップシステムの実施例の構造図である。図9に示すように、本実施例のウェイクアップシステムは、知能デバイス30とクラウドサーバー40とを含む。
本実施例の知能デバイス30は、前記図6に示す実施例のクラウドサーバー40と対話できる知能デバイスを利用してもよく、本実施例のクラウドサーバー40は前記図7又は図8に示す実施例のクラウドサーバーを利用してもよい。また、具体的に、前記図2、図3又は図4に示す実施例の音声ウェイクアップ方法を利用してもよく、詳細には、前記関連実施例の記載を参照してもよく、ここでは重複に記載しない。
図10は、本発明の知能デバイス実施例の構造図である。図10に示すように、本実施例の知能デバイスは、1つ又は複数のプロセッサー30と、メモリ40とを含み、メモリ40は、1つ又は複数のプログラムを記憶し、メモリ40に記憶された1つ又は複数のプログラムが1つ又は複数のプロセッサー30によって実行されると、1つ又は複数のプロセッサー30が前記図1に示す実施例の音声ウェイクアップ方法を実現する。図10に示す実施例は、複数のプロセッサー30を含んでいることを例とする。
同じ理由によって、本実施例のクラウドサーバーは、前記図10に示す構造を利用してもよく、1つ又は複数のプロセッサー30とメモリ10を含み、ここで、メモリ40に記憶された1つ又は複数のプログラムが1つ又は複数のプロセッサー30に実行されて、1つ又は複数のプロセッサー30が図2に示す実施例の音声ウェイクアップ方法を実現する。
例えば、図11は、本発明で提供するクラウドサーバーの例示図である。図11は、本発明の実施形態の例示的なクラウドサーバー12aを示すためのブロック図を示した。図11に示すクラウドサーバー12aはただ1つの例示で、本発明の実施例の機能及び使用範囲に何れの制限を与えるべきでない。
図11に示すように、クラウドサーバー12aは、通用の計算デバイスの形式で表現される。クラウドサーバー12aの構成要素は、1つ又は複数のプロセッサー16aと、システムメモリ28aと、異なるシステム構成要素(システムメモリ28aとプロセッサー16aを含む)を接続するためのバス18aを含んでいてもよいが、これらに限定されない。
バス18aは、複数種類のバス構造における1つまたは複数を示し、メモリバスまたはメモリ制御器、外装バス、グラフィックス高速化ポート、プロセッサーまたは複数種類のバス構造における何れのバス構造のローカルバスなどを含む。例えば、これらのアーキテクチャー構造は、工業基準体系構造(ISA)バス、マイクロチャネルのアーキテクチャー(MAC)バス、増強型ISAバス、ビデオ電子基準協会(VESA)ローカルバス及び周辺コンポーネント相互接続(PCI(peripheral component interconnect))バスなどを含んでいても良いが、これらに限定されない。
クラウドサーバー12aは、代表的に複数のコンピュータシステム可読媒体を含んでいる。これらの媒体は、何れのコンピュータシステム/サーバー12aによって接続できる利用可能な媒体で、揮発性及び不揮発性媒体と、ポータブル又はアンポータブルな媒体を含んでいてもよい。
システムメモリ28aは、揮発性メモリ形式のコンピュータシステム可読媒体、例えば、ランダムアクセスメモリ(RAM)30a及び/または高速キャッシュメモリ32aを含んでいてもよい。クラウドサーバー12aは、さらに、他のポータブル又はアンポータブルな、揮発性/不揮発性コンピュータシステム記憶媒体を含んでいてもよい。ただ一例として、記憶システム34aは、アンポータブルな、不揮発性磁気媒体(図11に示していない、通常に「ハードディスクドライバ」と呼ばれる)の読み書きに用いられてもよい。図11に示していないが、ポータブルな不揮発性磁気ディスク(例えば、「フロッピー(登録商標)ディスク))に読み書くことができる磁気ディスクドライバ、及びポータブルな不揮発性光ディスク(例えば、CD-ROM、DVD-ROMまたは他の光媒体)に読み書くことができる光ディスクドライバを提供しても良い。これらの場合、各ドライバは、1つまたは複数のデータ媒体インターフェースでバス18aに接続してもよい。システムメモリ28aは、少なくとも1つのプログラム製品を含んでいてもよく、当該プログラム製品は、一組(例えば、少なくとも1つの)のプログラムモジュールを備えており、これらのプログラムモジュールは本発明の前記図1−図9の各実施例の機能を実行するように配置されている。
一組(少なくとも1つの)のプログラムモジュール42aを有するプログラム/実用アプリ40aは、例えばシステムメモリ28に記憶されていてもよく、このようなプログラムモジュール42aは、操作システム、1つまたは複数のアプリケーションプログラム、他のプログラムモジュール及びプログラムデータを含んでいても良いが、これらに限定されない。これらの例示に於ける一種類毎又はある組合せにはネットワーク環境での実現を含んでいてもよい。プログラムモジュール42aは、通常、本発明に記載した前記図1−図9の各実施例に於ける機能及び/又は方法を実行する。
クラウドサーバー12aは、1つ又は複数の外部デバイス14a(例えば、キーパッド、ポインティングデバイス、ディスプレイ24a等)と通信してもよく、ユーザーを当該クラウドサーバー12aと対話させる1つ又は複数のデバイスと通信してもよく、及び/または当該クラウドサーバー12aを1つ又は複数の他の計算デバイスと通信させるいかなるデバイス(例えば、ネットワークカード、モデム等)と通信してもよい。このような通信は、入力/出力(I/O)インターフェース22aを介して実行してもよい。また、クラウドサーバー12aは、さらにネットワークアダプタ20aを介して1つ又は複数のネットワーク(例えば、ローカル・エリア・ネットワーク(LAN)、はワイド・エリア・ネットワーク(WAN)及び/または公共ネットワーク、例えば、インターネット)と通信してもよい。図に示すように、ネットワークアダプタ20aは、バス18aを介してクラウドサーバー12aの他のモジュールと通信してもよい。図に示していないが、クラウドサーバー12aを結合して、マイクロコード、デバイスドライバ、冗長処理手段、外部磁気ディスクドライバアレイ、RAIDシステム、磁気テープドライバ及びデータバックアップ記憶システム等を含む他のハードウェアを利用することができるが、これらに限定されない。
プロセッサー16aは、システムメモリ28aに格納されているプログラムを実行して、色々な機能アプリ及びデータ処理を実行し、例えば、前記実施例に示すウェイクアップ方法を実現する。
本発明は、さらに、コンピュータプログラムを格納しているコンピュータ可読記憶媒体を提供し、当該プログラムがプロセッサーによって実行される時に、前記図1に示す実施例に示すウェイクアップ方法、又は、図2に示す実施例に示すウェイクアップ方法を実現する。
本実施例のコンピュータ可読記憶媒体は、前記図11に示す実施例でのシステムメモリ28aにおけるRAM30a、及び/または高速キャッシュメモリ32a、及び/または記憶システム34aを含んでいてもよい。
科学技術の発展に伴って、コンピュータプログラムの伝播は有形の媒体に限られなく、直接にネットワークからダウンロードしてもよく、又は他の方式で獲得してもよい。そのため、本実施例におけるコンピュータ可読媒体は有形の媒体を含むばかりでなく、無形の媒体も含んでいてもよい。
本実施例のコンピュータ可読媒体は、1つまたは複数のコンピュータ可読媒体の何れの組み合わせを使用してもよい。コンピュータ可読媒体は、コンピュータ可読信号媒体、またはコンピュータ可読記憶媒体であってもよい。コンピュータ可読記憶媒体は、例えば、電気、磁気、光学、電磁、赤外線、または半導体のシステム、装置またはデバイス、又はこれらの何れの組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例(非汲尽くしのリスト)としては、1つまたは複数のリード線を有する電気的接続、携帯型コンピュータディスク、ハードディスク、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、イーピーロム(EPROMまたはフラッシュメモリ)、光ファイバ、携帯コンパクトディスク読み出し専用メモリ(CD-ROM)、光記憶装置、磁気記憶装置、またはこれらの何れの適切な組み合わせを含む。本明細書において、コンピュータ可読記憶媒体は、命令実行システム、装置またはデバイスによって利用できまたはこれらと組み合わせて利用できるプログラムを含みまたは記憶している何れかの有形媒体であってもよい。
コンピュータ可読信号媒体は、ベースバンドにおいてまたはキャリヤーの一部として伝播するコンピュータ可読なプログラムコードを搭載したデータ信号を含んでいてもよい。このような伝播するデータ信号は、様々な形態をとることができ、電磁信号、光信号、またはこれらの何れの適切な組み合わせを含んでいてもよいが、これらに限定されない。コンピュータ可読信号媒体は、コンピュータ可読記憶媒体以外の何れかのコンピュータ可読媒体であってもよく、当該コンピュータ可読媒体は、命令実行システム、装置またはデバイスによって使用されまたはこれらに結合されて使用されるプログラムを送信し、伝播し、送信することができる。
コンピュータ可読媒体に含まれるプログラムコードは、無線、ワイヤ、ケーブル、RF等、またはこれらの何れかの適切な組み合わせの何れかの適切な媒体で送信されてもよいが、これらに限定されない。
1つまたは複数のプログラム設計言語またはこれらの組合せで、本発明の動作を実行するためのコンピュータプログラムコードを書き込むことができ、前記プログラム設計言語は、オブジェクト指向プログラミング言語、例えばJava(登録商標)、Smalltalk、C++を含み、常用の過程式プログラム設計言語、例えば「C」言語または類似なプログラム設計言語を含む。プログラムコードは、完全にユーザーのコンピュータ上で実行されてもよく、一部はユーザーのコンピュータで実行されて1つの独立したソフトウェアパッケージとして実行されてもよく、一部はユーザーのコンピュータで、一部はリモートコンピュータで実行されてもよく、または、完全にリモートコンピュータまたはサーバーで実行されてもよい。リモートコンピュータに関するものの場合は、リモートコンピュータは、ローカル・エリア・ネットワーク(LAN)またはワイド・エリア・ネットワーク(WAN)を含む何れの種類のネットワークを介して、ユーザコンピュータに接続されてもよく、あるいは、外部コンピュータ(例えば、インターネット・サービス・プロバイダを利用してインターネットを介して接続する)に接続してもよい。
本発明で提供する幾つかの実施例で開示したシステム、装置及び方法は、他の方式によって実現できるのは理解すべきである。例えば、以上に記載した装置の実施例はただ例示的なもので、例えば、前記手段の分割はただロジック機能の分割で、実際に実現する時は他の分割方式によってもよい。
以上で分離部材として説明した手段は、物理上で分離したものであってもよく物理上で分離しなかったものであってもよく、手段として表示した部材は物理手段であってもよく、物理手段でないでもよく、即ち、同一の位置にあってもよく、複数のネットワーク手段に分布されていてもよい。実際の必要によってその中における一部または全部手段を選択して本実施例の方案の目的を実現してもよい。
また、本発明の各実施例における各機能手段は一つの処理手段に集積してもよく、各手段が物理上で単独に存在してもよく、二つ又は二つ以上の手段を一つの手段に集積してもよい。前記集積した手段は、ハードウェアの形式で実現してもよく、ハードウェアにソフトウェアの機能手段を結合する形式で実現してもよい。
上記のソフト機能手段の形式で実現した集積した手段は、一つのコンピュータ可読記憶媒体に記憶してもよい。前記ソフト機能手段は一つの記憶媒体に記憶してもよく、複数の命令を含んで一つのコンピューターデバイス(パーソナルコンピューター、サーバー、又はネットワークデバイス等)又はプロセッサ(processor)によって、本発明の各実施例の前記方法の一部のステップを実行させてもよい。前記記憶媒体は、Uディスク、ポータブルハードウェア、読み出し専用メモリ(Read-Only Memory、ROM)、ランダムアクセスメモリ(Random Access Memory、RAM)、ディスク又は光ディスク等のプログラムコードを記憶できる複数種類の媒体を含む。
以上はただ本発明の好ましい実施例であり、これによって本発明を制限するものではなく、本発明の主旨及び原則の範囲で行った何れかの修正、等価置換、改良等は、全部本発明の保護範囲に含まれる。

Claims (14)

  1. 知能デバイスが音声識別段階に進入した後、
    ユーザーが音声方式で入力した第二要求を受信し、
    前記第二要求に基づいて、ローカルのサービス情報ベースで前記第二要求に対応するサービスを照会して、前記第二要求に対応するサービス満足処理の実施を開始し、
    前記ユーザーが音声方式で入力した第一要求を受信し、
    語義解析後の前記第一要求と予め格納したウェイクアップ単語が一致しているか否かを判断し、
    一致していると、受信した前記第一要求が前記知能デバイスに前記第二要求に対応するサービス満足処理を停止させる再度ウェイクアップを実行するのに用いられるのを確定することを含む、音声ウェイクアップ方法。
  2. 知能デバイスが音声認識段階に進入した後、
    ユーザーが音声方式で入力した第二要求を受信し、
    クラウドサーバーに前記知能デバイスの標識と前記第二要求を発送して、前記クラウドサーバーに前記知能デバイスで前記第二要求に対応するサービス満足処理の実施を開始し、
    前記ユーザーが音声方式で入力した第一要求を受信し、
    語義解析後の前記第一要求と予め格納したウェイクアップ単語が一致しているか否かを判断し、
    一致していると、受信した前記第一要求が前記知能デバイスに前記第二要求に対応するサービス満足処理を停止させる再度ウェイクアップを実行するのに用いられるのを確定した後、さらに、
    前記クラウドサーバーに前記知能デバイスの標識を持っている再度ウェイクアップ通知メッセージを発送して、前記クラウドサーバーに前記知能デバイスの標識に基づいて、対応する前記知能デバイスを確定して前記再度ウェイクアップを実行させることで、前記第二要求に対応するサービス満足処理を停止し、又は、
    前記クラウドサーバーに前記知能デバイスの標識と前記第一要求を発送して、前記クラウドサーバーに前記知能デバイスの標識に基づいて予め格納した前記知能デバイスのウェイクアップ単語を獲得させ、語義解析後の前記第一要求が予め格納した前記ウェイクアップ単語と一致しているか否かを判断させ、一致していると、受信した前記第一要求が前記知能デバイスに前記再度ウェイクアップを実行させるのに用いられるのを確定し、前記第二要求に対応するサービス満足処理を停止させることを含む、音声ウェイクアップ方法。
  3. 前記ユーザーが音声方式で入力した第二要求を受信してから、クラウドサーバーに前記知能デバイスの標識を持っている前記第二要求を発送する前に、前記音声ウェイクアップ方法は、さらに、
    前記知能デバイスのローカルのサービス情報ベースで前記第二要求に対応するサービスを照会されなかったことを含む、請求項2に記載の音声ウェイクアップ方法。
  4. クラウドサーバーに前記知能デバイスの標識と前記第二要求を発送した後、前記音声ウェイクアップ方法は、さらに、
    現在時刻と前記クラウドサーバーへ前記第二要求を発送する時刻の時間差を獲得し、
    前記クラウドサーバーが発送した前記第二要求のサービスフィードバックを受信するまでに、前記ユーザーに前記時間差を表示し、サービスフィードバックを受信すると前記時間差の表示を取り消し、
    前記ユーザーが表示された前記時間差に基づいて前記時間差が予め設定した時間長さより大きいことを確定した時に音声入力した前記ウェイクアップ単語を受信して、前記知能デバイスに前記再度ウェイクアップを実行させることを含み、
    または、クラウドサーバーに前記知能デバイスの標識と前記第二要求を発送した後、前記音声ウェイクアップ方法は、さらに、
    前記第二要求を発送した後の予め設定時間内で前記クラウドサーバーのサービスフィードバックを受信したか否かを検出し、
    受信しなかったら、前記ユーザーに再度ウェイクアップの提示メッセージを表示し、
    前記ユーザーが音声入力した前記ウェイクアップ単語を受信して、前記知能デバイスに前記再度ウェイクアップを実行させることを含む、請求項2に記載の音声ウェイクアップ方法。
  5. 知能デバイスが音声識別段階に進入した後、
    前記知能デバイスが発送した前記知能デバイスの標識と前記知能デバイスが受信したユーザーが入力した第二要求を受信し、
    前記知能デバイスで前記第二要求に対応するサービス満足処理の実施を開始し、
    前記知能デバイスが発送した前記知能デバイスの標識と前記知能デバイスが受信した前記ユーザーが入力した第一要求を受信し、
    前記知能デバイスの標識に基づいて予め格納した前記知能デバイスのウェイクアップ単語を獲得し、
    語義解析後の前記第一要求が予め格納した前記ウェイクアップ単語と一致しているか否かを判断し、
    一致していると、受信した前記第一要求が前記知能デバイスに前記第二要求に対応するサービス満足処理を停止させる再度ウェイクアップを実行するに用いられるのを確定することを含む、音声ウェイクアップ方法。
  6. 知能デバイスが音声識別段階に進入すると、ユーザーが音声方式で入力した第一要求及び第二要求を受信する受信モジュールと、
    前記第二要求に基づいて、ローカルのサービス情報ベースで前記第二要求に対応するサービスを照会して、前記第二要求に対応するサービス満足処理の実施を開始するサービス満足処理モジュールと、
    語義解析後の前記第一要求と予め格納したウェイクアップ単語が一致しているか否かを判断する判断モジュールと、
    前記第一要求が予め格納した前記ウェイクアップ単語と一致していると、受信した前記第一要求が前記知能デバイスに前記第二要求に対応するサービス満足処理を停止させる再度ウェイクアップを実行するのに用いられるのを確定する確定モジュールとを含み、
    前記サービス満足処理モジュールは、さらに前記第二要求に対応するサービス満足処理を停止する、
    知能デバイス。
  7. 前記知能デバイスは、さらに発送モジュールを含み、
    記発送モジュールは、クラウドサーバーに前記知能デバイスの標識と前記第二要求を発送して、前記クラウドサーバーに前記知能デバイスで前記第二要求に対応するサービス満足処理を開始させ、
    さらに、前記発送モジュールは、さらに、前記クラウドサーバーに前記知能デバイスの標識を持っている再度ウェイクアップ通知メッセージを発送して、前記クラウドサーバーに前記知能デバイスの標識に基づいて、対応する前記知能デバイスを確定して前記再度ウェイクアップを実行させることで、前記第二要求に対応するサービス満足処理を停止し、
    又は、前記発送モジュールは、さらに、前記クラウドサーバーに前記知能デバイスの標識と前記第一要求を発送して、前記クラウドサーバーに前記知能デバイスの標識に基づいて予め格納した前記知能デバイスのウェイクアップ単語を獲得させ、語義解析後の前記第一要求が予め格納した前記ウェイクアップ単語と一致しているか否かを判断させ、一致していると、受信した前記第一要求が前記知能デバイスに前記再度ウェイクアップを実行させるのに用いられるのを確定し、前記第二要求に対応するサービス満足処理を停止する、請求項6に記載の知能デバイス。
  8. 前記サービス満足処理モジュールは、さらに前記知能デバイスのローカルのサービス情報ベースで前記第二要求に対応するサービスを照会されなかった、請求項7に記載の知能デバイス。
  9. 前記知能デバイスは、さらに、獲得モジュールと表示モジュールとを含み、
    前記獲得モジュールは、現在時刻と前記クラウドサーバーへ前記第二要求を発送する時刻の時間差を獲得し、
    前記表示モジュールは、前記クラウドサーバーが発送した前記第二要求のサービスフィードバックを受信するまでに、前記ユーザーに前記時間差を表示し、サービスフィードバックを受信すると前記時間差の表示を取り消し、
    前記受信モジュールは、さらに前記ユーザーが表示された前記時間差に基づいて前記時間差が予め設定した時間長さより大きいことを確定した時に音声入力した前記ウェイクアップ単語を受信して、前記知能デバイスに前記再度ウェイクアップを実行させ
    または、前記知能デバイスは、さらに、検出モジュールを含み、
    前記検出モジュールは、前記第二要求を発送した後の予め設定時間内で前記クラウドサーバーのサービスフィードバックを受信したか否かを検出し、
    前記表示モジュールは、さらに、前記検出モジュールが前記第二要求後の予め設定の時間長さ内で前記クラウドサーバーのサービスフィードバックを受信しなかったことを検出すると、前記ユーザーに再度ウェイクアップの提示メッセージを表示し、
    前記受信モジュールは、さらに前記ユーザーが音声入力した前記ウェイクアップ単語を受信して、前記知能デバイスに前記再度ウェイクアップを実行させる、請求項7に記載の知能デバイス。
  10. 知能デバイスが音声識別段階に進入した後、前記知能デバイスが発送した前記知能デバイスの標識と前記知能デバイスが受信したユーザーが入力した第一要求及び第二要求を受信する受信モジュールと、
    前記知能デバイスで前記第二要求に対応するサービス満足処理の実施を開始するサービス満足処理モジュールと、
    前記知能デバイスの標識に基づいて予め格納した前記知能デバイスのウェイクアップ単語を獲得する獲得モジュールと、
    語義解析後の前記第一要求が予め格納した前記ウェイクアップ単語と一致しているか否かを判断する判断モジュールと、
    前記判断モジュールが語義解析後の前記第一要求と予め格納した前記ウェイクアップ単語が一致していることを判断すると、受信した前記第一要求が前記知能デバイスに前記サービス満足処理を停止させる再度ウェイクアップを実行するのに用いられるのを確定する確定モジュールとを含み、
    前記サービス満足処理モジュールは、さらに前記第二要求に対応するサービス満足処理を停止する、クラウドサーバー。
  11. 知能デバイスと前記クラウドサーバーとを含み、
    前記知能デバイスは、前記クラウドサーバーと通信接続し、
    前記知能デバイスは請求項7〜9の何れか一項に記載の知能デバイスを利用し、
    前記クラウドサーバーは請求項10に記載のクラウドサーバーを利用する、音声ウェイクアップシステム。
  12. 一つ又は複数のプロセッサーと、
    一つ又は複数のプログラムを格納するメモリとを含む知能デバイスであって、
    前記一つ又は複数のプログラムが前記一つ又は複数のプロセッサーによって実行されると、前記一つ又は複数のプロセッサーが請求項1〜4の何れか一項に記載の音声ウェイクアップ方法を実現する、知能デバイス。
  13. 一つ又は複数のプロセッサーと、
    一つ又は複数のプログラムを格納するメモリとを含むクラウドサーバーであって、
    前記一つ又は複数のプログラムが前記一つ又は複数のプロセッサーによって実行されると、前記一つ又は複数のプロセッサーが請求項5に記載の音声ウェイクアップ方法を実現する、クラウドサーバー。
  14. プロセッサーに、請求項1〜4の何れかの一項に記載の音声ウェイクアップ方法を実行させる、又は、前記プロセッサーに、請求項5に記載の音声ウェイクアップ方法を実行させるためのコンピュータプログラム。
JP2018047997A 2017-07-05 2018-03-15 ウェイクアップ方法、デバイス及びシステム、クラウドサーバーと可読媒体 Active JP6728540B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201710543572.8 2017-07-05
CN201710543572.8A CN107564517A (zh) 2017-07-05 2017-07-05 语音唤醒方法、设备及系统、云端服务器与可读介质

Publications (2)

Publication Number Publication Date
JP2019015952A JP2019015952A (ja) 2019-01-31
JP6728540B2 true JP6728540B2 (ja) 2020-07-22

Family

ID=60973010

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018047997A Active JP6728540B2 (ja) 2017-07-05 2018-03-15 ウェイクアップ方法、デバイス及びシステム、クラウドサーバーと可読媒体

Country Status (5)

Country Link
US (1) US10964317B2 (ja)
EP (2) EP3447763A1 (ja)
JP (1) JP6728540B2 (ja)
KR (1) KR102096156B1 (ja)
CN (1) CN107564517A (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107564517A (zh) 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 语音唤醒方法、设备及系统、云端服务器与可读介质
CN110275691A (zh) * 2018-03-15 2019-09-24 阿拉的(深圳)人工智能有限公司 智能语音唤醒的自动回复方法、装置、终端及存储介质
CN108665900B (zh) 2018-04-23 2020-03-03 百度在线网络技术(北京)有限公司 云端唤醒方法及系统、终端以及计算机可读存储介质
EP3627501B1 (en) * 2018-05-18 2023-10-18 Shenzhen Aukey Smart Information Technology Co., Ltd. Headphones, wrist-worn voice interaction device and system
CN108735216B (zh) * 2018-06-12 2020-10-16 广东小天才科技有限公司 一种基于语义识别的语音搜题方法及家教设备
CN109377993A (zh) * 2018-10-12 2019-02-22 上海庆科信息技术有限公司 智能语音系统及其语音唤醒方法及智能语音设备
CN109389977B (zh) * 2018-11-01 2021-07-16 腾讯大地通途(北京)科技有限公司 一种语音交互方法及装置
CN109637542A (zh) * 2018-12-25 2019-04-16 圆通速递有限公司 一种语音外呼系统
CN111862965A (zh) * 2019-04-28 2020-10-30 阿里巴巴集团控股有限公司 唤醒处理方法、装置、智能音箱及电子设备
KR102228549B1 (ko) * 2019-06-11 2021-03-16 엘지전자 주식회사 음성 인에이블 디바이스 선택 방법, 음성 인에이블 디바이스 선택 장치 및 이를 제어하는 지능형 컴퓨팅 디바이스
CN112152890B (zh) * 2019-06-28 2022-01-21 海信视像科技股份有限公司 一种基于智能音箱的控制系统及方法
CN110706696A (zh) * 2019-09-25 2020-01-17 珠海格力电器股份有限公司 一种语音控制方法及装置
CN110890092B (zh) * 2019-11-07 2022-08-05 北京小米移动软件有限公司 唤醒控制方法及装置、计算机存储介质
CN110827799B (zh) * 2019-11-21 2022-06-10 百度在线网络技术(北京)有限公司 用于处理语音信号的方法、装置、设备和介质
CN110827820B (zh) * 2019-11-27 2022-09-27 北京梧桐车联科技有限责任公司 语音唤醒方法、装置、设备、计算机存储介质及车辆
CN111243700B (zh) * 2020-01-15 2023-09-29 创业慧康科技股份有限公司 一种电子病历输入方法及装置
CN111243577B (zh) * 2020-03-27 2022-04-19 四川虹美智能科技有限公司 语音交互方法及装置
CN111522592A (zh) * 2020-04-24 2020-08-11 腾讯科技(深圳)有限公司 一种基于人工智能的智能终端唤醒方法和装置
CN111554288A (zh) * 2020-04-27 2020-08-18 北京猎户星空科技有限公司 智能设备的唤醒方法、装置、电子设备及介质
CN111722696B (zh) * 2020-06-17 2021-11-05 思必驰科技股份有限公司 用于低功耗设备的语音数据处理方法和装置
CN111833874B (zh) * 2020-07-10 2023-12-05 上海茂声智能科技有限公司 一种基于标识符的人机交互方法、系统、设备和存储介质
KR20220037846A (ko) * 2020-09-18 2022-03-25 삼성전자주식회사 음성 인식을 수행하기 위한 전자 장치를 식별하기 위한 전자 장치 및 그 동작 방법
CN113012697A (zh) * 2021-03-05 2021-06-22 北京嘀嘀无限科技发展有限公司 一种信息交互方法、装置及电子设备
CN113921016A (zh) * 2021-10-15 2022-01-11 阿波罗智联(北京)科技有限公司 语音处理方法、装置、电子设备以及存储介质
CN114915514B (zh) * 2022-03-28 2024-03-22 青岛海尔科技有限公司 意图的处理方法和装置、存储介质及电子装置

Family Cites Families (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000089789A (ja) 1998-09-08 2000-03-31 Fujitsu Ltd 音声認識装置及び記録媒体
US7058575B2 (en) * 2001-06-27 2006-06-06 Intel Corporation Integrating keyword spotting with graph decoder to improve the robustness of speech recognition
JP3632679B2 (ja) 2002-06-21 2005-03-23 ブラザー工業株式会社 通信システム及び通信機器
JP2004096520A (ja) 2002-09-02 2004-03-25 Hosiden Corp 音声認識リモコン
US8154227B1 (en) * 2003-11-26 2012-04-10 Liontech Trains Llc Model train control system
KR100621593B1 (ko) * 2004-09-24 2006-09-19 삼성전자주식회사 다중양식의 입력을 이용하는 통합 원격 제어 장치 및 방법
US20080147652A1 (en) * 2006-12-14 2008-06-19 Bellsouth Intellectual Property Corporation Physical address verification within electronic documents
US8041012B2 (en) 2007-03-06 2011-10-18 Embarq Holdings Company, Llc System and method for voice-activated dialing over implicit and explicit NFA trunks
US20110054899A1 (en) 2007-03-07 2011-03-03 Phillips Michael S Command and control utilizing content information in a mobile voice-to-speech application
US8886545B2 (en) 2007-03-07 2014-11-11 Vlingo Corporation Dealing with switch latency in speech recognition
US8090750B2 (en) * 2008-12-30 2012-01-03 International Business Machines Corporation Prompting of an end user with commands
US9421475B2 (en) * 2009-11-25 2016-08-23 Hallmark Cards Incorporated Context-based interactive plush toy
US20140372114A1 (en) * 2010-08-06 2014-12-18 Google Inc. Self-Directed Machine-Generated Transcripts
WO2012025784A1 (en) * 2010-08-23 2012-03-01 Nokia Corporation An audio user interface apparatus and method
US8880403B2 (en) 2010-09-03 2014-11-04 Canyon Ip Holdings Llc Methods and systems for obtaining language models for transcribing communications
CN102682771B (zh) 2012-04-27 2013-11-20 厦门思德电子科技有限公司 一种适用于云平台的多语音控制方法
KR20130133629A (ko) * 2012-05-29 2013-12-09 삼성전자주식회사 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법
US20140006825A1 (en) * 2012-06-30 2014-01-02 David Shenhav Systems and methods to wake up a device from a power conservation state
WO2014017144A1 (ja) 2012-07-27 2014-01-30 Jsr株式会社 ネガ型レジストパターン形成方法及びフォトレジスト組成物
US8849667B2 (en) 2012-07-31 2014-09-30 Novospeech Ltd. Method and apparatus for speech recognition
US9576574B2 (en) * 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
CN104769668B (zh) 2012-10-04 2018-10-30 纽昂斯通讯公司 改进的用于asr的混合控制器
US10304465B2 (en) * 2012-10-30 2019-05-28 Google Technology Holdings LLC Voice control user interface for low power mode
EP2941769B1 (en) * 2013-01-04 2019-05-08 Kopin Corporation Bifurcated speech recognition
EP2784774A1 (en) 2013-03-29 2014-10-01 Orange Telephone voice personnal assistant
CN103280217B (zh) * 2013-05-02 2016-05-04 锤子科技(北京)有限公司 一种移动终端的语音识别方法及其装置
US9786296B2 (en) 2013-07-08 2017-10-10 Qualcomm Incorporated Method and apparatus for assigning keyword model to voice operated function
US20150039316A1 (en) * 2013-07-31 2015-02-05 GM Global Technology Operations LLC Systems and methods for managing dialog context in speech systems
US9548047B2 (en) * 2013-07-31 2017-01-17 Google Technology Holdings LLC Method and apparatus for evaluating trigger phrase enrollment
US10223445B2 (en) * 2013-09-19 2019-03-05 Maluuba Inc. Hybrid natural language processor
US9443522B2 (en) * 2013-11-18 2016-09-13 Beijing Lenovo Software Ltd. Voice recognition method, voice controlling method, information processing method, and electronic apparatus
US9373321B2 (en) * 2013-12-02 2016-06-21 Cypress Semiconductor Corporation Generation of wake-up words
US8719039B1 (en) * 2013-12-05 2014-05-06 Google Inc. Promoting voice actions to hotwords
CN103714815A (zh) 2013-12-09 2014-04-09 何永 语音控制方法及其设备
US8938394B1 (en) * 2014-01-09 2015-01-20 Google Inc. Audio triggers based on context
CN103956168A (zh) 2014-03-29 2014-07-30 深圳创维数字技术股份有限公司 一种语音识别方法、装置及终端
EP2930716B1 (en) 2014-04-07 2018-10-31 Samsung Electronics Co., Ltd Speech recognition using electronic device and server
US9953632B2 (en) * 2014-04-17 2018-04-24 Qualcomm Incorporated Keyword model generation for detecting user-defined keyword
US9620999B2 (en) * 2014-04-22 2017-04-11 Baldor Electric Company High conductivity rotor cage for line start permanent magnet motor
US20160055847A1 (en) * 2014-08-19 2016-02-25 Nuance Communications, Inc. System and method for speech validation
CN104183237B (zh) 2014-09-04 2017-10-31 百度在线网络技术(北京)有限公司 用于便携式终端的语音处理方法及装置
US10127911B2 (en) * 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9812126B2 (en) * 2014-11-28 2017-11-07 Microsoft Technology Licensing, Llc Device arbitration for listening devices
US9911415B2 (en) * 2014-12-19 2018-03-06 Lenovo (Singapore) Pte. Ltd. Executing a voice command during voice input
CN204440902U (zh) 2014-12-22 2015-07-01 南京声准科技有限公司 终端智能语音测试系统
EP3067884B1 (en) * 2015-03-13 2019-05-08 Samsung Electronics Co., Ltd. Speech recognition system and speech recognition method thereof
EP3279790B1 (en) * 2015-03-31 2020-11-11 Sony Corporation Information processing device, control method, and program
US20190189019A1 (en) * 2015-06-08 2019-06-20 Novel Effect, Inc. System and Method for Integrating Special Effects with a Text Source
WO2017054158A1 (zh) * 2015-09-30 2017-04-06 华为技术有限公司 一种语音控制的处理方法和装置
CN106814639A (zh) * 2015-11-27 2017-06-09 富泰华工业(深圳)有限公司 语音控制系统及方法
CN105895103B (zh) 2015-12-03 2020-01-17 乐融致新电子科技(天津)有限公司 一种语音识别方法及装置
US9940929B2 (en) * 2015-12-09 2018-04-10 Lenovo (Singapore) Pte. Ltd. Extending the period of voice recognition
CN105931644B (zh) 2016-04-15 2019-10-25 Oppo广东移动通信有限公司 一种语音识别方法及移动终端
CN105869637B (zh) * 2016-05-26 2019-10-15 百度在线网络技术(北京)有限公司 语音唤醒方法和装置
US10217453B2 (en) * 2016-10-14 2019-02-26 Soundhound, Inc. Virtual assistant configured by selection of wake-up phrase
CN106448664A (zh) 2016-10-28 2017-02-22 魏朝正 一种通过语音控制智能家居设备的系统及方法
CN106611597B (zh) 2016-12-02 2019-11-08 百度在线网络技术(北京)有限公司 基于人工智能的语音唤醒方法和装置
US10057125B1 (en) * 2017-04-17 2018-08-21 Essential Products, Inc. Voice-enabled home setup
US20180336275A1 (en) * 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
CN110349572B (zh) 2017-05-27 2021-10-22 腾讯科技(深圳)有限公司 一种语音关键词识别方法、装置、终端及服务器
CN107564517A (zh) 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 语音唤醒方法、设备及系统、云端服务器与可读介质
CN107358954A (zh) 2017-08-29 2017-11-17 成都启英泰伦科技有限公司 一种实时更换唤醒词的设备及方法
CN107704275B (zh) 2017-09-04 2021-07-23 百度在线网络技术(北京)有限公司 智能设备唤醒方法、装置、服务器及智能设备
CN107610702B (zh) 2017-09-22 2021-01-29 百度在线网络技术(北京)有限公司 终端设备待机唤醒方法、装置及计算机设备
CN107622770B (zh) 2017-09-30 2021-03-16 百度在线网络技术(北京)有限公司 语音唤醒方法及装置

Also Published As

Publication number Publication date
EP3486901A1 (en) 2019-05-22
KR102096156B1 (ko) 2020-04-06
KR20190005104A (ko) 2019-01-15
EP3486901B1 (en) 2023-06-14
EP3447763A1 (en) 2019-02-27
JP2019015952A (ja) 2019-01-31
US10964317B2 (en) 2021-03-30
CN107564517A (zh) 2018-01-09
US20190013021A1 (en) 2019-01-10

Similar Documents

Publication Publication Date Title
JP6728540B2 (ja) ウェイクアップ方法、デバイス及びシステム、クラウドサーバーと可読媒体
US11955124B2 (en) Electronic device for processing user speech and operating method therefor
AU2019246868B2 (en) Method and system for voice activation
EP3389044B1 (en) Management layer for multiple intelligent personal assistant services
KR102523982B1 (ko) 자동화된 어시스턴트를 호출하기 위한 다이내믹 및/또는 컨텍스트-특정 핫 워드
EP3078021B1 (en) Initiating actions based on partial hotwords
WO2018126935A1 (zh) 基于语音的交互方法、装置、电子设备及操作系统
CN111357048A (zh) 用于控制家庭助手装置的方法和系统
US20160293157A1 (en) Contextual Voice Action History
CN107886944B (zh) 一种语音识别方法、装置、设备及存储介质
WO2018125292A1 (en) Contextual hotwords
US20150127345A1 (en) Name Based Initiation of Speech Recognition
JP2023015054A (ja) 自動化アシスタントを呼び出すための動的および/またはコンテキスト固有のホットワード
GB2524882A (en) Disambiguation of dynamic commands
CN112201246A (zh) 基于语音的智能控制方法、装置、电子设备及存储介质
JP7453443B2 (ja) ホットワード認識および受動的支援
JP2022533308A (ja) 複数の音声アシスタント向けの起動管理
CN111862943A (zh) 语音识别方法和装置、电子设备和存储介质
JP2023553995A (ja) 単一の発話におけるデバイスまたはアシスタント固有ホットワードの組合せ
CN113611316A (zh) 人机交互方法、装置、设备以及存储介质
US20180350360A1 (en) Provide non-obtrusive output
US20200051555A1 (en) Electronic apparatus for processing user utterance and controlling method thereof
US20200310523A1 (en) User Request Detection and Execution
CN113096651A (zh) 语音信号处理方法、装置、可读存储介质及电子设备
US11132173B1 (en) Network scheduling of stimulus-based actions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190408

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200609

R150 Certificate of patent or registration of utility model

Ref document number: 6728540

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250