JP2020008854A

JP2020008854A - 音声要求を処理するための方法および装置

Info

Publication number: JP2020008854A
Application number: JP2019122910A
Authority: JP
Inventors: シーチェン・イエ; Shiquan Ye; ジュエ・ファン; Jue Huang; ホン・スー; Hong Su; シン・ルオ; Xing Luo; シャジュン・ルオ; Xiajun Luo; ディー・ペン; Di Peng
Original assignee: Baidu Online Network Technology Beijing Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd
Priority date: 2018-07-03
Filing date: 2019-07-01
Publication date: 2020-01-16
Anticipated expiration: 2039-07-01
Also published as: CN109036417A; JP6867441B2; CN109036417B; US20200012675A1

Abstract

【課題】音声サービスコンテンツのカバレッジを拡張して、音声サービスの効率を向上させることができる方法および装置方法を提供する。【解決手段】音声要求を処理するため方法は、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、マルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索することと、インテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレス及び対象マルチメディアリソースを再生する命令を送信することとを含む。【選択図】図２

Description

本願は、コンピュータ技術分野に関し、具体的には音声技術分野に関し、特に音声要求を処理するための方法及び装置に関する。

インテリジェント音声サービスは、音声認識や音声合成などの技術に基づく音声サービス技術である。人工知能技術の発展に伴い、インテリジェント音声サービスは様々なシーンにますます広く応用されている。

インテリジェント音声サービス技術において、一般的にそのバックグラウンドサーバによりメンテナンスされるリソースプールへのアクセスをサポートすることができ、例えばインテリジェントスピーカボックスによる音声サーバの音楽リソースプールにおける音楽の再生をサポートすることができる。ところで、音声サーバのリソースプールにおけるリソース数が限られるため、音声サーバはユーザのニーズに合致するリソースを提供することが困難である可能性がある。

本願の実施例には、音声要求を処理するための方法および装置が提案されている。

第１の態様では、本願の実施例は、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、マルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索することと、インテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレスと対象マルチメディアリソースを再生する命令とを送信することとを含む音声要求を処理するための方法を提供する。

いくつかの実施例において、上記マルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索することは、ウェブページを介して前記マルチメディアリソースプール以外のリソースプール内で前記対象マルチメディアリソースを検索することを含み、上記インテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレス及び対象マルチメディアリソースを再生する命令を送信することは、インテリジェント音声デバイスに、検索された対象マルチメディアリソースのリンクアドレスと、ウェブページを介して前記対象マルチメディアリソースを再生する命令とを送信することを含む。

いくつかの実施例において、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、マルチメディアリソースプール以外のリソースプール内で前記対象マルチメディアリソースを検索する前に、上記方法は、取得された音声要求の意図を解析して、音声要求で再生が要求される対象マルチメディアリソースを決定することをさらに含む。

いくつかの実施例において、上記方法は、インテリジェント音声デバイスから送信された、ウェブページで対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答して、対象マルチメディアリソースと類似するマルチメディアリソースを検索することと、インテリジェント音声デバイスに対象マルチメディアリソースと類似するマルチメディアリソースを再生する命令を送信することとをさらに含む。

いくつかの実施例において、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、ウェブページで対象マルチメディアリソースを検索した後に、上記方法は、予め設定された再生方式のパラメータ値を、再生方式がウェブページ再生であることを示すためのパラメータ値に設定することをさらに含み、インテリジェント音声デバイスから送信された、ウェブページで対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答して、対象マルチメディアリソースと類似するマルチメディアリソースを検索することは、インテリジェント音声デバイスから送信された、ウェブページで対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答して、再生方式のパラメータ値を、再生方式が非ウェブページ再生であることを示すためのパラメータ値に設定することと、再生方式のパラメータ値により現在の再生方式が非ウェブページ再生であることが指示されると判定したことに応答して、予め設定されたマルチメディアリソースプール内で対象マルチメディアリソースと類似するマルチメディアリソースを検索することを含む。

いくつかの実施例において、上記方法は、対象マルチメディアリソースの再生状態を変更するための音声要求を受信したことに応答して、インテリジェント音声デバイスにウェブページで対象マルチメディアリソースの再生状態を変更する命令を送信することを更に含む。

第２の態様では、本願の実施例は、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、マルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索するように構成される検索手段と、インテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレス及び対象マルチメディアリソースを再生する命令を送信するように構成される送信手段と、を備える音声要求を処理するための装置を提供する。

いくつかの実施例において、上記検索手段は、さらに、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、ウェブページを介してマルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索するように構成され、上記送信手段は、さらに、インテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレス及びウェブページを介して対象マルチメディアリソースを再生する命令を送信するように構成される。

いくつかの実施例において、上記装置は、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、マルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索する前に、取得された音声要求の意図を解析して、音声要求で再生が要求される対象マルチメディアリソースを決定するように構成される解析手段をさらに備える。

いくつかの実施例において、上記装置は、インテリジェント音声デバイスから送信された、ウェブページで対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答して、対象マルチメディアリソースと類似するマルチメディアリソースを検索することと、インテリジェント音声デバイスに対象マルチメディアリソースと類似するマルチメディアリソースを再生する命令を送信するように構成される推薦手段をさらに備える。

いくつかの実施例において、上記装置は、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、ウェブページで対象マルチメディアリソースを検索した後に、予め設定された再生方式のパラメータ値を、再生方式がウェブページ再生であることを示すためのパラメータ値に設定するように構成される設定手段をさらに備え、上記推薦手段は、インテリジェント音声デバイスから送信された、ウェブページで対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答して、再生方式のパラメータ値を、再生方式が非ウェブページ再生であることを示すためのパラメータ値に設定して、再生方式のパラメータ値により現在の再生方式が非ウェブページ再生であることが指示されると判定したことに応答して、予め設定されたマルチメディアリソースプール内で対象マルチメディアリソースと類似するマルチメディアリソースを検索するように構成される。

いくつかの実施例において、上記装置は、対象マルチメディアリソースの再生状態を変更するための音声要求を受信したことに応答して、インテリジェント音声デバイスにウェブページで対象マルチメディアリソースの再生状態を変更する命令を送信することように構成される変更手段を更に備える。

第３の態様では、本願の実施例は、１つまたは複数のプロセッサと、１つまたは複数のプログラムを記憶する記憶装置と、を備える電子デバイスであって、１つまたは複数のプログラムを１つまたは複数のプロセッサに実行させることにより、音声要求を処理するための方法を１つまたは複数のプロセッサに実現させる電子デバイスを提供する。

第４の態様では、本願の実施例は、コンピュータプログラムが記憶されているコンピュータ可読媒体であって、コンピュータプログラムが実行される場合、第１態様で提供される音声要求を処理するための方法を実現させる。

本願の上記実施例にかかる音声要求を処理するための方法及び装置は、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、ウェブページ内で対象マルチメディアリソースを検索して、インテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレス及びウェブページを介して対象マルチメディアリソースを再生する命令を送信することにより、音声サービスコンテンツのカバレッジを拡張して、音声サービスの効率を向上させることができる。

本願の他の特徴、目的および利点は、以下の図面を参照して説明される非限定的な実施例を読むことによって、より明らかになる。
本願の実施例を適用可能なシステム構成の一例を示す図である。本願の音声要求を処理するための方法による１つの実施例を示すフローチャートである。本願の音声要求を処理するための方法による別の実施例を示すフローチャートである。本願の音声要求を処理するための方法による更なる別の実施例を示すフローチャートである。本願の音声要求を処理するための装置の構成概略図である。本願の実施例の電子デバイスを実現するのに適したコンピュータシステムの構成概略図である。

以下、図面及び実施例を参照しながら本願をさらに詳細に説明する。本明細書に記載された具体的な実施例は、単に本発明を説明するためのものであり、本発明を限定するものではないことが理解されるべきである。なお、説明の便宜上、図面には、かかる発明に関連する部分のみが示されている。

なお、矛盾しない場合に、本願における実施例及び実施例における特徴は互いに組み合わせることができる。以下、図面及び実施例を参照しながら本願を詳細に説明する。

図１は、本願の音声要求を処理するための方法または音声要求を処理するための装置を適用することができる例示的なシステム構成１００を示す。

図１に示すように、システム構成１００は、インテリジェント音声デバイス１０１、１０２、１０３と、ネットワーク１０４と、サーバ１０５とを含むことができる。ネットワーク１０４は、インテリジェント音声デバイス１０１、１０２、１０３とサーバ１０５との間で通信リンクの媒体を提供するために使用される。ネットワーク１０４は、例えば、有線や無線通信リンク、または光ファイバケーブルなどの様々な接続タイプを含むことができる。

ユーザ１１０は、インテリジェント音声デバイス１０１、１０２、１０３を使用して、ネットワーク１０４を介してサーバ１０５と対話して、メッセージなどを送受信することができる。インテリジェント音声デバイス１０１、１０２、１０３は、マイクロフォンおよびスピーカを有し、ユーザおよびサーバ１０５との直接対話をサポートする様々な電子デバイスとすることができ、例えば、インテリジェントロボット、スマートスピーカボックス、スマートテレビ、スマート冷蔵庫などである。インテリジェント音声デバイス１０１、１０２、１０３は、さらに表示パネルを有することができる。

サーバ１０５は、音声サービスを提供する音声サーバであってもよく、音声サーバ１０５は、インテリジェント音声デバイス１０１、１０２、１０３から発行された音声要求を解析して、解析結果に基づいてデータを検索して音声応答情報を生成することができるとともに、音声応答情報をネットワーク１０４を介してインテリジェント音声デバイス１０１、１０２、１０３にフィードバックすることができる。

なお、本願の実施例が提供する音声要求を処理するための方法は、サーバ１０５によって実行されてもよく、それに応じて、音声要求を処理するための装置は、サーバ１０５に設置されてもよい。

なお、サーバは、ハードウェアであってもよいし、ソフトウェアであってもよい。サーバはハードウェアである場合、複数のサーバから構成される分散型サーバクラスタとして実現されてもよく、単一のサーバとして実現されてもよい。サーバはソフトウェアである場合、複数のソフトウェアまたはソフトウェアモジュール（例えば分散型サービスを提供するために使用される複数のソフトウェアモジュール）として実現されてもよく、単一のソフトウェアまたはソフトウェアモジュールとして実現されてもよい。ここでは具体的に限定されるものではない。

図１の端末デバイス、ネットワークおよびサーバの数は、単に例示的なものであることが理解されるべきである。必要に応じて、任意の数の端末デバイス、ネットワークおよびサーバを有することができる。

次に、図２を参照すると、本願の音声要求を処理するための方法による１つの実施例のフロー２００が示されている。この音声要求を処理するための方法は、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、マルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索するステップ２０１を含む。

本実施例において、音声要求を処理するための方法の実行主体（例えば図１に示すサーバ）は、音声要求を受信して、音声要求において再生が要求される対象マルチメディアリソースを示すための関連情報を抽出することができ、例えば対象マルチメディアリソースのリソース識別子、タイプ識別子、作者識別子などの情報を抽出して、その後抽出された関連情報に基づいて予め設定されたマルチメディアリソースプール内で対象マルチメディアリソースを検索することができる。ここで、予め設定されたマルチメディアリソースプールは、上記実行主体によりメンテナンスされるマルチメディアリソースプールであってもよく、複数種類のデータフォーマットのマルチメディアリソースプールを含むことができ、例えば画像リソースプールやビデオリソースプール、オーディオリソースプールなどを含む。

前記実行主体は、抽出された音声要求において再生が要求される対象マルチメディアリソースを示すための関連情報に基づいて、予め設定されたマルチメディアリソースプール内で対象マルチメディアリソースが存在するかどうかを検索することができる。具体的には、対象マルチメディアリソースの関連情報と予め設定されたマルチメディアリソースプールにおける予め設定された各マルチメディアリソースの関連情報とをマッチングして、マッチングされた、予め設定されたマルチメディアリソースを対象マルチメディアリソースの検索結果とすることができる。予め設定されたマルチメディアリソースプールにおいて、関連情報と音声要求で抽出された再生が要求される対象マルチメディアリソースの関連情報とがマッチングしたマルチメディアリソースを検索しなかった場合、予め設定されたマルチメディアリソースプール内に対象マルチメディアリソースが存在しないと判定することができる。

予め設定されたマルチメディアリソースプール内に対象マルチメディアリソースが存在しないと判定された場合、上記予め設定されたマルチメディアリソースプール以外の他のリソースプール内で対象マルチメディアリソースを検索することができる。ここで、予め設定されたマルチメディアリソースプール以外の他のリソースプールは、マルチメディア再生プラットフォームのサーバによりメンテナンスされるマルチメディアリソースプールであってもよく、例えば種々のビデオ再生ソフトウェア又は種々の音楽再生ソフトウェアよりメンテナンスされるマルチメディアリソースプールである。

いくつかの実施例において、上記マルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索するステップは、ウェブページを介してマルチメディアリソースプール以外のリソースプール内で前記対象マルチメディアリソースを検索することを含むことができる。上記実行主体は、ウェブページブラウザを介してウェブページ内で対象マルチメディアリソースを検索することができる。具体的には、音声要求から抽出された対象マルチメディアリソースの関連情報に基づいて検索条件を生成して、ウェブページ内で検索を開始し、検索エンジンを利用してこの関連情報を満たすマルチメディアリソースを検索することができる。ウェブページ内で検索された、音声要求から抽出された対象マルチメディアリソースを示す関連情報を満たすマルチメディアリソースを検索された対象マルチメディアリソースとすることができる。

実際のシーンにおいて、ユーザはインテリジェント音声デバイス（例えばスマートスピーカボックス）にマルチメディアリソースを再生する要求を送信することができ、例えばユーザが「中国語ロック調な楽曲を再生する」又は「タイタニックのテーマ曲を聞きたい」という要求を送信することができる。スマートスピーカボックスはこの要求を音声サーバに転送することができ、音声サーバは再生が要求される音楽トラックのジャンル情報を示す「中国語ロック」又は所属のアルバムの名称情報である「タイタニック」を抽出して、その後音声サーバのミュージックライブラリ内で対応する音楽トラックが存在するか否かを検索することができる。音声サーバのミュージックライブラリ内で対応する音楽トラックが検索されなかった場合には、ウェブページで「中国語ロック調な楽曲」又は「タイタニックのテーマ曲」を検索することにより対応する音楽トラックを検索することができる。

本実施例のいくつかの選択可能な実施形態において、ステップ２０１の前に、上記音声要求を処理するための方法は、取得された音声要求の意図を解析して、音声要求で再生が要求される対象マルチメディアリソースを決定することを更に含むことができる。具体的には、インテリジェント音声デバイスを介してユーザが発行した音声要求を取得して、音声認識技術を利用して音声要求を対応するテキストに変換することができる。そして、音声要求に対応するテキストに対して、自然言語処理技術を利用して言語解析を行い、例えばキーワード辞書に基づくキーワード抽出方法でキーワードを抽出して、キーワードに対応する意味を検索することにより、又は音声要求に対応するテキストを訓練された言語解析機械学習モデルに入力して、言語解析結果を取得することにより、音声要求を発行するユーザの意図を取得することができる。選択的に、マルチメディアリソースの属性情報を含むマルチメディアリソース属性情報ベースに基づいて音声要求に対応するテキストとマッチングを行い、マルチメディアリソース属性情報とマッチングしたキーワードを抽出するとともに、音声要求に対応するテキストにおけるキーワードとマッチングしたマルチメディアリソース属性情報に対応するマルチメディアリソースを対象マルチメディアリソースとすることができる。ここで、マルチメディアリソース属性情報ベースは、大量のマルチメディアリソースの属性情報の統計に基づいて取得することができ、複数の作成者の名称、複数のアルバムの名称、複数種類のジャンルタイプラベル、複数の再生人気値などを含むことができる。

上記音声要求を処理するための方法は、インテリジェント音声デバイスに、検索された対象マルチメディアリソースのリンクアドレスと、対象マルチメディアリソースを再生する命令とを送信するステップ２０２を含む。

ウェブページ内で対象マルチメディアリソースを検索した後に、対象マルチメディアリソースのリンクアドレスを上記実行主体に音声要求を送信するインテリジェント音声デバイスに送信すると同時に、上記実行主体はインテリジェント音声デバイスに対象マルチメディアリソースを再生する命令を送信することができる。対象マルチメディアリソースを再生する命令に再生操作をトリガーする命令が含まれてもよく、この命令が実行された時に、受信された対象マルチメディアリソースのリンクアドレスを呼び出す。

いくつかの実施例において、ステップ２０１におけるマルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索するステップが実行される際に、ウェブページを介してマルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索する方式が採用されると、ステップ２０２において、インテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレスと、ウェブページを介して対象マルチメディアリソースを再生する命令と、を送信することができる。

上記ウェブページを介して対象マルチメディアを再生する命令は、対象マルチメディアを再生するＪａｖａＳｃｒｉｐｔ（登録商標）命令を含むことができる。インテリジェント音声デバイスは、この対象マルチメディアを再生するＪａｖａＳｃｒｉｐｔ命令を受信した後にこのコマンドを解析し、ウェブページブラウザを起動して、上記実行主体が送信したＪａｖａＳｃｒｉｐｔ命令コードを注入し、「＜ａｕｄｉｏ＞」タグにより対象マルチメディアコンテンツのリンクアドレスをロードして、即ち「＜ａｕｄｉｏ＞」タグに対象マルチメディアコンテンツのＵＲＬ（ＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＬｏｃａｔｏｒ）をロードすることにより、対象マルチメディアのコンテンツを再生することができる。

本実施例のいくつかの選択可能な実施形態において、上記インテリジェント音声デバイスは、ウェブページマルチメディアリソース再生を実現するためのモジュールを予め配置することができ、このモジュールにウェブページマルチメディアリソース再生を実現するためのロジックコードが含まれる。インテリジェント音声デバイスは、ウェブページを介して対象マルチメディアリソースを再生する命令を受信すると、ウェブページマルチメディアリソース再生を実現するためのモジュールにおける対応するロジックコードを実行することにより、インテリジェント音声デバイス側でウェブページマルチメディアリソースを再生することを実現することができる。

本実施例の別の選択可能な実施形態において、上記実行主体がインテリジェント音声デバイスに送信するウェブページを介して対象マルチメディアリソースを再生する命令は、ＨＴＭＬ５（ＨｙｐｅｒＴｅｘｔＭａｒｋｕｐＬａｎｇｕａｇｅ）ウェブページ再生を制御するロジックを実現するためのＪａｖａＳｃｒｉｐｔコードを含むことができる。インテリジェント音声デバイスは、ウェブページを介して対象マルチメディアリソースを再生する命令を受信すると、ＨＴＭＬ５ページを開いて、受信したＨＴＭＬ５ページ再生を制御するロジックを実現するためのＪａｖａＳｃｒｉｐｔコードを注入することにより、ＨＴＭＬ５ページにおける「＜ａｕｄｉｏ＞」タグを制御して、マルチメディアリソースの再生を実現することができる。

本願の上記実施例にかかる音声要求を処理するための方法は、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、マルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索して、インテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレス及び対象マルチメディアリソースを再生する命令を送信することにより、音声サービスコンテンツのカバレッジを拡張して、音声サービスの効率を向上させることができる。

そして、上記実施例のいくつかの選択可能な実現形態において、ウェブページ内で対象マルチメディアのリンクを検索することにより、インテリジェント音声デバイスにウェブページを介して対象マルチメディアリソースを再生する命令を送信することにより、音声によるウェブページマルチメディアリソースの再生制御を実現することができ、音声サービスにおけるリッチメディアのリソースアクセスを実現する。ウェブページマルチメディアリソースを利用して音声サービスコンテンツのカバレッジと音声サービスの方式を有効に拡張することができ、ひいては音声サービスの効率を向上させることができる。

本実施例のいくつかの選択可能な実施形態において、さらに検索された対象マルチメディアリソースの属性情報に基づいて音声応答情報を生成することができる。マルチメディアリソースの属性情報は、マルチメディアリソースの作成者やマルチメディアリソースアルバムの名称、マルチメディアリソースの発行者などを含むことができる。予め設定された音声テンプレートに基づいて、マルチメディア属性情報を音声テンプレートにおける対応するスロットに追加して、音声合成により対応する音声応答情報に変換することができる。例えば、ユーザの音声要求が「タイタニックのテーマ曲を聞きたい」である場合には、「「ＸＸ音楽」で「タイタニックのテーマ曲」を検索しました。再生させていただきます」という音声応答情報を生成することができる。ここで、「ＸＸ音楽」及び「タイタニックのテーマ曲」は、音声テンプレートにおける対応するスロットに追加されたコンテンツである。

次に、図３を参照すると、本願の音声要求を処理するための方法による別の実施例のフローチャートが示されている。図３に示すように、本実施例の音声要求を処理するための方法のフロー３００は、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、ウェブページ内で対象マルチメディアリソースを検索するステップ３０１を含む。

本実施例において、音声要求を処理するための方法の実行主体（例えば図１に示すサーバ）は、音声要求を受信して、音声要求において再生が要求される対象マルチメディアリソースを示すための関連情報を抽出して、この関連情報を検索条件として、予め設定されたマルチメディアリソースプール内で対象マルチメディアリソースが存在するか否かを検索する。ここで、予め設定されたマルチメディアリソースプールは、上記実行主体によりメンテナンスされるマルチメディアリソースプールであってもよい。予め設定されたマルチメディアリソースプール内で対象マルチメディアリソースを検索しないと、ウェブページを開いて、音声要求において再生が要求される対象マルチメディアリソースを示すための関連情報を検索条件として、ウェブページを介して対象マルチメディアリソースを検索することができる。

本実施例のいくつかの選択可能な実施形態において、ステップ３０１の前に、取得された音声要求の意図を解析して、音声要求で再生が要求される対象マルチメディアリソースを決定することができる。具体的には、インテリジェント音声デバイスから送信された音声要求を取得した後に、音声認識技術を利用して音声をテキストに変換し、その後テキストに対してキーワード又は意図識別モデルに基づく意図識別を行い、音声要求により再生が請求される対象マルチメディアリソースの識別子、ジャンルタイプ、作成者などの関連情報を決定することができる。

上記音声要求を処理するための方法は、インテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレス及びウェブページを介して対象マルチメディアリソースを再生する命令を送信するステップ３０２を含む。

ウェブページ内で対象マルチメディアリソースを検索した後に、対象マルチメディアリソースのリンクアドレスを上記実行主体に音声要求を送信するインテリジェント音声デバイスに送信すると同時に、上記実行主体はインテリジェント音声デバイスにウェブページを介して対象マルチメディアリソースを再生する命令を送信することができる。このウェブページを介して対象マルチメディアを再生する命令は、対象マルチメディアを再生するＪａｖａＳｃｒｉｐｔ命令を含むことができる。インテリジェント音声デバイスは、この対象マルチメディアを再生するＪａｖａＳｃｒｉｐｔ命令を受信した後にこの命令を解析し、ウェブページブラウザを起動して、上記実行主体が送信したＪａｖａＳｃｒｉｐｔ命令コードを注入し、「＜ａｕｄｉｏ＞」タグにより対象マルチメディアコンテンツのリンクアドレスをロードすることにより、対象マルチメディアのコンテンツを再生することができる。

本実施例におけるステップ３０１、ステップ３０２は、それぞれ前記実施例のステップ２０１、ステップ２０２と一致し、ステップ３０１、ステップ３０２の具体的な実施形態は、前記ステップ２０１、ステップ２０２の関連説明を参照することができる。

上記音声要求を処理するための方法は、インテリジェント音声デバイスから送信された、ウェブページで対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答して、対象マルチメディアリソースと類似するマルチメディアリソースを検索するステップ３０３を含む。

本実施例において、インテリジェント音声デバイスはウェブページを介して検索された対象マルチメディアリソースを再生した後に、上記実行主体に再生完了の通知メッセージを報知することができる。上記実行主体は、インテリジェント音声デバイスから報知された、ウェブページ内で対象マルチメディアリソースの再生が完了した通知メッセージを受信した後に、対象マルチメディアのコンテンツと類似するコンテンツを検索することができる。

具体的には、マルチメディアリソースに、マルチメディアリソースの属性特徴を示すコンテンツタグが予め構成されることができ、コンテンツタグは、作成者タグ、ジャンルタグ以下を含むが、これらに限定されない。マルチメディアリソースの集合名称タグ、作成時間タグ、タイトルタグなどである。上記実行主体は、対象マルチメディアリソースと類似するマルチメディアリソースを検索する際に、対象マルチメディアリソースと同一又は類似のコンテンツタグを有するマルチメディアリソースを検索することができる。上記実行主体は、マルチメディアリソースのコンテンツの特徴を抽出して、マルチメディアリソースの特徴を取得した後、マルチメディアリソースの特徴同士の類似度に基づいて対象マルチメディアリソースと類似するマルチメディアリソースを検索することができる。

本実施例のいくつかの選択可能な実施形態において、上記実行主体は、インテリジェント音声デバイスが送信された、ウェブページ内で対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答して、予め設定されたマルチメディアリソースプール内で対象マルチメディアリソースと類似するマルチメディアリソースを検索することができる。本実施例の他の選択可能な実現形態において、上記実行主体は、インテリジェント音声デバイスから送信された、ウェブページ内で対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答し、ウェブページを介して対象マルチメディアリソースと類似するマルチメディアリソースを検索することができる。

本実施例のいくつかの選択可能な実施形態において、上記実行主体に予め設定された再生方式のパラメータが記憶されてもよい。予め設定された再生方式のパラメータは、現在の再生方式がウェブページ再生又は非ウェブページ再生であることを示すために用いられる。ステップ３０１の後に、音声要求を処理するための方法フロー３００は、予め設定された再生方式のパラメータ値を、再生方式がウェブページ再生であることを示すためのパラメータ値に設定することをさらに含むことができる。ステップ３０３において、上記実行主体はインテリジェント音声デバイスから送信された、ウェブページで対象マルチメディアリソースを再生する通知メッセージを受信したことに応答して、再生方式のパラメータ値を再生方式が非ウェブページ再生であることを示すためのパラメータ値に設定して、再生方式のパラメータ値により現在の再生方式が非ウェブページ再生であることが示されると決定したことに応答して、予め設定されたマルチメディアリソースプール内で対象マルチメディアリソースと類似するマルチメディアリソースを検索することができる。すなわち、対象マルチメディアリソースと類似するマルチメディアリソースを検索する前に、予め設定された再生方式のパラメータ値に基づいて再生方式のパラメータにより現在の再生方式が非ウェブページ再生であることが示されるかどうかを判断することができ、そうであれば、予め設定されたマルチメディアリソースプール内で類似するマルチメディアリソースの検索を行うことができる。

１つの例示的なシーンにおいて、インテリジェント音声デバイスがウェブページ再生を介した音楽の再生が終了した後、音声サーバに対して通知メッセージを送信して現在の音楽の再生が完了したことを通知することができる。この場合、音声サービスは、再生方式のパラメータにより現在の再生方式が非ウェブページ再生であることが示されるように、再生方式のパラメータ値を変更することができる。音声サーバは、自身がメンテナンスする音楽リソースプール内でウェブページを介して再生された音楽と類似する音楽を検索することができる。

上記音声要求を処理するための方法は、インテリジェント音声デバイスに対象マルチメディアリソースと類似するマルチメディアリソースを再生する命令を送信するステップ３０４を含む。

対象マルチメディアリソースと類似するマルチメディアリソースを検索した後、インテリジェント音声デバイスに対象マルチメディアリソースと類似するマルチメディアリソースを再生する命令を送信することができるとともに、検索された対象マルチメディアリソースと類似するマルチメディアリソースをインテリジェント音声デバイスに送信して、インテリジェント音声デバイスに再生させることができる。

本実施例のいくつかの選択可能な実施形態において、上記実行主体は、さらに、予め設定された音楽推薦音声テンプレートに基づいて、インテリジェント音声デバイスに対象マルチメディアリソースと類似するマルチメディアリソースを再生しようとすることをユーザに通知するための音声情報を送信することができる。例えば、上記実行主体は、インテリジェント音声デバイスに「以下の良好な音楽を推薦させていただきます」という音声情報を送信することができ、インテリジェント音声デバイスはこの音声情報を出力することができる。

図３から分かるように、本実施例においてウェブページでのマルチメディアリソースの再生が終了した後に、類似するマルチメディアリソースを検索して、インテリジェント音声デバイスに応答としての再生命令を送信することにより、ユーザに興味を持つ可能性があるマルチメディアリソースを推薦して、さらに音声サービスの効率を向上させる。

次に、図４を参照すると、本願の音声要求を処理するための方法による別の実施例のフローチャートが示されている。図４に示すように、本実施例の音声要求を処理するための方法のフロー４００は、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、ウェブページ内で対象マルチメディアリソースを検索するステップ４０１を含む。

本実施例のいくつかの選択可能な実施形態において、ステップ４０１の前に、取得された音声要求の意図を解析して、音声要求で再生が要求される対象マルチメディアリソースを決定することができる。具体的には、インテリジェント音声デバイスから送信された音声要求を取得した後に、音声認識技術を利用して音声をテキストに変換し、その後テキストに対してキーワード又は意図識別モデルに基づく意図識別を行い、音声要求により再生が請求される対象マルチメディアリソースの識別子、ジャンルタイプ、作成者などの関連情報を決定することができる。

上記音声要求を処理するための方法は、インテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレス及びウェブページを介して対象マルチメディアリソースを再生する命令を送信するステップ４０２を含む。

本実施例におけるステップ４０１、ステップ４０２は、それぞれ前記実施例のステップ２０１、ステップ２０２と一致し、ステップ４０１、ステップ４０２の具体的な実施形態は、前記ステップ２０１、ステップ２０２の関連説明を参照することができる。

上記音声要求を処理するための方法は、対象マルチメディアリソースの再生状態を変更するための音声要求を受信したことに応答して、インテリジェント音声デバイスにウェブページで対象マルチメディアリソースの再生状態を変更する命令を送信するステップ４０３を含む。

本実施例では、ウェブページを介した対象マルチメディアリソースの再生を制御することができる。具体的には、ウェブページを介して対象マルチメディアリソースを再生する際に、ユーザがインテリジェント音声デバイスを介して送信した再生状態を変更するための音声要求を受信し、その後、この要求に基づいてウェブページで対象マルチメディアリソースの再生状態を変更するための対応する命令を生成してインテリジェント音声デバイスに送信することができる。ここで、再生状態を変更するための音声要求は、現在の再生状態を他の再生状態に切り替えるための要求である。再生状態の変更には、再生の一時停止、再生の継続、再生の終了、次曲再生、前曲再生などを含むが、これに限定されない。

上記実行主体は、ウェブページを介して対象マルチメディアリソースを再生する過程において受信された音声要求を解析することにより、音声要求を送信したユーザが再生状態を変更する意図を有するかどうかを判断する。例えば、音声要求をテキストメッセージに変換した後に、自然言語処理技術により解析してユーザ意図を取得することができる。ユーザの意図が現在の再生状態に対する変更であると解析した場合に、ユーザの意図に基づいてウェブページで再生状態の変更操作を実行するための対応する命令を生成することができ、例えば再生状態を変更するためのＪａｖａＳｃｒｉｐｔ命令を生成してインテリジェント音声デバイスに送信する。インテリジェント音声デバイスは、ウェブページで受信された命令をロードすることにより、再生状態の変更操作を実行することができる。

選択的に、対象マルチメディアリソースの再生状態を変更する音声要求は、次曲再生が要求される音声要求であってもよく、この場合、上記実行主体は、ユーザの意図が次曲に切り替えて再生することと認識することができ、対象マルチメディアリソースと類似するマルチメディアリソースを検索して、インテリジェント音声デバイスにプッシュして再生されることができる。選択的に、上記実行主体は、さらに、予め設定された再生方式のパラメータ値を再生方式が非ウェブページ再生であることを示すパラメータ値に設定して、その後上記予め設定されたマルチメディアリソースプール内で対象マルチメディアリソースと類似するマルチメディアリソースを検索することができる。

選択的に、対象マルチメディアリソースの再生状態を変更する音声要求は、再生の一時停止／継続を要求する音声要求であってもよい。上記実行主体は、音声要求に基づいてユーザの意図が再生の一時停止又は再生の継続であると認識した場合、現在の再生状態がウェブページ再生状態であるか否かを検出して、そうであれば、インテリジェント音声デバイスにウェブページを介して対象マルチメディアリソースの再生を一時停止／継続するための命令を送信することができ、この命令は、例えばＪａｖａＳｃｒｉｐｔ命令であってもよく、インテリジェント音声デバイスがこのＪａｖａＳｃｒｉｐｔ命令を受信した後に、ウェブページでＪａｖａＳｃｒｉｐｔ命令にレンダリングを注入して、「＜ａｕｄｉｏ＞タグ」を制御することにより、再生の一時停止又は再生の継続の操作を実行することができる。

選択的に、対象マルチメディアリソースの再生状態を変更する音声要求は、マルチメディアリソースの再生を終了する音声要求であってもよい。上記実行主体は、音声要求に基づいてユーザの意図がマルチメディアリソースの再生を終了することであると識別した場合、現在の再生状態がウェブページ再生であるか否かを検出して、そうであれば、インテリジェント音声デバイスに終了命令を送信することができ、この終了命令は、インテリジェント音声デバイスが開いたウェブページを閉じるように示すことができる。インテリジェント音声デバイスは、終了命令を受信した後にウェブページを閉じてウェブページブラウザを終了することができる。

本実施例のいくつかの選択可能な実施形態において、インテリジェント音声デバイスによる対象マルチメディアリソースの再生が完了した後に、通知メッセージを報知することができ、そうすれば、上記実行主体は、インテリジェントデバイスから送信された、ウェブページ内で対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答して、予め設定されたマルチメディアリソースプール又はウェブページ内で対象マルチメディアと類似するマルチメディアリソースを検索して、インテリジェント音声デバイスに対象マルチメディアリソースと類似するマルチメディアリソースを再生する命令を送信することができる。

さらに、上記ステップ４０１の後に、上記実行主体は、さらに、予め設定された再生方式のパラメータ値を再生方式がウェブページ再生であることを示すためのパラメータ値に設定することができる。この場合、上記実行主体はインテリジェント音声デバイスから送信された、ウェブページで対象マルチメディアリソースを再生する通知メッセージを受信したことに応答して、再生方式のパラメータ値を再生方式が非ウェブページ再生であることを示すためのパラメータ値に設定して、再生方式のパラメータ値により現在の再生方式が非ウェブページ再生であることが示されると決定したことに応答して、予め設定されたマルチメディアリソースプール内で対象マルチメディアリソースと類似するマルチメディアリソースを検索することができる。即ち、対象マルチメディアリソースの再生が完了した通知メッセージを受信した後、上記実行本体は、再生方式のパラメータ値を再生方式が非ウェブページ再生であることを示すためのパラメータ値に設定することができ、この場合、上記予め設定されたマルチメディアリソースプール内で対象マルチメディアリソースと類似するマルチメディアリソースを検索して推薦再生を行うことができる。このように、予め設定されたマルチメディアリソースプールを利用してユーザが興味を持つマルチメディアリソースを迅速に提供することができ、音声サービスの効率を向上させることができる。

図４から分かるように、本実施例の音声要求を処理するための方法は、対象マルチメディアリソースの再生状態を変更する音声要求を受信すると、インテリジェント音声デバイスにウェブページで対象マルチメディアリソースの再生状態を変更する命令を送信することにより、音声要求に基づいてウェブページを介したマルチメディアリソースの再生を制御することを実現して、マルチメディアリソース再生の制御方式の柔軟性を向上させる。

更に図５を参照すると、上記各図に示される方法の実施として、本願は音声要求を処理するための装置の一実施例を提供して、この装置の実施例は図２、図３、図４に示される方法の実施例に対応して、この装置は具体的に様々な電子デバイスに適用されることができる。

図５に示すように、本実施例の音声要求を処理するための装置５００は、検索手段５０１及び送信手段５０２を含むことができる。ここで、検索手段５０１は、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、マルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索するように構成されることができ、送信手段５０２は、インテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレス及び対象マルチメディアリソースを再生する命令を送信するように構成されることができる。

いくつかの実施例において、検索手段５０１は、さらに、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、ウェブページを介して前記マルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索するように構成されることができ、送信手段５０２は、さらに、インテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレス及びウェブページを介して前記対象マルチメディアリソースを再生する命令を送信するように構成されることができる。

いくつかの実施例おいて、上記デバイス５００は、解析手段をさらに含むことができる。解析手段は、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、マルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索する前に、取得された音声要求の意図を解析して、音声要求で再生が要求される対象マルチメディアリソースを決定するように構成される。

いくつかの実施例おいて、上記装置５００は、推薦手段をさらに含むことができる。推薦手段は、インテリジェント音声デバイスから送信された、ウェブページで対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答して、対象マルチメディアリソースと類似するマルチメディアリソースを検索することと、インテリジェント音声デバイスに対象マルチメディアリソースと類似するマルチメディアリソースを再生する命令を送信するように構成される。

いくつかの実施例おいて、上記デバイス５００は、設定手段をさらに含むことができる。設定手段は、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、ウェブページで対象マルチメディアリソースを検索した後に、予め設定された再生モードのパラメータ値を再生方式がウェブページ再生であることを示すためのパラメータ値に設定するように構成される。この場合、上記推薦手段は、さらに、インテリジェント音声デバイスから送信された、ウェブページで対象マルチメディアリソースを再生する通知メッセージを受信したことに応答して、再生方式のパラメータ値を再生方式が非ウェブページ再生であることを示すためのパラメータ値に設定して、再生方式のパラメータ値により現在の再生方式が非ウェブページ再生であることが示されると決定したことに応答して、予め設定されたマルチメディアリソースプール内で対象マルチメディアリソースと類似するマルチメディアリソースを検索することができる。

いくつかの実施例おいて、上記デバイス５００は、変更手段をさらに含むことができる。変更手段は、対象マルチメディアリソースの再生状態を変更するための音声要求を受信したことに応答して、インテリジェント音声デバイスにウェブページで対象マルチメディアリソースの再生状態を変更する命令を送信するように構成される。

装置５００に記載された各手段は、図２、図３及び図４を参照して説明された方法の各ステップに対応することが理解されるべきである。したがって、方法について説明された操作および特徴は、同様に装置５００およびそれに含まれる手段に適用可能であるので、ここでは説明を省略する。

本願の上記実施例にかかる音声要求を処理するための装置５００は、検索手段により予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、マルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索して、送信手段によりインテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレス及び対象マルチメディアリソースを再生する命令を送信することにより、音声サービスのコンテンツのカバレッジを拡張して、音声サービスの効率を向上させる。

以下、図６を参照すると、本願の実施例の電子デバイスを実現するのに適したコンピュータシステム６００の構成概略図が示されている。図６に示す電子デバイスは一例であり、本願の実施例の機能及び使用範囲を限定するものではない。

図６に示すように、コンピュータシステム６００は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）６０２に格納されているプログラム、または記憶部６０８からＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）６０３にロードされたプログラムに従って各種の適切な動作および処理を実行するＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）６０１を備える。ＲＡＭ６０３には、システム６００が操作するために必要な各種プログラムやデータも格納されている。ＣＰＵ６０１、ＲＯＭ６０２及びＲＡＭ６０３は、バス６０４を介して相互に接続されている。また、バス６０４には、入出力（Ｉ／Ｏ）インタフェース６０５も接続されている。

Ｉ／Ｏインタフェース６０５には、キーボードやマウス、マイクロホンなどを含む入力部６０６と、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）や液晶ディスプレイ（ＬＣＤ）など及びスピーカなどを含む出力部６０７と、ハードディスクなどを含む記憶部６０８と、ＬＡＮカードやモデムなどのネットワークインタフェースカードを含む通信部６０９が接続されていることができる。通信部６０９は、インターネットのようなネットワークを介して通信処理を行う。ドライブ６１０も、必要に応じてＩ／Ｏインタフェース６０５に接続される。磁気ディスクや光ディスク、光磁気ディスク、半導体メモリなどのリムーバブルメディア６１１は、必要に応じてドライブ６１０にインストールされることにより、リムーバブルメディア６１１から読み出されたコンピュータプログラムが必要に応じて記憶部６０８にインストールされる。

特に、本開示の実施形態によれば、上記したフローチャートを参照して説明された手順がコンピュータソフトウェアプログラムとして実施されることができる。例えば、本開示の実施例は、フローチャートに示される方法を実行するためのプログラムコードを含むコンピュータ可読媒体に担持されたコンピュータプログラムを含むコンピュータプログラム製品を含む。そのような実施例では、コンピュータプログラムは、通信部６０９を介してネットワークからダウンロードしてインストールされ、および／またはリムーバブルメディア６１１からインストールされることができる。このコンピュータプログラムが中央処理ユニット（ＣＰＵ）６０１によって実行されると、本願の方法で限定された上記機能が実行される。なお、本願のコンピュータ可読媒体は、コンピュータ可読信号媒体やコンピュータ可読記憶媒体、又は上記両方の任意の組み合わせであってもよい。コンピュータ可読記憶媒体は、特に限定されないが、例えば、電気や磁気、光、電磁気、赤外線または半導体のシステム、装置またはデバイスであってもよく、またはこれらの任意の組み合わせであってもよい。コンピュータ可読記憶媒体のより具体的な例には、１つまたは複数のリードを有する電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、消去可能プログラマブルリードオンリーメモリ（ＥＰＲＯＭまたはフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ（ＣＤ−ＲＯＭ）、光記憶デバイス、磁気記憶デバイス、または上述の任意の適切な組合せが含まれるが、これらに限定されない。本願において、コンピュータ可読記憶媒体は、プログラムを含みかまたは格納する任意の有形媒体であってもよく、そのプログラムは、命令を実行するシステム、装置またはデバイスによって使用されてもよく、またはそれらとともに使用されてもよい。本願において、コンピュータ可読信号媒体は、ベースバンドでまたはキャリアの一部として伝搬される、コンピュータ読み取り可能なプログラムコードを担持するデータ信号を含むことができる。このように伝搬されるデータ信号は、電磁信号、光信号、または上述の任意の適切な組み合わせを含む様々な形態とすることができるが、これらに限定されない。コンピュータ可読信号媒体は、さらに、命令を実行するシステム、装置またはデバイスによって使用され、またはそれらとともに使用されるプログラムを送信、伝播または伝搬することが可能なコンピュータ可読記憶媒体以外の任意のコンピュータ可読媒体とすることができる。コンピュータ可読媒体に含まれるプログラムコードは、無線や電線、光ケーブル、ＲＦなど、またはそれらの任意の適切な組合せを含む任意の適切な媒体を介して伝送されることができるが、これらに限定されない。

本願の操作を実行するためのコンピュータプログラムコードは、Ｊａｖａ（登録商標）、Ｓｍａｌｌｔａｌｋ、Ｃ＋＋などのオブジェクト指向のプログラミング言語、並びに「Ｃ」言語または同様のプログラミング言語などの一般的な手続き型プログラミング言語を含む、１つまたは複数のプログラミング言語またはそれらの組合せにより記述されることができる。プログラムコードは、全部がパーソナルコンピュータ上で実行されてもよく、一部がパーソナルコンピュータ上で実行されてもよく、別個のソフトウェアパッケージとして実行されてもよく、一部がパーソナルコンピュータ上で実行され残りの一部がリモートコンピュータ上で実行されてもよく、または全部がリモートコンピュータまたはサーバ上で実行されてもよい。リモートコンピュータに関連する場合、リモートコンピュータは、ローカルエリアネットワーク（ＬＡＮ）またはワイドエリアネットワーク（ＷＡＮ）を含む任意の種類のネットワークを介してパーソナルコンピュータに接続されてもよく、または外部のコンピュータに接続されてもよい（例えば、インターネットサービスプロバイダによりインターネットを介して接続される）。

図面におけるフローチャートおよびブロック図は、本願の様々な実施例によるシステム、方法およびコンピュータプログラム製品の実施可能な構成、機能および操作を示す。この点に関して、フローチャートまたはブロック図の各ブロックは、所定の論理機能を実施するための１つまたは複数の実行可能な命令を含むモジュール、ブロックまたはコードの一部を示すことができる。なお、いくつかの置換例としての実施例では、ブロックに示す機能は、図面に示す順序とは異なる順序で実行されてもよい。例えば、接続して示される２つのブロックは、実際に、実質的に並行して実行されてもよく、かかる機能によっては、相互に逆の順序で実行されてもよい。なお、ブロック図および／またはフローチャートにおける各ブロック、ならびにブロック図および／またはフローチャートにおけるブロックの組合せは、所定の機能または操作を実行する専用のハードウェアによるシステムによって実施されてもよく、または専用ハードウェアとコンピュータ命令との組合せによって実施されてもよい。

本願の実施例にかかる手段は、ソフトウェアによって実現されてもよく、ハードウェアによって実現されてもよい。説明された手段は、プロセッサに配置されてもよく、例えば、プロセッサは検索手段と、送信手段とを含むようにとして記載されてもよい。ここで、これら手段の名称は、この手段自体を限定するように構成されない場合があり、例えば、取得手段は、さらに「予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、ウェブページ内で対象マルチメディアリソースを検索する手段」として説明されることができる。

別の態様として、本願は、上述の実施例で説明された装置に含まれてよく、または、この装置に組み込まれなく、別個に存在してもよいコンピュータ可読媒体をさらに提供する。上記コンピュータ可読媒体には、１つまたは複数のプログラムが担持され、上記１つまたは複数のプログラムが装置により実行される場合、この装置に上記実施例にかかる音声要求を処理するための方法を実行させ、具体的には、予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、マルチメディアリソースプール以外のリソースプール内で対象マルチメディアリソースを検索することと、インテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレス及び対象マルチメディアリソースを再生する命令を送信することを、この装置に実行させる。

以上の説明は、本出願の好適な実施例及び適用される技術原理の説明に過ぎない。当業者であれば、本願に係る発明の範囲は、上記技術的特徴の特定の組み合わせからなる技術的手段に限定されるものではなく、同時に上記発明の主旨から逸脱しない範囲で上記技術的特徴又はその等価な特徴によって任意に組み合わせて形成される他の技術的手段を含むことが理解されるべきである。例えば、上記特徴が本願に開示された（これに限定されない）同様な機能を有する技術的特徴と相互に置換されて形成される技術的手段である。

Claims

音声要求を処理するための方法であって、
予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、前記マルチメディアリソースプール以外のリソースプール内で前記対象マルチメディアリソースを検索することと、
インテリジェント音声デバイスに、検索された対象マルチメディアリソースのリンクアドレスと前記対象マルチメディアリソースを再生する命令とを送信することと、を含む方法。
前記マルチメディアリソースプール以外のリソースプール内で前記対象マルチメディアリソースを検索することは、
ウェブページを介して前記マルチメディアリソースプール以外のリソースプール内で前記対象マルチメディアリソースを検索することを含み、
前記インテリジェント音声デバイスに、検索された対象マルチメディアリソースのリンクアドレスと前記対象マルチメディアリソースを再生する命令を送信することは、
インテリジェント音声デバイスに、検索された対象マルチメディアリソースのリンクアドレスと、ウェブページを介して前記対象マルチメディアリソースを再生する命令とを送信することを含む、請求項１に記載の方法。
予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、前記マルチメディアリソースプール以外のリソースプール内で前記対象マルチメディアリソースを検索する前に、
取得された音声要求の意図を解析して、前記音声要求で再生が要求される対象マルチメディアリソースを決定することをさらに含む、請求項１に記載の方法。
前記インテリジェント音声デバイスから送信された、ウェブページで前記対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答して、前記対象マルチメディアリソースと類似するマルチメディアリソースを検索することと、
前記インテリジェント音声デバイスに前記対象マルチメディアリソースと類似するマルチメディアリソースを再生する命令を送信することとを含む、請求項２に記載の方法。
予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、ウェブページで前記対象マルチメディアリソースを検索した後に、
予め設定された再生方式のパラメータ値を、再生方式がウェブページ再生であることを示すためのパラメータ値に設定することをさらに含み、
前記インテリジェント音声デバイスから送信された、ウェブページで前記対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答して、前記対象マルチメディアリソースと類似するマルチメディアリソースを検索することとは、
前記インテリジェント音声デバイスから送信された、ウェブページで前記対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答して、前記再生方式のパラメータ値を、再生方式が非ウェブページ再生であることを示すためのパラメータ値に設定することと、
再生方式のパラメータ値により現在の再生方式が非ウェブページ再生であることが指示されると判定したことに応答して、前記予め設定されたマルチメディアリソースプール内で前記対象マルチメディアリソースと類似するマルチメディアリソースを検索することとを含む、請求項４に記載の方法。
前記対象マルチメディアリソースの再生状態を変更するための音声要求を受信したことに応答して、前記インテリジェント音声デバイスにウェブページで前記対象マルチメディアリソースの再生状態を変更する命令を送信することを更に含む、請求項２〜５のいずれか１項に記載の方法。
音声要求を処理するための装置であって、
予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、前記マルチメディアリソースプール以外のリソースプール内で前記対象マルチメディアリソースを検索するように構成される検索手段と、
インテリジェント音声デバイスに、検索された対象マルチメディアリソースのリンクアドレスと前記対象マルチメディアリソースを再生する命令とを送信するように構成される送信手段と、を備える装置。
前記検索手段は、
予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、ウェブページを介して前記マルチメディアリソースプール以外のリソースプール内で前記対象マルチメディアリソースを検索するように構成され、
前記送信手段は、さらに、
インテリジェント音声デバイスに検索された対象マルチメディアリソースのリンクアドレスと、ウェブページを介して前記対象マルチメディアリソースを再生する命令とを送信するように構成される、請求項７に記載の装置。
予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、前記マルチメディアリソースプール以外のリソースプール内で前記対象マルチメディアリソースを検索する前に、取得された音声要求の意図を解析して、前記音声要求で再生が要求される対象マルチメディアリソースを決定するように構成される解析手段をさらに備える、請求項７に記載の装置。
前記インテリジェント音声デバイスから送信された、ウェブページで前記対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答して、前記対象マルチメディアリソースと類似するマルチメディアリソースを検索して、
前記インテリジェント音声デバイスに前記対象マルチメディアリソースと類似するマルチメディアリソースを再生する命令を送信するように構成される、推薦手段をさらに備える請求項８に記載の装置。
予め設定されたマルチメディアリソースプール内に音声要求で再生が請求される対象マルチメディアリソースが存在しないと判定したことに応答して、ウェブページで前記対象マルチメディアリソースを検索した後に、予め設定された再生方式のパラメータ値を、再生方式がウェブページ再生であることを示すためのパラメータ値に設定するように構成される設定手段をさらに備え、
前記推薦手段は、さらに、
前記インテリジェント音声デバイスから送信された、ウェブページで前記対象マルチメディアリソースの再生が完了した通知メッセージを受信したことに応答して、前記再生方式のパラメータ値を、再生方式が非ウェブページ再生であることを示すためのパラメータ値に設定して、
再生方式のパラメータ値により現在の再生方式が非ウェブページ再生であることが指示されると判定したことに応答して、前記予め設定されたマルチメディアリソースプール内で前記対象マルチメディアリソースと類似するマルチメディアリソースを検索するように構成される、請求項１０に記載の装置。
前記対象マルチメディアリソースの再生状態を変更するための音声要求を受信したことに応答して、前記インテリジェント音声デバイスにウェブページで前記対象マルチメディアリソースの再生状態を変更する命令を送信するように構成される変更手段をさらに備える、請求項８〜１１のいずれか１項に記載の装置。
１つ又は複数のプロセッサと、
１つまたは複数のプログラムを記憶する記憶装置と、を備える電子デバイスであって、
前記１つまたは複数のプログラムを前記１つまたは複数のプロセッサに実行させることにより、請求項１〜６のいずれか１項に記載の方法を１つまたは複数のプロセッサに実現させる、電子デバイス。
コンピュータプログラムが記憶されているコンピュータ可読媒体であって、前記コンピュータプログラムが実行される場合、請求項１〜６のいずれか１項に記載の方法を実現させる、コンピュータ可読媒体。