JP2023504809A

JP2023504809A - 音声対話プラットフォームの機能ディスパッチ方法および装置

Info

Publication number: JP2023504809A
Application number: JP2022532075A
Authority: JP
Inventors: 成亜朱; 帥樊; ▲ウェイ▼斯石
Original assignee: AI Speech Ltd
Current assignee: AI Speech Ltd
Priority date: 2019-12-26
Filing date: 2020-11-18
Publication date: 2023-02-07
Anticipated expiration: 2040-11-18
Also published as: WO2021129240A1; CN111161717B; EP4083997A1; CN111161717A; EP4083997A4; US11862150B2; US20230044968A1; JP7293512B2

Abstract

【課題】機能ディスパッチの効率を向上させる。
【解決手段】中央制御ディスパッチサービスによってユーザ音声のセマンティック結果を受信するステップと、中央制御ディスパッチサービスによってセマンティック結果に関連する複数の機能サービスを並行してディスパッチし、複数の機能サービスからフィードバックされた解析結果を取得するステップと、機能サービスの優先度に基づいて複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出するステップと、ユーザにフィードバックするステップと、を含む音声対話プラットフォームの機能ディスパッチ方法を提供する。さらに、音声対話プラットフォームに用いられる機能ディスパッチ装置を提供する。
【選択図】図１

Description

本発明は、インテリジェント音声分野に関し、特に、音声対話プラットフォームの機能ディスパッチ方法および装置に関する。

音声製品には、複数の異なる機能（ナビゲーション、音楽、ラジオ等）が含まれ、ユーザが入力した音声に対するセマンティック分類と解析結果に基づいて、対応する機能が選択される。

セマンティック分類のディスパッチポリシーに基づいて、ある音声製品にはＱＱ（登録商標）音楽と網易（登録商標）雲音楽が含まれており、ＱＱ（登録商標）音楽機能にセマンティック分類された後、コンテンツが検索できない場合や著作権がない場合には、引き続き網易（登録商標）雲音楽機能においてディスパッチして、検索を完了させることができる。

本発明を実現する過程において、発明者は、関連技術において少なくとも以下の問題が存在することを発見した。
機能ディスパッチは、音声対話プラットフォームの中央制御ディスパッチサービスによって処理される。ユーザが検索したコンテンツが人気のないコンテンツであれば、一般的に使用される機能には対応するコンテンツがない。この時、中央制御ディスパッチサービスは、ユーザの今回の検索に対して複数回の機能を繰り返しディスパッチして、対応するコンテンツを照会する必要がある。中央制御ディスパッチサービスが大量のユーザ要求を受信した場合、大量のディスパッチ処理を行う必要がある。この場合、大きな遅延が発生し、ユーザへのフィードバックの効率が低下する。

本発明は、少なくとも従来技術において、中央制御ディスパッチサービスが大量のユーザ要求を受信した場合、ユーザが要求したリソースが人気のないリソースであるという原因により、中央制御ディスパッチサービスが極めて多い回数のディスパッチを必要とし、ネットワーク遅延が発生し、フィードバック効率が低くなるという問題を解決する。

第１態様では、本発明の実施例は、
中央制御ディスパッチサービスによって、データ配信サービスから送信される、ユーザ音声を認識したセマンティック結果を受信するステップと、
中央制御ディスパッチサービスによって、セマンティック結果に関連する複数の機能サービスを並行してディスパッチし、複数の機能サービスからフィードバックされた機能解析結果を取得するステップと、
機能サービスの優先度に基づいて複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の機能解析結果によってセマンティック結果の機能を実現できるか否かを判断するステップと、
機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出し、
機能実現判別サービスから実現の成功というフィードバックがあった場合、最高優先度の機能解析結果をデータ配信サービスに送信して、ユーザにフィードバックするステップと、
を含むことを特徴とする音声対話プラットフォームの機能ディスパッチ方法を提供する。

第２態様では、本発明の実施例は、
中央制御ディスパッチサービスによって、データ配信サービスから送信されるユーザ音声を認識したセマンティック結果を受信するために用いられるセマンティック受信プログラムモジュールと、
中央制御ディスパッチサービスによってセマンティック結果に関連する複数の機能サービスを並行してディスパッチし、複数の機能サービスからフィードバックされた解析結果を取得するために用いられる機能解析プログラムモジュールと、
機能サービスの優先度に基づいて複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の機能解析結果によってセマンティック結果の機能を実現できるか否かを判断するために用いられる機能実現判別プログラムモジュールと、
機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出するが、機能実現判別サービスから実現の成功というフィードバックがあった場合、最高優先度の機能解析結果をデータ配信サービスに送信してユーザにフィードバックするために用いられるディスパッチプログラムモジュールと、
を含むことを特徴とする音声対話プラットフォームの機能ディスパッチ装置を提供する。

第３態様では、少なくとも１つのプロセッサと、少なくとも１つのプロセッサに通信可能に接続されたメモリと、を含む電子機器であって、メモリには、少なくとも１つのプロセッサによって実行可能な命令が記憶されており、本発明のいずれかの実施例の音声対話プラットフォームの機能ディスパッチ方法のステップが実行できるように、少なくとも１つのプロセッサによって命令を実行させることを特徴とする電子機器を提供する。

第４態様では、コンピュータプログラムが記憶されている記憶媒体であって、当該プログラムがプロセッサによって実行されると、本発明のいずれかの実施例の音声対話プラットフォームの機能ディスパッチ方法のステップが実現できる、ことを特徴とする記憶媒体を提供する。

本発明の実施例は、以下の有益な効果を有する。セマンティック認識結果を複数の機能サービスに同時に送信し、各機能サービスの解析結果を機能実現判別サービスに送信して順次判別する。中央制御ディスパッチサービスと機能サービスとの間で一度ディスパッチするだけで、ユーザのニーズを実現できる音声機能の解析結果を確定でき、中央制御ディスパッチサービスのディスパッチ回数を減少させることができる。多数のユーザが要求を送信する場合、機能ディスパッチの効率を確保し、遅延を低減し、ユーザの体験を改善させることもできる。

本願の実施例の技術方案をより明確に説明するために、以下、実施例の説明において使用される図面について簡単に紹介する。明らかに、以下の説明における図面は、本願のいくつかの実施例である。当業者は、創造的な労働をすることなく、これらの図面に基づいて他の図面を得ることができる。

本発明の一実施例によって提供される音声対話プラットフォームの機能ディスパッチ方法のフローチャートである。本発明の一実施例によって提供される音声対話プラットフォームの機能ディスパッチ装置の構造概略図である。本発明の電子機器の一実施例の概略構成図である。

本発明の実施例の目的、技術方案および利点をより明確にするために、以下では、本発明の実施例における図面と併せて、本発明の実施例における技術方案を明確かつ完全に説明する。もちろん、説明される実施形態は本発明の一部の実施形態にすぎず、本発明の全部の実施形態ではない。本発明の実施形態に基づいて、当業者が創造的な努力なしに得られる他の全ての実施形態も本発明の保護範囲に含まれるべきである。

図１は、本発明の一実施例によって提供される音声対話プラットフォームの機能ディスパッチ方法のフローチャートである。この方法はサーバに用いられ、以下のステップを含む。

ステップＳ１１において、中央制御ディスパッチサービスによって、データ配信サービスから送信される、ユーザ音声を認識したセマンティック結果を受信する。

ステップＳ１２において、中央制御ディスパッチサービスによって、セマンティック結果に関連する複数の機能サービスを並行してディスパッチし、複数の機能サービスからフィードバックされた解析結果を取得する。

ステップＳ１３において、機能サービスの優先度に基づいて複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の機能解析結果によってセマンティック結果の機能を実現できるか否かを判断する。

ステップＳ１４において、機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出し、
機能実現判別サービスから実現の成功というフィードバックがあった場合、最高優先度の機能解析結果をデータ配信サービスに送信して、ユーザにフィードバックする。

本実施形態において、ユーザは、インテリジェントデバイスを使用する際に、例えば「＊＊曲を再生します」または「＊＊問題を照会します」などのようにインテリジェントデバイスと対話をする。インテリジェントデバイスは、収集された音声をデータ配信サービスに送信する。音声は、データ配信サービスを介して認識サービスに送信され、セマンティック認識される。データ配信サービスは、ユーザ音声のセマンティック結果を取得した後、セマンティック結果を中央制御ディスパッチサービスに送信する。

ステップＳ１１において、中央制御ディスパッチサービスによって、データ配信サービスから送信されるユーザ音声のセマンティック認識結果、例えば、「ある曲を再生します」を受信する。

ステップＳ１２において、中央制御ディスパッチサービスによってセマンティック認識結果を受信した後、１つの機能サービスに直接送信するのではなく、当該セマンティック結果をセマンティック結果に関連する複数の機能サービスに同時に並行して送信する。この時、中央制御ディスパッチサービスによって、複数の機能サービスからフィードバックされた解析結果を受信する。「ある曲を再生します」が、例えばＱＱ（登録商標）音楽、網易（登録商標）雲音楽、酷狗音楽、酷我音楽、蝦米音楽などの複数の関連する機能サービスに並行して送信される。中央制御ディスパッチサービスによって、各音声機能によりフィードバックされた解析結果を受信する。

従来の方法では、セマンティック認識結果を確定した後、最高優先度の機能サービスに直接送信する。当該機能サービスによってセマンティック結果の機能を実現できない場合、中央制御ディスパッチサービスによってセマンティック認識結果を他の機能サービスに再送信する必要があり、このようなディスパッチ方法は、中央制御ディスパッチサービスによって継続的に試行する必要があり、効率が低い。

ステップＳ１３において、音声製品設計段階において、異なる機能に対して異なる優先度があるため、まず、最高優先度の機能解析結果を機能実現判別サービスに導出して、最高優先度の機能によってセマンティック結果の機能を実現できるか否かを判断する。例えば、セマンティック結果が「『これが愛です』を再生する」であり、各機能はいずれも対応する解析結果をフィードバックしている。この場合、第１優先度の機能はＱＱ（登録商標）音楽である。ＱＱ（登録商標）音楽機能の解析結果を機能実現判別サービスに導出する。

ステップＳ１４において、機能実現判別サービスから実現の失敗というフィードバックがあった場合、例えば、ＱＱ（登録商標）音楽に「これが愛です」のオリジナル曲がなく、ユーザのニーズを実現できない場合には、残りの複数の機能解析の中から最高優先度の機能解析結果を再度選択して機能実現判別サービスに導出する。例えば、この時の最高優先度の機能が網易（登録商標）雲音楽である場合、網易（登録商標）雲音楽機能の解析結果を機能実現判別サービスに導出する。

機能実現判別サービスから実現の成功というフィードバックがあった場合、「これが愛です」という曲が網易（登録商標）雲音楽にあることを表明する。網易（登録商標）雲音楽機能の解析結果をデータ配信サービスに送信して、ユーザにフィードバックする。

この実施形態によれば、セマンティック認識結果を複数の機能サービスに同時に送信し、各機能サービスの解析結果を機能実現判別サービスに送信して順次判別し、中央制御ディスパッチサービスと機能サービスとの間で一度ディスパッチするだけで、ユーザのニーズを実現できる音声機能の解析結果を確定でき、中央制御ディスパッチサービスと機能サービスのディスパッチ回数を減少させることができる。多数のユーザが要求を送信する場合、機能ディスパッチの効率を確保し、遅延を低減し、ユーザの体験を改善させることもできる。

一実施形態として、本実施例において、機能実現判別サービスは、
中央制御ディスパッチサービスから送信される最高優先度の機能解析結果を受信するステップと、
機能解析結果に対して対話状態追跡を行い、確定された対話状態に基づいて機能解析結果によってセマンティック結果の機能を実現できるか否かを判断するステップと、
を含む。

本実施形態において、機能実現判別サービスは、機能解析結果に対して対話状態追跡を行い、対応する対話状態を確定することにより、機能解析結果によってセマンティック結果の機能を実現できるか否かを判断する。例えば、音楽機能の他に、いくつかの検索機能に用いることができる。検索エンジンが異なるため、同じキーワードを入力すると異なる検索結果を得る可能性がある。ある検索機能はゴシップ類の情報を検索することが得意で、ある検索機能は学術類の情報を検索することが得意である。対話状態追跡によって取得される対話状態も異なり、さらに異なる機能の解析結果によってセマンティック結果の機能を実現できるか否かを判断する。

この実施形態からわかるように、機能実現判別の実現方法が提供されており、フィードバックされたコンテンツがいずれもユーザ所望のコンテンツであることを確保し、ユーザの体験をさらに改善することができる。

一実施形態として、本実施例において、優先度には、少なくとも機能優先度とコンテキスト優先度とが含まれる。

コンテキスト優先度は、このように理解することができる。例えば、Ａエンジン検索機能はゴシップ情報を検索することが得意で、Ｂエンジン検索機能は学術情報を検索することが得意である。ユーザが学術的な質問を頻繁にしない可能性があることを考慮して、Ａエンジン検索機能の優先度はＢエンジン検索機能より高い。ユーザが第１ラウンドの対話において学術類の質問要求を入力した場合、上記の方法により、学術類の質問要求をＡエンジン検索機能とＢエンジン検索機能に同時に並行して送信することができる。Ａエンジン検索機能の解析結果によってユーザのニーズを実現できるかどうかを優先的に判断する。Ａエンジン検索機能によってユーザのニーズを実現できず、Ｂエンジン検索機能によって実現できると判断された場合には、Ｂエンジン検索機能の解析結果をユーザにフィードバックする。ユーザの第２ラウンドの対話ではまた学術類の質問がされている。この時、コンテキスト判断により、第１ラウンドの対話ではＢエンジン検索機能によってユーザのニーズを実現できるため、第２ラウンドの対話ではＢエンジン検索機能が優先的に考慮される。

この実施形態から分かるように、複数の優先度の判別方法が提供されており、ディスパッチロジックをさらに最適化し、機能ディスパッチ効率を向上させることができる。

図２は、本発明の一実施例によって提供される音声対話プラットフォームの機能ディスパッチ装置１０の構造概略図である。この装置は、上記いずれかの実施例の音声対話プラットフォームの機能ディスパッチ方法を実行することができ、且つ端末に配置される。

本実施例によって提供される音声対話プラットフォームの機能ディスパッチ装置１０は、セマンティック受信プログラムモジュール１１と、機能解析プログラムモジュール１２と、機能実現判別プログラムモジュール１３と、ディスパッチプログラムモジュール１４と、を含む。

ここで、セマンティック受信プログラムモジュール１１は、中央制御ディスパッチサービスによって、データ配信サービスから送信されるユーザ音声を認識したセマンティック結果を受信するために用いられる。機能解析プログラムモジュール１２は、中央制御ディスパッチサービスによってセマンティック結果に関連する複数の機能サービスを並行してディスパッチし、複数の機能サービスからフィードバックされた解析結果を取得するために用いられる。機能実現判別プログラムモジュール１３は、機能サービスの優先度に基づいて複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の機能解析結果によってセマンティック結果の機能を実現できるか否かを判断するために用いられる。ディスパッチプログラムモジュール１４は、機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出するが、機能実現判別サービスから実現の成功というフィードバックがあった場合、最高優先度の機能解析結果をデータ配信サービスに送信してユーザにフィードバックするために用いられる。

機能実現判別プログラムモジュールは、
中央制御ディスパッチサービスから送信される最高優先度の機能解析結果を受信し、
機能解析結果に対して対話状態追跡を行い、確定された対話状態に基づいて機能解析結果によってセマンティック結果の機能を実現できるか否かを判断するために用いられる。

さらに、優先度には、少なくとも機能優先度とコンテキスト優先度とが含まれる。
さらに、機能サービスには、質問応答型機能サービスとタスク型機能サービスとが含まれる。

本発明の実施例は、不揮発性コンピュータ記録媒体をさらに提供し、上記のいずれかの方法実施例における音声対話プラットフォームの機能ディスパッチ方法を実行可能なコンピュータにより実行可能な命令が記憶されている。

一実施形態として、本発明の不揮発性コンピュータ記録媒体に記憶されているコンピュータにより実行可能な命令は、以下のように構成される。
中央制御ディスパッチサービスによって、データ配信サービスから送信される、ユーザ音声を認識したセマンティック結果を受信する。
中央制御ディスパッチサービスによって、セマンティック結果に関連する複数の機能サービスを並行してディスパッチし、複数の機能サービスからフィードバックされた解析結果を取得する。
機能サービスの優先度に基づいて複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の機能解析結果によってセマンティック結果の機能を実現できるか否かを判断する。
機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出し、
機能実現判別サービスから実現の成功というフィードバックがあった場合、最高優先度の機能解析結果をデータ配信サービスに送信して、ユーザにフィードバックする。

不揮発性コンピュータ可読記憶媒体として、不揮発性ソフトウェアプログラム、不揮発性コンピュータ実行可能なプログラムおよびモジュール、例えば本発明の実施例における方法に対応するプログラム命令／モジュールを記憶するために用いることができる。１つまたは複数のプログラム命令は、不揮発性コンピュータ可読記憶媒体に記憶され、プロセッサによって実行されると、上述したいずれかの方法実施例における音声対話プラットフォームの機能ディスパッチ方法が実行できる。

不揮発性コンピュータ可読記憶媒体は、プログラム記憶領域とデータ記憶領域を含むことができる。ここで、プログラム記憶領域は、オペレーティングシステムと少なくとも１つの機能に必要なアプリケーションプログラムとを記憶することができる。データ記憶領域は、装置の使用に応じて作成されたデータなどを記憶することができる。さらに、不揮発性コンピュータ可読記憶媒体は、高速ランダムアクセスメモリを含むことができ、不揮発性メモリ、例えば少なくとも１つの磁気ディスク記憶装置、フラッシュメモリ装置、または他の不揮発性固体記憶装置を含むことができる。いくつかの実施例において、不揮発性コンピュータ可読記憶媒体は、プロセッサから離れて設置されたメモリを選択的に含むことができ、これらのリモートメモリは、ネットワークを介して装置に接続することができる。上記ネットワークの例には、インタネット、イントラネット、ローカルエリアネットワーク、移動体通信ネットワークおよびそれらの組合せが含まれるが、これらに限定されない。

本発明の実施例はさらに、少なくとも１つのプロセッサと、少なくとも１つのプロセッサに通信可能に接続されたメモリと、を含む電子機器であって、メモリには、少なくとも１つのプロセッサによって実行可能な命令が記憶されており、
中央制御ディスパッチサービスによって、データ配信サービスから送信される、ユーザ音声を認識したセマンティック結果を受信するステップと、
中央制御ディスパッチサービスによって、セマンティック結果に関連する複数の機能サービスを並行してディスパッチし、複数の機能サービスからフィードバックされた解析結果を取得するステップと、
機能サービスの優先度に基づいて複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の機能解析結果によってセマンティック結果の機能を実現できるか否かを判断するステップと、
機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出し、
機能実現判別サービスから実現の成功というフィードバックがあった場合、最高優先度の機能解析結果をデータ配信サービスに送信して、ユーザにフィードバックするステップと、
が実行できるように、少なくとも１つのプロセッサによって命令を実行させる電子機器を提供する。

一実施形態として、前記機能実現判別サービスは、中央制御ディスパッチサービスから送信される最高優先度の機能解析結果を受信するステップと、前記機能解析結果に対して対話状態追跡を行い、確定された対話状態に基づいて前記機能解析結果によって前記セマンティック結果の機能を実現できるか否かを判断するステップと、を含む。

一実施形態として、前記優先度には、少なくとも機能優先度とコンテキスト優先度とが含まれる。

一実施形態として、前記機能サービスには、質問応答型機能サービスとタスク型機能サービスとが含まれる。

図３は、本発明の他の実施例によって提供される音声対話プラットフォームの機能ディスパッチ方法を実行する電子機器のハードウェア構造概略図ある。図３に示すように、この機器は、１つまたは複数のプロセッサ３１０とメモリ３２０とを含み、図３では、１つのプロセッサ３１０を例としている。

音声対話プラットフォームの機能ディスパッチ方法を実行する機器は、入力装置３３０と出力装置３４０とをさらに含むことができる。

プロセッサ３１０、メモリ３２０、入力装置３３０及び出力装置３４０は、バスを介して接続されてもよいし、他の方法で接続されてもよく、図３では、バスを介した接続を例とする。

メモリ３２０は、不揮発性コンピュータ可読記憶媒体であり、不揮発性ソフトウェアプログラム、不揮発性コンピュータ実行可能なプログラムおよびモジュール、例えば本発明の実施例における音声対話プラットフォームの機能ディスパッチ方法に対応するプログラム命令／モジュールを記憶するために用いることができる。プロセッサ３１０は、メモリ３２０に記憶されている不揮発性ソフトウェアプログラム、命令およびモジュールを実行することにより、サーバの各種機能応用およびデータ処理を実行し、上記方法実施例の音声対話プラットフォームの機能ディスパッチ方法を実現する。

メモリ３２０は、プログラム記憶領域とデータ記憶領域を含むことができる。プログラム記憶領域は、オペレーティングシステムや少なくとも１つの機能に必要なアプリケーションプログラムを記憶することができる。データ記憶領域は、音声対話プラットフォームの機能ディスパッチ装置の使用に応じて作成されたデータなどを記憶することができる。さらに、メモリ３２０は、高速ランダムアクセスメモリを含むことができ、不揮発性メモリ、例えば少なくとも１つの磁気ディスク記憶装置、フラッシュメモリ装置、または他の不揮発性固体記憶装置を含むことができる。いくつかの実施例において、メモリ３２０は、プロセッサ３１０から離れて設置されたメモリを選択的に含むことができ、これらのリモートメモリは、ネットワークを介して音声対話プラットフォームの機能ディスパッチ装置に接続することができる。上記ネットワークの例には、インタネット、イントラネット、ローカルエリアネットワーク、移動体通信ネットワークおよびそれらの組合せが含まれるが、これらに限定されない。

入力装置３３０は、入力された数値や文字情報を受信し、音声対話プラットフォームの機能ディスパッチ装置のユーザ設置および機能制御に関連する信号を生成することができる。出力装置３４０は、ディスプレイなどの表示装置を含むことができる。

１つまたは複数のモジュールはメモリ３２０に記憶され、１つまたは複数のプロセッサ３１０によって実行されると、上記任意の方法実施例における音声対話プラットフォームの機能ディスパッチ方法を実行する。

本発明の実施形態の電子デバイスは、以下のデバイスを含むが、これらに限定されない様々な形態で存在する。

（１）モバイル通信デバイス：これらのデバイスは、その特徴がモバイル通信機能を備えることであり、音声及びデータ通信を提供することを主な目標として、スマートフォン（例えば、ｉｐｈｏｎｅ（登録商標））、マルチメディア携帯電話、機能携帯電話、ローエンド携帯電話などを含む。
（２）ウルトラモバイルパソコンデバイス：これらのデバイスは、パソコンのカテゴリーに属し、計算及び処理の機能を持ち、一般にモバイルインターネットアクセスの特性を持って、例えば、ｉＰａｄ（登録商標）などのＰＤＡ、ＭＩＤ及びＵＭＰＣデバイスなどを含む。
（３）ポータブルエンターテイメントデバイス：これらのデバイスは、マルチメディアコンテンツを表示及び放送でき、オーディオ、ビデオプレーヤー（例えば、ｉＰｏｄ（登録商標））、ハンドヘルドゲームデバイス、電子書籍、インテリジェントおもちゃ及びポータブルカーナビゲーションデバイスを含む。
（４）データ交換機能を備えたその他の電子デバイス。

上記の装置の実施形態は、例示的だけであり、分離するコンポーネントとして記載されたユニットは、物理的に分離されるものであってもよく、分離されないものであってもよい。ユニットとして表示されるコンポーネントは、物理ユニットであってもよく、物理ユニットではなくてもよい。即ち、一つの場所に配置することもでき、複数のネットワークユニットに分散することもできる。実際のニーズに応じて、いくつかのモジュール又はすべてのモジュールを選択することができ、実施形態の目的を達成するようになる。

上記の実施形態の説明を通じて、当業者は、各実施形態がソフトウェア及び共通のハードウェアプラットフォームによって実現することができ、もちろん、ハードウェアによって実現することもできることを明確に理解することができる。この理解に基づいて、上記の技術方案の本質又は関連技術に貢献する部分は、ソフトウェア製品の形式で具体化でき、コンピューターソフトウェア製品は、例えば、ＲＯＭ／ＲＡＭ、磁気ディスク、コンパクトディスクなどのコンピュータ可読記憶媒体に格納でき、コンピューターデバイス（パーソナルコンピューター、サーバ又はネットワークデバイスなどである）に、各々の実施形態又は実施形態のある部分に記載された方法を実行させるように、いくつかの命令を含む。

最後に、上記した実施形態は、本発明の技術構成を説明するためのものであり、本発明を限定するためのものではない。当業者であれば、本発明の技術構成の趣旨や範囲を逸脱しない前提下で、上述した実施形態に対して修正することもできるし、一部の技術的特徴を均等置換することもできる。これらの修正や置換は、いずれも本発明の保護範囲に含まれるべきである。

Claims

サーバに用いられる音声対話プラットフォームの機能ディスパッチ方法であって、
中央制御ディスパッチサービスによって、データ配信サービスから送信される、ユーザ音声を認識したセマンティック結果を受信するステップと、
中央制御ディスパッチサービスによって、前記セマンティック結果に関連する複数の機能サービスを並行してディスパッチし、前記複数の機能サービスからフィードバックされた機能解析結果を取得するステップと、
前記機能サービスの優先度に基づいて前記機能解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の前記機能解析結果によって前記セマンティック結果の機能を実現できるか否かを判断するステップと、
前記機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出し、
前記機能実現判別サービスから実現の成功というフィードバックがあった場合、前記最高優先度の機能解析結果をデータ配信サービスに送信して、ユーザにフィードバックするステップと、
を含むことを特徴とする音声対話プラットフォームの機能ディスパッチ方法。
前記機能実現判別サービスは、
中央制御ディスパッチサービスから送信される最高優先度の機能解析結果を受信するステップと、
前記機能解析結果に対して対話状態追跡を行い、確定された対話状態に基づいて前記機能解析結果によって前記セマンティック結果の機能を実現できるか否かを判断するステップと、
を含むことを特徴とする請求項１に記載の音声対話プラットフォームの機能ディスパッチ方法。
前記優先度には、少なくとも機能優先度とコンテキスト優先度とが含まれることを特徴とする請求項１に記載の音声対話プラットフォームの機能ディスパッチ方法。
前記機能サービスには、質問応答型機能サービスとタスク型機能サービスとが含まれることを特徴とする請求項１に記載の音声対話プラットフォームの機能ディスパッチ方法。
中央制御ディスパッチサービスによって、データ配信サービスから送信されるユーザ音声を認識したセマンティック結果を受信するために用いられるセマンティック受信プログラムモジュールと、
中央制御ディスパッチサービスによって前記セマンティック結果に関連する複数の機能サービスを並行してディスパッチし、前記複数の機能サービスからフィードバックされた機能解析結果を取得するために用いられる機能解析プログラムモジュールと、
前記機能サービスの優先度に基づいて前記複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の前記機能解析結果によって前記セマンティック結果の機能を実現できるか否かを判断するために用いられる機能実現判別プログラムモジュールと、
前記機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出するが、前記機能実現判別サービスから実現の成功というフィードバックがあった場合、前記最高優先度の機能解析結果をデータ配信サービスに送信してユーザにフィードバックするために用いられるディスパッチプログラムモジュールと、
を含むことを特徴とする音声対話プラットフォームの機能ディスパッチ装置。
前記機能実現判別プログラムモジュールは、
中央制御ディスパッチサービスから送信される最高優先度の機能解析結果を受信し、
前記機能解析結果に対して対話状態追跡を行い、確定された対話状態に基づいて前記機能解析結果によって前記セマンティック結果の機能を実現できるか否かを判断するために用いられる、
ことを特徴とする請求項５に記載の音声対話プラットフォームの機能ディスパッチ装置。
前記優先度には、少なくとも機能優先度とコンテキスト優先度とが含まれることを特徴とする請求項５に記載の音声対話プラットフォームの機能ディスパッチ装置。
前記機能サービスには、質問応答型機能サービスとタスク型機能サービスとが含まれることを特徴とする請求項５に記載の音声対話プラットフォームの機能ディスパッチ装置。
少なくとも１つのプロセッサと、前記少なくとも１つのプロセッサに通信可能に接続されたメモリと、を含む電子機器であって、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶されており、
請求項１～４のいずれか１項に記載の音声対話プラットフォームの機能ディスパッチ方法のステップが実行できるように、前記少なくとも１つのプロセッサによって前記命令を実行させることを特徴とする電子機器。
コンピュータプログラムが記憶されている記憶媒体であって、
前記プログラムがプロセッサによって実行されると、請求項１～４のいずれか１項に記載の音声対話プラットフォームの機能ディスパッチ方法のステップが実現できる、ことを特徴とする記憶媒体。