JP2020009439A

JP2020009439A - インタラクション方法および装置

Info

Publication number: JP2020009439A
Application number: JP2019122909A
Authority: JP
Inventors: メンメン・チャン; Mengmeng Zhang; ジョンジ・ファン; Zhongji Fan; レイ・シー; Lei Shi; リー・ワン; Wang Le; チャン・ジュ; Qiang Ju; チャオ・イン; Chao Yin; ウェイ・シェン; Wei Shen; ジャン・シェ; Jiang Hsieh; ラン・シュウ; Ran Xu; ジンヤ・ワン; Jingya Wang
Original assignee: Baidu Online Network Technology Beijing Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd
Priority date: 2018-07-04
Filing date: 2019-07-01
Publication date: 2020-01-16
Anticipated expiration: 2039-07-01
Also published as: CN108881466B; US20200013400A1; CN108881466A; JP7112991B2; US11081108B2

Abstract

【課題】インタラクション方法および装置を提供する。【解決手段】要求情報が複数の照会意図に関連付けられていること及び照会意図に関連付けられていないことの一方を含む案内条件を満たすとの判定に応答し、案内情報を生成してユーザにフィードバックする。また、要求情報と案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成し、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックすることとを含む。ユーザとインタラクションする過程において、ユーザにより入力された要求情報に対して複数の照会意図が関連付けられているか意図が不完全な状況などでは、ユーザとのインタラクションにより、明確な照会意図が関連付けられている意図の明確な要求情報を決定し、対応するプッシュ情報を取得しユーザにフィードバックする。その過程において、ユーザへのフィードバック精度を向上させる。【選択図】図２

Description

本願はコンピュータ分野に関し、具体的にインタラクション分野に関し、特にインタラクション方法及び装置に関する。

例えば音声でユーザとインタラクションすることにより、ユーザが取得しようとする情報をフィードバックする機能は、インテリジェントデバイスの基礎機能である。現在、一般的なインタラクションプロセスは、ユーザがある方面の情報を取得しようとする際に、照会意図に関連付ける要求情報を入力して、要求情報によって照会意図を決定できると、照会意図に基づいてユーザにフィードバックする情報を決定して、決定された情報をユーザにフィードバックする一方、要求情報によって照会意図を決定できないと、ユーザに情報をフィードバックしない。

本願の実施例は、インタラクション方法及び装置を提供する。

第１態様では、本願の実施例は、ユーザにより入力された要求情報が、複数の照会意図が関連付けられていること及び照会意図が関連付けられていないことの一方を含む案内条件を満たすと判定したことに応答して、案内情報を生成するとともに、案内情報をユーザにフィードバックすることと、要求情報とユーザにより入力さらた案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックすることとを含む、インタラクション方法を提供する。

第２態様では、本願の実施例は、ユーザにより入力された要求情報が、複数の照会意図が関連付けられていること及び照会意図が関連付けられていないことの一方を含む案内条件を満たすと判定したことに応答して、案内情報を生成するとともに、案内情報をユーザにフィードバックするように構成される応答手段と、要求情報とユーザにより入力さらた案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックするように構成されるフィードバック手段とを備える、インタラクション装置を提供する。

本願の実施例が提供するインタラクション方法及び装置は、ユーザにより入力された要求情報が、複数の照会意図が関連付けられていること及び照会意図が関連付けられていないことの一方を含む案内条件を満たすと判定したことに応答して、案内情報を生成するとともに、案内情報をユーザにフィードバックすることと、要求情報とユーザにより入力さらた案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックすることとを含む。ユーザとインタラクションする過程において、ユーザにより入力された要求情報に対して複数の照会意図が関連付けられている状況、意図が不完全な状況などでは、ユーザとのインタラクションにより、明確な照会意図が関連付けられている意図の明確な要求情報を決定し、意図の明確な要求情報を利用して対応するプッシュ情報を取得しユーザにフィードバックして、ユーザとインタラクションする過程において、ユーザが取得しようとする情報をフィードバックする精度を向上させる。

本願の他の特徴、目的および利点は、以下の図面を参照して説明される非限定的な実施例を読むことによって、より明らかになる。
本願の実施例を実現するのに適した例示的なシステム構成を示す。本願のインタラクション方法にかかる一実施例を示すフローチャートである。本願のインタラクション装置にかかる一実施例の構成概略図である。本願の実施例の端末を実現するのに適したコンピュータシステムの構成概略図である。

以下、図面及び実施例を参照しながら本願をさらに詳細に説明する。本明細書に記載された具体的な実施例は、単に本発明を説明するためのものであり、本発明を限定するものではないことが理解されるべきである。なお、説明の便宜上、図面には、かかる発明に関連する部分のみが示されている。

なお、矛盾しない場合に、本願における実施例及び実施例における特徴は互いに組み合わせることができる。以下、図面及び実施例を参照しながら本願を詳細に説明する。。

図１を参照すると、本願の実施例を実現するこの適合した例示的なシステム構成が示されている。

図１に示すように、端末１０１、ネットワーク１０２、サーバ１０３を含む。ネットワーク１０２は、有線通信ネットワークまたは無線通信ネットワークであってもよい。

端末１０１は、インテリジェントデバイス、スマートフォン、タブレット型コンピュータ、車載端末であってもよい。ユーザがある方面の情報を取得する必要がある場合に、ユーザは、端末１０１で要求情報を入力する。ユーザは、音声で要求情報を入力することができる。端末１０１のユーザが端末１０１で入力した要求情報は、サーバ１０３に送信される。サーバ１０３は、ユーザにより入力された要求情報が案内条件を満たするか否かを判断することができ、ユーザにより入力された要求情報が案内条件を満たすと判断した場合に、案内情報を生成して、案内情報を端末１０１に送信して、端末１０１によってユーザにフィードバックされることができる。ユーザは、フィードバック情報を入力することができ、端末１０１は、ユーザにより入力されたフィードバック情報をサーバに送信することができ、サーバ１０３は、要求情報及びユーザにより入力された案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報を端末１０１に送信して、端末１０１によってユーザにフィードバックされることができる。

図２を参照すると、本願のインタラクション方法にかかる一実施例のフローが示されている。該方法は、ユーザにより入力された要求情報が案内条件を満たすと判定したことに応答して、案内情報を生成するとともに、案内情報をユーザにフィードバックするステップ２０１を含む。

本実施例において、案内条件は、複数の照会意図が関連付けられていること及び照会意図が関連付けられていないことの一方を含む。

本実施例において、ユーザは端末で要求情報を入力することができ、端末は要求情報をサーバに送信することができる。サーバは、ユーザにより入力された要求情報が案内条件を満たしているか否かを判断することができる。要求情報にプッシュ情報がバインディングされていないと判定した場合に、要求情報に照会意図が関連付けられていないと判定することができ、ひいては案内条件を満たすと判定することができる。要求情報に複数のプッシュ情報がバインディングされていない場合に、ユーザにより入力された要求情報に複数の照会意図が関連付けられていると判定することができ、ひいては案内条件を満たすと判定することができる。

本実施例のいくつかの選択可能な実施形態において、要求情報は、情報照会要求情報、マルチメディアコンテンツ要求情報及び通話要求情報のいずれか１つを含む。情報照会要求情報は、ユーザが天気、交通、生活などの一般的なタイプの情報を取得しようとするニーズに関連付けられている。マルチメディアコンテンツ要求情報は、ユーザがマルチメディアコンテンツを取得しようとするニーズに関連付けられている。通話要求情報は、ユーザの連絡先との通話ニーズに関連付けられている。

本実施例において、サーバに複数のスロットが予め設定されており、１つの単語が出現する位置を１つのスロットと称することができ、１つのスロットにおける値が複数であってもよい。各スロットの値を組み合わせることにより、大量の異なる予め設定された単語の組み合わせを構成することができ、サーバには大量の異なる予め設定された単語の組み合わせが予め記憶されており、予め設定された単語の組み合わせのそれぞれは１つの照会意図を示することができ、予め設定された単語の組み合わせのそれぞれにプッシュ情報が予めバインディングされている。例えば、サーバに予め設定された全てのスロットには、動作に対応するスロットと、リソース名称に対応するスロットと、リソースタイプに対応するスロットが含まれている。動作に対応するスロットの値は、閲覧したい、聞きたい、開き、再生などを含むことができる。リソース名称に対応するスロットの値は、大量のリソース名称を含むことができる。リソースタイプに対応するスロットの値は、ニュース、クリップ、音楽、映画を含むことができる。動作に対応するスロット、リソース名称に対応するスロット、リソースタイプに対応するスロットの異なる値を組み合わせることにより、複数の予め設定された単語の組み合わせを構成することができ、予め設定された単語の組み合わせのそれぞれは１つの照会意図を示すことができ、予め設定された単語の組み合わせのそれぞれにプッシュ情報が予めバインディングされている。ユーザにより入力された要求情報が予め設定された単語の組み合わせにマッチングしたかどうかによって、ユーザにより入力された要求情報に対応するプッシュ情報があるかどうかを判定することができ、ひいては照会意図が関連付けられているか否かを判定することができる。ユーザにより入力された要求情報が１つの予め設定された単語の組み合わせにマッチングした場合、この要求情報にこの予め設定された単語の組合せにバインディングされたプッシュ情報がバインディングされていると判定することができる。

本実施例において、ユーザにより入力された要求情報に複数の照会意図が関連付けられていると判定すると、フィードバックを行って照会意図をさらに明確にするようにユーザを案内するための案内情報を生成することができる。

例えば、ユーザは１つの要求情報を入力して、この要求情報は、サーバに予め記憶された複数の予め設定された単語の組み合わせにマッチングしており、各予め設定された単語の組み合わせにプッシュ情報が予めバインディングされており、マッチングしたすべての予め設定された単語の組み合わせには、プッシュ情報に含まれる複数の異なるタイプのプッシュ情報が予めバインディングされている。案内情報、例えば、「どのタイプの情報を取得しようとしますか」を生成することができる。

本実施例において、ユーザにより入力された要求情報に照会意図が関連付けられていないと判定した場合、他の要求情報を利用してプッシュ情報を取得するか否かを決定するようにユーザを案内するための案内情報を生成することができる。

例えば、ユーザにより入力された要求情報がサーバに予め記憶されたいずれかの照会意図を示すための予め設定された単語の組み合わせにマッチングしない場合に、インタラクション履歴に基づいて、要求情報における１つの単語を別の単語で置換した後に、予め設定された単語の組み合わせにマッチングした場合に、かかる置換を行って、新たな要求情報を取得することができる。そして、案内情報を生成することができ、例えば、「新たな要求情報を入力したいですか」を生成する。

また、例えば、サーバにユーザの連絡先情報に関連する複数の予め設定された単語組み合わせが予め記憶されており、予め設定された単語の組み合わせは、連絡先の氏名、連絡先の電話を含む。ユーザにより入力された要求情報は、１つの連絡先の氏名である小明を含むと、サーバは、ユーザにより入力された要求情報が小明の氏名及び小明の電話を含む予め設定された単語の組み合わせにマッチングしたと判定することができ、案内情報である「小明に電話をかけたいですか」を生成することができる。

本実施例のいくつかの選択可能な実施形態において、ユーザにより入力された要求情報は、ユーザにより入力された照会音声に対して音声認識を行って得られたものである。ユーザは、端末で要求情報に対応する照会音声を入力することができ、端末はユーザにより入力された要求情報に対応する照会音声をサーバに送信する。サーバによってこの照会音声を音声認識して、ユーザにより入力された要求情報を取得することができる。

本実施例のいくつかの選択可能な実施形態において、ユーザにより入力された要求情報がエンティティキーワードを含み、サーバにこのエンティティキーワードで示されるエンティティに属する複数のリソースタイプのプッシュ情報が予め記憶されており、各リソースタイプのプッシュ情報のそれぞれがこのエンティティキーワードを含む予め設定された１つの単語の組み合わせにバインディングされると、このユーザにより入力された要求情報と各リソースタイプのプッシュ情報のぞれぞれにバインディングされた、予め設定された単語の組み合わせのいずれにもマッチングしたと判定して、ユーザにより入力された要求情報に複数の照会意図が関連付けられていると判定することができる。エンティティキーワードで示されるエンティティの複数のリソースタイプから少なくとも１つのタイプを選択するようにユーザを案内するための案内情報を生成することができる。

例えば、ユーザは、要求情報である「ラヴソング」に対応する音声を入力する。この要求情報には、エンティティキーワードとしての「ラヴソング」のみが含まれている。サーバは、この端末から送信された音声を受信した後、音声認識により、ユーザが要求情報である「ラヴソング」を入力したと判定する。サーバは、ラヴソングというエンティティについて、ムービービデオリソースプールと音楽リソースプールとの両方にプッシュ情報が存在すると判定することができる。ラヴソングというエンティティのリソースタイプには映画、音楽などのリソースタイプが含まれる。プッシュ情報にはリソース名称、リソースの再生アドレスなどが含まれることができる。サーバは、ユーザにより入力された要求情報には、「ラヴソング」という映画を見る、「ラヴソング」という音楽を聞くなどの照会意図が関連付けられていると判定する。サーバは、「ラヴソングという映画及び音楽があり、どちらがほしいですか」という案内情報を生成することができる。サーバは、「ラヴソングという映画及び音楽があり、どちらがほしいですか」という案内情報を端末に送信する。端末は案内情報を受信した後に、「ラヴソングという映画及び音楽があり、どちらがほしいですか」という案内情報をユーザに提示する。

本実施例のいくつかの選択可能な実施形態において、ユーザにより入力された要求情報に対応するプッシュ情報がないと判定する場合、即ちユーザにより入力された要求情報に照会意図が関連付けられていないと判定して、且つユーザにより入力された要求情報における重みの高い複数の単語が１つの予め設定された単語の組み合わせに出現する場合に、ユーザにより入力された要求情報が不完全であるとさらに判定することができる。フィードバック情報を入力し続けてフィードバック情報と要求情報とで意図の明確な情報を構成するようにユーザを案内するための案内情報を生成することができる。言い換えれば、この案内情報は、フィードバック情報を入力し続けるようにユーザを案内するためのものであり、案内情報をユーザにフィードバックした後に、ユーザはフィードバック情報を入力し続けることができ、フィードバック情報と要求情報とでプッシュ情報がバインディングされている意図の明確な要求情報を構成することができる。

ユーザにより入力された要求情報に対応するプッシュ情報がないと判断した場合、即ちユーザにより入力された要求情報に照会意図が関連付けられていないと判定して、且つユーザにより入力された要求情報に予め設定された動作キーワードのみが含まれ、予め設定された動作キーワードに対応する動作対象キーワードが含まれない場合に、ユーザにより入力された要求情報が不完全であるとさらに判定することができる。また、予め設定された動作キーワードに対応する動作対象キーワードをフィードバック情報として入力し続けるようにユーザを案内するための案内情報を生成することができる。

例えば、ユーザが要求情報「見たい」を入力すると、この要求情報には予め設定された動作キーワード「見たい」のみが含まれている。サーバは、プッシュ情報がバインディングされ「見たい」を含む複数の予め設定された単語の組み合わせが予め格納されていると判定することができるが、「見たい」対象のコンテンツは空である。

サーバは、ユーザにより入力された要求情報が不完全であると判定することができる。サーバは、「よく聞こえません。何を見たいですか」という案内情報を生成することができる。サーバは、「よく聞こえません。何を見たいですか」という案内情報を端末に送信して、端末が受信した後に、ユーザに「よく聞こえません。何を見たいですか」という案内情報をユーザに提示する。ユーザは、「見たい」に対応する動作対象キーワードである、例えば「偶像研修生クリップ」に対応する音声をフィードバック情報として入力することができる。端末はこの音声をサーバに送信する。サーバは、音声認識を行った後に、ユーザにより入力されたフィードバック情報が、「見たい」に対応する動作対象キーワードである、例えば「偶像研修生クリップ」であると判定する。

本実施例のいくつかの選択可能な実施形態において、ユーザにより入力された要求情報に対応するプッシュ情報がないと判断した場合、即ちユーザにより入力された要求情報に照会意図が関連付けられていないと判定して、且つユーザにより入力された要求情報と類似する要求情報にプッシュ情報がバインディングされていると判定した場合に、ユーザにより入力された要求情報と類似の要求情報を意図の明確な要求情報として利用して、プッシュ情報を取得するかを決定するようにユーザを案内するための案内情報を生成することができる。

例えば、ユーザは、要求情報である「アイドル研修生クリップ」に対応する音声を入力する。サーバは、この端末から送信された音声を受信して音声認識を行った後に、ユーザにより入力された要求情報が「アイドル研修生クリップ」であると判定する。単語分割により「アイドル研修生、クリップ｝を得た後に、｛アイドル研修生、クリップ｝にマッチングした予め設定された単語の組合せがないと判定する。サーバは、｛アイドル研修生、クリップ｝と、プッシュ情報がバインディングされている、予め設定された単語の組み合わせとの意味の類似度を計算して、計算された意味の類似度に基づいて、プッシュ情報がバインディングされている、予め設定された単語の組み合わせから、｛アイドル研修生、クリップ｝の意味と類似する｛偶像研修生、クリップ｝を含む予め設定された単語の組み合わせを検索することができる。｛偶像研修生、クリップ｝を含む予め設定された単語の組み合わせには、偶像研修生のクリップの再生アドレス、インターフェースを含むプッシュ情報がバインディングされている。サーバは、「偶像研修生のクリップを見たいですよね」という案内情報を生成することができる。「偶像研修生のクリップを見たいですよね」という案内情報を端末に送信する。端末は、サーバから送信された案内情報を受信した後に、「偶像研修生のクリップを見たいですよね」という案内情報をユーザに提示する。

上記インタラクション方法は、要求情報とユーザにより入力された案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックするステップ２０２を含む。

本実施例において、ユーザにより入力された要求情報に複数の照会意図が関連付けられていると判定した場合、案内情報を生成して、ユーザに案内情報をフィードバックした後に、ユーザは案内情報に対応するフィードバック情報を入力することができる。そして、要求情報とユーザにより入力された案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックすることができる。意図の明確な要求情報にはプッシュ情報がバインディングされている。

例えば、ユーザは１つの要求情報を入力する。この要求情報は、サーバに予め記憶された照会意図を示す複数の予め設定された単語の組み合わせにマッチングしたものである。各予め設定された単語の組み合わせにプッシュ情報が予めバインディングされている。予め設定された単語の組み合わせのぞれぞれに予めバインディングされているプッシュ情報には、複数の異なるタイプのプッシュ情報が含まれている。「どのタイプの情報を取得しようとしますか」とう案内情報を生成することができる。案内情報をユーザにフィードバックした後に、ユーザにより入力されたフィードバック情報を受信することができる。フィードバック情報は、ユーザにより入力された取得しようとするタイプの名称であってもよく、フィードバック情報をユーザにより入力された要求情報と組み合わせることにより、プッシュ情報がバインディングされている意図の明確な要求情報を構成することができる。それにより、意図の明確な要求情報によりプッシュ情報を取得して、プッシュ情報をユーザにプッシュすることができる。

本実施例において、ユーザにより入力された要求情報に照会意図が関連付けられていないと判定した場合に、他の要求情報を利用してプッシュ情報を取得するか否かを決定するようにユーザを案内するための案内情報を生成して、この案内情報をユーザにフィードバックした後に、ユーザはフィードバック情報を入力することができる。フィードバック情報は、肯定的な情報を示すものであってもよいし、否定的な情報を示すものであってもよい。ユーザにより入力された要求情報及びフィードバック情報に基づいて、意図の明確な要求情報を生成することができる。

例えば、ユーザにより入力された要求情報がサーバに予め記憶されたいずれかの照会意図を示すための予め設定された単語の組み合わせにマッチングしない場合に、インタラクション履歴に基づいて、要求情報における１つの単語を別の単語で置換した後に、照会意図を示すための予め設定された単語の組み合わせにマッチングした場合に、かかる置換を行って、新たな要求情報を取得することができる。そして、案内情報を生成することができ、例えば、「新たな要求情報を入力したいですか」という案内情報を生成する。案内情報をユーザにフィードバックした後に、ユーザは、肯定を示す単語、例えば「はい」、又は否定を示す単語、例えば「いいえ」を入力することができる。ユーザにより入力されたフィードバック情報が肯定を示す単語であると判定すると、この新たな要求情報をそのまま意図の明確な要求情報とすることができる。

本実施例において、ユーザにより入力された要求情報はエンティティキーワードを含み、ユーザにより入力された要求情報に複数の照会意図が関連付けられていると判断した後に、エンティティキーワードで示されるエンティティの複数のリソースタイプから少なくとも１つのタイプを選択するようにユーザを案内するための案内情報を生成することができる。案内情報をユーザにフィードバックした後、ユーザにより入力されたフィードバック情報を受信することができ、フィードバック情報は、エンティティキーワードで示されるエンティティの複数のリソースタイプから選択されたリソースタイプの名称であってもよい。サーバは、選択されたリソースタイプの名称をフィードバック情報としてエンティティキーワードと組み合わせることにより、プッシュ情報がバインディングされている意図の明確な要求情報を構成することができる。それにより、意図の明確な要求情報によりプッシュ情報を取得して、プッシュ情報をユーザにプッシュすることができる。

例えば、ユーザは、要求情報である「ラヴソング」に対応する音声を入力する。サーバは、この端末から送信された音声を受信した後、音声認識により、ユーザが要求情報である「ラヴソング」を入力したと判定する。サーバは、ラヴソングというエンティティついて、ムービービデオリソースプールと音楽リソースプールとの両方にプッシュ情報が存在すると判定することができる。プッシュ情報にはリソース名称、リソースの再生アドレスなどが含まれることができる。サーバは、ユーザにより入力された要求情報には、「ラヴソング」という映画を見る、「ラヴソング」という音楽を聞くなどの照会意図が関連付けられていると判定する。サーバは、「ラヴソングという映画及び音楽があり、どちらがほしいですか」という案内情報を生成することができる。サーバは、「ラヴソングという映画及び音楽があり、どちらがほしいですか」という案内情報を端末に送信する。端末は案内情報を受信した後に、「ラヴソングという映画及び音楽があり、どちらがほしいですか」という案内情報をユーザに提示する。ユーザは「映画」に対応する音声又は「音楽」に対応する音声を入力することができ、端末は「映画」に対応する音声又は「音楽」に対応する音声をサーバに送信して、サーバは、ユーザにより入力されたフィードバック情報が「映画」又は「音楽」であると判定して、「ラヴソング」と「映画」又は「音楽」とを意図の明確な要求情報に組み合わせることにより、「ラヴソング」という名称の映画に対応するプッシュ情報又は「ラヴソング」という音楽に対応するプッシュ情報を取得することができる。

本実施例において、ユーザにより入力された要求情報に照会意図が関連付けられていないと判定して、且つユーザにより入力された要求情報が不完全であると判定した場合に、フィードバック情報を入力し続けてフィードバック情報と要求情報とで意図の明確な情報を構成するようにユーザを案内するための案内情報を生成することができる。言い換えれば、この案内情報は、フィードバック情報を入力し続けるようにユーザを案内するためのものであり、案内情報をユーザにフィードバックした後に、ユーザはフィードバック情報を入力し続けることができ、フィードバック情報と要求情報とでプッシュ情報がバインディングされている意図の明確な要求情報を構成することができる。

例えば、ユーザが要求情報「見たい」を入力すると、この要求情報には予め設定された動作キーワード「見たい」のみが含まれている。サーバは、プッシュ情報がバインディングされ「見たい」を含む複数の予め設定された単語の組み合わせが予め格納されていると判定することができるが、「見たい」対象のコンテンツは空である。サーバは、ユーザにより入力された要求情報が不完全であると判定することができる。サーバは、「よく聞こえません。何を見たいですか」という案内情報を生成することができる。サーバは、「よく聞こえません。何を見たいですか」という案内情報を端末に送信して、端末が受信した後に、ユーザに「よく聞こえません。何を見たいですか」という案内情報をユーザに提示する。ユーザは、「見たい」に対応する動作対象キーワードである、例えば「偶像研修生クリップ」に対応する音声をフィードバック情報として入力することができる。端末は、この音声をサーバに送信する。サーバは、音声認識を行った後に、ユーザにより入力されたフィードバック情報が「見たい」に対応する動作対象キーワード、例えば「偶像研修生クリップ」であると判定して、「見たい」と、続けて入力されたフィードバック情報とをプッシュ情報がバインディングされている意図の明確な要求情報に組み合わせることができる。

本実施例において、ユーザにより入力された要求情報に対応するプッシュ情報がないと判断した場合、即ちユーザにより入力された要求情報に照会意図が関連付けられていないと判定して、且つユーザにより入力された要求情報と類似する要求情報にプッシュ情報がバインディングされていると判定した場合に、ユーザにより入力された要求情報の意味と類似の要求情報を意図の明確な要求情報として利用して、プッシュ情報を取得するかを決定するようにユーザを案内するための案内情報を生成することができる。

例えば、ユーザは、要求情報である「アイドル研修生クリップ」に対応する音声を入力する。サーバは、この端末から送信された音声を受信して音声認識を行った後に、ユーザにより入力された要求情報が「アイドル研修生クリップ」であると判定する。単語分割により「アイドル研修生、クリップ｝を得た後に、｛アイドル研修生、クリップ｝にマッチングした予め設定された単語の組合せがないと判定する。サーバは、｛アイドル研修生、クリップ｝と、プッシュ情報がバインディングされている、予め設定された単語の組み合わせとの意味の類似度を計算して、計算された意味の類似度に基づいて、プッシュ情報がバインディングされている、予め設定された単語の組み合わせから、｛アイドル研修生、クリップ｝の意味と類似する｛偶像研修生、クリップ｝を含む予め設定された単語の組み合わせを検索することができる。｛偶像研修生、クリップ｝を含む予め設定された単語の組み合わせには、偶像研修生のクリップの再生アドレス、インターフェースを含むプッシュ情報がバインディングされている。サーバは、「偶像研修生のクリップを見たいですよね」という案内情報を生成することができる。「偶像研修生のクリップを見たいですよね」という案内情報を端末に送信する。端末は、サーバから送信された案内情報を受信した後に、「偶像研修生のクリップを見たいですよね」という案内情報をユーザに提示する。ユーザは、肯定を示す単語に対応する音声、例えば「はい」に対応する音声、又は否定を示す単語に対応する音声、例えば「いいえ」に対応する音声を入力することができる。サーバは、音声認識を行った後に、ユーザにより入力されたフィードバック情報が肯定を示す単語又は否定を示す単語であると判定する。ユーザにより入力されたフィードバック情報が肯定を示す単語であると判定すると、｛偶像研修生、クリップ｝を含む予め設定された単語の組み合せをそのまま意図の明確な情報とすることができる。

図３を参照すると、上記各図に示される方法の実施として、本願はインタラクション装置の一実施例を提供して、この装置の実施例は図２に示される方法の実施例に対応する。

図３に示すように、本実施例のインタラクション装置は、応答手段３０１、フィードバック手段３０２を備える。ここで、応答手段３０１は、ユーザにより入力された要求情報が、複数の照会意図が関連付けられていること及び照会意図が関連付けられていないことの一方を含む案内条件を満たすと判定したことに応答して、案内情報を生成するとともに、案内情報をユーザにフィードバックするように構成され、フィードバック手段３０２は、要求情報とユーザにより入力さらた案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックするように構成される。

本実施例のいくつかの選択可能な実施形態において、要求情報は、情報照会要求情報、マルチメディアコンテンツ要求情報及び通話要求情報のいずれか１つを含む。

本実施例のいくつかの選択可能な実施形態において、案内条件は、複数の照会意図が関連付けられていることを含み、要求情報は、エンティティキーワードを含み、前記案内情報は、前記エンティティキーワードで示されるエンティティのリソースタイプから少なくとも一つのリソースタイプを選択するようにユーザを案内するためのものである。

本実施例のいくつかの選択可能な実施形態において、案内条件は、照会意図が関連付けられていないことを含み、前記案内情報は、フィードバック情報を入力し続けてフィードバック情報と要求情報とで意図の明確な情報を構成するようにユーザを案内するためのものである。

本実施例のいくつかの選択可能な実施形態において、要求情報は、予め設定された動作キーワードを含み、フィードバック情報は、予め設定された動作キーワードに対応する動作対象キーワードを含む。

本実施例のいくつかの選択可能な実施形態において、案内条件は、照会意図が関連付けられていないことを含み、前記案内情報は、ユーザにより入力された要求情報と意味的に類似する要求情報を意図の明確な要求情報とするかどうかを決定するようにユーザを案内するためのものである。

本実施例のいくつかの選択可能な実施形態において、要求情報は、ユーザにより入力された照会音声に対して音声認識を行って得られたものであり、フィードバック情報は、ユーザにより入力されたフィードバック音声に対して音声認識を行って得られたものである。

図４には、本願の実施例のサーバを実現するのに適したコンピュータシステムの構成概略図が示されている。

図４に示すように、コンピュータシステムは、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）４０２に格納されているプログラム、または記憶部４０８からＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）４０３にロードされたプログラムに従って各種の適切な動作および処理を実行するＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）４０１を備える。ＲＡＭ４０３には、コンピュータシステムが動作するために必要な各種プログラムやデータも記憶されている。ＣＰＵ４０１、ＲＯＭ４０２及びＲＡＭ４０３は、バス４０４を介して相互に接続されている。また、バス４０４には、入出力（Ｉ／Ｏ）インタフェース４０５も接続されている。

Ｉ／Ｏインタフェース４０５には、入力部４０６と、出力部４０７と、ハードディスクなどを含む記憶部４０８と、ＬＡＮカードやモデムなどのネットワークインタフェースカードを含む通信部４０９とが接続されている。通信部４０９は、インターネットのようなネットワークを介して通信処理を行う。ドライブ４１０も、必要に応じてＩ／Ｏインタフェース４０５に接続される。磁気ディスクや光ディスク、光磁気ディスク、半導体メモリなどのリムーバブルメディア４１１は、必要に応じてドライブ４１０にインストールされることにより、リムーバブルメディア７１１から読み出されたコンピュータプログラムが必要に応じて記憶部４０８にインストールされる。

特に、本願の実施例で説明されたプロセスは、コンピュータプログラムとして実施されることができる。例えば、本願の実施例は、フローチャートに示される方法を実行するための命令を含むコンピュータ可読媒体に担持されたコンピュータプログラムを含むコンピュータプログラム製品を含む。このコンピュータプログラムは、通信部４０９を介してネットワークからダウンロードしてインストールされ、および／またはリムーバブルメディア４１１からインストールされることができる。このコンピュータプログラムが中央処理手段（ＣＰＵ）４０１によって実行されると、本願の方法で限定された上記機能が実行される。

なお、本願に記載のコンピュータ可読媒体は、コンピュータ可読信号媒体やコンピュータ可読記憶媒体、又は上記両方の任意の組み合わせであってもよい。コンピュータ可読記憶媒体は、特に限定されないが、例えば、電気や磁気、光、電磁気、赤外線または半導体のシステム、装置またはデバイスであってもく、またはこれらの任意の組み合わせであってもよい。コンピュータ可読記憶媒体のより具体的な例には、１つまたは複数のリードを有する電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、消去可能プログラマブルリードオンリーメモリ（ＥＰＲＯＭまたはフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ（ＣＤ−ＲＯＭ）、光記憶デバイス、磁気記憶デバイス、または上述の任意の適切な組合せが含まれるが、これらに限定されない。本願において、コンピュータ可読記憶媒体は、プログラムを含むかまたは格納する任意の有形媒体であってもよく、そのプログラムは、情報を実行するシステム、装置またはデバイスによって使用されてもよく、またはそれらとともに使用されてもよい。本願において、コンピュータ可読信号媒体は、ベースバンドでまたはキャリアの一部として伝搬される、コンピュータ読み取り可能なプログラムコードを担持するデータ信号を含むことができる。このように伝搬されるデータ信号は、電磁信号、光信号、または上述の任意の適切な組み合わせを含む様々な形態とすることができるが、これらに限定されない。コンピュータ可読信号媒体は、さらに、情報を実行するシステム、装置またはデバイスによって使用され、またはそれらとともに使用されるプログラムを送信、伝播または伝搬することが可能なコンピュータ可読記憶媒体以外の任意のコンピュータ可読媒体とすることができる。コンピュータ可読媒体に含まれるプログラムコードは、無線や電線、光ケーブル、ＲＦなど、またはそれらの任意の適切な組合せを含む任意の適切な媒体を介して伝送されてることができるが、これらに限定されない。

図面におけるフローチャートおよびブロック図は、本願の様々な実施例によるシステム、方法およびコンピュータプログラム製品の実施可能な構成、機能および動作を示す。この点に関して、フローチャートまたはブロック図の各ブロックは、所定の論理機能を実施するための１つまたは複数の実行可能な情報を含むモジュール、ブロックまたはコードの一部を示すことができる。なお、いくつかの置換例としての実施例では、ブロックに示す機能は、図面に示す順序とは異なる順序で実行されてもよい。例えば、接続して示される２つのブロックは、実際に、実質的に並行して実行されてもよく、かかる機能によっては、相互に逆の順序で実行されてもよい。なお、ブロック図および／またはフローチャートにおける各ブロック、ならびにブロック図および／またはフローチャートにおけるブロックの組合せは、所定の機能または動作を実行する専用のハードウェアによるシステムによって実施されてもよく、または専用ハードウェアとコンピュータ情報との組合せによって実施されてもよい。

以上の説明は、本出願の好適な実施例及び適用される技術原理の説明に過ぎない。当業者であれば、本願に係る発明の範囲は、上記技術的特徴の特定の組み合わせからなる技術的手段に限定されるものではなく、同時に前記発明の主旨から逸脱しない範囲で上記技術的特徴又はその等価な特徴によって任意に組み合わせて形成される他の技術的手段を含むことが理解されべきである。例えば、上記特徴が本願に開示された（これに限定されない）同様な機能を有する技術的特徴と相互に置換されて形成される技術的手段である。

Claims

ユーザにより入力された要求情報が、複数の照会意図が関連付けられていること及び照会意図が関連付けられていないことの一方を含む案内条件を満たすと判定したことに応答して、案内情報を生成するとともに、案内情報をユーザにフィードバックすることと、
要求情報とユーザにより入力された案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックすることとを含むインタラクション方法。
要求情報は、情報照会要求情報、マルチメディアコンテンツ要求情報、及び通話要求情報のいずれか一つを含む、請求項１に記載の方法。
案内条件は、複数の照会意図が関連付けられていることを含み、要求情報は、エンティティキーワードを含み、前記案内情報は、前記エンティティキーワードで示されるエンティティのリソースタイプから少なくとも一つのリソースタイプを選択するようにユーザを案内するためのものである、請求項２に記載の方法。
案内条件は、照会意図が関連付けられていないことを含み、前記案内情報は、フィードバック情報を入力し続けてフィードバック情報と要求情報とで意図の明確な情報を構成するようにユーザを案内するためのものである、請求項２に記載の方法。
要求情報は、予め設定された動作キーワードを含み、フィードバック情報は、予め設定された動作キーワードに対応する動作対象キーワードを含む、請求項４に記載の方法。
案内条件は、照会意図が関連付けられていないことを含み、前記案内情報は、ユーザにより入力された要求情報と意味的に類似する要求情報を意図の明確な要求情報とするかどうかを決定するようにユーザを案内するためのものである、請求項２に記載の方法。
要求情報は、ユーザにより入力された照会音声に対して音声認識を行って得られたものであり、フィードバック情報は、ユーザにより入力されたフィードバック音声に対して音声認識を行って得られたものである、請求項１〜６のいずれか１項に記載の方法。
ユーザにより入力された要求情報が、複数の照会意図が関連付けられていること及び照会意図が関連付けられていないことの一方を含む案内条件を満たすと判定したことに応答して、案内情報を生成するとともに、案内情報をユーザにフィードバックするように構成される応答手段と、
要求情報とユーザにより入力された案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックするように構成されるフィードバック手段とを備えるインタラクション装置。
要求情報は、情報照会要求情報、マルチメディアコンテンツ要求情報、及び通話要求情報のいずれか一つを含む、請求項８に記載の装置。
案内条件は、複数の照会意図が関連付けられていることを含み、要求情報は、エンティティキーワードを含み、前記案内情報は、前記エンティティキーワードで示されるエンティティのリソースタイプから少なくとも一つのリソースタイプを選択するようにユーザを案内するためのものである、請求項９に記載の装置。
案内条件は、照会意図が関連付けられていないことを含み、前記案内情報は、フィードバック情報を入力し続けてフィードバック情報と要求情報とで意図の明確な情報を構成するようにユーザを案内するためのものである、請求項９に記載の装置。
要求情報は、予め設定された動作キーワードを含み、フィードバック情報は、予め設定された動作キーワードに対応する動作対象キーワードを含む、請求項１１に記載の装置。
案内条件は、照会意図が関連付けられていないことを含み、前記案内情報は、ユーザにより入力された要求情報と意味的に類似する要求情報を意図の明確な要求情報とするかどうかを決定するようにユーザを案内するためのものである、請求項９に記載の装置。
要求情報は、ユーザにより入力された照会音声に対して音声認識を行って得られたものであり、フィードバック情報は、ユーザにより入力されたフィードバック音声に対して音声認識を行って得られたものである、請求項８〜１３のいずれか１項に記載の装置。
コンピュータプログラムが記憶されているコンピュータ可読媒体であって、前記コンピュータプログラムが実行される場合、請求項１〜７のいずれか１項に記載の方法を実現させる、コンピュータ可読媒体。