JP7256857B2

JP7256857B2 - 対話処理方法、装置、電子機器及び記憶媒体

Info

Publication number: JP7256857B2
Application number: JP2021179666A
Authority: JP
Inventors: ファンワン; スーチーバオ; ファンホー; ファウー; ジンジョウホー
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-12-24
Filing date: 2021-11-02
Publication date: 2023-04-12
Anticipated expiration: 2041-11-02
Also published as: US20210383797A1; JP2022020063A; CN112329907A; US11977850B2

Description

本出願はコンピュータ技術分野における音声、自然言語処理、深層学習技術分野に関し、特に対話処理方法、装置、電子機器及び記憶媒体に関する。

現在、人工知能、自然言語処理などの技術の発展と伴い、対話処理技術も広く応用され、人々の生活に多くの便利をもたらしている。しかしながら、関連技術における対話処理方法は、対話システムにおける「一対多」の問題と大規模モデルの並行運行の問題との両方に気を配ることができない。

対話処理方法、装置、電子機器及び記憶媒体を提供する。

第１の態様によれば、対話処理方法を提供し、対話履歴を取得するステップと、予め設定された複数台のマシンの中からターゲットマシンを選択するステップと、前記対話履歴を前記ターゲットマシンにおける訓練済みの対話モデルに入力して、前記対話履歴に対応する応答を生成するステップであって、前記対話モデルには共通パラメータと固有パラメータが含まれ、前記異なるマシンに対応する前記共通パラメータは同じであるステップと、を含む。

第２の態様によれば、対話処理装置を提供し、対話履歴を取得するための第１の取得モジュールと、予め設定された複数台のマシンの中からターゲットマシンを選択するための第１の選択モジュールと、前記対話履歴を前記ターゲットマシンの訓練済みの対話モデルに入力して、前記対話履歴に対応する応答を生成するための生成モジュールであって、前記対話モデルには共通パラメータと固有パラメータが含まれ、前記異なるマシンに対応する前記共通パラメータは同じである生成モジュールと、を含む。

第３の態様によれば、電子機器を提供し、少なくとも１つのプロセッサと、前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を含み、前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも１つのプロセッサが本出願の第１の様態に記載の対話処理方法を実行できるように、前記少なくとも１つのプロセッサによって実行される。

第４の態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに本出願の第１の様態に記載の対話処理方法を実行させる。

第５態様によれば、コンピュータプログラムが含まれるコンピュータプログラム製品を提供し、前記コンピュータプログラムがプロセッサによって実行される場合、本出願の第１の様態に記載の対話処理方法を実現する。
第６態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムがプロセッサによって実行される場合、本出願の第１の様態に記載の対話処理方法を実現する。

なお、この部分に記載されている内容は、本出願の実施例の主要または重要な特徴を限定することを意図しておらず、本出願の範囲を限定するものでもないことを理解されたい。本出願の他の特徴は、以下の説明を通して容易に理解される。

図面は、本技術案をよりよく理解するために使用され、本開示を限定するものではない。
本出願の第１の実施例に係る対話処理方法のフローチャートである。本出願の実施例に係る対話処理方法の応用シーンの概略図である。本出願の第２の実施例に係る対話処理方法のフローチャートである。本出願の第３の実施例に係る対話処理方法のフローチャートである。本出願の第１の実施例に係る対話処理装置のブロック図である。本出願の第２の実施例に係る対話処理装置のブロック図である。本出願の実施例の対話処理方法を実現するための電子機器のブロック図である。

以下、図面と組み合わせて本出願の例示的な実施例を説明し、理解を容易にするためにその中には本出願の実施例の様々な詳細事項が含まれており、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本出願の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができることを認識されたい。同様に、明確及び簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。

音声は音声認識、音声インタラクションなどの技術分野を含むことができ、人工知能分野の重要な方向である。

音声認識（ＶｏｉｃｅＲｅｃｏｇｎｉｔｉｏｎ）は、機器に音声信号を認識と理解するプロセスにより、音声信号を対応するテキストまたは指令に変換させるようにする技術であり、主に特徴抽出技術、モードマッチング基準およびモデル訓練技術の３つの態様を含む。

音声インタラクション（ＶｏｉｃｅＩｎｔｅｒａｃｔｉｏｎ）は、マシンとユーザが音声を情報キャリアとして対話、コミュニケーション、情報交換などの対話的行為を行う技術であり、伝統的なヒューマンインタラクションと比較して、便利且つ迅速で、ユーザの快適性が高いという利点がある。

自然言語処理（ＮａｔｕｒａｌＬａｎｇｕａｇｅＰｒｏｃｅｓｓｉｎｇ、ＮＬＵ）は、自然言語通信を効果的に実現できるコンピュータシステム、特にそのうちのソフトウェアシステムを研究する１つの科学であり、コンピュータ科学分野と人工知能分野の重要な方向である。

深層学習（ＤｅｅｐＬｅａｒｎｉｎｇ、ＤＬ）はマシン学習（ＭａｃｈｉｎｅＬｅａｒｎｉｎｇ、ＭＬ）分野における新しい研究方向であり、サンプルデータの内的な規則と表示レベルを学習して、マシンが人間のように分析学習能力を持ち、文字、画像と音声などのデータを認識できるようにする科学であり、音声と画像認識に広く応用されている。

ここ数年、大規模な対話コーパスと大規模なモデルの利用のおかげで、エンドツーエンドの対話モデル効果が大きな突破をとげた。しかしながら、現在モデル規模は百億、さらには千億レベルのパラメータになっており、すでに１台のマシンの記憶空間を上回り、モデルの分散型の記憶方式を用いてこの問題を緩和することができるが、モデル更新の全体構造は非常に複雑である。特に、グラフィックプロセッサ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ，ＧＰＵ）クラスタに対しては、難易度が高い。また、各対話のコーパスは異なる背景からなる可能性があるため、これらの背景は対話履歴と応答との間の一対一対応の関係を打ち破って、したがって、対話システムには「一対多」の問題が存在する。そのため、本出願は対話処理方法、装置、電子機器及び記憶媒体を提供する。

以下、図面と併せて本出願の実施例の対話処理方法、装置、電子機器及び記憶媒体を説明する。

図１は本出願の第１の実施例に係る対話処理方法のフローチャートである。

図１に示すように、本出願の実施例の対話処理方法は、具体的には、以下のステップ１０１～ステップ１０３を含むことができる。

ステップ１０１、対話履歴を取得する。

具体的には、本出願の実施例に係る対話処理方法の実行主体は、本出願の実施例によって提供される対話処理装置であっても良い。この対話処理装置はデータ情報処理能力を有するハードウェア装置および／またはこのハードウェア装置の動作を駆動するために必要なソフトウェアであってもよい。選択可能に、実行主体は、ワークステーション、サーバ、コンピュータ、ユーザ端末および他のデバイスを含むことができる。ここで、ユーザ端末は、携帯電話、コンピュータ、スマート音声インタラクティブデバイス、スマート家電、車載端末などを含むが、これらに限定されない。

対話履歴ｒ１，ｒ２，……，ｒｔ－１は現在処理対象の対話の前文であり、本出願の実施例の対話処理方法は、この対話履歴ｒ１，ｒ２，……，ｒｔ－１に基づいて、対応する応答ｒｔを取得すことを目的とする。

選択可能に、対話履歴は、録画、ネットワーク伝送などの方式によって取得することができる。

例えば、録画の方式を用いて対話履歴を取得する場合、デバイス上に対話収集装置があり、対話収集装置はマイクロフォン（Ｍｉｃｒｏｐｈｏｎｅ）、マイクロフォンアレイ（ＭｉｃｒｏｐｈｏｎｅＡｒｒａｙ）などであってもよい。または、ネットワーク伝送の方式を用いて対話履歴を取得する場合、デバイス上にネットワークデバイスがあり、ネットワークデバイスを介して他のデバイスまたはサーバとネットワーク伝送を行うことができる。

対話履歴はオーディオ、テキストなどの形式であっても良く、ここでは限定されないことを理解されたい。

ステップ１０２は、予め設定された複数台のマシンの中からターゲットマシンを選択する。

具体的には、並行される複数台のマシン、例えばＮ台のマシンが予め配置され、各マシンの中に訓練済みの対話モデルが予め構成されている。Ｎ台のマシンの中から、１台のマシン、例えば第ｉ台のマシンを選択してターゲット機器とし、ｉ∈［１，Ｎ］。

ステップ１０３、対話履歴をターゲットマシンの訓練済みの対話モデルに入力して、対話履歴に対応する応答を生成し、対話モデルには共通パラメータと固有パラメータが含まれ、異なるマシンに対応する共通パラメータが同じである。

具体的には、ステップ１０１で取得された対話履歴を、ステップ１０２で選択されたターゲットマシンの訓練済みの対話モデルに入力し、訓練済みの対話モデルが対話履歴に対応する応答を出力する。ここで、対話モデルのモデルパラメータは共通パラメータθｃと固有パラメータθｓ，ｉを含み、異なるマシンに対応する対話モデルの固有パラメータθｃが同じであり，異なるマシンに対応する対話モデルの固有パラメータθｓ，ｉが異なる。１つの実行可能な実施形態として、対話モデルにおけるエンコードパラメータ（Ｅｎｃｏｄｅｒ）を共通パラメータθｃとし、対話モデルにおけるデコードパラメータ（Ｄｅｃｏｄｅｒ）を固有パラメータθｓ，ｉとする。

なお、本出願の実施例における対話モデルは、既存の様々なタイプの対話モデルであってもよく、本出願はこれに限定されない。

図２は本出願の実施例に係る対話処理方法の応用シーンの概略図である。図２に示すように、取得された対話履歴は「こんにちは、どこに遊びに行きたいですか？」であり、ターゲットマシンｉにおける訓練されたモデルの共通パラメータと固有パラメータｉ（ｉ∈［１，Ｎ］）に基づいて、この対話履歴「こんにちは、どこに遊びに行きたいですか？」を処理して、対応する応答を取得し、例えばターゲットマシンが第１台のマシンである場合、生成される応答は「香山の紅葉を見に行きます。」になり、ターゲットマシンが第２台のマシンである場合、生成される応答は「どこにも行きたくないので、自宅にいます」になり、ターゲットマシンが第Ｎ台のマシンである場合、生成される応答は「分かりません、あなたは？」になる。

以上、本出願の実施例に係る対話処理方法は、対話履歴を取得し、予め設定された複数台のマシンの中からターゲットマシンを選択し、対話履歴を前記ターゲットマシンにおける訓練済みの対話モデルに入力して、対話履歴に対応する応答を生成し、対話モデルには共通パラメータと固有パラメータが含まれ、前記異なるマシンに対応する共通パラメータが同じである。本出願の実施例の対話処理方法は、選択されたターゲットマシンによって、同じ対話履歴に基づいて、複数の異なる応答を生成し、対話システムにおける「一対多」の問題を解決することができる。各マシンには１つの対話モデルが構成されており、共通パラメータの同期化さえすればよく、並行計算効率が高く、また、マシンを増加することで対話モデルを大きくして、対話モデルの規模が拡大しやすくなり、対話システムにおける「一対多」の問題と大規模モデルの並行運行の問題との両方に気を配ることができる。

図３は、本出願の第２の実施例に係る対話処理方法のフローチャートである。

図３に示すように、本出願の実施例の対話処理方法は、具体的には、以下のステップ３０１～ステップ３０４を含むことができる。

ステップ３０１、対話履歴を取得する。

具体的には、本ステップ３０１は、上記実施例のステップ１０１と同じであり、ここでは説明を省略する。

上記実施例のステップ１０２は、具体的には、以下のステップ３０２またはステップ３０３を含むことができる。

ステップ３０２は、複数台のマシンの中からターゲットマシンをランダムに選択する。

具体的には、予め配置されたＮ台のマシンの中から、１台のマシン、例えば第ｉ台のマシンを選択してターゲット機器とし、ｉ∈［１，Ｎ］。

ステップ３０３は、対話履歴に基づいて、複数台のマシンの中からターゲットマシンを選択する。

具体的には、対話履歴ｒ１，ｒ２，……，ｒｔ－１に基づいて、予め設定された分配関数ｉ＝ｆ（ｒ１，…，ｒｔ）∈［１，Ｎ］を用いて、第ｉ台のマシンをターゲットマシンとすることができる。

ステップ３０４、対話履歴をターゲットマシンの訓練済みの対話モデルに入力して、対話履歴に対応する応答を生成し、対話モデルには共通パラメータと固有パラメータが含まれ、異なるマシンに対応する共通パラメータが同じである。

具体的には、本ステップ３０４は、上記実施例のステップ１０３と同じであり、ここでは説明を省略する。

実行可能な実施形態として、「対話履歴に基づいて、複数台のマシンの中からターゲットマシンを選択する」という上記ステップ３０３は、具体的には、対話履歴に基づいて対応する対話ベクトルを生成するステップと、対話ベクトルをハッシュ関数によってターゲットマシンにマッピングするステップと、を含むことができる。

他の実行可能な実施形態として、「対話履歴に基づいて、複数台のマシンの中からターゲットマシンを選択する」という上記ステップ３０３は、具体的には、対話履歴に基づいて対応する対話ベクトルを生成するステップと、対話ベクトルに基づいて対応するカテゴリを決定するステップと、カテゴリに基づいてターゲットマシンを決定するステップと、を含むことができる。

さらに、図４に示すように、本出願の実施例の対話処理方法は、以下の対話モデルの訓練ステップ４０１～ステップ４０５をさらに含むことができる。

ステップ４０１、サンプル対話履歴及び対応するサンプル応答を取得する。

具体的には、サンプルの対話履歴は、対話履歴の対話前文であり、サンプル応答は、対話履歴の対話前文に対応する応答である。

ステップ４０２は、複数台のマシンの中からサンプルターゲットマシンを選択する。

具体的には、ステップ４０２は上記実施例のステップ１０２と類似して、ここでは説明を省略する。

ステップ４０３は、サンプル対話履歴及びサンプル応答に基づいて、サンプルターゲットマシンにおける訓練対象の対話モデルを訓練する。

具体的には、ステップ４０１で取得されたサンプル対話履歴を、上記ステップ４０２で選択されたサンプルターゲットマシンにおける訓練対象の対話モデルの入力として、ステップ４０１で取得されたサンプル応答を、訓練対象の対話モデルの出力として、訓練対象の対話モデルを訓練し、すなわち、訓練対象の対話モデルにおける共通パラメータと固有パラメータを更新する。

ステップ４０４、訓練によって取得された対話モデルの共通パラメータを、複数台のマシンのうちのサンプルターゲットマシン以外のマシンにおける訓練対象の対話モデルに同期化する。

具体的には、ステップ４０３で訓練済みの対話モデルにおける共通パラメータを、Ｎ台マシンのうちのサンプルターゲットマシン以外の他のマシンに同期化し、その後、訓練終了条件が満たされるまで、次のサンプル対話履歴及び対応するサンプル応答に基づいてモデル訓練を行い、訓練済みの対話モデルを得る。

「複数台のマシンの中からサンプルターゲットマシンを選択する」という上記ステップ４０２は、具体的には、複数台のマシンの中からサンプルターゲットマシンをランダムに選択するステップ、または、サンプル対話履歴及びサンプル応答に基づいて、複数台のマシンの中からサンプルターゲットマシンを選択するステップ、を含む。

１つの実行可能な実施形態として、「サンプル対話履歴及びサンプル応答に基づいて、複数台のマシンの中からサンプルターゲットマシンを選択する」という上記ステップは、具体的には、サンプル対話履歴及びサンプル応答に基づいて対応するサンプル対話ベクトルを生成するステップと、サンプル対話ベクトルをハッシュ関数によってターゲットマシンにマッピングするステップと、を含むことができる。

１つの実行可能な実施形態として、「サンプル対話履歴及びサンプル応答に基づいて、複数台のマシンの中からサンプルターゲットマシンを選択する」という上記ステップは、サンプル対話履歴及びサンプル応答に基づいて対応するサンプル対話ベクトルを生成するステップと、サンプル対話ベクトルに基づいて対応するサンプルカテゴリを決定するステップと、サンプルカテゴリに基づいてサンプルターゲットマシンを決定するステップと、を含むことができる。

図５は本出願の第１の実施例に係る対話処理方法のブロック図である。

図５に示すように、本発明の実施例の対話処理装置５００は、具体的に、第１の取得モジュール５０１と、第１の選択モジュール５０２と、生成モジュール５０３とを含むことができる。

対話履歴を取得するための第１の取得モジュール５０１と、
予め設定された複数台のマシンの中からターゲットマシンを選択するための第１の選択モジュール５０２と、
対話履歴をターゲットマシンの訓練済みの対話モデルに入力して、対話履歴に対応する応答を生成するための生成モジュール５０３であって、対話モデルには共通パラメータと固有パラメータが含まれ、異なるマシンに対応する共通パラメータが同じである生成モジュール５０３と、を含む。

なお、上記の対話処理方法の実施例についての説明は、本出願の実施例の対話処理装置にも適用され、具体的なプロセスの説明はここで省略する。

以上、本出願の実施例に係る対話処理装置は、対話履歴を取得し、予め設定された複数台のマシンの中からターゲットマシンを選択し、対話履歴を前記ターゲットマシンにおける訓練済みの対話モデルに入力して、対話履歴に対応する応答を生成し、対話モデルには共通パラメータと固有パラメータが含まれ、前記異なるマシンに対応する共通パラメータが同じである。本出願の実施例の対話処理方法は、選択されたターゲットマシンによって、同じ対話履歴に基づいて、複数の異なる応答を生成し、対話システムにおける「一対多」の問題を解決することができる。各マシンには１つの対話モデルが構成されており、共通パラメータの同期化さえすればよく、並行計算効率が高く、また、マシンを増加することで対話モデルを大きくして、対話モデルの規模が拡大しやすくなり、対話システムにおける「一対多」の問題と大規模モデルの並行運行の問題との両方に気を配ることができる。

図６は本出願の第２の実施例に係る対話処理方法のブロック図である。

図６に示すように、本出願の実施例の対話処理装置６００は、第１の取得モジュール６０１と、第１の選択モジュール６０２と、生成モジュール６０３とを含む。

ここで、第１の取得モジュール６０１は、上記実施例における第１の取得モジュール５０１と同じ機能及び構造を有し、生成モジュール６０３は、上記実施例における生成モジュール５０３と同じ機能及び構造を有する。

ここで、第１の選択モジュール６０２は、具体的には、複数台のマシンの中からターゲットマシンをランダムに選択するための第１の選択ユニット６０２１、または、対話履歴に基づいて複数台のマシンの中からターゲットマシンを選択するための第２の選択ユニット６０２２を含むことができる。

１つの実行可能な実施形態として第２の選択ユニット６０２２は、具体的には、対話履歴に基づいて対応する対話ベクトルを生成するための第１の生成サブユニットと、対話ベクトルをハッシュ関数によってターゲットマシンにマッピングするための第１のマッピングサブユニットと、を含むことができる。

別の１つの実行可能な実施形態として、第２の選択ユニット６０２２は、対話履歴に基づいて対応する対話ベクトルを生成するための第２の生成サブユニットと、対話ベクトルに基づいて対応するカテゴリを決定するための第１の決定サブユニットと、を含むことができる。

さらに、本出願の実施例の対話処理装置６００は、サンプル対話履歴及び対応するサンプル応答を取得するための第２の取得モジュールと、複数台のマシンの中からサンプルターゲットマシンを選択するための第２の選択モジュールと、サンプル対話履歴及びサンプル応答に基づいて、サンプルターゲットマシンにおける訓練対象の対話モデルを訓練するための訓練モジュールと、訓練によって取得された対話モデルの共通パラメータを、複数台のマシンのうちのサンプルターゲットマシン以外のマシンにおける訓練対象の対話モデルに同期化するための同期化モジュールと、をさらに含むことができる。

さらに、第２の選択モジュールは、具体的に、複数台のマシンの中からサンプルターゲットマシンをランダムに選択するための第３の選択ユニット、または、サンプル対話履歴及びサンプル応答に基づいて、複数台のマシンの中からサンプルターゲットマシンを選択するための第４の選択ユニットと、を含むことができる。

実行可能な実施形態として、第４の選択ユニットは、具体的に、サンプル対話履歴及びサンプル応答に基づいて対応するサンプル対話ベクトルを生成するための第３の生成サブユニットと、サンプル対話ベクトルをハッシュ関数によってサンプルターゲットマシンにマッピングするための第２のマッピングサブユニットと、を含むことができる。

別の１つの実行可能な実施形態として、第４の選択ユニットは、具体的には、サンプル対話履歴及びサンプル応答に基づいて対応するサンプル対話ベクトルを生成するための第４の生成サブユニットと、サンプル対話ベクトルに基づいて対応するサンプルカテゴリを決定するための第３の決定サブユニットと、サンプルカテゴリに基づいてサンプルターゲットマシンを決定するための第４の決定サブユニットと、を含むことができる。

本出願の実施例によれば、本出願は、電子機器及び読み取り可能な記憶媒体をさらに提供する。

図７に示すように、それは本出願の実施例に係る対話を処理方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、スマート音声インタラクティブデバイス、パーソナルデジタル処理、携帯電話、スマートフォン、装着可能なデバイス、他の同様のコンピューティングデバイスなどの様々な形式のモバイル装置を表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び／又は要求される本出願の実現を制限することを意図したものではない。

図７示すように、当該電子機器は、１つ又は複数のプロセッサ７０１と、メモリ７０２と、高速インターフェース及び低速インターフェースを含む各コンポーネントを接続するためのインターフェースと、を含む。各コンポーネントは、異なるバスで相互に接続され、かつ共通のマザーボードに取り付けられてもよいし、又は必要に応じて他の方式で取り付けられてもよい。プロセッサ７０１は、電子機器内で実行される命令を処理することができ、外部入力／出力装置（インターフェースに結合されたディスプレイデバイスなど）にＧＵＩの図形情報をディスプレイするためにメモリに記憶されている命令を含む。他の実施形態では、必要であれば、複数のプロセッサ及び／又は複数のバスを、複数のメモリとともに使用することができる。同様に、複数の電子機器を接続することができ、各電子機器は、部分的な必要な操作（例えば、サーバアレイ、ブレードサーバ、又はマルチプロセッサシステムとする）を提供することができる。図７では、１つのプロセッサ７０１を例とする。

メモリ７０２は、本出願により提供される非一時的なコンピュータ読み取り可能な記憶媒体である。その中、前記メモリには、少なくとも１つのプロセッサによって実行される命令を記憶して、少なくとも１つのプロセッサが本出願により提供される対話処理方法を実行することができるようにする。本出願の非一時的なコンピュータ読み取り可能な記憶媒体に、コンピュータに本出願が提供した対話処理方法を実行するためのコンピュータ命令が記憶されている。

メモリ７０２は、非一時的なコンピュータ読み取り可能な記憶媒体として、本出願の実施例における対話処理方法に対応するプログラム命令／モジュール（例えば、図５に示す第１の取得モジュール５０１、第１の選択モジュール５０２、及び生成モジュール５０３）のような非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能プログラム及びモジュールを記憶する。プロセッサ７０１は、メモリ７０２に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち上記の方法の実施例における対話処理方法を実現する。

メモ７０２は、プログラム記憶領域及びデータ記憶領域を含むことができ、その中、プログラム記憶領域は、オペレーティングシステム、少なくとも１つの機能に必要なアプリケーションを記憶することができ、データ記憶領域は、対話処理方法を実行する電子機器の使用によって作成されたデータなどを記憶することができる。また、メモリ７０２は、高速ランダムアクセスメモリを含むことができ、不揮発性メモリ、例えば少なくとも１つの磁気ディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスをさらに含むことができる。いくつかの実施例では、メモリ７０２は、プロセッサ７０１に対して遠隔に設けられたメモリを選択的に含むことができ、これらの遠隔メモリは、ネットワークを介して対話処理方法の電子機器に接続されてもよい。上記ネットワークの例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク及びそれらの組み合わせを含むが、これらに限定されない。

対話処理方法の電子機器は、入力装置７０３と出力装置７０４とをさらに含むことができる。プロセッサ７０１、メモリ７０２、入力装置７０３、及び出力装置７０４は、バス又は他の方式を介して接続することができ、図７では、バスを介して接続することを例とする。

入力装置７０３は、入力された数字又は文字情報を受信することができ、及び対話処理方法の電子機器のユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、指示杆、１つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置７０４は、ディスプレイデバイス、補助照明デバイス（例えば、ＬＥＤ）、及び触覚フィードバックデバイス（例えば、振動モータ）などを含むことができる。当該ディスプレイデバイスは、液晶ディスプレイ（ＬＣＤ）、発光ダイオード（ＬＥＤ）ディスプレイ、及びプラズマディスプレイを含むことができるが、これらに限定しない。いくつかの実施形態では、ディスプレイデバイスは、タッチスクリーンであってもよい。

本明細書で説明されるシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けＡＳＩＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び／又は解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも１つの入力装置、及び当該少なくとも１つの出力装置に伝送することができる。

これらのコンピューティングプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる）は、プログラマブルプロセッサの機械命令、高レベルのプロセス及び／又は対象指向プログラミング言語、及び／又はアセンブリ／機械言語でこれらのコンピューティングプログラムを実施することを含む。本明細書に使用されるような用語「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」は、機械命令及び／又はデータをプログラマブルプロセッサに提供するために使用される任意のコンピュータプログラム製品、機器、及び／又は装置（例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス（ＰＬＤ））を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び／又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。

ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータ上で実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウス又はトラックボール）とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクションを提供するために用いられることもでき、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、任意の形式（音響入力と、音声入力と、触覚入力とを含む）でユーザからの入力を受信することができる。

ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバー）、又はフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする）、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形式又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを相互に接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットとを含む。

コンピュータシステムは、クライアントとサーバとを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント－サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバはクラウドサーバであっても良く、クラウドコンピューティングサーバまたはクラウドホストとも呼ばれ、クラウドコンピューティングサービスシステムにおける１つのホスト製品であり、従来の物理ホストとＶＰＳサービスに存在する管理の難しさ、業務拡張性の弱いという欠陥を解決した。サーバは分散システムのサーバであっても良い、ブロックチェーンを組み込んだサーバであっても良い。

本出願の実施例によれば、本出願は、コンピュータプログラムが含まれるコンピュータプログラム製品を提供し、前記コンピュータプログラムがプロセッサによって実行される場合、本出願の上記実施例の対話処理方法を実現する。
本出願の実施例によれば、本出願は、コンピュータプログラムを提供し、前記コンピュータプログラムがプロセッサによって実行される場合、本出願の上記実施例の対話処理方法を実現する。

本出願の技術案によれば、対話履歴を取得し、予め設定された複数台のマシンの中からターゲットマシンを選択し、対話履歴を前記ターゲットマシンにおける訓練済みの対話モデルに入力して、対話履歴に対応する応答を生成し、対話モデルには共通パラメータと固有パラメータが含まれ、前記異なるマシンに対応する共通パラメータが同じである。本出願の実施例の対話処理方法は、選択されたターゲットマシンによって、同じ対話履歴に基づいて、複数の異なる応答を生成し、対話システムにおける「一対多」の問題を解決することができる。各マシンには１つの対話モデルが構成されており、共通パラメータの同期化さえすればよく、並行計算効率が高く、また、マシンを増加することで対話モデルを大きくして、対話モデルの規模が拡大しやすくなり、対話システムにおける「一対多」の問題と大規模モデルの並行運行の問題との両方に気を配ることができる。

なお、上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本出願に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本出願で開示されている技術案の所望の結果を実現することができれば、本明細書では限定されない。

上記の具体的な実施形態は、本出願に対する保護範囲を限定するものではない。当業者は、設計要件と他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。任意の本出願の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本出願の保護範囲内に含まれるべきである。

Claims

対話処理方法であって、
対話履歴を取得するステップと、
予め設定された複数台のマシンの中からターゲットマシンを選択するステップと、
前記対話履歴を前記ターゲットマシンの訓練済みの対話モデルに入力して、前記対話履歴に対応する応答を生成するステップであって、前記対話モデルには共通パラメータと固有パラメータとが含まれ、異なる前記マシンに対応する前記共通パラメータが同じであるステップと、を含み、
前記対話処理方法は、サンプル対話履歴及び対応するサンプル応答を取得するステップと、
前記複数台のマシンの中からサンプルターゲットマシンを選択するステップと、
前記サンプル対話履歴及び前記サンプル応答に基づいて、前記サンプルターゲットマシンにおける訓練対象の対話モデルを訓練するステップと、
訓練によって取得された対話モデルの共通パラメータを、前記複数台のマシンのうちの前記サンプルターゲットマシン以外のマシンにおける訓練対象の対話モデルに同期化するステップと、をさらに含む、
ことを特徴とする対話処理方法。
前記予め設定された複数台のマシンの中からターゲットマシンを選択するステップは、
前記複数台のマシンの中から前記ターゲットマシンをランダムに選択するステップ、または、
前記対話履歴に基づいて、前記複数台のマシンの中から前記ターゲットマシンを選択するステップ、を含む、
ことを特徴とする請求項１に記載の対話処理方法。
前記対話履歴に基づいて、前記複数台のマシンの中から前記ターゲットマシンを選択するステップは、
前記対話履歴に基づいて、対応する対話ベクトルを生成するステップと、
前記対話ベクトルをハッシュ関数によって前記ターゲットマシンにマッピングするステップと、を含む、
ことを特徴とする請求項２に記載の対話処理方法。
前記対話履歴に基づいて、前記複数台のマシンの中から前記ターゲットマシンを選択するステップは、
前記対話履歴に基づいて、対応する対話ベクトルを生成するステップと、
前記対話ベクトルに基づいて、対応するカテゴリを決定するステップと、
前記カテゴリに基づいて、前記ターゲットマシンを決定するステップと、を含む、
ことを特徴とする請求項２に記載の対話処理方法。
前記複数台のマシンの中からサンプルターゲットマシンを選択するステップは、
前記複数台のマシンの中から前記サンプルターゲットマシンをランダムに選択するステップ、または、
前記サンプル対話履歴及び前記サンプル応答に基づいて、前記複数台のマシンの中から前記サンプルターゲットマシンを選択するステップ、を含む、
ことを特徴とする請求項１に記載の対話処理方法。
前記サンプル対話履歴及び前記サンプル応答に基づいて、前記複数台のマシンの中から前記サンプルターゲットマシンを選択するステップは、
前記サンプル対話履歴及び前記サンプル応答に基づいて、対応するサンプル対話ベクトルを生成するステップと、
前記サンプル対話ベクトルをハッシュ関数によって前記サンプルターゲットマシンにマッピングするステップと、を含む、
ことを特徴とする請求項５に記載の対話処理方法。
前記サンプル対話履歴及び前記サンプル応答に基づいて、前記複数台のマシンの中から前記サンプルターゲットマシンを選択するステップは、
前記サンプル対話履歴及び前記サンプル応答に基づいて、対応するサンプル対話ベクトルを生成するステップと、
前記サンプル対話ベクトルに基づいて、対応するサンプルカテゴリを決定するステップと、
前記サンプルカテゴリに基づいて、前記サンプルターゲットマシンを決定するステップと、を含む、
ことを特徴とする請求項５に記載の対話処理方法。
対話処理装置であって、
対話履歴を取得するための第１の取得モジュールと、
予め設定された複数台のマシンの中からターゲットマシンを選択するための第１の選択モジュールと、
前記対話履歴を前記ターゲットマシンの訓練済みの対話モデルに入力して、前記対話履歴に対応する応答を生成するための生成モジュールであって、前記対話モデルには共通パラメータと固有パラメータとが含まれ、異なる前記マシンに対応する前記共通パラメータが同じである生成モジュールと、を含み、
前記対話処理装置は、
サンプル対話履歴及び対応するサンプル応答を取得するための第２の取得モジュールと、
前記複数台のマシンの中からサンプルターゲットマシンを選択するための第２の選択モジュールと、
前記サンプル対話履歴及び前記サンプル応答に基づいて、前記サンプルターゲットマシンにおける訓練対象の対話モデルを訓練するための訓練モジュールと、
訓練によって取得された対話モデルの共通パラメータを、前記複数台のマシンのうちの前記サンプルターゲットマシン以外のマシンにおける訓練対象の対話モデルに同期化するための同期化モジュールと、をさらに含む、
ことを特徴とする対話処理装置。
前記第１の選択モジュールが、
前記複数台のマシンの中から前記ターゲットマシンをランダムに選択するための第１の選択ユニット、または、
前記対話履歴に基づいて、前記複数台のマシンの中から前記ターゲットマシンを選択するための第２の選択ユニット、を含む、
ことを特徴とする請求項８に記載の対話処理装置。
前記第２の選択ユニットが、
前記対話履歴に基づいて、対応する対話ベクトルを生成するための第１の生成サブユニットと、
前記対話ベクトルをハッシュ関数によって前記ターゲットマシンにマッピングするための第１のマッピングサブユニットと、を含む、
ことを特徴とする請求項９に記載の対話処理装置。
前記第２の選択ユニットが、
前記対話履歴に基づいて、対応する対話ベクトルを生成するための第２の生成サブユニットと、
前記対話ベクトルに基づいて、対応するカテゴリを決定するための第１の決定サブユニットと、
前記カテゴリに基づいて、前記ターゲットマシンを決定するための第２の決定サブユニットと、を含む、
ことを特徴とする請求項９に記載の対話処理装置。
前記第２の選択モジュールが、
前記複数台のマシンの中から前記サンプルターゲットマシンをランダムに選択するための第３の選択ユニット、または、
前記サンプル対話履歴及び前記サンプル応答に基づいて、前記複数台のマシンの中から前記サンプルターゲットマシンを選択するための第４の選択ユニット、を含む、
ことを特徴とする請求項８に記載の対話処理装置。
前記第４の選択ユニットが、
前記サンプル対話履歴及び前記サンプル応答に基づいて、対応するサンプル対話ベクトルを生成するための第３の生成サブユニットと、
前記サンプル対話ベクトルをハッシュ関数によって前記サンプルターゲットマシンにマッピングするための第２のマッピングサブユニットと、を含む、
ことを特徴とする請求項１２に記載の対話処理装置。
前記第４の選択ユニットが、
前記サンプル対話履歴及び前記サンプル応答に基づいて、対応するサンプル対話ベクトルを生成するための第４の生成サブユニットと、
前記サンプル対話ベクトルに基づいて、対応するサンプルカテゴリを決定するための第３の決定サブユニットと、
前記サンプルカテゴリに基づいて、前記サンプルターゲットマシンを決定するための第４の決定サブユニットと、を含む、
ことを特徴とする請求項１２に記載の対話処理装置。
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも１つのプロセッサが請求項１～７のいずれかに記載の対話処理方法を実行できるように、前記少なくとも１つのプロセッサによって実行される、
ことを特徴とする電子機器。
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項１～７のいずれかに記載の対話処理方法を実行させる、
ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
コンピュータプログラムであって、
前記コンピュータプログラムがプロセッサによって実行される場合、請求項１～７のいずれかに記載の対話処理方法を実現する、
ことを特徴とするコンピュータプログラム。