JP2022028889A

JP2022028889A - 対話生成方法、装置、電子機器及び記憶媒体

Info

Publication number: JP2022028889A
Application number: JP2021193407A
Authority: JP
Inventors: ジァンルーフー; Jianglu Hu; ヘハンリー; Hehan Li; フゥイファンスゥン; Huifeng Sun; シゥーチィースゥン; Shuqi Sun; ユエチァン; Yue Chang; ティンティンリー; Tingting Li; フゥアウー; Hua Wu; ハイフェンワン; Haifeng Wang
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-01-04
Filing date: 2021-11-29
Publication date: 2022-02-16
Also published as: EP3958163A2; EP3958163A3; KR20220002187A; CN112328776A; US20220215180A1

Abstract

【課題】指定されたタイプのタスク型応答文を優先的にターゲット応答文として返すことが可能な対話生成方法、装置、電子機器及び記憶媒体を提供する。【解決手段】対話生成方法は、入力文を取得するステップと、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定するステップと、前記入力文をタスク型の対話応答生成器に入力して、前記タスク型応答文を生成するステップと、タスク型応答文のタイプが指定されたタイプである場合、タスク型応答文がターゲット応答文であると決定するステップと、を含む。【選択図】図１

Description

本開示はコンピュータ技術の分野に関し、具体的に自然言語処理、音声技術、ナレッジグラフ、深層学習などの人工知能技術の分野に関し、特に対話生成方法、装置、電子機器及び記憶媒体に関する。

コンピュータ技術の長足の発展につれて、人工知能の分野も急速に発展してきて、音声アシスタント、インテリジェントスピーカー、チャットソフトなどもだんだん幅広く使われていく。対話コミュニケーションは、音声アシスタント、インテリジェントスピーカー、チャットソフトなどの分野において不可欠な一部として、いかに速く、正確に対話を生成するかが、極めて重要であると見える。

本開示は対話生成方法、装置、電子機器及び記憶媒体を提供する。

本開示の一様態によれば、
入力文を取得するステップと、
前記入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定するステップと、
前記入力文をタスク型の対話応答生成器に入力して、前記タスク型応答文を生成するステップと、
前記タスク型応答文のタイプが指定されたタイプである場合、前記タスク型応答文がターゲット応答文であると決定するステップと、を含む方法を提供する。

本開示の別の様態によれば、
入力文を取得する第１の取得モジュールと、
前記入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する第１の決定モジュールと、
前記入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成する第１の生成モジュールと、
前記タスク型応答文のタイプが指定されたタイプである場合、前記タスク型応答文がターゲット応答文であると決定する第２の決定モジュールと、を含む。

本開示の別の様態によれば、電子機器を提供し、
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも１つのプロセッサによって実行される場合、前記少なくとも１つのプロセッサが上記一様態の実施例に記載の対話生成方法を実行させる。

本開示の別の様態によれば、コンピュータプログラムが記憶されているコンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに上記一様態の実施例に記載の対話生成方法を実行させる。

本出願の別の様態によれば、コンピュータプログラムを提供し、前記コンピュータプログラムはプロセッサによって実行される場合、上記一様態の実施例に記載の対話生成方法を実現する。

本開示によって提供される対話生成方法、装置、電子機器および記憶媒体は、以下のような有益な効果を有する。

まず入力文を取得し、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、入力文をタスク型の対話応答生成器に入力して、対応するタスク型応答文を生成し、当該タスク型応答文のタイプが指定されたタイプである場合、当該タスク型応答文をターゲット応答文としてもよい。これにより、対話を生成する時、指定されたタイプのタスク型応答文を優先的にターゲット応答文として返すことにより、対話が順調に進むことを保障する前提で、できるだけタスク型応答文を返し、対話システムの性能を改善し、ユーザによりよく、より速い対話体験をもたらすことができる。

なお、この部分に記載されている内容は、本開示の実施例の肝心または重要な特徴を特定することを意図しておらず、本開示の範囲を限定することも意図していないことを理解されたい。本開示の他の特徴は、以下の説明を通して容易に理解される。

図面は、本技術案をよりよく理解するために使用され、本開示を限定するものではない。
本開示の一実施例によって提供される対話生成方法のフローチャートである。本開示の別の実施例によって提供される対話生成方法のフローチャートである。本開示の別の実施例によって提供される対話生成方法のフローチャートである。本開示の一実施例によって提供される対話生成装置の概略構造図である。本開示の別の実施例によって提供される対話生成装置の概略構造図である。本開示の別の実施例によって提供される対話生成装置の概略構造図である。本開示の実施例に係る対話生成方法の電子機器のブロック図である。

以下、図面と組み合わせて本開示の例示的な実施例を説明し、理解を容易にするためにその中には本開示の実施例の様々な詳細事項を含んでおり、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本開示の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができることを認識されたい。同様に、明確及び簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。

人工知能はコンピュータに人の特定の思惟過程及び知的行為（例えば、学習、推理、思考、計画など）をシミュレーションされることを研究する学科であり、ハードウェアの面の技術もソフトウェアの面の技術もある。人工知能ハードウェア技術は一般にセンサー、専用人工知能チップ、クラウド計算、分散記憶、ビッグデータ処理などの技術を含む。人工知能ソフトウェア技術は主にコンピュータ視覚技術、音声認識技術、自然言語処理技術及び機械学習／深層学習、ビッグデータ処理技術、ナレッジグラフ技術などのいくつかの方向を含む。

自然言語処理は人間言語（中国語、英語など）をコンピュータで処理、理解、運用し、コンピュータ科学と言語学の交差学科であり、通常に計算言語学と呼ばれる。自然言語は人間が他の動物と区別する根本的なしるしであり、言語がないと、人間の思考も不可能であるため、自然言語処理は人工知能の最高タスクと境界を体現している。つまり、コンピュータが自然言語を処理する能力を備える時にこそ、マシンは本当の知能を実現したと言える。

音声技術がコンピュータの分野におけるキー技術は、自動音声認識技術（ＡＳＲ）と音声合成技術（ＴＴＳ）がある。コンピュータがものを聞いたり、見たり、話したり、感じたりすることを可能にすることは、将来のヒューマンマシンインタラクションの発展方向であり、音声は将来最も期待されるヒューマンマシンインタラクション形態になり、音声は他のインタラクション形態よりもっと多くの利点を有する。

ナレッジグラフは本質的にセマンティックネットワークであり、図に基づくデータ構造であり、ノードとエッジから構成される。ナレッジグラフでは、各ノードは現実世界に存在するエンティティを表し、各エッジはエンティティとエンティティとの関係である。分かりやすく言えば、ナレッジグラフはすべての異なる種類の情報を接続して得られた関係ネットワークであり、ナレッジグラフは「関係」の角度から問題を分析する能力を提供する。

深層学習は多層の人工ニューラルネットワークとそれをトレーニングする方法を指す。一層のニューラルネットワークは、大量の行列数字を入力として、非線形アクティベーション方法によって重みを取り、別のデータ集合を出力として生成する。人々が物体を認識したりピクチャーをマークしたりするように、適切な行列数量、多層の組織がリンクすることにより、ニューラルネットワーク「脳」を形成して、正確で複雑な処理を行う。

以下、図面を参照しながら、本開示の実施例の対話生成方法、装置、電子機器及び記憶媒体を説明する。

図１は、本開示の実施例によって提供される対話生成方法のフローチャートである。

本開示の実施例の対話生成方法は、本開示の実施例によって提供される対話生成装置によって実行されてもよく、当該装置は電子機器に配置されてもよい。説明を簡単にするために、本開示の以下の各実施例では当該対話生成装置は、すべて「生成装置」と省略する。

図１に示すように、当該対話生成方法は以下のステップ１０１～１０４を含む。

ステップ１０１において、入力文を取得する。

入力文は任意の文であってもよく、言語、長さ、形式などに限定されない。例えば、入力文は中国語の文、英語の文などであってもよく、または疑問文、平叙文などであってもよく、音声の文、文字の文などであってもよいが、本開示はこれに対して限定するものではない。

ステップ１０２において、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する。

タスク型応答文は複数のタイプがあり、例えば明確化、満足、疑問などであってもよく、本開示はこれに対して限定するものではない。

本開示の実施例では、決定された生成対象のタスク型応答文のタイプの精度をさらに向上させるために、まず取得された入力文を口語で理解することができ、これによって入力文のセマンティック理解結果、例えば意図、含まれたワードスロットなどの情報を取得することができる。その後、対話状態のトラッキングによって、現在の対話状態を更新し、生成対象のタスク型応答文のタイプを決定する。

例えば、取得された入力文は「明日の上海までの航空券を予約する」である場合、まずそれを口語で理解し、入力文のセマンティック理解結果を取得し、その意図は航空券を予約することであり、目的地は上海であり、対話状態のトラッキングにより、現在の入力文に出発地、出発時間などの情報が含まれないと判断でき、ワードスロットの欠損は存在し、より明確で有用な情報を取得するために、ワードスロットの欠損を明確化することができ、これによって生成対象のタスク型応答文のタイプが明確化タイプと決定することができる。

なお、上記の例は単なる例示であり、本開示の実施例では入力文、タスク型応答文タイプに対する限定としてはいけない。

ステップ１０３において、入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成する。

対話応答生成器は、その中に入力された入力文に対して分析でき、これによって対応する応答文を生成する。

対話応答生成器はいくつかのタイプがあり、例えばタスク型の対話応答生成器、雑談応答生成器、本開示はこれに対して限定するものではない。

様々なタイプの対話応答生成器は、対応する表記コーパスに基づいて、訓練を重ねて生成されることができる。例えば、タスク型の対話応答生成器は、表記された入力文及び対応するタスク型応答文に基づいてトレーニングして生成されることができ、雑談応答生成器は、表記された入力文及び対応する雑談型応答文に基づいてトレーニングして生成されることができると理解することができ、本開示はこれに対して限定するものではない。

例えば、入力文が「今何時ですか？」である場合、それをタスク型の対話応答生成器に入力すると、「今は朝７時１０分です」のタスク型応答文を取得する可能性がある。

または、入力文が「天気を調べる」である場合、それをタスク型の対話応答生成器に入力し、「今日の気温３～１０度」のタスク型応答文を取得する可能性がある。

なお、上記の例は単なる例示であり、本開示の実施例ではタスク型応答文に対する限定としてはいけない。

ステップ１０４において、タスク型応答文のタイプが指定されたタイプである場合、タスク型応答文がターゲット応答文であると決定する。

ターゲット応答文は、生成装置が最終的に決定して出力され、入力文に対する返事の文である。

通常、明確化タイプの文は、ワードスロット欠損の明確化、肯定否定態度の明確化、多結果選択の明確化などの任意の事実に対する状況を含むことができ、本開示はこれに対して限定するものではない。しかしながら、満足タイプの文は、対話タスクがすでに実現され、目的が達成され、または問題が解決されたことなどを明らかにすることができる。すなわちタスク型応答文が明確化のタイプであるか、それとも満足のタイであるかにかかわらず、当該タスク型対話が現在通常の対話フローにあり、当該応答文が現在対話タスクに対する明確な返事であることを明らかにすることができ、これによって生成装置は当該タスク型応答文をターゲット応答文としてもよい。すなわち本開示の実施例における指定されたタイプは明確化のタイプまたは満足のタイプである。

例えば、入力文が「天気を調べる」である場合、当該入力文をタスク型の対話応答生成器に入力した後、生成されたタスク型応答文は「いつの天気を調べますか？」である可能性があり、当該応答文のタイプは明確化のタイプであり、指定されたタイプに属し、生成装置は当該応答文「いつの天気を調べますか」をターゲット応答文として決定することができる。

または、入力文が「飲み物を飲みたい」である場合、当該入力文をタスク型の対話応答生成器に入力した後、生成されたタスク型応答文は「ジュース、コーヒー、それともミルクティーがほしいですか？」であり、当該応答文のタイプは明確化のタイプであり、指定されたタイプに属し、生成装置は当該応答文「ジュース、コーヒー、それともミルクティーがほしいですか？」をターゲット応答文として決定することができる。

または、入力文が「天気を調べる」である場合、当該入力文をタスク型の対話応答生成器に入力した後、生成されたタスク型応答文は「今日の天気は晴れています」であり、当該応答文のタイプは満足のタイプであり、指定されたタイプに属し、生成装置は当該応答文「今日の天気は晴れています」をターゲット応答文として決定することができる。

なお、上記の例は単なる例示であり、本開示の実施例ではターゲット応答文に対する限定としていけない。

本開示の実施例、まず入力文を取得し、その後、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、その後、入力文をタスク型の対話応答生成器に入力して、対応するタスク型応答文を生成し、当該タスク型応答文のタイプが指定されたタイプである場合、当該タスク型応答文をターゲット応答文としてもよい。これにより、対話を生成する時、指定されたタイプのタスク型応答文を優先的にターゲット応答文として返すことにより、対話が順調に進むことを保障する前提で、できるだけタスク型応答文を返し、対話システムの性能を改善し、ユーザによりよく、より速い対話体験をもたらすことができる。

上記実施例は、入力文をタスク型の対話応答生成器に入力することにより、対応するタスク型応答文を取得でき、その後、タスク型応答文が指定されたタイプの文である場合、当該タスク型応答文を入力文に対応するターゲット応答文として決定することができる。入力文が異なる場合、それをタスク型の対話応答生成器に入力し、取得されたタスク型応答文のタイプは同じである可能性があり、異なる可能性もあり、これによって指定されたタイプの文は存在する可能性があり、指定されていないタイプの文が存在する可能性もある。さらに、決定されたターゲット応答文がもっと正確で、合理的になるように、以下、図２と併せて取得されたタスク型応答文が指定されていないタイプの文である場合に対して詳細に説明する。

図２は本開示の別の実施例によって提供される対話生成方法のフローチャートである。

ステップ２０１において、入力文を取得する。

ステップ２０２において、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する。

ステップ２０３において、入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成する。

ステップ２０４において、タスク型応答文のタイプが指定されていないタイプである場合、入力文の意図を決定する。

本開示の実施例では指定されたタイプは明確化のタイプ、満足のタイプであり、それに対応して、指定されていないタイプは明確化のタイプ、満足のタイプの他の任意のタイプに属せず、例えば疑問などのタイプであり、すなわち当該タスク型応答文は、対話タスクがすでに実現され、目的が達成され、または問題が解決されたことなどを明らかにすることができない、本開示の実施例は指定されていないタイプの文のタイプに対して限定するものではない。

取得された入力文をタスク型の対話応答生成器に入力すると、対応するタスク型応答文を生成でき、タスク型応答文のタイプが指定されていないタイプである場合、当該応答文が現在対話タスクに対する明確な返事ではないと明らかにし、現在の入力文に含まれる対話目的を実現できない。生成された応答文がもっと正確で、合理的になり、ユーザの目的を早く実現できるように、入力文の意図をさらに決定してから、対応する操作を行うことができると理解することができる。

ステップ２０５において、入力文の意図が非雑談的意図である場合、対話履歴のうち入力文に隣接する最初のＮ個の応答文を取得し、Ｎは正の整数である。

入力文の意図は多様である可能性があり、例えば雑談意図、需要意図、タスク意図などであり、本開示はこれに対して限定するものではない。

本開示の実施例では、入力文の意図が非雑談的意図である場合、その意図に対してよりよい返事をするために、生成装置はその前の対話履歴から隣接する応答文を取得することができる。

ステップ２０６において、最初のＮ個の応答文に基づいて、現在のターゲット応答文を生成する。

実際の応用では、Ｎの異なる数値に応じて、異なる方式でターゲット応答文を生成することができる。

通常、対話プロセスにおいて、各入力文の間に一定の連続性と関連性があり、本開示の実施例では、現在の入力文に基づいて、生成されたタスク型応答文が指定されていないタイプの文である場合、各入力文の間の関連性を考慮すると、その前の入力文に対応する応答文に基づいて、現在のターゲット応答文を決定することができ、これによって現在対話が順調に進むのを保障しながら、返された応答文が自然であること保障し、したがってユーザによりよい体験をもたらす。

例えば、入力文の意図が非雑談的意図である場合、Ｎが１である時、対話履歴のうち入力文に隣接する１つ前の応答文に基づいて、ターゲット応答文を決定することができる。

具体的に、取得された対話履歴のうち入力文に隣接する１つ前の応答語が明確化のタイプである場合、該応答文がユーザ対話タスクを達成することを目的とし、且つユーザのニーズに応じて応答した文であることを表明し、これによって、それを現在のターゲット応答文とすることができる。

例えば、現在の入力文が「ナビゲーションを使用したい」である場合、それをタスク型の対話応答生成器に入力すると、生成されたタスク型の対話応答文が指定されていないタイプの文である時、当該応答文が現在のユーザ対話タスクに対してよい返事をしなかったことを表す。この時、当該対話タスクに対してよい応答をするために、さらに入力文の意図を決定することができ、当該入力文の「ナビゲーションを使用したい」が非雑談的意図の文である場合、これによって対話履歴において現在の入力文に隣接する１つ前の応答文を選択して取得することができる。対話履歴において前のラウンドの対話における入力文が「北京の天気を調べる」であり、対応する応答文が「いつの天気を調べますか？」である場合、当該応答文は明確化タイプのタスク型応答文であり、対話タスクに対してすでに相応返事した。この時、ユーザ現在の対話タスクにより正確な回答をするために、前のラウンドの明確化タイプのタスク型応答文「いつの天気を調べますか？」を繰り返して選択することができ、これによって現在の意図を再度説明するようにユーザを誘導して、タスクを引き続き達成する。

または、取得された対話履歴のうち入力文に隣接する１つ前の応答文が非明確化タイプのタスク型の文である場合、当該応答文がタスク達成を目的とするフローにないことを表明し、この時ユーザの対話タスクをできるだけ達成するために、指定された応答文を選択することができ、例えば包括応答文を現在のターゲット応答文とする。

例えば、現在の入力文が「ナビゲーションしたい」であり、非雑談的意図の文であるため、後で対話履歴において現在の入力文に隣接する１つ前の応答文を選択して取得することができる。前のラウンドの対話における入力文が「北京の天気を調べる」であり、対応する応答文が「意味が分かりませんね」である場合、当該応答文は明確化タイプのタスク型応答文ではなく、当該応答語がユーザの対話タスクを達成することに役立たないことを表明する。この時、現在の対話タスクを引き続き達成するために、包括応答文を選択して現在のターゲット応答文とすることができ、例えば「どう返事するか分かりません。」という文を現在のターゲット応答文とする。

なお、上記の例は単なる例示であり、本開示の実施例がターゲット応答文を決定することに対する限定としてはいけない。

または、Ｎが１より大きい場合、入力文が非雑談的意図であるため、現在ユーザの入力文が特定のタスクを達成する必要があることを表明し、この時、入力文に含まれる対話タスクに対して返事する必要がある。タスク対話が引き続き進めることを保障するために、履歴対話における明確化タイプのタスク型応答文でターゲット応答文を生成することができる。

本開示の実施例では、最初のＮ個の応答文における明確化タイプのタスク型応答文に基づいて現在のターゲット応答文を決定する時、多様の決定方法、例えばセマンティック類似度、時間間隔などに基づいて決定する方法がある。

例えば、セマンティック類似度に基づいてターゲット応答文を決定することができる。最初のＮ個の応答文のうち入力文とのセマンティック類似度が最も高い明確化タイプのタスク型応答文を、現在のターゲット応答文として決定する。

例えば、入力文が「今日はいい天気ですね」であり、Ｎが３である場合、取得された最初の３つの応答文は「何を調べたいですか？」、「天気を調べたいですか？それとも時間を調べたいですか？」、「いつの天気を調べますか？」である可能性があり、この３つの応答文はすべて明確化タイプのタスク型文であり、この３つの応答文と入力文とのセマンティック類似度をそれぞれ算出し、「いつの天気を調べますか？」と入力文とのセマンティック類似度が最も高いことを得て、これによって「いつの天気を調べますか？」を現在のターゲット応答文とすることができる。

または、時間間隔に応じてターゲット応答文を決定してもよい。最初のＮ個の応答文のうち入力文との時間間隔が最も短い明確化タイプのタスク型応答文を、現在のターゲット応答文として決定してもよい。

例えば、Ｎが３であり、且つ入力文が「こんなにいい天気なら、何をするのに適していますか？」である場合、時間の順序によって、順次取得されたその前の３つの応答文は「天気を調べたいですか？それとも時間を調べたいですか？」、「いつの天気を調べますか？」、「天気がいいですね」であり、「天気がいいですね」は入力文との時間間隔が最も短い明確化タイプのタスク型応答文であるため、「天気がいいですね」を現在のターゲット応答文とすることができる。

本開示の実施例では、まず取得された入力文に基づいて、現在の対話状態に対してトラッキングして、生成対象のタスク型応答文のタイプを決定し、その後、入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成し、タスク型応答文のタイプが指定されていないタイプである場合、さらに入力文の意図を決定する。入力文の意図が非雑談的意図である場合、対話履歴のうち入力文に隣接する最初のＮ個の応答文を取得し、最初のＮ個の応答文に基づいて、対応する方式を選択して現在のターゲット応答文を生成する。これにより、タスク型の対話応答生成器によって生成されたタスク型応答文が指定されていないタイプであり、且つ入力文が非雑談的意図である場合、対話履歴のうち入力文に隣接する１つ前の応答文または複数の応答文に基づいて現在のターゲット応答文を生成し、これによって対話がタスク達成を目的として引き続き進んでいくように保障でき、タスク満足率を向上させるだけでなく、返された応答文が自然であり、ユーザがよい対話体験を取得できるようにすることができる。

上記実施例では、指定されていないタイプのタスク型応答文を取得した時、さらに入力文の意図を決定し、非雑談的意図の入力文に対して、対話履歴のうちそれに隣接する応答文に基づいて、対応するターゲット応答文を生成することができる。実際の応用では、入力文は雑談意図の文である可能性があり、この時、対話をよりスムーズにしながら、無意味な対話の継続を回避するために、現在の対話をさらに判断することができ、これによって対応するターゲット応答文を決定する。以下、図３と併せて入力文が雑談意図である状況に対して詳細に説明する。

図３は本開示の別の実施例によって提供される対話生成方法のフローチャートである。

ステップ３０１において、入力文を取得する。

ステップ３０２において、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する。

ステップ３０３において、入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成する。

ステップ３０４において、入力文を雑談応答生成器に入力して、雑談型応答文を生成する。

なお、ステップ３０３とステップ３０４は、具体的に使用する時、順序を問わず、ここでは１つの実現形態であり、本開示に対する限定としてはいけない。

ステップ３０５において、タスク型応答文のタイプが指定されていないタイプである場合、入力文の意図を決定する。

ステップ３０６において、入力文の意図が雑談意図である場合、履歴対話を取得する。

本開示の実施例では、履歴対話は、現在対話に最も近い前のラウンドの対話文であってもよく、または現在対話に最も近い前のいくつかのラウンドの対話文であってもよく、現在対話に最も近い前のタスク型の対話応答文であってもよいが、本開示はこれに対して限定するものではない。

なお、ユーザが雑談意図の入力文を入力した後、ユーザが引き続き雑談したい場合、ユーザの需要を満たすために、雑談型応答文を現在のターゲット応答文とすることができ、これによって引き続きユーザと対話することができる。

ステップ３０７において、履歴対話、雑談型応答文及び入力文に基づいて、雑談を終了するタイミングを決定する。

実際の使用プロセスにおいて、履歴対話における応答文のタイプに基づいて、履歴対話の関連タスクがすでに完成したか否かを決定することができる。

例えば、履歴対話において応答文のタイプが明確化のタイプである場合、当該履歴対話の関連タスクがまだ完成していない可能性がある明らかにする。例えば、履歴入力文は「天気を調べる」であり、履歴応答文は「いつの天気を調べますか？」であり、当該履歴応答文は明確化タイプの文であり、生成装置は天気を調べない、当該履歴対話の関連タスクは完成していない。

または、取得された履歴対話において応答文のタイプが満足タイプである場合、当該履歴対話の関連タスクはすでに完成した可能性があることを表明する。例えば、履歴入力文が「天気を調べる」であり、履歴応答文が「今日は晴れていて、そよ風が吹いている」である場合、当該履歴応答文は満足タイプの文であり、生成装置はユーザに天気状況を返事し、ユーザの「天気を調べる」という需要を満たし、当該履歴対話の関連タスクはすでに完成した。

なお、上記の例は単なる例示であり、本開示の実施例の履歴対話における応答文のタイプ、及び履歴対話の関連タスクがすでに完成したか否かを決定することへの限定としてはいけない。

その後、履歴対話の関連タスクが完成していない場合、雑談型応答文及び入力文と関連タスクとの関連度を決定する。

例えば、履歴対話における入力文が「北京の天気を調べる」であり、対応する応答文が「いつの天気を調べますか？」である場合、ユーザは北京天気の具体的な状況を得られず、当該履歴対話の関連タスクはまだ完成していない。現在対話において入力文が「今日は遊びに行きませんか？」である場合、これに対応して生成された雑談型応答文が「天気がよければ、遊びに行ってもいいですよ。」であってもよく、これによって雑談型応答文及び入力文と関連タスクとの関連度を決定する。

なお、上記の例は単なる例示であり、本開示の実施例における履歴対話の入力文、対応する応答文、そして雑談性応答文及び入力文と関連タスクとの関連度を決定することへの限定としてはいけない。

さらに、関連度が閾値より大きい場合、現在時刻が雑談を終了するタイミングであると決定する。

閾値は、設定された数値であってよく、具体的な状況に応じて設定してもよい。本開示はこれに対して限定するものではない。

例えば、閾値が０．７であり、関連度が０．９５であり、関連度が閾値より大きいことは、現在の入力文及び雑談型応答文がすべて履歴対話の関連タスクと緊密に関連していることを表明し、この時、雑談を終了しても不自然ではなく、同時に、履歴対話の関連タスクを引き続き完成することができ、ユーザの要求を満たすことに加えて、ユーザによい使用感をもたらすことができる。

なお、上記の例は単なる例示であり、本開示の実施例における関連度、閾値、及び現在時刻が雑談を終了するタイミングであると決定することへの限定としてはいけない。

または、関連度が閾値以下である場合、現在時刻が雑談を終了するタイミングではないと決定する。

例えば、閾値が０．６であり、関連度が０．１であり、関連度が閾値より遥かに小さいことは、現在の入力文及び雑談型応答文と履歴対話の関連タスクとの関連性が低いことを表明し、この時、雑談を直接終了すると、対話が固くて不自然であり、ユーザとの応答が一貫しておらず、ユーザに満足度の低い会話体験を与える可能性がある。

また、履歴対話の関連タスクがすでに完成した場合、現在時刻が雑談を終了するタイミングではないと決定する。

履歴対話の関連タスクがすでに完成した場合、ユーザの主要な問題がすでに解決されたことを表明し、現在時刻が雑談を終了するタイミングではないと決定することができ、この時に現在のチャッを続けてもよく、包括モードを選択してもよいが、本開示はこれに対して限定するものではない。

ステップ３０８において、現在時刻が雑談を終了するタイミングである場合、雑談型応答文、及び履歴対話のうち入力文に隣接する１つ前のタスク型応答文に基づいて、現在のターゲット応答文を生成する。

現在対話タスクがまだ完成していない場合、現在の時刻に雑談をできるだけ回避すべきであり、すなわち雑談を終了する必要があることを表明し、引き続きタスク型の対話に戻り、対話タスクを達成するために、この時に雑談応答、及び履歴対話のうち現在対話と最も近い１つ前のタスク型対話の最後のラウンドの応答を選択してターゲット応答文としてもよく、これによって、情報の紛失を引き起こすことなく、一貫性がより高い対話を生成でき、同時に、対話タスクを緊密にめぐってユーザの需要を満たすことができる。

例えば、１つ前のラウンドの入力文が「北京の天気を調べる」であり、対応する応答文が「いつの天気を調べますか？」である場合、現在時刻の入力文が雑談意図の「私と雑談しましょうか」という文である時、１つ前のタスク型応答文「いつの天気を調べますか？」に基づいて、当該対話タスクがまだ完成していないと判断することができ、この時、雑談を終了して引き続き対話タスクを達成することができる。ユーザが引き続き対話タスクを達成することを誘導するために、この時、雑談応答文及び１つ前のラウンドの応答文に基づいてターゲット応答文、例えば「私と雑談しましょうか、では、いつの天気を調べますか？」を生成することができる。

なお、上記の例は単なる例示であり、本開示の実施例においてターゲット応答文を生成することに対する限定としてはいけない。

ステップ３０９において、現在時刻が雑談を終了するタイミングではない場合、雑談型応答文を現在のターゲット応答文とする。

履歴対話、雑談型応答文及び入力文に基づいて、現在時刻が雑談を終了することに適合せず、ユーザと引き続き雑談すべきであると判断する場合、この時、雑談型応答文を現在のターゲット応答文としてもよい。

例えば、現在の入力文が「一緒に遊びに行きましょうか」で、雑談意図がある文であり、１つ前のラウンドの対話の入力文が「今日の北京の天気を調べます」であり、対応する応答文が「北京は今日晴れています。風が吹いています」である場合、当該応答文に基づいて、この時に、当該ラウンドの対話のタスクがすでに達成され、ユーザの需要がすでに満たされたと判断でき、ユーザ現在の入力文に基づいて、ユーザが現在雑談したい状態にある可能性があると判断し、この時、ユーザと引き続き雑談することを選択することで、ユーザがよい対話体験を得るようにし、これによって雑談型応答文を現在のターゲット応答文としてもよい。

本開示の実施例では、まず入力文を取得し、その後、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、取得された入力文をそれぞれタスク型の対話応答生成器と雑談応答生成器に入力して、対応するタスク型応答文と雑談型応答文を生成し、タスク型応答文が指定されていないタイプの文であり、入力文が雑談意図である場合、履歴対話、雑談型応答文と併せて、雑談を終了できるか否かを判断し、これによって雑談を終了する必要があるかに基づいてターゲット応答文を決定する。これにより、入力文を取得する時、タスク型応答文のタイプ、入力文の意図及び雑談を終了するタイミングなどの複数の方面に基づいて、返信対象のターゲット応答文を決定し、これによって対話がユーザタスクを達成することを保障でき、対話が滑らかで一貫するようにし、ユーザによりよい対話体験を与える。

上記実施例を実現するために、本開示の実施例は対話生成装置をさらに提供する。図４は、本開示の一実施例によって提供される対話生成装置の概略構造図である。

図４に示すように、当該対話生成装置４００は、第１の取得モジュール４１０、第１の決定モジュール４２０、第１の生成モジュール４３０及び第２の決定モジュール４４０と、を含む。

第１の取得モジュール４１０は、入力文を取得する。

第１の決定モジュール４２０は、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する。

第１の生成モジュール４３０は、前記入力文をタスク型の対話応答生成器に入力して、前記タスク型応答文を生成する。

第２の決定モジュール４４０は、前記タスク型応答文のタイプが指定されたタイプである場合、前記タスク型応答文がターゲット応答文であると決定する。

なお、本開示の実施例において上記各モジュールの機能及び具体的な実現原理について、上記各方法の実施例を参照でき、ここでは説明を省略する。

本開示の実施例の対話生成装置は、まず入力文を取得し、その後、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、入力文をタスク型の対話応答生成器に入力して、対応するタスク型応答文を生成し、当該タスク型応答文のタイプが指定されたタイプである場合、当該タスク型応答文をターゲット応答文としてもよい。これにより、対話を生成する時、指定されたタイプのタスク型応答文を優先的にターゲット応答文として返すことにより、対話が順調に進むことを保障する前提で、できるだけタスク型応答文を返し、対話システムの性能を改善し、ユーザによりよく、より速い対話体験をもたらすことができる。

図５は、本開示の別の実施例によって提供される対話生成装置の概略構造図である。

図５に示すように、当該対話生成装置５００は、第１の取得モジュール５１０、第１の決定モジュール５２０、第１の生成モジュール５３０、第３の決定モジュール５４０、第２の取得モジュール５５０及び第２の生成モジュール５６０を含む。

第１の取得モジュール５１０は、入力文を取得する。

本実施例の第１の取得モジュール５１０と、上記実施例の第１の取得モジュール４１０とは、同じ機能と構造を有すことができると理解することができる。

第１の決定モジュール５２０は、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する。

本実施例の第１の決定モジュール５２０と、上記実施例の第１の決定モジュール４２０とは、同じ機能と構造を有すことができると理解することができる。

第１の生成モジュール５３０は、前記入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成する。

本実施例の第１の生成モジュール５３０と、上記実施例の第１の生成モジュール４３０とは、同じ機能と構造を有すことができると理解することができる。

第３の決定モジュール５４０は、前記タスク型応答文が指定されていないタイプの文である場合、前記入力文の意図を決定する。

第２の取得モジュール５５０は、前記入力文の意図が非雑談的意図である場合、対話履歴のうち前記入力文に隣接する最初のＮ個の応答文を取得し、Ｎは正の整数である。

第２の生成モジュール５６０は、前記最初のＮ個の応答文に基づいて、現在のターゲット応答文を生成する。

１つの可能な実現形態では、第２の生成モジュール５６０は、具体的に前記１つ前の応答文が明確化タイプのタスク型文である場合、前記１つ前の応答文を前記現在のターゲット応答文として決定する。または、前記１つ前の応答文が非明確化タイプのタスク型文である場合、指定された応答文を前記現在のターゲット応答文として決定する。

別の可能な実現形態では、第２の生成モジュール５６０は、具体的に前記最初のＮ個の応答文のうち前記入力文とのセマンティック類似度が最も高い明確化タイプのタスク型応答文を、前記現在のターゲット応答文として決定する。または、前記最初のＮ個の応答文のうち前記入力文との時間間隔が最も短い明確化タイプのタスク型応答文を、前記現在のターゲット応答文として決定する。

本開示の実施例の対話生成装置は、まず入力文を取得し、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、その後、取得された入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成し、タスク型応答文のタイプが指定されていないタイプである場合、入力文の意図をさらに決定する。入力文の意図が非雑談的意図である場合、対話履歴のうち入力文に隣接する最初のＮ個の応答文を取得し、最初のＮ個の応答文に基づいて、対応する方式を選択して現在のターゲット応答文を生成する。これにより、タスク型の対話応答生成器によって生成されたタスク型応答文が指定されていないタイプであり、且つ入力文が非雑談的意図である場合、対話履歴のうち入力文に隣接する１つ前の応答文または複数の応答文に基づいて現在のターゲット応答文を生成し、これによって対話がタスク達成を目的として引き続き進んでいくように保障でき、タスク満足率を向上させるだけでなく、返された応答文が自然であり、ユーザがよい対話体験を取得できるようにする。

図６は本開示の別の実施例によって提供される対話生成装置の概略構造図である。

図６に示すように、当該対話生成装置６００は、第１の取得モジュール６１０、第１の決定モジュール６２０、第１の生成モジュール６３０、第３の決定モジュール６４０、第３の生成モジュール６５０、第４の決定モジュール６６０を含む。

第１の取得モジュール６１０は、入力文を取得する。

本実施例の第１の取得モジュール６１０と、上記任意の実施例の第１の取得モジュールとは、同じ機能と構造を有すことができると理解することができる。

第１の決定モジュール６２０は、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する。

本実施例の第１の決定モジュール６２０と、上記実施例の第１の決定モジュールとは、同じ機能と構造を有すことができると理解することができる。

第１の生成モジュール６３０は、前記入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成する。

本実施例の第１の生成モジュール６３０と、上記任意の実施例の第１の生成モジュールとは、同じ機能と構造を有すことができると理解することができる。

第３の決定モジュール６４０は、前記タスク型応答文が指定されていないタイプの文である場合、前記入力文の意図を決定する。

本実施例の第３の決定モジュール６４０と、上記実施例の第３の決定モジュール５４０とは、同じ機能と構造を有すことができると理解することができる。

第３の生成モジュール６５０は、前記入力文を雑談応答生成器に入力して、雑談型応答文を生成する。

第４の決定モジュール６６０は、前記入力文の意図が雑談意図である場合、前記雑談型応答文を現在のターゲット応答文とする。

１つの可能な実現形態では、前記装置は第４の生成モジュールをさらに含み、前記入力文を雑談応答生成器に入力して、雑談型応答文を生成する。

第３の取得モジュールは、前記入力文の意図が雑談意図である場合、履歴対話を取得する。

第５の決定モジュールは、前記履歴対話、雑談型応答文及び前記入力文に基づいて、雑談を終了するタイミングを決定する。

１つの可能な実現形態では、第５の決定モジュールは、前記履歴対話における応答文のタイプに基づいて、前記履歴対話の関連タスクがすでに完成したか否かを決定する。前記履歴対話の関連タスクがまだ完成していない場合、前記雑談型応答文及び前記入力文と前記関連タスクとの関連度を決定する。前記関連度が閾値より大きい場合、現在時刻が前記雑談を終了するタイミングであると決定する。

１つの可能な実現形態では、第５の決定モジュールは、具体的に前記履歴対話の関連タスクがすでに完成した場合、現在時刻が前記雑談を終了するタイミングではないと決定する。

１つの可能な実現形態では、第５の決定モジュールは、具体的に前記関連度が閾値以下である場合、現在時刻が前記雑談を終了するタイミングではないと決定する。

１つの可能な実現形態では、第４の生成モジュールは、現在時刻が前記雑談を終了するタイミングである場合、前記雑談型応答文、及び前記履歴対話のうち前記入力文に隣接する１つ前のタスク型応答文に基づいて、現在のターゲット応答文を生成する。

１つの可能な実現形態では、第２の決定モジュールは、現在時刻が前記雑談を終了するタイミングではない場合、前記雑談型応答文を現在のターゲット応答文とする。

本開示の実施例の対話生成装置は、まず入力文を取得し、その後、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、その後、取得された入力文をそれぞれタスク型の対話応答生成器と雑談応答生成器に入力して、対応するタスク型応答文と雑談型応答文を生成し、タスク型応答文が指定されていないタイプの文であり、入力文が雑談意図である場合、履歴対話、雑談型応答文と併せて、雑談を終了できるか否かを判断し、これによって雑談を終了する必要があるかに基づいてターゲット応答文を決定する。これにより、入力文を取得する時、タスク型応答文のタイプ、入力文の意図及び雑談を終了するタイミングなどの複数の方面に基づいて、返信対象のターゲット応答文を決定し、これによって対話がユーザタスクを達成することを保障でき、対話が滑らかで一貫するようにし、ユーザによりよい対話体験を与える。

本開示の実施例によれば、本開示は、電子機器、及び読み取り可能な記憶媒体、をさらに提供する。

図７に示すように、本開示の実施例に係る対話生成方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、形態情報端末、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の同様のコンピューティングデバイスなどの様々な形式のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は、単なる例であり、本明細書の説明及び／又は要求される本開示の実現を制限することを意図したものではない。

図７示すように、当該電子機器は、１つ又は複数のプロセッサ７０１と、メモリ７０２と、高速インターフェースと低速インターフェースを含む各コンポーネントを接続するためのインターフェースと、を含む。各コンポーネントは、異なるバスで相互に接続され、共通のマザーボードに取り付けられてもよいし、又は必要に応じて他の方式で取り付けられてもよい。プロセッサは、外部入力／出力装置（インターフェースに結合されたディスプレイデバイスなど）にＧＵＩの図形情報をディスプレイするためにメモリに記憶されている命令を含む、電子機器内に実行される命令を処理することができる。他の実施形態では、必要があれば、複数のプロセッサ及び／又は複数のバスを、複数のメモリとともに使用することができる。同様に、複数の電子機器を接続することができ、各電子機器は、必要な操作（例えば、サーバアレイ、ブレードサーバ、又はマルチプロセッサシステムとする）の一部を提供する。図７では、１つのプロセッサ７０１を例とする。

メモリ７０２は、本開示により提供される非一時的なコンピュータ読み取り可能な記憶媒体である。前記メモリには、少なくとも１つのプロセッサによって実行される命令を記憶して、前記少なくとも１つのプロセッサが本開示により提供される対話生成方法を実行することができるようにする。本開示の非一時的なコンピュータ読み取り可能な記憶媒体は、コンピュータが本出願により提供される対話生成方法を実行するためのコンピュータ命令を記憶する。

メモリ７０２は、非一時的なコンピュータ読み取り可能な記憶媒体として、本開示の実施例における対話生成方法に対応するプログラム命令／モジュール（例えば、図４に示す第１の取得モジュール４１０、第１の決定モジュール４２０、第１の生成モジュール４３０及び第２の決定モジュール４４０）のような非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能プログラム及びモジュールを記憶する。プロセッサ７０１は、メモリ７０２に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち上記の方法の実施例における対話生成方法を実現する。

メモ７０２は、プログラム記憶領域とデータ記憶領域とを含むことができ、プログラム記憶領域は、オペレーティングシステム、少なくとも１つの機能に必要なアプリケーションを記憶することができ、データ記憶領域は、電子機器の使用によって作成されたデータなどを記憶することができる。また、メモリ７０２は、高速ランダムアクセスメモリを含むことができ、少なくとも１つの磁気ディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスなどの非一時的なメモリをさらに含むことができる。いくつかの実施例では、メモリ７０２は、プロセッサ７０１に対して遠隔に設定されたメモリを選択的に含むことができ、これらの遠隔メモリは、ネットワークを介して対話生成方法の電子機器に接続されることができる。上記ネットワークの例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク及びそれらの組み合わせを含むが、これらに限定されない。

対話生成方法の電子機器は、入力装置７０３と出力装置７０４とをさらに含むことができる。プロセッサ７０１、メモリ７０２、入力装置７０３、及び出力装置７０４は、バス又は他の方式を介して接続することができ、図７では、バスを介して接続することを例とする。

入力装置７０３は、入力された数字又は文字情報を受信することができ、及び対話生成方法の電子機器のユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、１つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置７０４は、ディスプレイデバイス、補助照明デバイス（例えば、ＬＥＤ）、及び触覚フィードバックデバイス（例えば、振動モータ）などを含むことができる。当該ディスプレイデバイスは、液晶ディスプレイ（ＬＣＤ）、発光ダイオード（ＬＥＤ）ディスプレイ、及びプラズマディスプレイを含むことができるが、これらに限定されない。いくつかの実施形態では、ディスプレイデバイスは、タッチスクリーンであってもよい。

本明細書で説明されたシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けＡＳＩＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び／又は解釈することができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも１つの入力装置、及び当該少なくとも１つの出力装置に伝送することができる。

これらのコンピューティングプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる）は、プログラマブルプロセッサの機械命令を含み、高レベルのプロセス及び／又は対象指向プログラミング言語、及び／又はアセンブリ／機械言語でこれらのコンピューティングプログラムを実施する。本明細書に使用されるような、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、機械命令及び／又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、機器、及び／又は装置（例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス（ＰＬＤ））を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び／又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。

ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータ上で実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウス又はトラックボール）とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、任意の形式（音響入力と、音声入力、または、触覚入力とを含む）でユーザからの入力を受信することができる。

ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションできる）、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実行することができる。任意の形式又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットと、ブロックチェーンネットワークを含む。

コンピュータシステムは、クライアントとサーバを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、かつ互いにクライアント－サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバはクラウドサーバであってもよく、クラウドコンピューティングサーバまたはクラウドホストとも呼ばれ、クラウドコンピューティングサービスシステムにおける１つのホスト製品であり、従来の物理ホストとＶＰＳ（ＶｉｒｔｕａｌＰｒｉｖａｔｅＳｅｒｖｅｒ，仮想専用サーバ）サービスに存在する管理の難しさ、業務拡張性の弱いという欠陥を解決した。サーバは分散システムのサーバであってもよく、またはブロックチェーンと組み合わせたサーバであってもよい。

本開示の実施例に係る技術案によれば、まず入力文を取得し、その後、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、入力文をタスク型の対話応答生成器に入力して、対応するタスク型応答文を生成し、当該タスク型応答文のタイプが指定されたタイプである場合、当該タスク型応答文をターゲット応答文としてもよい。これにより、対話を生成する時、指定されたタイプのタスク型応答文を優先的にターゲット応答文として返すことにより、対話が順調に進むことを保障する前提で、できるだけタスク型応答文を返し、対話システムの性能を改善し、ユーザによりよく、より速い対話体験をもたらすことができる。

当該コンピュータプログラムはプロセッサによって実行される場合、上記のいずれかの実施例に記載の対話生成方法を実現することができる。

コンピュータプログラムが実行される場合、以下のような有益な効果が存在する。
まず入力文を取得し、その後入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、入力文をタスク型の対話応答生成器に入力して、対応するタスク型応答文を生成し、当該タスク型応答文のタイプが指定されたタイプである場合、当該タスク型応答文をターゲット応答文としてもよい。これにより、対話を生成する時、指定されたタイプのタスク型応答文を優先的にターゲット応答文として返すことにより、対話が順調に進むことを保障する前提で、できるだけタスク型応答文を返し、対話システムの性能を改善し、ユーザによりよく、より速い対話体験をもたらすことができる。

なお、上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次実行されてもよいし、異なる順序で実行されてもよいが、本開示で開示されている技術案の所望の結果を実現できる限り、本明細書はここで制限するものではない。

上記具体的な実施形態は、本開示の保護範囲を制限するものではない。当業者は、設計要件と他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができると理解すべきである。任意の本開示の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれるべきである。

Claims

対話生成方法であって、
入力文を取得するステップと、
前記入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定するステップと、
前記入力文をタスク型の対話応答生成器に入力して、前記タスク型応答文を生成するステップと、
前記タスク型応答文のタイプが指定されたタイプである場合、前記タスク型応答文がターゲット応答文であると決定するステップと、を含む、
対話生成方法。
前記タスク型応答文のタイプが指定されていないタイプである場合、前記入力文の意図を決定するステップと、
前記入力文の意図が非雑談的意図である場合、対話履歴のうち前記入力文に隣接する最初のＮ個の応答文を取得するステップであって、Ｎは正の整数であるステップと、
前記最初のＮ個の応答文に基づいて、現在のターゲット応答文を生成するステップと、をさらに含む、
請求項１に記載の方法。
Ｎは１であり、前記最初のＮ個の応答文に基づいて、現在のターゲット応答文を生成するステップは、
１つ前の応答文が明確化タイプのタスク型文である場合、前記１つ前の応答文を前記現在のターゲット応答文として決定するステップ、
または、
前記１つ前の応答文が非明確化タイプのタスク型文である場合、指定された応答文を前記現在のターゲット応答文として決定するステップ、を含む、
請求項２に記載の方法。
Ｎは１より大きく、前記最初のＮ個の応答文に基づいて、現在のターゲット応答文を生成するステップは、
前記最初のＮ個の応答文のうち前記入力文とのセマンティック類似度が最も高い明確化タイプのタスク型応答文を、前記現在のターゲット応答文として決定するステップ、
または、
前記最初のＮ個の応答文のうち前記入力文との時間間隔が最も短い明確化タイプのタスク型応答文を、前記現在のターゲット応答文として決定するステップと、を含む、
請求項２に記載の方法。
前記入力文を雑談応答生成器に入力して、雑談型応答文を生成するステップと、
前記入力文の意図が雑談意図である場合、前記雑談型応答文を現在のターゲット応答文とするステップと、をさらに含む、
請求項２～４のいずれか一項に記載の方法。
前記入力文を雑談応答生成器に入力して、前記雑談型応答文を生成するステップと、
前記入力文の意図が雑談意図である場合、履歴対話を取得するステップと、
前記履歴対話、雑談型応答文及び前記入力文に基づいて、雑談を終了するタイミングを決定するステップと、
現在時刻が前記雑談を終了するタイミングである場合、前記雑談型応答文、及び前記履歴対話のうち前記入力文に隣接する１つ前のタスク型応答文に基づいて、現在のターゲット応答文を生成するステップと、をさらに含む、
請求項２～４のいずれか一項に記載の方法。
現在時刻が前記雑談を終了するタイミングではない場合、前記雑談型応答文を現在のターゲット応答文とするステップをさらに含む、
請求項６に記載の方法。
前記履歴対話、雑談型応答文及び前記入力文に基づいて、雑談を終了するタイミングを決定するステップは、
前記履歴対話における応答文のタイプに基づいて、前記履歴対話の関連タスクがすでに完成したか否かを決定するステップと、
前記履歴対話の関連タスクがまだ完成していない場合、前記雑談型応答文及び前記入力文と前記関連タスクとの関連度を決定するステップと、
前記関連度が閾値より大きい場合、現在時刻が前記雑談を終了するタイミングであると決定するステップと、を含む、
請求項６に記載の方法。
前記履歴対話の関連タスクがすでに完成したか否かを決定するステップの後、
前記履歴対話の関連タスクがすでに完成した場合、現在時刻が前記雑談を終了するタイミングではないと決定するステップをさらに含む、
請求項８に記載の方法。
前記雑談型応答文及び前記入力文と前記関連タスクとの関連度を決定するステップの後、
前記関連度が閾値以下である場合、現在時刻が前記雑談を終了するタイミングではないと決定するステップをさらに含む、
請求項８に記載の方法。
対話生成装置であって、
入力文を取得する第１の取得モジュールと、
前記入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する第１の決定モジュールと、
前記入力文をタスク型の対話応答生成器に入力して、前記タスク型応答文を生成する第１の生成モジュールと、
前記タスク型応答文のタイプが指定されたタイプである場合、前記タスク型応答文がターゲット応答文であると決定する第２の決定モジュールと、を含む、
対話生成装置。
前記タスク型応答文のタイプが指定されていないタイプである場合、前記入力文の意図を決定する第３の決定モジュールと、
前記入力文の意図が非雑談的意図である場合、対話履歴のうち前記入力文に隣接する最初のＮ個の応答文を取得する第２の取得モジュールであって、Ｎは正の整数である第２の取得モジュールと、
前記最初のＮ個の応答文に基づいて、現在のターゲット応答文を生成する第２の生成モジュールと、をさらに含む、
請求項１１に記載の装置。
前記第２の生成モジュールは、具体的に、
１つ前の応答文が明確化タイプのタスク型の文である場合、前記１つ前の応答文を前記現在のターゲット応答文として決定し、
または、
前記１つ前の応答文が非明確化タイプのタスク型文である場合、指定された応答文を前記現在のターゲット応答文として決定する、
請求項１２に記載の装置。
前記第２の生成モジュールは、具体的に、
前記最初のＮ個の応答文のうち前記入力文とのセマンティック類似度が最も高い明確化タイプのタスク型応答文を、前記現在のターゲット応答文として決定し、
または、
前記最初のＮ個の応答文のうち前記入力文との時間間隔が最も短い明確化タイプのタスク型応答文を、前記現在のターゲット応答文として決定する、
請求項１２に記載の装置。
前記入力文を雑談応答生成器に入力して、前記雑談型応答文を生成する第３の生成モジュールと、
前記入力文の意図が雑談意図である場合、前記雑談型応答文を現在のターゲット応答文とする第４の決定モジュールと、をさらに含む、
請求項１２～１４のいずれか一項に記載の装置。
前記入力文を雑談応答生成器に入力して、前記雑談型応答文を生成する第４の生成モジュールと、
前記入力文の意図が雑談意図である場合、履歴対話を取得する第３の取得モジュールと、
前記履歴対話、雑談型応答文及び前記入力文に基づいて、雑談を終了するタイミングを決定する第５の決定モジュールと、
現在時刻が前記雑談を終了するタイミングである場合、前記雑談型応答文、及び前記履歴対話のうち前記入力文に隣接する１つ前のタスク型応答文に基づいて、現在のターゲット応答文を生成する前記第４の生成モジュールと、をさらに含む、
請求項１２～１４のいずれか一項に記載の装置。
前記第２の決定モジュールは、さらに現在時刻が前記雑談を終了するタイミングではない場合、前記雑談型応答文を現在のターゲット応答文とする、
請求項１６に記載の装置。
前記第５の決定モジュールは具体的に、
前記履歴対話における応答文のタイプに基づいて、前記履歴対話の関連タスクがすでに完成したか否かを決定し、
前記履歴対話の関連タスクがまだ完成していない場合、前記雑談型応答文及び前記入力文と前記関連タスクとの関連度を決定し、
前記関連度が閾値より大きい場合、現在時刻が前記雑談を終了するタイミングであると決定する、
請求項１６に記載の装置。
前記第５の決定モジュールは、具体的に、
前記履歴対話の関連タスクがすでに完成した場合、現在時刻が前記雑談を終了するタイミングではないと決定する、
請求項１８に記載の装置。
前記第５の決定モジュールは、具体的に、
前記関連度が閾値以下である場合、現在時刻が前記雑談を終了するタイミングではないと決定する、
請求項１８に記載の装置。
電子機器であって、
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも１つのプロセッサによって実行される場合、前記少なくとも１つのプロセッサが請求項１～１０のいずれか一項に記載の対話生成方法を実行させる、
電子機器。
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、前記コンピュータに請求項１～１０のいずれか一項に記載の対話生成方法を実行させる、
非一時的なコンピュータ読み取り可能な記憶媒体。
コンピュータプログラムであって、
前記コンピュータプログラムは、コンピュータにより実行される場合、前記コンピュータに請求項１～１０のいずれか一項に記載の対話生成方法を実行させる、
コンピュータプログラム。