JP2021103556A

JP2021103556A - 対話生成方法、装置、電子機器及び記憶媒体

Info

Publication number: JP2021103556A
Application number: JP2021048627A
Authority: JP
Inventors: ユンシュ; Jun Xu; ゼヤンライ; Zeyang Lei; ツェンギュニウ; Zhengyu Niu; フアウ; Hua Wu; ワン　ハイフェン; Haifeng Wang; ハイフェンワン
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-09-18
Filing date: 2021-03-23
Publication date: 2021-07-15
Anticipated expiration: 2041-03-23
Also published as: CN111930916B; CN111930916A; EP3855323A1; JP7216133B2; KR20210119340A; US20210280189A1

Abstract

【課題】対話ターゲットを明確にし、制御可能とし、対話効率を向上させる対話生成方法、装置、電子機器及び記憶媒体を提供する。【解決手段】方法は、入力文を取得し、対話グラフから入力文に対応する第１の連語を取得する。対話グラフには、互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれる。各対話ターゲットクラスタには、複数の連語が含まれる。複数の対話ターゲットクラスタ間の関連関係及び対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから前記第１の連語に関連する第２の連語を取得し、第２の連語及び入力文に基づいて、応答文を生成する。【選択図】図１

Description

本出願は、コンピュータ技術分野に関し、具体的には自然言語処理技術分野に関し、特に対話生成方法、装置、電子機器及び記憶媒体に関する。

ヒューマンコンピュータ対話は、人工知能にとって重要な課題であり、近年、人工知能の台頭に伴い、ヒューマンコンピュータ対話の研究もますます熱くなっている。ヒューマンコンピュータ対話は、生活に多くの便利さをもたらし、人的資源を節約する。多くの対話アプリケーションは、複数回の対話において、物品を推奨するようなターゲットを達成する必要がある。

したがって、ヒューマンコンピュータ対話プロセスで対話ターゲットをどのように達成するかが特に重要である。

本出願は、対話ターゲットが明確で制御可能である対話を生成するための対話生成方法、装置、電子機器及び記憶媒体を提供する。

第１の態様によれば、
入力文を取得するステップと、
対話グラフから前記入力文に対応する第１の連語を取得するステップであって、ここで、前記対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれるステップと、
前記複数の対話ターゲットクラスタ間の関連関係及び前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第１の連語に関連する第２の連語を取得するステップと、
前記第２の連語及び前記入力文に基づいて、応答文を生成するステップと、を含む対話生成方法を提供する。

本出願の実施例の対話生成方法は、入力文を取得し、対話グラフから入力文に対応する第１の連語を取得し、対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれ、複数の対話ターゲットクラスタ間の関連関係及び対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから前記第１の連語に関連する第２の連語を取得し、第２の連語及び入力文に基づいて、応答文を生成する。これにより、対話ターゲットクラスタと連語二重構造が含まれる対話グラフを用いることによって、対話ターゲットクラスタ間、及び各単語間の関連関係に基づいて、応答文を生成することで、生成された対話ターゲットを明確にし、制御可能とし、対話効率を向上させる。

第２の態様によれば、
入力文を取得するための第１の取得モジュールと、
対話グラフから前記入力文に対応する第１の連語を取得するための第２の取得モジュールであって、ここで、前記対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれる第２の取得モジュールと、
前記複数の対話ターゲットクラスタ間の関連関係及び前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第１の連語に関連する第２の連語を取得するための第３の取得モジュールと、
前記第２の連語及び前記入力文に基づいて、応答文を生成するための生成モジュールと、を含む対話生成装置を提供する。

本出願の実施例の対話生成装置は、入力文を取得し、対話グラフから入力文に対応する第１の連語を取得し、対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれ、複数の対話ターゲットクラスタ間の関連関係及び対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから前記第１の連語に関連する第２の連語を取得し、第２の連語及び入力文に基づいて、応答文を生成する。これにより、対話ターゲットクラスタと連語二重構造が含まれる対話グラフを用いることによって、対話ターゲットクラスタ間、及び各単語間の関連関係に基づいて、応答文を生成することで、生成された対話ターゲットを明確にし、制御可能とし、対話効率を向上させる。

第３の態様によれば、
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を含む電子機器を提供し、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも１つのプロセッサが上記一態様の実施例に記載の対話生成方法を実行できるように、前記少なくとも１つのプロセッサによって実行される。

第４の態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに上記一態様の実施例に記載の対話生成方法を実行させる。
第５の態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムは、コンピュータに上記一態様の実施例に記載の対話生成方法を実行させる。

本出願の実施例によれば、対話ターゲットクラスタと連語二重構造が含まれる対話グラフを用いることによって、対話ターゲットクラスタ間、及び各単語間の関連関係に基づいて、応答文を生成することで、生成された対話ターゲットを明確にし、制御可能とし、対話効率を向上させる。

上記選択可能な方式が有する他の効果については、以下、具体的な実施例と組み合わせて説明する。
図面は、本技術案をよりよく理解するために使用され、本出願を限定するものではない。

本出願の実施例により提供される対話生成方法のフローチャートである。本出願の実施例により提供されるもう１つの対話生成方法のフローチャートである。本出願の実施例により提供される対話グラフにおける連語間の接続辺の概略図である。本出願の実施例により提供されるもう１つの対話生成方法のフローチャートである。本出願の実施例により提供されるもう１つの対話生成方法のフローチャートである。本出願の実施例により提供されるもう１つの対話生成方法のフローチャートである。本出願の実施例により提供される対話グラフの概略図である。本出願の実施例により提供される対話生成装置の概略構成図である。本出願の実施例の対話生成方法の電子機器のブロック図である。

以下、図面と組み合わせて本出願の例示的な実施例を説明し、理解を容易にするためにその中には本出願の実施例の様々な詳細事項を含んでおり、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本出願の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができることを認識されたい。同様に、明確及び簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。

以下、図面を参照して本出願の実施例の対話生成方法、装置、電子機器及び記憶媒体を説明する。

本出願の実施例の対話生成方法は、対話ターゲットクラスタと連語二重構造が含まれる対話グラフを用いることによって、対話ターゲットクラスタ間、及び各単語間の関連関係に基づいて、応答文を生成することで、生成された対話ターゲットを明確にし、制御可能とし、対話効率を向上させる。

図１は本出願の実施例により提供される対話生成方法のフローチャートである。

本出願の実施例の対話生成方法は、本出願の実施例により提供される対話生成装置によって実行することができ、当該装置は、対話ターゲットが明確で制御可能な対話を生成することを実現するように、電子機器に配置することができる。

図１に示すように、当該対話生成方法は、ステップ１０１〜ステップ１０４を含む。

ステップ１０１：入力文を取得する。

本実施例において、入力文はユーザによって入力された音声語句であってもよい。例えば、ユーザは「今日の天気はどうですか」と音声入力する。

ステップ１０２：対話グラフから入力文に対応する第１の連語を取得し、ここで、対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれる。

入力文を取得した後、対話グラフから入力文に対応する第１の連語を取得する。ここで、対話グラフは予め作成され、対話グラフにおいて、各連語を１つのノードとし、ノードとノードとの間の接続辺は、２つの連語間の関連を表すことができる。

本実施例において、対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれる。ここで対話ターゲットクラスタに含まれる複数の連語が属する対話ターゲットは同じである。つまり、各対話ターゲットクラスタは１つの対話ターゲットに対応する。

例えば、ＨとＴという２つの対話ターゲットクラスタがあり、対話ターゲットクラスタＨには「温度」、「風がある」、「大雨」、「暑い」、「熱中症」、「高温」など、天気に関連する複数の連語が含まれ、ここで、「高温」が「熱中症」に関連し、「温度」が「高温」に関連する。対話ターゲットクラスタＴには「飛行機」、「列車」、「自ら運転する」、「雨あり」、「天気」、「日焼け止め」など、旅行に関連する複数の連語があり、ここで、「天気」がそれぞれ「雨あり」、「日焼け止め」に関連する。且つ、２つの対話ターゲットクラスタＨとＴもお互いに関連し、対話ターゲットクラスタＨにおける「大雨」が対話ターゲットクラスタＴにおける「雨あり」、「天気」に関連し、対話ターゲットクラスタＨにおける「高温」が対話ターゲットクラスタＴにおける「日焼け止め」に関連する。

本実施例において、対話グラフは二重構造であり、１層が対話ターゲットクラスタであり、もう１層が連語であり、ここでは連語が下層であり、対話ターゲットクラスタが上層であると見なすことができ、すなわちこの対話グラフは階層化対話グラフである。

また、連語間の関連関係とは、連語間が同時に一組の対話中に出現し、一定の関連を有することを指し、複数の対話ターゲットクラスタが互いに関連していることは、複数の対話ターゲットクラスタ内の連語間に関連関係があると見なすことができる。

第１の連語を取得する場合、入力文からキーワードを抽出し、対話グラフからキーワードとの類似度が最も高い連語を第１の連語として取得することができる。これによって、入力文を対話グラフにおける１つのノードにマッピングする。

例えば、「今日の天気はどうですか」のキーワードが「天気」であり、対話グラフから「天気」に対応する連語を取得することができる。

ステップ１０３：複数の対話ターゲットクラスタ間の関連関係及び対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第１の連語に関連する第２の連語を取得する。

第１の連語を決定した後、対話グラフを照会することにより、第１の連語が属する対話ターゲットクラスタを決定し、そして第１の連語が属する対話ターゲットクラスタにおける連語間の関連関係に基づいて、第２の連語を選ぶことができる。

具体的には、第１の連語が属する対話ターゲットクラスタのうち、第１の連語と関連関係がある連語の中から、ランダムに１つを第２の連語として選択し、または第１の連語が属する対話ターゲットクラスタのうち、第１の連語と関連関係があり、且つ他の連語と最も関連関係がある連語を第２の連語とすることができる。

ステップ１０４：第２の連語及び入力文に基づいて、応答文を生成する。

第２の連語を取得した後、第２の連語に基づいて、入力文に含まれる連語を組み合わせて、応答文を生成することができる。

具体的には、第２の連語及び入力文を生成モデルに入力し、生成モデルによって応答文を生成することができる。例えば、第２の連語及び入力文を記憶に基づくシーケンスからシーケンスを指向するモデルに入力し、このモデルによって応答文を生成する。

ユーザが応答文に基づいて語句を再度入力する場合、ユーザによって再度入力された語句に基づいて、上記方法によって応答文を生成する。これによって、複数回の対話を生成することができる。

本実施例において、応答文を生成するための第２の連語は、対話ターゲットクラスタと連語二重構造が対話グラフから選択された連語であるので、第２の連語に基づいて生成された応答文は、対話ターゲットが明確で制御可能であり、階層化を有する。

本出願の実施例において、入力文を取得し、対話グラフから入力文に対応する第１の連語を取得し、対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれ、複数の対話ターゲットクラスタ間の関連関係及び対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから前記第１の連語に関連する第２の連語を取得し、第２の連語及び入力文に基づいて、応答文を生成する。これにより、対話ターゲットクラスタと連語二重構造が含まれる対話グラフを用いることによって、対話ターゲットクラスタ間、及び各単語間の関連関係に基づいて、応答文を生成することで、生成された対話ターゲットを明確にし、制御可能とし、対話効率を向上させる。

生成された対話の対話ターゲットをより明確にするために、上記対話グラフから第１の連語に関連する第２の連語を取得するステップに対して、本出願の１つの実施例において、まず対話グラフ内の下層から第１の連語に関連する複数の候補連語を取得し、そして第１の連語が属する対話ターゲットクラスタ、及び各候補連語が属する上層対話ターゲットクラスタに基づいて、１つの対話ターゲットクラスタを決定し、この対話ターゲットクラスタから第２の連語を取得することができる。以下、図２と組み合わせて説明し、図２は本出願の実施例により提供されるもう１つの対話生成方法のフローチャートである。

図２に示すように、上記複数の対話ターゲットクラスタ間の関連関係及び対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第１の連語に関連する第２の連語を取得するステップは、ステップ２０１〜ステップ２０３を含む。

ステップ２０１：対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第１の連語に関連する複数の第１の候補連語を取得する。

本実施例において、対話グラフにおける複数の連語間には関連関係があり、複数の連語間の関連関係に基づいて、対話グラフにおける第１の連語に関連する複数の連語を決定することができ、区別の便宜上、第１の候補連語と呼ぶ。ここで、第１の候補連語は、第１の連語と同じ対話ターゲットクラスタに属する場合もあれば、それぞれ異なる対話ターゲットクラスタに属する場合もある。

ここで、対話グラフにおける第１の連語に関連するすべての連語を第１の候補連語とすることができ、その中の一部を第１の候補連語とすることもでき、例えば第１の連語に関連するすべての連語から、入力文とのマッチング度が高い連語の一部を第１の候補連語として選択する。

ステップ２０２：第１の連語が属する第１の対話ターゲットクラスタと、複数の第１の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第２の対話ターゲットクラスタを決定する。

本実施例において、対話グラフにおける各対話ターゲットクラスタに含まれる複数の連語に基づいて、第１の連語が属する対話ターゲットクラスタを決定し、ここでは第１の対話ターゲットクラスタと呼び、及び各第１の候補連語が属する対話ターゲットクラスタを決定し、ここでは候補対話ターゲットクラスタと呼ぶことができる。これにより、対話グラフの下層連語から複数の第１の候補連語を取得し、上層対話ターゲットクラスタから複数の候補対話ターゲットクラスタを決定することができる。

第１の連語が属する第１の対話ターゲットクラスタ、及び複数の第１の候補連語のそれぞれが属する各候補対話ターゲットクラスタを決定した後、第１の対話ターゲットクラスタと各候補対話ターゲットクラスタとの間の関連関係に基づいて、複数の候補ターゲットクラスタから第２の対話ターゲットクラスタを取得することができる。ここで、第２の対話ターゲットクラスタに対応する対話ターゲットは、現在の対話の対話ターゲットと見なすことができる。

具体的には、各候補対話ターゲットクラスタから、第１の対話ターゲットクラスタとの距離が最も近い候補対話ターゲットクラスタを第２の対話ターゲットクラスタとして選択することができる。または、含まれる複数の連語が第１の対話ターゲットクラスタ中の連語と最も関連の多い候補対話ターゲットクラスタを第２の対話ターゲットクラスタとして選択することもできる。または、第１の対話ターゲットクラスタとの関連度が最も高い候補対話ターゲットクラスタを第２の対話ターゲットクラスタとして選択する。

または、前回対話を生成している際の第２の対話ターゲットクラスタとの距離が最も小さい候補対話ターゲットクラスタを現在の第２の対話ターゲットクラスタとして選択することもできる。これにより、現在生成された対話を生成された前回の対話に関連付け、生成された対話ターゲットをより明確にするだけでなく、生成された対話をより一貫性のあるものにする。

または、複数の候補対話ターゲットクラスタのうち、第２の対話ターゲットクラスタとして選択される回数が最も多い候補対話ターゲットクラスタを第２の対話ターゲットクラスタとする。これにより、長期的に第２の対話ターゲットクラスタとされる候補対話ターゲットクラスタを、現在対話を生成している際の第２の対話ターゲットクラスタとすることで、生成された対話のターゲットをより正確にする。

ステップ２０３：第２の対話ターゲットクラスタから第１の連語に関連する第２の連語を取得する。

第２の対話ターゲットクラスタを決定した後、第２の対話ターゲットクラスタにおける他の連語との関連関係が最も多い連語を第１の連語に関連する第２の連語とし、または第１の連語との関連度が最も高い連語を第２の連語とするなどことができる。

本出願の実施例において、複数の対話ターゲットクラスタ間の関連関係及び対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第１の連語に関連する第２の連語を取得する場合、対話グラフの下層連語から複数の第１の候補連語を取得し、そして上層対話ターゲットクラスタから第１の対話ターゲットと複数の候補対話ターゲットクラスタを決定し、これにより、下層の複数の第１の候補連語、及び上層の複数の候補第２の対話ターゲットクラスタを用いて、第２の連語を決定することにより、さらに生成された対話ターゲットをより明確にし、階層化対話を生成する。

実際の応用において、連語は対話中に一定の出現順序を有し、これに基づいて、生成された対話の一貫性を向上させるために、本出願の１つの実施例において、複数の連語間の関連関係は、複数の連語間の接続辺の方向及び接続辺の第１の重みを含み、上記対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第１の連語に関連する複数の第１の候補連語を取得する場合、複数の連語間の接続辺の方向及び第１の重みに基づいて、第１の候補連語を取得することができる。

本実施例において、複数の連語間の接続辺の方向は、既存の対話語句における連語の出現順序を指示することに用いられる。対話の習慣が異なるので、２つの連語が異なる対話に現れる順序は異なる可能性があり、そのため、２つの連語間には指向が反対する２つの接続辺がある可能性がある。例えば、ある２つの連語ａと連語ｂの間には、連語ａから連語ｂを指向する接続辺が含まれ、連語ｂから連語ａを指向する接続辺も含まれている。

接続辺の重み、ここでは第１の重みと呼び、２つの連語の接続辺の方向の関連度を指示することに用いられ、第１の重みが大きいほど、２つの連語の接続辺の方向の関連度が高いことを示す。

対話グラフから第１の連語に関連する複数の第１の候補連語を取得する場合、まず複数の連語間の接続辺の方向に基づいて、対話グラフにおける第１の連語が指向する複数の連語、及び第１の連語から各連語の接続辺を指向する方向の第１の重みを取得し、そして第１の重みが予め設定された第１の閾値より大きい複数の連語を複数の第１の候補連語として選択することができる。

つまり、各第１の候補連語と第１の連語の間には、第１の連語から第１の候補連語を指向する接続辺が含まれ、且つ接続辺の第１の重みが第１の閾値より大きい。

図３は本出願の実施例により提供される対話グラフにおける連語間の接続辺の概略図である。図３において、丸印は連語に対応するノードを示し、連語Ａは連語Ｂを指し、重みが０．６であり、連語Ａは連語Ｃを指し、重みが０．３である。連語Ａが第１の連語であり、第１の閾値が０．４である場合、連語Ｂは連語Ａの第１の候補連語である。

本出願の実施例において、複数の連語間の関連関係は、複数の連語間の接続辺の方向及び接続辺の第１の重みを含み、対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第１の連語に関連する複数の第１の候補連語を取得する場合、複数の連語間の接続辺の方向及び接続辺の第１の重みに基づいて、対話グラフから複数の第１の候補連語を取得し、ここで、各第１の候補連語と第１の連語の間には、第１の連語から第１の候補連語を指向する接続辺が含まれ、且つ接続辺の第１の重みが第１の閾値より大きい。これにより、連語間の接続方向を考慮するだけでなく、重みも考慮し、取得された第１の候補連語の正確性を向上させ、第１の候補連語が属する候補対話ターゲットクラスタに基づいて、第２の連語を決定し、第２の連語に基づいて応答文を生成することで、対話の生成の正確性を向上させる。

上記実施例では複数の連語間の接続辺の方向及び接続辺の第１の重みに基づいて、第１の候補連語を取得することであり、本出願の１つの実施例において、対話グラフにおける複数の連語間の関連関係は、複数の連語間の接続辺の方向を含み、複数の連語間の接続辺の方向及び接続辺の数量に基づいて、第１の候補連語を決定することができる。

具体的には、対話グラフから第１の連語に関連する第２の連語を取得する場合、まず複数の連語間の接続辺の方向に基づいて、対話グラフにおける第１の連語が指向する複数の連語を取得し、そしてその中から接続辺の数量が予め設定された第２の閾値より大きい連語を第１の候補連語として選択することができる。

つまり、各第１の候補連語と第１の連語との間の接続辺の方向は、第１の連語から第１の候補連語を指向するものであり、且つ各第１の候補連語に対応する接続辺の数量は第２の閾値より大きい。

ここで、第１の候補連語に対応する接続辺の数量は、他の連語から第１の候補連語を指向する接続辺の数量と、第１の候補連語から他の連語を指向する接続辺の数量との和である。

または、接続辺の方向が第１の連語で指向される、且つ他の連語を指向する接続辺の数量が第２の閾値より大きい連語を第１の候補連語として選択することもできる。つまり、第１の連語で指され、且つ出辺の数量が第２の閾値より大きい連語を第１の候補連語とする。

例えば、第１の連語が連語ｆであり、連語ｆがそれぞれ連語ｓと連語ｔに関連し、連語ｓが他の連語を指向する２つの接続辺を有し、連語ｔが他の連語を指向する５つの接続辺を有し、第２の閾値が２であると仮定すると、連語ｔを連語ｆの第１の候補連語とする。

本出願の実施例において、複数の連語間の関連関係は、複数の連語間の接続辺の方向を含み、対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第１の連語に関連する複数の第１の候補連語を取得する場合、複数の連語間の接続辺の方向及び接続辺の数量に基づいて、対話グラフから第１の連語に関連する複数の第１の候補連語を取得し、ここで、各第１の候補連語と第１の連語との間の接続辺の方向は、第１の連語から第１の候補連語を指向するものであり、且つ各第１の候補連語に対応する接続辺の数量は第２の閾値より大きい。これにより、複数の連語間の接続辺の方向及び接続辺の数量に基づいて、第１の候補連語を選択し、第１の連語が指向する連語及び指された連語と他の連語の関連情況を考慮して、第１の候補連語の正確性を向上させ、さらに対話の生成の正確性を向上させる。

上記対話グラフから第１の連語に関連する複数の第１の候補連語を取得するステップに対して、本出願の１つの実施例において、連語が選択された回数に基づいて、第２の連語を決定することもできる。

具体的には、対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第１の連語に関連する複数の第２の候補連語を取得し、ここで、第２の候補連語は対話グラフにおける第１の連語間の接続辺の方向が第１の連語が指向する連語であってもよいし、対話グラフにおける第１の連語に関連するすべての連語であってもよい、第１の連語が指向する連語と第１の連語を指向する連語とを含む。

本実施例において、対話グラフにおいて各連語が現在の対話生成プロセスで応答文を生成するために選択された回数、及び以前に対話を生成した時に応答文を生成するために選択された回数を記録することができる。第１の候補連語を決定した後、各第２の候補連語のそれぞれに対応する選択された回数に基づいて、複数の第２の候補連語から第１の候補連語を取得する。

具体的には、第２の候補連語に基づいて同じ回の対話の生成のプロセスで選択された回数が最も小さい第２の候補連語を第２の連語としてもよいし、第２の候補連語基づいて以前に対話を生成した時に、選択された回数が最も多い第２の候補連語を第１の候補連語としてもよい。

本出願の実施例において、対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第１の連語に関連する複数の第１の候補連語を取得し、対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第１の連語に関連する複数の第２の候補連語を取得し、そして複数の第２の候補連語において各第２の候補連語のそれぞれに対応する選択された回数に基づいて、複数の第２の候補連語から複数の第１の候補連語を取得することができる。これにより、第１の連語に関連する複数の第２の候補連語の選択された回数に基づいて、複数の第１の候補連語を取得し、語句の生成の正確性を向上させる。

上記第１の連語が属する第１の対話ターゲットクラスタと、複数の第１の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第２の対話ターゲットクラスタを決定するステップに対して、第１の候補連語が第１の連語に関連する連語であり、第１の連語と同じ対話ターゲットクラスタに属する可能性があるため、本出願の１つの実施例において、複数の第１の候補連語におけるいずれかの候補連語が属する候補対話ターゲットクラスタが第１の対話ターゲットクラスタである場合、つまり、複数の第１の候補連語でいずれかの候補連語と第１の連語が第１の対話ターゲットクラスタに属する場合、第１の連語が属する第１の対話ターゲットクラスタを第２の対話ターゲットクラスタとする。

これによって、複数の第１の候補連語のそれぞれが属する各候補対話ターゲットクラスタには、第１の対話ターゲットクラスタと同じ候補対話ターゲットクラスタがある場合、第１の対話ターゲットクラスタを第２の対話ターゲットクラスタとし、すなわち第２の対話ターゲットクラスタと第１の対話ターゲットクラスタは同じ対話ターゲットクラスタである。

本出願の実施例において、第１の連語が属する第１の対話ターゲットクラスタと、複数の第１の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第２の対話ターゲットクラスタを決定する場合、複数の第１の候補連語におけるいずれかの候補連語が属する候補対話ターゲットクラスタが第１の対話ターゲットクラスタである場合、第２の対話ターゲットクラスと第１の対話ターゲットクラスタは同じ対話ターゲットクラスタであると決定する。これにより、複数の第１の候補連語には第１の対話ターゲットクラスタに属する第１の連語がある場合、第１の対話ターゲットクラスタを第２の対話ターゲットクラスタとして、第２の対話ターゲットクラスタから第１の連語に関連する第２の連語を取得し、第２の連語と第１の連語の関連性を向上させ、生成された対話をより一貫性のあるものにする。

本出願の１つの実施例において、複数の対話ターゲットクラスタ間の関連関係は、複数の対話ターゲットクラスタ間の接続辺の方向及び接続辺の第２の重みを含み、第２の対話ターゲットクラスタを決定する場合、複数の対話ターゲットクラスタ間の接続辺の方向及び接続辺の第２の重みに基づいて、複数の候補対話ターゲットクラスタから第２の対話ターゲットクラスタを取得することもできる。

本実施例において、２つの対話ターゲットクラスタ間には１つの接続辺がある可能性があり、方向が反対である２つの接続辺がある可能性もあり、接続辺がない可能性もある。２つの対話ターゲットクラスタ間の接続辺の第２の重みが大きいほど、２つの対話ターゲットクラスタの対話ターゲットの関連度が高いことを示す。

第２の対話ターゲットクラスタを決定する場合、まず複数の対話ターゲットクラスタ間の接続辺の方向に基づいて、候補対話ターゲットクラスタから第１の対話ターゲットクラスタが指向する候補対話ターゲットクラスタを取得し、第１の対話ターゲットクラスタから候補対話ターゲットクラスタを指向する接続辺の第２の重みを取得し、そして第２の重みが予め設定された第３の閾値より大きい候補対話ターゲットクラスタを第２の対話ターゲットクラスタとして選択することができる。ここで、第２の対話ターゲットクラスタは１つでも複数でも可能性がある。

つまり、第１の対話ターゲットクラスタと第２の対話ターゲットクラスタの間には、第１の対話ターゲットクラスタから第２の対話ターゲットクラスタを指向する接続辺が含まれ、且つ接続辺の第２の重みが第３の閾値より大きい。

本出願の実施例において、複数の対話ターゲットクラスタ間の関連関係は、複数の対話ターゲットクラスタ間の接続辺の方向及び接続辺の第２の重みを含み、第２の対話ターゲットクラスタを決定する場合、第１の対話ターゲットクラスタと各候補対話ターゲットクラスタとの間の接続辺の方向及び接続辺の第２の重みに基づいて、各候補対話ターゲットクラスタから第２の対話ターゲットクラスタを取得し、ここで、第１の対話ターゲットクラスタと第２の対話ターゲットクラスタの間には、第１の対話ターゲットクラスタから第２の対話ターゲットクラスタを指向する接続辺が含まれ、且つ接続辺の第２の重みが第３の閾値より大きい。これにより、第１の対話ターゲットクラスタと各候補対話ターゲットクラスタとの間の接続辺の方向及び接続辺の第２の重みに基づいて、第２の対話ターゲットクラスタを決定することで、対話ターゲットクラスタ間の対話ターゲットの対話中の順序を考慮するだけでなく、関連度も考慮し、これにより決定された第２の対話ターゲットクラスタ生成された応答文に基づいて、対話ターゲットが明確で、階層化を有し、制御可能である。

実際の応用において、人と人の間の対話では前後２つの文が対象とする対話ターゲットは通常同じもの又は近いものである。これに基づいて、本出願の１つの実施例において、複数の対話ターゲットクラスタ間の関連関係は、複数の対話ターゲットクラスタ間の接続辺の方向及び接続辺の第２の重みを含み、各対話ターゲットクラスタが１つの対話ターゲットに対応し、第１の連語が属する第１の対話ターゲットクラスタと、複数の第１の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第２の対話ターゲットクラスタを決定する場合、まず入力文に基づいて現在の誘導対象の対話ターゲットを決定し、誘導対象の対話ターゲットに基づいて第２の対話ターゲットクラスタを決定することができる。

以下、図４と組み合わせて説明し、図４は本出願の実施例により提供されるもう１つの対話生成方法のフローチャートである。

図４に示すように、第１の連語が属する第１の対話ターゲットクラスタと、複数の第１の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第２の対話ターゲットクラスタを決定する上記ステップは、ステップ４０１〜ステップ４０３を含む。

ステップ４０１：入力文を認識して、現在対応する誘導対象の対話ターゲットを決定する。

本実施例において、入力文に対して語意分析を行って、現在対応する誘導対象の対話ターゲットを決定することができる。または、入力文におけるキーワードを抽出し、キーワードに基づいて現在対応する誘導対象の対話ターゲットを決定する。ここで、誘導対象の対話ターゲットは入力文に対応する対話ターゲットと理解できる。

ステップ４０２：誘導対象の対話ターゲットと対話グラフにおける各対話ターゲットクラスタとのマッチング度に基づいて、第３の対話ターゲットクラスタを決定する。

対話ターゲットが明確である対話を生成するために、本実施例において、対話グラフから対話ターゲットと誘導対象の対話ターゲットとのマッチング度が高い対話ターゲットクラスタを選択することができる。

具体的には、誘導対象の対話ターゲットと対話グラフにおける各対話ターゲットクラスタに対応する対話ターゲットのマッチング度を計算し、マッチング度が最も高い対話ターゲットクラスタを第３の対話ターゲットクラスタとする。これにより、対話グラフにおける複数の対話ターゲットクラスタでは、入力文に現在対応する誘導対象の対話ターゲット、及び対応する対話ターゲットクラスタを決定する。

ステップ４０３：各候補対話ターゲットクラスタのそれぞれと第３の対話ターゲットクラスタとの間の接続辺の方向及び接続辺の第２の重みに基づいて、各候補対話ターゲットクラスタから第２の対話ターゲットクラスタを取得する。

第３の対話ターゲットクラスタを決定した後、各候補対話ターゲットクラスタのそれぞれと第３の対話ターゲットクラスタとの間の接続辺の方向及び接続辺の第２の重みに基づいて、各候補対話ターゲットクラスタから第２の対話ターゲットクラスタを取得する。

具体的な方法は、上記実施例における第１の対話ターゲットクラスタと各候補対話ターゲットクラスタとの間の接続辺の方向及び接続辺の第２の重みに基づいて、第２のターゲット対話クラスタを決定する方法と類似しているので、ここでは説明を省略する。

なお、候補対話ターゲットクラスタには第３の対話ターゲットクラスタと同じ対話ターゲットクラスタがあると、第３の対話ターゲットクラスタを第２の対話ターゲットクラスタとすることができる。

本出願の実施例において、入力文を認識して、誘導対象の対話ターゲットを決定することにより、誘導対象の対話ターゲットに対応する第３の対話ターゲットクラスタを決定し、各候補対話ターゲットクラスタのそれぞれと第３の対話ターゲットクラスタとの間の接続辺の方向及び接続辺の第２の重みに基づいて、候補対話ターゲットクラスタから第２の対話ターゲットクラスタを取得して、第２の対話ターゲットクラスタの対話ターゲットが入力文誘導対象の対話ターゲットに関連するようにし、さらには第２の対話ターゲットクラスタから取得された第２の連語に基づいて生成された応答文が入力文の対話ターゲットと同一又は関連するようにし、生成された対話ターゲットを明確にし、一貫性を強くする。

なお、第２の対話ターゲットクラスタを決定する場合、上記いくつかの方法の他に、候補対話ターゲットクラスタと第１の対話ターゲットクラスタとの間の距離に基づいて、第２の対話ターゲットクラスタを決定することもできる。候補対話ターゲットクラスタと前の対話ターゲットクラスタとの間の距離に基づいて、第２の対話ターゲットクラスタを決定することもできる。または、候補対話ターゲットクラスタと、対話を生成する際に選択された回数が最も多い対話ターゲットクラスタとの間の距離に基づいて、対話ターゲットクラスタを決定することもできる。実際の応用において、その中の１つの方法を選択して第２の対話ターゲットクラスタを決定してもよいし、両方とも用いてもよい。

上記対話グラフから入力文に対応する第１の連語を取得するステップに対して、本出願の１つの実施例において、図５に示すような方法を用いてもよい。図５は本出願の実施例により提供されるもう１つの対話生成方法のフローチャートである。

図５に示すように、対話グラフから入力文に対応する第１の連語を取得する上記ステップは、ステップ５０１〜ステップ５０２を含む。

ステップ５０１：入力文に対して単語分割処理を行って、入力文に含まれる各分割された単語を決定する。

本実施例において、辞書を用いて、辞書における連語を入力文における文字列とマッチングして、入力文に対して単語分割処理を行い、入力文に含まれる各分割された単語を取得することができる。

ステップ５０２：各分割された単語のそれぞれと対話グラフ内の各連語との間の関連度に基づいて、対話グラフにおける入力文に対応する第１の連語を決定する。

本実施例において、入力文に含まれる各分割された単語を取得した後、各分割された単語と対話グラフ内の各連語との関連度を取得し、関連度に基づいて第１の入力文に対応する第１の連語を決定する。ここで、関連度は２つの単語間の関連度を指示することに用いられる。

各分割された単語と対話グラフ内の各連語との関連度を取得する場合、分割された単語と対話グラフ内の連語に基づいて、既存の文章、対話などで出現する頻度を決定することができ、ここで、出現する頻度が高いほど、分割された単語と対話グラフ内の連語との関連度が高いことを示す。

または、分割された単語と対話グラフ内の分割された単語との間の類似度を計算することもでき、類似度が高いほど、関連度が高いと考える。例えば、「天気」という分割された単語の場合、対話グラフには連語「天気」があれば、両者の類似度が最も高く、一致である。

入力文における各分割された単語に基づいて、対話グラフにおける各分割された単語との関連が最も高い連語を決定した後、これらの連語から１つを第１の連語として選択し、ランダムに選択してもよいし、関連度が最も高い連語を選択してもよい。

本出願の実施例において、対話グラフから入力文に対応する第１の連語を取得する場合、入力文における各分割された単語のそれぞれと対話グラフ内の各連語との間の関連度に基づいて、対話グラフにおける入力文に対応する第１の連語を決定することにより、入力文を対話グラフにマッピングすることを実現するだけでなく、入力文における各分割された単語に基づいて決定し、正確性が高い。

入力文を対話グラフの下層の連語にマッピングする正確性を向上させるために、本出願の１つの実施例において、各分割された単語と対話グラフ内の連語の関連度に基づいて、複数の候補連語を取得し、そして候補連語と入力文の類似度に基づいて、第１の連語を決定することができる。

具体的には、入力文における各分割された単語と対話グラフ内の各連語との間の関連度を計算し、各分割された単語関連度が最も高い予め設定された数量の連語を候補連語として選択して、複数の第３の候補連語を取得することができる。ここで、２つの連語間の関連度は、２つの連語が同じ対話に出現する可能性を指示することに用いられ、関連度が高いほど、可能性が大きい。

複数の第３の候補連語を取得した後、各第３の候補連語と入力文の類似度を計算し、具体的には第３の候補連語の単語ベクトルと入力文に対応するベクトルに基づいて、類似度を計算する。そして、入力文との類似度が最も高い第３の候補連語を入力文に対応する第１の連語として選択する。

本出願の実施例において、各分割された単語のそれぞれと対話グラフ内の各連語との間の関連度に基づいて、対話グラフにおける入力文に対応する第１の連語を決定する場合、対話グラフから取得された第３の候補連語と入力文の類似度に基づいて、複数の第３の候補連語から第１の連語を決定することにより、入力文を対話グラフの下層の連語にマッピングする正確性を向上させる。

本出願の１つの実施例において、対話グラフから入力文に対応する第１の連語を取得する前に、まず対話データセットに基づいて、対話グラフを生成することができる。以下、図６と組み合わせて説明し、図６は本出願の実施例により提供されるもう１つの対話生成方法のフローチャートである。

図６に示すように、上記対話グラフから入力文に対応する第１の連語を取得する前に、ステップ６０１〜ステップ６０４を含む。

ステップ６０１：複数組の対話が含まれる対話データセットを取得する。

本実施例において、大量の人と人の間の対話データを収集し、これらの対話データを集合にして、対話データセットを取得することができる。ここで、対話データセットには複数組の対話が含まれる。ここで、各組の対話には複数の対話語句が含まれることができ、且つ各組の対話の対話ターゲットまたは対話テーマは同じであってもよいし、異ってもよい。

ステップ６０２：対話データセットから複数の連語を抽出する。

本実施例において、対話データセットにおける各組の対話中の各語句に対して単語分割処理を行って、各組の対話中の連語を取得することができ、各組の対話中の連語に基づいて大量の連語を取得することができる。

または、対話データセット内の各対話に対して構文分析を行うこともでき、例えば各単語の品詞及び各単語間の依存関係を決定し、各対話に対応する構文木を取得する。ここで、構文木には各単語間の依存関係が記述されている。そして、各対話に対応する構文木のルートノードから連語を選択し、抽出された１つまたは複数の連語を各対話に対応する連語とする。

本実施例において、各対話に対応する構文木を取得し、構文木によって各対話に対応する連語を取得することにより、抽出された連語の正確性が高い。

ステップ６０３：複数の連語のうちの各２つの連語の、同じ組の対話での共起方式に基づいて、複数の連語間の関連関係を決定する。

本実施例において、対話データから抽出された複数の連語を２つずつ組み合わせ、各２つの連語の、同じ組の対話での共起方式を統計する。

ここで、共起方式には、共起回数、共起時の２つの連語の対話における出現順序、共起時の２つの連語の対話における距離が含まれる。共起回数が０より大きい場合、２つの連語が関連することを示し、２つの連語の対話における出現順序に基づいて、２つの連語間の接続辺の方向を決定する。例えば、一組の対話において、連語ｍが連語ｎより先に出現すると、連語ｍと連語ｍの間に接続辺があると見なすことができ、接続辺の方向が連語ｍから連語に指向する。

２つの連語の会話中の間隔が遠いほど、関連度が低いことが示される。２つの連語が１組の対話中の隣接する前後の文に現れていれば、２つの連語の関連度は高い。２つの連語が１組の対話中の離れた２つの文に現れていれば、２つの連語が関連していると見なすこともできるが、関連度は隣接する前後の文に現れている２つの連語より低い。

これにより、各２つの連語の、同じ組の対話での共起方式に基づいて、連語間の接続辺の方向、接続辺の重みなど、複数の連語間の関連関係を決定する。ここで、接続辺の重みは関連度に対応し、関連度が高いほど、接続辺の重みが大きい。

ステップ６０４：複数の連語間の関連関係に基づいて、複数の連語をクラスタリングして、複数の対話ターゲットクラスタ及び複数の対話ターゲットクラスタ間の関連関係を決定する。

複数の連語間の関連関係を取得した後、複数の連語間の関連関係に基づいて、複数の単語分割をクラスタリングすることができ、具体的には、接続辺の重みが予め設定された重み閾値より大きい２つの連語を１つにまとめて、複数の対話ターゲットクラスタ、及び対話ターゲットクラスタ間の関連関係を取得することができる。ここで、各対話ターゲットクラスタには複数の連語が含まれる。

具体的にはクラスタリングする場合、Ｋ平均値クラスタリングなどのクラスタリング方法を採用してもよいし、他の手法を採用してもよいが、具体的なプロセスはここでは説明を省略する。

これにより、関連度の高い連語を同一の対話ターゲットクラスタにまとめることで、同一の対話ターゲットに関連する連語を１つのクラスタにまとめる。これにより対話グラフに基づいて対話を生成する時に、生成された対話が同一の対話ターゲットを中心にして、対話効率を向上させる。

対話ターゲットクラスタ間の関連関係を決定する場合、複数の対話ターゲットクラスタにおける２つの対話ターゲットクラスタごとに連語間の接続辺の方向及び重みに基づいて、２つの対話ターゲットクラスタ間の接続辺の方向及び重みを決定することができる。

具体的には、２つの対話ターゲットクラスタでは、他方の対話ターゲットクラスタから他方の対話ターゲットクラスタを指向する２つの連語が存在すれば、２つの対話ターゲットクラスタの接続辺の方向、当該接続方向の重みを決定することができ、当該接続方向の連語間の重み和は、２つの対話ターゲットクラスタ間の重みである。

図７は本出願の実施例により提供される対話グラフの概略図である。図７において、対話ターゲットクラスタＭは、連語ａ、連語ｂ、連語ｃという３つの連語を含み、対話ターゲットクラスタＮは、連語ｄ及び連語ｅという２つの連語を含む。ここで、連語ａ及び連語ｄは２つの接続辺を有し、ここで、一方の接続辺の方向は連語Ａから連語ｄを指向し、当該方向の接続辺の重みが０．６であり、他方は連語ｄから連語ａを指向し、当該方向の接続辺の重みが０．３であり、連語ｂと連語ｅは１つの接続辺を有し、方向は連語ｂから連語ｅを指向し、当該方向の接続辺の重みが０．７である。

上記方法に基づいて、対話ターゲットクラスタＭが対話ターゲットクラスタＮを指向する接続方向では、２つの対話ターゲットクラスタの重みは連語ａから連語ｄを指向する重みの０．６と、連語ｂから連語ｅを指向する重みの０．７との和で、１．３であり、対話ターゲットクラスタＮが対話ターゲットクラスタＭを指向する接続方向で、２つの対話ターゲットクラスタの重みは連語ｄから連語ａを指向する重みの０．３である。

抽出された複数の連語間の関連関係、及び対話ターゲットクラスタ間の関連関係を取得した後、連語と対話ターゲットクラスタとが含まれる二重の、階層化の対話グラフを生成することができる。

本出願の実施例において、対話グラフから入力文に対応する第１の連語を取得する前に、対話データセットから複数の連語を抽出し、複数の連語のうちの各２つの連語の、同じ組の対話での共起方式に基づいて、複数の連語間の関連関係を決定し、複数の連語間の関連関係に基づいて、複数の連語をクラスタリングして、複数の対話ターゲットクラスタ及び複数の対話ターゲットクラスタ間の関連関係を決定する。これにより、対話データセットに基づいて二重構造の対話グラフを生成することができ、階層化の対話グラフに基づいて、対話ターゲットが明確で一貫性が強い階層化対話を生成することができ、対話効率を向上させる。

上記実施例を実現するために、本出願の実施例は、対話生成装置をさらに提供する。図８は本出願の実施例により提供される対話生成装置の概略構成図である。

図８に示すように、当該対話生成装置８００は、第１の取得モジュール８１０と、第２の取得モジュール８２０と、第３の取得モジュール８３０と、生成モジュール８４０と、を含む。

第１の取得モジュール８１０は、入力文を取得することに用いられ、
第２の取得モジュール８２０は、対話グラフから入力文に対応する第１の連語を取得することに用いられ、ここで、対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれ、
第３の取得モジュール８３０は、複数の対話ターゲットクラスタ間の関連関係及び対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第１の連語に関連する第２の連語を取得することに用いられ、
生成モジュール８４０は、第２の連語及び入力文に基づいて、応答文を生成することに用いられる。

本出願の実施例の１つの可能な実施例方法において、上記第３の取得モジュール８３０は、
対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第１の連語に関連する複数の第１の候補連語を取得するための第１の取得ユニットと、
第１の連語が属する第１の対話ターゲットクラスタと、複数の第１の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第２の対話ターゲットクラスタを決定するための第１の決定ユニットと、
第２の対話ターゲットクラスタから第１の連語に関連する第２の連語を取得するための第２の取得ユニットと、を含む。

本出願の実施例の１つの可能な実施例方法において、上記複数の連語間の関連関係は、複数の連語間の接続辺の方向及び接続辺の第１の重みを含み、上記第１の取得ユニットは、
複数の連語間の接続辺の方向及び接続辺の第１の重みに基づいて、対話グラフから複数の第１の候補連語を取得することに用いられ、ここで、各第１の候補連語と第１の連語の間には、第１の連語から第１の候補連語を指向する接続辺が含まれ、且つ接続辺の第１の重みが第１の閾値より大きい。

本出願の実施例の１つの可能な実施例方法において、上記複数の連語間の関連関係は、複数の連語間の接続辺の方向を含み、上記第１の取得ユニットは、
複数の連語間の接続辺の方向及び接続辺の数量に基づいて、対話グラフから第１の連語に関連する複数の第１の候補連語を取得することに用いられ、ここで、各第１の候補連語と第１の連語との間の接続辺の方向は、第１の連語から第１の候補連語を指向するものであり、且つ各第１の候補連語に対応する接続辺の数量は第２の閾値より大きい。

本出願の実施例の１つの可能な実施例方法において、上記第１の取得ユニットは、
対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第１の連語に関連する複数の第２の候補連語を取得し、
複数の第２の候補連語のうちの各第２の候補連語にそれぞれ対応する選択された回数に基づいて、複数の第２の候補連語から複数の第１の候補連語を取得することに用いられる。

本出願の実施例の１つの可能な実施例方法において、上記第１の決定ユニットは、
複数の第１の候補連語におけるいずれかの候補連語が属する候補対話ターゲットクラスタが第１の対話ターゲットクラスタである場合、第２の対話ターゲットクラスタと第１の対話ターゲットクラスタとが同じ対話ターゲットクラスタであると決定することに用いられる。

本出願の実施例の１つの可能な実施例方法において、上記複数の対話ターゲットクラスタ間の関連関係は、複数の対話ターゲットクラスタ間の接続辺の方向及び接続辺の第２の重みを含み、上記第１の決定ユニットは、
第１の対話ターゲットクラスタと各候補対話ターゲットクラスタとの間の接続辺の方向及び接続辺の第２の重みに基づいて、各候補対話ターゲットクラスタから第２の対話ターゲットクラスタを取得することに用いられ、ここで、第１の対話ターゲットクラスタと第２の対話ターゲットクラスタの間には、第１の対話ターゲットクラスタから第２の対話ターゲットクラスタを指向する接続辺が含まれ、且つ接続辺の第２の重みが第３の閾値より大きい。

本出願の実施例の１つの可能な実施例方法において、上記複数の対話ターゲットクラスタ間の関連関係は、複数の対話ターゲットクラスタ間の接続辺の方向及び接続辺の第２の重みを含み、各対話ターゲットクラスタが１つの対話ターゲットに対応し、上記第１の決定ユニットは、
入力文を認識して、現在対応する誘導対象の対話ターゲットを決定し、
誘導対象の対話ターゲットと対話グラフにおける各対話ターゲットクラスタとのマッチング度に基づいて、第３の対話ターゲットクラスタを決定し、
各候補対話ターゲットクラスタのそれぞれと第３の対話ターゲットクラスタとの間の接続辺の方向及び接続辺の第２の重みに基づいて、各候補対話ターゲットクラスタから第２の対話ターゲットクラスタを取得することに用いられる。

本出願の実施例の１つの可能な実施例方法において、上記第２の取得モジュール８２０は、
入力文に対して単語分割処理を行って、入力文に含まれる各分割された単語を決定するための単語分割処理ユニットと、
各分割された単語のそれぞれと対話グラフ内の各連語との間の関連度に基づいて、対話グラフにおける入力文に対応する第１の連語を決定するための第２の決定ユニットと、を含む。

本出願の実施例の１つの可能な実施例方法において、上記第２の決定ユニットは、
各分割された単語のそれぞれと対話グラフにおける複数の連語との間の関連度に基づいて、対話グラフから複数の第３の候補連語を取得し、
複数の第３の候補連語のそれぞれと入力文との類似度に基づいて、複数の第３の候補連語から第１の連語を取得することに用いられる。

本出願の実施例の１つの可能な実施例方法において、当該装置は、
複数組の対話が含まれる対話データセットを取得するための第４の取得モジュールと、
対話データセットから複数の連語を抽出するための抽出モジュールと、
複数の連語のうちの各２つの連語の、同じ組の対話での共起方式に基づいて、複数の連語間の関連関係を決定するための決定モジュールと、
複数の連語間の関連関係に基づいて、複数の連語をクラスタリングして、複数の対話ターゲットクラスタ及び複数の対話ターゲットクラスタ間の関連関係を決定するためのクラスタリングモジュールと、をさらに含む。

本出願の実施例の１つの可能な実施例方法において、上記抽出モジュールは、
対話データセットにおける各対話に対して構文分析を行って、各対話に対応する構文木を取得するための第３の取得ユニットと、
各対話に対応する構文木のルートノードから、各対話に対応する連語を抽出するための抽出ユニットと、を含む。

なお、前述対話生成方法の実施例の説明は、当該実施例の対話生成装置にも適用され、ここでは説明を省略する。

本出願の実施例によれば、本出願は、電子機器及び読み取り可能な記憶媒体をさらに提供する。
本出願の実施例によれば、本出願は、コンピュータプログラムを提供し、コンピュータプログラムは、コンピュータに本出願によって提供される対話生成方法を実行させる。

図９に示すように、それは本出願の実施例に係る対話生成方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレーム、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、携帯情報端末、携帯電話、スマートフォン、ウェアラブルデバイス、他の同様のコンピューティングデバイスなどの様々な形式のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び／又は要求される本出願の実現を制限することを意図したものではない。

図９に示すように、当該電子機器は、１つ又は複数のプロセッサ９０１と、メモリ９０２と、高速インターフェース及び低速インターフェースを含む各コンポーネントを接続するためのインターフェースと、を含む。各コンポーネントは、異なるバスで相互に接続され、共通のマザーボードに取り付けられるか、又は必要に応じて他の方式で取り付けることができる。プロセッサは、外部入力／出力装置（インターフェースに結合されたディスプレイデバイスなど）にＧＵＩの図形情報をディスプレイするためにメモリに記憶されている命令を含む、電子機器内に実行される命令を処理することができる。他の実施形態では、必要であれば、複数のプロセッサ及び／又は複数のバスを、複数のメモリとともに使用することができる。同様に、複数の電子機器を接続することができ、各電子機器は、一部の必要な操作（例えば、サーバアレイ、ブレードサーバ、又はマルチプロセッサシステムとする）を提供することができる。図９では、１つのプロセッサ９０１を例とする。

メモリ９０２は、本出願により提供される非一時的なコンピュータ読み取り可能な記憶媒体である。ここで、前記メモリには、前記少なくとも１つのプロセッサが本出願により提供される対話生成方法を実行するように、少なくとも１つのプロセッサによって実行可能な命令が記憶されている。本出願の非一時的なコンピュータ読み取り可能な記憶媒体は、コンピュータが本出願により提供される対話生成方法を実行するためのコンピュータ命令を記憶する。

メモリ９０２は、非一時的なコンピュータ読み取り可能な記憶媒体として、本出願の実施例における対話生成方法に対応するプログラム命令／モジュール（例えば、図８に示す第１の取得モジュール８１０、第２の取得モジュール８２０、第３の取得モジュール８３０及び生成モジュール８４０）ように、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶するために用いられる。プロセッサ９０１は、メモリ９０２に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち上記方法の実施例における対話生成方法を実現する。

メモリ９０２は、プログラム記憶領域とデータ記憶領域とを含むことができ、ここで、プログラム記憶領域は、オペレーティングシステム、少なくとも１つの機能に必要なアプリケーションプログラムを記憶することができ、データ記憶領域は、対話生成方法ことに基づく電子機器の使用によって作成されたデータなどを記憶することができる。また、メモリ９０２は、高速ランダム存取メモリを含むことができ、非一時的なメモリをさらに含むことができ、例えば、少なくとも１つのディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスである。いくつかの実施例では、メモリ９０２は、プロセッサ９０１に対して遠隔に設定されたメモリを選択的に含むことができ、これらの遠隔メモリは、ネットワークを介して対話生成の電子機器に接続されることができる。上記ネットワークの例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びその組み合わせを含むが、これらに限定されない。

対話生成方法の電子機器は、入力装置９０３と出力装置９０４とをさらに含むことができる。プロセッサ９０１、メモリ９０２、入力装置９０３、及び出力装置９０４は、バス又は他の方式を介して接続することができ、図９では、バスを介して接続することを例とする。

入力装置９０３は、入力された数字又は文字情報を受信することができ、及び対話生成の電子機器のユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポイティングデバイス、１つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置９０４は、ディスプレイデバイス、補助照明デバイス（例えば、ＬＥＤ）、及び触覚フィードバックデバイス（例えば、振動モータ）などを含むことができる。当該ディスプレイデバイスは、液晶ディスプレイ（ＬＣＤ）、発光ダイオード（ＬＥＤ）ディスプレイ、及びプラズマディスプレイを含むことができるが、これらに限定されない。いくつかの実施形態では、ディスプレイデバイスは、タッチスクリーンであってもよい。

本明細書で説明されるシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けＡＳＩＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び／又は解釈することができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも１つの入力装置、及び当該少なくとも１つの出力装置に伝送することができる。

これらのコンピューティングプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる）は、プログラマブルプロセッサの機械命令、高レベルのプロセス及び／又はオブジェクト指向プログラミング言語、及び／又はアセンブリ／機械言語でこれらのコンピューティングプログラムを実施することを含む。本明細書に使用されるように、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」というは、機械命令及び／又はデータをプログラマブルプロセッサに提供するために使用される任意のコンピュータプログラム製品、機器、及び／又は装置（例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス（ＰＬＤ））を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び／又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。

ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータ上で実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウス又はトラックボール）とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクションを提供するために用いられることもでき、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、任意の形式（音響入力と、音声入力と、触覚入力とを含む）でユーザからの入力を受信することができる。

ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインターフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインターフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする）、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形式又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを互いに接続することができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットとを含む。

コンピュータシステムは、クライアントとサーバとを含むことができる。クライアントとサーバは、一般的に、互いに離れ、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント−サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。

本出願の実施例の技術案によれば、対話ターゲットクラスタと連語二重構造が含まれる対話グラフを用いることによって、対話ターゲットクラスタ間、及び各単語間の関連関係に基づいて、応答文を生成することで、生成された対話ターゲットを明確にし、制御可能とし、対話効率を向上させる。

本明細書の説明において、「第１」、「第２」という用語は、単に説明するためのものであり、比較的な重要性を指示又は暗示するか、或いは示された技術特徴の数を黙示的に指示するものとして理解してはいけない。これによって、「第１」、「第２」によって限定されている特徴は少なくとも１つの前記特徴を含むことを明示又は暗示するものである。さらに、本出願の説明において、明確且つ具体的な限定がない限り、「複数」とは、２つ、３つなど、少なくとも２つを意味する。

以上に本出願の実施例を示して説明したが、上記実施例は例示的なものであり、本出願を限定するものではなく、当業者は、本出願の範囲内で上記実施例に対して変化、修正、取り替え及び変形を行うことができるということを理解されたい。

Claims

対話生成方法であって、
入力文を取得するステップと、
対話グラフから前記入力文に対応する第１の連語を取得するステップであって、前記対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれるステップと、
前記複数の対話ターゲットクラスタ間の関連関係及び前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第１の連語に関連する第２の連語を取得するステップと、
前記第２の連語及び前記入力文に基づいて、応答文を生成するステップと、を含む、
ことを特徴とする対話生成方法。
前記複数の対話ターゲットクラスタ間の関連関係及び前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第１の連語に関連する第２の連語を取得するステップは、
前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第１の連語に関連する複数の第１の候補連語を取得するステップと、
前記第１の連語が属する第１の対話ターゲットクラスタと、前記複数の第１の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第２の対話ターゲットクラスタを決定するステップと、
前記第２の対話ターゲットクラスタから前記第１の連語に関連する第２の連語を取得するステップと、を含む、
ことを特徴とする請求項１に記載の方法。
前記複数の連語間の関連関係は、前記複数の連語間の接続辺の方向及び前記接続辺の第１の重みを含み、
前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第１の連語に関連する複数の第１の候補連語を取得するステップは、
前記複数の連語間の接続辺の方向及び前記接続辺の第１の重みに基づいて、前記対話グラフから複数の第１の候補連語を取得するステップであって、各前記第１の候補連語と前記第１の連語との間には、前記第１の連語から前記第１の候補連語を指向する接続辺が含まれ、且つ前記接続辺の第１の重みが第１の閾値より大きいステップを含む、
ことを特徴とする請求項２に記載の方法。
前記複数の連語間の関連関係は、前記複数の連語間の接続辺の方向を含み、
前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第１の連語に関連する複数の第１の候補連語を取得するステップは、
前記複数の連語間の接続辺の方向及び接続辺の数量に基づいて、前記対話グラフから前記第１の連語に関連する複数の第１の候補連語を取得するステップであって、各前記第１の候補連語と前記第１の連語との間の接続辺の方向が、前記第１の連語から前記第１の候補連語を指向するものであり、且つ各前記第１の候補連語に対応する接続辺の数量が第２の閾値より大きいステップを含む、
ことを特徴とする請求項２に記載の方法。
前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第１の連語に関連する複数の第１の候補連語を取得するステップは、
前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第１の連語に関連する複数の第２の候補連語を取得するステップと、
前記複数の第２の候補連語のうちの各前記第２の候補連語にそれぞれ対応する選択された回数に基づいて、前記複数の第２の候補連語から前記複数の第１の候補連語を取得するステップと、を含む、
ことを特徴とする請求項２に記載の方法。
前記第１の連語が属する第１の対話ターゲットクラスタと、前記複数の第１の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第２の対話ターゲットクラスタを決定するステップは、
前記複数の第１の候補連語におけるいずれかの候補連語が属する候補対話ターゲットクラスタが前記第１の対話ターゲットクラスタである場合、前記第２の対話ターゲットクラスタと前記第１の対話ターゲットクラスタとが同じ対話ターゲットクラスタであると決定するステップを含む、
ことを特徴とする請求項２に記載の方法。
前記複数の対話ターゲットクラスタ間の関連関係は、前記複数の対話ターゲットクラスタ間の接続辺の方向及び前記接続辺の第２の重みを含み、
前記第１の連語が属する第１の対話ターゲットクラスタと、前記複数の第１の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第２の対話ターゲットクラスタを決定するステップは、
前記第１の対話ターゲットクラスタと前記各候補対話ターゲットクラスタとの間の接続辺の方向及び前記接続辺の第２の重みに基づいて、前記各候補対話ターゲットクラスタから前記第２の対話ターゲットクラスタを取得するステップであって、前記第１の対話ターゲットクラスタと前記第２の対話ターゲットクラスタの間には、前記第１の対話ターゲットクラスタから前記第２の対話ターゲットクラスタを指向する接続辺が含まれ、且つ前記接続辺の第２の重みが第３の閾値より大きいステップを含む、
ことを特徴とする請求項２に記載の方法。
前記複数の対話ターゲットクラスタ間の関連関係は、前記複数の対話ターゲットクラスタ間の接続辺の方向及び前記接続辺の第２の重みを含み、各前記対話ターゲットクラスタが１つの対話ターゲットに対応し、
前記第１の連語が属する第１の対話ターゲットクラスタと、前記複数の第１の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第２の対話ターゲットクラスタを決定するステップは、
前記入力文を認識して、現在対応する誘導対象の対話ターゲットを決定するステップと、
前記誘導対象の対話ターゲットと前記対話グラフにおける各対話ターゲットクラスタとのマッチング度に基づいて、第３の対話ターゲットクラスタを決定するステップと、
前記各候補対話ターゲットクラスタのそれぞれと前記第３の対話ターゲットクラスタとの間の接続辺の方向及び前記接続辺の第２の重みに基づいて、前記各候補対話ターゲットクラスタから前記第２の対話ターゲットクラスタを取得するステップと、を含む、
ことを特徴とする請求項２〜６のいずれかに記載の方法。
前記対話グラフから前記入力文に対応する第１の連語を取得するステップは、
前記入力文に対して単語分割処理を行って、前記入力文に含まれる各分割された単語を決定するステップと、
前記各分割された単語のそれぞれと前記対話グラフ内の各連語との間の関連度に基づいて、前記対話グラフにおける前記入力文に対応する第１の連語を決定するステップと、を含む、
ことを特徴とする請求項１に記載の方法。
前記各分割された単語のそれぞれと前記対話グラフ内の各連語との間の関連度に基づいて、前記対話グラフにおける前記入力文に対応する第１の連語を決定するステップは、
前記各分割された単語のそれぞれと前記対話グラフにおける複数の連語との間の関連度に基づいて、前記対話グラフから複数の第３の候補連語を取得するステップと、
前記複数の第３の候補連語のそれぞれと前記入力文との類似度に基づいて、前記複数の第３の候補連語から前記第１の連語を取得するステップと、を含む、
ことを特徴とする請求項９に記載の方法。
前記対話グラフから前記入力文に対応する第１の連語を取得するステップの前に、
複数組の対話が含まれる対話データセットを取得するステップと、
前記対話データセットから複数の連語を抽出するステップと、
前記複数の連語のうちの各２つの連語の、同じ組の対話での共起方式に基づいて、前記複数の連語間の関連関係を決定するステップと、
前記複数の連語間の関連関係に基づいて、前記複数の連語をクラスタリングして、複数の対話ターゲットクラスタ及び前記複数の対話ターゲットクラスタ間の関連関係を決定するステップと、をさらに含む、
ことを特徴とする請求項１〜７のいずれかに記載の方法。
前記対話データセットから複数の連語を抽出するステップは、
前記対話データセットにおける各対話に対して構文分析を行って、前記各対話に対応する構文木を取得するステップと、
前記各対話に対応する構文木のルートノードから、前記各対話に対応する連語を抽出するステップと、を含む、
ことを特徴とする請求項１１に記載の方法。
対話生成装置であって、
入力文を取得するための第１の取得モジュールと、
対話グラフから前記入力文に対応する第１の連語を取得するための第２の取得モジュールであって、前記対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれる第２の取得モジュールと、
前記複数の対話ターゲットクラスタ間の関連関係及び前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第１の連語に関連する第２の連語を取得するための第３の取得モジュールと、
前記第２の連語及び前記入力文に基づいて、応答文を生成するための生成モジュールと、を含む、
ことを特徴とする対話生成装置。
前記第３の取得モジュールは、
前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第１の連語に関連する複数の第１の候補連語を取得するための第１の取得ユニットと、
前記第１の連語が属する第１の対話ターゲットクラスタと、前記複数の第１の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第２の対話ターゲットクラスタを決定するための第１の決定ユニットと、
前記第２の対話ターゲットクラスタから前記第１の連語に関連する第２の連語を取得するための第２の取得ユニットと、を含む、
ことを特徴とする請求項１３に記載の装置。
前記複数の連語間の関連関係は、前記複数の連語間の接続辺の方向及び前記接続辺の第１の重みを含み、
前記第１の取得ユニットは、
前記複数の連語間の接続辺の方向及び前記接続辺の第１の重みに基づいて、前記対話グラフから複数の第１の候補連語を取得し、各前記第１の候補連語と前記第１の連語の間には、前記第１の連語から前記第１の候補連語を指向する接続辺が含まれ、且つ前記接続辺の第１の重みが第１の閾値より大きい、
ことを特徴とする請求項１４に記載の装置。
前記複数の連語間の関連関係は、前記複数の連語間の接続辺の方向を含み、
前記第１の取得ユニットは、
前記複数の連語間の接続辺の方向及び接続辺の数量に基づいて、前記対話グラフから前記第１の連語に関連する複数の第１の候補連語を取得し、各前記第１の候補連語と前記第１の連語との間の接続辺の方向が、前記第１の連語から前記第１の候補連語を指向するものであり、且つ各前記第１の候補連語に対応する接続辺の数量が第２の閾値より大きい、
ことを特徴とする請求項１４に記載の装置。
前記第１の取得ユニットは、
前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第１の連語に関連する複数の第２の候補連語を取得し、
前記複数の第２の候補連語のうちの各前記第２の候補連語にそれぞれ対応する選択された回数に基づいて、前記複数の第２の候補連語から前記複数の第１の候補連語を取得する、
ことを特徴とする請求項１４に記載の装置。
前記第１の決定ユニットは、
前記複数の第１の候補連語におけるいずれかの候補連語が属する候補対話ターゲットクラスタが前記第１の対話ターゲットクラスタである場合、前記第２の対話ターゲットクラスタと前記第１の対話ターゲットクラスタとが同じ対話ターゲットクラスタであると決定する、
ことを特徴とする請求項１４に記載の装置。
前記複数の対話ターゲットクラスタ間の関連関係は、前記複数の対話ターゲットクラスタ間の接続辺の方向及び前記接続辺の第２の重みを含み、
前記第１の決定ユニットは、
前記第１の対話ターゲットクラスタと前記各候補対話ターゲットクラスタとの間の接続辺の方向及び前記接続辺の第２の重みに基づいて、前記各候補対話ターゲットクラスタから前記第２の対話ターゲットクラスタを取得し、前記第１の対話ターゲットクラスタと前記第２の対話ターゲットクラスタの間には、前記第１の対話ターゲットクラスタから前記第２の対話ターゲットクラスタを指向する接続辺が含まれ、且つ前記接続辺の第２の重みが第３の閾値より大きい、
ことを特徴とする請求項１４に記載の装置。
前記複数の対話ターゲットクラスタ間の関連関係は、前記複数の対話ターゲットクラスタ間の接続辺の方向及び前記接続辺の第２の重みを含み、各前記対話ターゲットクラスタが１つの対話ターゲットに対応し、
前記第１の決定ユニットは、
前記入力文を認識して、現在対応する誘導対象の対話ターゲットを決定し、
前記誘導対象の対話ターゲットと前記対話グラフにおける各対話ターゲットクラスタとのマッチング度に基づいて、第３の対話ターゲットクラスタを決定し、
前記各候補対話ターゲットクラスタのそれぞれと前記第３の対話ターゲットクラスタとの間の接続辺の方向及び前記接続辺の第２の重みに基づいて、前記各候補対話ターゲットクラスタから前記第２の対話ターゲットクラスタを取得する、
ことを特徴とする請求項１４〜１８のいずれかに記載の装置。
前記第２の取得モジュールは、
前記入力文に対して単語分割処理を行って、前記入力文に含まれる各分割された単語を決定するための単語分割処理ユニットと、
前記各分割された単語のそれぞれと前記対話グラフ内の各連語との間の関連度に基づいて、前記対話グラフにおける前記入力文に対応する第１の連語を決定するための第２の決定ユニットと、を含む、
ことを特徴とする請求項１３に記載の装置。
前記第２の決定ユニットは、
前記各分割された単語のそれぞれと前記対話グラフにおける複数の連語との間の関連度に基づいて、前記対話グラフから複数の第３の候補連語を取得し、
前記複数の第３の候補連語のそれぞれと前記入力文との類似度に基づいて、前記複数の第３の候補連語から前記第１の連語を取得する、
ことを特徴とする請求項２１に記載の装置。
複数組の対話が含まれる対話データセットを取得するための第４の取得モジュールと、
前記対話データセットから複数の連語を抽出するための抽出モジュールと、
前記複数の連語のうちの各２つの連語の、同じ組の対話での共起方式に基づいて、前記複数の連語間の関連関係を決定するための決定モジュールと、
前記複数の連語間の関連関係に基づいて、前記複数の連語をクラスタリングして、複数の対話ターゲットクラスタ及び前記複数の対話ターゲットクラスタ間の関連関係を決定するためのクラスタリングモジュールと、をさらに含む、
ことを特徴とする請求項１３〜１９のいずれかに記載の装置。
前記抽出モジュールは、
前記対話データセットにおける各対話に対して構文分析を行って、前記各対話に対応する構文木を取得するための第３の取得ユニットと、
前記各対話に対応する構文木のルートノードから、前記各対話に対応する連語を抽出するための抽出ユニットと、を含む、
ことを特徴とする請求項２３に記載の装置。
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも１つのプロセッサが請求項１〜１２のいずれかに記載の対話生成方法を実行できるように、前記少なくとも１つのプロセッサによって実行される、
ことを特徴とする電子機器。
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、前記コンピュータに請求項１〜１２のいずれかに記載の対話生成方法を実行させる、
ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
コンピュータプログラムであって、
前記コンピュータプログラムは、コンピュータに請求項１〜１２のいずれかに記載の対話生成方法を実行させる、
ことを特徴とするコンピュータプログラム。