JP2022028889A - 対話生成方法、装置、電子機器及び記憶媒体 - Google Patents

対話生成方法、装置、電子機器及び記憶媒体 Download PDF

Info

Publication number
JP2022028889A
JP2022028889A JP2021193407A JP2021193407A JP2022028889A JP 2022028889 A JP2022028889 A JP 2022028889A JP 2021193407 A JP2021193407 A JP 2021193407A JP 2021193407 A JP2021193407 A JP 2021193407A JP 2022028889 A JP2022028889 A JP 2022028889A
Authority
JP
Japan
Prior art keywords
response
type
statement
task
dialogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021193407A
Other languages
English (en)
Inventor
ジァンルー フー
Jianglu Hu
ヘハン リー
Hehan Li
フゥイファン スゥン
Huifeng Sun
シゥーチィー スゥン
Shuqi Sun
ユエ チァン
Yue Chang
ティンティン リー
Tingting Li
フゥア ウー
Hua Wu
ハイフェン ワン
Haifeng Wang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022028889A publication Critical patent/JP2022028889A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】指定されたタイプのタスク型応答文を優先的にターゲット応答文として返すことが可能な対話生成方法、装置、電子機器及び記憶媒体を提供する。【解決手段】対話生成方法は、入力文を取得するステップと、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定するステップと、前記入力文をタスク型の対話応答生成器に入力して、前記タスク型応答文を生成するステップと、タスク型応答文のタイプが指定されたタイプである場合、タスク型応答文がターゲット応答文であると決定するステップと、を含む。【選択図】図1

Description

本開示はコンピュータ技術の分野に関し、具体的に自然言語処理、音声技術、ナレッジグラフ、深層学習などの人工知能技術の分野に関し、特に対話生成方法、装置、電子機器及び記憶媒体に関する。
コンピュータ技術の長足の発展につれて、人工知能の分野も急速に発展してきて、音声アシスタント、インテリジェントスピーカー、チャットソフトなどもだんだん幅広く使われていく。対話コミュニケーションは、音声アシスタント、インテリジェントスピーカー、チャットソフトなどの分野において不可欠な一部として、いかに速く、正確に対話を生成するかが、極めて重要であると見える。
本開示は対話生成方法、装置、電子機器及び記憶媒体を提供する。
本開示の一様態によれば、
入力文を取得するステップと、
前記入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定するステップと、
前記入力文をタスク型の対話応答生成器に入力して、前記タスク型応答文を生成するステップと、
前記タスク型応答文のタイプが指定されたタイプである場合、前記タスク型応答文がターゲット応答文であると決定するステップと、を含む方法を提供する。
本開示の別の様態によれば、
入力文を取得する第1の取得モジュールと、
前記入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する第1の決定モジュールと、
前記入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成する第1の生成モジュールと、
前記タスク型応答文のタイプが指定されたタイプである場合、前記タスク型応答文がターゲット応答文であると決定する第2の決定モジュールと、を含む。
本開示の別の様態によれば、電子機器を提供し、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが上記一様態の実施例に記載の対話生成方法を実行させる。
本開示の別の様態によれば、コンピュータプログラムが記憶されているコンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに上記一様態の実施例に記載の対話生成方法を実行させる。
本出願の別の様態によれば、コンピュータプログラムを提供し、前記コンピュータプログラムはプロセッサによって実行される場合、上記一様態の実施例に記載の対話生成方法を実現する。
本開示によって提供される対話生成方法、装置、電子機器および記憶媒体は、以下のような有益な効果を有する。
まず入力文を取得し、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、入力文をタスク型の対話応答生成器に入力して、対応するタスク型応答文を生成し、当該タスク型応答文のタイプが指定されたタイプである場合、当該タスク型応答文をターゲット応答文としてもよい。これにより、対話を生成する時、指定されたタイプのタスク型応答文を優先的にターゲット応答文として返すことにより、対話が順調に進むことを保障する前提で、できるだけタスク型応答文を返し、対話システムの性能を改善し、ユーザによりよく、より速い対話体験をもたらすことができる。
なお、この部分に記載されている内容は、本開示の実施例の肝心または重要な特徴を特定することを意図しておらず、本開示の範囲を限定することも意図していないことを理解されたい。本開示の他の特徴は、以下の説明を通して容易に理解される。
図面は、本技術案をよりよく理解するために使用され、本開示を限定するものではない。
本開示の一実施例によって提供される対話生成方法のフローチャートである。 本開示の別の実施例によって提供される対話生成方法のフローチャートである。 本開示の別の実施例によって提供される対話生成方法のフローチャートである。 本開示の一実施例によって提供される対話生成装置の概略構造図である。 本開示の別の実施例によって提供される対話生成装置の概略構造図である。 本開示の別の実施例によって提供される対話生成装置の概略構造図である。 本開示の実施例に係る対話生成方法の電子機器のブロック図である。
以下、図面と組み合わせて本開示の例示的な実施例を説明し、理解を容易にするためにその中には本開示の実施例の様々な詳細事項を含んでおり、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本開示の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができることを認識されたい。同様に、明確及び簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。
人工知能はコンピュータに人の特定の思惟過程及び知的行為(例えば、学習、推理、思考、計画など)をシミュレーションされることを研究する学科であり、ハードウェアの面の技術もソフトウェアの面の技術もある。人工知能ハードウェア技術は一般にセンサー、専用人工知能チップ、クラウド計算、分散記憶、ビッグデータ処理などの技術を含む。人工知能ソフトウェア技術は主にコンピュータ視覚技術、音声認識技術、自然言語処理技術及び機械学習/深層学習、ビッグデータ処理技術、ナレッジグラフ技術などのいくつかの方向を含む。
自然言語処理は人間言語(中国語、英語など)をコンピュータで処理、理解、運用し、コンピュータ科学と言語学の交差学科であり、通常に計算言語学と呼ばれる。自然言語は人間が他の動物と区別する根本的なしるしであり、言語がないと、人間の思考も不可能であるため、自然言語処理は人工知能の最高タスクと境界を体現している。つまり、コンピュータが自然言語を処理する能力を備える時にこそ、マシンは本当の知能を実現したと言える。
音声技術がコンピュータの分野におけるキー技術は、自動音声認識技術(ASR)と音声合成技術(TTS)がある。コンピュータがものを聞いたり、見たり、話したり、感じたりすることを可能にすることは、将来のヒューマンマシンインタラクションの発展方向であり、音声は将来最も期待されるヒューマンマシンインタラクション形態になり、音声は他のインタラクション形態よりもっと多くの利点を有する。
ナレッジグラフは本質的にセマンティックネットワークであり、図に基づくデータ構造であり、ノードとエッジから構成される。ナレッジグラフでは、各ノードは現実世界に存在するエンティティを表し、各エッジはエンティティとエンティティとの関係である。分かりやすく言えば、ナレッジグラフはすべての異なる種類の情報を接続して得られた関係ネットワークであり、ナレッジグラフは「関係」の角度から問題を分析する能力を提供する。
深層学習は多層の人工ニューラルネットワークとそれをトレーニングする方法を指す。一層のニューラルネットワークは、大量の行列数字を入力として、非線形アクティベーション方法によって重みを取り、別のデータ集合を出力として生成する。人々が物体を認識したりピクチャーをマークしたりするように、適切な行列数量、多層の組織がリンクすることにより、ニューラルネットワーク「脳」を形成して、正確で複雑な処理を行う。
以下、図面を参照しながら、本開示の実施例の対話生成方法、装置、電子機器及び記憶媒体を説明する。
図1は、本開示の実施例によって提供される対話生成方法のフローチャートである。
本開示の実施例の対話生成方法は、本開示の実施例によって提供される対話生成装置によって実行されてもよく、当該装置は電子機器に配置されてもよい。説明を簡単にするために、本開示の以下の各実施例では当該対話生成装置は、すべて「生成装置」と省略する。
図1に示すように、当該対話生成方法は以下のステップ101~104を含む。
ステップ101において、入力文を取得する。
入力文は任意の文であってもよく、言語、長さ、形式などに限定されない。例えば、入力文は中国語の文、英語の文などであってもよく、または疑問文、平叙文などであってもよく、音声の文、文字の文などであってもよいが、本開示はこれに対して限定するものではない。
ステップ102において、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する。
タスク型応答文は複数のタイプがあり、例えば明確化、満足、疑問などであってもよく、本開示はこれに対して限定するものではない。
本開示の実施例では、決定された生成対象のタスク型応答文のタイプの精度をさらに向上させるために、まず取得された入力文を口語で理解することができ、これによって入力文のセマンティック理解結果、例えば意図、含まれたワードスロットなどの情報を取得することができる。その後、対話状態のトラッキングによって、現在の対話状態を更新し、生成対象のタスク型応答文のタイプを決定する。
例えば、取得された入力文は「明日の上海までの航空券を予約する」である場合、まずそれを口語で理解し、入力文のセマンティック理解結果を取得し、その意図は航空券を予約することであり、目的地は上海であり、対話状態のトラッキングにより、現在の入力文に出発地、出発時間などの情報が含まれないと判断でき、ワードスロットの欠損は存在し、より明確で有用な情報を取得するために、ワードスロットの欠損を明確化することができ、これによって生成対象のタスク型応答文のタイプが明確化タイプと決定することができる。
なお、上記の例は単なる例示であり、本開示の実施例では入力文、タスク型応答文タイプに対する限定としてはいけない。
ステップ103において、入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成する。
対話応答生成器は、その中に入力された入力文に対して分析でき、これによって対応する応答文を生成する。
対話応答生成器はいくつかのタイプがあり、例えばタスク型の対話応答生成器、雑談応答生成器、本開示はこれに対して限定するものではない。
様々なタイプの対話応答生成器は、対応する表記コーパスに基づいて、訓練を重ねて生成されることができる。例えば、タスク型の対話応答生成器は、表記された入力文及び対応するタスク型応答文に基づいてトレーニングして生成されることができ、雑談応答生成器は、表記された入力文及び対応する雑談型応答文に基づいてトレーニングして生成されることができると理解することができ、本開示はこれに対して限定するものではない。
例えば、入力文が「今何時ですか?」である場合、それをタスク型の対話応答生成器に入力すると、「今は朝7時10分です」のタスク型応答文を取得する可能性がある。
または、入力文が「天気を調べる」である場合、それをタスク型の対話応答生成器に入力し、「今日の気温3~10度」のタスク型応答文を取得する可能性がある。
なお、上記の例は単なる例示であり、本開示の実施例ではタスク型応答文に対する限定としてはいけない。
ステップ104において、タスク型応答文のタイプが指定されたタイプである場合、タスク型応答文がターゲット応答文であると決定する。
ターゲット応答文は、生成装置が最終的に決定して出力され、入力文に対する返事の文である。
タスク型応答文は複数のタイプがあり、例えば明確化、満足、疑問などであってもよく、本開示はこれに対して限定するものではない。
通常、明確化タイプの文は、ワードスロット欠損の明確化、肯定否定態度の明確化、多結果選択の明確化などの任意の事実に対する状況を含むことができ、本開示はこれに対して限定するものではない。しかしながら、満足タイプの文は、対話タスクがすでに実現され、目的が達成され、または問題が解決されたことなどを明らかにすることができる。すなわちタスク型応答文が明確化のタイプであるか、それとも満足のタイであるかにかかわらず、当該タスク型対話が現在通常の対話フローにあり、当該応答文が現在対話タスクに対する明確な返事であることを明らかにすることができ、これによって生成装置は当該タスク型応答文をターゲット応答文としてもよい。すなわち本開示の実施例における指定されたタイプは明確化のタイプまたは満足のタイプである。
例えば、入力文が「天気を調べる」である場合、当該入力文をタスク型の対話応答生成器に入力した後、生成されたタスク型応答文は「いつの天気を調べますか?」である可能性があり、当該応答文のタイプは明確化のタイプであり、指定されたタイプに属し、生成装置は当該応答文「いつの天気を調べますか」をターゲット応答文として決定することができる。
または、入力文が「飲み物を飲みたい」である場合、当該入力文をタスク型の対話応答生成器に入力した後、生成されたタスク型応答文は「ジュース、コーヒー、それともミルクティーがほしいですか?」であり、当該応答文のタイプは明確化のタイプであり、指定されたタイプに属し、生成装置は当該応答文「ジュース、コーヒー、それともミルクティーがほしいですか?」をターゲット応答文として決定することができる。
または、入力文が「天気を調べる」である場合、当該入力文をタスク型の対話応答生成器に入力した後、生成されたタスク型応答文は「今日の天気は晴れています」であり、当該応答文のタイプは満足のタイプであり、指定されたタイプに属し、生成装置は当該応答文「今日の天気は晴れています」をターゲット応答文として決定することができる。
なお、上記の例は単なる例示であり、本開示の実施例ではターゲット応答文に対する限定としていけない。
本開示の実施例、まず入力文を取得し、その後、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、その後、入力文をタスク型の対話応答生成器に入力して、対応するタスク型応答文を生成し、当該タスク型応答文のタイプが指定されたタイプである場合、当該タスク型応答文をターゲット応答文としてもよい。これにより、対話を生成する時、指定されたタイプのタスク型応答文を優先的にターゲット応答文として返すことにより、対話が順調に進むことを保障する前提で、できるだけタスク型応答文を返し、対話システムの性能を改善し、ユーザによりよく、より速い対話体験をもたらすことができる。
上記実施例は、入力文をタスク型の対話応答生成器に入力することにより、対応するタスク型応答文を取得でき、その後、タスク型応答文が指定されたタイプの文である場合、当該タスク型応答文を入力文に対応するターゲット応答文として決定することができる。入力文が異なる場合、それをタスク型の対話応答生成器に入力し、取得されたタスク型応答文のタイプは同じである可能性があり、異なる可能性もあり、これによって指定されたタイプの文は存在する可能性があり、指定されていないタイプの文が存在する可能性もある。さらに、決定されたターゲット応答文がもっと正確で、合理的になるように、以下、図2と併せて取得されたタスク型応答文が指定されていないタイプの文である場合に対して詳細に説明する。
図2は本開示の別の実施例によって提供される対話生成方法のフローチャートである。
ステップ201において、入力文を取得する。
ステップ202において、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する。
ステップ203において、入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成する。
ステップ204において、タスク型応答文のタイプが指定されていないタイプである場合、入力文の意図を決定する。
本開示の実施例では指定されたタイプは明確化のタイプ、満足のタイプであり、それに対応して、指定されていないタイプは明確化のタイプ、満足のタイプの他の任意のタイプに属せず、例えば疑問などのタイプであり、すなわち当該タスク型応答文は、対話タスクがすでに実現され、目的が達成され、または問題が解決されたことなどを明らかにすることができない、本開示の実施例は指定されていないタイプの文のタイプに対して限定するものではない。
取得された入力文をタスク型の対話応答生成器に入力すると、対応するタスク型応答文を生成でき、タスク型応答文のタイプが指定されていないタイプである場合、当該応答文が現在対話タスクに対する明確な返事ではないと明らかにし、現在の入力文に含まれる対話目的を実現できない。生成された応答文がもっと正確で、合理的になり、ユーザの目的を早く実現できるように、入力文の意図をさらに決定してから、対応する操作を行うことができると理解することができる。
ステップ205において、入力文の意図が非雑談的意図である場合、対話履歴のうち入力文に隣接する最初のN個の応答文を取得し、Nは正の整数である。
入力文の意図は多様である可能性があり、例えば雑談意図、需要意図、タスク意図などであり、本開示はこれに対して限定するものではない。
本開示の実施例では、入力文の意図が非雑談的意図である場合、その意図に対してよりよい返事をするために、生成装置はその前の対話履歴から隣接する応答文を取得することができる。
ステップ206において、最初のN個の応答文に基づいて、現在のターゲット応答文を生成する。
実際の応用では、Nの異なる数値に応じて、異なる方式でターゲット応答文を生成することができる。
通常、対話プロセスにおいて、各入力文の間に一定の連続性と関連性があり、本開示の実施例では、現在の入力文に基づいて、生成されたタスク型応答文が指定されていないタイプの文である場合、各入力文の間の関連性を考慮すると、その前の入力文に対応する応答文に基づいて、現在のターゲット応答文を決定することができ、これによって現在対話が順調に進むのを保障しながら、返された応答文が自然であること保障し、したがってユーザによりよい体験をもたらす。
例えば、入力文の意図が非雑談的意図である場合、Nが1である時、対話履歴のうち入力文に隣接する1つ前の応答文に基づいて、ターゲット応答文を決定することができる。
具体的に、取得された対話履歴のうち入力文に隣接する1つ前の応答語が明確化のタイプである場合、該応答文がユーザ対話タスクを達成することを目的とし、且つユーザのニーズに応じて応答した文であることを表明し、これによって、それを現在のターゲット応答文とすることができる。
例えば、現在の入力文が「ナビゲーションを使用したい」である場合、それをタスク型の対話応答生成器に入力すると、生成されたタスク型の対話応答文が指定されていないタイプの文である時、当該応答文が現在のユーザ対話タスクに対してよい返事をしなかったことを表す。この時、当該対話タスクに対してよい応答をするために、さらに入力文の意図を決定することができ、当該入力文の「ナビゲーションを使用したい」が非雑談的意図の文である場合、これによって対話履歴において現在の入力文に隣接する1つ前の応答文を選択して取得することができる。対話履歴において前のラウンドの対話における入力文が「北京の天気を調べる」であり、対応する応答文が「いつの天気を調べますか?」である場合、当該応答文は明確化タイプのタスク型応答文であり、対話タスクに対してすでに相応返事した。この時、ユーザ現在の対話タスクにより正確な回答をするために、前のラウンドの明確化タイプのタスク型応答文「いつの天気を調べますか?」を繰り返して選択することができ、これによって現在の意図を再度説明するようにユーザを誘導して、タスクを引き続き達成する。
または、取得された対話履歴のうち入力文に隣接する1つ前の応答文が非明確化タイプのタスク型の文である場合、当該応答文がタスク達成を目的とするフローにないことを表明し、この時ユーザの対話タスクをできるだけ達成するために、指定された応答文を選択することができ、例えば包括応答文を現在のターゲット応答文とする。
例えば、現在の入力文が「ナビゲーションしたい」であり、非雑談的意図の文であるため、後で対話履歴において現在の入力文に隣接する1つ前の応答文を選択して取得することができる。前のラウンドの対話における入力文が「北京の天気を調べる」であり、対応する応答文が「意味が分かりませんね」である場合、当該応答文は明確化タイプのタスク型応答文ではなく、当該応答語がユーザの対話タスクを達成することに役立たないことを表明する。この時、現在の対話タスクを引き続き達成するために、包括応答文を選択して現在のターゲット応答文とすることができ、例えば「どう返事するか分かりません。」という文を現在のターゲット応答文とする。
なお、上記の例は単なる例示であり、本開示の実施例がターゲット応答文を決定することに対する限定としてはいけない。
または、Nが1より大きい場合、入力文が非雑談的意図であるため、現在ユーザの入力文が特定のタスクを達成する必要があることを表明し、この時、入力文に含まれる対話タスクに対して返事する必要がある。タスク対話が引き続き進めることを保障するために、履歴対話における明確化タイプのタスク型応答文でターゲット応答文を生成することができる。
本開示の実施例では、最初のN個の応答文における明確化タイプのタスク型応答文に基づいて現在のターゲット応答文を決定する時、多様の決定方法、例えばセマンティック類似度、時間間隔などに基づいて決定する方法がある。
例えば、セマンティック類似度に基づいてターゲット応答文を決定することができる。最初のN個の応答文のうち入力文とのセマンティック類似度が最も高い明確化タイプのタスク型応答文を、現在のターゲット応答文として決定する。
例えば、入力文が「今日はいい天気ですね」であり、Nが3である場合、取得された最初の3つの応答文は「何を調べたいですか?」、「天気を調べたいですか?それとも時間を調べたいですか?」、「いつの天気を調べますか?」である可能性があり、この3つの応答文はすべて明確化タイプのタスク型文であり、この3つの応答文と入力文とのセマンティック類似度をそれぞれ算出し、「いつの天気を調べますか?」と入力文とのセマンティック類似度が最も高いことを得て、これによって「いつの天気を調べますか?」を現在のターゲット応答文とすることができる。
なお、上記の例は単なる例示であり、本開示の実施例がターゲット応答文を決定することに対する限定としてはいけない。
または、時間間隔に応じてターゲット応答文を決定してもよい。最初のN個の応答文のうち入力文との時間間隔が最も短い明確化タイプのタスク型応答文を、現在のターゲット応答文として決定してもよい。
例えば、Nが3であり、且つ入力文が「こんなにいい天気なら、何をするのに適していますか?」である場合、時間の順序によって、順次取得されたその前の3つの応答文は「天気を調べたいですか?それとも時間を調べたいですか?」、「いつの天気を調べますか?」、「天気がいいですね」であり、「天気がいいですね」は入力文との時間間隔が最も短い明確化タイプのタスク型応答文であるため、「天気がいいですね」を現在のターゲット応答文とすることができる。
なお、上記の例は単なる例示であり、本開示の実施例がターゲット応答文を決定することに対する限定としてはいけない。
本開示の実施例では、まず取得された入力文に基づいて、現在の対話状態に対してトラッキングして、生成対象のタスク型応答文のタイプを決定し、その後、入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成し、タスク型応答文のタイプが指定されていないタイプである場合、さらに入力文の意図を決定する。入力文の意図が非雑談的意図である場合、対話履歴のうち入力文に隣接する最初のN個の応答文を取得し、最初のN個の応答文に基づいて、対応する方式を選択して現在のターゲット応答文を生成する。これにより、タスク型の対話応答生成器によって生成されたタスク型応答文が指定されていないタイプであり、且つ入力文が非雑談的意図である場合、対話履歴のうち入力文に隣接する1つ前の応答文または複数の応答文に基づいて現在のターゲット応答文を生成し、これによって対話がタスク達成を目的として引き続き進んでいくように保障でき、タスク満足率を向上させるだけでなく、返された応答文が自然であり、ユーザがよい対話体験を取得できるようにすることができる。
上記実施例では、指定されていないタイプのタスク型応答文を取得した時、さらに入力文の意図を決定し、非雑談的意図の入力文に対して、対話履歴のうちそれに隣接する応答文に基づいて、対応するターゲット応答文を生成することができる。実際の応用では、入力文は雑談意図の文である可能性があり、この時、対話をよりスムーズにしながら、無意味な対話の継続を回避するために、現在の対話をさらに判断することができ、これによって対応するターゲット応答文を決定する。以下、図3と併せて入力文が雑談意図である状況に対して詳細に説明する。
図3は本開示の別の実施例によって提供される対話生成方法のフローチャートである。
ステップ301において、入力文を取得する。
ステップ302において、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する。
ステップ303において、入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成する。
ステップ304において、入力文を雑談応答生成器に入力して、雑談型応答文を生成する。
なお、ステップ303とステップ304は、具体的に使用する時、順序を問わず、ここでは1つの実現形態であり、本開示に対する限定としてはいけない。
ステップ305において、タスク型応答文のタイプが指定されていないタイプである場合、入力文の意図を決定する。
ステップ306において、入力文の意図が雑談意図である場合、履歴対話を取得する。
本開示の実施例では、履歴対話は、現在対話に最も近い前のラウンドの対話文であってもよく、または現在対話に最も近い前のいくつかのラウンドの対話文であってもよく、現在対話に最も近い前のタスク型の対話応答文であってもよいが、本開示はこれに対して限定するものではない。
なお、ユーザが雑談意図の入力文を入力した後、ユーザが引き続き雑談したい場合、ユーザの需要を満たすために、雑談型応答文を現在のターゲット応答文とすることができ、これによって引き続きユーザと対話することができる。
ステップ307において、履歴対話、雑談型応答文及び入力文に基づいて、雑談を終了するタイミングを決定する。
実際の使用プロセスにおいて、履歴対話における応答文のタイプに基づいて、履歴対話の関連タスクがすでに完成したか否かを決定することができる。
例えば、履歴対話において応答文のタイプが明確化のタイプである場合、当該履歴対話の関連タスクがまだ完成していない可能性がある明らかにする。例えば、履歴入力文は「天気を調べる」であり、履歴応答文は「いつの天気を調べますか?」であり、当該履歴応答文は明確化タイプの文であり、生成装置は天気を調べない、当該履歴対話の関連タスクは完成していない。
または、取得された履歴対話において応答文のタイプが満足タイプである場合、当該履歴対話の関連タスクはすでに完成した可能性があることを表明する。例えば、履歴入力文が「天気を調べる」であり、履歴応答文が「今日は晴れていて、そよ風が吹いている」である場合、当該履歴応答文は満足タイプの文であり、生成装置はユーザに天気状況を返事し、ユーザの「天気を調べる」という需要を満たし、当該履歴対話の関連タスクはすでに完成した。
なお、上記の例は単なる例示であり、本開示の実施例の履歴対話における応答文のタイプ、及び履歴対話の関連タスクがすでに完成したか否かを決定することへの限定としてはいけない。
その後、履歴対話の関連タスクが完成していない場合、雑談型応答文及び入力文と関連タスクとの関連度を決定する。
例えば、履歴対話における入力文が「北京の天気を調べる」であり、対応する応答文が「いつの天気を調べますか?」である場合、ユーザは北京天気の具体的な状況を得られず、当該履歴対話の関連タスクはまだ完成していない。現在対話において入力文が「今日は遊びに行きませんか?」である場合、これに対応して生成された雑談型応答文が「天気がよければ、遊びに行ってもいいですよ。」であってもよく、これによって雑談型応答文及び入力文と関連タスクとの関連度を決定する。
なお、上記の例は単なる例示であり、本開示の実施例における履歴対話の入力文、対応する応答文、そして雑談性応答文及び入力文と関連タスクとの関連度を決定することへの限定としてはいけない。
さらに、関連度が閾値より大きい場合、現在時刻が雑談を終了するタイミングであると決定する。
閾値は、設定された数値であってよく、具体的な状況に応じて設定してもよい。本開示はこれに対して限定するものではない。
例えば、閾値が0.7であり、関連度が0.95であり、関連度が閾値より大きいことは、現在の入力文及び雑談型応答文がすべて履歴対話の関連タスクと緊密に関連していることを表明し、この時、雑談を終了しても不自然ではなく、同時に、履歴対話の関連タスクを引き続き完成することができ、ユーザの要求を満たすことに加えて、ユーザによい使用感をもたらすことができる。
なお、上記の例は単なる例示であり、本開示の実施例における関連度、閾値、及び現在時刻が雑談を終了するタイミングであると決定することへの限定としてはいけない。
または、関連度が閾値以下である場合、現在時刻が雑談を終了するタイミングではないと決定する。
例えば、閾値が0.6であり、関連度が0.1であり、関連度が閾値より遥かに小さいことは、現在の入力文及び雑談型応答文と履歴対話の関連タスクとの関連性が低いことを表明し、この時、雑談を直接終了すると、対話が固くて不自然であり、ユーザとの応答が一貫しておらず、ユーザに満足度の低い会話体験を与える可能性がある。
なお、上記の例は単なる例示であり、本開示の実施例における関連度、閾値、及び現在時刻が雑談を終了するタイミングであると決定することへの限定としてはいけない。
また、履歴対話の関連タスクがすでに完成した場合、現在時刻が雑談を終了するタイミングではないと決定する。
履歴対話の関連タスクがすでに完成した場合、ユーザの主要な問題がすでに解決されたことを表明し、現在時刻が雑談を終了するタイミングではないと決定することができ、この時に現在のチャッを続けてもよく、包括モードを選択してもよいが、本開示はこれに対して限定するものではない。
ステップ308において、現在時刻が雑談を終了するタイミングである場合、雑談型応答文、及び履歴対話のうち入力文に隣接する1つ前のタスク型応答文に基づいて、現在のターゲット応答文を生成する。
現在対話タスクがまだ完成していない場合、現在の時刻に雑談をできるだけ回避すべきであり、すなわち雑談を終了する必要があることを表明し、引き続きタスク型の対話に戻り、対話タスクを達成するために、この時に雑談応答、及び履歴対話のうち現在対話と最も近い1つ前のタスク型対話の最後のラウンドの応答を選択してターゲット応答文としてもよく、これによって、情報の紛失を引き起こすことなく、一貫性がより高い対話を生成でき、同時に、対話タスクを緊密にめぐってユーザの需要を満たすことができる。
例えば、1つ前のラウンドの入力文が「北京の天気を調べる」であり、対応する応答文が「いつの天気を調べますか?」である場合、現在時刻の入力文が雑談意図の「私と雑談しましょうか」という文である時、1つ前のタスク型応答文「いつの天気を調べますか?」に基づいて、当該対話タスクがまだ完成していないと判断することができ、この時、雑談を終了して引き続き対話タスクを達成することができる。ユーザが引き続き対話タスクを達成することを誘導するために、この時、雑談応答文及び1つ前のラウンドの応答文に基づいてターゲット応答文、例えば「私と雑談しましょうか、では、いつの天気を調べますか?」を生成することができる。
なお、上記の例は単なる例示であり、本開示の実施例においてターゲット応答文を生成することに対する限定としてはいけない。
ステップ309において、現在時刻が雑談を終了するタイミングではない場合、雑談型応答文を現在のターゲット応答文とする。
履歴対話、雑談型応答文及び入力文に基づいて、現在時刻が雑談を終了することに適合せず、ユーザと引き続き雑談すべきであると判断する場合、この時、雑談型応答文を現在のターゲット応答文としてもよい。
例えば、現在の入力文が「一緒に遊びに行きましょうか」で、雑談意図がある文であり、1つ前のラウンドの対話の入力文が「今日の北京の天気を調べます」であり、対応する応答文が「北京は今日晴れています。風が吹いています」である場合、当該応答文に基づいて、この時に、当該ラウンドの対話のタスクがすでに達成され、ユーザの需要がすでに満たされたと判断でき、ユーザ現在の入力文に基づいて、ユーザが現在雑談したい状態にある可能性があると判断し、この時、ユーザと引き続き雑談することを選択することで、ユーザがよい対話体験を得るようにし、これによって雑談型応答文を現在のターゲット応答文としてもよい。
なお、上記の例は単なる例示であり、本開示の実施例においてターゲット応答文を生成することに対する限定としてはいけない。
本開示の実施例では、まず入力文を取得し、その後、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、取得された入力文をそれぞれタスク型の対話応答生成器と雑談応答生成器に入力して、対応するタスク型応答文と雑談型応答文を生成し、タスク型応答文が指定されていないタイプの文であり、入力文が雑談意図である場合、履歴対話、雑談型応答文と併せて、雑談を終了できるか否かを判断し、これによって雑談を終了する必要があるかに基づいてターゲット応答文を決定する。これにより、入力文を取得する時、タスク型応答文のタイプ、入力文の意図及び雑談を終了するタイミングなどの複数の方面に基づいて、返信対象のターゲット応答文を決定し、これによって対話がユーザタスクを達成することを保障でき、対話が滑らかで一貫するようにし、ユーザによりよい対話体験を与える。
上記実施例を実現するために、本開示の実施例は対話生成装置をさらに提供する。図4は、本開示の一実施例によって提供される対話生成装置の概略構造図である。
図4に示すように、当該対話生成装置400は、第1の取得モジュール410、第1の決定モジュール420、第1の生成モジュール430及び第2の決定モジュール440と、を含む。
第1の取得モジュール410は、入力文を取得する。
第1の決定モジュール420は、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する。
第1の生成モジュール430は、前記入力文をタスク型の対話応答生成器に入力して、前記タスク型応答文を生成する。
第2の決定モジュール440は、前記タスク型応答文のタイプが指定されたタイプである場合、前記タスク型応答文がターゲット応答文であると決定する。
なお、本開示の実施例において上記各モジュールの機能及び具体的な実現原理について、上記各方法の実施例を参照でき、ここでは説明を省略する。
本開示の実施例の対話生成装置は、まず入力文を取得し、その後、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、入力文をタスク型の対話応答生成器に入力して、対応するタスク型応答文を生成し、当該タスク型応答文のタイプが指定されたタイプである場合、当該タスク型応答文をターゲット応答文としてもよい。これにより、対話を生成する時、指定されたタイプのタスク型応答文を優先的にターゲット応答文として返すことにより、対話が順調に進むことを保障する前提で、できるだけタスク型応答文を返し、対話システムの性能を改善し、ユーザによりよく、より速い対話体験をもたらすことができる。
図5は、本開示の別の実施例によって提供される対話生成装置の概略構造図である。
図5に示すように、当該対話生成装置500は、第1の取得モジュール510、第1の決定モジュール520、第1の生成モジュール530、第3の決定モジュール540、第2の取得モジュール550及び第2の生成モジュール560を含む。
第1の取得モジュール510は、入力文を取得する。
本実施例の第1の取得モジュール510と、上記実施例の第1の取得モジュール410とは、同じ機能と構造を有すことができると理解することができる。
第1の決定モジュール520は、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する。
本実施例の第1の決定モジュール520と、上記実施例の第1の決定モジュール420とは、同じ機能と構造を有すことができると理解することができる。
第1の生成モジュール530は、前記入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成する。
本実施例の第1の生成モジュール530と、上記実施例の第1の生成モジュール430とは、同じ機能と構造を有すことができると理解することができる。
第3の決定モジュール540は、前記タスク型応答文が指定されていないタイプの文である場合、前記入力文の意図を決定する。
第2の取得モジュール550は、前記入力文の意図が非雑談的意図である場合、対話履歴のうち前記入力文に隣接する最初のN個の応答文を取得し、Nは正の整数である。
第2の生成モジュール560は、前記最初のN個の応答文に基づいて、現在のターゲット応答文を生成する。
1つの可能な実現形態では、第2の生成モジュール560は、具体的に前記1つ前の応答文が明確化タイプのタスク型文である場合、前記1つ前の応答文を前記現在のターゲット応答文として決定する。または、前記1つ前の応答文が非明確化タイプのタスク型文である場合、指定された応答文を前記現在のターゲット応答文として決定する。
別の可能な実現形態では、第2の生成モジュール560は、具体的に前記最初のN個の応答文のうち前記入力文とのセマンティック類似度が最も高い明確化タイプのタスク型応答文を、前記現在のターゲット応答文として決定する。または、前記最初のN個の応答文のうち前記入力文との時間間隔が最も短い明確化タイプのタスク型応答文を、前記現在のターゲット応答文として決定する。
なお、本開示の実施例において上記各モジュールの機能及び具体的な実現原理について、上記各方法の実施例を参照でき、ここでは説明を省略する。
本開示の実施例の対話生成装置は、まず入力文を取得し、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、その後、取得された入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成し、タスク型応答文のタイプが指定されていないタイプである場合、入力文の意図をさらに決定する。入力文の意図が非雑談的意図である場合、対話履歴のうち入力文に隣接する最初のN個の応答文を取得し、最初のN個の応答文に基づいて、対応する方式を選択して現在のターゲット応答文を生成する。これにより、タスク型の対話応答生成器によって生成されたタスク型応答文が指定されていないタイプであり、且つ入力文が非雑談的意図である場合、対話履歴のうち入力文に隣接する1つ前の応答文または複数の応答文に基づいて現在のターゲット応答文を生成し、これによって対話がタスク達成を目的として引き続き進んでいくように保障でき、タスク満足率を向上させるだけでなく、返された応答文が自然であり、ユーザがよい対話体験を取得できるようにする。
図6は本開示の別の実施例によって提供される対話生成装置の概略構造図である。
図6に示すように、当該対話生成装置600は、第1の取得モジュール610、第1の決定モジュール620、第1の生成モジュール630、第3の決定モジュール640、第3の生成モジュール650、第4の決定モジュール660を含む。
第1の取得モジュール610は、入力文を取得する。
本実施例の第1の取得モジュール610と、上記任意の実施例の第1の取得モジュールとは、同じ機能と構造を有すことができると理解することができる。
第1の決定モジュール620は、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する。
本実施例の第1の決定モジュール620と、上記実施例の第1の決定モジュールとは、同じ機能と構造を有すことができると理解することができる。
第1の生成モジュール630は、前記入力文をタスク型の対話応答生成器に入力して、タスク型応答文を生成する。
本実施例の第1の生成モジュール630と、上記任意の実施例の第1の生成モジュールとは、同じ機能と構造を有すことができると理解することができる。
第3の決定モジュール640は、前記タスク型応答文が指定されていないタイプの文である場合、前記入力文の意図を決定する。
本実施例の第3の決定モジュール640と、上記実施例の第3の決定モジュール540とは、同じ機能と構造を有すことができると理解することができる。
第3の生成モジュール650は、前記入力文を雑談応答生成器に入力して、雑談型応答文を生成する。
第4の決定モジュール660は、前記入力文の意図が雑談意図である場合、前記雑談型応答文を現在のターゲット応答文とする。
1つの可能な実現形態では、前記装置は第4の生成モジュールをさらに含み、前記入力文を雑談応答生成器に入力して、雑談型応答文を生成する。
第3の取得モジュールは、前記入力文の意図が雑談意図である場合、履歴対話を取得する。
第5の決定モジュールは、前記履歴対話、雑談型応答文及び前記入力文に基づいて、雑談を終了するタイミングを決定する。
1つの可能な実現形態では、第5の決定モジュールは、前記履歴対話における応答文のタイプに基づいて、前記履歴対話の関連タスクがすでに完成したか否かを決定する。前記履歴対話の関連タスクがまだ完成していない場合、前記雑談型応答文及び前記入力文と前記関連タスクとの関連度を決定する。前記関連度が閾値より大きい場合、現在時刻が前記雑談を終了するタイミングであると決定する。
1つの可能な実現形態では、第5の決定モジュールは、具体的に前記履歴対話の関連タスクがすでに完成した場合、現在時刻が前記雑談を終了するタイミングではないと決定する。
1つの可能な実現形態では、第5の決定モジュールは、具体的に前記関連度が閾値以下である場合、現在時刻が前記雑談を終了するタイミングではないと決定する。
1つの可能な実現形態では、第4の生成モジュールは、現在時刻が前記雑談を終了するタイミングである場合、前記雑談型応答文、及び前記履歴対話のうち前記入力文に隣接する1つ前のタスク型応答文に基づいて、現在のターゲット応答文を生成する。
1つの可能な実現形態では、第2の決定モジュールは、現在時刻が前記雑談を終了するタイミングではない場合、前記雑談型応答文を現在のターゲット応答文とする。
なお、本開示の実施例において上記各モジュールの機能及び具体的な実現原理について、上記各方法の実施例を参照でき、ここでは説明を省略する。
本開示の実施例の対話生成装置は、まず入力文を取得し、その後、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、その後、取得された入力文をそれぞれタスク型の対話応答生成器と雑談応答生成器に入力して、対応するタスク型応答文と雑談型応答文を生成し、タスク型応答文が指定されていないタイプの文であり、入力文が雑談意図である場合、履歴対話、雑談型応答文と併せて、雑談を終了できるか否かを判断し、これによって雑談を終了する必要があるかに基づいてターゲット応答文を決定する。これにより、入力文を取得する時、タスク型応答文のタイプ、入力文の意図及び雑談を終了するタイミングなどの複数の方面に基づいて、返信対象のターゲット応答文を決定し、これによって対話がユーザタスクを達成することを保障でき、対話が滑らかで一貫するようにし、ユーザによりよい対話体験を与える。
本開示の実施例によれば、本開示は、電子機器、及び読み取り可能な記憶媒体、をさらに提供する。
図7に示すように、本開示の実施例に係る対話生成方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、形態情報端末、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の同様のコンピューティングデバイスなどの様々な形式のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は、単なる例であり、本明細書の説明及び/又は要求される本開示の実現を制限することを意図したものではない。
図7示すように、当該電子機器は、1つ又は複数のプロセッサ701と、メモリ702と、高速インターフェースと低速インターフェースを含む各コンポーネントを接続するためのインターフェースと、を含む。各コンポーネントは、異なるバスで相互に接続され、共通のマザーボードに取り付けられてもよいし、又は必要に応じて他の方式で取り付けられてもよい。プロセッサは、外部入力/出力装置(インターフェースに結合されたディスプレイデバイスなど)にGUIの図形情報をディスプレイするためにメモリに記憶されている命令を含む、電子機器内に実行される命令を処理することができる。他の実施形態では、必要があれば、複数のプロセッサ及び/又は複数のバスを、複数のメモリとともに使用することができる。同様に、複数の電子機器を接続することができ、各電子機器は、必要な操作(例えば、サーバアレイ、ブレードサーバ、又はマルチプロセッサシステムとする)の一部を提供する。図7では、1つのプロセッサ701を例とする。
メモリ702は、本開示により提供される非一時的なコンピュータ読み取り可能な記憶媒体である。前記メモリには、少なくとも1つのプロセッサによって実行される命令を記憶して、前記少なくとも1つのプロセッサが本開示により提供される対話生成方法を実行することができるようにする。本開示の非一時的なコンピュータ読み取り可能な記憶媒体は、コンピュータが本出願により提供される対話生成方法を実行するためのコンピュータ命令を記憶する。
メモリ702は、非一時的なコンピュータ読み取り可能な記憶媒体として、本開示の実施例における対話生成方法に対応するプログラム命令/モジュール(例えば、図4に示す第1の取得モジュール410、第1の決定モジュール420、第1の生成モジュール430及び第2の決定モジュール440)のような非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能プログラム及びモジュールを記憶する。プロセッサ701は、メモリ702に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち上記の方法の実施例における対話生成方法を実現する。
メモ702は、プログラム記憶領域とデータ記憶領域とを含むことができ、プログラム記憶領域は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションを記憶することができ、データ記憶領域は、電子機器の使用によって作成されたデータなどを記憶することができる。また、メモリ702は、高速ランダムアクセスメモリを含むことができ、少なくとも1つの磁気ディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスなどの非一時的なメモリをさらに含むことができる。いくつかの実施例では、メモリ702は、プロセッサ701に対して遠隔に設定されたメモリを選択的に含むことができ、これらの遠隔メモリは、ネットワークを介して対話生成方法の電子機器に接続されることができる。上記ネットワークの例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク及びそれらの組み合わせを含むが、これらに限定されない。
対話生成方法の電子機器は、入力装置703と出力装置704とをさらに含むことができる。プロセッサ701、メモリ702、入力装置703、及び出力装置704は、バス又は他の方式を介して接続することができ、図7では、バスを介して接続することを例とする。
入力装置703は、入力された数字又は文字情報を受信することができ、及び対話生成方法の電子機器のユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置704は、ディスプレイデバイス、補助照明デバイス(例えば、LED)、及び触覚フィードバックデバイス(例えば、振動モータ)などを含むことができる。当該ディスプレイデバイスは、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを含むことができるが、これらに限定されない。いくつかの実施形態では、ディスプレイデバイスは、タッチスクリーンであってもよい。
本明細書で説明されたシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び/又は解釈することができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも1つの入力装置、及び当該少なくとも1つの出力装置に伝送することができる。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、高レベルのプロセス及び/又は対象指向プログラミング言語、及び/又はアセンブリ/機械言語でこれらのコンピューティングプログラムを実施する。本明細書に使用されるような、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。
ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータ上で実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、任意の形式(音響入力と、音声入力、または、触覚入力とを含む)でユーザからの入力を受信することができる。
ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションできる)、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実行することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットと、ブロックチェーンネットワークを含む。
コンピュータシステムは、クライアントとサーバを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、かつ互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバはクラウドサーバであってもよく、クラウドコンピューティングサーバまたはクラウドホストとも呼ばれ、クラウドコンピューティングサービスシステムにおける1つのホスト製品であり、従来の物理ホストとVPS(Virtual Private Server,仮想専用サーバ)サービスに存在する管理の難しさ、業務拡張性の弱いという欠陥を解決した。サーバは分散システムのサーバであってもよく、またはブロックチェーンと組み合わせたサーバであってもよい。
本開示の実施例に係る技術案によれば、まず入力文を取得し、その後、入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、入力文をタスク型の対話応答生成器に入力して、対応するタスク型応答文を生成し、当該タスク型応答文のタイプが指定されたタイプである場合、当該タスク型応答文をターゲット応答文としてもよい。これにより、対話を生成する時、指定されたタイプのタスク型応答文を優先的にターゲット応答文として返すことにより、対話が順調に進むことを保障する前提で、できるだけタスク型応答文を返し、対話システムの性能を改善し、ユーザによりよく、より速い対話体験をもたらすことができる。
当該コンピュータプログラムはプロセッサによって実行される場合、上記のいずれかの実施例に記載の対話生成方法を実現することができる。
コンピュータプログラムが実行される場合、以下のような有益な効果が存在する。
まず入力文を取得し、その後入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定し、入力文をタスク型の対話応答生成器に入力して、対応するタスク型応答文を生成し、当該タスク型応答文のタイプが指定されたタイプである場合、当該タスク型応答文をターゲット応答文としてもよい。これにより、対話を生成する時、指定されたタイプのタスク型応答文を優先的にターゲット応答文として返すことにより、対話が順調に進むことを保障する前提で、できるだけタスク型応答文を返し、対話システムの性能を改善し、ユーザによりよく、より速い対話体験をもたらすことができる。
なお、上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次実行されてもよいし、異なる順序で実行されてもよいが、本開示で開示されている技術案の所望の結果を実現できる限り、本明細書はここで制限するものではない。
上記具体的な実施形態は、本開示の保護範囲を制限するものではない。当業者は、設計要件と他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができると理解すべきである。任意の本開示の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれるべきである。

Claims (23)

  1. 対話生成方法であって、
    入力文を取得するステップと、
    前記入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定するステップと、
    前記入力文をタスク型の対話応答生成器に入力して、前記タスク型応答文を生成するステップと、
    前記タスク型応答文のタイプが指定されたタイプである場合、前記タスク型応答文がターゲット応答文であると決定するステップと、を含む、
    対話生成方法。
  2. 前記タスク型応答文のタイプが指定されていないタイプである場合、前記入力文の意図を決定するステップと、
    前記入力文の意図が非雑談的意図である場合、対話履歴のうち前記入力文に隣接する最初のN個の応答文を取得するステップであって、Nは正の整数であるステップと、
    前記最初のN個の応答文に基づいて、現在のターゲット応答文を生成するステップと、をさらに含む、
    請求項1に記載の方法。
  3. Nは1であり、前記最初のN個の応答文に基づいて、現在のターゲット応答文を生成するステップは、
    1つ前の応答文が明確化タイプのタスク型文である場合、前記1つ前の応答文を前記現在のターゲット応答文として決定するステップ、
    または、
    前記1つ前の応答文が非明確化タイプのタスク型文である場合、指定された応答文を前記現在のターゲット応答文として決定するステップ、を含む、
    請求項2に記載の方法。
  4. Nは1より大きく、前記最初のN個の応答文に基づいて、現在のターゲット応答文を生成するステップは、
    前記最初のN個の応答文のうち前記入力文とのセマンティック類似度が最も高い明確化タイプのタスク型応答文を、前記現在のターゲット応答文として決定するステップ、
    または、
    前記最初のN個の応答文のうち前記入力文との時間間隔が最も短い明確化タイプのタスク型応答文を、前記現在のターゲット応答文として決定するステップと、を含む、
    請求項2に記載の方法。
  5. 前記入力文を雑談応答生成器に入力して、雑談型応答文を生成するステップと、
    前記入力文の意図が雑談意図である場合、前記雑談型応答文を現在のターゲット応答文とするステップと、をさらに含む、
    請求項2~4のいずれか一項に記載の方法。
  6. 前記入力文を雑談応答生成器に入力して、前記雑談型応答文を生成するステップと、
    前記入力文の意図が雑談意図である場合、履歴対話を取得するステップと、
    前記履歴対話、雑談型応答文及び前記入力文に基づいて、雑談を終了するタイミングを決定するステップと、
    現在時刻が前記雑談を終了するタイミングである場合、前記雑談型応答文、及び前記履歴対話のうち前記入力文に隣接する1つ前のタスク型応答文に基づいて、現在のターゲット応答文を生成するステップと、をさらに含む、
    請求項2~4のいずれか一項に記載の方法。
  7. 現在時刻が前記雑談を終了するタイミングではない場合、前記雑談型応答文を現在のターゲット応答文とするステップをさらに含む、
    請求項6に記載の方法。
  8. 前記履歴対話、雑談型応答文及び前記入力文に基づいて、雑談を終了するタイミングを決定するステップは、
    前記履歴対話における応答文のタイプに基づいて、前記履歴対話の関連タスクがすでに完成したか否かを決定するステップと、
    前記履歴対話の関連タスクがまだ完成していない場合、前記雑談型応答文及び前記入力文と前記関連タスクとの関連度を決定するステップと、
    前記関連度が閾値より大きい場合、現在時刻が前記雑談を終了するタイミングであると決定するステップと、を含む、
    請求項6に記載の方法。
  9. 前記履歴対話の関連タスクがすでに完成したか否かを決定するステップの後、
    前記履歴対話の関連タスクがすでに完成した場合、現在時刻が前記雑談を終了するタイミングではないと決定するステップをさらに含む、
    請求項8に記載の方法。
  10. 前記雑談型応答文及び前記入力文と前記関連タスクとの関連度を決定するステップの後、
    前記関連度が閾値以下である場合、現在時刻が前記雑談を終了するタイミングではないと決定するステップをさらに含む、
    請求項8に記載の方法。
  11. 対話生成装置であって、
    入力文を取得する第1の取得モジュールと、
    前記入力文に基づいて、現在の対話状態を更新して、生成対象のタスク型応答文のタイプを決定する第1の決定モジュールと、
    前記入力文をタスク型の対話応答生成器に入力して、前記タスク型応答文を生成する第1の生成モジュールと、
    前記タスク型応答文のタイプが指定されたタイプである場合、前記タスク型応答文がターゲット応答文であると決定する第2の決定モジュールと、を含む、
    対話生成装置。
  12. 前記タスク型応答文のタイプが指定されていないタイプである場合、前記入力文の意図を決定する第3の決定モジュールと、
    前記入力文の意図が非雑談的意図である場合、対話履歴のうち前記入力文に隣接する最初のN個の応答文を取得する第2の取得モジュールであって、Nは正の整数である第2の取得モジュールと、
    前記最初のN個の応答文に基づいて、現在のターゲット応答文を生成する第2の生成モジュールと、をさらに含む、
    請求項11に記載の装置。
  13. 前記第2の生成モジュールは、具体的に、
    1つ前の応答文が明確化タイプのタスク型の文である場合、前記1つ前の応答文を前記現在のターゲット応答文として決定し、
    または、
    前記1つ前の応答文が非明確化タイプのタスク型文である場合、指定された応答文を前記現在のターゲット応答文として決定する、
    請求項12に記載の装置。
  14. 前記第2の生成モジュールは、具体的に、
    前記最初のN個の応答文のうち前記入力文とのセマンティック類似度が最も高い明確化タイプのタスク型応答文を、前記現在のターゲット応答文として決定し、
    または、
    前記最初のN個の応答文のうち前記入力文との時間間隔が最も短い明確化タイプのタスク型応答文を、前記現在のターゲット応答文として決定する、
    請求項12に記載の装置。
  15. 前記入力文を雑談応答生成器に入力して、前記雑談型応答文を生成する第3の生成モジュールと、
    前記入力文の意図が雑談意図である場合、前記雑談型応答文を現在のターゲット応答文とする第4の決定モジュールと、をさらに含む、
    請求項12~14のいずれか一項に記載の装置。
  16. 前記入力文を雑談応答生成器に入力して、前記雑談型応答文を生成する第4の生成モジュールと、
    前記入力文の意図が雑談意図である場合、履歴対話を取得する第3の取得モジュールと、
    前記履歴対話、雑談型応答文及び前記入力文に基づいて、雑談を終了するタイミングを決定する第5の決定モジュールと、
    現在時刻が前記雑談を終了するタイミングである場合、前記雑談型応答文、及び前記履歴対話のうち前記入力文に隣接する1つ前のタスク型応答文に基づいて、現在のターゲット応答文を生成する前記第4の生成モジュールと、をさらに含む、
    請求項12~14のいずれか一項に記載の装置。
  17. 前記第2の決定モジュールは、さらに現在時刻が前記雑談を終了するタイミングではない場合、前記雑談型応答文を現在のターゲット応答文とする、
    請求項16に記載の装置。
  18. 前記第5の決定モジュールは具体的に、
    前記履歴対話における応答文のタイプに基づいて、前記履歴対話の関連タスクがすでに完成したか否かを決定し、
    前記履歴対話の関連タスクがまだ完成していない場合、前記雑談型応答文及び前記入力文と前記関連タスクとの関連度を決定し、
    前記関連度が閾値より大きい場合、現在時刻が前記雑談を終了するタイミングであると決定する、
    請求項16に記載の装置。
  19. 前記第5の決定モジュールは、具体的に、
    前記履歴対話の関連タスクがすでに完成した場合、現在時刻が前記雑談を終了するタイミングではないと決定する、
    請求項18に記載の装置。
  20. 前記第5の決定モジュールは、具体的に、
    前記関連度が閾値以下である場合、現在時刻が前記雑談を終了するタイミングではないと決定する、
    請求項18に記載の装置。
  21. 電子機器であって、
    少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を含み、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが請求項1~10のいずれか一項に記載の対話生成方法を実行させる、
    電子機器。
  22. コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ命令は、前記コンピュータに請求項1~10のいずれか一項に記載の対話生成方法を実行させる、
    非一時的なコンピュータ読み取り可能な記憶媒体。
  23. コンピュータプログラムであって、
    前記コンピュータプログラムは、コンピュータにより実行される場合、前記コンピュータに請求項1~10のいずれか一項に記載の対話生成方法を実行させる、
    コンピュータプログラム。
JP2021193407A 2021-01-04 2021-11-29 対話生成方法、装置、電子機器及び記憶媒体 Pending JP2022028889A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110000726.5 2021-01-04
CN202110000726.5A CN112328776A (zh) 2021-01-04 2021-01-04 对话生成方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
JP2022028889A true JP2022028889A (ja) 2022-02-16

Family

ID=74302429

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021193407A Pending JP2022028889A (ja) 2021-01-04 2021-11-29 対話生成方法、装置、電子機器及び記憶媒体

Country Status (5)

Country Link
US (1) US20220215180A1 (ja)
EP (1) EP3958163A3 (ja)
JP (1) JP2022028889A (ja)
KR (1) KR20220002187A (ja)
CN (1) CN112328776A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657102B (zh) * 2021-08-17 2023-05-30 北京百度网讯科技有限公司 信息抽取方法、装置、设备及存储介质
CN116737910B (zh) * 2023-08-10 2024-03-29 腾讯科技(深圳)有限公司 智能对话处理方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016212541A (ja) * 2015-05-01 2016-12-15 株式会社ATR−Trek 対話装置、対話方法、及びそのコンピュータプログラム
CN109165274A (zh) * 2018-07-16 2019-01-08 厦门快商通信息技术有限公司 一种在线自动客服方法、系统及电子设备
JP2020118842A (ja) * 2019-01-23 2020-08-06 株式会社日立製作所 対話装置及び対話方法
WO2020202862A1 (ja) * 2019-03-29 2020-10-08 ソニー株式会社 応答生成装置及び応答生成方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794122B (zh) * 2014-01-20 2020-04-17 腾讯科技(北京)有限公司 一种位置信息推荐方法、装置和系统
KR102193559B1 (ko) * 2014-02-18 2020-12-22 삼성전자주식회사 대화형 서버 및 이의 제어 방법
JP6696923B2 (ja) * 2017-03-03 2020-05-20 国立大学法人京都大学 音声対話装置、その処理方法及びプログラム
CN111309990B (zh) * 2018-12-12 2024-01-23 北京嘀嘀无限科技发展有限公司 一种语句应答方法及装置
JP7059213B2 (ja) * 2019-01-30 2022-04-25 株式会社東芝 表示制御システム、プログラム、及び記憶媒体
CN110046221B (zh) * 2019-03-01 2023-12-22 平安科技(深圳)有限公司 一种机器对话方法、装置、计算机设备及存储介质
CN110211573A (zh) * 2019-05-28 2019-09-06 重庆邮电大学 一种基于神经网络模型的任务驱动型对话决策方法
US20210056521A1 (en) * 2019-08-22 2021-02-25 Paymentus Corporation Systems and methods for interactive video presentation of transactional information
CN110750629A (zh) * 2019-09-18 2020-02-04 平安科技(深圳)有限公司 机器人对话生成方法、装置、可读存储介质及机器人
KR20210033837A (ko) * 2019-09-19 2021-03-29 삼성전자주식회사 전자 장치 및 이의 제어 방법
CN111026857B (zh) * 2019-12-10 2022-07-08 思必驰科技股份有限公司 对话状态跟踪方法、人机对话方法及系统
CN111090728B (zh) * 2019-12-13 2023-05-26 车智互联(北京)科技有限公司 一种对话状态跟踪方法、装置及计算设备
CN111104504A (zh) * 2019-12-25 2020-05-05 天津中科智能识别产业技术研究院有限公司 一种基于自然语言处理和知识图谱的对话方法
CN111538823A (zh) * 2020-04-26 2020-08-14 支付宝(杭州)信息技术有限公司 信息处理方法、模型训练方法、装置、设备及介质
CN112131360A (zh) * 2020-09-04 2020-12-25 交通银行股份有限公司太平洋信用卡中心 一种智能多轮对话定制方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016212541A (ja) * 2015-05-01 2016-12-15 株式会社ATR−Trek 対話装置、対話方法、及びそのコンピュータプログラム
CN109165274A (zh) * 2018-07-16 2019-01-08 厦门快商通信息技术有限公司 一种在线自动客服方法、系统及电子设备
JP2020118842A (ja) * 2019-01-23 2020-08-06 株式会社日立製作所 対話装置及び対話方法
WO2020202862A1 (ja) * 2019-03-29 2020-10-08 ソニー株式会社 応答生成装置及び応答生成方法

Also Published As

Publication number Publication date
US20220215180A1 (en) 2022-07-07
EP3958163A2 (en) 2022-02-23
EP3958163A3 (en) 2022-06-29
KR20220002187A (ko) 2022-01-06
CN112328776A (zh) 2021-02-05

Similar Documents

Publication Publication Date Title
JP7127106B2 (ja) 質問応答処理、言語モデルの訓練方法、装置、機器および記憶媒体
JP7317791B2 (ja) エンティティ・リンキング方法、装置、機器、及び記憶媒体
CN110462730B (zh) 促进以多种语言与自动化助理的端到端沟通
JP7283009B2 (ja) 対話理解モデルの訓練方法、装置、デバイス及び記憶媒体
JP7228662B2 (ja) イベント抽出方法、装置、電子機器及び記憶媒体
KR102565673B1 (ko) 시멘틱 표현 모델의 생성 방법, 장치, 전자 기기 및 저장 매체
JP7309798B2 (ja) 対話意図の認識方法及び装置、電子機器並びに記憶媒体
JP2021099884A (ja) イベント引数抽出方法、イベント引数抽出装置、電子デバイス、記憶媒体及びコンピュータプログラム製品
JP2021157802A (ja) テキスト生成モデルのトレーニング方法、装置及び電子機器
KR20210038853A (ko) 이벤트 추출 방법, 이벤트 추출 장치 및 전자 기기
JP7395445B2 (ja) 検索データに基づくヒューマンコンピュータ対話型インタラクションの方法、装置及び電子機器
KR102630243B1 (ko) 구두점 예측 방법 및 장치
JP2021111420A (ja) テキストエンティティの語義記述処理方法、装置及び機器
JP2022013600A (ja) イベント関係の生成方法、装置、電子機器及び記憶媒体
CN111709252B (zh) 基于预训练的语义模型的模型改进方法及装置
JP2021099890A (ja) 因果関係の判別方法、装置、電子機器及び記憶媒体
JP2021192290A (ja) 機械翻訳モデルのトレーニング方法、装置及び電子機器
JP2022028889A (ja) 対話生成方法、装置、電子機器及び記憶媒体
CN111241838B (zh) 文本实体的语义关系处理方法、装置及设备
JP7395553B2 (ja) 文章翻訳方法、装置、電子機器及び記憶媒体
CN116303962B (zh) 对话生成方法、深度学习模型的训练方法、装置和设备
JP2022006173A (ja) 知識事前訓練モデルの訓練方法、装置及び電子機器
KR20210127613A (ko) 대화 생성 방법, 장치, 전자 기기 및 기록 매체
JP2022031863A (ja) 単語スロットの認識方法、装置及び電子機器
JP2022106980A (ja) クエリ文の生成方法、装置、電子機器及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230627

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240126

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20240208

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20240531