JP2021103556A - 対話生成方法、装置、電子機器及び記憶媒体 - Google Patents
対話生成方法、装置、電子機器及び記憶媒体 Download PDFInfo
- Publication number
- JP2021103556A JP2021103556A JP2021048627A JP2021048627A JP2021103556A JP 2021103556 A JP2021103556 A JP 2021103556A JP 2021048627 A JP2021048627 A JP 2021048627A JP 2021048627 A JP2021048627 A JP 2021048627A JP 2021103556 A JP2021103556 A JP 2021103556A
- Authority
- JP
- Japan
- Prior art keywords
- dialogue
- collocations
- collocation
- candidate
- target cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 95
- 230000003993 interaction Effects 0.000 title abstract description 12
- 230000004044 response Effects 0.000 claims description 29
- 230000015654 memory Effects 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 6
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 230000009977 dual effect Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000000475 sunscreen effect Effects 0.000 description 3
- 239000000516 sunscreening agent Substances 0.000 description 3
- 206010019345 Heat stroke Diseases 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/083—Recognition networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
Description
入力文を取得するステップと、
対話グラフから前記入力文に対応する第1の連語を取得するステップであって、ここで、前記対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれるステップと、
前記複数の対話ターゲットクラスタ間の関連関係及び前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第1の連語に関連する第2の連語を取得するステップと、
前記第2の連語及び前記入力文に基づいて、応答文を生成するステップと、を含む対話生成方法を提供する。
入力文を取得するための第1の取得モジュールと、
対話グラフから前記入力文に対応する第1の連語を取得するための第2の取得モジュールであって、ここで、前記対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれる第2の取得モジュールと、
前記複数の対話ターゲットクラスタ間の関連関係及び前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第1の連語に関連する第2の連語を取得するための第3の取得モジュールと、
前記第2の連語及び前記入力文に基づいて、応答文を生成するための生成モジュールと、を含む対話生成装置を提供する。
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を含む電子機器を提供し、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサが上記一態様の実施例に記載の対話生成方法を実行できるように、前記少なくとも1つのプロセッサによって実行される。
第5の態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムは、コンピュータに上記一態様の実施例に記載の対話生成方法を実行させる。
図面は、本技術案をよりよく理解するために使用され、本出願を限定するものではない。
第2の取得モジュール820は、対話グラフから入力文に対応する第1の連語を取得することに用いられ、ここで、対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれ、
第3の取得モジュール830は、複数の対話ターゲットクラスタ間の関連関係及び対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第1の連語に関連する第2の連語を取得することに用いられ、
生成モジュール840は、第2の連語及び入力文に基づいて、応答文を生成することに用いられる。
対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第1の連語に関連する複数の第1の候補連語を取得するための第1の取得ユニットと、
第1の連語が属する第1の対話ターゲットクラスタと、複数の第1の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第2の対話ターゲットクラスタを決定するための第1の決定ユニットと、
第2の対話ターゲットクラスタから第1の連語に関連する第2の連語を取得するための第2の取得ユニットと、を含む。
複数の連語間の接続辺の方向及び接続辺の第1の重みに基づいて、対話グラフから複数の第1の候補連語を取得することに用いられ、ここで、各第1の候補連語と第1の連語の間には、第1の連語から第1の候補連語を指向する接続辺が含まれ、且つ接続辺の第1の重みが第1の閾値より大きい。
複数の連語間の接続辺の方向及び接続辺の数量に基づいて、対話グラフから第1の連語に関連する複数の第1の候補連語を取得することに用いられ、ここで、各第1の候補連語と第1の連語との間の接続辺の方向は、第1の連語から第1の候補連語を指向するものであり、且つ各第1の候補連語に対応する接続辺の数量は第2の閾値より大きい。
対話グラフにおける複数の連語間の関連関係に基づいて、対話グラフから第1の連語に関連する複数の第2の候補連語を取得し、
複数の第2の候補連語のうちの各第2の候補連語にそれぞれ対応する選択された回数に基づいて、複数の第2の候補連語から複数の第1の候補連語を取得することに用いられる。
複数の第1の候補連語におけるいずれかの候補連語が属する候補対話ターゲットクラスタが第1の対話ターゲットクラスタである場合、第2の対話ターゲットクラスタと第1の対話ターゲットクラスタとが同じ対話ターゲットクラスタであると決定することに用いられる。
第1の対話ターゲットクラスタと各候補対話ターゲットクラスタとの間の接続辺の方向及び接続辺の第2の重みに基づいて、各候補対話ターゲットクラスタから第2の対話ターゲットクラスタを取得することに用いられ、ここで、第1の対話ターゲットクラスタと第2の対話ターゲットクラスタの間には、第1の対話ターゲットクラスタから第2の対話ターゲットクラスタを指向する接続辺が含まれ、且つ接続辺の第2の重みが第3の閾値より大きい。
入力文を認識して、現在対応する誘導対象の対話ターゲットを決定し、
誘導対象の対話ターゲットと対話グラフにおける各対話ターゲットクラスタとのマッチング度に基づいて、第3の対話ターゲットクラスタを決定し、
各候補対話ターゲットクラスタのそれぞれと第3の対話ターゲットクラスタとの間の接続辺の方向及び接続辺の第2の重みに基づいて、各候補対話ターゲットクラスタから第2の対話ターゲットクラスタを取得することに用いられる。
入力文に対して単語分割処理を行って、入力文に含まれる各分割された単語を決定するための単語分割処理ユニットと、
各分割された単語のそれぞれと対話グラフ内の各連語との間の関連度に基づいて、対話グラフにおける入力文に対応する第1の連語を決定するための第2の決定ユニットと、を含む。
各分割された単語のそれぞれと対話グラフにおける複数の連語との間の関連度に基づいて、対話グラフから複数の第3の候補連語を取得し、
複数の第3の候補連語のそれぞれと入力文との類似度に基づいて、複数の第3の候補連語から第1の連語を取得することに用いられる。
複数組の対話が含まれる対話データセットを取得するための第4の取得モジュールと、
対話データセットから複数の連語を抽出するための抽出モジュールと、
複数の連語のうちの各2つの連語の、同じ組の対話での共起方式に基づいて、複数の連語間の関連関係を決定するための決定モジュールと、
複数の連語間の関連関係に基づいて、複数の連語をクラスタリングして、複数の対話ターゲットクラスタ及び複数の対話ターゲットクラスタ間の関連関係を決定するためのクラスタリングモジュールと、をさらに含む。
対話データセットにおける各対話に対して構文分析を行って、各対話に対応する構文木を取得するための第3の取得ユニットと、
各対話に対応する構文木のルートノードから、各対話に対応する連語を抽出するための抽出ユニットと、を含む。
本出願の実施例によれば、本出願は、コンピュータプログラムを提供し、コンピュータプログラムは、コンピュータに本出願によって提供される対話生成方法を実行させる。
Claims (27)
- 対話生成方法であって、
入力文を取得するステップと、
対話グラフから前記入力文に対応する第1の連語を取得するステップであって、前記対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれるステップと、
前記複数の対話ターゲットクラスタ間の関連関係及び前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第1の連語に関連する第2の連語を取得するステップと、
前記第2の連語及び前記入力文に基づいて、応答文を生成するステップと、を含む、
ことを特徴とする対話生成方法。 - 前記複数の対話ターゲットクラスタ間の関連関係及び前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第1の連語に関連する第2の連語を取得するステップは、
前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第1の連語に関連する複数の第1の候補連語を取得するステップと、
前記第1の連語が属する第1の対話ターゲットクラスタと、前記複数の第1の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第2の対話ターゲットクラスタを決定するステップと、
前記第2の対話ターゲットクラスタから前記第1の連語に関連する第2の連語を取得するステップと、を含む、
ことを特徴とする請求項1に記載の方法。 - 前記複数の連語間の関連関係は、前記複数の連語間の接続辺の方向及び前記接続辺の第1の重みを含み、
前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第1の連語に関連する複数の第1の候補連語を取得するステップは、
前記複数の連語間の接続辺の方向及び前記接続辺の第1の重みに基づいて、前記対話グラフから複数の第1の候補連語を取得するステップであって、各前記第1の候補連語と前記第1の連語との間には、前記第1の連語から前記第1の候補連語を指向する接続辺が含まれ、且つ前記接続辺の第1の重みが第1の閾値より大きいステップを含む、
ことを特徴とする請求項2に記載の方法。 - 前記複数の連語間の関連関係は、前記複数の連語間の接続辺の方向を含み、
前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第1の連語に関連する複数の第1の候補連語を取得するステップは、
前記複数の連語間の接続辺の方向及び接続辺の数量に基づいて、前記対話グラフから前記第1の連語に関連する複数の第1の候補連語を取得するステップであって、各前記第1の候補連語と前記第1の連語との間の接続辺の方向が、前記第1の連語から前記第1の候補連語を指向するものであり、且つ各前記第1の候補連語に対応する接続辺の数量が第2の閾値より大きいステップを含む、
ことを特徴とする請求項2に記載の方法。 - 前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第1の連語に関連する複数の第1の候補連語を取得するステップは、
前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第1の連語に関連する複数の第2の候補連語を取得するステップと、
前記複数の第2の候補連語のうちの各前記第2の候補連語にそれぞれ対応する選択された回数に基づいて、前記複数の第2の候補連語から前記複数の第1の候補連語を取得するステップと、を含む、
ことを特徴とする請求項2に記載の方法。 - 前記第1の連語が属する第1の対話ターゲットクラスタと、前記複数の第1の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第2の対話ターゲットクラスタを決定するステップは、
前記複数の第1の候補連語におけるいずれかの候補連語が属する候補対話ターゲットクラスタが前記第1の対話ターゲットクラスタである場合、前記第2の対話ターゲットクラスタと前記第1の対話ターゲットクラスタとが同じ対話ターゲットクラスタであると決定するステップを含む、
ことを特徴とする請求項2に記載の方法。 - 前記複数の対話ターゲットクラスタ間の関連関係は、前記複数の対話ターゲットクラスタ間の接続辺の方向及び前記接続辺の第2の重みを含み、
前記第1の連語が属する第1の対話ターゲットクラスタと、前記複数の第1の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第2の対話ターゲットクラスタを決定するステップは、
前記第1の対話ターゲットクラスタと前記各候補対話ターゲットクラスタとの間の接続辺の方向及び前記接続辺の第2の重みに基づいて、前記各候補対話ターゲットクラスタから前記第2の対話ターゲットクラスタを取得するステップであって、前記第1の対話ターゲットクラスタと前記第2の対話ターゲットクラスタの間には、前記第1の対話ターゲットクラスタから前記第2の対話ターゲットクラスタを指向する接続辺が含まれ、且つ前記接続辺の第2の重みが第3の閾値より大きいステップを含む、
ことを特徴とする請求項2に記載の方法。 - 前記複数の対話ターゲットクラスタ間の関連関係は、前記複数の対話ターゲットクラスタ間の接続辺の方向及び前記接続辺の第2の重みを含み、各前記対話ターゲットクラスタが1つの対話ターゲットに対応し、
前記第1の連語が属する第1の対話ターゲットクラスタと、前記複数の第1の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第2の対話ターゲットクラスタを決定するステップは、
前記入力文を認識して、現在対応する誘導対象の対話ターゲットを決定するステップと、
前記誘導対象の対話ターゲットと前記対話グラフにおける各対話ターゲットクラスタとのマッチング度に基づいて、第3の対話ターゲットクラスタを決定するステップと、
前記各候補対話ターゲットクラスタのそれぞれと前記第3の対話ターゲットクラスタとの間の接続辺の方向及び前記接続辺の第2の重みに基づいて、前記各候補対話ターゲットクラスタから前記第2の対話ターゲットクラスタを取得するステップと、を含む、
ことを特徴とする請求項2〜6のいずれかに記載の方法。 - 前記対話グラフから前記入力文に対応する第1の連語を取得するステップは、
前記入力文に対して単語分割処理を行って、前記入力文に含まれる各分割された単語を決定するステップと、
前記各分割された単語のそれぞれと前記対話グラフ内の各連語との間の関連度に基づいて、前記対話グラフにおける前記入力文に対応する第1の連語を決定するステップと、を含む、
ことを特徴とする請求項1に記載の方法。 - 前記各分割された単語のそれぞれと前記対話グラフ内の各連語との間の関連度に基づいて、前記対話グラフにおける前記入力文に対応する第1の連語を決定するステップは、
前記各分割された単語のそれぞれと前記対話グラフにおける複数の連語との間の関連度に基づいて、前記対話グラフから複数の第3の候補連語を取得するステップと、
前記複数の第3の候補連語のそれぞれと前記入力文との類似度に基づいて、前記複数の第3の候補連語から前記第1の連語を取得するステップと、を含む、
ことを特徴とする請求項9に記載の方法。 - 前記対話グラフから前記入力文に対応する第1の連語を取得するステップの前に、
複数組の対話が含まれる対話データセットを取得するステップと、
前記対話データセットから複数の連語を抽出するステップと、
前記複数の連語のうちの各2つの連語の、同じ組の対話での共起方式に基づいて、前記複数の連語間の関連関係を決定するステップと、
前記複数の連語間の関連関係に基づいて、前記複数の連語をクラスタリングして、複数の対話ターゲットクラスタ及び前記複数の対話ターゲットクラスタ間の関連関係を決定するステップと、をさらに含む、
ことを特徴とする請求項1〜7のいずれかに記載の方法。 - 前記対話データセットから複数の連語を抽出するステップは、
前記対話データセットにおける各対話に対して構文分析を行って、前記各対話に対応する構文木を取得するステップと、
前記各対話に対応する構文木のルートノードから、前記各対話に対応する連語を抽出するステップと、を含む、
ことを特徴とする請求項11に記載の方法。 - 対話生成装置であって、
入力文を取得するための第1の取得モジュールと、
対話グラフから前記入力文に対応する第1の連語を取得するための第2の取得モジュールであって、前記対話グラフには互いに関連する複数の対話ターゲットクラスタ及び互いに関連する複数の連語が含まれ、各対話ターゲットクラスタには複数の連語が含まれる第2の取得モジュールと、
前記複数の対話ターゲットクラスタ間の関連関係及び前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第1の連語に関連する第2の連語を取得するための第3の取得モジュールと、
前記第2の連語及び前記入力文に基づいて、応答文を生成するための生成モジュールと、を含む、
ことを特徴とする対話生成装置。 - 前記第3の取得モジュールは、
前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第1の連語に関連する複数の第1の候補連語を取得するための第1の取得ユニットと、
前記第1の連語が属する第1の対話ターゲットクラスタと、前記複数の第1の候補連語のそれぞれが属する各候補対話ターゲットクラスタとの間の関連関係に基づいて、第2の対話ターゲットクラスタを決定するための第1の決定ユニットと、
前記第2の対話ターゲットクラスタから前記第1の連語に関連する第2の連語を取得するための第2の取得ユニットと、を含む、
ことを特徴とする請求項13に記載の装置。 - 前記複数の連語間の関連関係は、前記複数の連語間の接続辺の方向及び前記接続辺の第1の重みを含み、
前記第1の取得ユニットは、
前記複数の連語間の接続辺の方向及び前記接続辺の第1の重みに基づいて、前記対話グラフから複数の第1の候補連語を取得し、各前記第1の候補連語と前記第1の連語の間には、前記第1の連語から前記第1の候補連語を指向する接続辺が含まれ、且つ前記接続辺の第1の重みが第1の閾値より大きい、
ことを特徴とする請求項14に記載の装置。 - 前記複数の連語間の関連関係は、前記複数の連語間の接続辺の方向を含み、
前記第1の取得ユニットは、
前記複数の連語間の接続辺の方向及び接続辺の数量に基づいて、前記対話グラフから前記第1の連語に関連する複数の第1の候補連語を取得し、各前記第1の候補連語と前記第1の連語との間の接続辺の方向が、前記第1の連語から前記第1の候補連語を指向するものであり、且つ各前記第1の候補連語に対応する接続辺の数量が第2の閾値より大きい、
ことを特徴とする請求項14に記載の装置。 - 前記第1の取得ユニットは、
前記対話グラフにおける複数の連語間の関連関係に基づいて、前記対話グラフから前記第1の連語に関連する複数の第2の候補連語を取得し、
前記複数の第2の候補連語のうちの各前記第2の候補連語にそれぞれ対応する選択された回数に基づいて、前記複数の第2の候補連語から前記複数の第1の候補連語を取得する、
ことを特徴とする請求項14に記載の装置。 - 前記第1の決定ユニットは、
前記複数の第1の候補連語におけるいずれかの候補連語が属する候補対話ターゲットクラスタが前記第1の対話ターゲットクラスタである場合、前記第2の対話ターゲットクラスタと前記第1の対話ターゲットクラスタとが同じ対話ターゲットクラスタであると決定する、
ことを特徴とする請求項14に記載の装置。 - 前記複数の対話ターゲットクラスタ間の関連関係は、前記複数の対話ターゲットクラスタ間の接続辺の方向及び前記接続辺の第2の重みを含み、
前記第1の決定ユニットは、
前記第1の対話ターゲットクラスタと前記各候補対話ターゲットクラスタとの間の接続辺の方向及び前記接続辺の第2の重みに基づいて、前記各候補対話ターゲットクラスタから前記第2の対話ターゲットクラスタを取得し、前記第1の対話ターゲットクラスタと前記第2の対話ターゲットクラスタの間には、前記第1の対話ターゲットクラスタから前記第2の対話ターゲットクラスタを指向する接続辺が含まれ、且つ前記接続辺の第2の重みが第3の閾値より大きい、
ことを特徴とする請求項14に記載の装置。 - 前記複数の対話ターゲットクラスタ間の関連関係は、前記複数の対話ターゲットクラスタ間の接続辺の方向及び前記接続辺の第2の重みを含み、各前記対話ターゲットクラスタが1つの対話ターゲットに対応し、
前記第1の決定ユニットは、
前記入力文を認識して、現在対応する誘導対象の対話ターゲットを決定し、
前記誘導対象の対話ターゲットと前記対話グラフにおける各対話ターゲットクラスタとのマッチング度に基づいて、第3の対話ターゲットクラスタを決定し、
前記各候補対話ターゲットクラスタのそれぞれと前記第3の対話ターゲットクラスタとの間の接続辺の方向及び前記接続辺の第2の重みに基づいて、前記各候補対話ターゲットクラスタから前記第2の対話ターゲットクラスタを取得する、
ことを特徴とする請求項14〜18のいずれかに記載の装置。 - 前記第2の取得モジュールは、
前記入力文に対して単語分割処理を行って、前記入力文に含まれる各分割された単語を決定するための単語分割処理ユニットと、
前記各分割された単語のそれぞれと前記対話グラフ内の各連語との間の関連度に基づいて、前記対話グラフにおける前記入力文に対応する第1の連語を決定するための第2の決定ユニットと、を含む、
ことを特徴とする請求項13に記載の装置。 - 前記第2の決定ユニットは、
前記各分割された単語のそれぞれと前記対話グラフにおける複数の連語との間の関連度に基づいて、前記対話グラフから複数の第3の候補連語を取得し、
前記複数の第3の候補連語のそれぞれと前記入力文との類似度に基づいて、前記複数の第3の候補連語から前記第1の連語を取得する、
ことを特徴とする請求項21に記載の装置。 - 複数組の対話が含まれる対話データセットを取得するための第4の取得モジュールと、
前記対話データセットから複数の連語を抽出するための抽出モジュールと、
前記複数の連語のうちの各2つの連語の、同じ組の対話での共起方式に基づいて、前記複数の連語間の関連関係を決定するための決定モジュールと、
前記複数の連語間の関連関係に基づいて、前記複数の連語をクラスタリングして、複数の対話ターゲットクラスタ及び前記複数の対話ターゲットクラスタ間の関連関係を決定するためのクラスタリングモジュールと、をさらに含む、
ことを特徴とする請求項13〜19のいずれかに記載の装置。 - 前記抽出モジュールは、
前記対話データセットにおける各対話に対して構文分析を行って、前記各対話に対応する構文木を取得するための第3の取得ユニットと、
前記各対話に対応する構文木のルートノードから、前記各対話に対応する連語を抽出するための抽出ユニットと、を含む、
ことを特徴とする請求項23に記載の装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサが請求項1〜12のいずれかに記載の対話生成方法を実行できるように、前記少なくとも1つのプロセッサによって実行される、
ことを特徴とする電子機器。 - コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、前記コンピュータに請求項1〜12のいずれかに記載の対話生成方法を実行させる、
ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。 - コンピュータプログラムであって、
前記コンピュータプログラムは、コンピュータに請求項1〜12のいずれかに記載の対話生成方法を実行させる、
ことを特徴とするコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010984320.0A CN111930916B (zh) | 2020-09-18 | 2020-09-18 | 对话生成方法、装置、电子设备和存储介质 |
CN202010984320.0 | 2020-09-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021103556A true JP2021103556A (ja) | 2021-07-15 |
JP7216133B2 JP7216133B2 (ja) | 2023-01-31 |
Family
ID=73333935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021048627A Active JP7216133B2 (ja) | 2020-09-18 | 2021-03-23 | 対話生成方法、装置、電子機器及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210280189A1 (ja) |
EP (1) | EP3855323A1 (ja) |
JP (1) | JP7216133B2 (ja) |
KR (1) | KR20210119340A (ja) |
CN (1) | CN111930916B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114118101B (zh) * | 2021-11-26 | 2022-12-09 | 北京百度网讯科技有限公司 | 对话数据生成方法及装置、设备和介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012141756A (ja) * | 2010-12-28 | 2012-07-26 | Yahoo Japan Corp | 関連語グラフ作成装置、関連語グラフ作成方法、関連語提供装置、関連語提供方法及びプログラム |
JP2018055548A (ja) * | 2016-09-30 | 2018-04-05 | 株式会社Nextremer | 対話装置、学習装置、対話方法、学習方法、およびプログラム |
JP2020102117A (ja) * | 2018-12-25 | 2020-07-02 | 株式会社DataVision | 発話生成装置、発話生成方法、及びコンピュータプログラム |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4670848A (en) * | 1985-04-10 | 1987-06-02 | Standard Systems Corporation | Artificial intelligence system |
WO2008000046A1 (en) * | 2006-06-29 | 2008-01-03 | Relevancenow Pty Limited | Social intelligence |
US10073840B2 (en) * | 2013-12-20 | 2018-09-11 | Microsoft Technology Licensing, Llc | Unsupervised relation detection model training |
US10402453B2 (en) * | 2014-06-27 | 2019-09-03 | Nuance Communications, Inc. | Utilizing large-scale knowledge graphs to support inference at scale and explanation generation |
US10120955B2 (en) * | 2014-07-18 | 2018-11-06 | Nuance Communications, Inc. | State tracking over machine-learned relational trees in a dialog system |
CN104731895B (zh) * | 2015-03-18 | 2018-09-18 | 北京京东尚科信息技术有限公司 | 自动应答的方法和装置 |
CN105095195B (zh) * | 2015-07-03 | 2018-09-18 | 北京京东尚科信息技术有限公司 | 基于知识图谱的人机问答方法和系统 |
US10540666B2 (en) * | 2015-10-05 | 2020-01-21 | Oath Inc. | Method and system for updating an intent space and estimating intent based on an intent space |
CN106777364A (zh) * | 2017-01-22 | 2017-05-31 | 竹间智能科技(上海)有限公司 | 话题驱动的人工智能回应方法及装置 |
US10803249B2 (en) * | 2017-02-12 | 2020-10-13 | Seyed Ali Loghmani | Convolutional state modeling for planning natural language conversations |
CN107368524B (zh) * | 2017-06-07 | 2020-06-02 | 创新先进技术有限公司 | 一种对话生成方法、装置以及电子设备 |
US10860587B2 (en) * | 2017-06-14 | 2020-12-08 | Microsoft Technology Licensing, Llc | Conversationally-relevant content requests |
CN110399471A (zh) * | 2018-04-25 | 2019-11-01 | 北京快乐智慧科技有限责任公司 | 一种引导式情景对话方法和系统 |
US11196863B2 (en) * | 2018-10-24 | 2021-12-07 | Verint Americas Inc. | Method and system for virtual assistant conversations |
CN109800291B (zh) * | 2018-12-12 | 2024-03-15 | 平安科技(深圳)有限公司 | 问题应答方法及装置、电子设备和存储介质 |
US11132510B2 (en) * | 2019-01-30 | 2021-09-28 | International Business Machines Corporation | Intelligent management and interaction of a communication agent in an internet of things environment |
CN109918494B (zh) * | 2019-03-22 | 2022-11-04 | 元来信息科技(湖州)有限公司 | 基于图的上下文关联回复生成方法、计算机及介质 |
CN110309284B (zh) * | 2019-06-28 | 2021-08-06 | 广州探迹科技有限公司 | 一种基于贝叶斯网络推理的自动对答方法及装置 |
CN111026886B (zh) * | 2019-12-26 | 2023-05-02 | 成都航天科工大数据研究院有限公司 | 一种针对专业场景的多轮对话处理方法 |
-
2020
- 2020-09-18 CN CN202010984320.0A patent/CN111930916B/zh active Active
-
2021
- 2021-03-23 JP JP2021048627A patent/JP7216133B2/ja active Active
- 2021-05-20 EP EP21175059.1A patent/EP3855323A1/en not_active Withdrawn
- 2021-05-21 US US17/326,917 patent/US20210280189A1/en not_active Abandoned
- 2021-09-14 KR KR1020210122365A patent/KR20210119340A/ko not_active Application Discontinuation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012141756A (ja) * | 2010-12-28 | 2012-07-26 | Yahoo Japan Corp | 関連語グラフ作成装置、関連語グラフ作成方法、関連語提供装置、関連語提供方法及びプログラム |
JP2018055548A (ja) * | 2016-09-30 | 2018-04-05 | 株式会社Nextremer | 対話装置、学習装置、対話方法、学習方法、およびプログラム |
JP2020102117A (ja) * | 2018-12-25 | 2020-07-02 | 株式会社DataVision | 発話生成装置、発話生成方法、及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN111930916B (zh) | 2021-02-05 |
CN111930916A (zh) | 2020-11-13 |
EP3855323A1 (en) | 2021-07-28 |
JP7216133B2 (ja) | 2023-01-31 |
KR20210119340A (ko) | 2021-10-05 |
US20210280189A1 (en) | 2021-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7317791B2 (ja) | エンティティ・リンキング方法、装置、機器、及び記憶媒体 | |
JP2021190087A (ja) | テキスト認識処理方法、装置、電子機器及び記憶媒体 | |
JP2021082308A (ja) | マルチモーダルコンテンツ処理方法、装置、機器及び記憶媒体 | |
JP7130194B2 (ja) | ユーザ意図認識方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム | |
JP2021184237A (ja) | データセット処理方法、装置、電子機器及び記憶媒体 | |
CN112507715A (zh) | 确定实体之间关联关系的方法、装置、设备和存储介质 | |
JP2021120863A (ja) | 情報を生成するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
KR102573637B1 (ko) | 엔티티 링킹 방법, 장치, 전자 기기 및 기록 매체 | |
KR102565673B1 (ko) | 시멘틱 표현 모델의 생성 방법, 장치, 전자 기기 및 저장 매체 | |
JP2021111334A (ja) | 検索データに基づくヒューマンコンピュータ対話型インタラクションの方法、装置及び電子機器 | |
US11907671B2 (en) | Role labeling method, electronic device and storage medium | |
CN111709234B (zh) | 文本处理模型的训练方法、装置及电子设备 | |
JP2021103569A (ja) | セマンティック処理方法、装置、電子機器及び媒体 | |
JP2022013600A (ja) | イベント関係の生成方法、装置、電子機器及び記憶媒体 | |
JP2022050379A (ja) | 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
JP2021174516A (ja) | ナレッジグラフ構築方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
JP2021099890A (ja) | 因果関係の判別方法、装置、電子機器及び記憶媒体 | |
US20220129448A1 (en) | Intelligent dialogue method and apparatus, and storage medium | |
JP2022014429A (ja) | 語義表現モデルの訓練方法、装置、デバイス及びコンピュータ記憶媒体 | |
CN112528001B (zh) | 一种信息查询方法、装置及电子设备 | |
CN111709252B (zh) | 基于预训练的语义模型的模型改进方法及装置 | |
CN111859953B (zh) | 训练数据的挖掘方法、装置、电子设备及存储介质 | |
JP7230304B2 (ja) | 対話生成方法、装置、電子機器、プログラム及び記憶媒体 | |
CN111767381A (zh) | 自动问答方法和装置 | |
JP7241122B2 (ja) | スマート応答方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210323 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220907 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7216133 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |