JP2022187109A - Dialog knowledge generation apparatus and dialog knowledge generation method - Google Patents
Dialog knowledge generation apparatus and dialog knowledge generation method Download PDFInfo
- Publication number
- JP2022187109A JP2022187109A JP2021094945A JP2021094945A JP2022187109A JP 2022187109 A JP2022187109 A JP 2022187109A JP 2021094945 A JP2021094945 A JP 2021094945A JP 2021094945 A JP2021094945 A JP 2021094945A JP 2022187109 A JP2022187109 A JP 2022187109A
- Authority
- JP
- Japan
- Prior art keywords
- attribute value
- knowledge
- knowledge graph
- dialogue
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 125
- 238000012800 visualization Methods 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 13
- 230000002452 interceptive effect Effects 0.000 claims description 8
- 238000013507 mapping Methods 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 101
- 238000010586 diagram Methods 0.000 description 31
- 238000000605 extraction Methods 0.000 description 16
- 230000004044 response Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000015654 memory Effects 0.000 description 7
- 238000012552 review Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
本発明は、対話知識生成装置及び対話知識生成方法に関し、計算機を利用したテキスト処理によって対話知識を生成する対話知識生成装置及び対話知識生成方法に適用して好適なものである。 The present invention relates to a dialogue knowledge generation device and a dialogue knowledge generation method, and is suitable for application to a dialogue knowledge generation device and a dialogue knowledge generation method for generating dialogue knowledge by text processing using a computer.
計算機を利用したフローチャート型のデータ構造の生成に関する従来技術として、例えば特許文献1及び特許文献2が挙げられる。特許文献1では、コーパスからベクトルのセットを生成し、データ構造(例えば、クラスタ形成木、系統樹)を生成するシステムが開示されている。また、特許文献2では、対話知識を管理する対話管理サーバとして、ユーザからの質問文のテキストデータを受け付け、ベクトル算出する対話管理サーバが開示されている。
For example, Japanese Unexamined Patent Application Publication Nos. 2003-100003 and 2003-100001 are examples of conventional techniques relating to the generation of a flowchart-type data structure using a computer.
対話による応対サービスにおいては、例えば、「契約期限が近づいているという通知が届いたが、対処の方法が分からないので教えてほしい」という問い合わせに対しては、「お客様番号は分かりますか」といったように不明点を確認する聞き返しを繰り返しながら、最終的な回答を提示することが好ましい。この場合、対話知識を表すフローチャート型のデータ構造(フローモデル)を事前に用意し、それを参照しながら対話管理することができれば、業務の熟練者でなくても回答に至るまでの手順を把握することができる。しかし、上述した従来技術を利用した場合、対話のフローモデルの木構造は生成できるものの、対話における聞き返し質問や回答のデータを割り当てることまでは実現できないという問題があった。 For example, in response to an inquiry such as "I received a notification that my contract is about to expire, but I don't know how to deal with it, please let me know." It is preferable to present the final answer while repeatedly asking questions to confirm unclear points. In this case, if it is possible to prepare a flowchart-type data structure (flow model) representing dialogue knowledge in advance and manage the dialogue while referring to it, even a non-expert person can understand the procedure leading up to the answer. can do. However, when using the conventional technology described above, although the tree structure of the dialogue flow model can be generated, there is the problem that it is not possible to allocate the data of the feedback questions and answers in the dialogue.
本発明は以上の点を考慮してなされたもので、業務文書(例えば業務マニュアル)及び過去の対話記録(例えば対話ログ)を活用して、聞き返しを含む対話のフローモデル(聞き返しテキスト付きの対話知識)を自動的に構築することが可能な対話知識生成方法及び対話知識生成装置を提案しようとするものである。 The present invention has been made in consideration of the above points, and utilizes business documents (e.g., business manuals) and past dialogue records (e.g., dialogue logs) to create a dialogue flow model including reflection (dialogue with reflection text). The object of the present invention is to propose a dialog knowledge generation method and a dialog knowledge generation apparatus capable of automatically constructing knowledge.
かかる課題を解決するため本発明においては、対話のフローモデルを表す知識グラフを自動生成する対話知識生成装置であって、業務文書及び過去の対話記録を含む対象データから、対話のキーワードである属性値と属性値のカテゴリを示す属性名とを、それぞれの選定条件を示す手掛かり句を用いて選定するキーワード選定部(例えば、後述する属性値キーワード選定部142及び属性名キーワード選定部143)と、前記キーワード選定部によって選定された前記属性値と前記属性名との対応関係を前記対象データにおけるそれぞれの取得位置に基づいて決定する対応付け部(例えば、後述する属性値-属性名対応付け部146)と、前記対応付け部によって決定された対応関係に基づいて前記属性値または前記属性名を有する複数のアイテムの階層関係を抽出し、前記抽出した階層関係に基づいて前記複数のアイテムを組み合わせることにより、前記知識グラフを生成するグラフ生成部(例えば、後述する知識グラフ生成部147及び聞き返し質問生成部148)と、を備える対話知識生成装置が提供される。
In order to solve this problem, the present invention provides a dialogue knowledge generation device that automatically generates a knowledge graph representing a flow model of dialogue, wherein from target data including business documents and past dialogue records, attributes that are keywords of dialogue A keyword selection unit (for example, an attribute value
また、かかる課題を解決するため本発明においては、対話のフローモデルを表す知識グラフを自動生成する対話知識生成装置による対話知識生成方法であって、前記対話知識生成装置が、業務文書及び過去の対話記録を含む対象データから、対話のキーワードである属性値と属性値のカテゴリを示す属性名とを、それぞれの選定条件を示す手掛かり句を用いて選定するキーワード選定ステップと、前記対話知識生成装置が、前記キーワード選定ステップで選定された前記属性値と前記属性名との対応関係を前記対象データにおけるそれぞれの取得位置に基づいて決定する対応付けステップと、前記対話知識生成装置が、前記対応付けステップで決定された対応関係に基づいて前記属性値または前記属性名を有する複数のアイテムの階層関係を抽出し、前記抽出した階層関係に基づいて前記複数のアイテムを組み合わせることにより、前記知識グラフを生成するグラフ生成ステップと、を備える対話知識生成方法が提供される。 Further, in order to solve such problems, the present invention provides a dialogue knowledge generation method by a dialogue knowledge generation device for automatically generating a knowledge graph representing a flow model of dialogue, wherein the dialogue knowledge generation device is composed of business documents and past a keyword selection step of selecting, from target data including dialogue records, attribute values that are keywords of dialogue and attribute names that indicate categories of attribute values, using clue phrases that indicate selection conditions for the respective attribute values; and the dialogue knowledge generation device. a matching step of determining a correspondence relationship between the attribute values selected in the keyword selecting step and the attribute names based on their acquisition positions in the target data; extracting the hierarchical relationship of a plurality of items having the attribute value or the attribute name based on the correspondence determined in the step, and combining the plurality of items based on the extracted hierarchical relationship to create the knowledge graph; and a generating graph generation step.
本発明によれば、業務文書及び過去の対話記録を活用して、聞き返しを含む対話のフローモデルを自動的に構築することができる。 According to the present invention, it is possible to automatically construct a dialogue flow model including reflection by utilizing business documents and past dialogue records.
以下、図面を参照して、本発明の実施形態を詳述する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
(1)構成
図1は、本発明の一実施形態に係る対話知識生成装置100を実現するコンピュータ10のハードウェア構成例を示すブロック図である。
(1) Configuration FIG. 1 is a block diagram showing an example hardware configuration of a
コンピュータ10は、CPU11、メモリ12、記憶デバイス13、入力デバイス14、出力デバイス15、及びネットワークデバイス16が、バス17を介して互いに接続されて構成される。
The
CPU11は、プログラムを実行するプロセッサであり、例えばCPU(Central Processing Unit)である。メモリ12は、プログラムやプログラムを実行する際に参照されるデータ等を格納するRAM(Random Access Memory)等の主記憶装置である。記憶デバイス13は、プログラムやプログラムを実行する際に参照されるデータ等を格納する補助記憶装置であって、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)等である。入力デバイス14は、操作者による入力を受け付ける装置であって、例えば、キーボード、マウス、またはタッチパネル等である。出力デバイス15は、CPU11によって実行された処理の結果、あるいは、メモリ12または記憶デバイス13に保持されたデータ等を出力する装置であって、例えば、液晶表示装置や有機EL(Electro Luminescence)ディスプレイ等である。ネットワークデバイス16は、通信インタフェース及び入出力インタフェース等の各種インタフェースである。バス17は、内部通信線であって、コンピュータ10内の各装置を連結する。
The
後述する図2に示す対話知識生成装置100の各機能は、それぞれの機能に応じた処理用のプログラムが上記したコンピュータ10のハードウェア資源により実行されることによって実現される。具体的には、図2に示す制御部140内の各機能部は、CPU11が、メモリ12または記憶デバイス13に保持された所定のプログラムを関連データを参照しながら実行することによって実現される。また、知識グラフ可視化部150は、CPU11が所定のプログラムを実行し、さらにその実行結果を出力デバイス15(あるいはユーザ端末200でもよい)に出力することによって実現される。また、図2に示すテキスト情報DB110、関係情報DB120、及びグラフ情報DB130は、主に記憶デバイス13によって実現される。
Each function of the dialogue
なお、コンピュータ10においてCPU11が実行する上記プログラム、及び当該プログラムが参照するデータの一部または全ては、メモリ12または記憶デバイス13に予め格納されていてもよいし、必要に応じて、ネットワークデバイス16を介して、ネットワークで接続された他の装置の非一時的記憶装置または非一時的な記憶媒体から、コンピュータ10の記憶デバイス13に格納されるように構成されてもよい。また、以下の説明では、簡便のため、対話知識生成装置100が1つのコンピュータ10によって実現される構成とするが、本実施形態に係る対話知識生成装置100の構成はこれに限定されるものではなく、複数のコンピュータ10によって実現されてもよく、データベース装置やクラウドストレージ等を含めて実現されてもよい。
Note that part or all of the above programs executed by the
図2は、対話知識生成装置100の機能構成例を示すブロック図である。詳細は後述するが、対話知識生成装置100は、ユーザ端末200から業務文書、過去の対話記録(以下、問い合わせ記録とも呼ぶ)、及び初期手掛かり句の入力を受け付け、属性値キーワード、属性名キーワード、及び最終回答キーワードを生成し、それらの対応関係を特定したうえで、知識グラフ及び聞き返し質問を生成し、聞き返し質問のテキスト付きの知識グラフ(知識フローモデル)を可視化する。なお、本例では、テキストデータによる業務文書の一例として業務マニュアル(マニュアルとも称する)を用い、テキストデータによる過去の対話記録(問い合わせ記録)の一例として対話ログを用いて説明する。
FIG. 2 is a block diagram showing a functional configuration example of the dialogue
図2に示すように、対話知識生成装置100は、テキスト情報DB110、関係情報DB120、グラフ情報DB130、制御部140、及び知識グラフ可視化部150を備えて構成される。
As shown in FIG. 2, the dialogue
テキスト情報DB110は、知識グラフの生成と聞き返し質問の生成に必要となるデータのうち、テキストに関連付くデータを格納する。図2に示すように、テキスト情報DB110は、手掛かり句DB111、属性値DB112、属性名DB113、及び最終回答DB114から構成される。
The
手掛かり句DB111は、「手掛かり句」に関する手掛かり句情報を格納する。「手掛かり句」は、対話のキーワードである「属性値」、属性値のカテゴリを示す「属性名」、及び対話の「最終回答」を、対象データ(業務文書及び過去の対話記録)から選定するための選定条件となる語句である。本実施形態では、初期に外部(ユーザ端末200)から提供される手掛かり句を初期手掛かり句と称する。また、詳細は後述するが、本実施形態では、手掛かり句推定部141が、初期手掛かり句を用いて対象データから抽出した対象表現を基に、初期手掛かり句(対象表現と読み替えてもよい)を補完する手掛かり句を推定することができ、手掛かり句DB111に格納される手掛かり句情報は、これら初期手掛かり句と補完された手掛かり句とを含む。手掛かり句情報のデータ構成例は、後で図3を参照しながら説明する。
The
属性値DB112は、業務文書(例えば業務マニュアル)または問い合わせ記録(例えば対話ログ)から抽出されるキーワードの一種である「属性値」に関する属性値キーワード情報を格納する。属性値は、後述する知識グラフにおける「回答テキスト」を得るための情報である。属性値キーワード情報は、属性値キーワード選定部142によって抽出され、そのデータ構成例は、後で図4を参照しながら説明する。
The
属性名DB113は、上記属性値のカテゴリを表す「属性名」に関する属性名キーワード情報を格納する。属性名と属性値の関係は、キー(Key)と値(Value)の関係に相当する。属性名は、後述する知識グラフにおける「聞き返しテキスト」を得るための情報である。属性名キーワード情報は、属性名キーワード選定部143によって抽出され、そのデータ構成例は、後で図5を参照しながら説明する。
The
最終回答DB114は、業務文書または問い合わせ記録から抽出されるキーワードの一種である「最終回答」に関する最終回答キーワード情報を格納する。最終回答は、聞き返し質問を含む対話知識における最終的な回答に相当し、言い換えれば、後述する知識グラフにおける「最終回答テキスト」を得るための情報である。最終回答キーワード情報は、最終回答キーワード選定部144によって抽出され、そのデータ構成例は、後で図6を参照しながら説明する。
The
関係情報DB120は、知識グラフの生成と聞き返し質問の生成に必要となるデータのうち、テキスト同士の情報に関連付くデータを格納する。図2に示すように、関係情報DB120は、属性値最終回答対応関係DB121及び属性値属性名対応関係DB122から構成される。
The
属性値最終回答対応関係DB121は、属性値キーワードと最終回答キーワードとの対応関係を示す属性値-最終回答対応関係情報を格納する。属性値-最終回答対応関係情報は、属性値-最終回答対応付け部145によって生成され、そのデータ構成例は、後で図7を参照しながら説明する。
The attribute value final
属性値属性名対応関係DB122は、属性値キーワードと属性名キーワードとの対応関係を示す属性値-属性名対応関係情報を格納する。属性値-属性名対応関係情報は、属性値-属性名対応付け部146によって生成され、そのデータ構成例は、後で図8を参照しながら説明する。
The attribute value-attribute
グラフ情報DB130は、対話知識を示す知識グラフの生成、及び知識グラフにテキストデータで付加する聞き返し質問の生成に必要となるデータのうち、グラフ構造の情報に関連付くデータを格納する。図2に示すように、グラフ情報DB130は、知識グラフノードDB131及び知識グラフエッジDB132から構成される。
The
知識グラフノードDB131は、対話知識を示す知識グラフの構成要素であるノードに関する知識グラフノード情報を格納する。知識グラフノード情報は、知識グラフ生成部147及び聞き返し質問生成部148によって供給され、そのデータ構成例は、後で図9を参照しながら説明する。
The knowledge
知識グラフエッジDB132は、対話知識を示す知識グラフの構成要素であるエッジに関する知識グラフエッジ情報を格納する。知識グラフエッジ情報は、知識グラフ生成部147及び聞き返し質問生成部148によって供給され、そのデータ構成例は、後で図10を参照しながら説明する。
The knowledge
本実施形態において、知識グラフは、聞き返しと回答のテキストデータを割り当てたフローチャート型のデータ構造である「対話フローモデル」の一形態であって、対話における質問または最終回答のテキストを保持するノード(知識グラフノード)と、質問を受けた側の回答のテキストを保持するエッジ(知識グラフエッジ)とが階層的に連結された構造体で表される。 In this embodiment, the knowledge graph is a form of a "dialogue flow model", which is a flowchart-type data structure in which text data of reflections and answers are assigned, and is a node ( A knowledge graph node) and an edge (knowledge graph edge) holding the answer text of the question-receiver are represented by a structure in which they are hierarchically connected.
制御部140は、手掛かり句推定部141、属性値キーワード選定部142、属性名キーワード選定部143、最終回答キーワード選定部144、属性値-最終回答対応付け部145、属性値-属性名対応付け部146、知識グラフ生成部147、及び聞き返し質問生成部148を備え、各機能部が有する機能を提供する。
The
手掛かり句推定部141は、ユーザ端末200から業務文書(本例では業務マニュアル)、問い合わせ記録(本例では対話ログ)、及び初期手掛かり句の入力を受け取り、初期手掛かり句を用いて、対象データ(業務文書及び問い合わせ記録)から新たな手掛かり句を抽出する。手掛かり句推定部141は、抽出した手掛かり句に関する手掛かり句情報を作成し、手掛かり句DB111に格納する。手掛かり句推定部141による上記の処理(手掛かり句推定処理と称する)については、後で図12を参照しながら詳細な処理手順例を説明する。
The clue
属性値キーワード選定部142は、手掛かり句DB111に格納された手掛かり句情報を用いて、属性値キーワードとその対象データ内における位置情報等を抽出し、これらの抽出結果を含む属性値キーワード情報を属性値DB112に格納する。属性値キーワード選定部142による上記の処理(属性値キーワード選定処理と称する)については、後で図13を参照しながら詳細な処理手順例を説明する。
The attribute value
属性名キーワード選定部143は、手掛かり句DB111に格納された手掛かり句情報を用いて、属性名キーワードとその対象データ内の位置情報等を抽出し、これらの抽出結果を含む属性名キーワード情報を属性名DB113に格納する。属性名キーワード選定部143による上記の処理(属性名キーワード選定処理と称する)については、後で図14を参照しながら詳細な処理手順例を説明する。
The attribute name
最終回答キーワード選定部144は、手掛かり句DB111に格納された手掛かり句情報を用いて、最終回答キーワード及びその対象データ内位置情報等を抽出し、これらの抽出結果を含む最終回答キーワード情報を最終回答DB114に格納する。最終回答キーワード選定部144による上記の処理(最終回答キーワード選定処理と称する)については、後で図15を参照しながら詳細な処理手順例を説明する。
The final answer
属性値-最終回答対応付け部145は、属性値DB112に格納された属性値キーワード情報と最終回答DB114に格納された最終回答キーワード情報とを用いて、属性値レコードと最終回答レコードとの対応関係を特定し、その特定結果を含む属性値-最終回答対応関係情報を属性値-最終回答対応関係DB121に格納する。属性値-最終回答対応付け部145による上記の処理(属性値-最終回答対応付け処理と称する)については、後で図16を参照しながら詳細な処理手順例を説明する。
The attribute value-final
属性値-属性名対応付け部146は、属性値DB112に格納された属性値キーワード情報と属性名DB113に格納された属性名キーワード情報とを用いて、属性値レコードと属性名レコードとの対応関係を特定し、その特定結果を含む属性値-属性名対応関係情報を属性値-属性名対応関係DB122に格納する。属性値-属性名対応付け部146による上記の処理(属性値-属性名対応付け処理と称する)については、後で図17を参照しながら詳細な処理手順例を説明する。
The attribute value-attribute
知識グラフ生成部147は、属性値-最終回答対応関係DB121に格納された属性値-最終回答対応関係情報を用いて、対話知識を示す知識グラフを構成するノード及びエッジに関する情報として、知識グラフノード情報及び知識グラフエッジ情報を生成し、知識グラフノードDB131及び知識グラフエッジDB132に格納する。知識グラフ生成部147による上記の処理(知識グラフ生成処理と称する)については、後で図18,図19を参照しながら詳細な処理手順例を説明する。
The knowledge
聞き返し質問生成部148は、属性値-属性名対応関係DB122に格納された属性値-属性名対応関係情報を用いて、知識グラフノードDB131に格納された知識グラフノード情報及び知識グラフエッジDB132に格納された知識グラフエッジ情報に、適宜テキストを登録することにより、対話知識を示す知識グラフに、聞き返し質問のテキスト(聞き返しテキスト)及び質問への回答のテキスト(回答テキスト)を関連付ける。聞き返し質問生成部148による上記の処理(聞き返し質問生成処理と称する)については、後で図20,図21を参照しながら詳細な処理手順例を説明する。
The feedback
知識グラフ可視化部150は、知識グラフノードDB131に格納された知識グラフノード情報及び知識グラフエッジDB132に格納された知識グラフエッジ情報を用いて、知識グラフを可視化することにより、聞き返し質問のテキスト付きの対話知識をユーザから視認可能な形態で出力する。知識グラフ可視化部150による知識グラフの可視化の具体例は、図22,図23に例示される。
The knowledge
(2)データ構成例
以下では、テキスト情報DB110、関係情報DB120、及びグラフ情報DB130内の各DBに格納される各種情報のデータ構成例について説明する。
(2) Data Configuration Example A data configuration example of various types of information stored in each DB in the
図3は、手掛かり句情報のデータ構成例を示す図である。図3に示す手掛かり句情報300は、手掛かり句DB111にリスト形式で格納されるデータであって、1以上の手掛かり句レコード(行データ)から構成される。各手掛かり句レコードには、1つの手掛かり句に関する情報が保持される。そして、手掛かり句レコードは、手掛かり句ID301、対象データカテゴリ302、対象表現カテゴリ303、生成方法304、手掛かり句内容305、確信度306、及び照合パターン307のフィールドから構成される。
FIG. 3 is a diagram showing a data configuration example of clue phrase information. The
手掛かり句ID301は、当該手掛かり句の識別子(手掛かり句ID)を保持する。対象データカテゴリ302は、当該手掛かり句を用いたキーワード抽出の対象とされる対象データのカテゴリを示す情報を保持する。例えば、手掛かり句は、「マニュアル」または「対話ログ」の何れかからキーワード抽出するときに用いられる。
The
対象表現カテゴリ303は、当該手掛かり句を用いて抽出するキーワードの種類を示す情報を保持する。具体的には、属性名キーワードの場合は「属性名」、属性値キーワードの場合は「属性値」、最終回答キーワードの場合は「最終回答」と記載される。
The
生成方法304は、当該手掛かり句の生成方法を示す情報を保持する。具体的には、当該手掛かり句がユーザ端末200から入力された初期手掛かり句である場合は「初期」、新たな手掛かり句を生成した結果得られた手掛かり句である場合には「補完」と記載される。
The
手掛かり句内容305は、当該手掛かり句の内容をテキスト形式で保持する。確信度306は、当該手掛かり句の生成方法304が「補完」である場合に、手掛かり句としての確からしさに関する情報(確信度)を保持する。
The
照合パターン307は、当該手掛かり句を用いたキーワード抽出における対象表現の照合パターンを示す情報を保持する。本例では、照合パターン307は、固有のテキストと正規表現([]内には、変数部分として単語の種類を指定)によって、対象表現を指定している。このような照合パターン307が保持されることにより、当該照合パターンと正規表現処理による文字列抽出とを利用して、変数部分に該当する語句をキーワードとして抽出するキーワード抽出を実施することができる。なお、図3では、「普通名詞」、「時相名詞」、「固有名詞」等の、形態素解析で得られる形式が照合パターン307に指定されているが、照合パターン307の表記は必ずしもこれに限定されるものではなく、構文解析で得られる句や、固有表現抽出で得られるNamedEntityであってもよく、さらにはHTMLパーサーで得られるHTMLタグの形式を用いてもよい。
The
図4は、属性値キーワード情報のデータ構成例を示す図である。図4に示す属性値キーワード情報400は、属性値DB112にリスト形式で格納されるデータであって、1以上の属性値レコード(行データ)から構成される。そして属性値レコードは、属性値ID401、属性値キーワード402、対象データ内位置情報403、確信度404、及び選定元手掛かり句ID405のフィールドから構成される。
FIG. 4 is a diagram showing a data configuration example of attribute value keyword information. The attribute
属性値ID401は、抽出した属性値キーワードの識別子(属性値ID)を保持する。属性値キーワード402は、抽出した属性値キーワードのテキストを保持する。
The
対象データ内位置情報403は、照合パターン307に基づいて対象データから属性値キーワードを抽出したときに、対象データにおける属性値キーワードの抽出位置を示す情報を保持する。例えば、図4に示した「13行目」とは、マニュアルの13行目から属性値キーワードを抽出したことを意味し、「6番目発話」とは、対話ログの6番目の発話から属性値キーワードを抽出したことを意味する。
The target data position
確信度404は、属性値キーワードとしての確からしさに関する情報(確信度)を保持する。選定元手掛かり句ID405は、属性値キーワードの抽出に用いた手掛かり句レコードのID情報(図3の手掛かり句ID301に対応)を保持する。
The degree of
図5は、属性名キーワード情報のデータ構成例を示す図である。図5に示す属性名キーワード情報500は、属性名DB113にリスト形式で格納されるデータであって、1以上の属性名レコード(行データ)から構成される。そして属性名レコードは、属性名ID501、属性名キーワード502、対象データ内位置情報503、確信度504、及び選定元手掛かり句ID505のフィールドから構成される。
FIG. 5 is a diagram showing a data configuration example of attribute name keyword information. The attribute
属性名ID501は、抽出した属性名キーワードの識別子(属性名ID)を保持する。属性名キーワード502は、抽出した属性名キーワードのテキストを保持する。
The
対象データ内位置情報503は、照合パターン307に基づいて対象データから属性名キーワードを抽出したときに、対象データにおける属性名キーワードの抽出位置を示す情報を保持する。例えば、図5に示した「12行目」とは、マニュアルの12行目から属性名キーワードを抽出したことを意味し、「5番目発話」とは、対話ログの5番目の発話から属性名キーワードを抽出したことを意味する。
The target data
確信度504は、属性名キーワードとしての確からしさに関する情報(確信度)を保持する。選定元手掛かり句ID505は、属性名キーワードの抽出に用いた手掛かり句レコードのID情報(図3の手掛かり句ID301に対応)を保持する。
The degree of
図6は、最終回答キーワード情報のデータ構成例を示す図である。図6に示す最終回答キーワード情報600は、最終回答DB114にリスト形式で格納されるデータであって、1以上の最終回答レコード(行データ)から構成される。そして最終回答レコードは、最終回答ID601、最終回答キーワード602、対象データ内位置情報603、確信度604、及び選定元手掛かり句ID605のフィールドから構成される。
FIG. 6 is a diagram showing a data configuration example of final answer keyword information. The final
最終回答ID601は、抽出した最終回答キーワードの識別子(属性名ID)を保持する。最終回答キーワード602は、抽出した最終回答キーワードのテキストを保持する。
The
対象データ内位置情報603は、照合パターン307に基づいて対象データから最終回答キーワードを抽出したときに、対象データにおける最終回答キーワードの抽出位置を示す情報を保持する。例えば、図6に示した「14行目」とは、マニュアルの14行目から最終回答キーワードを抽出したことを意味し、「7番目発話」とは、対話ログの7番目の発話から最終回答キーワードを抽出したことを意味する。
The target data
確信度604は、最終回答キーワードとしての確からしさに関する情報(確信度)を保持する。選定元手掛かり句ID605は、最終回答キーワードの抽出に用いた手掛かり句レコードのID情報(図3の手掛かり句ID301に対応)を保持する。
The degree of
図7は、属性値-最終回答対応関係情報のデータ構成例を示す図である。図7に示す属性値-最終回答対応関係情報700は、属性値最終回答対応関係DB121にリスト形式で格納されるデータであって、1以上の属性値-最終回答対応関係レコード(行データ)から構成される。そして属性値-最終回答対応関係レコードは、対応関係ID701、属性値ID702、最終回答ID703、及び確信度704のフィールドから構成される。
FIG. 7 is a diagram showing a data configuration example of attribute value-final answer correspondence relationship information. The attribute value-final
対応関係ID701は、属性値キーワードと最終回答キーワードとの対応関係(属性値-最終回答対応関係)の識別子を保持する。属性値ID702は、当該対応関係を構成する属性値キーワードのID情報(図4の属性値ID401に対応)を保持する。最終回答ID703は、当該対応関係を構成する最終回答キーワードのID情報(図6の最終回答ID601に対応)を保持する。確信度704は、当該対応関係の対応付けの確からしさに関する情報を保持する。
The
図8は、属性値-属性名対応関係情報のデータ構成例を示す図である。図8に示す属性値-属性名対応関係情報800は、属性値属性名対応関係DB122にリスト形式で格納されるデータであって、1以上の属性値-属性名対応関係レコード(行データ)から構成される。そして属性値-属性名対応関係レコードは、対応関係ID801、属性値ID802、属性値ID803、及び確信度804のフィールドから構成される。
FIG. 8 is a diagram showing a data configuration example of attribute value-attribute name correspondence information. The attribute value-attribute
対応関係ID801は、属性値キーワードと属性名キーワードとの対応関係(属性値-属性名対応関係)の識別子を保持する。属性値ID802は、当該対応関係を構成する属性値キーワードのID情報(図4の属性値ID401に対応)を保持する。属性名ID803は、当該対応関係を構成する属性名キーワードのID情報(図5の属性名ID501に対応)を保持する。確信度804は、当該対応関係の対応付けの確からしさに関する情報を保持する。
The
図9は、知識グラフノード情報のデータ構成例を示す図である。図9に示す知識グラフノード情報900は、知識グラフノードDB131にリスト形式で格納されるデータであって、1以上の知識グラフノードレコード(行データ)から構成される。そして知識グラフノードレコードは、ノードID901、テキスト902、及びノードカテゴリ903のフィールドから構成される。
FIG. 9 is a diagram showing a data configuration example of knowledge graph node information. The knowledge
ノードID901は、知識グラフを構成するノードの識別子(ノードID)を保持する。テキスト902は、聞き返し質問のテキスト、または最終回答のテキストを保持する。ノードカテゴリ903は、知識ノードのカテゴリ(種類)を識別する情報を保持する。具体的には例えば、「最終回答」または「聞き返し質問」のカテゴリが用意される。
The
図10は、知識グラフエッジ情報のデータ構成例を示す図である。図10に示す知識グラフエッジ情報1000は、知識グラフエッジDB132にリスト形式で格納されるデータであって、1以上の知識グラフエッジレコード(行データ)から構成される。そして知識グラフエッジレコードは、エッジID1001、流入元ノードID1002、流入先ノードID1003、及びテキスト1004のフィールドから構成される。
FIG. 10 is a diagram showing a data configuration example of knowledge graph edge information. The knowledge
エッジID1001は、知識グラフを構成するエッジの識別子(エッジID)を保持する。流入元ノードID1002は、知識グラフにおいて当該エッジを割り当てた流入元の知識グラフノードのID情報(図9のノードID901に対応)を保持する。流入先ノードID1003は、知識グラフにおいて当該エッジを割り当てた流入先の知識グラフノードのID情報(図9のノードID901に対応)を保持する。テキスト1004は、聞き返し質問の回答結果に関するテキストを保持する。
The edge ID 1001 holds identifiers (edge IDs) of edges forming the knowledge graph. The inflow
(3)対話知識生成処理
以下では、対話知識生成装置100が実行する対話知識生成処理について、処理主体となる機能部を明示しながら詳しく説明する。
(3) Dialogue Knowledge Generation Processing Hereinafter, the dialogue knowledge generation processing executed by the dialogue
図11は、対話知識生成処理の全体的な処理手順例を示すフローチャートである。図11に示す対話知識生成処理において、対話知識生成装置100がユーザ端末200からの入力を受けると、手掛かり句推定部141が、手掛かり句情報300を手掛かり句DB111に格納する手掛かり句推定処理を実行する(ステップS1101)。
FIG. 11 is a flow chart showing an example of an overall processing procedure of dialogue knowledge generation processing. In the dialogue knowledge generation process shown in FIG. 11, when the dialogue
次に、属性値キーワード選定部142が、手掛かり句情報300を用いて対象データから属性値キーワードを抽出する属性値キーワード選定処理を実行し(ステップS1102)、属性名キーワード選定部143が、手掛かり句情報300を用いて対象データから属性名キーワードを抽出する属性名キーワード選定処理を実行し(ステップS1103)、最終回答キーワード選定部144が、手掛かり句情報300を用いて対象データから最終回答キーワードを抽出する最終回答キーワード選定処理を実行する(ステップS1104)。なお、ステップS1102~S1104の各処理は、実行順序を入れ替えてもよく、あるいは並行して実行してもよい。
Next, the attribute value
次に、属性値-最終回答対応付け部145が、属性値レコードと最終回答レコードとを対応付ける属性値-最終回答対応付け処理を実行し(ステップS1105)、属性値-属性名対応付け部146が、属性値レコードと属性名レコードとを対応付ける属性値-属性名対応付け処理を実行する(ステップS1106)。なお、ステップS1105,S1106の各処理は、実行順序を入れ替えてもよく、あるいは並行して実行してもよい。
Next, the attribute value-final
その後、知識グラフ生成部147が、対話知識を示す知識グラフの構造を生成する知識グラフ生成処理を実行する(ステップS1107)。知識グラフ生成処理では、具体的には、知識グラフノード情報900及び知識グラフエッジ情報1000の一部作成を行うことにより、知識グラフを構成するノードとエッジとの関係性を特定し、知識グラフの構造を完成させる。
After that, the knowledge
次に、聞き返し質問生成部148が、ステップS1107で生成された知識グラフに、聞き返し質問及びその回答のテキスト(聞き返しテキスト、回答テキスト)を関連付ける聞き返し質問生成処理を実行する(ステップS1108)。聞き返し質問生成処理が実行されることにより、知識グラフ生成部147によって途中まで生成された知識グラフに聞き返しテキストが追加されるため、聞き返しテキスト付きの対話知識(対話フローモデル)としての知識グラフが完成する。
Next, the reflection
次に、知識グラフ可視化部150が、ステップS1107,S1108を経て生成された聞き返し質問のテキスト付きの知識グラフを可視化する知識グラフ可視化処理を実行する(ステップS1109)。
Next, the knowledge
その後、対話知識生成装置100は、ユーザ端末200からの追加入力があるか否かを判定し(ステップS1110)、追加入力がある場合は(ステップS1110のYES)、ステップS1109に戻り、追加入力の内容に応じて、知識グラフ及び聞き返し質問を再度可視化する。一方、追加入力がない場合は(ステップS1110のNO)、対話知識生成処理を終了する。
Thereafter, the dialogue
以下では、対話知識生成処理における各ステップの処理について詳しく説明する。 The processing of each step in the dialogue knowledge generation processing will be described in detail below.
(3-1)手掛かり句推定処理
図12は、手掛かり句推定処理の処理手順例を示すフローチャートである。手掛かり句推定処理は、図11のステップS1101の処理であって、手掛かり句推定部141によって実行される。
(3-1) Clue Phrase Estimation Processing FIG. 12 is a flowchart showing an example of the procedure of the clue phrase estimation processing. The clue phrase estimation process is the process of step S1101 in FIG. 11 and is executed by the clue
手掛かり句推定処理ではまず、手掛かり句推定部141は、ユーザ端末200から、業務文書(本例では業務マニュアル)、問い合わせ記録(本例では対話ログ)、及び初期手掛かり句の入力を受信する(ステップS1201)。
In the clue phrase estimation process, first, the clue
次に、手掛かり句推定部141は、ステップS1201で受信した初期手掛かり句に関する手掛かり句レコードを生成し、手掛かり句DB111に格納される手掛かり句情報300に追加する(ステップS1202)。ステップS1202で生成される手掛かり句レコードは、生成方法304に「初期」が登録され、その他のフィールドにも適宜、入力された値が登録される。なお、ステップS1201においてユーザ端末200から入力される初期手掛かり句は複数であってもよく、その場合、手掛かり句推定部141は、ステップS1202において受信した初期手掛かり句の分だけ、新規に手掛かり句レコードを生成する。また、ステップS1202において、手掛かり句推定部141は、ステップS1201で受信した業務文書及び問い合わせ記録を、対話知識生成装置100内の適切な記憶場所(詳細は図示省略)に格納する。
Next, the clue
次に、手掛かり句推定部141は、新たな手掛かり句を抽出していない初期手掛かり句が存在するか否かを判定する(ステップS1203)。新たな手掛かり句を抽出していない初期手掛かり句が存在する場合、例えば、ステップS1202で初期手掛かり句が手掛かり句DB111に登録された直後のケースでは(ステップS1203のYES)、ステップS1204に進む。一方、全ての初期手掛かり句について新たな手掛かり句を抽出済みである場合は(ステップS1203のNO)、手掛かり句推定処理を終了する。
Next, the clue
ステップS1204では、手掛かり句推定部141は、ステップS1202で生成した手掛かり句レコードに基づいて、初期手掛かり句の対象表現を抽出する。そして手掛かり句推定部141は、抽出した対象表現から新たな手掛かり句を抽出し(ステップS1205)、抽出した新たな手掛かり句に関する手掛かり句レコードを生成し、手掛かり句DB111(手掛かり句情報300)に格納し(ステップS1206)、ステップS1203に戻る。
In step S1204, the clue
ステップS1205で抽出される新たな手掛かり句は、初期手掛かり句を補完する手掛かり句であり、新たな手掛かり句の手掛かり句レコードでは、生成方法304に「補完」と記載される。具体的には、初期手掛かり句の照合パターン307が「[普通名詞]のときは」とされ、ステップS1204において、マニュアルから対象表現として「契約のときは」というテキストが抽出されたとする。この場合、ステップS1205では、機械学習モデルや予め単語ごとに設定されたパラメータを利用する等して、「契約のときは」という表現を補完する表現が探索され、例えば「契約の際は」という表現が抽出されたとすると、「[普通名詞]の際は」といった手掛かり句が、新たな手掛かり句として抽出され、手掛かり句DB111に格納される。
The new clue phrase extracted in step S1205 is a clue phrase that complements the initial clue phrase. Specifically, it is assumed that the
(3-2)属性値キーワード選定処理
図13は、属性値キーワード選定処理の処理手順例を示すフローチャートである。属性値キーワード選定処理は、図11のステップS1102の処理であって、属性値キーワード選定部142によって実行される。
(3-2) Attribute Value Keyword Selection Processing FIG. 13 is a flow chart showing an example of the processing procedure of the attribute value keyword selection processing. The attribute value keyword selection process is the process of step S1102 in FIG. 11 and is executed by the attribute value
属性値キーワード選定処理ではまず、属性値キーワード選定部142は、手掛かり句DB111に格納された手掛かり句情報300を用いて、対象表現カテゴリ303が「属性値」である手掛かり句レコードを抽出する(ステップS1301)。
In the attribute value keyword selection process, first, the attribute value
次に、属性値キーワード選定部142は、ステップS1301で抽出した手掛かり句レコードについて、照合パターン307による属性値キーワードの抽出が実行されていない手掛かり句レコードの存在を確認する(ステップS1302)。
Next, the attribute value
ステップS1302において属性値キーワードの抽出が実行されていない手掛かり句レコードが存在する場合(ステップS1302のYES)、属性値キーワード選定部142は、当該手掛かり句レコードの対象データカテゴリ302が示す対象データに対して、照合パターン307を検索キーとして検索することにより、該当する属性値キーワードを抽出し(ステップS1303)、抽出した属性値キーワードの確信度(確信度404)を計算し(ステップS1304)、抽出した属性値キーワードに関する属性値レコードを生成し、当該属性値レコードを属性値DB112の属性値キーワード情報400に追加する(ステップS1305)。ステップS1305の終了後はステップS1302に戻る。
If there is a clue phrase record for which attribute value keyword extraction has not been performed in step S1302 (YES in step S1302), the attribute value
そして、ステップS1302において属性値キーワードの抽出が実行されていない手掛かり句レコードが存在しない場合は(ステップS1302のNO)、属性値キーワード選定処理を終了する。 Then, if there is no clue phrase record for which attribute value keyword extraction has not been executed in step S1302 (NO in step S1302), the attribute value keyword selection process is terminated.
(3-3)属性名キーワード選定処理
図14は、属性名キーワード選定処理の処理手順例を示すフローチャートである。属性名キーワード選定処理は、図11のステップS1103の処理であって、属性名キーワード選定部143によって実行される。
(3-3) Attribute Name Keyword Selection Processing FIG. 14 is a flow chart showing an example of a processing procedure for attribute name keyword selection processing. The attribute name keyword selection process is the process of step S1103 in FIG. 11 and is executed by the attribute name
属性名キーワード選定処理ではまず、属性名キーワード選定部143は、手掛かり句DB111に格納された手掛かり句情報300を用いて、対象表現カテゴリ303が「属性名」である手掛かり句レコードを抽出する(ステップS1401)。
In the attribute name keyword selection process, first, the attribute name
次に、属性名キーワード選定部143は、ステップS1401で抽出した手掛かり句レコードについて、照合パターン307による属性名キーワードの抽出が実行されていない手掛かり句レコードの存在を確認する(ステップS1402)。
Next, the attribute name
ステップS1402において属性名キーワードの抽出が実行されていない手掛かり句レコードが存在する場合(ステップS1402のYES)、属性名キーワード選定部143は、当該手掛かり句レコードの対象データカテゴリ302が示す対象データに対して、照合パターン307を検索キーとして検索することにより、該当する属性名キーワードを抽出し(ステップS1403)、抽出した属性名キーワードの確信度(確信度504)を計算し(ステップS1404)、抽出した属性名キーワードに関する属性名レコードを生成し、当該属性名レコードを属性名DB113の属性名キーワード情報500に追加する(ステップS1405)。ステップS1405の終了後はステップS1402に戻る。
In step S1402, if there is a clue phrase record for which attribute name keyword extraction has not been performed (YES in step S1402), the attribute name
そして、ステップS1402において属性名キーワードの抽出が実行されていない手掛かり句レコードが存在しない場合は(ステップS1402のNO)、属性名キーワード選定処理を終了する。 Then, in step S1402, if there is no clue phrase record for which attribute name keyword extraction has not been executed (NO in step S1402), the attribute name keyword selection process is terminated.
(3-4)最終回答キーワード選定処理
図15は、最終回答キーワード選定処理の処理手順例を示すフローチャートである。最終回答キーワード選定処理は、図11のステップS1104の処理であって、最終回答キーワード選定部144によって実行される。
(3-4) Final Answer Keyword Selection Processing FIG. 15 is a flowchart showing an example of the processing procedure of the final reply keyword selection processing. The final answer keyword selection process is the process of step S1104 in FIG. 11, and is executed by the final answer
最終回答キーワード選定処理ではまず、最終回答キーワード選定部144は、手掛かり句DB111に格納された手掛かり句情報300を用いて、対象表現カテゴリ303が「最終回答」である手掛かり句レコードを抽出する(ステップS1501)。
In the final answer keyword selection process, first, the final answer
次に、最終回答キーワード選定部144は、ステップS1501で抽出した手掛かり句レコードについて、照合パターン307による最終回答キーワードの抽出が実行されていない手掛かり句レコードの存在を確認する(ステップS1502)。
Next, the final answer
ステップS1502において最終回答キーワードの抽出が実行されていない手掛かり句レコードが存在する場合(ステップS1502のYES)、最終回答キーワード選定部144は、当該手掛かり句レコードの対象データカテゴリ302が示す対象データに対して、照合パターン307を検索キーとして検索することにより、該当する最終回答キーワードを抽出し(ステップS1503)、抽出した最終回答キーワードの確信度(確信度604)を計算し(ステップS1504)、抽出した最終回答キーワードに関する最終回答レコードを生成し、当該最終回答レコードを最終回答DB114に格納される最終回答キーワード情報600に追加する(ステップS1505)。ステップS1505の終了後はステップS1502に戻る。
In step S1502, if there is a clue phrase record for which the final answer keyword has not been extracted (YES in step S1502), the final answer
そして、ステップS1502において最終回答キーワードの抽出が実行されていない手掛かり句レコードが存在しない場合は(ステップS1502のNO)、最終回答キーワード選定処理を終了する。 Then, in step S1502, if there is no clue phrase record for which the final answer keyword has not been extracted (NO in step S1502), the final answer keyword selection process ends.
(3-5)属性値-最終回答対応付け処理
図16は、属性値-最終回答対応付け処理の処理手順例を示すフローチャートである。属性値-最終回答対応付け処理は、図11のステップS1105の処理であって、属性値-最終回答対応付け部145によって実行される。
(3-5) Attribute Value-Final Answer Correlation Processing FIG. 16 is a flow chart showing an example of a processing procedure for attribute value-final reply correlation processing. The attribute value-final answer association process is the process of step S1105 in FIG. 11 and is executed by the attribute value-final
属性値-最終回答対応付け処理ではまず、属性値-最終回答対応付け部145は、属性値DB112及び最終回答DB114を参照し、属性値DB112に格納された属性値キーワード情報400を構成する属性値レコード、及び最終回答DB114に格納された最終回答キーワード情報600を構成する最終回答レコードを抽出する(ステップS1601)。
In the attribute value-final answer association process, first, the attribute value-final
次に、属性値-最終回答対応付け部145は、ステップS1601で抽出した最終回答レコードにおいて、ステップS1601で抽出した属性値レコードとの対応付けがされていない最終回答レコードが存在するか否かを判定する(ステップS1602)。ステップS1602の判定は、例えば、属性値最終回答対応関係DB121に格納された属性値-最終回答対応関係情報700を参照して、行うことができる。
Next, the attribute value-final
ステップS1602において属性値レコードとの対応付けがされていない最終回答レコードが存在する場合には(ステップS1602のYES)、属性値-最終回答対応付け部145は、対応付けがされていない最終回答レコードについて、対応する属性値レコードを特定し(ステップS1603)、特定結果に基づいて属性値-最終回答対応関係レコードを生成し、属性値最終回答対応関係DB121の属性値-最終回答対応関係情報700に追加し(ステップS1604)、ステップS1602に戻る。
In step S1602, if there is a final answer record that is not associated with an attribute value record (YES in step S1602), the attribute value-final
ステップS1603において、最終回答レコードに対応する属性値レコードを特定する際、属性値-最終回答対応付け部145は、それぞれのキーワードの位置情報の近さに基づいて、関連するペアを探索する。より具体的には、属性値-最終回答対応付け部145は、対応付けの対象とする最終回答レコードの対象データ内位置情報603と、ステップS1601で抽出した各属性値レコードの対象データ内位置情報403とを比較し、最も近い位置情報を示す属性値レコードを、対応付ける属性値レコードとして特定する。なお、最終回答キーワードと対象データが異なる属性値レコードは、対応付けの探索対象外としてよい。
In step S1603, when identifying the attribute value record corresponding to the final answer record, the attribute value-final
そして、ステップS1602において属性値レコードとの対応付けがされていない最終回答レコードが存在しない場合には(ステップS1602のNO)、属性値-最終回答対応付け処理を終了する。 Then, in step S1602, if there is no final answer record that is not associated with an attribute value record (NO in step S1602), the attribute value-final answer association processing ends.
(3-6)属性値-属性名対応付け処理
図17は、属性値-属性名対応付け処理の処理手順例を示すフローチャートである。属性値-属性名対応付け処理は、図11のステップS1106の処理であって、属性値-属性名対応付け部146によって実行される。
(3-6) Attribute Value-Attribute Name Correlation Processing FIG. 17 is a flow chart showing an example of a processing procedure for attribute value-attribute name correlation processing. The attribute value-attribute name association processing is the processing of step S1106 in FIG. 11, and is executed by the attribute value-attribute
属性値-属性名対応付け処理ではまず、属性値-属性名対応付け部146は、属性値DB112及び属性名DB113を参照し、属性値DB112に格納された属性値キーワード情報400を構成する属性値レコード、及び属性名DB113に格納された属性名キーワード情報500を構成する属性名レコードを抽出する(ステップS1701)。
In the attribute value-attribute name association processing, first, the attribute value-attribute
次に、属性値-属性名対応付け部146は、ステップS1701で抽出した属性値レコードにおいて、ステップS1701で抽出した属性名レコードとの対応付けがされていない属性値レコードが存在するか否かを判定する(ステップS1702)。ステップS1702の判定は、例えば、属性値属性名対応関係DB122に格納された属性値-属性名対応関係情報800を参照して、行うことができる。
Next, the attribute value-attribute
ステップS1702において属性名レコードとの対応付けがされていない属性値レコードが存在する場合には(ステップS1702のYES)、属性値-属性名対応付け部146は、対応付けがされていない属性値レコードについて、対応する属性名レコードを特定し(ステップS1703)、特定結果に基づいて属性値-属性名対応関係レコードを生成し、属性値属性名対応関係DB122の属性値-属性名対応関係情報800に追加し(ステップS1704)、ステップS1702に戻る。
If there is an attribute value record that is not associated with an attribute name record in step S1702 (YES in step S1702), the attribute value-attribute
ステップS1703において、属性値レコードに対応する属性名レコードを特定する際、属性値-属性名対応付け部146は、それぞれのキーワードの位置情報の近さに基づいて、関連するペアを探索する。より具体的には、属性値-属性名対応付け部146は、対応付けの対象とする属性値レコードの対象データ内位置情報403と、ステップS1701で抽出した各属性名レコードの対象データ内位置情報503とを比較し、最も近い位置情報を示す属性名レコードを、対応付ける属性名レコードとして特定する。なお、属性値キーワードと対象データが異なる属性名レコードは、対応付けの探索対象外としてよい。
In step S1703, when identifying the attribute name record corresponding to the attribute value record, the attribute value-attribute
そして、ステップS1702において属性名レコードとの対応付けがされていない属性値レコードが存在しない場合には(ステップS1702のNO)、属性値-属性名対応付け処理を終了する。 Then, in step S1702, if there is no attribute value record that has not been associated with an attribute name record (NO in step S1702), the attribute value-attribute name association processing ends.
(3-7)知識グラフ生成処理
図18は、知識グラフ生成処理の処理手順例を示すフローチャートである。知識グラフ生成処理は、図11のステップS1107の処理であって、知識グラフ生成部147によって実行される。
(3-7) Knowledge Graph Generation Processing FIG. 18 is a flowchart illustrating an example of a processing procedure for knowledge graph generation processing. The knowledge graph generation process is the process of step S1107 in FIG. 11 and is executed by the knowledge
知識グラフ生成処理ではまず、知識グラフ生成部147は、属性値最終回答対応関係DB121に格納された属性値-最終回答対応関係情報700を参照し、対応関係にある最終回答キーワード及び属性値キーワードを用いてテキスト(最終回答テキスト)を生成し、生成したテキストを値にもつ知識グラフノードを新たに生成する。このとき、知識グラフ生成部147は、新たな知識グラフノードについて、上記テキストをテキスト902に保持し、ノードカテゴリ903に「最終回答」を保持する知識グラフノードレコードを生成し、さらにノードID901にIDを付与した上で、知識グラフノードDB131の知識グラフノード情報900に追加する(ステップS1801)。最終回答キーワードのテキストは、最終回答キーワード情報600の最終回答キーワード602から取得することができ、属性値キーワードのテキストは、属性値キーワード情報400の属性値キーワード402から取得することができる。
In the knowledge graph generation process, first, the knowledge
例えば、属性値-最終回答対応関係情報700で対応関係が示される最終回答キーワードが「電話手続き」であり、属性値キーワードが「配偶者」であるとするとき、ステップS1801において知識グラフ生成部147は、最終回答テキストとして「電話手続き(配偶者)」を生成する。
For example, assuming that the final answer keyword whose correspondence is indicated by the attribute value-final
次に、知識グラフ生成部147は、知識グラフエッジDB132に格納された知識グラフエッジ情報1000を参照し、流入先ノードID1002にノードID901が登録されていない知識グラフノードレコードが2つ以上存在するか否かを判定する(ステップS1802)。ステップS1802の処理は、知識グラフを樹形図で考えたときに、親ノードが設定されていないノード(子ノード)が2つ以上存在するか否かを判定する処理に相当する。したがって、初めてステップS1802に進んだときは、何れの知識グラフノードにも親ノードが設定されていないことから、流入先ノードID1002にID901が登録されたノードは存在せず、ステップS1801で生成された全ての知識グラフノードレコードが該当しないことになる。
Next, the knowledge
次に、ステップS1802において流入先ノードID1002にノードID901が登録されていない知識グラフノードレコードが2つ以上存在する場合(ステップS1802のYES)、知識グラフ生成部147は、該当するレコードの知識グラフノードの親ノードを決定するために、親ノード生成の対象とする知識グラフノードの集合を選定する(ステップS1803)。具体的には、知識グラフ生成部147は、流入先ノードID1002にノードID901が登録されていない知識グラフノードレコードとして抽出される知識グラフノードのうちから、テキスト902の文字列の類似性に基づいて、一部のノード集合を選定する。ステップS1803の処理は、親ノードが設定されていない子ノードのうちから、共通の親ノードを割り当てる子ノードを選定する処理に相当する。
Next, in step S1802, if there are two or more knowledge graph node records in which the
次に、知識グラフ生成部147は、ノードカテゴリ903に「聞き返し質問」を保持する知識グラフノードレコードを生成し、ノードID901にIDを付与した上で、知識グラフノードDB131の知識グラフノード情報900に追加する(ステップS1804)。ステップS1804の処理は、ステップS1803で選定した子ノードの集合に共通する親ノードを生成する処理に相当する。但し、ステップS1804で作成された知識グラフノードレコードでは、ノードカテゴリ903が「聞き返し質問」である知識グラフノードにおけるテキスト902(聞き返しテキスト)は空白のままである。聞き返しテキストは、後述する聞き返し質問生成処理のなかでテキスト902に登録される(図20のステップS2006を参照)。
Next, the knowledge
次に、知識グラフ生成部147は、ステップS1803で選定した知識グラフノードのそれぞれに対して、流入先ノードID1003に当該知識グラフノードのノードID901を保持する知識グラフエッジレコードを生成し、流入元ノードID1002及びエッジID1001を追加した上で、知識グラフエッジDB132の知識グラフエッジ情報1000に追加する(ステップS1805)。このとき、流入元ノードID1002には、ステップS1804で生成した知識グラフノードレコードのノードID901(親ノードのノードID)が、共通して登録される。また、エッジID1001には、生成された知識グラフエッジレコードごとに異なるIDが付与される。ステップS1805の処理は、ステップS1803で選定した子ノードのそれぞれと、ステップS1804で生成した親ノードとの間を結ぶエッジを生成する処理に相当する。ステップS1805の処理後は、ステップS1802に戻る。
Next, for each of the knowledge graph nodes selected in step S1803, the knowledge
そして、ステップS1802において流入先ノードID1002にノードID901が登録されていない知識グラフノードレコードが1つになった場合は(ステップS1802のNO)、知識グラフ生成処理を終了する。補足すると、樹形図の知識グラフにおいて最も根元のノード(根ノード)は流入元のエッジを持つ必要がないため、流入先ノードID1003にノードID901が登録される必要がない。したがって、流入先ノードID1002にノードID901が登録されていない知識グラフノードレコードが1つになった時点で、その他の知識グラフノードには全て親ノードが接続されており、残った1つの知識グラフノードを根ノードとして、知識グラフの構造的な生成を終了することができる。
If there is only one knowledge graph node record in which the
図19は、知識グラフ生成処理のイメージを視覚的に説明するための図である。図19に示されたノード1901~1907は、図18のステップS1802において流入先ノードID1002にノードID901が登録されていないと判定された知識グラフノードの具体例である。各ノード内に示された文字列は、当該ノードのテキスト(テキスト902に相当)を表す。
FIG. 19 is a diagram for visually explaining an image of knowledge graph generation processing.
知識グラフ生成処理においてステップS1802の判定が行われた時点では、ノード1901~1907は親ノードが設定されていないノードであり、図19に示すノード1908及びエッジ1911~1913は存在していない。
次いでステップS1803では、親ノードが設定されていない子ノード(すなわちノード1901~1907)のうちから、共通の親ノードを割り当てる子ノードとして、例えば、ノード1901~1903が選定される。図19の場合、ノード1901~1903は、「電話手続き」という共通する文字列を有していることから、文字列の類似性に基づいて、これらのノードが共通の親ノードを割り当てる子ノードの集合として選定されている。
Next, in step S1803,
次いでステップS1804では、ステップS1803で選定した子ノードの集合(ノード1901~1903)に共通する親ノードとして、ノード1908が生成される。図18の説明で前述した通り、ステップS1804の時点では、ノード1908のテキスト902は空白である。
Next, in step S1804, a
そして、ステップS1805では、ステップS1803で選定した子ノード(ノード1901~1903)のそれぞれと、ステップS1804で生成した親ノード(ノード1908)との間を結ぶエッジとして、エッジ1911~1913がそれぞれ生成される。
In step S1805, edges 1911 to 1913 are generated as edges connecting each of the child nodes (
以上の処理が行われることにより、図19に示す樹形図において、親ノードが設定されていなかったノード1901~1903を、エッジ1911~1913によって親ノードであるノード1908と接続することができる。そしてこれらの処理を繰り返すことにより、知識グラフ生成部147は、1つの根ノードを除く全てのノードについて、親ノードと接続するエッジを生成することができ、知識グラフの構造を完成することができる。
By performing the above processing, the
(3-8)聞き返し質問生成処理
図20は、聞き返し質問生成処理の処理手順例を示すフローチャートである。聞き返し質問生成処理は、図11のステップS1108の処理であって、聞き返し質問生成部148によって実行される。
(3-8) Reflection Question Generation Processing FIG. 20 is a flow chart showing an example of the processing procedure of the reflection question generation processing. The feedback question generation process is the process of step S1108 in FIG. 11, and is executed by the feedback
聞き返し質問生成処理ではまず、聞き返し質問生成部148は、知識グラフノードDB131に格納された知識グラフノード情報900を参照して、ノードカテゴリ903が「聞き返し質問」である知識グラフノードレコードを抽出する(ステップS2001)。
In the reflection question generation process, first, the reflection
次に、聞き返し質問生成部148は、ステップS2001で抽出した知識グラフノードレコードのなかに、テキスト902に聞き返し質問の内容(聞き返しテキスト)が登録されていない知識グラフノードレコードが存在するか否かを判定する(ステップS2002)。ステップS2002の処理は、聞き返し質問が空の親ノードを探索する処理に相当する。
Next, the reflection
次に、ステップS2002においてテキスト902に聞き返しテキストが登録されていない知識グラフノードレコードが存在する場合(ステップS2002のYES)、聞き返し質問生成部148は、知識グラフエッジDB132に格納された知識グラフエッジ情報1000を参照して、当該知識グラフノードレコードのノードID901が流入元ノードID1002に登録された知識グラフエッジレコードを抽出し、抽出した各レコードの流入先ノードID1003をまとめた流入先ノードID群を抽出する(ステップS2003)。ステップS2003の処理は、聞き返し質問が空の親ノードを流入元ノードとして接続するエッジを探索し、当該エッジが接続する流入先ノード(子ノード)のノードID群を抽出する処理であって、言い換えれば、図18のステップS1803で選定された知識グラフノードの集合のノードID群を抽出する処理に相当する。
Next, in step S2002, if there is a knowledge graph node record in which the reflection text is not registered in the text 902 (YES in step S2002), the reflection
次に、聞き返し質問生成部148は、知識グラフノードDB131に格納された知識グラフノード情報900を参照して、ステップS2003で抽出した流入先ノードID群に対応する知識グラフノードレコードのテキスト902をまとめたテキスト群を抽出する(ステップS2004)。ステップS2004の処理は、ステップS2003でノードIDを抽出した流入先ノード群のテキスト群を抽出する処理に相当する。
Next, the feedback
次に、聞き返し質問生成部148は、ステップS2004で抽出したテキスト群と、属性値属性名対応関係DB122に格納された属性値-属性名対応関係情報800とを参照して(厳密には、属性値キーワード情報400及び属性名キーワード情報500も参照する)、上記テキスト群の各テキスト(テキスト902)の生成に用いられた属性値キーワードと、当該属性値キーワードに対応する属性名キーワードとを抽出する(ステップS2005)。ここで、上記の各テキスト902は、図18に示した知識グラフ生成処理のステップS1801において、知識グラフ生成部147が対応関係にある最終回答キーワード及び属性値キーワードを用いて生成したものであり、ステップS2005では、当該生成で用いられた属性値キーワードが抽出される。ステップS2005の処理は、ステップS2004で抽出したテキスト群に含まれる属性値キーワードと、その対応する属性名キーワードとを抽出する処理であって、ステップS2005で抽出される属性値キーワードは、基本的には、図18のステップS1803で文字列の類似性に基づいて選定された知識グラフノードの集合における文字列の差分に相当する。そして、ステップS2005で抽出される属性名キーワードは、各属性値キーワードで共通となることが想定される。
Next, the feedback
次に、聞き返し質問生成部148は、ステップS2005で抽出した属性名キーワードを、聞き返しテキストとして、ステップS2002で判定された聞き返し質問が空の親ノードの知識グラフノードレコードのテキスト902に登録し、知識グラフノードDB131に格納する。また、聞き返し質問生成部148は、ステップS2005で抽出した属性値キーワードの差分を、聞き返しに対する回答テキストとして、ステップS2003における流入先ノードID群の抽出に用いた知識グラフエッジレコードのテキスト1004に登録し、知識グラフエッジDB132に格納する(ステップS2006)。なお、ステップS2005で抽出した属性値キーワードの差分は、例えばLinux(登録商標)のdiffコマンド等の公知の方法によって抽出することができる。このようなステップS2006の処理は、子ノードのテキスト群において共通(または類似)する属性値キーワードに相当する属性名キーワードを、親ノードのテキスト(聞き返しテキスト)に登録し、子ノードのテキスト群における属性値キーワードの差分を、親ノードと子ノードとを接続するエッジのテキスト(回答テキスト)に登録する処理に相当する。ステップS2006の処理後は、ステップS2002に戻る。
Next, the reflection
そして、ステップS2002においてテキスト902に聞き返しテキストが登録されていない知識グラフノードレコードが存在しない場合には(ステップS2002のNO)、知識グラフノード情報900においてノードカテゴリ903が「聞き返し質問」である全ての知識グラフレコードと、知識グラフエッジ情報1000を構成する全ての知識グラフエッジレコードとについて、全てのフィールドが登録済みになることを意味するため、聞き返し質問生成処理を終了する。すなわち、聞き返し質問生成処理が終了することにより、聞き返しテキスト付の対話知識としての知識グラフが完成する。
If there is no knowledge graph node record in which the reflection text is not registered in the
なお、本実施形態において、図18に示した知識グラフ生成処理と図20に示した聞き返し質問生成処理とは、交互に繰り返して実行されるようにしてもよく、より具体的には例えば、図18のステップS1802~S1805の処理が1回終わるごとに、図20の処理を実行し、図20のステップS2002~S2006の処理が1回終わると、再び図18のステップS1802に戻るようにしてよい。 In this embodiment, the knowledge graph generation process shown in FIG. 18 and the feedback question generation process shown in FIG. 20 may be alternately and repeatedly executed. 20 is executed each time the processing of steps S1802 to S1805 in FIG. 18 is completed once, and once the processing of steps S2002 to S2006 in FIG. 20 is completed, the process may return to step S1802 in FIG. .
図21は、聞き返し質問生成処理のイメージを視覚的に説明するための図である。図21に示したノード1901~1903,1908、及びエッジ1911~1913は、図19に示した同じ符号の各構成に対応している。すなわち、ノード1901~1903は、共通の親ノード(ノード1908)が割り当てられる子ノードとしての知識グラフノードであり、ノード1908は、ノード1901~1903の親ノードとされる知識グラフノードであり、エッジ1911~1913は、ノード1908とノード1901~1903とを接続する知識グラフエッジである。
FIG. 21 is a diagram for visually explaining an image of the feedback question generation process.
聞き返し質問生成処理においてステップS2002の判定が行われたとき、図21では、テキスト902に聞き返しテキストが登録されていない知識グラフノードレコードとして、ノード1908が認められる。なお、当該時点では、ノード1908には「続柄」というテキストは登録されていない。また、エッジ1911~1913は先の知識グラフ生成処理において生成済みであるが(図19参照)、各エッジにおける「配偶者」、「子」、「父母」というテキストも、当該時点では登録されていない。
When the determination in step S2002 is made in the reflection question generation processing,
次いでステップS2003では、知識グラフエッジ情報1000を参照して、聞き返し質問が空の親ノード(ノード1908)を流入元ノードとして接続するエッジ1911~1913が探索され、当該エッジが接続する流入先ノード(ノード1901~1903)のノードID群が抽出される。
Next, in step S2003, the knowledge
次いでステップS2004では、知識グラフノード情報900を参照して、ステップS2003で抽出した流入先ノードID群に対応する知識グラフノード(ノード1901~1903)のテキスト902をまとめたテキスト群が抽出される。図21の場合、具体的には、「電話手続き(配偶者)」、「電話手続き(子)」、「電話手続き(父母)」の3つのテキストが抽出される。
Next, in step S2004, with reference to the knowledge
次いでステップS2005では、ステップS2004で抽出したテキスト群に含まれる属性値キーワードと、その対応する属性名キーワードとが抽出される。図21では、抽出される属性名キーワードと属性値キーワードとの組み合わせが、属性名キーワード2101及び属性値キーワード2102として示されている。個々の属性名キーワードは属性名キーワード情報500の属性名キーワード502から取得され、個々の属性値キーワードは、属性値キーワード情報400の属性値キーワード402から取得される。ここで、図21を参照すると、属性名キーワード2101は「続柄」で共通となっており、属性値キーワード2102はノードごとに異なることが分かる。
Next, in step S2005, attribute value keywords and corresponding attribute name keywords included in the text group extracted in step S2004 are extracted. In FIG. 21, combinations of extracted attribute name keywords and attribute value keywords are shown as
次いでステップS2006では、子ノード(ノード1901~1903)のテキスト群において共通(または類似)する属性値キーワードに相当する属性名キーワード2101を、親ノード(ノード1908)のテキスト902に登録する処理と、子ノードのテキスト群における属性値キーワード2102の差分を、親ノードと子ノードとを接続するエッジ(エッジ1911~1913)のテキスト1004に登録する処理とが行われる。図21の場合は、各ノードにおける属性値キーワード2102がそれぞれ相違しているため、属性値キーワード2102の差分は属性値キーワード2102がそのまま使用されている。
Next, in step S2006, a process of registering an
以上の処理が行われることにより、図21に示す樹形図において、ノード1901~1903の親ノードに設定されていたノード1908に対して、その聞き返しテキストとして「続柄」を登録することができ、また、ノード1908とノード1901~1903を接続するエッジ1911~1913に対して、それぞれの回答テキストとして「配偶者」、「子」、「父母」を登録することができる。かくして、知識グラフノード情報900及び知識グラフエッジ情報1000の全てのレコードにおいて全てのフィールドが登録済みとなり、聞き返しテキスト付の知識グラフを完成することができる。
By performing the above processing, "relationship" can be registered as the reflection text for the
(3-9)知識グラフ可視化処理
図22は、知識グラフの可視化の一例(その1)を示す図である。図22に示す表示画面2200は、図11のステップS1109の処理により、知識グラフ可視化部150によって出力デバイス15(あるいはユーザ端末200でもよい)に表示出力される知識グラフの可視化画面の一例であって、ネットワーク形式で知識グラフを可視化した例である。
(3-9) Knowledge Graph Visualization Processing FIG. 22 is a diagram showing an example (part 1) of knowledge graph visualization. A
表示画面2200は、知識グラフノード情報900及び知識グラフエッジ情報1000に基づいて、その表示内容が形成される。例えば、図22の場合、ノード2201は、根ノードに相当する知識グラフノードであって、ノード2202は、ノード2201の子ノードに相当する知識グラフノードの1つである。これらノード2201,2202の情報は、知識グラフノード情報900から取得することができる。具体的には、ノード2201に示された「サービス加入時期」やノード2002に示された「支払い形態」は、各ノードにおける質問テキスト(聞き返しテキスト)であり、知識グラフノード情報900のテキスト902から取得することができる。また、ノード2201とノード2202とを接続するエッジ2211や、ノード2202以降を接続するエッジ2212の情報は、知識グラフエッジ情報1000から取得することができる。具体的には、エッジ2212に示された「2019以前」やエッジ2212に示された「月単位」は、各エッジにおける回答テキストであり、知識グラフエッジ情報1000のテキスト1004から取得することができる。
The display content of the
図23は、知識グラフの可視化の一例(その1)を示す図である。図23に示す表示画面2300は、図11のステップS1109の処理により、知識グラフ可視化部150によって出力デバイス15(あるいはユーザ端末200でもよい)に表示出力される知識グラフの可視化画面の一例であって、テーブル形式で知識グラフを可視化した例である。
FIG. 23 is a diagram illustrating an example (part 1) of visualization of a knowledge graph. A
表示画面2300は、図22に示した表示画面2200と同様に、知識グラフノード情報900及び知識グラフエッジ情報1000に基づいて、その表示内容が形成される。なお、図23において吹き出し内に示したブロック図は、参考のために、表示画面2300のテーブルに表された各ノードの構成関係を示したものである。
As with the
図23の表示画面2300によれば、ノードID「5」のノード2301が保持する「続柄」について質問が行われた場合は、その回答に応じて、エッジ2311,2312に分岐する。回答が「配偶者」であった場合は、エッジ2311を経てノードID「3」のノード2302に連結されることにより、配偶者向けの電話手続きを最終回答として案内することになる。一方、回答が「子」であった場合は、エッジ2312を経てノードID「4」のノード2303に連結されることにより、子向けの電話手続きを最終回答として案内することになる。
According to the
図22,図23に示したように、対話知識生成装置100では、聞き返しテキスト付きの対話知識(対話フローモデル)を表す知識グラフが可視化されてユーザに提供されることにより、ユーザは、対話知識の全体像を容易に理解できるだけでなく、対話の進捗に応じて必要な聞き返し質問を把握することができる。
As shown in FIGS. 22 and 23, the dialogue
以上に説明したように、本実施形態に係る対話知識生成装置100は、業務文書(業務マニュアル)及び問い合わせ記録(対話ログ)等、複数のデータソースを組み合わせて、人手による作業負荷及び構築コストを低減しながら、自動的に聞き返しテキスト付きの対話フローモデル(知識グラフ)を構築することができる。さらに、対話知識生成装置100は、図22や図23に例示したように、生成した知識グラフを可視化してユーザに提供できることにより、対話業務の担当者(ユーザ)は、可視化された知識グラフを参照しながら対話管理を行うことができ、業務の比熟練者であっても、不明点を聞き返しながら対話業務を進め、対話の利用者に向けて、適切な最終回答を容易に提示することができる。
As described above, the dialogue
なお、本発明は上記した実施形態に限定されるものではなく、様々な変形例が含まれる。例えば、属性値キーワード、属性名キーワード、及び最終回答キーワードの抽出においては、手掛かり句情報300の照合パターン307を用いるものでなくてもよい。その場合、例えば、事前に機械学習で生成した予測モデルを用いて、キーワードの抽出と確信度の計算を行うようにしてもよい。また例えば、属性値キーワードと属性名キーワードの対応関係の推定は、対象データ内位置情報403,503を用いるものでなくてもよい。その場合、例えば、外部のオープンデータやオントロジーを用いて、「子」の上位概念は「続柄」であることを特定し、対応関係の候補を絞り込みながら実施する等してもよい。
In addition, the present invention is not limited to the above-described embodiments, and includes various modifications. For example, the
また、上記した実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、実施形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。 Further, the above-described embodiments are described in detail for easy understanding of the present invention, and are not necessarily limited to those having all the described configurations. Moreover, it is possible to add, delete, or replace a part of the configuration of the embodiment with another configuration.
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。 Further, each of the above configurations, functions, processing units, processing means, and the like may be realized by hardware, for example, by designing a part or all of them using an integrated circuit. Moreover, each of the above configurations, functions, etc. may be realized by software by a processor interpreting and executing a program for realizing each function. Information such as programs, tables, and files that implement each function can be stored in recording devices such as memories, hard disks, SSDs (Solid State Drives), or recording media such as IC cards, SD cards, and DVDs.
また、図面において制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。 Further, in the drawings, control lines and information lines are shown as necessary for explanation, and not all control lines and information lines are necessarily shown on the product. In fact, it may be considered that almost all configurations are interconnected.
10 コンピュータ
11 CPU
12 メモリ
13 記憶デバイス
14 入力デバイス
15 出力デバイス
16 ネットワークデバイス
17 バス
100 対話知識生成装置
110 テキスト情報DB
111 手掛かり句DB
112 属性値DB
113 属性名DB
114 最終回答DB
120 関係情報DB
121 属性値最終回答対応関係DB
122 属性値属性名対応関係DB
130 グラフ情報DB
131 知識グラフノードDB
132 知識グラフエッジDB
140 制御部
141 手掛かり句推定部
142 属性値キーワード選定部
143 属性名キーワード選定部
144 最終回答キーワード選定部
145 属性値-最終回答対応付け部
146 属性値-属性名対応付け部
147 知識グラフ生成部
148 聞き返し質問生成部
150 知識グラフ可視化部
200 ユーザ端末
300 手掛かり句情報
400 属性値キーワード情報
500 属性名キーワード情報
600 最終回答キーワード情報
700 属性値-最終回答対応関係情報
800 属性値-属性名対応関係情報
900 知識グラフノード情報
1000 知識グラフエッジ情報
2200,2300 表示画面
10
12
111 Clue phrase DB
112 attribute value database
113 Attribute name DB
114 Final Answer DB
120 Relationship information DB
121 Attribute Value Final Answer Correspondence DB
122 attribute value attribute name correspondence DB
130 graph information DB
131 knowledge graph node DB
132 knowledge graph edge DB
140
Claims (12)
業務文書及び過去の対話記録を含む対象データから、対話のキーワードである属性値と属性値のカテゴリを示す属性名とを、それぞれの選定条件を示す手掛かり句を用いて選定するキーワード選定部と、
前記キーワード選定部によって選定された前記属性値と前記属性名との対応関係を前記対象データにおけるそれぞれの取得位置に基づいて決定する対応付け部と、
前記対応付け部によって決定された対応関係に基づいて前記属性値または前記属性名を有する複数のアイテムの階層関係を抽出し、前記抽出した階層関係に基づいて前記複数のアイテムを組み合わせることにより、前記知識グラフを生成するグラフ生成部と、
を備えることを特徴とする対話知識生成装置。 A dialogue knowledge generation device for automatically generating a knowledge graph representing a dialogue flow model,
a keyword selection unit that selects, from target data including business documents and past dialogue records, attribute values that are keywords for dialogue and attribute names that indicate categories of attribute values, using clue phrases that indicate selection conditions for each;
an associating unit that determines a correspondence relationship between the attribute value selected by the keyword selecting unit and the attribute name based on their respective acquisition positions in the target data;
By extracting hierarchical relationships of a plurality of items having the attribute values or attribute names based on the correspondence determined by the association unit, and combining the plurality of items based on the extracted hierarchical relationships, a graph generator that generates a knowledge graph;
A dialogue knowledge generation device comprising:
前記キーワード選定部は、前記初期の手掛かり句及び前記手掛かり句推定部によって推定された前記新たな手掛かり句を用いて、前記対象データから前記属性値及び前記属性名を選定する
ことを特徴とする請求項1に記載の対話知識生成装置。 a clue phrase estimation unit that extracts a target expression from the target data using an initial clue phrase input from the outside and estimates a new clue phrase that complements the extracted target expression;
The keyword selection unit selects the attribute value and the attribute name from the target data using the initial clue phrase and the new clue phrase estimated by the clue phrase estimation unit. Item 1. The interactive knowledge generation device according to item 1.
ことを特徴とする請求項1に記載の対話知識生成装置。 2. The interactive knowledge generation apparatus according to claim 1, further comprising a knowledge graph visualization unit that outputs the knowledge graph generated by the graph generation unit in a visible form.
ことを特徴とする請求項1に記載の対話知識生成装置。 3. The knowledge graph is represented by a structure in which nodes holding texts of questions or final answers in dialogue and edges holding texts of answers to the questions are hierarchically connected. 2. The interactive knowledge generation device according to 1.
前記知識グラフの構造を生成する知識グラフ生成部と、
前記知識グラフ生成部が生成した前記知識グラフの構造に、対話における質問の内容と当該質問への回答の内容とを追加する聞き返し質問生成部と、を有する
ことを特徴とする請求項4に記載の対話知識生成装置。 The graph generation unit
a knowledge graph generation unit that generates the structure of the knowledge graph;
5. The method according to claim 4, further comprising: a feedback question generation unit that adds the content of the question in the dialogue and the content of the answer to the question to the structure of the knowledge graph generated by the knowledge graph generation unit. interactive knowledge generator.
ことを特徴とする請求項5に記載の対話知識生成装置。 In generating the knowledge graph, the knowledge graph generation unit selects a set of child nodes based on the similarity of text held from a plurality of the nodes for which a parent node to be connected is not created, and selects a set of child nodes. 6. The interactive knowledge generation apparatus according to claim 5, wherein a common parent node is created for sets.
ことを特徴とする請求項6に記載の対話知識生成装置。 7. The dialogue knowledge generating apparatus according to claim 6, wherein said reflection question generation unit assigns said attribute name corresponding to a similar portion of text in said set of child nodes to said parent node as reflection text.
ことを特徴とする請求項6に記載の対話知識生成装置。 The reflection question generation unit assigns the attribute value corresponding to the text difference in the set of child nodes to the edge connecting the child node having the difference and the parent node, as an answer text. 7. The interactive knowledge generation device according to claim 6.
前記対応付け部は、前記キーワード選定部によって選定された前記属性値と前記最終回答との対応関係を、前記対象データにおけるそれぞれの取得位置に基づいてさらに決定する
ことを特徴とする請求項5に記載の対話知識生成装置。 The keyword selection unit further selects a final answer to the dialogue from the target data using the clue phrase,
6. The method according to claim 5, wherein the associating unit further determines a corresponding relationship between the attribute value selected by the keyword selecting unit and the final answer based on the respective acquisition positions in the target data. An interactive knowledge generator as described.
ことを特徴とする請求項9に記載の対話知識生成装置。 The knowledge graph generation unit generates a final answer node based on the correspondence relationship between the attribute value and the final answer determined by the association unit, and combines the attribute value and the final answer having the correspondence relationship. 10. The dialogue knowledge generation apparatus according to claim 9, wherein is assigned to the node of the final answer as the final answer text.
ことを特徴とする請求項1に記載の対話知識生成装置。 2. The dialogue knowledge generating apparatus according to claim 1, wherein said target data is text data.
前記対話知識生成装置が、業務文書及び過去の対話記録を含む対象データから、対話のキーワードである属性値と属性値のカテゴリを示す属性名とを、それぞれの選定条件を示す手掛かり句を用いて選定するキーワード選定ステップと、
前記対話知識生成装置が、前記キーワード選定ステップで選定された前記属性値と前記属性名との対応関係を前記対象データにおけるそれぞれの取得位置に基づいて決定する対応付けステップと、
前記対話知識生成装置が、前記対応付けステップで決定された対応関係に基づいて前記属性値または前記属性名を有する複数のアイテムの階層関係を抽出し、前記抽出した階層関係に基づいて前記複数のアイテムを組み合わせることにより、前記知識グラフを生成するグラフ生成ステップと、
を備えることを特徴とする対話知識生成方法。
A dialogue knowledge generation method by a dialogue knowledge generation device for automatically generating a knowledge graph representing a dialogue flow model, comprising:
The dialogue knowledge generation device extracts attribute values, which are keywords for dialogue, and attribute names representing categories of attribute values, from target data including business documents and past dialogue records, using clue phrases representing respective selection conditions. a keyword selection step to be selected;
an association step in which the dialogue knowledge generation device determines a correspondence relationship between the attribute value selected in the keyword selection step and the attribute name based on their acquisition positions in the target data;
The dialogue knowledge generating device extracts a hierarchical relationship of a plurality of items having the attribute value or the attribute name based on the correspondence determined in the matching step, and extracts the plurality of items based on the extracted hierarchical relationship. a graph generation step of generating the knowledge graph by combining items;
A dialogue knowledge generation method characterized by comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021094945A JP2022187109A (en) | 2021-06-07 | 2021-06-07 | Dialog knowledge generation apparatus and dialog knowledge generation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021094945A JP2022187109A (en) | 2021-06-07 | 2021-06-07 | Dialog knowledge generation apparatus and dialog knowledge generation method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022187109A true JP2022187109A (en) | 2022-12-19 |
Family
ID=84525380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021094945A Pending JP2022187109A (en) | 2021-06-07 | 2021-06-07 | Dialog knowledge generation apparatus and dialog knowledge generation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022187109A (en) |
-
2021
- 2021-06-07 JP JP2021094945A patent/JP2022187109A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8296666B2 (en) | System and method for interactive visual representation of information content and relationships using layout and gestures | |
US6279005B1 (en) | Method and apparatus for generating paths in an open hierarchical data structure | |
JP2019215857A (en) | Deep learning technique based multi-purpose conversational agents for processing natural language queries | |
US20040030716A1 (en) | Hierarchical environments supporting relational schemas | |
US9298855B2 (en) | Optimization-based visual context management | |
Fu et al. | Hoops: Human-in-the-loop graph reasoning for conversational recommendation | |
CN107787491A (en) | Document for reusing the content in document stores | |
US20130124194A1 (en) | Systems and methods for manipulating data using natural language commands | |
US10818082B2 (en) | Method and system for parametrically creating an optimal three dimensional building structure | |
CN108701292A (en) | Recommendation is provided based on job change instruction | |
Partarakis et al. | Representation of socio-historical context to support the authoring and presentation of multimodal narratives: The Mingei Online Platform | |
US20090132506A1 (en) | Methods and apparatus for integration of visual and natural language query interfaces for context-sensitive data exploration | |
US10776351B2 (en) | Automatic core data service view generator | |
Castaldo et al. | Conversational data exploration | |
US20230252700A1 (en) | System for ontological graph creation via a user interface | |
Pan et al. | Natural language aided visual query building for complex data access | |
Anelli et al. | Anna: A virtual assistant to interact with Puglia Digital Library (discussion paper) | |
CN115329753B (en) | Intelligent data analysis method and system based on natural language processing | |
JP2022187109A (en) | Dialog knowledge generation apparatus and dialog knowledge generation method | |
US20230252006A1 (en) | System for annotating input data using graphs via a user interface | |
JPH0315981A (en) | Retrieving sentence graphic display system | |
JP2020161012A (en) | Information processing apparatus, control method and program | |
JP7340952B2 (en) | Template search system and template search method | |
Castaldo | A conceptual modeling approach for the rapid development of chatbots for conversational data exploration | |
Paschke et al. | Corporate semantic web: Towards the deployment of semantic technologies in enterprises |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240209 |