JPWO2019167281A1 - Response processing program, response processing method, response processing device and response processing system - Google Patents
Response processing program, response processing method, response processing device and response processing system Download PDFInfo
- Publication number
- JPWO2019167281A1 JPWO2019167281A1 JP2020502777A JP2020502777A JPWO2019167281A1 JP WO2019167281 A1 JPWO2019167281 A1 JP WO2019167281A1 JP 2020502777 A JP2020502777 A JP 2020502777A JP 2020502777 A JP2020502777 A JP 2020502777A JP WO2019167281 A1 JPWO2019167281 A1 JP WO2019167281A1
- Authority
- JP
- Japan
- Prior art keywords
- question data
- word
- response processing
- synonym
- topic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
応答処理装置(101)は、質問データ(Q)を登録する際に、質問データ(Q)を形態素解析して、質問データ(Q)に含まれる語を抽出する。応答処理装置(101)は、抽出した語の類義語に設定する対象の語の候補を提示する。応答処理装置(101)は、提示した候補のうち、抽出した語の類義語に設定する対象の語としていずれかの語の選択を受け付けると、質問データ(Q)と、質問データ(Q)に含まれる語を選択された語に置き換えて得られる質問データ(Q’)との双方が、同じ回答データ(A)に関連付くように学習する。When registering the question data (Q), the response processing device (101) morphologically analyzes the question data (Q) and extracts words included in the question data (Q). The response processing device (101) presents a candidate word to be set as a synonym for the extracted word. When the response processing device (101) accepts the selection of one of the presented candidates as the target word to be set as the synonym of the extracted word, it is included in the question data (Q) and the question data (Q). Learn so that both the question data (Q') obtained by replacing the word with the selected word are associated with the same answer data (A).
Description
本発明は、応答処理プログラム、応答処理方法、応答処理装置および応答処理システムに関する。 The present invention relates to a response processing program, a response processing method, a response processing device, and a response processing system.
近年、チャットボットと呼ばれる技術を利用したFAQ(Frequently Asked Question)システムを導入するコールセンタが増えている。チャットボットは、人工知能を利用して、人間との対話やメッセージのやりとりを行うコンピュータシステムである。 In recent years, an increasing number of call centers have introduced FAQ (freaky Asked Question) systems that use a technology called chatbots. A chatbot is a computer system that uses artificial intelligence to interact with humans and exchange messages.
また、FAQとして登録される質問に含まれるワードに対する類義語を辞書登録しておき、そのワード(類義語)を含む質問が入力された際に、そのワード(類義語)を対応するワードに置き換えた質問により、回答を検索する場合がある。類義語辞書は、例えば、過去の対話履歴や対応マニュアル等を学習データとして学習エンジンに入力することで自動生成される。 In addition, a synonym for a word included in a question registered as FAQ is registered in a dictionary, and when a question including that word (synonym) is input, the word (synonym) is replaced with the corresponding word. , May search for answers. The synonym dictionary is automatically generated, for example, by inputting the past dialogue history, the corresponding manual, etc. as learning data into the learning engine.
先行技術としては、質問データを受け取り、質問に対する回答がデータベース部にある場合、出力装置から回答を出力し、回答がない場合は、未解決データの質問内容を検索し、そこに含まれる複数のキーワードをリストにしたものを付加して蓄積するものがある。 Prior art is to receive question data, if the answer to the question is in the database section, output the answer from the output device, if there is no answer, search the question content of the unsolved data, and multiple items contained therein Some keywords are added to a list and accumulated.
しかしながら、従来技術では、FAQとして登録される質問データに含まれる語(ワード)についての適切な類義語を登録することが難しいといった問題がある。 However, in the prior art, there is a problem that it is difficult to register an appropriate synonym for a word included in the question data registered as FAQ.
一つの側面では、本発明は、質問データの登録の際に適切な類義語が登録できるように支援することを目的とする。 In one aspect, the present invention aims to assist in the registration of appropriate synonyms when registering question data.
1つの実施態様では、質問データを登録する際に、該質問データを形態素解析して、該質問データに含まれる語を抽出し、前記語の類義語に設定する対象の語の候補を提示し、前記候補のうち、前記語の類義語に設定する対象の語としていずれかの語の選択を受け付けると、前記質問データと、前記質問データに含まれる前記語を選択された前記語に置き換えて得られる質問データとの双方が、同じ回答データに関連づくように学習する、応答処理プログラムが提供される。 In one embodiment, when registering question data, the question data is morphologically analyzed, words included in the question data are extracted, and candidate words to be set as synonyms for the words are presented. When the selection of any of the candidates is accepted as the target word to be set as the synonym of the word, the question data and the word included in the question data are replaced with the selected word. A response processing program is provided that learns that both the question data and the question data are related to the same answer data.
本発明の一側面によれば、質問データの登録の際に適切な類義語が登録できるように支援することができる。 According to one aspect of the present invention, it is possible to support the registration of appropriate synonyms when registering question data.
以下に図面を参照して、本発明にかかる応答処理プログラム、応答処理方法、応答処理装置および応答処理システムの実施の形態を詳細に説明する。 Hereinafter, embodiments of a response processing program, a response processing method, a response processing apparatus, and a response processing system according to the present invention will be described in detail with reference to the drawings.
(実施の形態)
図1は、実施の形態にかかる応答処理装置101の一実施例を示す説明図である。図1において、応答処理装置101は、質問データに含まれる語(ワード)の類義語の登録を支援するコンピュータである。質問データは、例えば、FAQとして登録される質問データである。(Embodiment)
FIG. 1 is an explanatory diagram showing an embodiment of the
FAQは、「頻繁に尋ねられる質問」であり、あらかじめ予想される質問に対して、質問データと回答データをまとめたものである。質問データは、何らかの問題の解決方法を問いただすためのものである。例えば、質問データは、商品やサービスについての質問である。質問データは、単語または複数の単語の組み合わせによって表現されてもよく、1または複数の文章によって表現されてもよい。 The FAQ is a "frequently asked question", and is a collection of question data and answer data for a question expected in advance. The question data is for asking how to solve some problem. For example, question data is a question about a product or service. The question data may be represented by a word or a combination of words, or may be represented by one or more sentences.
ここで、質問データを登録したものの、質問データに含まれるワードについて類義語に置き換えられた質問データが入力された場合、その類義語が未登録であれば、同じ又は同種の質問と判断できず回答を提示できないことがある。一方、類義語に関する知識データを無条件に適用してしまうと、想定していなかった質問データが同じ又は同種の質問と判断され、誤った回答を提示してしまうといった問題がある。 Here, although the question data is registered, if the question data in which the words included in the question data are replaced with synonyms is input, if the synonyms are not registered, it cannot be judged as the same or similar question and the answer is answered. It may not be possible to present it. On the other hand, if knowledge data on synonyms is applied unconditionally, there is a problem that unexpected question data is judged to be the same or the same type of question and an incorrect answer is presented.
したがって、辞書登録する類義語について、適切な語であるか否かの確認を行うことは重要である。例えば、類義語辞書は、過去の対話履歴や対応マニュアル等を学習データとして学習エンジンに入力することで自動生成される。この際、多数の類義語が生成されると、確認等のメンテナンス作業にかかる負荷が増大する。メンテナンス作業にかかる負荷が増大すると、不適切な類義語を含む類義語辞書が放置され、陳腐化していくおそれがある。 Therefore, it is important to confirm whether or not the synonyms registered in the dictionary are appropriate words. For example, a synonym dictionary is automatically generated by inputting a past dialogue history, a corresponding manual, etc. as learning data into a learning engine. At this time, if a large number of synonyms are generated, the load on maintenance work such as confirmation increases. When the load on maintenance work increases, synonym dictionaries containing inappropriate synonyms may be left unattended and become obsolete.
そこで、本実施の形態では、質問データを登録するにあたり、その質問データに含まれる語(ワード)について、適切な類義語を登録できるように支援する応答処理装置101について説明する。以下、応答処理装置101の処理例について説明する。
Therefore, in the present embodiment, when registering the question data, the
(1)応答処理装置101は、質問データQを登録する際に、質問データQを形態素解析して、質問データQに含まれる語を抽出する。ここで、質問データQは、例えば、FAQとして回答データとともに登録される質問データである。形態素解析とは、コンピュータによる自然言語処理であり、例えば、文章を形態素の単位に区切って、品詞を判別する処理である。
(1) When registering the question data Q, the
図1の例では、質問データQを「コンピュータについて教えてください。」とし、質問データQに含まれる語として「コンピュータ」が抽出された場合を想定する。 In the example of FIG. 1, it is assumed that the question data Q is "Tell me about the computer" and "computer" is extracted as the word included in the question data Q.
(2)応答処理装置101は、抽出した語の類義語に設定する対象の語の候補を提示する。ここで、類義語に設定する候補となる対象の語は、例えば、コールセンタにおける過去の対話履歴(FAQ)や対応マニュアル等を学習データとして学習エンジンに入力することで自動生成される。
(2) The
図1の例では、語「コンピュータ」の類義語に設定する対象の語の候補として、「パソコン」、「計算機」および「ソフトウェア」という候補が、ディスプレイ110に提示されている。なお、ディスプレイ110は、応答処理装置101が有していてもよく、また、応答処理装置101に接続された他のコンピュータが有していてもよい。
In the example of FIG. 1, candidates of "personal computer", "computer" and "software" are presented on the
(3)応答処理装置101は、提示した候補のうち、抽出した語の類義語に設定する対象の語としていずれかの語の選択を受け付けると、質問データQと質問データQ’との双方が、同じ回答データAに関連付くように学習する。質問データQ’は、質問データQに含まれる語を、選択された語に置き換えて得られる質問データである。
(3) When the
ここで、質問データQと質問データQ’との双方が、同じ回答データAに関連付くように学習するとは、例えば、選択された語を、質問データQから抽出した語の類義語として類義語辞書等に登録することである。これにより、以降において、この類義語を含む質問データが入力された際に、該類義語を対応する語に置き換えた質問データQによる検索が可能となり、FAQシステムのヒット率を高めることができる。なお、ヒット率とは、FAQシステムに入力されるユーザからの質問に対して、ユーザが求める回答を提示できる割合を示す指標値である。 Here, learning so that both the question data Q and the question data Q'are related to the same answer data A means that, for example, the selected word is used as a synonym for the word extracted from the question data Q, such as a synonym dictionary. Is to register with. As a result, when question data including this synonym is input thereafter, it is possible to search by the question data Q in which the synonym is replaced with the corresponding word, and the hit rate of the FAQ system can be increased. The hit rate is an index value indicating the rate at which the answer requested by the user can be presented in response to the question from the user input to the FAQ system.
また、他の学習の例としては、学習モデルを用いて類義語辞書を生成する際に、質問データQから抽出した語の類義語として、選択された語が抽出されるように条件を設定することにしてもよい。これにより、次回の類義語辞書生成時に、FAQとして登録される質問データQに含まれる語に適切な類義語を対応付けた類義語辞書を生成することが可能となる。 In addition, as another example of learning, when generating a synonym dictionary using a learning model, a condition is set so that the selected word is extracted as a synonym of the word extracted from the question data Q. You may. As a result, when the next synonym dictionary is generated, it becomes possible to generate a synonym dictionary in which an appropriate synonym is associated with a word included in the question data Q registered as FAQ.
また、他の学習の例としては、質問データQに含まれる語を選択された語に置き換えて得られる質問データQ’を、FAQとして回答データAとともに登録することにしてもよい。これにより、質問データQ’が入力された際に、質問データQに関連付けられた回答データAを出力することができる。 Further, as another example of learning, the question data Q'obtained by replacing the word included in the question data Q with the selected word may be registered as the FAQ together with the answer data A. As a result, when the question data Q'is input, the answer data A associated with the question data Q can be output.
図1の例では、ディスプレイ110に提示された候補「パソコン」、「計算機」および「ソフトウェア」のうち、語「コンピュータ」の類義語に設定する対象の語として、「パソコン」が選択された場合を想定する。この場合、応答処理装置101は、例えば、選択された語「パソコン」を、質問データQから抽出した語「コンピュータ」の類義語として類義語辞書120に登録する。これにより、以降において、類義語「パソコン」を含む質問データが入力された際に、類義語「パソコン」を対応する語「コンピュータ」に置き換えた質問データによる検索が可能となり、ヒット率を高めることができる。
In the example of FIG. 1, among the candidates "personal computer", "computer" and "software" presented on the
このように、応答処理装置101によれば、質問データQを登録するにあたり、質問データQに含まれる語の類義語に設定する対象の語の候補を選択可能に提示することができる。そして、応答処理装置101によれば、提示した候補のうちのいずれかの語が選択された場合に、質問データQと質問データQ’との双方が、同じ回答データAに関連付くように学習することができる。
As described above, according to the
これにより、質問データQを登録するにあたり、類義語に設定する対象の語の候補の中からいずれかの語を選択するという簡単な操作を行うだけで、質問データQに含まれる語の類義語を登録することができる。このため、類義語の登録にかかる作業負担を軽減でき、質問データQに含まれる語について、適切な類義語を登録できるように支援することができる。 As a result, when registering the question data Q, the synonyms of the words included in the question data Q can be registered by simply performing a simple operation of selecting one of the candidate words to be set as the synonyms. can do. Therefore, the work load required for registering synonyms can be reduced, and it is possible to support the registration of appropriate synonyms for the words included in the question data Q.
(応答処理システム200のシステム構成例)
つぎに、図1に示した応答処理装置101を含む応答処理システム200のシステム構成例について説明する。応答処理システム200は、例えば、チャットボットを利用したFAQシステムに適用される。(System configuration example of response processing system 200)
Next, a system configuration example of the
図2は、応答処理システム200のシステム構成例を示す説明図である。図2において、応答処理システム200は、応答処理装置101と、作業者端末201と、を含む。応答処理システム200において、応答処理装置101および作業者端末201は、有線または無線のネットワーク210を介して接続される。ネットワーク210は、例えば、LAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどである。
FIG. 2 is an explanatory diagram showing a system configuration example of the
応答処理装置101は、FAQマスタ220、類義語評価テーブル230およびチャットログDB(Database)240を有する。各種DB等220,230,240の記憶内容については、図4〜図6を用いて後述する。応答処理装置101は、例えば、サーバである。
The
また、応答処理装置101は、応答処理システム200(FAQシステム)に入力された質問に対応する回答候補を出力することにしてもよい。質問に対応する回答候補は、例えば、FAQシステムやFAQサイトにおいて採用されている既存の検索アルゴリズムを用いて検索される。
Further, the
具体的には、例えば、応答処理装置101は、応答処理システム200のユーザにより入力された質問を形態素解析して形態素に分解する。つぎに、応答処理装置101は、FAQマスタ220を参照して、所定の検索条件にしたがって、分解した形態素に対応するFAQを検索する。そして、応答処理装置101は、検索した検索結果(FAQ)を、入力された質問に対応する回答候補として提示する。
Specifically, for example, the
ただし、応答処理システム200において、ユーザからの質問の入力を受け付けて、入力された質問に対応する回答候補を検索・出力する処理は、応答処理装置101とは異なる他のコンピュータにより実行されることにしてもよい。また、FAQマスタ220やチャットログDB240は、応答処理装置101がアクセス可能な他のコンピュータ(例えば、データベースサーバ)が有することにしてもよい。
However, in the
作業者端末201は、作業者が使用するコンピュータである。作業者は、類義語辞書のメンテナンス作業を行う者であり、例えば、応答処理システム200の管理者である。類義語辞書は、FAQとして登録される質問データQに含まれる語の類義語を登録した辞書である。作業者端末201は、例えば、PC(Personal Computer)、タブレット型PCなどである。
The
(応答処理装置101のハードウェア構成例)
図3は、応答処理装置101のハードウェア構成例を示すブロック図である。図3において、応答処理装置101は、CPU(Central Processing Unit)301と、メモリ302と、I/F(Interface)303と、ディスクドライブ304と、ディスク305と、を有する。また、各構成部は、バス300によってそれぞれ接続される。(Hardware configuration example of response processing device 101)
FIG. 3 is a block diagram showing a hardware configuration example of the
ここで、CPU301は、応答処理装置101の全体の制御を司る。メモリ302は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)およびフラッシュROMなどを有する。具体的には、例えば、フラッシュROMがOS(Operating System)のプログラムを記憶し、ROMがアプリケーションプログラムを記憶し、RAMがCPU301のワークエリアとして使用される。メモリ302に記憶されるプログラムは、CPU301にロードされることで、コーディングされている処理をCPU301に実行させる。
Here, the
I/F303は、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して外部のコンピュータ(例えば、図2に示した作業者端末201)に接続される。そして、I/F303は、ネットワーク210と装置内部とのインターフェースを司り、外部のコンピュータからのデータの入出力を制御する。I/F303には、例えば、モデムやLANアダプタなどを採用することができる。
The I /
ディスクドライブ304は、CPU301の制御に従ってディスク305に対するデータのリード/ライトを制御する。ディスク305は、ディスクドライブ304の制御で書き込まれたデータを記憶する。ディスク305としては、例えば、磁気ディスク、光ディスクなどが挙げられる。
The
なお、応答処理装置101は、上述した構成部のほかに、例えば、SSD(Solid State Drive)、入力装置、ディスプレイ等を有することにしてもよい。また、図2に示した作業者端末201についても、応答処理装置101と同様のハードウェア構成により実現することができる。ただし、作業者端末201は、上述した構成部のほかに、入力装置、ディスプレイ等を有する。
The
(FAQマスタ220の記憶内容)
つぎに、応答処理装置101が有するFAQマスタ220の記憶内容について説明する。FAQマスタ220は、例えば、図3に示したメモリ302、ディスク305などの記憶装置により実現される。(Memory contents of FAQ master 220)
Next, the stored contents of the
図4は、FAQマスタ220の記憶内容の一例を示す説明図である。図4において、FAQマスタ220は、FAQ−ID、タイトル、質問および回答のフィールドを有し、各フィールドに情報を設定することで、FAQ情報(例えば、FAQ情報400−1,400−2)をレコードとして記憶する。
FIG. 4 is an explanatory diagram showing an example of the stored contents of the
ここで、FAQ−IDは、FAQを識別する識別子である。タイトルは、複数の質問のうちの代表の質問である。互いに意味が類似する複数の質問には、同一のタイトルが付与される。そして、タイトルが同一のFAQには、同一のFAQ−IDが付与される。質問は、FAQを形成する質問を示す質問データQである。回答は、質問に対する回答を示す回答データAである。すなわち、1つのFAQは、n個の質問と、m個の回答とをまとめたものとなる(n,mは、1以上の自然数である)。 Here, the FAQ-ID is an identifier that identifies the FAQ. The title is a representative question among multiple questions. Multiple questions that have similar meanings are given the same title. Then, the same FAQ-ID is given to the FAQs having the same title. The question is question data Q indicating the question forming the FAQ. The answer is answer data A indicating the answer to the question. That is, one FAQ is a collection of n questions and m answers (n and m are natural numbers of 1 or more).
例えば、FAQ情報400−1は、FAQ1のタイトル「コンピュータについて教えてください。」、質問「コンピュータについて教えてください。」および回答「ノートブック型のパソコンです。」を示す。 For example, FAQ information 400-1 indicates the title of FAQ1, "Tell me about your computer", the question "Tell me about your computer", and the answer "It's a notebook-type personal computer."
(類義語評価テーブル230の記憶内容)
つぎに、応答処理装置101が有する類義語評価テーブル230の記憶内容について説明する。類義語評価テーブル230は、例えば、図3に示したメモリ302、ディスク305などの記憶装置により実現される。(Memory contents of synonym evaluation table 230)
Next, the stored contents of the synonym evaluation table 230 included in the
図5は、類義語評価テーブル230の記憶内容の一例を示す説明図である。図5において、類義語評価テーブル230は、質問とトピックとフレーズと採否フラグとを対応付けて表す類義語評価情報(例えば、類義語評価情報500−1)を記憶する。 FIG. 5 is an explanatory diagram showing an example of the stored contents of the synonym evaluation table 230. In FIG. 5, the synonym evaluation table 230 stores synonym evaluation information (for example, synonym evaluation information 500-1) representing a question, a topic, a phrase, and an acceptance / rejection flag in association with each other.
ここで、質問は、FAQとして登録される質問データQである。トピックは、質問データQに含まれる語である。フレーズは、トピックの類義語に設定する対象の語の候補である。採否フラグは、トピックの類義語に設定する対象の語としてフレーズを採用するか否かを示すフラグである。採否フラグ「1」は、フレーズを採用することを示す。採否フラグ「0」は、フレーズを採用しないことを示す。採否フラグは、初期状態では「0」である。 Here, the question is the question data Q registered as FAQ. The topic is a word included in the question data Q. A phrase is a candidate for a word to be set as a synonym for a topic. The acceptance / rejection flag is a flag indicating whether or not to adopt a phrase as a target word to be set as a synonym of a topic. The acceptance / rejection flag "1" indicates that the phrase is adopted. The acceptance / rejection flag "0" indicates that the phrase is not adopted. The acceptance / rejection flag is "0" in the initial state.
例えば、類義語評価情報500−1は、質問「コンピュータについて教えてください。」に含まれるトピック「コンピュータ」について、各フレーズ「パソコン、計算機、ソフトウェア」の採否フラグを示す。ここでは、各フレーズ「パソコン、計算機、ソフトウェア」の採否フラグは、初期状態「0」となっている。 For example, the synonym evaluation information 500-1 indicates the acceptance / rejection flag of each phrase "personal computer, computer, software" for the topic "computer" included in the question "Tell me about the computer." Here, the acceptance / rejection flag of each phrase "personal computer, computer, software" is in the initial state "0".
(チャットログDB240の記憶内容)
つぎに、応答処理装置101が有するチャットログDB240の記憶内容について説明する。チャットログDB240は、例えば、図3に示したメモリ302、ディスク305などの記憶装置により実現される。(Memory contents of chat log DB240)
Next, the stored contents of the
図6は、チャットログDB240の記憶内容の一例を示す説明図である。図6において、チャットログDB240は、入力質問、FAQ−IDおよびFAQ−LISTのフィールドを有し、各フィールドに情報を設定することで、チャットログ情報(例えば、チャットログ情報600−1,600−2)をレコードとして記憶する。
FIG. 6 is an explanatory diagram showing an example of the stored contents of the
ここで、入力質問は、応答処理システム200(FAQシステム)に入力された質問データである。FAQ−IDは、入力質問に対して提示された回答候補のうち選択された回答候補(回答データ)のFAQ−IDである。入力質問に対して回答候補が提示されなかった場合は、FAQ−IDフィールドには「−(Null)」が設定される。また、回答候補が提示されたにもかかわらず、いずれの回答候補も選択されなかった場合は、FAQ−IDフィールドには「Not Found」が設定される。 Here, the input question is question data input to the response processing system 200 (FAQ system). The FAQ-ID is the FAQ-ID of the answer candidate (answer data) selected from the answer candidates presented for the input question. If no answer candidate is presented for the input question, "-(Null)" is set in the FAQ-ID field. If none of the answer candidates are selected even though the answer candidates are presented, "Not Found" is set in the FAQ-ID field.
FAQ−LISTは、入力質問に対して提示された回答候補のリストである。入力質問に対して回答候補が提示されなかった場合は、FAQ−LISTフィールドには「Not Found」が設定される。FAQ−LIST「Not Found」は、入力質問に対応するFAQがないことを示す。FAQ−ID「Not Found」は、入力質問に対して提示した回答候補の中に、ユーザが期待するFAQがなかったことを示す。 The FAQ-LIST is a list of candidate answers presented for input questions. If no answer candidate is presented for the input question, "Not Found" is set in the FAQ-LIST field. The FAQ-LIST "Not Found" indicates that there is no FAQ corresponding to the input question. The FAQ-ID "Not Found" indicates that the FAQ expected by the user was not among the answer candidates presented for the input question.
例えば、チャットログ情報600−1は、入力質問「計算機について教えてください。」に対して回答候補が提示されなかったことを示す。また、チャットログ情報600−2は、入力質問「スペックを教えてください。」に対して提示した回答候補(FAQ100,FAQ101,FAQ102)のいずれも選択されなかったことを示す。 For example, the chat log information 600-1 indicates that no answer candidate was presented to the input question "Tell me about the computer." In addition, the chat log information 600-2 indicates that none of the answer candidates (FAQ100, FAQ101, FAQ102) presented to the input question "Please tell me the specifications" was selected.
(応答処理装置101の機能的構成例)
図7は、応答処理装置101の機能的構成例を示すブロック図である。図7において、応答処理装置101は、取得部701と、抽出部702と、表示制御部703と、受付部704と、学習部705と、を含む。取得部701〜学習部705は制御部となる機能であり、具体的には、例えば、図3に示したメモリ302、ディスク305などの記憶装置に記憶されたプログラムをCPU301に実行させることにより、または、I/F303により、その機能を実現する。各機能部の処理結果は、例えば、メモリ302、ディスク305などの記憶装置に記憶される。(Example of functional configuration of response processing device 101)
FIG. 7 is a block diagram showing a functional configuration example of the
取得部701は、登録対象の質問データQを取得する。質問データQは、例えば、図4に示したFAQマスタ220にFAQとして登録される質問データである。質問データQは、新たに生成された質問データであってもよく、また、過去にFAQマスタ220に登録された質問データであってもよい。
The
具体的には、例えば、取得部701は、作業者端末201から1または複数の質問データQを受信することにより、登録対象の質問データQを取得する。また、取得部701は、不図示の入力装置を用いたユーザの操作入力により、登録対象の質問データQを取得することにしてもよい。取得された質問データQは、例えば、FAQとして回答データAとともにFAQマスタ220に登録される。
Specifically, for example, the
抽出部702は、取得された質問データQを形態素解析して、質問データQに含まれる語(トピック)を抽出する。具体的には、例えば、抽出部702は、取得された質問データQを形態素の単位に区切って品詞を判別し、質問データQに含まれる単語をトピックとして抽出する。
The
また、抽出部702は、抽出した語(トピック)の類義語に設定する対象の語の候補(フレーズ)を特定する。具体的には、例えば、抽出部702は、類義語辞書を参照して、抽出したトピックの類義語に設定する対象の語の候補であるフレーズを特定する。類義語辞書は、トピックとフレーズとの対応関係を示す情報である。
In addition, the
ただし、ここで参照される類義語辞書は、メンテナンス対象となる類義語辞書であり、例えば、既存技術により生成される仮の類義語辞書である。類義語辞書は、応答処理装置101において生成することにしてもよく、また、応答処理装置101とは異なる他のコンピュータにおいて生成することにしてもよい。
However, the synonym dictionary referred to here is a synonym dictionary to be maintained, and is, for example, a temporary synonym dictionary generated by existing technology. The synonym dictionary may be generated in the
例えば、類義語辞書は、コールセンタにおける過去の対話履歴(FAQ)や対応マニュアル等を学習データとして学習エンジンに入力することで生成される。具体的には、例えば、応答処理装置101は、学習データに自然言語処理(形態素解析、構文解析、意味解析等)を施して、トピックとフレーズとの対応関係を抽出することにより、類義語辞書を生成することにしてもよい。
For example, a synonym dictionary is generated by inputting a past dialogue history (FAQ) in a call center, a corresponding manual, or the like as learning data into a learning engine. Specifically, for example, the
また、類義語は、トピックについての所定のサイト内の検索結果に基づいて提示されることにしてもよい。所定のサイトは、例えば、所定の検索サイトや百科事典サイトなどである。具体的には、例えば、応答処理装置101は、所定のサイト内でトピックを検索ワードとして得られるウェブページのHTML(Hyper Text Markup Language)データを学習データとして自然言語処理を施すことで単語を抽出する。
Synonyms may also be presented based on search results within a given site for a topic. The predetermined site is, for example, a predetermined search site or an encyclopedia site. Specifically, for example, the
この際、応答処理装置101は、所定のサイト(例えば、百科事典サイト)に登録されている全てのデータ(例えば、全ページのHTMLデータ)を学習データとしてもよい。そして、応答処理装置101は、既存の分類器を利用して、抽出した単語を分類することにより、トピックとフレーズとの対応関係を抽出して類義語辞書を生成することにしてもよい。
At this time, the
語(トピック)と、語(トピック)の類義語に設定する対象の語の候補(フレーズ)とは、例えば、語(トピック)を含む質問データQと対応付けて、図5に示した類義語評価テーブル230に記憶される。ただし、この時点では、採否フラグは「0」である。 The word (topic) and the candidate word (phrase) to be set as a synonym of the word (topic) are, for example, associated with the question data Q including the word (topic), and the synonym evaluation table shown in FIG. It is stored in 230. However, at this point, the acceptance / rejection flag is "0".
なお、語(トピック)の類義語に設定する対象の語の候補(フレーズ)が存在しない場合は、その語(トピック)については、類義語評価テーブル230に登録しなくてもよい。候補(フレーズ)が存在しない語(トピック)を類義語評価テーブル230に登録する場合は、その語(トピック)のフレーズ、採否フラグの各フィールドは「−」となる。 If there is no candidate word (phrase) to be set as a synonym for a word (topic), the word (topic) does not have to be registered in the synonym evaluation table 230. When a word (topic) for which no candidate (phrase) does not exist is registered in the synonym evaluation table 230, each field of the phrase and the acceptance / rejection flag of the word (topic) becomes "-".
表示制御部703は、抽出された語(トピック)の類義語に設定する対象の語の候補(フレーズ)を提示する。具体的には、例えば、まず、表示制御部703は、類義語評価テーブル230を参照して、トピック選択画面を表示する。トピック選択画面は、抽出部702によって1または複数の質問データQから抽出されたトピックを選択可能に表示する操作画面である。トピック選択画面の画面例については、図8を用いて後述する。
The
つぎに、表示制御部703は、トピック選択画面においていずれかのトピックの選択を受け付けると、類義語評価テーブル230を参照して、選択されたトピックについてのフレーズ選択画面を表示する。フレーズ選択画面は、抽出部702によって特定された、トピックの類義語に設定する対象の語の候補であるフレーズを選択可能に表示する操作画面である。フレーズ選択画面の画面例については、図9を用いて後述する。
Next, when the
これにより、質問データQに含まれるトピックの類義語に設定する対象の語の候補であるフレーズを選択可能に提示することができる。なお、各種画面の表示先のディスプレイは、例えば、作業者端末201のディスプレイ(不図示)であってもよく、また、自装置のディスプレイ(不図示)であってもよい。 As a result, it is possible to selectively present a phrase that is a candidate for a target word to be set as a synonym for the topic included in the question data Q. The display of the display destination of the various screens may be, for example, the display of the worker terminal 201 (not shown) or the display of the own device (not shown).
また、表示制御部703は、トピックの類義語に設定する対象の語の候補であるフレーズを選択可能に表示する際に、各フレーズの類似度を表示することにしてもよい。ここで、フレーズの類似度とは、トピックとの類似度合いを示す指標値である。各フレーズの類似度は、例えば、既存の技術により、学習エンジンを用いて類義語辞書を生成する際に得ることができる。また、表示制御部703は、トピックのフレーズが複数存在する場合には、複数のフレーズを類似度が高い順に表示することにしてもよい。また、表示制御部703は、複数のフレーズのうち類似度があらかじめ設定された閾値以上のフレーズのみ表示することにしてもよい。
Further, the
また、表示制御部703は、抽出部702によって質問データQを形態素解析した結果、質問データQに複数の語(トピック)が含まれる場合に、複数の語(トピック)のそれぞれについて類義語に設定する対象の語の候補(フレーズ)の有無又は数が分かるように提示することにしてもよい。
Further, the
具体的には、例えば、表示制御部703は、1または複数の質問データQそれぞれに含まれるトピックについて、類義語評価テーブル230を参照して、フレーズの有無又は数を特定する。そして、表示制御部703は、トピック選択画面において、1または複数の質問データQから抽出されたトピックを選択可能に表示するとともに、各トピックについて特定したフレーズの有無又は数を表示する。各トピックについてのフレーズの有無または数を表示するトピック選択画面の画面例については、図11を用いて後述する。
Specifically, for example, the
また、表示制御部703は、抽出部702によって抽出されたトピックを表示する際に、当該トピックの優先度に応じて表示態様を制御することにしてもよい。トピックの優先度は、任意の手法で設定可能であり、優先的に類義語のメンテナンスを行うことが望ましいトピックほど高くなるように設定される。
Further, the
具体的には、例えば、表示制御部703は、トピック選択画面において、高優先度のトピックを強調表示することにしてもよい。高優先度のトピックとは、例えば、優先度があらかじめ設定された閾値以上のトピックである。トピックを強調表示するとは、例えば、他のトピックとは異なる色、背景色、アイコン、フォントなどで表示することである。
Specifically, for example, the
また、表示制御部703は、トピック選択画面において、高優先度のトピックを優先的に類義語のメンテナンスを行うよう促すメッセージを付与することにしてもよい。また、表示制御部703は、トピック選択画面において、高優先度のトピックを上位に表示することにしてもよい。
Further, the
なお、トピックの優先度の設定例については、図10を用いて後述する。 An example of setting the priority of the topic will be described later with reference to FIG.
受付部704は、提示された候補(フレーズ)のうち、語(トピック)の類義語に設定する対象の語としていずれかの語(フレーズ)の選択を受け付ける。フレーズの選択は、例えば、フレーズ選択画面(例えば、後述の図9に示すフレーズ選択画面900)において行われる。
The
具体的には、例えば、受付部704は、作業者端末201からフレーズ選択画面において選択されたフレーズを示す選択結果を受信することにより、フレーズの選択を受け付ける。これにより、トピックについて類義語に設定する対象の語(フレーズ)を特定することができる。
Specifically, for example, the
学習部705は、語(フレーズ)の選択を受け付けると、質問データQと、質問データQに含まれる語(トピック)を選択された語(フレーズ)に置き換えて得られる質問データQ’との双方が、同じ回答データAに関連付くように学習する。
When the
具体的には、例えば、学習部705は、類義語評価テーブル230を参照して、質問データQ(抽出されたトピックを含む質問データQ)と、抽出されたトピックと、選択されたフレーズとの組み合わせに対応する類義語評価情報を特定する。つぎに、学習部705は、特定した類義語評価情報の当該フレーズの採否フラグに「1」を設定する。
Specifically, for example, the
そして、学習部705は、類義語評価テーブル230を参照して、採否フラグ「1」のトピックとフレーズとの対応関係を示す類義語辞書を生成する。この際、学習部705は、新たな類義語辞書を生成し直してもよく、また、各トピックのフレーズを特定する際に参照した類義語辞書(仮)を修正することにしてもよい。
Then, the
これにより、以降において、応答処理システム200にフレーズを含む質問データQ’が入力された際に、生成された類義語辞書を利用して、そのフレーズをトピックに置き換えた質問データQによる検索が可能となり、ヒット率を高めることができる。
As a result, after that, when the question data Q'including the phrase is input to the
なお、学習部705は、例えば、学習データを学習モデルに入力して類義語辞書を生成する際に、トピックの類義語として、採否フラグ「1」のフレーズ、すなわち、選択されたフレーズが抽出されるように条件を設定することにしてもよい。これにより、次回の類義語辞書生成時に、FAQとして登録される質問データQに含まれるトピックに適切なフレーズを対応付けた類義語辞書を生成することができる。
In addition, for example, when the
また、学習部705は、学習後、質問データQのうちトピックを特定のフレーズに置き換えた質問データQ’’の入力を検出すると、質問データQと質問データQ’’との双方が、同じ回答データAに関連付くように学習することにしてもよい。ここで、特定のフレーズは、トピックの類義語に設定する対象の語の候補のうち、当該トピックの類義語に設定する対象の語として選択されなかったフレーズである。
Further, when the
具体的には、例えば、学習部705は、質問データQ’’の入力を検出すると、類義語評価テーブル230を参照して、質問データQ’’のうち特定のフレーズをトピックに置き換えた質問データQと、トピックと、特定のフレーズとの組み合わせに対応する類義語評価情報を特定する。つぎに、学習部705は、特定した類義語評価情報の特定のフレーズの採否フラグに「1」を設定する。そして、学習部705は、類義語評価テーブル230を参照して、類義語辞書を修正する。
Specifically, for example, when the
これにより、以降において、応答処理システム200にフレーズを含む質問データQ’’が入力された際に、修正された類義語辞書を利用して、特定のフレーズをトピックに置き換えた質問データQによる検索が可能となり、ヒット率を高めることができる。
As a result, after that, when the question data Q'' including the phrase is input to the
なお、質問データQ’’の入力は、例えば、チャットログDB240に記憶された入力質問の中に、質問データQのうちトピックを特定のフレーズに置き換えた質問データQ’’があるか否かを判断することで検出することができる。
The input of the question data Q'' is, for example, whether or not the input question stored in the
また、学習部705は、学習後、質問データQのうちトピックを特定のフレーズに置き換えた質問データQ’’の入力を検出すると、特定のフレーズのトピックの類義語としての登録を示唆することにしてもよい。具体的には、例えば、学習部705は、質問データQ’’の入力を検出すると、特定のフレーズのトピックの類義語としての登録を推奨するメッセージを作業者端末201に送信することにしてもよい。これにより、応答処理システム200の管理者は、トピックの類義語として登録することが望ましい特定のフレーズの存在に気付くことができる。
Further, when the
なお、応答処理装置101の各機能部は、応答処理システム200内の他のコンピュータ、例えば、作業者端末201で実現することにしてもよい。また、応答処理装置101の各機能部は、応答処理システム200内の複数のコンピュータにより実現されることにしてもよい。
It should be noted that each functional unit of the
(トピック選択画面の画面例)
つぎに、図8を用いて、トピック選択画面の画面例について説明する。トピック選択画面は、例えば、応答処理装置101の表示制御部703により、類義語評価テーブル230の記憶内容に基づいて、作業者端末201のディスプレイ(不図示)に表示される。(Screen example of topic selection screen)
Next, a screen example of the topic selection screen will be described with reference to FIG. The topic selection screen is displayed on the display (not shown) of the
図8は、トピック選択画面の画面例を示す説明図である。図8において、トピック選択画面800は、FAQとして登録される質問データQから抽出されたトピック(例えば、トピックtp1〜tp10)を選択可能に表示する操作画面である。ただし、図8では、質問データQから抽出されたトピックの一部を抜粋して表示している。
FIG. 8 is an explanatory diagram showing a screen example of the topic selection screen. In FIG. 8, the
トピック選択画面800において、作業者端末201の入力装置(不図示)を用いたユーザの操作入力により、いずれかのトピックを選択すると、選択されたトピックについてのフレーズ選択画面を表示することができる。トピック選択画面800によれば、類義語のメンテナンス作業を行うトピックを選択することができる。
On the
また、トピック選択画面800において、ユーザの操作入力により終了ボタン801を選択すると、トピックの選択を終了することができる。具体的には、例えば、終了ボタン801が選択されると、作業者端末201から応答処理装置101にトピック選択終了通知が送信され、トピック選択画面800の表示が終了する。
Further, on the
図8の例では、トピックtp1が選択された場合を想定する。トピックtp1は、類義語評価テーブル230内の類義語評価情報500−1(図5参照)のトピック「コンピュータ」である。この場合、トピックtp1を示す選択結果が作業者端末201から応答処理装置101に送信される。この結果、応答処理装置101の表示制御部703により、図9に示すような、トピック「コンピュータ」についてのフレーズ選択画面900が作業者端末201に表示される。
In the example of FIG. 8, it is assumed that the topic tp1 is selected. The topic tp1 is the topic "computer" of the synonym evaluation information 500-1 (see FIG. 5) in the synonym evaluation table 230. In this case, the selection result indicating the topic tp1 is transmitted from the
(フレーズ選択画面の画面例)
ここで、図9を用いて、フレーズ選択画面の画面例について説明する。(Screen example of phrase selection screen)
Here, a screen example of the phrase selection screen will be described with reference to FIG.
図9は、フレーズ選択画面の画面例を示す説明図である。図9において、フレーズ選択画面900は、トピック「コンピュータ」の類義語に設定する対象の語の候補であるフレーズ「パソコン」、「計算機」および「ソフトウェア」の採否を選択可能に表示する操作画面である。
FIG. 9 is an explanatory diagram showing a screen example of the phrase selection screen. In FIG. 9, the
フレーズ選択画面900において、ユーザの操作入力により、採用ボタンb1または不採用ボタンb2を選択することで、フレーズ「パソコン」の採否を選択することができる。また、採用ボタンb3または不採用ボタンb4を選択することで、フレーズ「計算機」の採否を選択することができる。また、採用ボタンb5または不採用ボタンb6を選択することで、フレーズ「ソフトウェア」の採否を選択することができる。
On the
なお、初期状態では、各フレーズ「パソコン」、「計算機」および「ソフトウェア」について、不採用ボタンb2,b4,b6が選択された状態となっている。 In the initial state, the rejected buttons b2, b4, and b6 are selected for the phrases "personal computer", "computer", and "software".
また、フレーズ選択画面900において、ユーザの操作入力により決定ボタン901を選択すると、フレーズの採否の選択を終了することができる。具体的には、例えば、決定ボタン901が選択されると、作業者端末201から応答処理装置101に採用されたフレーズを示す選択結果が送信され、フレーズ選択画面900の表示が終了する。
Further, on the
例えば、採用ボタンb1、不採用ボタンb4,b6が選択された状態で、決定ボタン901が選択されると、採用されたフレーズ「パソコン」を示す選択結果が作業者端末201から応答処理装置101に送信される。この結果、応答処理装置101の受付部704により、トピック「コンピュータ」の類義語に設定するフレーズ「パソコン」の選択を受け付ける。
For example, when the
この場合、応答処理装置101の学習部705は、類義語評価テーブル230を参照して、類義語評価情報500−1のフレーズ「パソコン」の採否フラグに「1」を設定する。これにより、トピック「コンピュータ」の類義語としてフレーズ「パソコン」が設定され、トピック「コンピュータ」とフレーズ「パソコン」との対応関係を示す類義語辞書が生成される。
In this case, the
すなわち、学習部705は、質問データQ「コンピュータについて教えてください。」と、質問データQに含まれるトピック「コンピュータ」をフレーズ「パソコン」に置き換えて得られる質問データQ’「パソコンについて教えてください。」との双方が、同じ回答データAに関連付くように学習する。
That is, the
なお、学習後において、質問データQ「コンピュータについて教えてください。」のうちトピック「コンピュータ」を、特定のフレーズ「計算機」に置き換えた質問データQ’’「計算機について教えてください。」の入力が検出されたとする。特定のフレーズ「計算機」は、トピック「コンピュータ」の類義語に設定する対象の語として選択されなかったフレーズである。 After learning, the question data Q'' "Tell me about the computer." Is entered by replacing the topic "Computer" with the specific phrase "Calculator" in the question data Q "Tell me about the computer." Suppose it is detected. The specific phrase "calculator" is a phrase that was not selected as a target word to be set as a synonym for the topic "computer".
この場合、学習部705は、類義語評価テーブル230を参照して、類義語評価情報500−1のフレーズ「計算機」の採否フラグに「1」を設定する。これにより、トピック「コンピュータ」の類義語としてフレーズ「計算機」が設定され、トピック「コンピュータ」とフレーズ「計算機」との対応関係を示すように類義語辞書が修正される。
In this case, the
すなわち、学習部705は、質問データQ「コンピュータについて教えてください。」と、質問データQ’’「計算機について教えてください。」との双方が、同じ回答データAに関連付くように学習する。
That is, the
(トピックの優先度の設定例)
つぎに、図10を用いて、トピックの優先度の設定例について説明する。(Example of setting topic priority)
Next, an example of setting the priority of the topic will be described with reference to FIG.
図10は、トピックとフレーズとの対応関係の一例を示す説明図である。例えば、表示制御部703は、類義語評価テーブル230を参照して、同じフレーズを共有する複数のトピックに、他のトピックよりも高い優先度を設定する。この際、表示制御部703は、他のトピックと共有するフレーズが多いトピックほど、高い優先度を設定することにしてもよい。
FIG. 10 is an explanatory diagram showing an example of the correspondence between the topic and the phrase. For example, the
例えば、図10の(10−1)に示すように、トピック「コンピュータ」のフレーズとして「パソコン」および「計算機」があり、トピック「端末」のフレーズとして「パソコン」および「計算機」があるとする。この場合、トピック「コンピュータ」とトピック「端末」は、フレーズ「パソコン」および「計算機」を共有している。このため、表示制御部703は、トピック「コンピュータ」とトピック「端末」の優先度を2段階上げることにしてもよい。
For example, as shown in (10-1) of FIG. 10, it is assumed that the phrase "computer" has "personal computer" and "computer", and the phrase "terminal" has "personal computer" and "computer". .. In this case, the topic "computer" and the topic "terminal" share the phrases "computer" and "computer". Therefore, the
また、表示制御部703は、類義語評価テーブル230を参照して、トピック間において、一方のトピックが、他方のトピックのフレーズに使用されている語と同一であるという関係が互いに成り立つ場合に、双方のトピックに、高い優先度を設定することにしてもよい。
Further, the
例えば、図10の(10−2)に示すように、トピック「コンピュータ」のフレーズとして「パソコン」および「計算機」があり、トピック「パソコン」のフレーズとして「コンピュータ」および「計算機」があるとする。この場合、トピック「コンピュータ」は、他のトピック「パソコン」のフレーズに使用されている語「コンピュータ」と同一である。また、トピック「パソコン」は、他のトピック「コンピュータ」のフレーズに使用されている語「パソコン」と同一である。このため、表示制御部703は、トピック「コンピュータ」とトピック「パソコン」の双方に高い優先度を設定する。
For example, as shown in (10-2) of FIG. 10, it is assumed that the phrase "computer" has "computer" and "computer", and the phrase "computer" has "computer" and "computer". .. In this case, the topic "computer" is the same as the word "computer" used in the phrases of other topics "computers". In addition, the topic "personal computer" is the same as the word "personal computer" used in the phrases of other topics "computer". Therefore, the
また、応答処理システム200を運用中に得られる情報をもとにトピックの優先度を設定する手法として、例えば、以下のものがある。
Further, as a method of setting the priority of the topic based on the information obtained during the operation of the
表示制御部703は、学習後に、トピック選択画面において選択されていない未選択のトピックの各フレーズについて、チャットログDB240を参照して、応答処理システム200に入力された質問データ(入力質問)に含まれる回数を計数することにしてもよい。そして、表示制御部703は、計数した回数が一定数以上(例えば、5以上)のフレーズを有するトピックを高優先度のトピックとみなすことにしてもよい。これにより、応答処理システム200を運用中に入力された質問データに出現した回数が一定数以上のフレーズを有するトピックに高い優先度を設定することができる。
After learning, the
(トピック選択画面の他の画面例)
つぎに、図11を用いて、各トピックについてのフレーズの有無または数を表示するトピック選択画面の画面例について説明する。(Examples of other screens on the topic selection screen)
Next, a screen example of a topic selection screen for displaying the presence / absence or number of phrases for each topic will be described with reference to FIG.
図11は、トピック選択画面の他の画面例を示す説明図(その1)である。図11において、トピック選択画面1100は、FAQとして登録される質問データQから抽出されたトピック(例えば、トピックtp1〜tp10)を選択可能に表示する操作画面である。ただし、図10では、質問データQから抽出されたトピックの一部を抜粋して表示している。
FIG. 11 is an explanatory diagram (No. 1) showing another screen example of the topic selection screen. In FIG. 11, the
トピック選択画面1100において、各トピック(例えば、トピックtp1〜tp10)について、各トピックとともにフレーズの有無または数が表示されている。例えば、トピックtp1について、フレーズの数「3」が表示されている。また、トピックtp8について、フレーズがないことを示す「0」が表示されている。
On the
トピック選択画面1100によれば、類義語のメンテナンス作業を行うトピックを選択するにあたり、各トピックについてのフレーズの有無やフレーズの数から、優先的に類義語のメンテナンスを行うことが望ましいトピックを判断することができる。
According to the
つぎに、図12を用いて、高優先度のトピックを強調表示するトピック選択画面の画面例について説明する。 Next, a screen example of the topic selection screen for highlighting high-priority topics will be described with reference to FIG.
図12は、トピック選択画面の他の画面例を示す説明図(その2)である。図12において、トピック選択画面1200は、FAQとして登録される質問データQから抽出されたトピック(例えば、トピックtp1〜tp10)を選択可能に表示する操作画面である。ただし、図12では、質問データQから抽出されたトピックの一部を抜粋して表示している。
FIG. 12 is an explanatory diagram (No. 2) showing another screen example of the topic selection screen. In FIG. 12, the
トピック選択画面1200において、高優先度のトピックtp1,tp9が強調表示されている。具体的には、トピックtp1,tp9をあらわすボタンの背景色が、他のトピックをあらわすボタンとは異なる背景色に変更されている。
On the
トピック選択画面1200によれば、類義語のメンテナンス作業を行うトピックを選択するにあたり、各トピックをあらわすボタンの背景色の違いから、優先的に類義語のメンテナンスを行うことが望ましいトピックを判断することができる。
According to the
(応答処理装置101の情報処理手順)
つぎに、図13および図14を用いて、応答処理装置101の情報処理手順について説明する。(Information processing procedure of response processing device 101)
Next, the information processing procedure of the
図13および図14は、応答処理装置101の情報処理手順の一例を示すフローチャートである。図13のフローチャートにおいて、まず、応答処理装置101は、学習データを取得する(ステップS1301)。学習データは、例えば、コールセンタにおける過去の対話履歴(FAQ)や対応マニュアルなどである。
13 and 14 are flowcharts showing an example of the information processing procedure of the
そして、応答処理装置101は、取得した学習データを、既存の学習エンジンに入力することにより、トピックとフレーズとの対応関係を示す類義語辞書(仮)を生成する(ステップS1302)。つぎに、応答処理装置101は、登録対象の質問データQを取得する(ステップS1303)。
Then, the
そして、応答処理装置101は、取得した各質問データQを形態素解析して、各質問データQに含まれるトピックを抽出する(ステップS1304)。つぎに、応答処理装置101は、生成した類義語辞書(仮)を参照して、抽出した各トピックの類義語に設定する対象の語の候補であるフレーズを特定する(ステップS1305)。
Then, the
そして、応答処理装置101は、各質問データQと対応付けて、抽出したトピックと、特定したフレーズとを類義語評価テーブル230に登録して(ステップS1306)、図14に示すステップS1401に移行する。ただし、この時点では、採否フラグは「0」である。
Then, the
図14のフローチャートにおいて、まず、応答処理装置101は、類義語評価テーブル230を参照して、トピック選択画面を表示する(ステップS1401)。つぎに、応答処理装置101は、トピックの選択を受け付けたか否かを判断する(ステップS1402)。
In the flowchart of FIG. 14, first, the
ここで、トピックの選択を受け付けていない場合(ステップS1402:No)、応答処理装置101は、ステップS1407に移行する。一方、トピックの選択を受け付けた場合(ステップS1402:Yes)、応答処理装置101は、類義語評価テーブル230を参照して、選択されたトピックについてのフレーズ選択画面を表示する(ステップS1403)。ただし、トピックについてのフレーズがない場合は、応答処理装置101は、ステップS1407に移行する。
Here, if the topic selection is not accepted (step S1402: No), the
つぎに、応答処理装置101は、フレーズの選択を受け付けたか否かを判断する(ステップS1404)。ここで、応答処理装置101は、フレーズの選択を受け付けるのを待つ(ステップS1404:No)。ただし、いずれのフレーズも選択されなかった、すなわち、類義語としていずれのフレーズも採用されなかった場合は、応答処理装置101は、ステップS1407に移行する。
Next, the
そして、応答処理装置101は、フレーズの選択を受け付けた場合(ステップS1404:Yes)、類義語評価テーブル230を参照して、選択されたトピックと、選択されたフレーズとの組み合わせに対応する類義語評価情報を特定する(ステップS1405)。
Then, when the
つぎに、応答処理装置101は、特定した類義語評価情報の採否フラグに「1」を設定する(ステップS1406)。そして、応答処理装置101は、トピックの選択を終了するか否かを判断する(ステップS1407)。なお、応答処理装置101は、例えば、作業者端末201からトピック選択終了通知を受信した場合に、トピックの選択を終了すると判断する。
Next, the
ここで、トピックの選択を終了しない場合(ステップS1407:No)、応答処理装置101は、ステップS1402に戻る。一方、トピックの選択を終了する場合(ステップS1407:Yes)、応答処理装置101は、類義語評価テーブル230を参照して、採否フラグ「1」のトピックとフレーズとの対応関係を示す類義語辞書を生成する(ステップS1408)。
Here, if the topic selection is not completed (step S1407: No), the
そして、応答処理装置101は、生成した類義語辞書を出力して(ステップS1409)、本フローチャートによる一連の処理を終了する。これにより、FAQマスタ220に登録される質問データQに含まれるトピックについて、適切な類義語が登録できるように支援することができる。
Then, the
なお、図13に示したステップS1301,S1302の処理は、応答処理装置101とは異なる他のコンピュータにおいて実行されてもよい。この場合、応答処理装置101は、他のコンピュータから類義語辞書(仮)を取得する。また、応答処理装置101において過去に生成された類義語辞書が存在する場合は、その類義語辞書を類義語辞書(仮)として取得することにしてもよい。
The processing of steps S1301 and S1302 shown in FIG. 13 may be executed by another computer different from the
また、ステップS1402において選択されなかった未選択のトピックについては、応答処理装置101は、例えば、類義語評価テーブル230を参照して、当該トピックとの類似度が最大のフレーズの採否フラグを「1」に自動設定することにしてもよい。
Further, for the unselected topic not selected in step S1402, the
以上説明したように、実施の形態にかかる応答処理装置101によれば、質問データQを形態素解析して、質問データQに含まれるトピックを抽出し、抽出したトピックの類義語に設定する対象の語の候補であるフレーズを提示することができる。そして、応答処理装置101によれば、提示したフレーズのうち、トピックの類義語に設定する対象の語としていずれかのフレーズの選択を受け付けると、質問データQと質問データQ’との双方が、同じ回答データAに関連付くように学習することができる。質問データQ’は、質問データQに含まれるトピックを、選択されたフレーズに置き換えて得られる質問データである。
As described above, according to the
これにより、FAQとして登録される質問データQに含まれるトピックについて、適切な類義語を簡単に登録できるように支援することができる。例えば、質問データQを登録するにあたり、類義語に設定する対象の語の候補となるフレーズの中からいずれかのフレーズを選択するという簡単な操作を行うだけで、質問データQに含まれるトピックの類義語を登録することができる。 As a result, it is possible to support the easy registration of appropriate synonyms for the topic included in the question data Q registered as FAQ. For example, when registering question data Q, a synonym for a topic included in question data Q can be obtained by simply selecting one of the phrases that can be candidates for the target word to be set as a synonym. Can be registered.
また、応答処理装置101によれば、トピックについての所定のサイト内の検索結果に基づいて、トピックの類義語に設定する対象の語の候補であるフレーズを提示することができる。これにより、例えば、コールセンタにおける過去の対話履歴等が十分に蓄積されていなくても、公開されたウェブページの情報を用いて、トピックの類義語に設定する対象の語の候補を抽出して提示することができる。
Further, according to the
また、応答処理装置101によれば、質問データQを形態素解析した結果、質問データQに複数のトピックが含まれる場合に、複数のトピックのそれぞれについて類義語に設定する対象の語の候補であるフレーズの有無又は数が分かるように提示することができる。これにより、類義語のメンテナンスを行うトピックを選択するにあたり、各トピックについてのフレーズの有無やフレーズの数から、優先的に類義語のメンテナンスを行うことが望ましいトピックを判断することができる。
Further, according to the
また、応答処理装置101によれば、学習後、質問データQのうちトピックを特定のフレーズに置き換えた質問データQ’’の入力を検出すると、質問データQと質問データQ’’との双方が、同じ回答データAに関連付くように学習することにしてもよい。特定のフレーズは、トピックの類義語に設定する対象の語の候補のうち、当該トピックの類義語に設定する対象の語として選択されなかったフレーズである。
Further, according to the
これにより、以降において、応答処理システム200にフレーズを含む質問データQ’’が入力された際に、特定のフレーズをトピックに置き換えた質問データQによる検索が可能となり、ヒット率を高めることができる。
As a result, when the question data Q'' including the phrase is input to the
また、応答処理装置101によれば、学習後、質問データQのうちトピックを特定のフレーズに置き換えた質問データQ’’の入力を検出すると、特定のフレーズのトピックの類義語としての登録を示唆することができる。これにより、応答処理システム200の管理者等に対して、トピックの類義語として登録することが望ましい特定のフレーズの存在を知らせることができ、適切な類義語の登録漏れを防ぐことができる。
Further, according to the
これらのことから、実施の形態にかかる応答処理装置101および応答処理システム200によれば、質問データQを登録するにあたり、質問データQに含まれるトピックについて、適切な類義語を簡単に登録できるように支援することで、類義語のメンテナンスにかかる作業負荷を削減して、類義語辞書の陳腐化を防ぐことができる。
From these facts, according to the
なお、本実施の形態で説明した応答処理方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本応答処理プログラムは、ハードディスク、フレキシブルディスク、CD(Compact Disc)−ROM、MO(Magneto−Optical disk)、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本応答処理プログラムは、インターネット等のネットワークを介して配布してもよい。 The response processing method described in the present embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This response processing program is a computer-readable recording medium such as a hard disk, a flexible disk, a CD (Compact Disk) -ROM, an MO (Magnet-Optical disk), a DVD (Digital Versaille Disk), or a USB (Universal Serial Bus) memory. It is recorded on a DVD and executed by being read from a recording medium by a computer. Further, the response processing program may be distributed via a network such as the Internet.
101 応答処理装置
110 ディスプレイ
120 類義語辞書
200 応答処理システム
201 作業者端末
210 ネットワーク
220 FAQマスタ
230 類義語評価テーブル
240 チャットログDB
300 バス
301 CPU
302 メモリ
303 I/F
304 ディスクドライブ
305 ディスク
701 取得部
702 抽出部
703 表示制御部
704 受付部
705 学習部
800,1100,1200 トピック選択画面
900 フレーズ選択画面101
300
302 Memory 303 I / F
304
Claims (8)
前記語の類義語に設定する対象の語の候補を提示し、
前記候補のうち、前記語の類義語に設定する対象の語としていずれかの語の選択を受け付けると、前記質問データと、前記質問データに含まれる前記語を選択された前記語に置き換えて得られる質問データとの双方が、同じ回答データに関連づくように学習する、
処理をコンピュータに実行させることを特徴とする応答処理プログラム。When registering the question data, the question data is morphologically analyzed, and the words contained in the question data are extracted.
Present the candidate words to be set as synonyms of the above words,
When the selection of any of the candidates is accepted as the target word to be set as the synonym of the word, the question data and the word included in the question data are replaced with the selected word. Learn so that both with the question data are related to the same answer data,
A response processing program characterized by having a computer perform processing.
処理を前記コンピュータに実行させることを特徴とする請求項1に記載の応答処理プログラム。After learning, when the input of question data in which the word is replaced with a specific word that is not selected as a target word to be set as a synonym for the word among the candidates is detected, the question data and the question data are displayed. Learning so that both the word included in the question data and the question data obtained by replacing the word with the specific word are related to the same answer data.
The response processing program according to claim 1, wherein the processing is executed by the computer.
処理を前記コンピュータに実行させることを特徴とする請求項1に記載の応答処理プログラム。After learning, when the input of question data in which the word is replaced with a specific word that is not selected as a target word to be set as a synonym of the word among the candidates is detected, the input of the specific word is detected. Suggests registration of the word as a synonym,
The response processing program according to claim 1, wherein the processing is executed by the computer.
前記語の類義語に設定する対象の語の候補を提示し、
前記候補のうち、前記語の類義語に設定する対象の語としていずれかの語の選択を受け付けると、前記質問データと、前記質問データに含まれる前記語を選択された前記語に置き換えて得られる質問データとの双方が、同じ回答データに関連づくように学習する、
処理をコンピュータが実行することを特徴とする応答処理方法。When registering the question data, the question data is morphologically analyzed, and the words contained in the question data are extracted.
Present the candidate words to be set as synonyms of the above words,
When the selection of any of the candidates is accepted as the target word to be set as the synonym of the word, the question data and the word included in the question data are replaced with the selected word. Learn so that both with the question data are related to the same answer data,
A response processing method characterized in that processing is performed by a computer.
前記語の類義語に設定する対象の語の候補を提示し、
前記候補のうち、前記語の類義語に設定する対象の語としていずれかの語の選択を受け付けると、前記質問データと、前記質問データに含まれる前記語を選択された前記語に置き換えて得られる質問データとの双方が、同じ回答データに関連づくように学習する、
制御部を有することを特徴とする応答処理装置。When registering the question data, the question data is morphologically analyzed, and the words contained in the question data are extracted.
Present the candidate words to be set as synonyms of the above words,
When the selection of any of the candidates is accepted as the target word to be set as the synonym of the word, the question data and the word included in the question data are replaced with the selected word. Learn so that both with the question data are related to the same answer data,
A response processing device having a control unit.
前記語の類義語に設定する対象の語の候補を提示する表示制御部と、
前記候補のうち、前記語の類義語に設定する対象の語としていずれかの語の選択を受け付けると、前記質問データと、前記質問データに含まれる前記語を選択された前記語に置き換えて得られる質問データとの双方が、同じ回答データに関連づくように学習する学習部と、
を有することを特徴とする応答処理システム。When registering question data, an extraction unit that morphologically analyzes the question data and extracts words contained in the question data,
A display control unit that presents candidates for the target word to be set as a synonym for the word,
When the selection of any of the candidates is accepted as the target word to be set as the synonym of the word, the question data and the word included in the question data are replaced with the selected word. A learning department that learns so that both the question data and the question data are related to the same answer data,
A response processing system characterized by having.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/008160 WO2019167281A1 (en) | 2018-03-02 | 2018-03-02 | Reply processing program, reply processing method, reply processing device, and reply processing system |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019167281A1 true JPWO2019167281A1 (en) | 2020-12-03 |
JP6885506B2 JP6885506B2 (en) | 2021-06-16 |
Family
ID=67806004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020502777A Active JP6885506B2 (en) | 2018-03-02 | 2018-03-02 | Response processing program, response processing method, response processing device and response processing system |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6885506B2 (en) |
WO (1) | WO2019167281A1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI728507B (en) * | 2019-10-15 | 2021-05-21 | 財團法人資訊工業策進會 | Apparatus and method for generating a dialogue state tracking model |
JP2021108033A (en) * | 2019-12-27 | 2021-07-29 | カラクリ株式会社 | Question-answer display server, question-answer display method, and question-answer display program |
CN114117021B (en) * | 2022-01-24 | 2022-04-01 | 北京数智新天信息技术咨询有限公司 | Method and device for determining reply content and electronic equipment |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH064571A (en) * | 1992-06-18 | 1994-01-14 | Nec Corp | Synonym definition device |
JP2000090096A (en) * | 1998-09-08 | 2000-03-31 | Toshiba Corp | Intelligent electronic catalog system |
JP2000163433A (en) * | 1998-11-27 | 2000-06-16 | Nkk Corp | Synonym registration management system |
JP2002163540A (en) * | 2000-11-22 | 2002-06-07 | Akira Katakabe | Travel information system by making database of travel experience information |
JP2006053856A (en) * | 2004-08-16 | 2006-02-23 | Canon Inc | User support system |
JP2006293607A (en) * | 2005-04-08 | 2006-10-26 | Sony Corp | Information retrieval system, information retrieval device, terminal equipment, information retrieval method and program |
JP2017037588A (en) * | 2015-08-14 | 2017-02-16 | 富士ゼロックス株式会社 | Information processor and information processing program |
JP6218057B1 (en) * | 2017-07-14 | 2017-10-25 | Jeインターナショナル株式会社 | Automatic response server device, terminal device, response system, response method, and program |
-
2018
- 2018-03-02 JP JP2020502777A patent/JP6885506B2/en active Active
- 2018-03-02 WO PCT/JP2018/008160 patent/WO2019167281A1/en active Application Filing
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH064571A (en) * | 1992-06-18 | 1994-01-14 | Nec Corp | Synonym definition device |
JP2000090096A (en) * | 1998-09-08 | 2000-03-31 | Toshiba Corp | Intelligent electronic catalog system |
JP2000163433A (en) * | 1998-11-27 | 2000-06-16 | Nkk Corp | Synonym registration management system |
JP2002163540A (en) * | 2000-11-22 | 2002-06-07 | Akira Katakabe | Travel information system by making database of travel experience information |
JP2006053856A (en) * | 2004-08-16 | 2006-02-23 | Canon Inc | User support system |
JP2006293607A (en) * | 2005-04-08 | 2006-10-26 | Sony Corp | Information retrieval system, information retrieval device, terminal equipment, information retrieval method and program |
JP2017037588A (en) * | 2015-08-14 | 2017-02-16 | 富士ゼロックス株式会社 | Information processor and information processing program |
JP6218057B1 (en) * | 2017-07-14 | 2017-10-25 | Jeインターナショナル株式会社 | Automatic response server device, terminal device, response system, response method, and program |
Non-Patent Citations (1)
Title |
---|
石川 誠一: "ソフトバンクが提供する対話型FAQシステム:APTWARE", インタラクティブ情報アクセスと可視化マイニング 第11回研究会研究発表予稿集 [ONLINE], JPN6021012229, 16 March 2016 (2016-03-16), JP, pages 20 - 24, ISSN: 0004482509 * |
Also Published As
Publication number | Publication date |
---|---|
WO2019167281A1 (en) | 2019-09-06 |
JP6885506B2 (en) | 2021-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10521463B2 (en) | Answering questions via a persona-based natural language processing (NLP) system | |
JP6414956B2 (en) | Question generating device and computer program | |
US9373075B2 (en) | Applying a genetic algorithm to compositional semantics sentiment analysis to improve performance and accelerate domain adaptation | |
US10891427B2 (en) | Machine learning techniques for generating document summaries targeted to affective tone | |
KR102032091B1 (en) | Method And System of Comment Emotion Analysis based on Artificial Intelligence | |
US20180268038A1 (en) | Systems and Methods for Similarity and Context Measures for Trademark and Service Mark Analysis and Repository Searches | |
CN110297893B (en) | Natural language question-answering method, device, computer device and storage medium | |
US10977155B1 (en) | System for providing autonomous discovery of field or navigation constraints | |
JPH02302876A (en) | Conversational language analyzer | |
WO2019116253A1 (en) | Supporting evidence retrieval for complex answers | |
KR102285142B1 (en) | Apparatus and method for recommending learning data for chatbots | |
US11699034B2 (en) | Hybrid artificial intelligence system for semi-automatic patent infringement analysis | |
JP6885506B2 (en) | Response processing program, response processing method, response processing device and response processing system | |
CN112035506A (en) | Semantic recognition method and equipment | |
Quirchmayr et al. | Semi-automatic Software Feature-Relevant Information Extraction from Natural Language User Manuals: An Approach and Practical Experience at Roche Diagnostics GmbH | |
CN112417090A (en) | Using uncommitted user input data to improve task performance | |
CN114547274A (en) | Multi-turn question and answer method, device and equipment | |
Shah et al. | Simple App Review Classification with Only Lexical Features. | |
US20210192136A1 (en) | Machine learning models with improved semantic awareness | |
JP2017015874A (en) | Text reading comprehension support device, and annotation data creation device, annotation data creation method, and annotation data creation program | |
WO2023040516A1 (en) | Event integration method and apparatus, and electronic device, computer-readable storage medium and computer program product | |
CN111062832A (en) | Auxiliary analysis method and device for intelligently providing patent answer and debate opinions | |
US11709872B2 (en) | Computer-readable recording medium storing response processing program, response processing method, and information processing apparatus | |
CN114360678A (en) | Information processing method, device, equipment and storage medium | |
CN109284364B (en) | Interactive vocabulary updating method and device for voice microphone-connecting interaction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200520 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210413 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210426 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6885506 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |