JPWO2019150583A1 - 質問群抽出方法、質問群抽出装置および質問群抽出プログラム - Google Patents
質問群抽出方法、質問群抽出装置および質問群抽出プログラム Download PDFInfo
- Publication number
- JPWO2019150583A1 JPWO2019150583A1 JP2019568547A JP2019568547A JPWO2019150583A1 JP WO2019150583 A1 JPWO2019150583 A1 JP WO2019150583A1 JP 2019568547 A JP2019568547 A JP 2019568547A JP 2019568547 A JP2019568547 A JP 2019568547A JP WO2019150583 A1 JPWO2019150583 A1 JP WO2019150583A1
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- state
- question
- task
- indicating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/226—Validation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Abstract
Description
そこで、本発明は、上述した課題を解決する、会話履歴から任意のトピックに関連する質問群を容易に抽出できる質問群抽出方法、質問群抽出装置および記録媒体を提供することを目的とする。
[構成の説明]
以下、本発明の実施形態を、図面を参照して説明する。図1は、本発明による質問群抽出装置の第1の実施形態の構成例を示すブロック図である。
2.オペレータが顧客の状況を明確にするための質問をする
3.顧客が質問に答える
4.オペレータが顧客の課題に関して原因(Cause) を述べる
5.オペレータが顧客の課題に対する対処(Action)を行う
( 状態S →形態素a の対応頻度)/( 状態S →全形態素の対応頻度) ・・・式(1)
−c * ( 前状態に適合した発話からの距離の総和) ・・・式(2)
以下、本実施形態の質問群抽出装置100が状態遷移モデルの出力確率を学習する動作を図9を参照して説明する。図9は、第1の実施形態の質問群抽出装置100による出力確率学習処理の動作を示すフローチャートである。なお、本例において質問群抽出装置100には、状態遷移モデルとラベル付与パタンとが事前に設定されている。
本実施形態の質問群抽出装置100は、会話履歴データから質問群を抽出する装置である。質問群抽出装置100の学習ラベル付与部112は、会話履歴データ中の各発話に対して正規表現等を用いて状態ラベルを付与する。
11 付与部
12 抽出部
101 CPU
102 主記憶部
103 通信部
104 補助記憶部
105 入力部
106 出力部
107 システムバス
111 学習受付部
112 学習ラベル付与部
113 アラインメント生成部
114 出力確率算出部
121 抽出受付部
122 抽出ラベル付与部
123 状態遷移モデル参照部
124 生成確率算出部
125 出力部
そこで、本発明は、上述した課題を解決する、会話履歴から任意のトピックに関連する質問群を容易に抽出できる質問群抽出方法、質問群抽出装置および質問群抽出プログラムを提供することを目的とする。
Claims (11)
- 1つの課題を示す文である課題文と、前記1つの課題に対する質問を示す文である質問文と、前記質問に対する回答を示す文である回答文とで構成されている文の集合が1つ以上含まれている会話履歴を示すデータ内の前記課題文に課題状態を示すラベル、前記データ内の前記質問文に質問状態を示すラベル、および前記データ内の前記回答文に回答状態を示すラベルをそれぞれ付与し、
1つの課題状態と質問状態と回答状態とで構成され状態の遷移を表すモデルである状態遷移モデルに従ってラベルが示す状態が対応付けられている前記文の集合を、前記データから抽出する
ことを特徴とする質問群抽出方法。 - 会話履歴に含まれている文の集合の数だけ前記会話履歴を示すデータから前記文の集合を抽出する
請求項1記載の質問群抽出方法。 - 会話履歴を示すデータ内の文に付与されたラベルを状態遷移モデルを用いて修正し、
ラベルが修正された前記データから文の集合を抽出する
請求項1または請求項2記載の質問群抽出方法。 - 状態遷移モデル中の任意の状態から文を構成する形態素が生成される確率である生成確率を基にラベルを修正する
請求項3記載の質問群抽出方法。 - 状態遷移モデル中の任意の状態に文を構成する形態素が対応している度合いを学習し、
学習された度合いを用いて生成確率を算出する
請求項4記載の質問群抽出方法。 - 生成確率が算出される形態素が含まれる文と、前記文に付与されたラベルが示す状態への状態遷移モデルにおける遷移前の状態を示すラベルが付与された文との会話履歴中の距離を用いて前記生成確率を算出する
請求項4または請求項5記載の質問群抽出方法。 - 含まれている課題文が同一の課題を示す複数の文の集合をグループ化して出力する
請求項1から請求項6のうちのいずれか1項に記載の質問群抽出方法。 - 状態遷移モデルには、結論状態が含まれ、
会話履歴を示すデータ内の課題文が示す1つの課題に対する結論を示す文である結論文に結論状態を示すラベルを付与し、
結論文が含まれる文の集合を抽出する
請求項1から請求項7のうちのいずれか1項に記載の質問群抽出方法。 - 課題文が示す1つの課題に対応する対処内容を示す文を前記課題文が含まれている文の集合に含めた上で前記文の集合を抽出する
請求項1から請求項8のうちのいずれか1項に記載の質問群抽出方法。 - 1つの課題を示す文である課題文と、前記1つの課題に対する質問を示す文である質問文と、前記質問に対する回答を示す文である回答文とで構成されている文の集合が1つ以上含まれている会話履歴を示すデータ内の前記課題文に課題状態を示すラベル、前記データ内の前記質問文に質問状態を示すラベル、および前記データ内の前記回答文に回答状態を示すラベルをそれぞれ付与する付与部と、
1つの課題状態と質問状態と回答状態とで構成され状態の遷移を表すモデルである状態遷移モデルに従ってラベルが示す状態が対応付けられている前記文の集合を、前記データから抽出する抽出部とを備える
ことを特徴とする質問群抽出装置。 - コンピュータで実行されるときに、
1つの課題を示す文である課題文と、前記1つの課題に対する質問を示す文である質問文と、前記質問に対する回答を示す文である回答文とで構成されている文の集合が1つ以上含まれている会話履歴を示すデータ内の前記課題文に課題状態を示すラベル、前記データ内の前記質問文に質問状態を示すラベル、および前記データ内の前記回答文に回答状態を示すラベルをそれぞれ付与し、
1つの課題状態と質問状態と回答状態とで構成され状態の遷移を表すモデルである状態遷移モデルに従ってラベルが示す状態が対応付けられている前記文の集合を、前記データから抽出する
質問群抽出プログラム
を記録した非一時的なコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/003843 WO2019150583A1 (ja) | 2018-02-05 | 2018-02-05 | 質問群抽出方法、質問群抽出装置および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019150583A1 true JPWO2019150583A1 (ja) | 2021-01-14 |
JP6988924B2 JP6988924B2 (ja) | 2022-01-05 |
Family
ID=67479599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019568547A Active JP6988924B2 (ja) | 2018-02-05 | 2018-02-05 | 質問群抽出方法、質問群抽出装置および質問群抽出プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11416678B2 (ja) |
JP (1) | JP6988924B2 (ja) |
WO (1) | WO2019150583A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11783005B2 (en) * | 2019-04-26 | 2023-10-10 | Bank Of America Corporation | Classifying and mapping sentences using machine learning |
US11238076B2 (en) * | 2020-04-19 | 2022-02-01 | International Business Machines Corporation | Document enrichment with conversation texts, for enhanced information retrieval |
CN112966076A (zh) * | 2021-02-25 | 2021-06-15 | 中国平安人寿保险股份有限公司 | 智能问答问题的生成方法、装置、计算机设备及存储介质 |
CN113705248B (zh) * | 2021-07-21 | 2022-09-30 | 上海原圈网络科技有限公司 | 一种基于结果评价的话术训练数据处理方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004266551A (ja) * | 2003-02-28 | 2004-09-24 | Toshiba Corp | ストリームデータ生成装置、ストリームデータ生成システム、ストリームデータ生成方法及びプログラム |
JP2006349954A (ja) * | 2005-06-15 | 2006-12-28 | Fujitsu Ltd | 対話システム |
JP2018017936A (ja) * | 2016-07-28 | 2018-02-01 | 国立研究開発法人情報通信研究機構 | 音声対話装置、サーバ装置、音声対話方法、音声処理方法およびプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW473675B (en) | 2000-09-29 | 2002-01-21 | C A I Co Ltd | Topics dialog procedures and system |
JP4246548B2 (ja) | 2003-05-30 | 2009-04-02 | 日本電信電話株式会社 | 統計情報を用いた対話方法及びその装置と、対話プログラム及びそのプログラムを記録した記録媒体 |
JP4755478B2 (ja) | 2005-10-07 | 2011-08-24 | 日本電信電話株式会社 | 応答文生成装置、応答文生成方法、そのプログラムおよび記憶媒体 |
US8315964B2 (en) * | 2008-10-27 | 2012-11-20 | Microsoft Corporation | Comprehensive human computation framework |
US9378273B2 (en) * | 2014-03-13 | 2016-06-28 | International Business Machines Corporation | System and method for question answering by reformulating word problems |
US10572806B2 (en) * | 2015-02-17 | 2020-02-25 | International Business Machines Corporation | Question answering with time-based weighting |
US10120864B2 (en) * | 2016-03-29 | 2018-11-06 | Conduent Business Services Llc | Method and system for identifying user issues in forum posts based on discourse analysis |
US10460398B1 (en) * | 2016-07-27 | 2019-10-29 | Intuit Inc. | Method and system for crowdsourcing the detection of usability issues in a tax return preparation system |
CN110019644B (zh) * | 2017-09-06 | 2022-10-14 | 腾讯科技(深圳)有限公司 | 对话实现中的搜索方法、装置和计算机可读存储介质 |
-
2018
- 2018-02-05 WO PCT/JP2018/003843 patent/WO2019150583A1/ja active Application Filing
- 2018-02-05 US US16/967,321 patent/US11416678B2/en active Active
- 2018-02-05 JP JP2019568547A patent/JP6988924B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004266551A (ja) * | 2003-02-28 | 2004-09-24 | Toshiba Corp | ストリームデータ生成装置、ストリームデータ生成システム、ストリームデータ生成方法及びプログラム |
JP2006349954A (ja) * | 2005-06-15 | 2006-12-28 | Fujitsu Ltd | 対話システム |
JP2018017936A (ja) * | 2016-07-28 | 2018-02-01 | 国立研究開発法人情報通信研究機構 | 音声対話装置、サーバ装置、音声対話方法、音声処理方法およびプログラム |
Non-Patent Citations (1)
Title |
---|
STOLCKE, ANDREAS ET AL.: ""Dialogue Act Modeling for Automatic Tagging and Recognition of Conversational Speech"", COMPUTATIONAL LINGUISTICS, vol. Volume 26, Issue 3, JPN7018001140, September 2000 (2000-09-01), pages 339 - 373, ISSN: 0004577498 * |
Also Published As
Publication number | Publication date |
---|---|
JP6988924B2 (ja) | 2022-01-05 |
US11416678B2 (en) | 2022-08-16 |
US20210034815A1 (en) | 2021-02-04 |
WO2019150583A1 (ja) | 2019-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6719082B2 (ja) | 決定木生成装置、決定木生成方法、決定木生成プログラム及び質問システム | |
JP6988924B2 (ja) | 質問群抽出方法、質問群抽出装置および質問群抽出プログラム | |
CN106649742B (zh) | 数据库维护方法和装置 | |
JP5831951B2 (ja) | 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム | |
US20180157959A1 (en) | Intelligent interaction method and intelligent interaction system | |
CN112417102B (zh) | 一种语音查询方法、装置、服务器和可读存储介质 | |
US20060129396A1 (en) | Method and apparatus for automatic grammar generation from data entries | |
KR102100951B1 (ko) | 기계 독해를 위한 질의응답 데이터 생성 시스템 | |
CN113627797B (zh) | 入职员工画像生成方法、装置、计算机设备及存储介质 | |
KR101677859B1 (ko) | 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치 | |
Alhassan et al. | A novel framework for Arabic dialect chatbot using machine learning | |
US11669691B2 (en) | Information processing apparatus, information processing method, and computer readable recording medium | |
US6965856B1 (en) | Process for the automatic generation of a textual expression from a semantic representation using a computer system | |
JP6757840B2 (ja) | 文抽出システム、文抽出方法、及びプログラム | |
JP2013250926A (ja) | 質問応答装置、方法、及びプログラム | |
WO2020241039A1 (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
CN114020888A (zh) | 文本生成的方法、装置、设备以及存储介质 | |
JP7013329B2 (ja) | 学習装置、学習方法および学習プログラム | |
CN112685434A (zh) | 一种基于知识图谱的运维问答方法 | |
JP2021108033A (ja) | 質問回答表示サーバ、質問回答表示方法及び質問回答表示プログラム | |
JP7216863B1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN113743126B (zh) | 一种基于用户情绪的智能交互方法和装置 | |
CN111814433B (zh) | 一种维吾尔语实体识别的方法、装置和电子设备 | |
JP2013254421A (ja) | 固有表現タイプ推定装置、方法、及びプログラム | |
JP2018028925A (ja) | 次発話候補ランキング装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200731 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210824 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211020 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211102 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6988924 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |