JP2012003704A - Faq候補抽出システムおよびfaq候補抽出プログラム - Google Patents
Faq候補抽出システムおよびfaq候補抽出プログラム Download PDFInfo
- Publication number
- JP2012003704A JP2012003704A JP2010140675A JP2010140675A JP2012003704A JP 2012003704 A JP2012003704 A JP 2012003704A JP 2010140675 A JP2010140675 A JP 2010140675A JP 2010140675 A JP2010140675 A JP 2010140675A JP 2012003704 A JP2012003704 A JP 2012003704A
- Authority
- JP
- Japan
- Prior art keywords
- question
- discourse
- faq
- statement
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】談話データ101および談話セマンティクス200を入力とし、談話データ101からFAQ候補となる質問文を抽出して出力するFAQ候補抽出システム1であって、談話セマンティクス200は各ステートメントのフロー情報21を含み、談話データ101から、顧客によって発話され、質問文もしくは要求文であることを示すフローが設定された質問・要求ステートメントを抽出する質問抽出部60と、質問・要求ステートメントから指定されたキーワードを含むものを抽出する候補抽出部80と、質問・要求ステートメントについてクラスタリングし、各クラスタの代表となる質問・要求ステートメントをFAQ候補300として出力するクラスタリング部90とを有する。
【選択図】図1
Description
図2は、本発明の一実施の形態における談話構造解析システムの構成例の概要について示したブロック図である。談話構造解析システム2は、サーバやPC(Personal Computer)等のコンピュータシステムによって構成され、例えば、ソフトウェアプログラムによって実装される前処理部10、フロー解析部20、形態素解析部30、固有表現解析部40、結束性解析部50の各部と、フロー解析ルール22、および固有表現解析ルール42の各テーブルを有し、音声認識エンジン3によって談話の内容がテキスト化された談話データ100を入力として、談話構造の解析を行って談話セマンティクス200を出力する。
図1は、本発明の一実施の形態であるFAQ候補抽出システムの構成例の概要について示したブロック図である。FAQ候補抽出システム1は、談話構造解析システム2と同様に、サーバやPC等のコンピュータシステムによって構成され、例えば、ソフトウェアプログラムによって実装される質問抽出部60、スコアリング部70、候補抽出部80およびクラスタリング部90の各部と、既存FAQ82のテーブルを有し、談話の内容がテキスト化された談話データ101と、談話データ101についての談話構造の解析結果である談話セマンティクス200の全部または一部(特にフロー情報21、および形態素情報31)とを入力として、談話データ101からFAQの候補となる質問文を抽出してFAQ候補300として出力するシステムである。
以下では、図2に示した談話構造解析システム2のフロー解析部20によるフロー解析の処理の詳細について説明する。図4は、談話データ100におけるフローとコンテキストの例について示した図である。本実施の形態では、コンテキストは談話の各ブロックに対して設定される。図4の例では、最初のブロック(話者:オペレータ)のコンテキストは“開始”であり、次のブロック(話者:顧客)およびその次のブロック(話者:オペレータ)はともに“陳述”となっている。
以下では、図2に示した談話構造解析システム2の固有表現解析部40による固有表現解析の処理の詳細について説明する。図7は、談話構造解析システム2の固有表現解析ルール42の例について示した図である。固有表現解析ルール42は、ファイルやデータベース等に保持されており、ステートメント中の固有表現を特定するための正規表現と、当該正規表現とマッチする部分から固有表現を特定して抽出するための規則(以下では「固有表現規則」と記載する場合がある)との対応について予め指定したリストを保持するテーブルである。
以下では、図2に示した談話構造解析システム2の結束性解析部50による結束性解析の処理の詳細について説明する。図9は、談話構造解析システム2での結束性解析の例について示した図である。結束性解析処理では、まず、上段の図に示すように、談話データ100における全てのブロックを1つのセグメントとして設定する。
以下では、図1に示したFAQ候補抽出システム1によるFAQ候補抽出の処理の詳細について説明する。図11は、FAQ候補抽出システム1によって抽出したFAQ候補300を表示する画面の例について示した図である。画面上部には、FAQ候補300を抽出する際の基準となるキーワードを指定する入力フィールドを有する。ここでユーザがキーワードを指定すると、FAQ候補抽出システム1によって、談話データ101内の顧客による質問に相当するステートメントおよび既存FAQ82内に保持された質問文から抽出されクラスタリングされたFAQ候補300の内容がリストとして表示される。
10…前処理部、
20…フロー解析部、21…フロー情報、22…フロー解析ルール、
30…形態素解析部、31…形態素情報、
40…固有表現解析部、41…固有表現情報、42…固有表現解析ルール、
50…結束性解析部、51…結束性情報、
60…質問抽出部、
70…スコアリング部、71…質問情報、
80…候補抽出部、81…キーワード、82…既存FAQ、
100、101…談話データ、200…談話セマンティクス、300…FAQ候補。
Claims (8)
- 音声認識処理によって談話の内容がテキスト化された談話データ、および前記談話データにおける前記談話の構造の解析結果である、前記談話全体の意味内容を把握するための情報である談話セマンティクスを入力とし、前記談話データからFAQ候補となる質問文を抽出して出力するFAQ候補抽出システムであって、
前記談話セマンティクスは、前記談話データにおける各ステートメントの意味内容を示すフローの情報を含むフロー情報を含み、
前記談話データから、顧客によって発話され、前記談話セマンティクスの前記フロー情報において質問文もしくは要求文であることを示すフローが設定された質問・要求ステートメントを抽出する質問抽出部と、
前記質問抽出部によって抽出された前記質問・要求ステートメントから、指定されたキーワードを含むものを抽出する候補抽出部と、
前記候補抽出部によって抽出された前記質問・要求ステートメントについて、内容が同様のものにクラスタリングし、各クラスタの代表となる前記質問・要求ステートメントをFAQ候補として出力するクラスタリング部とを有することを特徴とするFAQ候補抽出システム。 - 請求項1に記載のFAQ候補抽出システムにおいて、
前記候補抽出部は、前記質問抽出部によって抽出された前記質問・要求ステートメントに既存のFAQにおける質問文を含めた集合から、指定されたキーワードを含むものを抽出し、
前記クラスタリング部は、前記FAQ候補として出力する前記質問・要求ステートメントについて、属するクラスタに既存のFAQから抽出された質問文が含まれるか否かの情報を含めることを特徴とするFAQ候補抽出システム。 - 請求項1または2に記載のFAQ候補抽出システムにおいて、
前記談話セマンティクスは、前記各ステートメントを形態素に分割して品詞を判別した形態素列の情報を含む形態素情報を含み、
さらに、前記質問抽出部によって抽出された前記質問・要求ステートメントについて、含まれる単語の出現頻度に係る情報を前記形態素情報に基づいて取得し、当該出現頻度の情報に基づいて重要度を算出するスコアリング部を有し、
前記クラスタリング部は、前記FAQ候補に含まれる前記質問・要求ステートメントについて、前記重要度の順に出力することを特徴とするFAQ候補抽出システム。 - 請求項3に記載のFAQ候補抽出システムにおいて、
前記スコアリング部は、前記質問抽出部によって抽出された前記質問・要求ステートメントに含まれる各単語についてTF−IDF値を算出し、前記各単語のTF−IDF値の平均値を前記重要度とすることを特徴とするFAQ候補抽出システム。 - 音声認識処理によって談話の内容がテキスト化された談話データ、および前記談話データにおける前記談話の構造の解析結果である、前記談話全体の意味内容を把握するための情報である談話セマンティクスを入力とし、前記談話データからFAQ候補となる質問文を抽出して出力するFAQ候補抽出システムとしてコンピュータを機能させるFAQ候補抽出プログラムであって、
前記談話セマンティクスは、前記談話データにおける各ステートメントの意味内容を示すフローの情報を含むフロー情報を含み、
前記談話データから、顧客によって発話され、前記談話セマンティクスの前記フロー情報において質問文もしくは要求文であることを示すフローが設定された質問・要求ステートメントを抽出する質問抽出処理と、
前記質問抽出処理によって抽出された前記質問・要求ステートメントから、指定されたキーワードを含むものを抽出する候補抽出処理と、
前記候補抽出処理によって抽出された前記質問・要求ステートメントについて、内容が同様のものにクラスタリングし、各クラスタの代表となる前記質問・要求ステートメントをFAQ候補として出力するクラスタリング処理とを実行することを特徴とするFAQ候補抽出プログラム。 - 請求項5に記載のFAQ候補抽出プログラムにおいて、
前記候補抽出処理は、前記質問抽出処理によって抽出された前記質問・要求ステートメントに既存のFAQにおける質問文を含めた集合から、指定されたキーワードを含むものを抽出し、
前記クラスタリング処理は、前記FAQ候補として出力する前記質問・要求ステートメントについて、属するクラスタに既存のFAQから抽出された質問文が含まれるか否かの情報を含めることを特徴とするFAQ候補抽出プログラム。 - 請求項5または6に記載のFAQ候補抽出プログラムにおいて、
前記談話セマンティクスは、前記各ステートメントを形態素に分割して品詞を判別した形態素列の情報を含む形態素情報を含み、
さらに、前記質問抽出処理によって抽出された前記質問・要求ステートメントについて、含まれる単語の出現頻度に係る情報を前記形態素情報に基づいて取得し、当該出現頻度の情報に基づいて重要度を算出するスコアリング処理を実行し、
前記クラスタリング処理は、前記FAQ候補に含まれる前記質問・要求ステートメントについて、前記重要度の順に出力することを特徴とするFAQ候補抽出プログラム。 - 請求項7に記載のFAQ候補抽出プログラムにおいて、
前記スコアリング処理は、前記質問抽出処理によって抽出された前記質問・要求ステートメントに含まれる各単語についてTF−IDF値を算出し、前記各単語のTF−IDF値の平均値を前記重要度とすることを特徴とするFAQ候補抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010140675A JP5574842B2 (ja) | 2010-06-21 | 2010-06-21 | Faq候補抽出システムおよびfaq候補抽出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010140675A JP5574842B2 (ja) | 2010-06-21 | 2010-06-21 | Faq候補抽出システムおよびfaq候補抽出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012003704A true JP2012003704A (ja) | 2012-01-05 |
JP5574842B2 JP5574842B2 (ja) | 2014-08-20 |
Family
ID=45535565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010140675A Active JP5574842B2 (ja) | 2010-06-21 | 2010-06-21 | Faq候補抽出システムおよびfaq候補抽出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5574842B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6457600B1 (ja) * | 2017-09-06 | 2019-01-23 | 株式会社RightSegment | チャットシステム、サーバ、画面生成方法及びコンピュータプログラム |
JP2019504371A (ja) * | 2016-11-14 | 2019-02-14 | 平安科技(深▲せん▼)有限公司 | 自動質問応答システムにおける質問クラスタリング処理方法及び装置 |
US10380177B2 (en) | 2015-12-02 | 2019-08-13 | International Business Machines Corporation | Expansion of a question and answer database |
WO2019156103A1 (ja) * | 2018-02-09 | 2019-08-15 | 日本電信電話株式会社 | Faq整備支援装置、faq整備支援方法、及びプログラム |
CN111198940A (zh) * | 2019-12-27 | 2020-05-26 | 北京百度网讯科技有限公司 | Faq方法、问答检索系统、电子设备和存储介质 |
US11144723B2 (en) | 2018-06-29 | 2021-10-12 | Fujitsu Limited | Method, device, and program for text classification |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006092473A (ja) * | 2004-09-27 | 2006-04-06 | Toshiba Corp | 回答支援システムおよび装置、回答支援プログラム |
JP2006107520A (ja) * | 2005-10-11 | 2006-04-20 | Okwave:Kk | 端末、プログラム及びq&aシステム |
JP2006119991A (ja) * | 2004-10-22 | 2006-05-11 | Qualica Inc | Faqデータ作成装置及び方法、整理装置及び方法、faq回答システム |
-
2010
- 2010-06-21 JP JP2010140675A patent/JP5574842B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006092473A (ja) * | 2004-09-27 | 2006-04-06 | Toshiba Corp | 回答支援システムおよび装置、回答支援プログラム |
JP2006119991A (ja) * | 2004-10-22 | 2006-05-11 | Qualica Inc | Faqデータ作成装置及び方法、整理装置及び方法、faq回答システム |
JP2006107520A (ja) * | 2005-10-11 | 2006-04-20 | Okwave:Kk | 端末、プログラム及びq&aシステム |
Non-Patent Citations (1)
Title |
---|
小野寺 佐知子: "質問回答検索における質問発話の談話構造推定", 第34回 言語・音声理解と対話処理システム研究会資料, JPN6013060785, 8 March 2002 (2002-03-08), JP, pages 27 - 32, ISSN: 0002700739 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10380177B2 (en) | 2015-12-02 | 2019-08-13 | International Business Machines Corporation | Expansion of a question and answer database |
US11494433B2 (en) | 2015-12-02 | 2022-11-08 | International Business Machines Corporation | Expansion of a question and answer database |
JP2019504371A (ja) * | 2016-11-14 | 2019-02-14 | 平安科技(深▲せん▼)有限公司 | 自動質問応答システムにおける質問クラスタリング処理方法及び装置 |
JP6457600B1 (ja) * | 2017-09-06 | 2019-01-23 | 株式会社RightSegment | チャットシステム、サーバ、画面生成方法及びコンピュータプログラム |
JP2019046388A (ja) * | 2017-09-06 | 2019-03-22 | 株式会社RightSegment | チャットシステム、サーバ、画面生成方法及びコンピュータプログラム |
WO2019156103A1 (ja) * | 2018-02-09 | 2019-08-15 | 日本電信電話株式会社 | Faq整備支援装置、faq整備支援方法、及びプログラム |
JPWO2019156103A1 (ja) * | 2018-02-09 | 2021-01-28 | 日本電信電話株式会社 | Faq整備支援装置、faq整備支援方法、及びプログラム |
JP7060027B2 (ja) | 2018-02-09 | 2022-04-26 | 日本電信電話株式会社 | Faq整備支援装置、faq整備支援方法、及びプログラム |
US11144723B2 (en) | 2018-06-29 | 2021-10-12 | Fujitsu Limited | Method, device, and program for text classification |
CN111198940A (zh) * | 2019-12-27 | 2020-05-26 | 北京百度网讯科技有限公司 | Faq方法、问答检索系统、电子设备和存储介质 |
CN111198940B (zh) * | 2019-12-27 | 2023-01-31 | 北京百度网讯科技有限公司 | Faq方法、问答检索系统、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5574842B2 (ja) | 2014-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5774459B2 (ja) | 談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラム | |
CN108847241B (zh) | 将会议语音识别为文本的方法、电子设备及存储介质 | |
JP5468474B2 (ja) | トークスクリプト利用状況算出システムおよびトークスクリプト利用状況算出プログラム | |
US8165887B2 (en) | Data-driven voice user interface | |
US20080091423A1 (en) | Generation of domain models from noisy transcriptions | |
KR102445519B1 (ko) | 대화형 지능 서비스 제공 챗봇 제작 시스템 및 방법 | |
Gardner-Bonneau et al. | Human factors and voice interactive systems | |
JP5574842B2 (ja) | Faq候補抽出システムおよびfaq候補抽出プログラム | |
US10860566B1 (en) | Themes surfacing for communication data analysis | |
JP2019003319A (ja) | 対話型業務支援システムおよび対話型業務支援プログラム | |
JP2013167985A (ja) | 談話要約生成システムおよび談話要約生成プログラム | |
Kafle et al. | Predicting the understandability of imperfect english captions for people who are deaf or hard of hearing | |
Kopparapu | Non-linguistic analysis of call center conversations | |
CN114168718A (zh) | 信息处理装置、方法和信息记录介质 | |
JP2012113542A (ja) | 感情推定装置、その方法、プログラム及びその記録媒体 | |
JP2018128869A (ja) | 検索結果表示装置、検索結果表示方法、及びプログラム | |
JP6994289B2 (ja) | キャラクタ属性に応じた対話シナリオを作成するプログラム、装置及び方法 | |
JP2009042968A (ja) | 情報選別システム、情報選別方法及び情報選別用プログラム | |
Bechet et al. | Adapting dependency parsing to spontaneous speech for open domain spoken language understanding | |
US20220392434A1 (en) | Reducing biases of generative language models | |
Dutrey et al. | A CRF-based approach to automatic disfluency detection in a French call-centre corpus. | |
JP2011123565A (ja) | Faq候補抽出システムおよびfaq候補抽出プログラム | |
JP5495968B2 (ja) | 談話構造解析システムおよび談話構造解析プログラム | |
CN109618067A (zh) | 外呼对话处理方法和系统 | |
JP5341732B2 (ja) | 談話要約生成システムおよび談話要約生成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130312 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140624 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140701 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5574842 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |