JP2020071690A - パターン認識モデル及びパターン学習装置、その生成方法、それを用いたfaqの抽出方法及びパターン認識装置、並びにプログラム - Google Patents
パターン認識モデル及びパターン学習装置、その生成方法、それを用いたfaqの抽出方法及びパターン認識装置、並びにプログラム Download PDFInfo
- Publication number
- JP2020071690A JP2020071690A JP2018205526A JP2018205526A JP2020071690A JP 2020071690 A JP2020071690 A JP 2020071690A JP 2018205526 A JP2018205526 A JP 2018205526A JP 2018205526 A JP2018205526 A JP 2018205526A JP 2020071690 A JP2020071690 A JP 2020071690A
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- log
- candidate
- pattern recognition
- questioner
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003909 pattern recognition Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims description 17
- 238000000605 extraction Methods 0.000 title description 7
- 238000004458 analytical method Methods 0.000 claims abstract description 18
- 230000000877 morphologic effect Effects 0.000 claims abstract description 17
- 230000002093 peripheral effect Effects 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims 1
- 239000000284 extract Substances 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 description 6
- 238000013075 data extraction Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
当該発話あたりの形態素数である発話長と、
当該発話の前後で共通する単語の出現回数である共通キーワード出現回数と、
当該発話あたりの周辺キーワードの重要度の総和であるキーワード重要度総和と、
当該発話の後方1以上5以下の発話内に存在する間投詞の数である間投詞数と、
の素性のうち少なくとも1つを含む素性値を、レコードごとの入力とし、
かつ、前記質問者による質問に相当するQ候補、又は前記回答者による回答に相当するA候補であるか否かを示す候補ラベルを出力として、
分類器を教師あり学習によりトレーニングしたパターン認識モデルにより、上記の課題を解決したのである。
質問者と回答者との一連の通話をテキストとした対話ログであって、
一連のテキスト部分は形態素解析されており、
一連の通話を構成する個々の発話であるレコードごとに、
前記質問者と前記回答者とのいずれの発話であるかを示す発話者区分と、
当該発話あたりの形態素数である発話長と、
前記質問者による質問に相当するQ候補、又は前記回答者による回答に相当するA候補であるか否かを示す候補ラベルと、
当該発話とその前後の発話との間における、共通の単語の出現回数である共通キーワード出現回数と、
前記通話中に複数回出現する名詞である中心キーワードと同じ発話内に出現する名詞である周辺キーワードに対して、下記式(1)からなるキーワード重要度の総和であるキーワード重要度総和と、
当該発話の後方1以上5以下の発話内に存在する間投詞の数である間投詞数と、
を有する、構造有対話ログを用いることができる。
・キーワード重要度=(前記中心キーワードと前記周辺キーワードとが共に出現した発話数)/(中心キーワードが出現した発話数) (1)
前記発話長と、
前記共通キーワード出現回数と、
前記キーワード重要度総和と、
前記間投詞数と、
の少なくとも一つを計算し、一連の通話を構成する個々の発話であるレコードごとに設定するステップを実行する形態が選択できる。
12 入出力部
13 データ加工部
14 記憶部
15 データ抽出部
16 解析部
21 パターン認識装置
Claims (12)
- 質問者と回答者との一連の通話をテキストとした対話ログを形態素解析したものについて、一連の通話を構成する個々の発話であるレコードごとに算出される、
当該発話あたりの形態素数である発話長と、
当該発話の前後で共通する単語の出現回数である共通キーワード出現回数と、
当該発話あたりの周辺キーワードの重要度の総和であるキーワード重要度総和と、
当該発話の後方1以上5以下の発話内に存在する間投詞の数である間投詞数と、
の素性のうち少なくとも1つを含む素性値を、レコードごとの入力とし、
かつ、前記質問者による質問に相当するQ候補、又は前記回答者による回答に相当するA候補であるか否かを示す候補ラベルを出力として、
分類器を教師あり学習によりトレーニングしたパターン認識モデル。 - 前記教師あり学習を、話者が質問者である発話部分のみを抜き出した質問者ログのレコード、又は話者が回答者である発話部分のみを抜き出した回答者ログのレコードのいずれかのみについて行った、請求項1に記載のパターン認識モデル。
- 質問者と回答者との一連の通話をテキストとした対話ログを形態素解析したものについて、一連の通話を構成する個々の発話であるレコードごとに、
当該発話あたりの形態素数である発話長と、
当該発話の前後で共通する単語の出現回数である共通キーワード出現回数と、
当該発話あたりの周辺キーワードの重要度の総和であるキーワード重要度総和と、
当該発話の後方1以上5以下の発話内に存在する間投詞の数である間投詞数と、
の素性のうち少なくとも1つを含む素性値を算出するステップ、
前記素性値を入力とし、前記質問者による質問に相当するQ候補、又は前記回答者による回答に相当するA候補であるか否かを示す候補ラベルを出力として、教師あり学習によりパターン認識モデルをトレーニングするステップ、
を実行するパターン認識モデルの生成方法。 - 前記教師あり学習は、話者が質問者である発話部分のみを抜き出した質問者ログ、又は話者が回答者である発話部分のみを抜き出した回答者ログのいずれかについて行う、請求項3に記載のパターン認識モデルの生成方法。
- 請求項1又は2に記載のパターン認識モデルを用いて、
認識対象とする前記対話ログについて、前記Q候補又は前記A候補となるレコードを判定する、
FAQの抽出方法。 - 前記パターン認識モデルが、前記質問者ログと前記回答者ログのいずれかについて生成したものであり、
認識対象とする前記対話ログは、それぞれのレコードの前記素性値について算出した後、前記質問者ログ、又は前記回答者ログを抽出して、対応する前記パターン認識モデルによって判定させる、
請求項5に記載のFAQの抽出方法。 - 質問者と回答者との一連の通話をテキストとした対話ログを形態素解析し、一連の通話を構成する個々の発話であるレコードごとに、
当該発話あたりの形態素数である発話長と、
当該発話の前後で共通する単語の出現回数である共通キーワード出現回数と、
当該発話あたりの周辺キーワードの重要度の総和であるキーワード重要度総和と、
当該発話の後方1以上5以下の発話内に存在する間投詞の数である間投詞数と、
の素性のうち少なくとも1つを含む素性値を算出する素性値算出手段と、
前記素性値を入力とし、前記質問者による質問に相当するQ候補、又は前記回答者による回答に相当するA候補であるか否かを示す候補ラベルを出力として、教師あり学習によりパターン認識モデルをトレーニングするパターン学習手段と、
を有するパターン学習装置。 - 前記パターン学習手段は、話者が質問者である発話部分のみを抜き出した質問者ログ、又は話者が回答者である発話部分のみを抜き出した回答者ログのいずれかについて行う、請求項7に記載のパターン学習装置。
- 請求項1又は2に記載のパターン認識モデルを用いて、認識対象とする前記対話ログについて、前記Q候補又は前記A候補となるレコードを判定する、パターン認識装置。
- 請求項7もしくは請求項8に記載のパターン学習装置又は請求項9に記載のパターン認識装置としてコンピュータを機能させるためのプログラム。
- 質問者と回答者との一連の通話をテキストとした対話ログであって、
一連のテキスト部分は形態素解析されており、
一連の通話を構成する個々の発話であるレコードごとに、
前記質問者と前記回答者とのいずれの発話であるかを示す発話者区分と、
当該発話あたりの形態素数である発話長と、
前記質問者による質問に相当するQ候補、又は前記回答者による回答に相当するA候補であるか否かを示す候補ラベルと、
当該発話とその前後の発話との間における、共通の単語の出現回数である共通キーワード出現回数と、
前記通話中に複数回出現する名詞である中心キーワードと同じ発話内に出現する名詞である周辺キーワードに対して、下記式(1)からなるキーワード重要度の総和であるキーワード重要度総和と、
当該発話の後方1以上5以下の発話内に存在する間投詞の数である間投詞数と、
を有する、構造有対話ログ。
・キーワード重要度=(前記中心キーワードと前記周辺キーワードとが共に出現した発話数)/(中心キーワードが出現した発話数) (1) - 前記対話ログに対して、
テキスト部分を形態素解析するステップの後に、
前記発話長と、
前記共通キーワード出現回数と、
前記キーワード重要度総和と、
前記間投詞数と、
の少なくとも1つを計算し、一連の通話を構成する個々の発話であるレコードごとに設定するステップを実行する、
請求項11に記載の構造有対話ログを作成する対話ログ作成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018205526A JP6743108B2 (ja) | 2018-10-31 | 2018-10-31 | パターン認識モデル及びパターン学習装置、その生成方法、それを用いたfaqの抽出方法及びパターン認識装置、並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018205526A JP6743108B2 (ja) | 2018-10-31 | 2018-10-31 | パターン認識モデル及びパターン学習装置、その生成方法、それを用いたfaqの抽出方法及びパターン認識装置、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020071690A true JP2020071690A (ja) | 2020-05-07 |
JP6743108B2 JP6743108B2 (ja) | 2020-08-19 |
Family
ID=70549548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018205526A Active JP6743108B2 (ja) | 2018-10-31 | 2018-10-31 | パターン認識モデル及びパターン学習装置、その生成方法、それを用いたfaqの抽出方法及びパターン認識装置、並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6743108B2 (ja) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001134575A (ja) * | 1999-10-29 | 2001-05-18 | Internatl Business Mach Corp <Ibm> | 頻出パターン検出方法およびシステム |
JP2008250409A (ja) * | 2007-03-29 | 2008-10-16 | Nec Corp | 典型文分析装置、その方法及びそのプログラム |
JP2013050896A (ja) * | 2011-08-31 | 2013-03-14 | Toshiba Corp | Faq作成支援システム及びプログラム |
JP2013109635A (ja) * | 2011-11-22 | 2013-06-06 | Nippon Telegr & Teleph Corp <Ntt> | 単語重要度算出装置とその方法とプログラム |
JP2013167765A (ja) * | 2012-02-15 | 2013-08-29 | Nippon Telegr & Teleph Corp <Ntt> | 知識量推定情報生成装置、知識量推定装置、方法、及びプログラム |
JPWO2012070228A1 (ja) * | 2010-11-22 | 2014-05-19 | 日本電気株式会社 | 対話テキスト解析装置、方法およびプログラム |
JP2018025747A (ja) * | 2016-08-09 | 2018-02-15 | パナソニックIpマネジメント株式会社 | 対話行為推定方法、対話行為推定装置およびプログラム |
JPWO2016199464A1 (ja) * | 2015-06-12 | 2018-04-05 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
-
2018
- 2018-10-31 JP JP2018205526A patent/JP6743108B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001134575A (ja) * | 1999-10-29 | 2001-05-18 | Internatl Business Mach Corp <Ibm> | 頻出パターン検出方法およびシステム |
JP2008250409A (ja) * | 2007-03-29 | 2008-10-16 | Nec Corp | 典型文分析装置、その方法及びそのプログラム |
JPWO2012070228A1 (ja) * | 2010-11-22 | 2014-05-19 | 日本電気株式会社 | 対話テキスト解析装置、方法およびプログラム |
JP2013050896A (ja) * | 2011-08-31 | 2013-03-14 | Toshiba Corp | Faq作成支援システム及びプログラム |
JP2013109635A (ja) * | 2011-11-22 | 2013-06-06 | Nippon Telegr & Teleph Corp <Ntt> | 単語重要度算出装置とその方法とプログラム |
JP2013167765A (ja) * | 2012-02-15 | 2013-08-29 | Nippon Telegr & Teleph Corp <Ntt> | 知識量推定情報生成装置、知識量推定装置、方法、及びプログラム |
JPWO2016199464A1 (ja) * | 2015-06-12 | 2018-04-05 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP2018025747A (ja) * | 2016-08-09 | 2018-02-15 | パナソニックIpマネジメント株式会社 | 対話行為推定方法、対話行為推定装置およびプログラム |
Non-Patent Citations (2)
Title |
---|
横山 貴彦,嶋田 和孝,遠藤 勉: ""複数人談話における言語情報と非言語情報を利用した盛り上がり判定"", 言語処理学会 第18回年次大会 発表論文集, JPN6019029469, 13 March 2012 (2012-03-13), JP, pages 291 - 294, ISSN: 0004208766 * |
稲葉 通将,鳥海 不二夫,石井 健一郎: ""語の共起情報を用いた対話における盛り上がりの自動判定"", 電子情報通信学会論文誌, vol. 94, no. 1, JPN6019029471, 1 January 2011 (2011-01-01), JP, pages 59 - 67, ISSN: 0004208767 * |
Also Published As
Publication number | Publication date |
---|---|
JP6743108B2 (ja) | 2020-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110765244B (zh) | 获取应答话术的方法、装置、计算机设备及存储介质 | |
US11663411B2 (en) | Ontology expansion using entity-association rules and abstract relations | |
US10679134B2 (en) | Automated ontology development | |
US10936664B2 (en) | Dialogue system and computer program therefor | |
Wu et al. | Emotion recognition from text using semantic labels and separable mixture models | |
US8412530B2 (en) | Method and apparatus for detection of sentiment in automated transcriptions | |
Mariooryad et al. | Building a naturalistic emotional speech corpus by retrieving expressive behaviors from existing speech corpora | |
EP3405912A1 (en) | Analyzing textual data | |
EP1901283A2 (en) | Automatic generation of statistical laguage models for interactive voice response applacation | |
Mairesse et al. | Can prosody inform sentiment analysis? experiments on short spoken reviews | |
KR102041621B1 (ko) | 인공지능 음성인식 기반 기계학습의 대규모 말뭉치 구축을 위한 대화형 말뭉치 분석 서비스 제공 시스템 및 구축 방법 | |
AU2011274318A1 (en) | System and method of providing a computer-generated response | |
Kaushik et al. | Automatic sentiment detection in naturalistic audio | |
US10255346B2 (en) | Tagging relations with N-best | |
CN111177350A (zh) | 智能语音机器人的话术形成方法、装置和系统 | |
CN111538828A (zh) | 文本情感分析方法、装置、计算机装置及可读存储介质 | |
Kopparapu | Non-linguistic analysis of call center conversations | |
de Velasco et al. | Emotion Detection from Speech and Text. | |
Zhou et al. | Predicting meeting success with nuanced emotions | |
KR20210051523A (ko) | 도메인 자동 분류 대화 시스템 | |
Jia et al. | A deep learning system for sentiment analysis of service calls | |
Trivedi | Fundamentals of Natural Language Processing | |
JP6743108B2 (ja) | パターン認識モデル及びパターン学習装置、その生成方法、それを用いたfaqの抽出方法及びパターン認識装置、並びにプログラム | |
JP2011123565A (ja) | Faq候補抽出システムおよびfaq候補抽出プログラム | |
Khasanova et al. | Developing a production system for Purpose of Call detection in business phone conversations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190924 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200403 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200728 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200729 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6743108 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |