JP2022047291A - 情報処理装置、方法、及びプログラム - Google Patents
情報処理装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2022047291A JP2022047291A JP2020153113A JP2020153113A JP2022047291A JP 2022047291 A JP2022047291 A JP 2022047291A JP 2020153113 A JP2020153113 A JP 2020153113A JP 2020153113 A JP2020153113 A JP 2020153113A JP 2022047291 A JP2022047291 A JP 2022047291A
- Authority
- JP
- Japan
- Prior art keywords
- keywords
- dialogue
- keyword
- faq
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title description 21
- 230000004044 response Effects 0.000 claims abstract description 51
- 238000003672 processing method Methods 0.000 claims abstract 2
- 238000012937 correction Methods 0.000 claims description 33
- 230000002776 aggregation Effects 0.000 claims description 9
- 238000004220 aggregation Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 description 40
- 230000008569 process Effects 0.000 description 14
- 238000012790 confirmation Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Abstract
Description
第1の実施形態に係る情報処理装置の構成例を、図1を参照して説明する。
情報処理装置1は、各構成部(処理回路11、メモリ12、表示装置13、入力インタフェース14、通信インタフェース15)を含む。情報処理装置1は、ハードウェア又はソフトウェアの態様で実装される。各構成部は、バスを通じて互いに通信可能に接続される。なお、各構成部は個々のハードウェアにより実装されなくともよい。例えば、各構成部のうち少なくとも2つが1つのハードウェアにより実装されてもよい。
集計部113は、対話データに基づき、複数のキーワードのそれぞれが対話の中で使用された頻度を集計した集計データを生成する。
出力部114は、集計データを出力する。
FAQ集120は、複数のFAQ(質問回答ペアとも呼ぶ)120a~120Kを含むデータベースである。FAQ120a~120Kにはそれぞれ、お互いのFAQを区別するためのID121a~121K、質問122a~122K、質問に対する回答123a~123K、及び質問に含まれるキーワード124a~124Kが対応付けられている。なお、キーワード124a~124Kは、FAQ120a~120Kと対応付けられている限り、FAQ集120の内部のみならず、FAQ集120の外部に格納されてもよい。例えば、キーワード124a~124Kは、情報処理装置1の内部や外部記憶装置に存在する、メモリ12の記憶領域に格納されてもよい。
ステップS201において、疑似対話生成部111は、処理キーワードを起点とした対話パスを開始する。対話パスは、発話と、当該発話に対する応答とを1ターンとしたやり取りを複数ターン繰り返すことで生じた対話の流れであり、応答にキーワードの例示が含まれる場合は、例示されたキーワード(例示キーワードとも呼ぶ)の数に応じて複数の枝に分岐し、最終的に1つのFAQに到達した時点で終了する。すなわち、対話パスは、処理キーワードを起点とし、例示されたキーワードを中継点とし、特定のFAQを終点とする一連の対話である。ステップS201が実行される時点(1ターン目)では、対話パスに処理キーワードが起点として追加される。
図5は、図2に示すFAQ集120に基づいて生成された疑似対話データ130a~130Mの一例である。なお、FAQ集120において、キーワード「預金口座」はFAQ120a、120b、120cの3件に含まれ、キーワード「残高確認」はFAQ120aの1件に含まれるものとする。
図6は、図5に示す疑似対話データ130a~130Mを集計して得られた集計データの一例である。集計データは、表示装置13上に表示される。
第2の実施形態に係る情報処理装置の構成例を、図7を参照して説明する。
第2の実施形態では、第1の実施形態に係る情報処理装置1の構成に加えて、処理回路11に編集部115、類義語決定部116を有する。
類義語決定部116は、編集されたFAQに紐づく1以上のキーワードである編集後キーワードについて、FAQ集に含まれる複数のキーワードのうち、編集後キーワードに類似する1以上の類似キーワードを抽出し、かつ類似キーワードのうち、集計データにおいて使用された頻度が編集後キーワードの使用された頻度よりも多い類似キーワードを修正候補キーワードとして抽出し、かつ編集後キーワードの使用頻度、及び修正候補キーワードの使用頻度を修正提案情報として生成する。
ステップS301において、編集部115は、ユーザからのFAQ集120に対する編集操作に応じて、メモリ12に格納されるFAQ集120を編集する。編集操作は、例えば新しいFAQの追加、既存のFAQの変更や削除を含む。なお、編集部115は、ユーザからの複数のFAQに対する同一又は異なる編集操作に応じて、一度にFAQ集120を編集してもよい。本実施形態において、1つのFAQに対して編集操作が行われたものとし、当該編集されたFAQをFAQ120Sとする。
修正提案情報200は、FAQ集120に新しいK+1個目のFAQ120K+1を追加した時の修正提案情報の一例である。修正提案情報200において、FAQ120K+1に対応付けられたID「K+1」、質問「預金口座の作り方を教えて」、回答「預金口座の新規開設手続きは、電話、郵送、ウェブから・・・」、キーワード「預金口座、作り方」が表示されている。
第3の実施形態に係る情報処理装置の構成例を、図10を参照して説明する。
第3の実施形態では、第2の実施形態に係る情報処理装置1の構成に加えて、処理回路11に更新部117を有する。
なお、ステップS401~ステップS406は、ステップS301~ステップS306と同様である。
Claims (10)
- 質問と、前記質問に対する回答と、前記質問から抽出された1つ以上のキーワードとを含むFAQを複数格納するFAQ集において、
前記FAQ集に含まれる複数のキーワードのそれぞれを発話文として生成し、前記発話文を用いて前記FAQ集を検索した結果に基づいて、前記発話文に対する応答文を生成することで得られる1回の対話を前記複数のキーワードのそれぞれについて1回以上行い、1回以上の対話に関する対話データを前記複数のキーワードのそれぞれについて生成する生成部と、
前記対話データに基づき、前記複数のキーワードのそれぞれが対話の中で使用された頻度を集計した集計データを生成する集計部と、
を具備する情報処理装置。 - 前記生成部は、
1回目の対話において、前記FAQ集に含まれる複数のキーワードのうち1つを処理対象となる第1のキーワードとして抽出し、かつ
前記第1のキーワードを含む第1の発話文を生成する疑似対話生成部と、
前記第1の発話文に含まれる前記第1のキーワードを用いて前記FAQ集を検索することで、前記FAQ集のうち前記第1のキーワードを含む1件以上のFAQを第1の検索結果として抽出し、かつ
前記第1の検索結果が1件である場合、前記第1のキーワードを起点とし、前記抽出した1件のFAQを終点とする前記対話データを生成する応答生成部と、
を具備する請求項1に記載の情報処理装置。 - 前記応答生成部は、
前記第1の検索結果が複数件である場合、前記抽出した複数件のFAQに含まれる複数のキーワードのうち、前記第1のキーワード以外の複数の第2のキーワードを含む第1の応答文を生成する、
請求項2に記載の情報処理装置。 - 前記疑似対話生成部は、
N(Nは2以上の自然数)回目の対話において、第N-1の応答文に含まれる複数の第Nのキーワードのうち、1つの第Nのキーワードを選択し、かつ
前記第1のキーワードと、N-1回目の対話までに得られたN-1個の応答文からそれぞれ選択した、前記第Nのキーワードを含むN-1個のキーワードとを含む第Nの発話文を生成し、
前記応答生成部は、
前記第Nの発話文に含まれる、前記第1のキーワード及び前記選択したN-1個のキーワードを用いて前記FAQ集を検索することで、前記第1のキーワード及び前記選択したN-1個のキーワードを含む1件以上のFAQを第Nの検索結果として抽出し、
前記第Nの検索結果が1件である場合、前記第1のキーワードを起点とし、前記選択したN-1個のキーワードを中継点とし、前記抽出した1件のFAQを終点とする前記対話データを生成する、
請求項2又は請求項3に記載の情報処理装置。 - 前記応答生成部は、
前記第Nの検索結果が複数件である場合、前記抽出した複数件のFAQに含まれる複数のキーワードのうち、前記第1のキーワード及び前記選択したN-1個のキーワード以外の複数の第N+1のキーワードを含む第Nの応答文を生成する、
請求項4に記載の情報処理装置。 - 前記FAQ集のうち1以上のFAQを編集する編集部と、
前記編集されたFAQに紐づく1以上のキーワードである編集後キーワードについて、前記FAQ集に含まれる複数のキーワードのうち、前記編集後キーワードに類似する1以上の類似キーワードを抽出し、かつ
前記類似キーワードのうち、前記集計データにおいて使用された頻度が前記編集後キーワードの使用された頻度よりも多い前記類似キーワードを修正候補キーワードとして抽出し、かつ
前記編集後キーワードの使用頻度、及び前記修正候補キーワードの使用頻度を修正提案情報として生成する類義語決定部と、
をさらに具備する請求項1から請求項5のいずれか1項に記載の情報処理装置。 - 前記修正提案情報は、前記編集されたFAQに関する情報をさらに含む、
請求項6に記載の情報処理装置。 - 前記修正提案情報に基づいて、前記FAQ集を更新する更新部と、
をさらに具備する請求項6又は請求項7に記載の情報処理装置。 - 質問と、前記質問に対する回答と、前記質問から抽出された1つ以上のキーワードとを含むFAQを複数格納するFAQ集において、
前記FAQ集に含まれる複数のキーワードのそれぞれを発話文として生成し、前記発話文を用いて前記FAQ集を検索した結果に基づいて、前記発話文に対する応答文を生成することで得られる1回の対話を前記複数のキーワードのそれぞれについて1回以上行い、1回以上の対話に関する対話データを前記複数のキーワードのそれぞれについて生成し、
前記対話データに基づき、前記複数のキーワードのそれぞれが対話の中で使用された頻度を集計した集計データを生成する、情報処理方法。 - コンピュータに、
質問と、前記質問に対する回答と、前記質問から抽出された1つ以上のキーワードとを含むFAQを複数格納するFAQ集において、
前記FAQ集に含まれる複数のキーワードのそれぞれを発話文として生成し、前記発話文を用いて前記FAQ集を検索した結果に基づいて、前記発話文に対する応答文を生成することで得られる1回の対話を前記複数のキーワードのそれぞれについて1回以上行い、1回以上の対話に関する対話データを前記複数のキーワードのそれぞれについて生成する生成機能と、
前記対話データに基づき、前記複数のキーワードのそれぞれが対話の中で使用された頻度を集計した集計データを生成する集計機能と、
を実現させる情報処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020153113A JP2022047291A (ja) | 2020-09-11 | 2020-09-11 | 情報処理装置、方法、及びプログラム |
CN202110219897.7A CN114168718A (zh) | 2020-09-11 | 2021-02-26 | 信息处理装置、方法和信息记录介质 |
US17/186,827 US11531693B2 (en) | 2020-09-11 | 2021-02-26 | Information processing apparatus, method and non-transitory computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020153113A JP2022047291A (ja) | 2020-09-11 | 2020-09-11 | 情報処理装置、方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022047291A true JP2022047291A (ja) | 2022-03-24 |
Family
ID=80476262
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020153113A Pending JP2022047291A (ja) | 2020-09-11 | 2020-09-11 | 情報処理装置、方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11531693B2 (ja) |
JP (1) | JP2022047291A (ja) |
CN (1) | CN114168718A (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11893385B2 (en) | 2021-02-17 | 2024-02-06 | Open Weaver Inc. | Methods and systems for automated software natural language documentation |
US11947530B2 (en) | 2021-02-24 | 2024-04-02 | Open Weaver Inc. | Methods and systems to automatically generate search queries from software documents to validate software component search engines |
US11960492B2 (en) | 2021-02-24 | 2024-04-16 | Open Weaver Inc. | Methods and systems for display of search item scores and related information for easier search result selection |
US20220269503A1 (en) * | 2021-02-24 | 2022-08-25 | Open Weaver Inc. | Methods and systems for auto creation of software component reference guide from multiple information sources |
US11921763B2 (en) | 2021-02-24 | 2024-03-05 | Open Weaver Inc. | Methods and systems to parse a software component search query to enable multi entity search |
JP7287412B2 (ja) * | 2021-03-24 | 2023-06-06 | カシオ計算機株式会社 | 情報処理装置、情報処理方法及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11126920B2 (en) | 2017-05-12 | 2021-09-21 | Fujitsu Limited | Interaction scenario display control method and information processing apparatus |
US11429650B2 (en) * | 2018-09-21 | 2022-08-30 | Servicenow, Inc. | Parsing of user queries in a remote network management platform using linguistic matching |
JP7132090B2 (ja) | 2018-11-07 | 2022-09-06 | 株式会社東芝 | 対話システム、対話装置、対話方法、及びプログラム |
JP7059213B2 (ja) | 2019-01-30 | 2022-04-25 | 株式会社東芝 | 表示制御システム、プログラム、及び記憶媒体 |
JP2020123131A (ja) | 2019-01-30 | 2020-08-13 | 株式会社東芝 | 対話システム、対話方法、プログラム、及び記憶媒体 |
-
2020
- 2020-09-11 JP JP2020153113A patent/JP2022047291A/ja active Pending
-
2021
- 2021-02-26 US US17/186,827 patent/US11531693B2/en active Active
- 2021-02-26 CN CN202110219897.7A patent/CN114168718A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220083577A1 (en) | 2022-03-17 |
CN114168718A (zh) | 2022-03-11 |
US11531693B2 (en) | 2022-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022047291A (ja) | 情報処理装置、方法、及びプログラム | |
US11816438B2 (en) | Context saliency-based deictic parser for natural language processing | |
TWI684881B (zh) | 基於機器翻譯的自動生成重述以產生一對話式代理人的方法、系統及非暫態機器可讀取媒體 | |
US20190163691A1 (en) | Intent Based Dynamic Generation of Personalized Content from Dynamic Sources | |
JP5620349B2 (ja) | 対話装置、対話方法および対話プログラム | |
KR20100015958A (ko) | 멀티모드 다국어 입력기 | |
JP2015094848A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
KR20210061141A (ko) | 자연어 처리 방법 및 장치 | |
US11586689B2 (en) | Electronic apparatus and controlling method thereof | |
CN110688450B (zh) | 一种基于蒙特卡洛树搜索的关键词生成方法、基于强化学习的关键词生成模型及电子设备 | |
US11238050B2 (en) | Method and apparatus for determining response for user input data, and medium | |
JP6663826B2 (ja) | 計算機及び応答の生成方法 | |
JP2018045537A (ja) | 検索プログラム、検索装置および検索方法 | |
JP2017204018A (ja) | 検索処理方法、検索処理プログラムおよび情報処理装置 | |
JP2003196280A (ja) | テキスト生成方法及びテキスト生成装置 | |
JP7091146B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN111259262A (zh) | 一种信息检索方法、装置、设备及介质 | |
CN113157727A (zh) | 提供召回结果的方法、设备和存储介质 | |
CN110619112B (zh) | 用于汉字的读音标注方法、装置、电子设备及存储介质 | |
JP4361299B2 (ja) | 評価表現抽出装置、プログラム、及び記憶媒体 | |
US20230140480A1 (en) | Utterance generation apparatus, utterance generation method, and program | |
CN112905752A (zh) | 一种智能交互方法、装置、设备以及存储介质 | |
CN113064982A (zh) | 一种问答库生成方法及相关设备 | |
JP4576977B2 (ja) | 情報処理装置および方法、並びにプログラム | |
JP5302784B2 (ja) | 機械翻訳方法、及びシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220826 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20230105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230711 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230913 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240308 |