JP5213098B2 - 質問応答方法及びシステム - Google Patents
質問応答方法及びシステム Download PDFInfo
- Publication number
- JP5213098B2 JP5213098B2 JP2007165692A JP2007165692A JP5213098B2 JP 5213098 B2 JP5213098 B2 JP 5213098B2 JP 2007165692 A JP2007165692 A JP 2007165692A JP 2007165692 A JP2007165692 A JP 2007165692A JP 5213098 B2 JP5213098 B2 JP 5213098B2
- Authority
- JP
- Japan
- Prior art keywords
- question sentence
- question
- answer
- training data
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Jun Suzuki,Yutaka Sasaki,Eisaku Maeda.SVM Answer Selection for Open-Domain Question Answering,In Proc.of Coling-2002,pp974〜980(2002).
ISF(wj,Ci)=(N(wj,Ci)+0.5)/(N(wj)+0.5)
ここで、N(wj)は、単語wjが含まれているウェブページのスニペットの総数、N(wj,Ci)は、単語wjが含まれているクラスタCiにおけるスニペットの数、
を特徴とする。
ISF(wj,Ci)=(N(wj,Ci)+0.5)/(N(wj)+0.5)
ここで、N(wj)は、単語wjが含まれているウェブページのスニペットの総数、N(wj,Ci)は、単語wjが含まれているクラスタCiにおけるスニペットの数
を特徴とする。
ISF(wj,Ci)=(N(wj,Ci)+0.5)/(N(wj)+0.5)
ここで、N(wj)は、単語wjが含まれているウェブページのスニペットの総数、N(wj,Ci)は、単語wjが含まれているクラスタCiにおけるスニペットの数
を特徴とする。
ISF(wj,Ci)=(N(wj,Ci)+0.5)/(N(wj)+0.5)
ここで、N(wj)は、単語wjが含まれているウェブページのスニペットの総数、N(wj,Ci)は、単語wjが含まれているクラスタCiにおけるスニペットの数である。
11 ユーザ端末装置
12 通信網
13 ウェブサーバ
14 制御装置
Claims (8)
- ユーザから入力された質問文を構成する単語から、キーワードと、質問の種別を規定するアンサータイプとを特定する質問文解析ステップと、
上記質問文解析ステップにおいて抽出したキーワードを検索クエリーとし、当該キーワードに関連するウェブページを検索する検索ステップと、
上記検索ステップにおいて検索した各ウェブページから、上記アンサータイプに基づいて解答候補を順次抽出する解答候補抽出ステップと、
上記解答候補抽出ステップにおいて抽出した各解答候補に基づいて、候補選択スニペットをクラスタに割り当て、これをトレーニングデータとする、クラスタリングステップと、
上記トレーニングデータを解析することにより上記クラスタを分類し、更に上記トレーニングデータの解析と同一解析条件の下で上記質問文を解析し、当該質問文の解析結果と最も類似するクラスタを順に抽出し、これを応答として出力する分類ステップとを有し、
上記分類ステップは、上記トレーニングデータと上記質問文との単語重複度を示すSBFS(similarity-based feature set)、上記トレーニングデータと上記質問文とのブーリアン重複度を示すBMFS(Boolean match-based feature set)、上記トレーニングデータを構成する解答候補の前後を構成する文字を含めた文字列と上記質問文との類似度を示すWWFS(window-based word feature set)に基づいて、当該質問文の解析結果と最も類似するクラスタを順に抽出し、
上記SBFSは、上記キーワードのbi-gramの一致度に基づくものであり、
上記BMFSは、解答候補が質問文のbi-gramと一致したbi-gramを有するか否かに基づくものであり、
上記WWFSは、以下のISF値により重み付けされていること
ISF(wj,Ci)=(N(wj,Ci)+0.5)/(N(wj)+0.5)
ここで、N(wj)は、単語wjが含まれているウェブページのスニペットの総数、N(wj,Ci)は、単語wjが含まれているクラスタCiにおけるスニペットの数
を特徴とする質問応答方法。 - 上記分類ステップは、SVM(Support Vector Machine)を利用することにより、質問文の解析結果と最も類似するクラスタを順に抽出すること
を特徴とする請求項1記載の質問応答方法。 - ユーザから入力された質問文を構成する単語から、キーワードと、質問の種別を規定するアンサータイプとを特定する質問文解析手段と、
上記質問文解析手段により抽出されたキーワードを検索クエリーとし、当該キーワードに関連するウェブページを検索する検索手段と、
上記検索ステップにより検索された各ウェブページから、上記アンサータイプに基づいて解答候補を順次抽出する解答候補抽出手段と、
上記解答候補抽出手段により抽出された各解答候補に基づいて、候補選択スニペットをクラスタに割り当て、これをトレーニングデータとする、クラスタリング手段と、
上記トレーニングデータを解析することにより上記クラスタを分類し、更に上記トレーニングデータの解析と同一解析条件の下で上記質問文を解析し、当該質問文の解析結果と最も類似するクラスタを順に抽出し、これを応答として出力する分類手段とを備え、
上記分類手段は、上記トレーニングデータと上記質問文との単語重複度を示すSBFS(similarity-based feature set)、上記トレーニングデータと上記質問文とのブーリアン重複度を示すBMFS(Boolean match-based feature set)、上記トレーニングデータを構成する解答候補の前後を構成する文字を含めた文字列と上記質問文との類似度を示すWWFS(window-based word feature set)に基づいて、当該質問文の解析結果と最も類似するクラスタを順に抽出し、
上記分類手段は、上記SBFSを、上記キーワードのbi-gramの一致度に基づくものとし、
上記BMFSを、解答候補が質問文のbi-gramと一致したbi-gramを有するか否かに基づくものとし、
上記WWFSを、以下のISF値により重み付けすること
ISF(wj,Ci)=(N(wj,Ci)+0.5)/(N(wj)+0.5)
ここで、N(wj)は、単語wjが含まれているウェブページのスニペットの総数、N(wj,Ci)は、単語wjが含まれているクラスタCiにおけるスニペットの数
を特徴とする質問応答システム。 - 上記分類手段は、SVM(Support Vector Machine)を利用することにより、質問文の解析結果と最も類似するクラスタを順に抽出すること
を特徴とする請求項3記載の質問応答システム。 - 上記質問文解析手段と、上記検索手段と、上記解答候補抽出手段と、上記クラスタリング手段と、上記分類手段とを備える制御装置と、当該制御装置に対して通信網を介して情報を送受信可能な複数のユーザ用端末装置とを備え、
上記ユーザ用端末装置は、ユーザからの上記質問文の入力を受け付け、これを通信網を介して上記制御装置における上記質問文解析手段へと送信するとともに、当該制御装置における上記分類手段から出力される上記応答を上記通信網を介して受信し、これをユーザに表示すること
を特徴とする請求項3又は4記載の質問応答システム。 - ユーザから入力された質問文を構成する単語から、キーワードと、質問の種別を規定するアンサータイプとを特定する質問文解析ステップと、
上記質問文解析ステップにおいて抽出したキーワードを検索クエリーとし、当該キーワードに関連するウェブページを検索する検索ステップと、
上記検索ステップにおいて検索した各ウェブページから、上記アンサータイプに基づいて解答候補を順次抽出する解答候補抽出ステップと、
上記解答候補抽出ステップにおいて抽出した各解答候補に基づいて、候補選択スニペットをクラスタに割り当て、これをトレーニングデータとする、クラスタリングステップと、
上記トレーニングデータを解析することにより上記クラスタを分類し、更に上記トレーニングデータの解析と同一解析条件の下で上記質問文を解析し、当該質問文の解析結果と最も類似するクラスタを順に抽出し、これを応答として出力する分類ステップとをコンピュータに実行させ、
上記分類ステップは、上記トレーニングデータと上記質問文との単語重複度を示すSBFS(similarity-based feature set)、上記トレーニングデータと上記質問文とのブーリアン重複度を示すBMFS(Boolean match-based feature set)、上記トレーニングデータを構成する解答候補の前後を構成する文字を含めた文字列と上記質問文との類似度を示すWWFS(window-based word feature set)に基づいて、当該質問文の解析結果と最も類似するクラスタを順に抽出し、
上記SBFSは、上記キーワードのbi-gramの一致度に基づくものであり、
上記BMFSは、解答候補が質問文のbi-gramと一致したbi-gramを有するか否かに基づくものであり、
上記WWFSは、以下のISF値により重み付けされていること
ISF(wj,Ci)=(N(wj,Ci)+0.5)/(N(wj)+0.5)
ここで、N(wj)は、単語wjが含まれているウェブページのスニペットの総数、N(wj,Ci)は、単語wjが含まれているクラスタCiにおけるスニペットの数
を特徴とするプログラム。 - 上記分類ステップは、SVM(Support Vector Machine)を利用することにより、質問文の解析結果と最も類似するクラスタを順に抽出すること
を特徴とする請求項6記載のプログラム。 - 請求項7項記載のプログラムが記録されていることを特徴とする記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007165692A JP5213098B2 (ja) | 2007-06-22 | 2007-06-22 | 質問応答方法及びシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007165692A JP5213098B2 (ja) | 2007-06-22 | 2007-06-22 | 質問応答方法及びシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009003814A JP2009003814A (ja) | 2009-01-08 |
JP5213098B2 true JP5213098B2 (ja) | 2013-06-19 |
Family
ID=40320113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007165692A Expired - Fee Related JP5213098B2 (ja) | 2007-06-22 | 2007-06-22 | 質問応答方法及びシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5213098B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101928060B1 (ko) * | 2017-12-01 | 2018-12-11 | 사회복지법인 삼성생명공익재단 | 아이디어 확장 방법, 시스템 및 컴퓨터 판독 가능한 기록매체 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9461945B2 (en) * | 2013-10-18 | 2016-10-04 | Jeffrey P. Phillips | Automated messaging response |
CN109710634B (zh) * | 2018-12-28 | 2021-04-30 | 北京百度网讯科技有限公司 | 用于生成信息的方法及装置 |
CN111008267B (zh) * | 2019-10-29 | 2024-07-12 | 平安科技(深圳)有限公司 | 智能对话方法及相关设备 |
CN111177349B (zh) * | 2019-12-20 | 2022-05-17 | 厦门快商通科技股份有限公司 | 问答匹配方法、装置、设备及存储介质 |
CN111061853B (zh) * | 2019-12-26 | 2024-01-12 | 竹间智能科技(上海)有限公司 | 一种快速获取faq模型训练语料的方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09231238A (ja) * | 1996-02-20 | 1997-09-05 | Omron Corp | テキスト検索結果表示方法及び装置 |
JP2003150624A (ja) * | 2001-11-12 | 2003-05-23 | Mitsubishi Electric Corp | 情報抽出装置および情報抽出方法 |
JP4512826B2 (ja) * | 2005-03-03 | 2010-07-28 | 国立大学法人 筑波大学 | 質問応答システム |
-
2007
- 2007-06-22 JP JP2007165692A patent/JP5213098B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101928060B1 (ko) * | 2017-12-01 | 2018-12-11 | 사회복지법인 삼성생명공익재단 | 아이디어 확장 방법, 시스템 및 컴퓨터 판독 가능한 기록매체 |
Also Published As
Publication number | Publication date |
---|---|
JP2009003814A (ja) | 2009-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9489450B2 (en) | Method and apparatus for responding to an inquiry | |
JP3981734B2 (ja) | 質問応答システムおよび質問応答処理方法 | |
JP3882048B2 (ja) | 質問応答システムおよび質問応答処理方法 | |
CN112667794A (zh) | 一种基于孪生网络bert模型的智能问答匹配方法及系统 | |
EP1555625A1 (en) | Query recognizer | |
KR102271361B1 (ko) | 자동 질의응답 장치 | |
JP2007141059A (ja) | 読書支援システム及びプログラム | |
JP5213098B2 (ja) | 質問応答方法及びシステム | |
US20170169355A1 (en) | Ground Truth Improvement Via Machine Learned Similar Passage Detection | |
CN112989208B (zh) | 一种信息推荐方法、装置、电子设备及存储介质 | |
CN111221968B (zh) | 基于学科树聚类的作者消歧方法及装置 | |
WO2018227930A1 (zh) | 智能提示答案的方法及装置 | |
KR102256007B1 (ko) | 자연어 질의를 통한 문서 검색 및 응답 제공 시스템 및 방법 | |
JP3198932B2 (ja) | 文書検索装置 | |
Abimbola et al. | A noun-centric keyphrase extraction model: Graph-based approach | |
CN110688559A (zh) | 一种检索方法及装置 | |
CN110377706A (zh) | 基于深度学习的搜索语句挖掘方法及设备 | |
Secker et al. | AISIID: An artificial immune system for interesting information discovery on the web | |
CN113761125A (zh) | 动态摘要确定方法和装置、计算设备以及计算机存储介质 | |
JP7135730B2 (ja) | 要約生成方法及び要約生成プログラム | |
JP2010282403A (ja) | 文書検索方法 | |
CN112214511A (zh) | 一种基于wtp-wcd算法的api推荐方法 | |
CN112949287A (zh) | 热词挖掘方法、系统、计算机设备和存储介质 | |
Čeh et al. | Developing a question answering system for the Slovene language | |
Sati et al. | Arabic text question answering from an answer retrieval point of view: A survey |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120403 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120525 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121120 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130221 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |