JP5710581B2 - 質問応答装置、方法、及びプログラム - Google Patents
質問応答装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP5710581B2 JP5710581B2 JP2012275924A JP2012275924A JP5710581B2 JP 5710581 B2 JP5710581 B2 JP 5710581B2 JP 2012275924 A JP2012275924 A JP 2012275924A JP 2012275924 A JP2012275924 A JP 2012275924A JP 5710581 B2 JP5710581 B2 JP 5710581B2
- Authority
- JP
- Japan
- Prior art keywords
- answer
- learning
- question
- extracted
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 31
- 238000004364 calculation method Methods 0.000 claims description 81
- 230000014509 gene expression Effects 0.000 claims description 55
- 238000000605 extraction Methods 0.000 claims description 32
- 230000004044 response Effects 0.000 claims description 15
- 239000000284 extract Substances 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 description 16
- 238000011156 evaluation Methods 0.000 description 11
- 238000010276 construction Methods 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 4
- 238000007477 logistic regression Methods 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 235000010724 Wisteria floribunda Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
第1の実施の形態に係る質問応答装置10は、CPUと、RAMと、後述する信頼度算出式構築処理ルーチン、及び質問応答処理ルーチンを実行するためのプログラム及び各種データを記憶したROMとを備えたコンピュータで構成されている。また、記憶手段としてHDDを設けてもよい。
・文書の検索順位(rank)・・・回答候補が出現する文書の検索時における順位を値として持つ特徴量である。
・検索結果における回答候補の頻度(cand_count)・・・文書の検索結果から抽出された全ての回答候補における対象の回答候補の出現回数を値として持つ特徴量である。文書の検索結果における出現頻度が高い場合に、対象の回答候補が回答らしい(信頼度が高い)としたい場合に有効な特徴量である。
・検索結果における回答候補の割合(cand_ratio)・・・文書の検索結果から抽出された全ての回答候補に対して、対象の回答候補が占める割合を値として持つ特徴量である。例えば、対象の回答候補が「A」であり、文書の検索結果中から10個の回答候補が抽出されており、そのうち5個が「A」という回答候補だったとすると、回答候補「A」についての本特徴量は0.5となる。
次に、第2の実施の形態について説明する。なお、第2の実施の形態に係る質問応答装置について、第1の実施の形態に係る質問応答装置10と同様の構成については、同一符号を付して詳細な説明を省略する。
1 エベレスト 0.969366(22)
2 富士山 0.246514(3)
3 チョモランマ 0.226562(1)
4 K2 0.151517(2)
5 ハワイ島 0.13605(1)
6 エベレスト/チョモランマ 0.0898824(1)
7 ダウラギリ 0.0621022(3)
8 カンチェンジュンガ 0.0353058(5)
9 カメルーン山 0.0261512(2)
10 マナスル 0.0173765(1)
11 ローツェ 0.0152677(1)
12 チョ・オユー 0.0152677(1)
13 マカルー 0.00845766(1)
14 アルプス 0.00446622(1)
enetype_Mountain-cand_ratio 3.812258026357529
enetype_Mountain-score_dist 0.02188293329420078
enetype_Mountain-cand_count 0.006644647005094824
enetype_Mountain-rank -0.02508300268047375
比較として、回答タイプ「Lake」に関する各特徴量の回帰係数を以下に示す。
enetype_Lake-cand_ratio 3.260375594203147
enetype_Lake-cand_count 0.01467459091733951
enetype_Lake-rank -0.03125393707655315
enetype_Lake-score_dist -0.09606970225518727
11 質問解析部
12 文書検索部
13 回答候補抽出部
14、214 回答評価部
21 特徴量抽出部
22、222 学習部
31 文書DB
32、232 信頼度算出式
Claims (7)
- 自然言語による質問文を拡張固有表現の体系に従って分類することにより、前記質問文に対する回答の種類を示す回答タイプを解析する解析手段と、
前記質問文に含まれる単語を検索条件として複数の文書から検索された文書に含まれる拡張固有表現から、前記解析手段により解析された回答タイプに対応した拡張固有表現を回答候補として抽出する抽出手段と、
前記回答候補の前記質問文に対する回答としての信頼度を算出する信頼度算出式であって、前記解析手段により解析された回答タイプに応じた信頼度算出式に基づいて得られた信頼度の高い回答候補を、前記質問文に対する回答として出力する出力手段と、
を含む質問応答装置。 - 前記出力手段は、質問文に対する回答タイプ及び回答が既知の複数の学習用質問文について抽出された複数の学習用回答候補の各々について、該学習用回答候補の各々から抽出された学習用特徴量と、該学習用回答候補が正解の回答か否かを示すラベルとの組を学習データとして、前記回答タイプ毎に学習することにより得られた前記回答タイプ毎の信頼度算出式のうち、前記解析手段により解析された回答タイプの信頼度算出式に、前記質問文について抽出された回答候補から抽出された特徴量を入力して、前記回答候補の信頼度を算出する請求項1記載の質問応答装置。
- 前記出力手段は、質問文に対する回答タイプ及び回答が既知の複数の学習用質問文について抽出された複数の学習用回答候補の各々について、該学習用回答候補の各々から抽出された学習用特徴量に、前記学習用質問文の回答タイプを示す情報を含めた特徴量と、該学習用回答候補が正解の回答か否かを示すラベルとの組を学習データとして学習することにより得られた前記信頼度算出式に、前記質問文について抽出された回答候補から抽出された特徴量に、前記解析手段により解析された回答タイプを示す情報を含めた特徴量を入力して、前記回答候補の信頼度を算出する請求項1記載の質問応答装置。
- 解析手段と、抽出手段と、出力手段とを含む質問応答装置における質問応答方法であって、
前記解析手段が、自然言語による質問文を拡張固有表現の体系に従って分類することにより、前記質問文に対する回答の種類を示す回答タイプを解析し、
前記抽出手段が、前記質問文に含まれる単語を検索条件として複数の文書から検索された文書に含まれる拡張固有表現から、前記解析手段により解析された回答タイプに対応した拡張固有表現を回答候補として抽出し、
前記出力手段が、前記回答候補の前記質問文に対する回答としての信頼度を算出する信頼度算出式であって、前記解析手段により解析された回答タイプに応じた信頼度算出式に基づいて得られた信頼度の高い回答候補を、前記質問文に対する回答として出力する
質問応答方法。 - 前記出力手段は、質問文に対する回答タイプ及び回答が既知の複数の学習用質問文について抽出された複数の学習用回答候補の各々について、該学習用回答候補の各々から抽出された学習用特徴量と、該学習用回答候補が正解の回答か否かを示すラベルとの組を学習データとして、前記回答タイプ毎に学習することにより得られた前記回答タイプ毎の信頼度算出式のうち、前記解析手段により解析された回答タイプの信頼度算出式に、前記質問文について抽出された回答候補から抽出された特徴量を入力して、前記回答候補の信頼度を算出する請求項4記載の質問応答方法。
- 前記出力手段は、質問文に対する回答タイプ及び回答が既知の複数の学習用質問文について抽出された複数の学習用回答候補の各々について、該学習用回答候補の各々から抽出された学習用特徴量に、前記学習用質問文の回答タイプを示す情報を含めた特徴量と、該学習用回答候補が正解の回答か否かを示すラベルとの組を学習データとして学習することにより得られた前記信頼度算出式に、前記質問文について抽出された回答候補から抽出された特徴量に、前記解析手段により解析された回答タイプを示す情報を含めた特徴量を入力して、前記回答候補の信頼度を算出する請求項4記載の質問応答方法。
- コンピュータを、請求項1〜請求項3のいずれか1項記載の質問応答装置を構成する各手段として機能させるための質問応答プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012275924A JP5710581B2 (ja) | 2012-12-18 | 2012-12-18 | 質問応答装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012275924A JP5710581B2 (ja) | 2012-12-18 | 2012-12-18 | 質問応答装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014120053A JP2014120053A (ja) | 2014-06-30 |
JP5710581B2 true JP5710581B2 (ja) | 2015-04-30 |
Family
ID=51174822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012275924A Active JP5710581B2 (ja) | 2012-12-18 | 2012-12-18 | 質問応答装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5710581B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11157829B2 (en) | 2017-07-18 | 2021-10-26 | International Business Machines Corporation | Method to leverage similarity and hierarchy of documents in NN training |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10769155B2 (en) | 2016-05-17 | 2020-09-08 | Google Llc | Automatically augmenting message exchange threads based on tone of message |
JP6048997B1 (ja) * | 2016-06-16 | 2016-12-21 | 株式会社FiNC | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
JP6165306B1 (ja) * | 2016-09-20 | 2017-07-19 | ヤフー株式会社 | 生成装置、生成方法及び生成プログラム |
JP6739361B2 (ja) * | 2017-01-18 | 2020-08-12 | ヤフー株式会社 | 情報提供装置、情報提供方法、およびプログラム |
US11144718B2 (en) | 2017-02-28 | 2021-10-12 | International Business Machines Corporation | Adaptable processing components |
JP6630701B2 (ja) * | 2017-04-13 | 2020-01-15 | 日本電信電話株式会社 | 回答候補生成装置、方法、及びプログラム |
JP6449378B2 (ja) * | 2017-06-20 | 2019-01-09 | ヤフー株式会社 | 生成装置、生成方法及び生成プログラム |
WO2019244803A1 (ja) * | 2018-06-18 | 2019-12-26 | 日本電信電話株式会社 | 回答学習装置、回答学習方法、回答生成装置、回答生成方法、及びプログラム |
CN109829041B (zh) * | 2018-12-25 | 2021-06-29 | 出门问问信息科技有限公司 | 问题处理方法、装置、计算机设备及计算机可读存储介质 |
CN113449117B (zh) * | 2021-06-24 | 2023-09-26 | 武汉工程大学 | 一种基于Bi-LSTM和中文知识图谱的复合问答方法 |
-
2012
- 2012-12-18 JP JP2012275924A patent/JP5710581B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11157829B2 (en) | 2017-07-18 | 2021-10-26 | International Business Machines Corporation | Method to leverage similarity and hierarchy of documents in NN training |
Also Published As
Publication number | Publication date |
---|---|
JP2014120053A (ja) | 2014-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
Bennani-Smires et al. | Simple unsupervised keyphrase extraction using sentence embeddings | |
US10503828B2 (en) | System and method for answering natural language question | |
JP5078173B2 (ja) | 多義性解消方法とそのシステム | |
Eisa et al. | Existing plagiarism detection techniques: A systematic mapping of the scholarly literature | |
US8812504B2 (en) | Keyword presentation apparatus and method | |
Atia et al. | Increasing the accuracy of opinion mining in Arabic | |
JP2011118872A (ja) | 未登録語のカテゴリを決定する方法と装置 | |
JP2011118689A (ja) | 検索方法及びシステム | |
Habib et al. | An exploratory approach to find a novel metric based optimum language model for automatic bangla word prediction | |
Alyami et al. | Systematic literature review of Arabic aspect-based sentiment analysis | |
JP5427694B2 (ja) | 関連コンテンツ提示装置及びプログラム | |
Yadav et al. | Feature based automatic text summarization methods: a comprehensive state-of-the-art survey | |
Barteld et al. | Token-based spelling variant detection in Middle Low German texts | |
JP2004355550A (ja) | 自然文検索装置、その方法及びプログラム | |
Garrido et al. | Improving the generation of infoboxes from data silos through machine learning and the use of semantic repositories | |
Corrada-Emmanuel et al. | Answer passage retrieval for question answering | |
Karisani et al. | Multi-view active learning for short text classification in user-generated data | |
Guo et al. | Deep natural language processing for linkedin search | |
Das et al. | A Novel Approach to Enhance the Performance of Semantic Search in Bengali using Neural Net and Other Classification Techniques | |
Nikolić et al. | Modelling the System of Receiving Quick Answers for e-Government Services: Study for the Crime Domain in the Republic of Serbia | |
Tang et al. | Mining language variation using word using and collocation characteristics | |
Sati et al. | Arabic text question answering from an answer retrieval point of view: A survey | |
Lakatos et al. | A Cloud-based Machine Learning Pipeline for the Efficient Extraction of Insights from Customer Reviews | |
Beumer | Evaluation of Text Document Clustering using k-Means |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141023 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150304 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5710581 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |