JP2014134871A - 質問応答用検索キーワード生成方法、装置、及びプログラム - Google Patents
質問応答用検索キーワード生成方法、装置、及びプログラム Download PDFInfo
- Publication number
- JP2014134871A JP2014134871A JP2013001146A JP2013001146A JP2014134871A JP 2014134871 A JP2014134871 A JP 2014134871A JP 2013001146 A JP2013001146 A JP 2013001146A JP 2013001146 A JP2013001146 A JP 2013001146A JP 2014134871 A JP2014134871 A JP 2014134871A
- Authority
- JP
- Japan
- Prior art keywords
- word
- function
- predicate
- question
- question sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 38
- 230000014509 gene expression Effects 0.000 claims abstract description 93
- 238000010606 normalization Methods 0.000 claims abstract description 27
- 238000000605 extraction Methods 0.000 claims abstract description 24
- 230000000877 morphologic effect Effects 0.000 claims description 25
- 230000004044 response Effects 0.000 claims description 11
- 238000004519 manufacturing process Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 92
- 239000011521 glass Substances 0.000 description 11
- 239000000284 extract Substances 0.000 description 8
- 238000012217 deletion Methods 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 206010002515 Animal bite Diseases 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 206010052428 Wound Diseases 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 241001122315 Polites Species 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】述部機能表現正規化部202によって、入力された質問文の形態素解析結果に基づいて、質問文に含まれる、内容語と、内容語に後続する文字列であって少なくとも1つの機能語を含む文字列である機能表現との組み合わせで構成される述部について、述部の意味に影響を与えないように機能表現を単純な形に変換することにより、述部を正規化する。そして、内容語抽出部203によって、質問文の形態素解析結果に基づいて、質問文の述部以外の部分から、内容語を抽出する。そして、検索キーワード生成部204によって、正規化された述部と、抽出された内容語との組み合わせを、質問文に対する回答を検索するための検索キーワードとして生成する。
【選択図】図1
Description
まず、本発明の実施の形態の概要について説明する。
図1は、本発明の実施の形態に係る質問応答装置100を示すブロック図である。この質問応答装置100は、CPUと、RAMと、後述する質問応答処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。
(2)述部の態を区別するための意味ラベルとして、「受身」、「使役」の意味ラベルが格納されている。そして、各々の意味ラベルに対応する文字リストとして、以下の文字リストが格納されている。
「受身」:「れる」「られる」
「使役」:「せる」「される」
なお、「受身」、「使役」の意味ラベルに対応する文字リストに含まれる機能語が、態を表す機能語の一例である。
(3)述部が表す出来事の時制を特徴付ける意味ラベルとして、「完了」の意味ラベルが格納されており、「完了」の意味ラベルに対応する文字リストとして、「た」、「ちゃう」、「ちまう」、「て/しまう」、「て/おく」が格納されている。なお、「完了」の意味ラベルに対応する文字リストに含まれる機能語が、時制を表す機能語の一例である。
(4)述部が表す出来事に話者(ユーザ)の主観(即ち、モダリティ表現)が含まれているか否かを区別するための意味ラベルとして、「疑問」、「勧誘・意志」、「願望」、「依頼」、「勧め」、「必要」、「許可」、「推量」、「可能」が格納されている。そして、各々の意味ラベルに対応する文字リストとして、以下の文字リストが格納されている。
「疑問」:「か」
「勧誘・意志」:「う」
「願望」:「たい」「がな」「たい/がる」
「依頼」:「て/くれる」「て/欲しい」
「勧め」:「た/方/が/いい」「と/良い」
「必要」:「べき」「ない/て/は/いける/ない」
「許可」:「て/も/いい」
「推量」:「かも/知れる/ない」「らしい」「よう」「そう」「だろう」
「可能」:「れる」「こと/が/できる」
なお、これらの意味ラベルに対応する文字リストに含まれる機能語が、モダリティを表す機能語の一例である。
もし、回答タイプ判定部205によって判定された回答タイプがファクトイド型質問の回答タイプであった場合には、情報検索部21によって得られたスニペットから固有表現の抽出を行う。固有表現の抽出では、スニペットから、ファクトイド型質問の回答タイプ8種に対応する、人名、地名、組織名、人工物名、日付、時間、金額、及び割合の各々を表す形態素列を固有表現として抽出する。スニペットが「メガネは1549年にフランシスコ・ザビエルが日本に伝えた」であったとすると、「1549年」が日付、「フランシスコ・ザビエル」が人名、「日本」が地名として抽出される。回答候補抽出部22では、この固有表現の抽出処理をインターネット検索で得られた全スニペットに対して行い、抽出された固有表現から、判定された回答タイプ(上記例1では人名)と一致する固有表現をすべて回答候補として抽出する。
もし、回答タイプ判定部205によって判定された回答タイプがノンファクトイド型質問のタイプであった場合には、スニペット(文書)を段落や文に分解したのちに、回答タイプに応じた処理が行われる(上記非特許文献1参照)。回答タイプが方法であった場合、たとえば手がかり表現「方法」「手順」「ことにより」「〜には」「〜ときは」が含まれている段落や文を回答候補として抽出する(上記非特許文献1参照)。
次に、本実施の形態に係る質問応答装置100の作用について説明する。まず、ユーザによって作成された質問文が質問応答装置100に入力されると、質問応答装置100によって、図7に示す質問応答処理ルーチンが実行される。
20 質問解析部
100 質問応答装置
202 述部機能表現正規化部
203 内容語抽出部
204 検索キーワード生成部
Claims (7)
- 述部機能表現正規化手段、内容語抽出手段、及び検索キーワード生成手段を含む質問応答用検索キーワード生成装置における質問応答用検索キーワード生成方法であって、
前記述部機能表現正規化手段によって、入力された質問文の形態素解析結果に基づいて、前記質問文に含まれる、内容語と、前記内容語に後続する文字列であって少なくとも1つの機能語を含む文字列である機能表現との組み合わせで構成される述部について、前記述部の意味に影響を与えないように前記機能表現を単純な形に変換することにより、前記述部を正規化するステップと、
前記内容語抽出手段によって、前記質問文の形態素解析結果に基づいて、前記質問文の述部以外の部分から、内容語を抽出するステップと、
前記検索キーワード生成手段によって、前記述部機能表現正規化手段によって正規化された述部と、前記内容語抽出手段によって抽出された内容語との組み合わせを、前記質問文に対する回答を検索するための検索キーワードとして生成するステップと、
を含む質問応答用検索キーワード生成方法。 - 前記述部機能表現正規化手段によって正規化するステップは、前記入力された質問文の形態素解析結果に基づいて、前記質問文に含まれる、内容語と、前記機能表現との組み合わせで構成される述部について、前記述部の意味に影響を与えない機能語及び冗長な機能語を削除して前記機能表現を単純な形に変換することにより、前記述部を正規化する請求項1記載の質問応答用検索キーワード生成方法。
- 前記述部機能表現正規化手段によって正規化するステップは、予め定められた、否定を表す機能語、態を表す機能語、時制を表す機能語、及びモダリティを表す機能語以外の機能語を、前記述部の意味に影響を与えない機能語として削除する請求項2記載の質問応答用検索キーワード生成方法。
- 入力された質問文の形態素解析結果に基づいて、前記質問文に含まれる、内容語と、前記内容語に後続する文字列であって少なくとも1つの機能語を含む文字列である機能表現との組み合わせで構成される述部について、前記述部の意味に影響を与えないように前記機能表現を単純な形に変換することにより、前記述部を正規化する述部機能表現正規化手段と、
前記質問文の形態素解析結果に基づいて、前記質問文の述部以外の部分から、内容語を抽出する内容語抽出手段と、
前記述部機能表現正規化手段によって正規化された述部と、前記内容語抽出手段によって抽出された内容語との組み合わせを、前記質問文に対する回答を検索するための検索キーワードとして生成する検索キーワード生成手段と、
を含む質問応答用検索キーワード生成装置。 - 前記述部機能表現正規化手段は、前記入力された質問文の形態素解析結果に基づいて、前記質問文に含まれる、内容語と、前記機能表現との組み合わせで構成される述部について、前記述部の意味に影響を与えない機能語及び冗長な機能語を削除して前記機能表現を単純な形に変換することにより、前記述部を正規化する請求項4記載の質問応答用検索キーワード生成装置。
- 前記述部機能表現正規化手段は、予め定められた、否定を表す機能語、態を表す機能語、時制を表す機能語、及びモダリティを表す機能語以外の機能語を、前記述部の意味に影響を与えない機能語として削除する請求項5記載の質問応答用検索キーワード生成装置。
- 請求項1〜請求項3の何れか1項記載の質問応答用検索キーワード生成方法を構成する各ステップをコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013001146A JP5882241B2 (ja) | 2013-01-08 | 2013-01-08 | 質問応答用検索キーワード生成方法、装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013001146A JP5882241B2 (ja) | 2013-01-08 | 2013-01-08 | 質問応答用検索キーワード生成方法、装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014134871A true JP2014134871A (ja) | 2014-07-24 |
JP5882241B2 JP5882241B2 (ja) | 2016-03-09 |
Family
ID=51413104
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013001146A Expired - Fee Related JP5882241B2 (ja) | 2013-01-08 | 2013-01-08 | 質問応答用検索キーワード生成方法、装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5882241B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016027714A1 (ja) * | 2014-08-21 | 2016-02-25 | 国立研究開発法人情報通信研究機構 | 質問文生成装置及びコンピュータプログラム |
US10796096B2 (en) | 2017-06-12 | 2020-10-06 | Shanghai Xiaoi Robot Technology Co., Ltd. | Semantic expression generation method and apparatus |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08129554A (ja) * | 1994-05-25 | 1996-05-21 | Fuji Xerox Co Ltd | 関係表現抽出装置および関係表現検索装置 |
JP2003132060A (ja) * | 2001-10-23 | 2003-05-09 | Just Syst Corp | 検索支援装置、検索支援方法、及び検索支援プログラム |
US20050131886A1 (en) * | 2000-06-22 | 2005-06-16 | Hapax Limited | Method and system for information extraction |
JP2009116662A (ja) * | 2007-11-07 | 2009-05-28 | National Institute Of Information & Communication Technology | 質問応答装置、質問応答方法、及びプログラム |
JP2011145844A (ja) * | 2010-01-14 | 2011-07-28 | Nippon Telegr & Teleph Corp <Ntt> | 述部機能表現正規化方法、その装置及びプログラム |
JP2012220666A (ja) * | 2011-04-07 | 2012-11-12 | Nippon Telegr & Teleph Corp <Ntt> | 読解問題回答装置、方法、及びプログラム |
-
2013
- 2013-01-08 JP JP2013001146A patent/JP5882241B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08129554A (ja) * | 1994-05-25 | 1996-05-21 | Fuji Xerox Co Ltd | 関係表現抽出装置および関係表現検索装置 |
US20050131886A1 (en) * | 2000-06-22 | 2005-06-16 | Hapax Limited | Method and system for information extraction |
JP2003132060A (ja) * | 2001-10-23 | 2003-05-09 | Just Syst Corp | 検索支援装置、検索支援方法、及び検索支援プログラム |
JP2009116662A (ja) * | 2007-11-07 | 2009-05-28 | National Institute Of Information & Communication Technology | 質問応答装置、質問応答方法、及びプログラム |
JP2011145844A (ja) * | 2010-01-14 | 2011-07-28 | Nippon Telegr & Teleph Corp <Ntt> | 述部機能表現正規化方法、その装置及びプログラム |
JP2012220666A (ja) * | 2011-04-07 | 2012-11-12 | Nippon Telegr & Teleph Corp <Ntt> | 読解問題回答装置、方法、及びプログラム |
Non-Patent Citations (1)
Title |
---|
JPN6013029576; 泉朋子 他4名: '正規化を指向した機能動詞表現の述部言い換え' 言語処理学会第15回年次大会発表論文集 , 20090302, 264-267頁, 言語処理学会 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016027714A1 (ja) * | 2014-08-21 | 2016-02-25 | 国立研究開発法人情報通信研究機構 | 質問文生成装置及びコンピュータプログラム |
JP2016045652A (ja) * | 2014-08-21 | 2016-04-04 | 国立研究開発法人情報通信研究機構 | 質問文生成装置及びコンピュータプログラム |
US10380149B2 (en) | 2014-08-21 | 2019-08-13 | National Institute Of Information And Communications Technology | Question sentence generating device and computer program |
US10796096B2 (en) | 2017-06-12 | 2020-10-06 | Shanghai Xiaoi Robot Technology Co., Ltd. | Semantic expression generation method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP5882241B2 (ja) | 2016-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11397762B2 (en) | Automatically generating natural language responses to users' questions | |
US11068662B2 (en) | Method for automatically detecting meaning and measuring the univocality of text | |
KR102256240B1 (ko) | 논팩토이드형 질의 응답 시스템 및 방법 | |
US10339168B2 (en) | System and method for generating full questions from natural language queries | |
CN111078875B (zh) | 一种基于机器学习的从半结构化文档中提取问答对的方法 | |
Mishra et al. | MAULIK: an effective stemmer for Hindi language | |
US10339167B2 (en) | System and method for generating full questions from natural language queries | |
JP2013254420A (ja) | 質問応答装置、モデル学習装置、方法、及びプログラム | |
US20120124467A1 (en) | Method for automatically generating descriptive headings for a text element | |
Kavitha et al. | Chatbot for healthcare system using Artificial Intelligence | |
KR101333485B1 (ko) | 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치 | |
JP2014219872A (ja) | 発話選択装置、方法、及びプログラム、対話装置及び方法 | |
JP5882241B2 (ja) | 質問応答用検索キーワード生成方法、装置、及びプログラム | |
CN111046168B (zh) | 用于生成专利概述信息的方法、装置、电子设备和介质 | |
CN113157887A (zh) | 知识问答意图识别方法、装置、及计算机设备 | |
JP5911931B2 (ja) | 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体 | |
JP4478042B2 (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 | |
KR20210012606A (ko) | 바이오 정보 분석 방법 및 이를 수행하기 위한 프로그램을 저장하는 저장 매체 | |
Lim et al. | A Conceptual Framework for Malay-English Mixed-language Question Answering System | |
Jarman | Combining Natural Language Processing and Statistical Text Mining: A Study of Specialized Versus Common Languages | |
Peng et al. | A novel method of complex temporal question generation | |
Prasla et al. | Question answering system using artificial neural network | |
CN116226677B (zh) | 平行语料构建方法及装置、存储介质及电子设备 | |
Yu et al. | Extracting and Clustering of Story Events from a Story Corpus. | |
Patel | Sentiment analysis on Twitter data using machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150114 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150924 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151013 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5882241 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |