JP2017058866A - 情報抽出装置、情報抽出方法および情報抽出プログラム - Google Patents
情報抽出装置、情報抽出方法および情報抽出プログラム Download PDFInfo
- Publication number
- JP2017058866A JP2017058866A JP2015182102A JP2015182102A JP2017058866A JP 2017058866 A JP2017058866 A JP 2017058866A JP 2015182102 A JP2015182102 A JP 2015182102A JP 2015182102 A JP2015182102 A JP 2015182102A JP 2017058866 A JP2017058866 A JP 2017058866A
- Authority
- JP
- Japan
- Prior art keywords
- information
- value
- attribute
- relationship
- information extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
図1には、第1の実施形態に係る情報抽出装置100が例示される。情報抽出装置100は、例えば、文書を入力可能な端末であってもよいし、係る端末のためにアプリケーションまたはサービスを提供してもよい。
図8に例示されるように、第2の実施形態に係る情報抽出装置300は、入力部101と、関係情報抽出部102と、学習部103と、算出部104と、判定部105と、補完情報抽出部106と、出力部107と、評価情報入力部308と、評価結果格納部309とを含む。すなわち、情報抽出装置300は、図1の情報抽出装置100に評価情報入力部308および評価結果格納部309を追加したものに相当する。
101・・・入力部
102・・・関係情報抽出部
103・・・学習部
104・・・算出部
105・・・判定部
106・・・補完情報抽出部
107・・・出力部
308・・・評価情報入力部
309・・・評価結果格納部
Claims (13)
- 第1の属性の値と第2の属性の値との間の関係を表す少なくとも1つの関係情報を文書から抽出することによって関係情報群を得る関係情報抽出部と、
前記関係情報群に属する第1の関係情報が曖昧性を持つと判定基準に従って判定される場合に、当該第1の関係情報を形成する第1の属性の値および第2の属性の値の少なくとも一方に関係する補完情報を抽出する補完情報抽出部と
を具備する、情報抽出装置。 - 前記第1の関係情報を形成する第1の属性の値が前記関係情報群に属する第2の関係情報を形成する第1の属性の値と同一であって、かつ、当該第1の関係情報を形成する第2の属性の値が前記第2の関係情報を形成する第2の属性の値と異なる場合に、前記第1の関係情報および前記第2の関係情報が曖昧性を持つと判定する判定部をさらに具備する、請求項1記載の情報抽出装置。
- 前記第1の関係情報に含まれる第1の属性の値が特定の種類の単語に該当する場合に、当該第1の関係情報が曖昧性を持つと判定する判定部をさらに具備する、請求項1記載の情報抽出装置。
- 前記補完情報抽出部は、前記第1の関係情報が曖昧性を持つと判定された場合に、当該第1の関係情報を形成する第1の属性の値および第2の属性の値の少なくとも一方について、係り受け解析、照応解析またはパラフレーズを行い、前記補完情報を抽出する、請求項2記載の情報抽出装置。
- 前記補完情報抽出部は、前記第1の関係情報が曖昧性を持つと判定された場合に、当該第1の関係情報を形成する第1の属性の値の上位概念若しくは下位概念に相当する単語または前記第1の属性の値の詳細を表す単語を前記補完情報として抽出する、請求項2記載の情報抽出装置。
- 前記補完情報抽出部は、前記第1の関係情報が曖昧性を持つと判定された場合に、当該第1の関係情報と同一の第2の属性の値を含む少なくとも1つの第3の関係情報を形成する第1の属性の値のいずれかを前記補完情報として抽出する、請求項2記載の情報抽出装置。
- 前記補完情報抽出部は、前記第1の関係情報が曖昧性を持つと判定される場合に、前記補完情報を抽出し、当該補完情報を用いて当該第1の関係情報を補完する、請求項1記載の情報抽出装置。
- 前記第1の関係情報を出力する出力部をさらに具備する、請求項1記載の情報抽出装置。
- 前記第1の関係情報に対して評価者から妥当性の評価結果を受け取る評価入力部と
前記評価結果を前記第1の関係情報と関連づけて格納する格納部とをさらに具備する
請求項8記載の情報抽出装置。 - 前記出力部は、前記第1の関係情報を表形式で出力する、請求項8記載の情報抽出装置。
- 前記第1の関係情報の素性の重みを学習する学習部と、
前記素性の重みに基づいて前記第1の関係情報の確からしさを表すスコアを算出する算出部と
をさらに具備する、請求項1記載の情報抽出装置。 - 第1の属性の値と第2の属性の値との間の関係を表す少なくとも1つの関係情報を文書から抽出することによって関係情報群を得ることと、
前記関係情報群に属する第1の関係情報が曖昧性を持つと判定基準に従って判定される場合に、当該第1の関係情報を形成する第1の属性の値および第2の属性の値の少なくとも一方に関係する補完情報を抽出することと
を具備する、情報抽出方法。 - コンピュータを、
第1の属性の値と第2の属性の値との間の関係を表す少なくとも1つの関係情報を文書から抽出することによって関係情報群を得る手段、
前記関係情報群に属する第1の関係情報が曖昧性を持つと判定基準に従って判定される場合に、当該第1の関係情報を形成する第1の属性の値および第2の属性の値の少なくとも一方に関係する補完情報を抽出する手段
として機能させるための、情報抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015182102A JP6502807B2 (ja) | 2015-09-15 | 2015-09-15 | 情報抽出装置、情報抽出方法および情報抽出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015182102A JP6502807B2 (ja) | 2015-09-15 | 2015-09-15 | 情報抽出装置、情報抽出方法および情報抽出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017058866A true JP2017058866A (ja) | 2017-03-23 |
JP6502807B2 JP6502807B2 (ja) | 2019-04-17 |
Family
ID=58390204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015182102A Active JP6502807B2 (ja) | 2015-09-15 | 2015-09-15 | 情報抽出装置、情報抽出方法および情報抽出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6502807B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020170427A (ja) * | 2019-04-05 | 2020-10-15 | 株式会社日立製作所 | モデル作成支援方法、及びモデル作成支援システム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008112363A (ja) * | 2006-10-31 | 2008-05-15 | Toshiba Corp | 文書処理装置および文書処理プログラム |
JP2009116869A (ja) * | 2007-10-31 | 2009-05-28 | Nec (China) Co Ltd | エンティティ関係マイニング装置および方法 |
JP2009282903A (ja) * | 2008-05-26 | 2009-12-03 | Nippon Telegr & Teleph Corp <Ntt> | 知識抽出・検索装置およびその方法 |
JP2011257790A (ja) * | 2010-06-04 | 2011-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 関係情報抽出装置、その方法及びプログラム |
CN103235772A (zh) * | 2013-03-08 | 2013-08-07 | 北京理工大学 | 一种文本集人物关系自动提取方法 |
-
2015
- 2015-09-15 JP JP2015182102A patent/JP6502807B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008112363A (ja) * | 2006-10-31 | 2008-05-15 | Toshiba Corp | 文書処理装置および文書処理プログラム |
JP2009116869A (ja) * | 2007-10-31 | 2009-05-28 | Nec (China) Co Ltd | エンティティ関係マイニング装置および方法 |
JP2009282903A (ja) * | 2008-05-26 | 2009-12-03 | Nippon Telegr & Teleph Corp <Ntt> | 知識抽出・検索装置およびその方法 |
JP2011257790A (ja) * | 2010-06-04 | 2011-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 関係情報抽出装置、その方法及びプログラム |
CN103235772A (zh) * | 2013-03-08 | 2013-08-07 | 北京理工大学 | 一种文本集人物关系自动提取方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020170427A (ja) * | 2019-04-05 | 2020-10-15 | 株式会社日立製作所 | モデル作成支援方法、及びモデル作成支援システム |
JP7189068B2 (ja) | 2019-04-05 | 2022-12-13 | 株式会社日立製作所 | モデル作成支援方法、及びモデル作成支援システム |
Also Published As
Publication number | Publication date |
---|---|
JP6502807B2 (ja) | 2019-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pavitha et al. | Movie recommendation and sentiment analysis using machine learning | |
CN108255813B (zh) | 一种基于词频-逆文档与crf的文本匹配方法 | |
Shoukry et al. | A hybrid approach for sentiment classification of Egyptian dialect tweets | |
JP6505421B2 (ja) | 情報抽出支援装置、方法およびプログラム | |
JP6462970B1 (ja) | 分類装置、分類方法、生成方法、分類プログラム及び生成プログラム | |
JP2017091000A (ja) | 文書処理装置、方法、およびプログラム | |
Suchdev et al. | Twitter sentiment analysis using machine learning and knowledge-based approach | |
WO2019093172A1 (ja) | 類似性指標値算出装置、類似検索装置および類似性指標値算出用プログラム | |
Jihan et al. | Multi-domain aspect extraction using support vector machines | |
CN110705261B (zh) | 中文文本分词方法及其系统 | |
Dehkharghani et al. | Automatically identifying a software product's quality attributes through sentiment analysis of tweets | |
CN114138969A (zh) | 文本处理方法及装置 | |
US10929446B2 (en) | Document search apparatus and method | |
CN110516175B (zh) | 一种确定用户标签的方法、装置、设备和介质 | |
JP6502807B2 (ja) | 情報抽出装置、情報抽出方法および情報抽出プログラム | |
Nandan et al. | SAP-RI: a constrained and supervised approach for aspect-based sentiment analysis | |
US20200293717A1 (en) | Interactive control system, interactive control method, and computer program product | |
CN110489522B (zh) | 一种基于用户评分的情感词典构建方法 | |
WO2015159702A1 (ja) | 部分情報抽出システム | |
WO2019239877A1 (ja) | 知的財産支援装置および知的財産支援方法並びに知的財産支援プログラム | |
JP5405507B2 (ja) | 具体主題の有無判定装置、方法、及びプログラム | |
JP4314271B2 (ja) | 単語間関連度算出装置、単語間関連度算出方法及び単語間関連度算出プログラム並びにそのプログラムを記録した記録媒体 | |
JP5703958B2 (ja) | 情報検索装置、情報検索方法および情報検索プログラム | |
CN110837740B (zh) | 一种基于词典改进lda模型的评论方面观点级挖掘方法 | |
CN111310455B (zh) | 一种面向网购评论的新情感词极性计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190322 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6502807 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |