JP7034977B2 - 情報抽出支援装置、情報抽出支援方法及びプログラム - Google Patents
情報抽出支援装置、情報抽出支援方法及びプログラム Download PDFInfo
- Publication number
- JP7034977B2 JP7034977B2 JP2019050181A JP2019050181A JP7034977B2 JP 7034977 B2 JP7034977 B2 JP 7034977B2 JP 2019050181 A JP2019050181 A JP 2019050181A JP 2019050181 A JP2019050181 A JP 2019050181A JP 7034977 B2 JP7034977 B2 JP 7034977B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- clue
- extraction
- new
- correctness
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
はじめに、第1実施形態の情報抽出支援装置について説明する。
図1は第1実施形態の情報抽出支援装置101の機能構成の例を示す図である。第1実施形態の情報抽出支援装置システム101は、抽出部102、特定部103、付与部104、学習推定部105及び出力部106を備える。
・情報抽出結果e, eの特徴集合A, 評価結果が正解(○)である場合
count(特徴集合A, 評価結果○)>閾値、かつ
count(特徴集合A, 評価結果○) / count(特徴集合A, 評価結果×)>閾値
であれば、ルール「特徴集合がAであれば正解(○)とする。
・情報抽出結果e, eの特徴集合A, 評価結果が正解(○)で
情報抽出結果eに対する特徴集合がA’となった場合、
ルール「特徴集合がA’であれば○」とする。
(3a) 同じ特徴でスコア、例えば確率値が減少した場合、「新しい手掛かり情報(特徴)の例が必要である」ことを出力する。
例えば、1回目の実行で情報抽出結果e, eの特徴集合A, 確率値0.95, 評価結果が○であり、2回目の実行で確率値が0.7に下がった場合、集合Aだけでは精度が下がったことになるため、「新しい特徴」の例を提示するなどしてもよい。
(3b) 特徴が変わりスコア、例えば確率値が減少した場合、「精度低下要因としてdiff(A, A’)」を出力する。
例えば、1回目の実行で情報抽出結果e, eの特徴集合A, 確率値0.95, 評価結果が○であり、2回目の実行で特徴集合がA’に変化、確率値が(例えば)0.7に下がった場合、特徴集合の変化が容易として考えられため、特徴集合間の差分を出力する。
また、汎用性の高いルールを生成するために、特徴集合Aと特徴集合Bの共通部分(A∩B)について正誤判定を行い、ルール化する候補としてもよい。
図7は第1乃実施形態の情報抽出支援装置101に使用されるコンピュータのハードウェア構成の例を示す図である。
図8は本実施形態の情報抽出支援装置101の装置構成の例を示す図である。図8の例では、情報抽出支援装置101は、複数のクライアント装置1a~1z、ネットワーク2及びサーバ装置3を備える。
2 ネットワーク
3 サーバ装置
101 情報抽出支援装置
102 抽出部
103 特定部
104 付与部
105 学習推定部
106 出力部
Claims (5)
- 複数の単語を含む文書データから、所定のルールに従い当該文書データに関する第1情報を抽出する抽出部と、
前記第1情報に関連する情報を手掛かり情報として特定する特定部と、
予め決められた規則に基づいて前記第1情報に正誤を示すラベルを付与する付与部と、
前記第1情報と、前記手掛かり情報と、前記ラベルとに基づいて新たな第1情報を抽出するための規則の学習を実行し、新たな手掛かり情報を用いて、前記新たな第1情報を生成する推論を実行する学習推論部と、
前記ラベルと前記新たな第1情報についての正誤の結果である正誤判定とに基づいて、前記手掛かり情報及び前記規則の少なくとも一つの変更方法を出力する出力部と、
を有する情報抽出支援装置。 - 前記出力部は、前記変更方法と、前記抽出部の抽出結果についての正誤判定と、前記手掛かり情報との少なくとも一つを組み合わせて出力する請求項1に記載の情報抽出支援装置。
- 前記手掛かり情報が情報抽出に適しているかを判別できない場合、前記出力部が、追加の手がかり情報が必要である旨を出力する請求項1に記載の情報抽出支援装置。
- 抽出手段が、複数の単語を含む文書データから、所定のルールに従い当該文書データに関する第1情報を抽出し、
特定手段が、前記第1情報に関連する情報を手掛かり情報として特定し、
付与手段が、予め決められた規則に基づいて前記第1情報に正誤を示すラベルを付与し、
学習推論手段が、前記第1情報と、前記手掛かり情報と、前記ラベルとに基づいて新たな第1情報を抽出するための規則の学習を実行し、新たな手掛かり情報を用いて、前記新たな第1情報を生成する推論を実行し、
出力手段が、前記ラベルと前記新たな第1情報についての正誤の結果である正誤判定とに基づいて、前記手掛かり情報及び前記規則の少なくとも一つの変更方法を出力する、情報抽出支援方法。 - コンピュータを、
複数の単語を含む文書データから、所定のルールに従い当該文書データに関する第1情報を抽出する抽出部と、
前記第1情報に関連する情報を手掛かり情報として特定する特定部と、
予め決められた規則に基づいて前記第1情報に正誤を示すラベルを付与する付与部と、
前記第1情報と、前記手掛かり情報と、前記ラベルとに基づいて新たな第1情報を抽出するための規則の学習を実行し、新たな手掛かり情報を用いて、前記新たな第1情報を生成する推論を実行する学習推論部と、
前記ラベルと前記新たな第1情報についての正誤の結果である正誤判定とに基づいて、前記手掛かり情報及び前記規則の少なくとも一つの変更方法を出力する出力部として機能させるための情報抽出支援プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019050181A JP7034977B2 (ja) | 2019-03-18 | 2019-03-18 | 情報抽出支援装置、情報抽出支援方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019050181A JP7034977B2 (ja) | 2019-03-18 | 2019-03-18 | 情報抽出支援装置、情報抽出支援方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020154448A JP2020154448A (ja) | 2020-09-24 |
JP7034977B2 true JP7034977B2 (ja) | 2022-03-14 |
Family
ID=72559006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019050181A Active JP7034977B2 (ja) | 2019-03-18 | 2019-03-18 | 情報抽出支援装置、情報抽出支援方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7034977B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002222083A (ja) | 2001-01-29 | 2002-08-09 | Fujitsu Ltd | 事例蓄積装置および方法 |
JP2017167854A (ja) | 2016-03-16 | 2017-09-21 | 株式会社東芝 | 学習装置、方法、及びプログラム |
US20180276560A1 (en) | 2017-03-23 | 2018-09-27 | Futurewei Technologies, Inc. | Review machine learning system |
-
2019
- 2019-03-18 JP JP2019050181A patent/JP7034977B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002222083A (ja) | 2001-01-29 | 2002-08-09 | Fujitsu Ltd | 事例蓄積装置および方法 |
JP2017167854A (ja) | 2016-03-16 | 2017-09-21 | 株式会社東芝 | 学習装置、方法、及びプログラム |
US20180276560A1 (en) | 2017-03-23 | 2018-09-27 | Futurewei Technologies, Inc. | Review machine learning system |
Also Published As
Publication number | Publication date |
---|---|
JP2020154448A (ja) | 2020-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20170300565A1 (en) | System and method for entity extraction from semi-structured text documents | |
JP5356197B2 (ja) | 単語意味関係抽出装置 | |
US9483460B2 (en) | Automated formation of specialized dictionaries | |
US20090182554A1 (en) | Text analysis method | |
US10503830B2 (en) | Natural language processing with adaptable rules based on user inputs | |
CN112686036B (zh) | 风险文本识别方法、装置、计算机设备及存储介质 | |
US9898464B2 (en) | Information extraction supporting apparatus and method | |
US11379536B2 (en) | Classification device, classification method, generation method, classification program, and generation program | |
US9632998B2 (en) | Claim polarity identification | |
US9262400B2 (en) | Non-transitory computer readable medium and information processing apparatus and method for classifying multilingual documents | |
US20220067290A1 (en) | Automatically identifying multi-word expressions | |
Osman et al. | Plagiarism detection using graph-based representation | |
KR20200064490A (ko) | 프로필 자동생성서버 및 방법 | |
US8666987B2 (en) | Apparatus and method for processing documents to extract expressions and descriptions | |
JP6942759B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP6495124B2 (ja) | 用語意味コード判定装置、用語意味コード判定モデル学習装置、方法、及びプログラム | |
JP2016110256A (ja) | 情報処理装置及び情報処理プログラム | |
JP7034977B2 (ja) | 情報抽出支援装置、情報抽出支援方法及びプログラム | |
CN107908792B (zh) | 信息推送方法和装置 | |
US8977538B2 (en) | Constructing and analyzing a word graph | |
JP2016162163A (ja) | 情報処理装置及び情報処理プログラム | |
US20210089541A1 (en) | Intellectual property support device, intellectual property support method, and intellectual property support program | |
KR102072708B1 (ko) | 텍스트 콘텐츠의 장르를 추론하는 방법 및 컴퓨터 프로그램 | |
JP6181890B2 (ja) | 文献解析装置、文献解析方法およびプログラム | |
JP5138622B2 (ja) | 情報処理装置及び不満抽出方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200831 |
|
RD07 | Notification of extinguishment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7427 Effective date: 20210618 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210716 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211004 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20211004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20211005 |
|
RD07 | Notification of extinguishment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7427 Effective date: 20211112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20211116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220302 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7034977 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |