JP6622172B2 - 情報抽出支援装置、情報抽出支援方法およびプログラム - Google Patents
情報抽出支援装置、情報抽出支援方法およびプログラム Download PDFInfo
- Publication number
- JP6622172B2 JP6622172B2 JP2016224305A JP2016224305A JP6622172B2 JP 6622172 B2 JP6622172 B2 JP 6622172B2 JP 2016224305 A JP2016224305 A JP 2016224305A JP 2016224305 A JP2016224305 A JP 2016224305A JP 6622172 B2 JP6622172 B2 JP 6622172B2
- Authority
- JP
- Japan
- Prior art keywords
- training
- information
- pattern
- case
- teacher pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Description
(P1)データ生成部103は、「材料名と移動度との間の単語数は1」の弱教師パターンを適用し、「Mobility of InGaZnO on 300 K is 9.7 cm2/Vs」という文から、「300」が移動度を示す事例候補を生成する。
(P2)図10のような修正画面で、「300」ではなく「9.7」が移動度を示すことが指定される。
(P3)パターン生成部102は、修正された判定結果を参照し、弱教師パターンを「移動度の後に“K”が来る場合は負例」に更新する。
101 受付部
102 パターン生成部
103 データ生成部
104 出力制御部
105 学習部
106 抽出部
121 記憶部
Claims (11)
- 情報の抽出および複数の情報間の関係の抽出の少なくとも一方の実行に用いるモデルを学習するための第1訓練事例と、前記第1訓練事例を学習に用いる根拠を示す手掛かり情報と、の入力を受け付ける受付部と、
前記第1訓練事例と前記手掛かり情報とを用いて、学習に用いる訓練事例を生成するための教師パターンを生成するパターン生成部と、
前記教師パターンにより第2訓練事例を生成するデータ生成部と、
前記第2訓練事例と、前記第2訓練事例を生成した前記教師パターンの生成に用いられた前記手掛かり情報とを出力する出力制御部と、
を備える情報抽出支援装置。 - 前記受付部は、さらに、前記第2訓練事例が正しいか否か示す判定結果の入力を受け付け、
前記パターン生成部は、前記判定結果に基づいて、生成された前記教師パターンを更新する、
請求項1に記載の情報抽出支援装置。 - 前記データ生成部は、さらに、更新後の前記教師パターンにより第3訓練事例を生成し、
前記出力制御部は、さらに、前記第2訓練事例と前記第3訓練事例との差分を出力する、
請求項2に記載の情報抽出支援装置。 - 前記受付部は、前記第1訓練事例を含む情報を検索するために用いられたキーワードを、前記手掛かり情報として受け付ける、
請求項1から3のいずれか1項に記載の情報抽出支援装置。 - 前記教師パターンは、訓練事例と、訓練事例が正しいか否かを示す判定結果とを生成するパターンであり、
前記データ生成部は、前記教師パターンにより前記第2訓練事例と、前記第2訓練事例の判定結果とを生成し、
前記出力制御部は、さらに、前記教師パターンと、前記教師パターンにより生成された前記第2訓練事例の判定結果とを対応づけて出力する、
請求項1から4のいずれか1項に記載の情報抽出支援装置。 - 前記教師パターンは、学習に用いる訓練事例が満たす条件を定め、
前記データ生成部は、前記条件を満たす第2訓練事例を生成する、
請求項1から5のいずれか1項に記載の情報抽出支援装置。 - 前記パターン生成部は、重要度を対応づけた前記教師パターンを生成し、
前記データ生成部は、前記重要度に応じて、前記第2訓練事例を生成する前記教師パターンを変更する、
請求項1から6のいずれか1項に記載の情報抽出支援装置。 - 前記第2訓練事例、および、前記教師パターンを用いて新たに生成される訓練事例の少なくとも一方を用いて前記モデルを学習する学習部をさらに備える、
請求項1から7のいずれか1項に記載の情報抽出支援装置。 - 前記出力制御部は、さらに、前記第2訓練事例に対して、前記手掛かり情報が同一または類似する他の訓練事例を出力する、
請求項1から8のいずれか1項に記載の情報抽出支援装置。 - 受付部が、情報の抽出および複数の情報間の関係の抽出の少なくとも一方の実行に用いるモデルを学習するための第1訓練事例と、前記第1訓練事例を学習に用いる根拠を示す手掛かり情報と、の入力を受け付ける受付ステップと、
パターン生成部が、前記第1訓練事例と前記手掛かり情報とを用いて、学習に用いる訓練事例を生成するための教師パターンを生成するパターン生成ステップと、
データ生成部が、前記教師パターンにより第2訓練事例を生成するデータ生成ステップと、
出力制御部が、前記第2訓練事例と、前記第2訓練事例を生成した前記教師パターンの生成に用いられた前記手掛かり情報とを出力する出力制御ステップと、
を含む情報抽出支援方法。 - コンピュータを、
情報の抽出および複数の情報間の関係の抽出の少なくとも一方の実行に用いるモデルを学習するための第1訓練事例と、前記第1訓練事例を学習に用いる根拠を示す手掛かり情報と、の入力を受け付ける受付部と、
前記第1訓練事例と前記手掛かり情報とを用いて、学習に用いる訓練事例を生成するための教師パターンを生成するパターン生成部と、
前記教師パターンにより第2訓練事例を生成するデータ生成部と、
前記第2訓練事例と、前記第2訓練事例を生成した前記教師パターンの生成に用いられた前記手掛かり情報とを出力する出力制御部、
として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016224305A JP6622172B2 (ja) | 2016-11-17 | 2016-11-17 | 情報抽出支援装置、情報抽出支援方法およびプログラム |
US15/689,975 US11481663B2 (en) | 2016-11-17 | 2017-08-29 | Information extraction support device, information extraction support method and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016224305A JP6622172B2 (ja) | 2016-11-17 | 2016-11-17 | 情報抽出支援装置、情報抽出支援方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018081569A JP2018081569A (ja) | 2018-05-24 |
JP6622172B2 true JP6622172B2 (ja) | 2019-12-18 |
Family
ID=62107944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016224305A Active JP6622172B2 (ja) | 2016-11-17 | 2016-11-17 | 情報抽出支援装置、情報抽出支援方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11481663B2 (ja) |
JP (1) | JP6622172B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6775935B2 (ja) | 2015-11-04 | 2020-10-28 | 株式会社東芝 | 文書処理装置、方法、およびプログラム |
JP6490607B2 (ja) | 2016-02-09 | 2019-03-27 | 株式会社東芝 | 材料推薦装置 |
JP6602243B2 (ja) | 2016-03-16 | 2019-11-06 | 株式会社東芝 | 学習装置、方法、及びプログラム |
JP6800825B2 (ja) | 2017-10-02 | 2020-12-16 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
US11830195B2 (en) * | 2018-08-06 | 2023-11-28 | Shimadzu Corporation | Training label image correction method, trained model creation method, and image analysis device |
US11520835B2 (en) * | 2018-09-28 | 2022-12-06 | Rakuten Group, Inc. | Learning system, learning method, and program |
US11095059B2 (en) | 2019-04-25 | 2021-08-17 | Molex, Llc | Connector |
JP7111671B2 (ja) * | 2019-09-05 | 2022-08-02 | 株式会社東芝 | 学習装置、学習システム、および学習方法 |
US11222238B2 (en) * | 2019-11-14 | 2022-01-11 | Nec Corporation | Object detection with training from multiple datasets |
CN115619192B (zh) * | 2022-11-10 | 2023-10-03 | 国网江苏省电力有限公司物资分公司 | 一种面向需求计划规则的混合式关系提取方法 |
Family Cites Families (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5341276B2 (ja) | 1972-06-09 | 1978-11-01 | ||
US4912063A (en) | 1987-10-26 | 1990-03-27 | North Carolina State University | Growth of beta-sic thin films and semiconductor devices fabricated thereon |
JP3384016B2 (ja) | 1993-02-19 | 2003-03-10 | 富士ゼロックス株式会社 | 文書編集管理装置 |
JP3020803B2 (ja) | 1994-06-08 | 2000-03-15 | 株式会社日立製作所 | 法令文書検索改正システム |
JP4278011B2 (ja) | 1996-04-05 | 2009-06-10 | 富士通株式会社 | 文書校正装置およびプログラム記憶媒体 |
JP3936453B2 (ja) | 1997-12-04 | 2007-06-27 | 富士通株式会社 | 文書校正装置 |
JP2001134600A (ja) | 1999-11-08 | 2001-05-18 | Nec Corp | 情報抽出システム、情報抽出方法および情報抽出用プログラムを記録した記録媒体 |
JP2002024211A (ja) | 2000-06-30 | 2002-01-25 | Hitachi Ltd | 文書管理方法およびシステム並びにその処理プログラムを格納した記憶媒体 |
JP2002056354A (ja) | 2000-08-14 | 2002-02-20 | Toshiba Corp | 光学的文字読取装置および同装置のデータ修正方法 |
JP3832281B2 (ja) | 2001-06-27 | 2006-10-11 | 日本電気株式会社 | 外れ値ルール生成装置と外れ値検出装置、その外れ値ルール生成方法と外れ値検出方法及びそのプログラム |
JP4861573B2 (ja) | 2001-08-02 | 2012-01-25 | 株式会社 ワールドフュージョン | 研究遺伝子産物の重要性を予測するシステム |
JP2003167870A (ja) | 2001-11-29 | 2003-06-13 | Fujitsu Ltd | 文書処理装置、およびプログラム |
US8316001B1 (en) | 2002-07-22 | 2012-11-20 | Ipvision, Inc. | Apparatus and method for performing analyses on data derived from a web-based search engine |
JP4737914B2 (ja) | 2002-10-02 | 2011-08-03 | ケープレックス・インク | 文書改訂支援プログラム及び当該支援プログラムを記録したコンピュータ読み取り可能媒体、並びに文書改訂支援装置。 |
JP4186774B2 (ja) | 2003-09-25 | 2008-11-26 | 沖電気工業株式会社 | 情報抽出装置,情報抽出方法,およびプログラム |
US20050144177A1 (en) | 2003-11-26 | 2005-06-30 | Hodes Alan S. | Patent analysis and formulation using ontologies |
JP2005190338A (ja) | 2003-12-26 | 2005-07-14 | Toshiba Corp | 情報抽出装置および情報抽出方法 |
US20050261889A1 (en) * | 2004-05-20 | 2005-11-24 | Fujitsu Limited | Method and apparatus for extracting information, and computer product |
JP4347226B2 (ja) * | 2004-05-20 | 2009-10-21 | 富士通株式会社 | 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法 |
JP4534666B2 (ja) | 2004-08-24 | 2010-09-01 | 富士ゼロックス株式会社 | テキスト文検索装置及びテキスト文検索プログラム |
JP4713870B2 (ja) | 2004-10-13 | 2011-06-29 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー. | 文書分類装置、方法、プログラム |
JP4600045B2 (ja) * | 2005-01-07 | 2010-12-15 | 日本電気株式会社 | 意見抽出用学習装置及び意見抽出用分類装置 |
US20060242130A1 (en) * | 2005-04-23 | 2006-10-26 | Clenova, Llc | Information retrieval using conjunctive search and link discovery |
AU2005201758B2 (en) | 2005-04-27 | 2008-12-18 | Canon Kabushiki Kaisha | Method of learning associations between documents and data sets |
KR20080021017A (ko) | 2005-05-13 | 2008-03-06 | 커틴 유니버시티 오브 테크놀로지 | 텍스트 기반의 문서 비교 |
WO2006126409A1 (ja) | 2005-05-26 | 2006-11-30 | Sharp Kabushiki Kaisha | 特許情報分析装置、特許情報分析方法、特許情報分析プログラム、およびコンピュータ読み取り可能な記録媒体 |
JP4565106B2 (ja) | 2005-06-23 | 2010-10-20 | 独立行政法人情報通信研究機構 | 二項関係抽出装置,二項関係抽出処理を用いた情報検索装置,二項関係抽出処理方法,二項関係抽出処理を用いた情報検索処理方法,二項関係抽出処理プログラム,および二項関係抽出処理を用いた情報検索処理プログラム |
US7809551B2 (en) | 2005-07-01 | 2010-10-05 | Xerox Corporation | Concept matching system |
US20070073653A1 (en) | 2005-09-29 | 2007-03-29 | Caterpillar Inc. | Patent related search method and system |
WO2008120030A1 (en) | 2007-04-02 | 2008-10-09 | Sobha Renaissance Information | Latent metonymical analysis and indexing [lmai] |
JP2009075733A (ja) | 2007-09-19 | 2009-04-09 | Toshiba Corp | 候補表示装置及び方法 |
US9384175B2 (en) | 2008-02-19 | 2016-07-05 | Adobe Systems Incorporated | Determination of differences between electronic documents |
US8645391B1 (en) | 2008-07-03 | 2014-02-04 | Google Inc. | Attribute-value extraction from structured documents |
JP5238418B2 (ja) | 2008-09-09 | 2013-07-17 | 株式会社東芝 | 情報推薦装置および情報推薦方法 |
WO2010030794A1 (en) * | 2008-09-10 | 2010-03-18 | Digital Infuzion, Inc. | Machine learning methods and systems for identifying patterns in data |
US8346534B2 (en) | 2008-11-06 | 2013-01-01 | University of North Texas System | Method, system and apparatus for automatic keyword extraction |
JP5359389B2 (ja) | 2009-03-06 | 2013-12-04 | 大日本印刷株式会社 | データ分析支援装置、データ分析支援システム、及びプログラム |
JP4897846B2 (ja) | 2009-03-17 | 2012-03-14 | ヤフー株式会社 | 関連情報提供装置、そのシステム、そのプログラム、および、その方法 |
JP5424001B2 (ja) | 2009-04-15 | 2014-02-26 | 日本電気株式会社 | 学習データ生成装置、固有表現抽出システム、学習データ生成方法、及びプログラム |
US9235563B2 (en) | 2009-07-02 | 2016-01-12 | Battelle Memorial Institute | Systems and processes for identifying features and determining feature associations in groups of documents |
EP2478423A1 (en) * | 2009-09-17 | 2012-07-25 | Siemens Aktiengesellschaft | Supervised fault learning using rule-generated samples for machine condition monitoring |
US8321357B2 (en) | 2009-09-30 | 2012-11-27 | Lapir Gennady | Method and system for extraction |
JP2011108085A (ja) | 2009-11-19 | 2011-06-02 | Nippon Hoso Kyokai <Nhk> | 知識構築装置およびプログラム |
JP5356197B2 (ja) | 2009-12-01 | 2013-12-04 | 株式会社日立製作所 | 単語意味関係抽出装置 |
JP2011232871A (ja) | 2010-04-26 | 2011-11-17 | Sony Corp | 情報処理装置、テキスト選択方法及びプログラム |
JP5577546B2 (ja) * | 2010-05-13 | 2014-08-27 | 株式会社日立製作所 | 計算機システム |
US9189748B2 (en) * | 2010-05-24 | 2015-11-17 | Nec Corporation | Information extraction system, method, and program |
US8566360B2 (en) | 2010-05-28 | 2013-10-22 | Drexel University | System and method for automatically generating systematic reviews of a scientific field |
JP5640773B2 (ja) * | 2011-01-28 | 2014-12-17 | 富士通株式会社 | 情報照合装置、情報照合方法および情報照合プログラム |
CN102820253B (zh) | 2011-06-08 | 2014-04-16 | 中国科学院上海微系统与信息技术研究所 | 一种基于soi衬底的高迁移率双沟道材料的制备方法 |
US9176949B2 (en) | 2011-07-06 | 2015-11-03 | Altamira Technologies Corporation | Systems and methods for sentence comparison and sentence-based search |
US9098600B2 (en) | 2011-09-14 | 2015-08-04 | International Business Machines Corporation | Deriving dynamic consumer defined product attributes from input queries |
KR101127883B1 (ko) | 2011-09-26 | 2012-03-21 | 한국과학기술정보연구원 | 기술 생명 주기 그래프를 이용한 기술 추이 제공 방법 및 시스템 |
US20130086093A1 (en) | 2011-10-03 | 2013-04-04 | Steven W. Lundberg | System and method for competitive prior art analytics and mapping |
JP2013105321A (ja) | 2011-11-14 | 2013-05-30 | Hitachi Ltd | 文書処理装置、文書構成要素間の関係解析方法およびプログラム |
JP2013143039A (ja) | 2012-01-11 | 2013-07-22 | Canon Inc | 頻出パターン抽出装置、頻出パターン抽出方法、及びプログラム |
JP5870790B2 (ja) | 2012-03-19 | 2016-03-01 | 富士通株式会社 | 文章校正装置、及び文章校正方法 |
US9858609B2 (en) | 2012-06-27 | 2018-01-02 | Rakuten, Inc. | Information processing apparatus, information processing method, and information processing program |
JP6025520B2 (ja) | 2012-11-26 | 2016-11-16 | 株式会社日立製作所 | データ分析支援処理システム及び方法 |
JP6061337B2 (ja) | 2013-01-17 | 2017-01-18 | Kddi株式会社 | 規則生成装置及び抽出装置 |
WO2014169334A1 (en) | 2013-04-15 | 2014-10-23 | Contextual Systems Pty Ltd | Methods and systems for improved document comparison |
JP6150282B2 (ja) * | 2013-06-27 | 2017-06-21 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及びコンピュータプログラム |
KR101485940B1 (ko) | 2013-08-23 | 2015-01-27 | 네이버 주식회사 | 시멘틱 뎁스 구조 기반의 검색어 제시 시스템 및 방법 |
JP6505421B2 (ja) | 2014-11-19 | 2019-04-24 | 株式会社東芝 | 情報抽出支援装置、方法およびプログラム |
US20170075877A1 (en) | 2015-09-16 | 2017-03-16 | Marie-Therese LEPELTIER | Methods and systems of handling patent claims |
EP3151131A1 (en) | 2015-09-30 | 2017-04-05 | Hitachi, Ltd. | Apparatus and method for executing an automated analysis of data, in particular social media data, for product failure detection |
JP6775935B2 (ja) | 2015-11-04 | 2020-10-28 | 株式会社東芝 | 文書処理装置、方法、およびプログラム |
JP2017091463A (ja) | 2015-11-17 | 2017-05-25 | 株式会社東芝 | 校正装置、方法およびプログラム |
JP6490607B2 (ja) | 2016-02-09 | 2019-03-27 | 株式会社東芝 | 材料推薦装置 |
JP6721179B2 (ja) * | 2016-10-05 | 2020-07-08 | 国立研究開発法人情報通信研究機構 | 因果関係認識装置及びそのためのコンピュータプログラム |
-
2016
- 2016-11-17 JP JP2016224305A patent/JP6622172B2/ja active Active
-
2017
- 2017-08-29 US US15/689,975 patent/US11481663B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11481663B2 (en) | 2022-10-25 |
JP2018081569A (ja) | 2018-05-24 |
US20180137435A1 (en) | 2018-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6622172B2 (ja) | 情報抽出支援装置、情報抽出支援方法およびプログラム | |
US11501210B1 (en) | Adjusting confidence thresholds based on review and ML outputs | |
CN111046152B (zh) | Faq问答对自动构建方法、装置、计算机设备及存储介质 | |
US9898464B2 (en) | Information extraction supporting apparatus and method | |
JP5040925B2 (ja) | 情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラム | |
US20160117405A1 (en) | Information Processing Method and Apparatus | |
US11520835B2 (en) | Learning system, learning method, and program | |
CN113707300A (zh) | 基于人工智能的搜索意图识别方法、装置、设备及介质 | |
JP2008129692A (ja) | 回答支援装置、回答支援システム、回答支援方法および回答支援プログラム | |
JP2017091479A (ja) | 学習支援システム、学習支援方法、学習支援装置、および学習支援プログラム | |
JP6334587B2 (ja) | 単語抽出装置、方法、及びプログラム | |
JP2006023968A (ja) | 固有表現抽出方法および装置並びにそれらに用いるプログラム | |
US20220207900A1 (en) | Information processing apparatus, information processing method, and storage medium | |
JP2020119087A (ja) | 文書審査支援方法、文書審査支援装置及びコンピュータプログラム | |
US11861512B1 (en) | Determining content to present for human review | |
US10606875B2 (en) | Search support apparatus and method | |
JPWO2014170965A1 (ja) | 文書処理方法、文書処理装置および文書処理プログラム | |
JP6804913B2 (ja) | 表構造推定システムおよび方法 | |
CN111967227A (zh) | 协同修改说明书的方法、装置、设备及存储介质 | |
US20210200953A1 (en) | Named-entity extraction apparatus, method, and non-transitory computer readable storage medium | |
US11928558B1 (en) | Providing content reviews based on AI/ML output | |
US20150363383A1 (en) | Input support system, input support method and input support program | |
JP2013196091A (ja) | データ修正装置 | |
US20240231764A9 (en) | Automatic program code generation device and program | |
JP6437899B2 (ja) | 文書校正支援装置、文書校正支援方法、および文書校正支援プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180912 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190827 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191009 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191023 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191121 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6622172 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |