JPWO2008093569A1 - 情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラム - Google Patents
情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラム Download PDFInfo
- Publication number
- JPWO2008093569A1 JPWO2008093569A1 JP2008556057A JP2008556057A JPWO2008093569A1 JP WO2008093569 A1 JPWO2008093569 A1 JP WO2008093569A1 JP 2008556057 A JP2008556057 A JP 2008556057A JP 2008556057 A JP2008556057 A JP 2008556057A JP WO2008093569 A1 JPWO2008093569 A1 JP WO2008093569A1
- Authority
- JP
- Japan
- Prior art keywords
- extraction
- rule
- information
- rules
- relation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/046—Forward inferencing; Production systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
Description
本発明は、情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラムに関し、特に情報を抽出するための抽出規則の作成を支援する情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラムに関する。
特許文献1に記載された情報抽出システムでは、事前に膨大な教師データを必要とする。さらに、教師データを人手により作成するため、教師データの作成に膨大な作業量を必要とする。また、特許文献2に記載されたような情報抽出装置では、逐次的な教師データの入力を支援するものの、依然として大量の教師データを必要とし、また入力の量を多く必要とする。
2 記憶装置
3 入力装置
4 出力装置
10 抽出規則入力手段
11 抽出規則適用手段
12 規則関係生成手段
13 規則関係出力手段
14 抽出規則生成手段
15 抽出規則絞込手段
16 抽出対象選出手段
20 抽出対象文書記憶部
21 抽出結果記憶部
22 規則関係記憶部
以下、本発明の第1の実施の形態について図面を参照して説明する。図1は、本発明による情報抽出規則作成支援システムの構成の一例を示すブロック図である。なお、情報抽出規則作成支援システムは、電子文書から所望の情報を抽出するための規則である抽出規則を作成する作業を支援するために用いられる。また、情報抽出規則作成支援システムは、例えば、電子文書からユーザが所望する情報を効率的に抽出する情報抽出システムや、ユーザが所望する情報を検索する情報検索システムの用途に適用できる。
次に、本発明の第2の実施の形態について図面を参照して説明する。図3は、第2の実施の形態における情報抽出規則作成支援システムの構成例を示すブロック図である。図3に示すように、本実施の形態では、情報抽出規則作成支援システムが、図1に示した構成要素に加えて、入力装置3(例えば、キーボードやマウス)を有する点で、第1の実施の形態と異なる。また、本実施の形態では、データ処理装置1が、図1に示した構成要素に加えて抽出規則生成手段14を有する点で、第1の実施の形態と異なる。また、本実施の形態では、データ処理装置1が、図1に示した構成要素のうち抽出規則入力手段10を有さない点で、第1の実施の形態と異なる。
次に、本発明の第3の実施の形態について図面を参照して説明する。図5は、第3の実施の形態における情報抽出規則作成支援システムの構成例を示すブロック図である。図5に示すように、本実施の形態では、データ処理装置1が、図1に示したデータ処理装置1の規則関係出力手段13に代えて抽出規則絞込手段15を有する点で、第1の実施の形態と異なる。また、本実施の形態では、情報抽出規則作成支援システムが、図1に示した構成要素に加えて、入力装置3(例えば、キーボードやマウス)と、出力装置4(例えば、ディスプレイ装置等の表示装置や、プリンタ等の印刷装置)とを有する点で、第1の実施の形態と異なる。
次に、本発明の第4の実施の形態について図面を参照して説明する。図7は、第4の実施の形態における情報抽出規則作成支援システムの構成例を示すブロック図である。図7に示すように、本実施の形態では、データ処理装置1が、図5に示したデータ処理装置1の抽出規則入力手段10に代えて、抽出規則生成手段14を有している点で、第3の実施の形態と異なる。
次に、本発明の第5の実施の形態について図面を参照して説明する。図9は、第5の実施の形態における情報抽出規則作成支援システムの構成例を示すブロック図である。図9に示すように、本実施の形態では、データ処理装置1が、図7に示したデータ処理装置1の構成要素に加えて抽出対象選出手段16を有する点で、第4の実施の形態と異なる。
続いて、中央演算装置は、図17に示される抽出規則IDが1,2,3,4である抽出規則間で抽出結果を比較すると、抽出規則間に包含関係を有する場合にリンクとして、図18に示すような関係を得る(求める)。図18は、包含関係を有する抽出規則間をリンクとした場合のそのリンクの情報を示す規則関係ネットワークのデータを示す説明図である。
本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素の多様な組み合わせないし選択が可能である。
Claims (26)
- 情報抽出対象の電子文書である抽出対象文書を記憶する記憶手段と、
前記抽出対象文書から情報を抽出するための規則である複数の抽出規則を入力する入力手段と、
前記入力手段が入力した前記各抽出規則を用いて、前記記憶手段が記憶する前記抽出対象文書から、前記各抽出規則に合致する抽出結果をそれぞれ求める情報抽出手段と、
前記情報抽出手段が求めた各抽出結果の間の重複関係又は包含関係を分析して、分析した結果に基づいて前記各抽出規則をリンク付けることによって、前記各抽出規則の関係を示す規則関係ネットワークを生成する規則関係生成手段とを
備えたことを特徴とする情報抽出規則作成支援システム。 - 情報抽出対象の電子文書である抽出対象文書を記憶する記憶手段と、
前記抽出対象文書から情報を抽出するための規則である抽出規則を生成するための電子文書である抽出規則生成用文書と、当該抽出規則生成用文書中の抽出箇所を示す指示情報とを入力する入力手段と、
前記入力手段が入力した前記抽出規則生成用文書及び前記指示情報に基づいて、前記指示情報で指定される抽出箇所の情報を抽出するための抽出規則を複数生成する抽出規則生成手段と、
前記抽出規則生成手段が生成した前記各抽出規則を用いて、前記記憶手段が記憶する前記抽出対象文書から、前記各抽出規則に合致する抽出結果をそれぞれ求める情報抽出手段と、
前記情報抽出手段が求めた各抽出結果の間の重複関係又は包含関係を分析して、分析した結果に基づいて前記各抽出規則をリンク付けることによって、前記各抽出規則の関係を示す規則関係ネットワークを生成する規則関係生成手段とを
備えたことを特徴とする情報抽出規則作成支援システム。 - 前記規則関係生成手段は、前記情報抽出手段が求めた各抽出結果の間の重複関係を分析して前記各抽出結果の間の重複関係を示す重複率を求め、求めた前記重複率に基づいて、対応する抽出規則をリンク付ける請求項1又は請求項2記載の情報抽出規則作成支援システム。
- 前記規則関係生成手段は、前記情報抽出手段が求めた各抽出結果の間に包含関係がある場合にのみ、対応する抽出規則をリンク付ける請求項1又は請求項2記載の情報抽出規則作成支援システム。
- 前記規則関係生成手段が生成した前記規則関係ネットワークを、各抽出規則の関係を示す規則関係情報として出力する出力手段を備えた請求項1から請求項4のうちのいずれか1項に記載の情報抽出規則作成支援システム。
- 前記規則関係生成手段が生成した前記規則関係ネットワークと、前記規則関係ネットワークでリンク付けられた抽出規則に対応する抽出結果の差分を示す情報とを、各抽出規則の関係を示す規則関係情報として出力する出力手段を備えた請求項1から請求項4のうちのいずれか1項に記載の情報抽出規則作成支援システム。
- 抽出規則の絞り込みを行なう抽出規則絞込手段を備え、
前記抽出規則絞込手段は、
所定の優先度に基づいて、前記規則関係生成手段が生成した前記規則関係ネットワークに含まれるリンクを選択し、
選択したリンクに対応する各抽出規則を用いて情報抽出を行なったときの抽出結果を含む提示情報を生成し、
前記提示情報に含まれる抽出結果に対する正否を示す判定情報を入力し、
入力した前記判定情報と前記規則関係ネットワークとに基づいて、1つ以上の抽出規則について採用の正否を判定する
請求項1から請求項6のうちのいずれか1項に記載の情報抽出規則作成支援システム。 - 抽出規則の絞り込みを行なう抽出規則絞込手段を備え、
前記抽出規則絞込手段は、
所定の優先度に基づいて、前記規則関係生成手段が生成した前記規則関係ネットワークに含まれるリンクを選択し、
選択したリンクに対応する各抽出規則のうち、抽出規則を用いて情報抽出を行なったときの抽出結果が多い方の抽出規則を用いて抽出した抽出結果であり、かつ抽出規則を用いて情報抽出を行なったときの抽出結果が少ない方の抽出規則の抽出結果ではない情報を少なくとも含む提示情報を生成し、
前記提示情報に含まれる抽出結果に対する正否を示す判定情報を入力し、
入力した前記判定情報と前記規則関係ネットワークとに基づいて、1つ以上の抽出規則について採用の正否を判定する
請求項1から請求項6のうちのいずれか1項に記載の情報抽出規則作成支援システム。 - 前記抽出規則絞込手段は、前記規則関係生成手段が生成した前記規則関係ネットワークでリンク付けられた抽出規則に対応する抽出結果の数の比率に基づいて、抽出規則を選択する請求項7又は請求項8記載の情報抽出規則作成支援システム。
- 前記抽出規則絞込手段は、前記規則関係生成手段が生成した前記規則関係ネットワークでリンク付けられた抽出規則の子孫ノードの数に基づいて、抽出規則を選択する請求項7又は請求項8記載の情報抽出規則作成支援システム。
- 前記抽出規則絞込手段は、前記規則関係生成手段が生成した前記規則関係ネットワークでリンク付けられた抽出規則に対応する抽出結果の数の比率と、前記規則関係ネットワークでリンク付けられた抽出規則の子孫ノードの数を用いて算出されるスコア値とに基づいて、抽出規則を選択する請求項7又は請求項8記載の情報抽出規則作成支援システム。
- 前記抽出規則絞込手段により採用と判定された抽出規則を用いて情報抽出を行ったときの抽出結果より、過去に指示情報で指定された抽出箇所の情報とは異なる情報を選出する情報選出手段を備え、
前記情報選出手段は、選出した情報と、選出した情報を含む抽出対象文書を特定可能な情報とを含む抽出対象文書を出力する機能を有する
請求項7又は請求項8記載の情報抽出規則作成支援システム。 - 情報抽出対象の電子文書である抽出対象文書を記憶装置に記憶する記憶ステップと、
前記抽出対象文書から情報を抽出するための規則である複数の抽出規則を入力する入力ステップと、
入力した前記各抽出規則を用いて、前記記憶装置が記憶する前記抽出対象文書から、前記各抽出規則に合致する抽出結果をそれぞれ求める情報抽出ステップと、
求めた各抽出結果の間の重複関係又は包含関係を分析して、分析した結果に基づいて前記各抽出規則をリンク付けることによって、前記各抽出規則の関係を示す規則関係ネットワークを生成する規則関係生成ステップとを
含むことを特徴とする情報抽出規則作成支援方法。 - 情報抽出対象の電子文書である抽出対象文書を記憶装置に記憶する記憶ステップと、
前記抽出対象文書から情報を抽出するための規則である抽出規則を生成するための電子文書である抽出規則生成用文書と、当該抽出規則生成用文書中の抽出箇所を示す指示情報とを入力する入力ステップと、
入力した前記抽出規則生成用文書及び前記指示情報に基づいて、前記指示情報で指定される抽出箇所の情報を抽出するための抽出規則を複数生成する抽出規則生成ステップと、
生成した前記各抽出規則を用いて、前記記憶装置が記憶する前記抽出対象文書から、前記各抽出規則に合致する抽出結果をそれぞれ求める情報抽出ステップと、
求めた各抽出結果の間の重複関係又は包含関係を分析して、分析した結果に基づいて前記各抽出規則をリンク付けることによって、前記各抽出規則の関係を示す規則関係ネットワークを生成する規則関係生成ステップとを
含むことを特徴とする情報抽出規則作成支援方法。 - 前記規則関係生成ステップで、求めた各抽出結果の間の重複関係を分析して前記各抽出結果の間の重複関係を示す重複率を求め、求めた前記重複率に基づいて、対応する抽出規則をリンク付ける請求項13又は請求項14記載の情報抽出規則作成支援方法。
- 前記規則関係生成ステップで、求めた各抽出結果の間に包含関係がある場合にのみ、対応する抽出規則をリンク付ける請求項13又は請求項14記載の情報抽出規則作成支援方法。
- 生成した前記規則関係ネットワークを、各抽出規則の関係を示す規則関係情報として出力する出力ステップを含む請求項13から請求項16のうちのいずれか1項に記載の情報抽出規則作成支援方法。
- 生成した前記規則関係ネットワークと、前記規則関係ネットワークでリンク付けられた抽出規則に対応する抽出結果の差分を示す情報とを、各抽出規則の関係を示す規則関係情報として出力する出力ステップを含む請求項13から請求項16のうちのいずれか1項に記載の情報抽出規則作成支援方法。
- 抽出規則の絞り込みを行なう抽出規則絞込ステップを含み、
前記抽出規則絞込ステップで、
所定の優先度に基づいて、生成した前記規則関係ネットワークに含まれるリンクを選択し、
選択したリンクに対応する各抽出規則を用いて情報抽出を行なったときの抽出結果を含む提示情報を生成し、
前記提示情報に含まれる抽出結果に対する正否を示す判定情報を入力し、
入力した前記判定情報と前記規則関係ネットワークとに基づいて、1つ以上の抽出規則について採用の正否を判定する
請求項13から請求項18のうちのいずれか1項に記載の情報抽出規則作成支援方法。 - 抽出規則の絞り込みを行なう抽出規則絞込ステップを含み、
前記抽出規則絞込ステップで、
所定の優先度に基づいて、生成した前記規則関係ネットワークに含まれるリンクを選択し、
選択したリンクに対応する各抽出規則のうち、抽出規則を用いて情報抽出を行なったときの抽出結果が多い方の抽出規則を用いて抽出した抽出結果であり、かつ抽出規則を用いて情報抽出を行なったときの抽出結果が少ない方の抽出規則の抽出結果ではない情報を少なくとも含む提示情報を生成し、
前記提示情報に含まれる抽出結果に対する正否を示す判定情報を入力し、
入力した前記判定情報と前記規則関係ネットワークとに基づいて、1つ以上の抽出規則について採用の正否を判定する
請求項13から請求項18のうちのいずれか1項に記載の情報抽出規則作成支援方法。 - 前記抽出規則絞込ステップで、生成した前記規則関係ネットワークでリンク付けられた抽出規則に対応する抽出結果の数の比率に基づいて、抽出規則を選択する請求項19又は請求項20記載の情報抽出規則作成支援方法。
- 前記抽出規則絞込ステップで、生成した前記規則関係ネットワークでリンク付けられた抽出規則の子孫ノードの数に基づいて、抽出規則を選択する請求項19又は請求項20記載の情報抽出規則作成支援方法。
- 前記抽出規則絞込ステップで、生成した前記規則関係ネットワークでリンク付けられた抽出規則に対応する抽出結果の数の比率と、前記規則関係ネットワークでリンク付けられた抽出規則の子孫ノードの数を用いて算出されるスコア値とに基づいて、抽出規則を選択する請求項19又は請求項20記載の情報抽出規則作成支援方法。
- 採用と判定された抽出規則を用いて情報抽出を行ったときの抽出結果より、過去に指示情報で指定された抽出箇所の情報とは異なる情報を選出する情報選出ステップを含み、
前記情報選出ステップで、選出した情報と、選出した情報を含む抽出対象文書を特定可能な情報とを含む抽出対象文書を出力する
請求項19又は請求項20記載の情報抽出規則作成支援方法。 - 情報抽出対象の電子文書である抽出対象文書を記憶する記憶手段を備えたコンピュータに、
前記抽出対象文書から情報を抽出するための規則である複数の抽出規則を入力する入力処理と、
入力した前記各抽出規則を用いて、前記記憶手段が記憶する前記抽出対象文書から、前記各抽出規則に合致する抽出結果をそれぞれ求める情報抽出処理と、
求めた各抽出結果の間の重複関係又は包含関係を分析して、分析した結果に基づいて前記各抽出規則をリンク付けることによって、前記各抽出規則の関係を示す規則関係ネットワークを生成する規則関係生成処理とを
実行させるための情報抽出規則作成支援プログラム。 - 情報抽出対象の電子文書である抽出対象文書を記憶する記憶手段を備えたコンピュータに、
前記抽出対象文書から情報を抽出するための規則である抽出規則を生成するための電子文書である抽出規則生成用文書と、当該抽出規則生成用文書中の抽出箇所を示す指示情報とを入力する入力処理と、
入力した前記抽出規則生成用文書及び前記指示情報に基づいて、前記指示情報で指定される抽出箇所の情報を抽出するための抽出規則を複数生成する抽出規則生成処理と、
生成した前記各抽出規則を用いて、前記記憶装置が記憶する前記抽出対象文書から、前記各抽出規則に合致する抽出結果をそれぞれ求める情報抽出処理と、
求めた各抽出結果の間の重複関係又は包含関係を分析して、分析した結果に基づいて前記各抽出規則をリンク付けることによって、前記各抽出規則の関係を示す規則関係ネットワークを生成する規則関係生成処理とを
実行させるための情報抽出規則作成支援プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008556057A JP5040925B2 (ja) | 2007-01-29 | 2008-01-22 | 情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007018583 | 2007-01-29 | ||
JP2007018583 | 2007-01-29 | ||
JP2008556057A JP5040925B2 (ja) | 2007-01-29 | 2008-01-22 | 情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラム |
PCT/JP2008/050823 WO2008093569A1 (ja) | 2007-01-29 | 2008-01-22 | 情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008093569A1 true JPWO2008093569A1 (ja) | 2010-05-20 |
JP5040925B2 JP5040925B2 (ja) | 2012-10-03 |
Family
ID=39673881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008556057A Active JP5040925B2 (ja) | 2007-01-29 | 2008-01-22 | 情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8380650B2 (ja) |
JP (1) | JP5040925B2 (ja) |
WO (1) | WO2008093569A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110765778B (zh) * | 2019-10-23 | 2023-08-29 | 北京锐安科技有限公司 | 一种标签实体处理方法、装置、计算机设备和存储介质 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9928260B2 (en) * | 2008-02-11 | 2018-03-27 | Nuix Pty Ltd | Systems and methods for scalable delocalized information governance |
US8065116B2 (en) * | 2008-10-08 | 2011-11-22 | Robert Bosch Gmbh | Systems, methods, and tools for proofing a computer-aided design object |
US8095341B2 (en) | 2008-10-08 | 2012-01-10 | Robert Bosch Gmbh | Systems, methods, and tools for proofing a computer-aided design object |
US20100087943A1 (en) * | 2008-10-08 | 2010-04-08 | Robert Bosch Gmbh | Systems, methods, and tools for proofing a computer-aided design object |
JP5326781B2 (ja) * | 2009-04-30 | 2013-10-30 | 日本電気株式会社 | 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム |
JP5340847B2 (ja) * | 2009-07-27 | 2013-11-13 | 株式会社日立ソリューションズ | 文書データ処理装置 |
JP5317922B2 (ja) * | 2009-10-16 | 2013-10-16 | 株式会社野村総合研究所 | 情報抽出ルール作成支援システム |
US8417709B2 (en) * | 2010-05-27 | 2013-04-09 | International Business Machines Corporation | Automatic refinement of information extraction rules |
US9076152B2 (en) * | 2010-10-20 | 2015-07-07 | Microsoft Technology Licensing, Llc | Semantic analysis of information |
CN102737125B (zh) * | 2012-06-15 | 2014-05-21 | 武汉大学 | 基于Web时态对象模型的过时网页信息自动发现方法 |
KR20150130387A (ko) | 2013-03-15 | 2015-11-23 | 테라노스, 인코포레이티드 | 시료 준비용 기기, 시스템 및 방법 |
FR3027130B1 (fr) * | 2014-10-14 | 2016-12-30 | Airbus Operations Sas | Integration automatique de donnees relatives a une operation de maintenance |
CN104866629B (zh) * | 2015-06-16 | 2018-08-31 | 成都博元科技有限公司 | 基于模糊理论的大数据信息挖掘方法 |
CN108701339A (zh) | 2016-02-23 | 2018-10-23 | 开利公司 | 从自然语言文档中提取策略以用于物理访问控制 |
US11874873B2 (en) | 2018-03-07 | 2024-01-16 | Nec Corporation | Knowledge expansion system, method, and program |
CN110032739B (zh) * | 2019-04-18 | 2021-07-13 | 清华大学 | 中文电子病历命名实体抽取方法及系统 |
US11501183B2 (en) * | 2019-07-15 | 2022-11-15 | HCL Australia Services Pty. Ltd | Generating a recommendation associated with an extraction rule for big-data analysis |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6353840B2 (en) * | 1997-08-15 | 2002-03-05 | Ricoh Company, Ltd. | User-defined search template for extracting information from documents |
JPH11259524A (ja) * | 1998-03-06 | 1999-09-24 | Omron Corp | 情報検索システム、情報検索システムにおける情報処理方法および記録媒体 |
JP2000132556A (ja) * | 1998-10-22 | 2000-05-12 | Hitachi Ltd | 障害情報検索支援方法 |
JP2001318792A (ja) | 2000-05-10 | 2001-11-16 | Nippon Telegr & Teleph Corp <Ntt> | 固有表現抽出規則生成システムと方法およびその処理プログラムを記録した記録媒体ならびに固有表現抽出装置 |
JP2006023968A (ja) | 2004-07-08 | 2006-01-26 | Hitachi Ltd | 固有表現抽出方法および装置並びにそれらに用いるプログラム |
JP2006040166A (ja) * | 2004-07-29 | 2006-02-09 | Oki Electric Ind Co Ltd | 情報抽出装置、情報抽出方法、情報抽出プログラム及び情報検索システム |
JP4856925B2 (ja) * | 2005-10-07 | 2012-01-18 | 株式会社リコー | 画像処理装置、画像処理方法及び画像処理プログラム |
-
2008
- 2008-01-22 JP JP2008556057A patent/JP5040925B2/ja active Active
- 2008-01-22 US US12/524,179 patent/US8380650B2/en active Active
- 2008-01-22 WO PCT/JP2008/050823 patent/WO2008093569A1/ja active Application Filing
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110765778B (zh) * | 2019-10-23 | 2023-08-29 | 北京锐安科技有限公司 | 一种标签实体处理方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US8380650B2 (en) | 2013-02-19 |
US20100005049A1 (en) | 2010-01-07 |
WO2008093569A1 (ja) | 2008-08-07 |
JP5040925B2 (ja) | 2012-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5040925B2 (ja) | 情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラム | |
KR100650427B1 (ko) | 자연어 인식 애플리케이션 구축을 위한 통합 개발 툴 | |
CN101739335B (zh) | 建议的应用评估系统 | |
JP5370159B2 (ja) | 情報抽出装置及び情報抽出システム | |
US20060167873A1 (en) | Editor for deriving regular expressions by example | |
US8533140B2 (en) | Method and system for design check knowledge construction | |
WO2006046523A1 (ja) | 文書解析システム、及び文書適応システム | |
US11243971B2 (en) | System and method of database creation through form design | |
JPWO2006038498A1 (ja) | 配列の生成方法、及び、配列生成プログラム | |
US7401071B2 (en) | Structured data retrieval apparatus, method, and computer readable medium | |
JP2010015458A (ja) | プログラム修正支援システム、プログラム修正支援方法、およびプログラム修正支援プログラム | |
CN110188207A (zh) | 知识图谱构建方法及装置、可读存储介质、电子设备 | |
JP2021089668A (ja) | 情報処理装置及びプログラム | |
JP2015162004A (ja) | 開発ドキュメント間トレースリンク生成支援装置及び方法及びプログラム | |
JP2007257369A (ja) | 情報検索装置 | |
JPH08255253A (ja) | グラフ表示処理装置およびグラフ表示処理方法 | |
JP2003281149A (ja) | アクセス権限設定方法および構造化文書管理システム | |
WO2014170965A1 (ja) | 文書処理方法、文書処理装置および文書処理プログラム | |
JP5648336B2 (ja) | 不整合検出装置、プログラム及び方法、修正支援装置、プログラム及び方法 | |
US20100138735A1 (en) | Document processing device | |
JP2006277282A (ja) | モデル評価解析システムおよびモデル評価解析プログラム | |
JPH09245052A (ja) | 構造化文書処理装置 | |
JP2001344230A (ja) | マルチメディア文書生成装置及び方法、及びこれらをコンピュータに実行させるプログラムを記録した記録媒体 | |
JP2005173671A (ja) | リンク診断装置、リンク診断方法およびリンク診断プログラム。 | |
JP6807201B2 (ja) | 情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120612 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120625 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5040925 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150720 Year of fee payment: 3 |