JP2008027431A - 情報解析装置、情報解析方法、及び情報解析プログラム - Google Patents
情報解析装置、情報解析方法、及び情報解析プログラム Download PDFInfo
- Publication number
- JP2008027431A JP2008027431A JP2007163485A JP2007163485A JP2008027431A JP 2008027431 A JP2008027431 A JP 2008027431A JP 2007163485 A JP2007163485 A JP 2007163485A JP 2007163485 A JP2007163485 A JP 2007163485A JP 2008027431 A JP2008027431 A JP 2008027431A
- Authority
- JP
- Japan
- Prior art keywords
- information
- label
- classification
- extracted
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】分類情報抽出装置10は、入力したデータからテキストデータを抽出して表の要素となる一連のキーワードを取得し、取得した個々のキーワードを分類ルール4に格納された対応情報に基づいてその種類別にラベル付けし、種類別に付されたラベルの列から1単位レコードを構成するラベル順列を推定し、当該ラベル順列をレコード推定結果として出力し、1回の繰り返しパタン分のラベル列に含まれる各ラベルに相当する要素をテキストデータからそれぞれ抽出し、これをラベル列の繰り返し数分行うことで前記要素集合に含まれる特定の種類の情報を全て抽出し、抽出した各情報を一定の分類ルールに基づいて各々いずれかのカテゴリに分類し、当該分類結果を抽出する。
【選択図】図1
Description
図1は、本発明の第1の実施の形態による情報解析装置の機能構成を示すブロック図である。
図3は、本実施の形態による情報解析装置の動作を示すフローチャートである。
実施例1において、あるデータ中に図4に示すような表データ401が記述されていたとする。前述の表要素列抽出手段1を用いて、この表データ401を構成する文字列をテキストデータとして抽出し、さらに、図5に示した名前(氏名・連名を含む)や地名(住所を含む)などいずれかの種類に合致するキーワードを当該テキストデータから抽出する(図3ステップS101〜S102参照)。
以上説明した実施例1による情報解析装置10の動作にかかる一連の分類情報抽出方法によれば、テキストデータ上のキーワード列を、対応関係を示す対応情報に基づいてラベル列に1対1に置き換えることによって、1次元のラベル列のみからレコードを推定するため、見かけ上の表データがどのような構造になっているかには依存することなく、また、キーワード列内において各種類のキーワードが出現することもあれば出現しないこともあるような場合であっても、レコードを推定することができると共に、表データの各レコードにどのような情報が含まれているかを認識することができる。
図10は、図6の変形例を示すものであり、図3に示したフローチャートに対応させ、表データを構成するキーワード列から置き換えたラベル列から表データのレコード構成を表すラベル列を推定し、各レコードに含まれる情報を分類した結果を抽出する一連の流れを示した説明図である。
以上説明した実施例2による表レコード推定装置10の動作にかかる一連の分類情報抽出方法によれば、例えば、先頭の「A」のような、ラベル列を読み込む際に基準とするラベルがラベル列内の各レコードに常には出現しない場合であっても、実施例1のような効果を達成することができる。
図11は、図4の変形例を示すものであり、図11に示す表データ1101は、「住所」について、「住所」のより下位の概念を示す分類として「都道府県」及び「市区町村」を対応付け、「メールアドレス」及び「電話番号」について、「メールアドレス」及び「電話番号」のより上位の概念としての分類である「連絡先」を対応付けたものである。また、図12は、図5の変形例を示すものであり、図12に示す対応情報1201は、「電話番号」(ラベルD)及び「メールアドレス」(ラベルC)について、「電話番号」(ラベルD)及び「メールアドレス」(ラベルC)のより上位の概念としての分類である「連絡先」を示すラベルXを対応付けたものである。このことは、「連絡先」(ラベルX)について、「連絡先」(ラベルX)のより下位の概念を示す分類として「電話番号」(ラベルD)及び「メールアドレス」(ラベルC)を対応付けているともいえる。
本実施例3において、上記図6のS606や図10のS1006で示される「ABDC」は、図11で示される表データ1101及び図12で示される対応情報1201に基づいて、「ABX」が最終的なレコード推定結果となるため、図8の出力情報801に対応する出力情報は、「名・地・連」(不図示)となる。
本実施例3によれば、抽出したキーワードの種類について、抽出した複数のキーワードの種類をまとめたより上位の概念を示す種類、又は抽出したキーワードの種類を詳細に分類したより下位の概念を示す種類に階層的に任意に対応付けることができるため、入力したデータの構成を任意の階層によって推定し、各レコードに含まれる情報を分類することができる。
さらに、本発明の第2の実施の形態は、様々なファイル形式に対応する表構造解析方法を予め個別に用意しておく必要や、厳密に表データに対応するレコードの記述パタン等の体裁を持つ必要などがなく、図13に示したような自然言語文や語句のリストのみからなるテキストデータ1301からでも、上記実施例1と同様にレコードを推定できるため、以下に説明する。なお、本実施の形態のうち、上記実施の形態1や実施例1と重複する部分については適宜省略して説明する。
図14は、本実施の形態における情報解析装置の構成を示すブロック図である。
本実施の形態における情報解析装置20は、まず、データ格納手段25によって格納されているデータをテキストデータ抽出手段21を用いて参照し、各データからテキストデータを抽出する。
図23を参照して、本発明の第2の実施形態における、さらに別の動作について説明する。
このように、本実施の形態による情報解析装置20を利用すれば、例えば、個人情報や商品情報の特徴をキーワードの種類として定義した辞書を用意することにより、組織内の様々な文書(データ)から個人情報や商品情報を抽出し、一定の形式のスキーマでデータベースに記録することで、情報管理を効率化することができる。また、分類結果を元の文書と結びつけてデータベース化することにより、文書管理が容易になる。従って、本実施の形態による表レコード推定方式と同方式を用いた情報解析装置は、企業などの組織内の資産管理や情報セキュリティ管理、様々な文書の統合管理や横断的な検索に有用である。
本発明による第3の実施の形態を以下に示す。なお、本実施の形態のうち、上記各実施の形態や実施例1と重複する部分については適宜省略して説明する。
本実施の形態によれば、情報解析装置100が、通信ネットワーク200を介してデータ蓄積装置300と接続されるため、情報解析装置100においてデータ蓄積装置300を有する必要がない。また、情報解析装置100が、通信ネットワーク200を介して複数のデータ蓄積装置300と接続できるため、災害や障害等に対し、可用性等が向上する。さらに、通信ネットワーク200を介して端末装置から送られてきたEメールデータを参照することにより、情報解析装置100によって当該Eメールデータに特定種類の情報が含まれていればこれを抽出することができる等、ネットワークを介して送信又は受信される情報から所定の情報を収集することができる。
本発明による第4の実施の形態を以下に示す。なお、本実施の形態のうち、上記各実施の形態や各実施例と重複する部分については適宜省略して説明する。
このような構成により、本実施の形態によれば、予め紙文書の詳細なレイアウト構造の特徴を知る必要なく、その電子ファイリング時の文書の自動分類や、紙文書からの情報収集が可能になる。
1、1a:表要素列抽出手段
2:表要素ラベル化手段
3:ラベル出現パタン推定手段
4、4a:分類ルール
5:分割基準格納手段
6:情報抽出手段
7、7a:情報分類手段
11:CPU
12:主記憶部
13:提示部
14:入力部
15:インタフェース部
16:補助記憶部
17:システムバス
20、100、2200:情報解析装置
21:テキストデータ抽出手段
22:キーワード抽出手段
23:表レコード推定手段
24:レコード要素抽出手段
26:分類結果格納手段
27:キーワード辞書
101:メインメモリ
102:CPU
103:データ記憶装置
104:通信装置
105:プログラム
106:入力装置
107:出力装置
200:通信ネットワーク
300:データ蓄積装置
400:記憶装置
500:スキャニング装置
401、701、1101、1801:表データ
801、901:出力情報
501、1201:対応情報
1301:テキストデータ
1601:キーワードのリスト
1701:分類結果
1901、2001:分類ルール
Claims (27)
- 文字情報を含むデータの構成を解析する情報解析装置において、
前記データの文字情報から所定の文字列を抽出する文字情報抽出部と、
抽出した前記各文字列を、前記文字列の分類を表すラベルからなる一連のラベル列に変換するラベル化部と、
前記ラベル列内における前記ラベルの出現パタンを推定するラベル出現パタン推定部と、
前記推定した個々の出現パタン毎にラベルの組を抽出する推定パタン情報抽出部と、
前記抽出した出現パタン毎のラベルの組を、その組合せに基づいて分類する抽出情報分類部と、
を含むことを特徴とする情報解析装置。 - 前記文字情報抽出部は、前記文字列の分類毎に、出現順序が定められた前記文字列を含む前記データから前記所定の文字列を抽出し、
前記ラベル化部は、抽出した各前記文字列を所定の順序で種類別に前記ラベルに置き換えることによって、抽出した前記文字列を一連のラベル列に変換することを特徴とする請求項1に記載の情報解析装置。 - 前記ラベル化部は、同一種類の隣り合う2つ以上の前記文字列を1つの前記ラベルに置き換えることを特徴とする請求項1又は2に記載の情報解析装置。
- 更に、抽出した前記文字列の種類と前記文字列を置き換える前記ラベルとの対応関係を定義した対応情報を格納する対応情報格納部を備え、
前記ラベル化部は、前記対応情報に基づいて、抽出した前記文字列を種類別に前記ラベルに置き換えることを特徴とする請求項1〜3のいずれか1項に記載の情報解析装置。 - 前記ラベル出現パタン推定部は、前後の出現パタン間で欠落したラベルを補足しながら逐次的に当該出現パタンの推定を行なうことを特徴とする請求項1〜4のいずれか1項に記載の情報解析装置。
- 前記文字情報抽出部は、前記データの文字情報から前記文字列を抽出するための抽出情報を格納する抽出情報格納部を含み、前記抽出情報に基づいて、前記データの文字情報から前記文字列を抽出することを特徴とする請求項1〜5のいずれか1項に記載の情報解析装置。
- 更に、予め定めた分割基準を格納する分割基準格納部を備え、
前記文字情報抽出部は、前記抽出情報に基づいて抽出した前記文字列の集合を、予め定めた分割基準に基づいて複数の部分文字列集合に分割し、
前記ラベル化部は、前記部分文字列集合に含まれる前記文字列を種類別に前記ラベルに置き換え、
前記ラベル出現パタン推定部は、前記部分文字列集合から前記ラベル化部により置き換えられたラベル列を入力としてラベルの出現パタンを推定することを特徴とする請求項6に記載の情報解析装置。 - 前記予め定めた分割基準として、前記データ内での隣接する前記文字列間の距離が規定値以上であるか否かを設定し、
前記分割基準を満たすか否かに基づいて、各文字列を異なる部分文字列集合に含ませるか、又は、各文字列を同一の部分文字列集合に含ませることを特徴とする請求項7に記載の情報解析装置。 - 前記対応情報は、抽出した前記文字列について、分類した文字列の種類より上位の分類又はより下位の分類に関しても対応関係を定義され、
前記抽出情報分類部は、推定した前記出現パタンで表される各前記ラベルを、前記対応情報に基づいて前記置き換え前の前記各文字列の任意の分類又は該任意の分類より上位の分類又は該任意の分類より下位の分類に対応付け、所定の組合せに適合する適合文字情報を選択することによって、前記データから抽出した前記文字列を分類することを特徴とする請求項4〜8のいずれか1項に記載の情報解析装置。 - 前記推定パタン情報抽出部は、単一種類の前記文字列で成立する分類条件があれば、前記ラベル化部において同一種類の隣り合う2つ以上の前記文字列を1つの前記ラベルに置き換える処理の前に、当該分類条件に合致する前記ラベル列中のラベルを抽出することを特徴とする請求項3〜9のいずれか1項に記載の情報解析装置。
- 前記文字情報抽出部は、前記文字列として抽出するキーワードを種類毎に定義付けたキーワード情報を格納するキーワード辞書を、前記抽出情報格納部として含み、
前記文字情報抽出部は更に、文書等のデータを格納するデータ格納部と、前記データ格納部に格納されているデータを参照し、参照したデータからテキストデータを抽出するテキストデータ抽出部と、抽出されたテキストデータから前記キーワード辞書に格納されているキーワード情報に基づいてキーワードを抽出してキーワード列を前記文字列として生成するキーワード抽出部と含むことを特徴とする請求項6に記載の情報解析装置。 - 前記抽出情報分類部による前記分類結果を記憶する分類結果格納部を備えることを特徴とする請求項1〜10のいずれか1項に記載の情報解析装置。
- 請求項1〜12のいずれか1項に記載の情報解析装置と、
前記情報解析装置と通信ネットワークを介して接続され、該通信ネットワークを通じて取得したデータを格納する少なくとも1つのデータ蓄積部を含む情報解析システムであって、
前記情報解析装置における前記文字情報抽出部は、前記データ蓄積部に格納された前記データの文字情報から所定の文字列を抽出することを特徴とする情報解析システム。 - 文字情報を含むデータの構成を解析する情報解析方法であって、
前記データの文字情報から所定の文字列を抽出する文字情報抽出処理と、
抽出した前記各文字列を、前記文字列の分類を表すラベルからなる一連のラベル列に変換するラベル化処理と、
前記ラベル列内における前記ラベルの出現パタンを推定するラベル出現パタン推定処理と、
前記推定した個々の出現パタン毎にラベルの組を抽出する推定パタン情報抽出処理と、
前記抽出した出現パタン毎のラベルの組を、その組合せに基づいて分類する抽出情報分類処理と、
を含むことを特徴とする情報解析方法。 - 前記ラベル化処理においては、前記抽出した文字列の集合に含まれる同一種類の隣り合う2つ以上の前記文字列を1つの前記ラベルに置き換えることによって前記文字列を一連のラベル列に変換することを特徴とする請求項14に記載の情報解析方法。
- 更に、抽出した文字列の種類と前記文字列を置き換える前記ラベルとの対応関係を定義した対応情報を格納する対応情報格納処理を含み、
前記ラベル化処理においては、前記対応情報に基づいて、抽出した文字列を種類別に前記ラベルに置き換えることを特徴とする請求項14又は15に記載の情報解析方法。 - 前記ラベル出現パタン推定処理においては、前後の出現パタン間で欠落したラベルを補足しながら逐次的に当該出現パタンの推定を行なうことを特徴とする請求項14〜16のいずれか1項に記載の情報解析方法。
- 前記対応情報は、抽出した前記文字列について、分類した文字列の種類より上位の分類又はより下位の分類に関しても対応関係を定義され、
前記抽出情報分類部は、推定した前記出現パタンで表される前記各ラベルを、前記置き換え前の前記各文字列の任意の分類又は該任意の分類より上位の分類又は該任意の分類より下位の分類に対応付け、所定の組合せに適合する適合文字情報を選択することによって、前記データから抽出した前記文字列を分類することを特徴とする請求項16又は17に記載の情報解析方法。 - 前記推定パタン情報抽出処理においては、単一種類の前記文字列で成立する分類条件があれば、前記ラベル化処理において同一種類の隣り合う2つ以上の前記文字列を1つの前記ラベルに置き換える処理の前に、当該分類条件に合致する前記ラベル列中のラベルを抽出することを特徴とする請求項18に記載の情報解析方法。
- 更に、前記分類の結果を記憶する処理を含むことを特徴とする請求項18または19に記載の情報解析方法。
- コンピュータに、文字情報を含むデータの構成の解析を実行させるための情報解析プログラムであって、
前記データの文字情報から所定の文字列を抽出する文字情報抽出処理と、
抽出した前記各文字列を、前記文字列の分類を表すラベルからなる一連のラベル列に変換するラベル化処理と、
前記ラベル列内における前記ラベルの出現パタンを推定するラベル出現パタン推定処理と、
前記推定した個々の出現パタン毎にラベルの組を抽出する推定パタン情報抽出処理と、
前記抽出した出現パタン毎のラベルの組を、その組合せに基づいて分類する抽出情報分類処理と、
を実行させるための情報解析プログラム。 - 前記ラベル化処理においては、抽出した前記文字列の集合に含まれる同一種類の隣り合う2つ以上の前記文字列を1つの前記ラベルに置き換えることによって前記文字列を一連のラベル列に変換する処理を実行させることを特徴とする請求項21に記載の情報解析プログラム。
- 更に、抽出した文字列の種類と前記文字列を置き換える前記ラベルとの対応関係を定義した対応情報を格納する対応情報格納処理を実行させ、
前記ラベル化処理においては、前記対応情報に基づいて、抽出した文字列を種類別に前記ラベルに置き換える処理を実行させることを特徴とする請求項21又は22に記載の情報解析プログラム。 - 前記ラベル出現パタン推定処理においては、前後の出現パタン間で欠落したラベルを補足しながら逐次的に当該出現パタンの推定を実行させることを特徴とする請求項21〜23のいずれか1項に記載の情報解析プログラム。
- 前記対応情報は、抽出した前記文字列において、分類した文字列の種類より上位の分類又はより下位の分類に関しても対応関係を定義され、
前記抽出情報分類処理においては、推定した前記出現パタンで表される各前記ラベルを、前記置き換え前の各前記文字列の任意の前記分類又は該任意の分類より上位の分類又は該任意の分類より下位の分類に対応付け、所定の組合せに適合する適合文字情報を選択することによって、前記データから抽出した前記文字列を分類する処理を実行させることを特徴とする請求項21〜24のいずれか1項に記載の情報解析プログラム。 - 前記推定パタン情報抽出処理においては、単一種類の前記文字列で成立する分類条件があれば、前記ラベル化処理において同一種類の隣り合う2つ以上の前記文字列を1つの前記ラベルに置き換える処理の前に、当該分類条件に合致する前記ラベル列中のラベルを抽出する処理を実行させることを特徴とする請求項25に記載の情報解析プログラム。
- 更に、前記分類の結果を記憶する処理を実行させることを特徴とする請求項25又は26に記載の情報解析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007163485A JP5013081B2 (ja) | 2006-06-22 | 2007-06-21 | 情報解析装置、情報解析方法、及び情報解析プログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006172341 | 2006-06-22 | ||
JP2006172341 | 2006-06-22 | ||
JP2007163485A JP5013081B2 (ja) | 2006-06-22 | 2007-06-21 | 情報解析装置、情報解析方法、及び情報解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008027431A true JP2008027431A (ja) | 2008-02-07 |
JP5013081B2 JP5013081B2 (ja) | 2012-08-29 |
Family
ID=39117955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007163485A Active JP5013081B2 (ja) | 2006-06-22 | 2007-06-21 | 情報解析装置、情報解析方法、及び情報解析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5013081B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012048343A (ja) * | 2010-08-25 | 2012-03-08 | Fujifilm Corp | ドキュメント閲覧システム及びドキュメント画像配信装置並びにドキュメント閲覧方法 |
KR101621959B1 (ko) | 2015-12-23 | 2016-05-17 | 주식회사 모비젠 | 로그패턴추출장치, 로그패턴분석장치 및 그 방법 |
CN107766371A (zh) * | 2016-08-19 | 2018-03-06 | 中兴通讯股份有限公司 | 一种文本信息分类方法及其装置 |
CN111898378A (zh) * | 2020-07-31 | 2020-11-06 | 中国联合网络通信集团有限公司 | 政企客户的行业分类方法和装置、电子设备、存储介质 |
CN113610427A (zh) * | 2021-08-19 | 2021-11-05 | 深圳市德信软件有限公司 | 事件预警指标获得方法、装置、终端设备以及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06162102A (ja) * | 1992-11-26 | 1994-06-10 | Nippon Telegr & Teleph Corp <Ntt> | 内容抽出装置 |
JP2004213158A (ja) * | 2002-12-27 | 2004-07-29 | Hiroshima Pref Gov | 情報加工用自動検索サーバ、並びに自動情報加工システム及び自動情報加工プログラム |
-
2007
- 2007-06-21 JP JP2007163485A patent/JP5013081B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06162102A (ja) * | 1992-11-26 | 1994-06-10 | Nippon Telegr & Teleph Corp <Ntt> | 内容抽出装置 |
JP2004213158A (ja) * | 2002-12-27 | 2004-07-29 | Hiroshima Pref Gov | 情報加工用自動検索サーバ、並びに自動情報加工システム及び自動情報加工プログラム |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012048343A (ja) * | 2010-08-25 | 2012-03-08 | Fujifilm Corp | ドキュメント閲覧システム及びドキュメント画像配信装置並びにドキュメント閲覧方法 |
KR101621959B1 (ko) | 2015-12-23 | 2016-05-17 | 주식회사 모비젠 | 로그패턴추출장치, 로그패턴분석장치 및 그 방법 |
CN107766371A (zh) * | 2016-08-19 | 2018-03-06 | 中兴通讯股份有限公司 | 一种文本信息分类方法及其装置 |
CN107766371B (zh) * | 2016-08-19 | 2023-11-17 | 中兴通讯股份有限公司 | 一种文本信息分类方法及其装置 |
CN111898378A (zh) * | 2020-07-31 | 2020-11-06 | 中国联合网络通信集团有限公司 | 政企客户的行业分类方法和装置、电子设备、存储介质 |
CN111898378B (zh) * | 2020-07-31 | 2023-09-19 | 中国联合网络通信集团有限公司 | 政企客户的行业分类方法和装置、电子设备、存储介质 |
CN113610427A (zh) * | 2021-08-19 | 2021-11-05 | 深圳市德信软件有限公司 | 事件预警指标获得方法、装置、终端设备以及存储介质 |
CN113610427B (zh) * | 2021-08-19 | 2023-08-18 | 深圳市德信软件有限公司 | 事件预警指标获得方法、装置、终端设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5013081B2 (ja) | 2012-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5126541B2 (ja) | 情報分類装置、情報分類方法、及び情報分類プログラム | |
US20080235227A1 (en) | Systems and methods to extract data automatically from a composite electronic document | |
US8983962B2 (en) | Question and answer data editing device, question and answer data editing method and question answer data editing program | |
US7689037B2 (en) | System and method for identifying and labeling fields of text associated with scanned business documents | |
US8954839B2 (en) | Contract authoring system and method | |
US10318617B2 (en) | Methods and apparatus for extraction of content from an email or email threads for use in providing implicit profile attributes and content for recommendation engines | |
CN102257487B (zh) | 分析事件 | |
US20190005050A1 (en) | Regularities and trends discovery in a flow of business documents | |
US20100254613A1 (en) | System and method for duplicate text recognition | |
AU2007314123A1 (en) | Email document parsing method and apparatus | |
JP2006221560A (ja) | データ置換装置、データ置換方法およびデータ置換プログラム | |
JP5013081B2 (ja) | 情報解析装置、情報解析方法、及び情報解析プログラム | |
US7359896B2 (en) | Information retrieving system, information retrieving method, and information retrieving program | |
CN112926299A (zh) | 一种文本比对方法、合同审阅方法、审核系统 | |
CN115422125A (zh) | 一种基于智能算法的电子文档自动归档方法与系统 | |
CN110874398A (zh) | 违禁词处理方法、装置、电子设备及存储介质 | |
JP2016018279A (ja) | 文書ファイル検索プログラム、文書ファイル検索装置、文書ファイル検索方法、文書情報出力プログラム、文書情報出力装置及び文書情報出力方法 | |
CN115210708B (zh) | 处理文本数据的方法和系统、非暂时性计算机可读介质 | |
KR20210001164A (ko) | 계약서 분석 장치 및 방법 | |
KR102689187B1 (ko) | 딥러닝 기반 요약 대상 판단 및 요약문 생성 방법 | |
JP2003058559A (ja) | 文書分類方法、検索方法、分類システム及び検索システム | |
Kwok et al. | An automatic method to extract data from an electronic contract composed of a number of documents in PDF format | |
EP1072986A2 (en) | System and method for extracting data from semi-structured text | |
JP4700637B2 (ja) | Web文書分割方法、システム及びプログラム | |
JP2007199885A (ja) | 情報分析知識管理装置、データ構造、情報分析装置、辞書生成方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100511 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120217 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120417 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120509 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120522 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150615 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5013081 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |