JP5340689B2 - データベース生成装置、データベース生成方法及びコンピュータプログラム - Google Patents
データベース生成装置、データベース生成方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP5340689B2 JP5340689B2 JP2008265354A JP2008265354A JP5340689B2 JP 5340689 B2 JP5340689 B2 JP 5340689B2 JP 2008265354 A JP2008265354 A JP 2008265354A JP 2008265354 A JP2008265354 A JP 2008265354A JP 5340689 B2 JP5340689 B2 JP 5340689B2
- Authority
- JP
- Japan
- Prior art keywords
- database
- data
- electronic document
- item
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
図1は、本発明の実施の形態1に係るデータベース生成装置の構成例を示すブロック図である。本発明の実施の形態1に係るデータベース生成装置1は、少なくともCPU(中央演算装置)11、メモリ12、記憶装置13、I/Oインタフェース14、ビデオインタフェース15、可搬型ディスクドライブ16、通信インタフェース17及び上述したハードウェアを接続する内部バス18で構成されている。
本発明の実施の形態2に係るデータベース生成装置の構成は、実施の形態1と同様であることから、同一の符号を付することにより、詳細な説明を省略する。本実施の形態2では、異なるデータ形式を有する複数の表データが存在する場合であっても、容易に新たなデータベースを生成することができ、ゆらぎ補正の内容を視認することができる点で実施の形態1と相違する。
2 ネットワーク
11 CPU
12 RAM
13 記憶装置
14 I/Oインタフェース
15 ビデオインタフェース
16 可搬型ディスクドライブ
17 通信インタフェース
18 内部バス
23 表示装置
90 可搬型記録媒体
100 コンピュータプログラム
131 電子文書ファイル記憶部
132 データ抽出規則記憶部
133 データベース記憶部
134 ゆらぎ情報記憶部
Claims (9)
- 表データが含まれる一又は複数の電子文書ファイル中から抽出したデータに基づいて新たなデータベースを生成するデータベース生成装置において、
一又は複数の前記電子文書ファイルを取得する電子文書ファイル取得手段と、
取得した一又は複数の前記電子文書ファイルに含まれる罫線に関する罫線情報をそれぞれ抽出する罫線情報抽出手段と、
抽出した複数の罫線情報に基づいて前記電子文書ファイルの内容を解析する解析手段と、
前記罫線情報に基づいた前記電子文書ファイルの内容の解析結果に基づいて、生成するデータベースのデータベース項目及びデータ抽出規則を特定するデータ抽出規則特定手段と、
特定したデータベース項目及びデータ抽出規則にて、一又は複数の前記電子文書ファイルから前記データベース項目及び対応するデータを抽出するデータ抽出手段と、
抽出されたデータベース項目及び対応するデータを一覧表示する表示手段と、
表示されたデータベース項目及び対応するデータが適正である旨を示す確定情報の入力を受け付ける確定情報受付手段と
を備えることを特徴とするデータベース生成装置。 - 前記データ抽出規則特定手段は、
一又は複数の前記電子文書ファイルの指定を受け付けるファイル指定受付手段と、
指定を受け付けた一又は複数の電子文書ファイルの表データの範囲指定を受け付ける範囲指定受付手段と、
受け付けた範囲指定に従って、前記データベース項目及び前記データ抽出規則を特定する特定手段と
を備えることを特徴とする請求項1記載のデータベース生成装置。 - 異なる電子文書ファイルから抽出した表データの位置の相違に関する情報、及び/又は異なる電子文書ファイルから抽出したデータベース項目の相違に関する情報を少なくとも含む表データの相違に関するゆらぎ情報を抽出するゆらぎ情報抽出手段と、
前記データベース項目、前記データ抽出規則及び抽出されたゆらぎ情報に基づいて、前記データ抽出規則の変更部分が存在するか否かを判断する判断手段と、
該判断手段で変更部分が存在すると判断した場合、同一の前記データベース項目に対しては同一の、異なるデータベース項目に対しては異なるタグ情報を付与するタグ情報付与手段と
を備え、
前記データ抽出手段は、前記データ抽出規則の変更部分を反映して前記データベース項目及び対応するデータを抽出するようにしてあり、
前記表示手段は、前記データベース項目に付与されているタグ情報に従って前記データベース項目を配列して、前記データベース項目及び対応するデータを一覧表示するようにしてあることを特徴とする請求項1又は2記載のデータベース生成装置。 - 前記解析手段は、
罫線により区切られた区画が複数列又は複数行にわたって同一であるか否かを判断する手段を備え、
該手段で同一であると判断した場合、前記データ抽出手段は、複数列又は複数行にわたって同一である最初の行又は列での区画に相当するデータベース項目にてデータを抽出するようにしてあることを特徴とする請求項1乃至3のいずれか一項に記載のデータベース生成装置。 - 表データが含まれる一又は複数の電子文書ファイル中から抽出したデータに基づいて新たなデータベースを生成するデータベース生成装置で実行することが可能なデータベース生成方法において、
前記データベース生成装置は、
一又は複数の前記電子文書ファイルを取得し、
取得した一又は複数の前記電子文書ファイルに含まれる罫線に関する罫線情報をそれぞれ抽出し、
抽出した複数の罫線情報に基づいて前記電子文書ファイルの内容を解析し、
前記罫線情報に基づいた前記電子文書ファイルの内容の解析結果に基づいて、生成するデータベースのデータベース項目及びデータ抽出規則を特定し、
特定したデータベース項目及びデータ抽出規則にて、一又は複数の前記電子文書ファイルから前記データベース項目及び対応するデータを抽出し、
抽出されたデータベース項目及び対応するデータを一覧表示し、
表示されたデータベース項目及び対応するデータが適正である旨を示す確定情報の入力を受け付けることを特徴とするデータベース生成方法。 - 前記データベース生成装置は、
一又は複数の前記電子文書ファイルの指定を受け付け、
指定を受け付けた一又は複数の電子文書ファイルの表データの範囲指定を受け付け、
受け付けた範囲指定に従って、前記データベース項目及び前記データ抽出規則を特定することを特徴とする請求項5記載のデータベース生成方法。 - 前記データベース生成装置は、
異なる電子文書ファイルから抽出した表データの位置の相違に関する情報、及び/又は異なる電子文書ファイルから抽出したデータベース項目の相違に関する情報を少なくとも含む表データの相違に関するゆらぎ情報を抽出し、
前記データベース項目、前記データ抽出規則及び抽出されたゆらぎ情報に基づいて、前記データ抽出規則の変更部分が存在するか否かを判断し、
変更部分が存在すると判断した場合、同一の前記データベース項目に対しては同一の、異なるデータベース項目に対しては異なるタグ情報を付与し、
前記データ抽出規則の変更部分を反映して前記データベース項目及び対応するデータを抽出し、
前記データベース項目に付与されているタグ情報に従って前記データベース項目を配列して、前記データベース項目及び対応するデータを一覧表示することを特徴とする請求項5又は6記載のデータベース生成方法。 - 前記データベース生成装置は、
罫線により区切られた区画が複数列又は複数行にわたって同一であるか否かを判断し、
同一であると判断した場合、複数列又は複数行にわたって同一である最初の行又は列での区画に相当するデータベース項目にてデータを抽出することを特徴とする請求項5乃至7のいずれか一項に記載のデータベース生成方法。 - 表データが含まれる一又は複数の電子文書ファイル中から抽出したデータに基づいて新たなデータベースを生成するデータベース生成装置で実行することが可能なコンピュータプログラムにおいて、
前記データベース生成装置を、
一又は複数の前記電子文書ファイルを取得する電子文書ファイル取得手段、
取得した一又は複数の前記電子文書ファイルに含まれる罫線に関する罫線情報をそれぞれ抽出する罫線情報抽出手段、
抽出した複数の罫線情報に基づいて前記電子文書ファイルの内容を解析する解析手段、
前記罫線情報に基づいた前記電子文書ファイルの内容の解析結果に基づいて、生成するデータベースのデータベース項目及びデータ抽出規則を特定するデータ抽出規則特定手段、
特定したデータベース項目及びデータ抽出規則にて、一又は複数の前記電子文書ファイルから前記データベース項目及び対応するデータを抽出するデータ抽出手段、
抽出されたデータベース項目及び対応するデータを一覧表示する表示手段、及び
表示されたデータベース項目及び対応するデータが適正である旨を示す確定情報の入力を受け付ける確定情報受付手段
として機能させることを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008265354A JP5340689B2 (ja) | 2008-10-14 | 2008-10-14 | データベース生成装置、データベース生成方法及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008265354A JP5340689B2 (ja) | 2008-10-14 | 2008-10-14 | データベース生成装置、データベース生成方法及びコンピュータプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2010097263A JP2010097263A (ja) | 2010-04-30 |
JP2010097263A5 JP2010097263A5 (ja) | 2011-11-04 |
JP5340689B2 true JP5340689B2 (ja) | 2013-11-13 |
Family
ID=42258922
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008265354A Expired - Fee Related JP5340689B2 (ja) | 2008-10-14 | 2008-10-14 | データベース生成装置、データベース生成方法及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5340689B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5642999B2 (ja) * | 2010-05-26 | 2014-12-17 | 株式会社オービック | csvファイル出力装置、csvファイル出力方法及びcsvファイル出力プログラム |
JP6283442B1 (ja) * | 2017-06-01 | 2018-02-21 | フューチャー株式会社 | 解析装置、解析方法、および解析プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06243130A (ja) * | 1993-02-18 | 1994-09-02 | Fuji Xerox Co Ltd | 表情報処理装置 |
JP3420864B2 (ja) * | 1995-08-09 | 2003-06-30 | 富士通株式会社 | 枠抽出装置及び矩形抽出装置 |
JP2001331764A (ja) * | 2000-03-13 | 2001-11-30 | Fujitsu Ltd | 文字認識方法 |
JP2004252509A (ja) * | 2003-02-18 | 2004-09-09 | Tokio Marine & Fire Insurance Co Ltd | ファイルやシートを結合又は分割するための情報処理方法 |
JP4501459B2 (ja) * | 2004-02-25 | 2010-07-14 | 富士ゼロックス株式会社 | クロス表作成のためのプログラム及び方法及び装置 |
-
2008
- 2008-10-14 JP JP2008265354A patent/JP5340689B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010097263A (ja) | 2010-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100454293C (zh) | 文档编辑方法和文档编辑设备 | |
JP2006153628A (ja) | 分析データ管理装置及び分析データ管理プログラム | |
JP2009122760A (ja) | 文書処理装置、文書処理方法及び文書処理プログラム | |
JP6690224B2 (ja) | 医療情報処理装置、その情報処理方法、およびプログラム | |
JP2006252201A (ja) | ソースコード解析プログラム | |
JP5742979B1 (ja) | 画像処理装置、画像読取装置及びプログラム | |
JP5578188B2 (ja) | 画像処理装置、画像処理装置の制御方法、および、プログラム | |
US20170178528A1 (en) | Method and System for Providing Automated Localized Feedback for an Extracted Component of an Electronic Document File | |
JP5340689B2 (ja) | データベース生成装置、データベース生成方法及びコンピュータプログラム | |
JP2008122788A (ja) | 画像処理装置、画像処理方法、該方法を実行するためのプログラム及び記憶媒体 | |
JP4983464B2 (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
JP2015167001A (ja) | 情報処理プログラム、情報処理装置、情報処理システム、情報処理方法、画像処理装置及び画像処理システム | |
JP5149525B2 (ja) | プロジェクト管理支援装置およびその方法 | |
JP6680052B2 (ja) | 表データ変換方法、プログラム、画像読取装置 | |
JP2010079502A (ja) | 情報処理装置及びプログラム | |
JP5470308B2 (ja) | 法令分析支援装置、法令分析支援方法、及び法令分析支援プログラム | |
WO2014170965A1 (ja) | 文書処理方法、文書処理装置および文書処理プログラム | |
JP2010097264A (ja) | データベース生成装置、データベース生成方法及びコンピュータプログラム | |
JP5299898B2 (ja) | データベース生成装置、データベース生成方法及びコンピュータプログラム | |
JP2010128894A (ja) | データベース生成装置、データベース生成方法及びコンピュータプログラム | |
JP2016162211A (ja) | 情報処理装置、制御方法及びプログラム | |
JPWO2004104860A1 (ja) | 電子化サービスマニュアル表示制御装置 | |
JP2009230450A (ja) | 文書属性情報登録装置及びプログラム | |
WO2021149164A1 (ja) | データ表示プログラム、プログラマブル表示器およびプログラマブル表示器の再現シミュレータ | |
JP2014035638A (ja) | 電子マニュアル出力システム及び電子マニュアル出力方法並びに電子マニュアル出力プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110916 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110916 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130108 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130208 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20130404 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20130404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130709 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130807 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |