JP2016091131A - 情報処理装置とその処理方法及びプログラム。 - Google Patents
情報処理装置とその処理方法及びプログラム。 Download PDFInfo
- Publication number
- JP2016091131A JP2016091131A JP2014222121A JP2014222121A JP2016091131A JP 2016091131 A JP2016091131 A JP 2016091131A JP 2014222121 A JP2014222121 A JP 2014222121A JP 2014222121 A JP2014222121 A JP 2014222121A JP 2016091131 A JP2016091131 A JP 2016091131A
- Authority
- JP
- Japan
- Prior art keywords
- file
- text data
- line
- data
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims description 14
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 238000000034 method Methods 0.000 description 35
- 230000008569 process Effects 0.000 description 33
- 238000012545 processing Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 11
- 230000002776 aggregation Effects 0.000 description 9
- 238000004220 aggregation Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- KNMAVSAGTYIFJF-UHFFFAOYSA-N 1-[2-[(2-hydroxy-3-phenoxypropyl)amino]ethylamino]-3-phenoxypropan-2-ol;dihydrochloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC=C1 KNMAVSAGTYIFJF-UHFFFAOYSA-N 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
【解決手段】テキストデータとテキストデータの属性情報と罫線情報とを1ファイルに含む第2の文書データを取り込むと、第2の文書データの各ページのテキストデータの配置位置から、ページ共通の行を特定し、前記行特定手段で特定された行に従って、決定されたテキストデータを描画する位置を記憶するファイルと、第2の文書データのテキストデータを記憶するファイルと、テキストの属性情報を記憶するファイルと、第2の文書データの罫線情報を含むファイルとを生成する。
【選択図】図4
Description
この電子帳票システムは、独自のファイル形式にデータを変換して、システム上で電子帳票を閲覧、検索できるようになっている。(例えば、特許文献1)
図1は、本発明の実施形態に係る電子帳票システムの概略構成を示す図である。
すなわち、図1は、帳票データを表示する情報処理装置と、帳票データを管理するサーバとが通信可能に接続されている帳票システムである。
通信I/Fコントローラ208は、ネットワーク103を介して行われる、クライアントPC等の外部機器との通信を制御する。
帳票サーバ100は、PDFファイルを受信すると、CPU201により、PDFファイルを解析して、帳票ファイル213を生成する。
帳票ファイル213(第1の文書データ)は、帳票における罫線や図などのレイアウトを定めるフォーム情報ファイル3301(テキストデータと合成するためのフォームデータを記憶する第4のファイル)と、帳票に含まれる文字に関するテキスト情報ファイル3302(テキストデータを記憶する第1のファイル)と、帳票における行ピッチや文字のフォントなどを定める文字情報ファイル3303(テキストデータの属性情報を記憶する第2のファイル)と、帳票において帳票テキストデータの配置を定めるページ情報ファイル3304(テキストデータの描画位置を記憶する第3のファイル)とで構成されている。
フォーム情報ファイルは、フォーム情報ファイルID、座標原点、罫線を含む画像ファイルを記憶している。
ステップS01では、帳票サーバ100がPDFファイルを受信して、SPOOLフォルダに格納する。
異なるものかどうかは、各ページから抽出される罫線情報・画像などの情報のハッシュ値をもとに判断する。
ステップS10では、行情報集計結果から
共通ページ定義を作成する。共通ページ定義の作成については、図14のフローチャートを用いて後述する。
ステップS11では、共通ページ定義を使用して、独自帳票データを作成する。帳票データの作成については、図15のフローチャートを用いて後述する。
ステップS12では、本処理を終了する。
ステップS13では、PDF構成情報を読み込み、ステップS14では、内部メモリに保持する。
ステップS16では、作成したデータファイルリストを取得し、フォーム単位に処理を開始する。
ステップS17では、データ情報を読み込み、ステップS18では、読み込んだデータから行リスト(802)として、内部メモリに保持する。
図10がY座標を集約した行の概略を示すイメージ図である。
ステップS21では、行リスト分繰り返し、行集計結果にY座標データをマージする。
ステップS25では、フォーム毎に作成した行情報集計結果(903)を、Y座標で昇順にソートする。ソートした行情報集計結果の例が904である。
ステップS27では、フォーム毎に作成した行情報集計結果を、内部メモリに保持する。
ステップS28では、フォーム数分繰り返し、すべてのフォーム対する行情報集計結果を作成し、行情報集計結果リストを作成する。
ステップS30では、共通ページ定義の情報を格納するオブジェクトを、内部メモリに作成する。
ステップS31では、行情報集計結果から、行情報(Y座標)のリストを取得する。
ステップS32では、取得した行情報(Y座標)のリストから、先頭行の情報を取得する。
プリントラインの概略を示す図が図12のイメージ図である。
ステップS35では、共通ページ定義で必要となる改行幅(行の差分情報)の値として、先頭行の情報から改行幅情報を取得する。
ステップS36では、改行幅の設定行数が「0」か否かを判定する。
ステップS38では、改行幅の情報が先頭行かどうかを判断する。
ステップS41では、フォーム毎に作成した共通ページ定義を紐付けたリストを作成する。
ステップS43では、ページ順にデータファイルを取得し、行リストとして読み込む。
ステップS46では、独自形式のテキストオブジェクト(テキスト情報)をメモリ内に作成する。
ステップS47では、独自形式のマップパターン(文字情報)をメモリ内に作成する。
ステップS48では、共通ページ定義から、プリントライン、改行幅情報を取得する。
ステップS49では、プリントラインに設定されている行数分、プリントラインデータオブジェクトを内部メモリ内に作成する。
ステップS51では、データの行リストから1行分のデータを取得する。
ステップS52では、共通ページ定義のプリントラインのY座標と1行分のデータのY座標が一致するかを判定する
プリントデータオブジェクトに割り当てる処理の概略図が図13である。
ステップS59では、1ページ分のテキストリストを、一括で独自帳票データのテキスト情報に変換しやすいように、1ページ分テキスト情報として変換する。
ステップS60では、同じようにメモリ上のマップパターンを1ページ分のマップパターンとして変換する。
登録が完了すると、PDFファイルは削除される。また、この登録された独自帳票データを用いて、クライアント端末のブラウザで帳票を閲覧する。
なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。
101 クライアントPC
102 クライアントPC
103 ネットワーク
201 CPU
202 RAM
203 ROM
211 外部メモリ
Claims (6)
- テキストデータを記憶する第1のファイルと、テキストデータの属性情報を記憶する第2のファイルと、テキストデータの描画位置を記憶する第3のファイルと、前記テキストデータと合成するためのフォームデータを記憶する第4のファイルとを含む第1の文書データを管理する情報処理装置であって、
テキストデータとテキストデータの属性情報と罫線情報とを1ファイルに含む第2の文書データを取り込む取込手段と、
前記第2の文書データから、罫線情報を抽出する罫線抽出手段と、
前記第2の文書データの各ページのテキストデータの配置位置から、ページ共通の行を特定する行特定手段と、
前記行特定手段で特定した行に含まれるテキストデータを特定するテキストデータ特定手段と、
前記テキストデータ特定手段で特定されたテキストデータを含む第1のファイルと、
各テキストデータに対して、前記第2の文書データから得られる属性情報を割り当てた第2のファイルと、
前記行特定手段で特定された行に従って、決定されたテキストデータを描画する位置を記憶する第3のファイルと、
前記罫線抽出手段により抽出された罫線情報を含むフォームデータを記憶する第4のファイルとを生成するファイル生成手段と、
前記ファイル生成手段により生成された前記第1のファイルと前記第2のファイルと前記第3のファイルと前記第4のファイルとを、前記第1の文書として登録する登録手段と
を備えることを特徴とする情報処理装置。 - 前記テキストデータの配置位置のY座標に従って、行の位置を決定する行位置決定手段とを備え、
前記行特定手段は、前記行位置決定手段により決定された各ページごとの行位置に従って、ページ共通の行を特定することを特徴とする請求項1に記載の情報処理装置。 - 前記テキストデータの1文字ごとに配置位置のX座標に従って、各行の文字を配列する配列手段とを備え、
前記データ特定手段は、前記配列手段により並び替えられた文字を取得することを特徴とする請求項2に記載の情報処理装置。 - 前記第2の文書データはPDFファイルであり、
前記ファイル生成手段は、当該PDFファイルから前記第1のファイルと前記第2のファイルと前記第3のファイルと前記第4のファイルとを生成することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。 - テキストデータを記憶する第1のファイルと、テキストデータの属性情報を記憶する第2のファイルと、テキストデータの描画位置を記憶する第3のファイルと、前記テキストデータと合成するためのフォームデータを記憶する第4のファイルとを含む第1の文書データを管理する情報処理装置の処理方法であって、
前記情報処理装置が、
テキストデータとテキストデータの属性情報と罫線情報とを1ファイルに含む第2の文書データを取り込む取込ステップと、
前記第2の文書データから、罫線情報を抽出する罫線抽出ステップと、
前記第2の文書データの各ページのテキストデータの配置位置から、ページ共通の行を特定する行特定ステップと、
前記行特定ステップで特定した行に含まれるテキストデータを特定するテキストデータ特定ステップと、
前記テキストデータ特定ステップで特定されたテキストデータを含む第1のファイルと、
各テキストデータに対して、前記第2の文書データから得られる属性情報を割り当てた第2のファイルと、
前記行特定ステップで特定された行に従って、決定されたテキストデータを描画する位置を記憶する第3のファイルと、
前記罫線抽出ステップにより抽出された罫線情報を含むフォームデータを記憶する第4のファイルとを生成するファイル生成ステップと、
前記ファイル生成ステップにより生成された前記第1のファイルと前記第2のファイルと前記第3のファイルと前記第4のファイルとを、前記第1の文書として登録する登録ステップと
そ実行することを特徴とする処理方法。 - テキストデータを記憶する第1のファイルと、テキストデータの属性情報を記憶する第2のファイルと、テキストデータの描画位置を記憶する第3のファイルと、前記テキストデータと合成するためのフォームデータを記憶する第4のファイルとを含む第1の文書データを管理する情報処理装置で実行可能なプログラムであって、
前記情報処理装置を、
テキストデータとテキストデータの属性情報と罫線情報とを1ファイルに含む第2の文書データを取り込む取込手段と、
前記第2の文書データから、罫線情報を抽出する罫線抽出手段と、
前記第2の文書データの各ページのテキストデータの配置位置から、ページ共通の行を特定する行特定手段と、
前記行特定手段で特定した行に含まれるテキストデータを特定するテキストデータ特定手段と、
前記テキストデータ特定手段で特定されたテキストデータを含む第1のファイルと、
各テキストデータに対して、前記第2の文書データから得られる属性情報を割り当てた第2のファイルと、
前記行特定手段で特定された行に従って、決定されたテキストデータを描画する位置を記憶する第3のファイルと、
前記罫線抽出手段により抽出された罫線情報を含むフォームデータを記憶する第4のファイルとを生成するファイル生成手段と、
前記ファイル生成手段により生成された前記第1のファイルと前記第2のファイルと前記第3のファイルと前記第4のファイルとを、前記第1の文書として登録する登録手段
として機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014222121A JP6550721B2 (ja) | 2014-10-31 | 2014-10-31 | 情報処理装置、文書管理システムとその処理方法及びプログラム。 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014222121A JP6550721B2 (ja) | 2014-10-31 | 2014-10-31 | 情報処理装置、文書管理システムとその処理方法及びプログラム。 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016091131A true JP2016091131A (ja) | 2016-05-23 |
JP2016091131A5 JP2016091131A5 (ja) | 2017-12-14 |
JP6550721B2 JP6550721B2 (ja) | 2019-07-31 |
Family
ID=56018617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014222121A Active JP6550721B2 (ja) | 2014-10-31 | 2014-10-31 | 情報処理装置、文書管理システムとその処理方法及びプログラム。 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6550721B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08194696A (ja) * | 1995-01-18 | 1996-07-30 | Casio Comput Co Ltd | 文書イメージ処理装置 |
JP2006309593A (ja) * | 2005-04-28 | 2006-11-09 | Canon Marketing Japan Inc | 帳票処理装置、帳票処理方法、プログラム及び記録媒体 |
JP2013080348A (ja) * | 2011-10-03 | 2013-05-02 | Canon Inc | 画像処理装置、画像処理方法、およびプログラム |
JP2014119939A (ja) * | 2012-12-17 | 2014-06-30 | Canon Marketing Japan Inc | 情報処理装置、情報処理方法、プログラム、情報処理システム |
-
2014
- 2014-10-31 JP JP2014222121A patent/JP6550721B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08194696A (ja) * | 1995-01-18 | 1996-07-30 | Casio Comput Co Ltd | 文書イメージ処理装置 |
JP2006309593A (ja) * | 2005-04-28 | 2006-11-09 | Canon Marketing Japan Inc | 帳票処理装置、帳票処理方法、プログラム及び記録媒体 |
JP2013080348A (ja) * | 2011-10-03 | 2013-05-02 | Canon Inc | 画像処理装置、画像処理方法、およびプログラム |
JP2014119939A (ja) * | 2012-12-17 | 2014-06-30 | Canon Marketing Japan Inc | 情報処理装置、情報処理方法、プログラム、情報処理システム |
Also Published As
Publication number | Publication date |
---|---|
JP6550721B2 (ja) | 2019-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10366154B2 (en) | Information processing device, information processing method, and computer program product | |
JP2009003802A (ja) | 情報表示装置及び情報表示方法 | |
CN108228119A (zh) | 基于hxml的打印方法、终端设备及存储介质 | |
US10839146B2 (en) | Information processing system, information processing apparatus, control method, and storage medium | |
JP2018063501A (ja) | 情報処理装置及び文書表示方法、文書表示システムおよびプログラム | |
JP5046984B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP4959501B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5167200B2 (ja) | 印刷ジョブ抽出装置およびプリントシステム | |
JP2006065467A5 (ja) | ||
JP6558339B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6550721B2 (ja) | 情報処理装置、文書管理システムとその処理方法及びプログラム。 | |
JP2004326626A (ja) | 構造化文書ファイル管理装置および構造化文書ファイル管理方法 | |
JP6327918B2 (ja) | 画像検索装置及びその制御方法 | |
JP2015064652A (ja) | 管理システム、画像形成装置及び端末装置 | |
JP2018106538A (ja) | 情報処理装置、情報処理システム、制御方法、プログラム | |
JP2004145736A (ja) | 文字認識装置および文字認識データ出力方法およびプログラムおよび記録媒体 | |
JP7315817B2 (ja) | 情報処理装置及びその制御方法、プログラム | |
JP4946762B2 (ja) | 画像処理装置及びプログラム | |
US20230058537A1 (en) | Information processing apparatus and system and non-transitory computer readable medium | |
JP5414615B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2006238248A (ja) | 複数のデータを含んだデータ群の処理装置及び方法 | |
CN116823841A (zh) | 画板处理方法、装置、设备及存储介质 | |
JP2008033647A (ja) | ドキュメントセット作成装置及びドキュメントセット作成方法 | |
JP6175414B2 (ja) | 文書処理装置および文書処理プログラム | |
JP2017175414A (ja) | 画像処理サーバ、データ送信プログラム及び振分装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20161101 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20161101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171030 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171030 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20180703 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180928 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20181031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181225 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190617 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6550721 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |