JP6394069B2 - 文書処理装置及び文書処理プログラム - Google Patents
文書処理装置及び文書処理プログラム Download PDFInfo
- Publication number
- JP6394069B2 JP6394069B2 JP2014108111A JP2014108111A JP6394069B2 JP 6394069 B2 JP6394069 B2 JP 6394069B2 JP 2014108111 A JP2014108111 A JP 2014108111A JP 2014108111 A JP2014108111 A JP 2014108111A JP 6394069 B2 JP6394069 B2 JP 6394069B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- data
- image
- page
- link information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Description
また、前記紙文書は目次ページを含み、前記リンク情報付与部は、前記文書データから前記目次ページを認識して項目に対応するページ番号を判断し、前記判断したページ番号をリンク付与番号候補とし、さらに前記リンク付与番号候補と各ページのページ番号とを照合し、一致していればそれぞれ一致した前記リンク付与番号候補及び前記各ページのページ番号に対して双方向に移動できるリンク情報を付与することを特徴とする。
また、前記リンク情報付与部は、前記各ページに対してヘッダー領域及びフッター領域を検索し、前記ヘッダー領域又はフッター領域に文字データがあり、前記文字データが数字であればページ番号であると判断することを特徴とする。
本発明の文書処理プログラムは、文書データに対してリンク情報を付与する文書処理装置を制御するためのコンピューターで実行される文書処理プログラムであって、データ化文書生成部により、スキャナーによって読み取られた紙文書のデータ化を行い、データ化文書を生成する工程と、文書データ生成部により、前記データ化文書に対しOCR変換を行って文字画像を特定し、前記文字画像に基づく前記文書データを生成する工程と、リンク情報付与部により、前記文書データからリンク対象となる文字データを検索し、それぞれの文字データの間での移動を可能とするリンク情報を付与する工程とを前記コンピューターに実行させ、前記リンク情報付与部は、前記文書データから図形又は表の画像領域の有無を判断し、いずれかの画像領域がある場合、前記画像領域を広げて画像番号である図番号又は表番号を検索し、前記検索した画像番号である図番号又は表番号をリンク付与領域候補とし、前記広げた画像領域と同じ大きさ及び形状の1つの透明の領域データを、前記広げた画像領域上に埋め込み、さらに、前記文書データから前記リンク付与領域候補と同一の文字列を検索し、前記文字列に対して前記広げた画像領域に移動できるリンク情報を付与し、前記画像番号である図番号又は表番号を検索する際、前記画像領域に隣接する文字画像が含まれるまで前記画像領域を広げることを特徴とする。
本発明の文書処理装置及び文書処理プログラムでは、データ化文書生成部により、スキャナーによって読み取られた紙文書のデータ化が行われてデータ化文書が生成され、文書データ生成部により、データ化文書に対しのOCR変換により文書データが生成され、リンク情報付与部により、文書データからリンク対象となる文字データが検索され、それぞれの文字データの間での移動を可能とするリンク情報が付与される。これにより、OCR変換を行った文書データに対してリンク情報が自動的に付与される。
そのため、リンク情報付与部11dは、文書データにおいて文字データのサイズより大きいサイズの画像の領域を図形又は表の画像領域と判断することができる。具体的には、リンク情報付与部11dは、文書データにおいて文字データのサイズより大きいサイズの画像、文書データにおいて文字データのサイズより大きいサイズの画像を内接する矩形、または、文書データにおいて文字データのサイズより大きいサイズの画像とその周囲の余白部分の少なくとも一部とを合わせた領域を内接する矩形を図形又は表の画像領域と判断してもよい。
また、リンク情報付与部11dは、文書データにおいて文字画像ではない画像の領域を図形又は表の画像領域と判断してもよい。具体的には、リンク情報付与部11dは、文書データにおいて文字画像ではない画像、文書データにおいて文字画像ではない画像を内接する矩形、または、文書データにおいて文字画像ではない画像とその周囲の余白部分の少なくとも一部とを合わせた領域を内接する矩形を図形又は表の画像領域と判断してもよい。
なお、図形又は表の画像領域、または広げた画像領域に移動させるためのリンク情報を付与する場合、リンク情報付与部11dは、図形又は表の画像領域、または広げた画像領域と同じ大きさ及び形状の1つの(透明の)領域データを、対応する画像領域上に埋め込む。これにより、それぞれの画像領域が文書データから分離して認識されることが可能になるため、リンク情報によってリンク先の画像領域を指定することができる。
すなわち、図2(a)に示した目次ページのリンク付与番号候補とされたページ番号のたとえば「1」と、図2(b)に示した1ページ目の右下のページ番号の「1」とが一致すると、目次ページのリンク付与番号候補とされたページ番号の「1」と、1ページ目のページ番号の「1」に対し、双方向にジャンプさせるためのリンク情報が付与される。このようなリンク情報の付与は、目次ページの他のページ番号と、目次ページの他のページ番号に対応する各ページのページ番号についても、上記同様にして行われる。
11 制御部
11a 操作受付部
11b 文書読取部
11c 文書構成理解部
11d リンク情報付与部
11e リンク実行部
11f メモリー
12 操作部
13 表示部
14 スキャナー部
a ヘッダー領域
b フッター領域
c 画像領域(表)
d 画像領域(円グラフの図形)
e 画像領域(棒グラフの図形)
Claims (4)
- スキャナーによって読み取られた紙文書のデータ化を行い、データ化文書を生成するデータ化文書生成部と、
前記データ化文書に対しOCR変換を行って文字画像を特定し、前記文字画像に基づく文書データを生成する文書データ生成部と、
前記文書データからリンク対象となる文字データを検索し、それぞれの文字データの間での移動を可能とするリンク情報を付与するリンク情報付与部とを備え、
前記リンク情報付与部は、
前記文書データから図形又は表の画像領域の有無を判断し、いずれかの画像領域がある場合、前記画像領域を広げて画像番号である図番号又は表番号を検索し、前記検索した画像番号である図番号又は表番号をリンク付与領域候補とし、前記広げた画像領域と同じ大きさ及び形状の1つの透明の領域データを、前記広げた画像領域上に埋め込み、さらに、前記文書データから前記リンク付与領域候補と同一の文字列を検索し、前記文字列に対して前記広げた画像領域に移動できるリンク情報を付与し、
前記画像番号である図番号又は表番号を検索する際、前記画像領域に隣接する文字画像が含まれるまで前記画像領域を広げる
ことを特徴とする文書処理装置。 - 前記紙文書は目次ページを含み、
前記リンク情報付与部は、
前記文書データから前記目次ページを認識して項目に対応するページ番号を判断し、前記判断したページ番号をリンク付与番号候補とし、さらに前記リンク付与番号候補と各ページのページ番号とを照合し、一致していればそれぞれ一致した前記リンク付与番号候補及び前記各ページのページ番号に対して双方向に移動できるリンク情報を付与する
ことを特徴とする請求項1に記載の文書処理装置。 - 前記リンク情報付与部は、前記各ページに対してヘッダー領域及びフッター領域を検索し、前記ヘッダー領域又はフッター領域に文字データがあり、前記文字データが数字であればページ番号であると判断することを特徴とする請求項2に記載の文書処理装置。
- 文書データに対してリンク情報を付与する文書処理装置を制御するためのコンピューターで実行される文書処理プログラムであって、
データ化文書生成部により、スキャナーによって読み取られた紙文書のデータ化を行い、データ化文書を生成する工程と、
文書データ生成部により、前記データ化文書に対しOCR変換を行って文字画像を特定し、前記文字画像に基づく前記文書データを生成する工程と、
リンク情報付与部により、前記文書データからリンク対象となる文字データを検索し、それぞれの文字データの間での移動を可能とするリンク情報を付与する工程とを前記コンピューターに実行させ、
前記リンク情報付与部は、
前記文書データから図形又は表の画像領域の有無を判断し、いずれかの画像領域がある場合、前記画像領域を広げて画像番号である図番号又は表番号を検索し、前記検索した画像番号である図番号又は表番号をリンク付与領域候補とし、前記広げた画像領域と同じ大きさ及び形状の1つの透明の領域データを、前記広げた画像領域上に埋め込み、さらに、前記文書データから前記リンク付与領域候補と同一の文字列を検索し、前記文字列に対して前記広げた画像領域に移動できるリンク情報を付与し、
前記画像番号である図番号又は表番号を検索する際、前記画像領域に隣接する文字画像が含まれるまで前記画像領域を広げる
ことを特徴とする文書処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014108111A JP6394069B2 (ja) | 2014-05-26 | 2014-05-26 | 文書処理装置及び文書処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014108111A JP6394069B2 (ja) | 2014-05-26 | 2014-05-26 | 文書処理装置及び文書処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015225377A JP2015225377A (ja) | 2015-12-14 |
JP6394069B2 true JP6394069B2 (ja) | 2018-09-26 |
Family
ID=54842101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014108111A Expired - Fee Related JP6394069B2 (ja) | 2014-05-26 | 2014-05-26 | 文書処理装置及び文書処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6394069B2 (ja) |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2506987B2 (ja) * | 1988-09-09 | 1996-06-12 | 松下電器産業株式会社 | 画像検索装置及び方法 |
JP3711636B2 (ja) * | 1996-06-18 | 2005-11-02 | 富士ゼロックス株式会社 | 情報検索装置および方法 |
JPH10228473A (ja) * | 1997-02-13 | 1998-08-25 | Ricoh Co Ltd | 文書画像処理方法、文書画像処理装置および記憶媒体 |
JP3717742B2 (ja) * | 2000-03-29 | 2005-11-16 | 大日本スクリーン製造株式会社 | ブックデータ生成装置、およびブックデータ生成方法 |
JP3476752B2 (ja) * | 2000-07-07 | 2003-12-10 | 日本電信電話株式会社 | 情報重ね合わせ表示方法及び装置並びにそのプログラムを格納した記録媒体 |
JP2006085234A (ja) * | 2004-09-14 | 2006-03-30 | Fuji Xerox Co Ltd | 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム |
US20080065671A1 (en) * | 2006-09-07 | 2008-03-13 | Xerox Corporation | Methods and apparatuses for detecting and labeling organizational tables in a document |
JP4780169B2 (ja) * | 2008-09-30 | 2011-09-28 | ブラザー工業株式会社 | データ生成装置、スキャナ、及びコンピュータプログラム |
US8719702B2 (en) * | 2010-03-09 | 2014-05-06 | Xerox Corporation | Document organizing based on page numbers |
JP2013152564A (ja) * | 2012-01-24 | 2013-08-08 | Canon Inc | 文書処理装置及び文書処理方法 |
US9495334B2 (en) * | 2012-02-01 | 2016-11-15 | Adobe Systems Incorporated | Visualizing content referenced in an electronic document |
JP5753828B2 (ja) * | 2012-09-27 | 2015-07-22 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置及び画像処理プログラム |
-
2014
- 2014-05-26 JP JP2014108111A patent/JP6394069B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015225377A (ja) | 2015-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5402099B2 (ja) | 情報処理システム、情報処理装置、情報処理方法およびプログラム | |
US10949662B2 (en) | Image processing apparatus | |
JP2014102669A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP6896292B2 (ja) | 帳票入力フォーム生成装置、帳票入力フォーム生成方法及びプログラム | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
AU2013374725B2 (en) | Display control apparatus and program | |
JP4724507B2 (ja) | 情報処理装置、方法、プログラム、および、記憶媒体 | |
JP2016024488A (ja) | 画像処理装置および画像処理装置の制御方法 | |
JP2020184276A5 (ja) | ||
JP6394069B2 (ja) | 文書処理装置及び文書処理プログラム | |
US20150261735A1 (en) | Document processing system, document processing apparatus, and document processing method | |
JP5623574B2 (ja) | 帳票識別装置および帳票識別方法 | |
JP2017068303A (ja) | 画像処理装置及びプログラム | |
JP2018200614A (ja) | 表示制御プログラム、表示制御方法及び表示制御装置 | |
JP6432179B2 (ja) | 文書ファイル生成装置及び文書ファイル生成方法 | |
JP2016018454A (ja) | 画像処理装置および画像処理装置の制御方法 | |
JP6222541B2 (ja) | 画像処理装置及びプログラム | |
JP2018055256A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JPWO2014170965A1 (ja) | 文書処理方法、文書処理装置および文書処理プログラム | |
JP2006252455A (ja) | ファイル管理装置、ファイル管理方法及びファイル管理プログラム | |
JP6651675B1 (ja) | 画像情報処理装置、画像情報処理方法、及び画像情報処理プログラム | |
JP3897772B2 (ja) | ファイル名作成装置及びファイル名作成プログラム | |
JP2019169182A (ja) | 情報処理装置、制御方法、プログラム | |
JP2019197337A (ja) | メタデータ生成装置、画像表示システム、メタデータ生成方法、及びプログラム | |
JP2018147400A (ja) | 表示差異検出プログラム、装置、及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160721 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170523 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170524 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180731 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180813 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6394069 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |