JP4792117B2 - 文書画像処理装置、文書画像処理方法および文書画像処理プログラム - Google Patents
文書画像処理装置、文書画像処理方法および文書画像処理プログラム Download PDFInfo
- Publication number
- JP4792117B2 JP4792117B2 JP2010058475A JP2010058475A JP4792117B2 JP 4792117 B2 JP4792117 B2 JP 4792117B2 JP 2010058475 A JP2010058475 A JP 2010058475A JP 2010058475 A JP2010058475 A JP 2010058475A JP 4792117 B2 JP4792117 B2 JP 4792117B2
- Authority
- JP
- Japan
- Prior art keywords
- color
- document image
- pixel
- representative
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/64—Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
- H04N1/642—Adapting to different types of images, e.g. characters, graphs, black and white image portions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18105—Extraction of features or characteristics of the image related to colour
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Facsimile Image Signal Circuits (AREA)
- Color Image Communication Systems (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Analysis (AREA)
Description
図1は、本発明の一つの実施の形態に係る文書画像処理装置10の構成を示すブロック図である。
文書要素抽出部101は、前処理として2値化処理を行う(図7のステップS111)。通常、この文書要素の判別として重要なものは、下地と区別可能な濃い濃度の色である。そこで、この文書要素抽出部101での2値化処理によって、ノイズや薄い網点領域などを除去した白画素と黒画素からなる2値画像を生成する。2値画像の生成は、たとえば、濃淡画像を2値化処理する際に最適閾値を求める判別分析法などの一般に知られている技法を利用してよい。
文書要素抽出部101は、この2値化処理によって生成された2値入力文書画像311に対して、黒画素312〜319の連結性を検出する。そして、連結されているものは1つの塊として抽出する連結成分抽出処理を行う(図7のステップS112)。
文書要素抽出部101は、この抽出された各連結成分に対して、「大きさ」、「形状」、「黒画素比率」、「黒画素分布」などの特徴量を計測する(図7のステップS113)。たとえば、「大きさ」は、連結成分の外接矩形の縦横の画素数から測定する。「形状」は、連結成分の外接矩形が正方形、横に細長い長方形、あるいは縦に細長い長方形等の形状を計測する。「黒画素比率」は、連結成分の外接矩形に対して、黒画素の比率の大小を計測する。「黒画素分布」は、連結成分の外接矩形内における黒画素の分布に偏りがあるか、または一様かを計測する。
文書要素抽出部101は、この特徴量測定処理の計測結果を用いて、各連結成分がどのような種類の文書要素であるかの属性分類を行う(図7のステップS114)。たとえば、「大きさ」が文書画像の大きさに比較して小さく、「形状」が正方形に近く、「黒画素比率」が高い文書要素は、文字と判別する。また、「大きさ」が文字よりも大きく、内部が空白で「黒画素比率」が低く、「黒画素分布」では連結成分の外接矩形付近にのみ黒画素が存在する文書要素は、罫線枠と判別する。また、文字として抽出された連結成分について、周囲で同様な連結成分があった場合のみ、文字として判別してもよい。これにより、2値化時に発生するノイズ成分を除去することが可能である。
ax+by+cz+d=0 …(1)
となる。
d=−(aα+bβ+cγ)
となる。
本発明の第2の実施形態について図面を用いて説明する。図20は、本実施形態における減色処理部3の機能構成を示す図である。本実施形態においては、減色処理部3がさらに代表色統一部105を備える。この代表色統一処理部105による代表色統一処理について、図3、図5、図12、図17、図20、図21を用いて説明する。なお、第1の実施形態と同じ動作の説明は省略する。
Claims (9)
- 入力文書画像と、前記入力文書画像に対応するプレプリントデータの各画素から各々の文書要素を抽出する文書要素抽出部と、
前記入力文書画像および前記プレプリントデータの各々から抽出された前記文書要素の色空間における代表色を推定する代表色推定部と、
前記入力文書画像および前記プレプリントデータ各々の前記代表色を前記色空間上で各々分離する分離平面を算出する分離平面算出部と、
前記入力文書画像および前記プレプリントデータ各々の前記分離平面によって分離される前記色空間の分離領域に分布する前記文書要素の各画素の色を、同じ前記分離領域に分布する前記代表色に置き換える色置換処理部と、
各画素の色を前記代表色に置き換えた前記入力文書画像の各画素と、各画素の色を前記代表色に置き換えた前記プレプリントデータの各画素との差分画像を生成する差分画像生成部と、
を備えることを特徴とする文書画像処理装置。 - 前記プレプリントデータの前記代表色と、それに対応する前記入力文書画像の前記代表色が類似している場合、前記入力文書画像の前記代表色を前記プレプリントデータの前記代表色に置き換える代表色統一部を更に備えること特徴とする請求項1に記載の文書画像処理装置。
- 前記各画素の色を前記代表色に置き換えた前記プレプリントデータと前記差分画像生成部により生成された前記差分画像とを用いて文書画像を構築する再構築処理部を更に備えることを特徴とする請求項1に記載の文書画像処理装置。
- 前記プレプリントデータを識別情報と対応付けて記憶する記憶部と、
前記入力文書画像の識別情報と一致又は類似する前記記憶部に記憶された前記プレプリントデータを前記入力文書画像のプレプリントデータとして識別する文書識別部と
を更に備えることを特徴とする請求項1に記載の文書画像処理装置。 - 前記各画素の色を前記代表色に置き換えた前記プレプリントデータを記憶する記憶部を更に備え、
前記差分画像生成部は前記各画素の色を前記代表色に置き換えた前記入力文書画像の各画素と前記記憶部に記憶された前記プレプリントデータとを用いて前記差分画像を生成することを特徴とする請求項1に記載の文書画像処理装置。 - 入力文書画像から各々の文書要素を抽出する文書要素抽出部と、
前記入力文書画像から抽出された前記文書要素の色空間における代表色を推定する代表色推定部と、
前記入力文書画像の前記代表色を前記色空間上で各々分離する分離平面を算出する分離平面算出部と、
前記入力文書画像の前記分離平面によって分離される前記色空間の分離領域に分布する前記文書要素の各画素の色を、同じ前記分離領域に分布する前記代表色に置き換える色置換処理部と、
各画素の色を前記代表色に置き換えた前記入力文書画像の各画素と、前記代表色の置き換えが既に施された前記入力文書画像に対応するプレプリントデータの各画素との差分画像を生成する差分画像生成部と、
を備えることを特徴とする文書画像処理装置。 - 前記入力文書画像と、前記入力文書画像に対応するプレプリントデータの各画素から各々の文書要素を抽出するステップと、
前記入力文書画像および前記プレプリントデータの各々から抽出された前記文書要素の色空間における代表色を推定するステップと、
前記入力文書画像および前記プレプリントデータ各々の前記代表色を前記色空間上で各々分離する分離平面を算出するステップと、
前記入力文書画像および前記プレプリントデータ各々の前記分離平面によって分離される前記色空間の分離領域に分布する前記文書要素の各画素の色を、同じ前記分離領域に分布する前記代表色に置き換えるステップと、
各画素の色を前記代表色に置き換えた前記文書画像と、各画素の色を前記代表色に置き換えた前記プレプリントデータの各画素との差分画像を生成するステップと、
を具備することを特徴とする文書画像処理方法。 - 文書画像を入力するステップと、
前記入力文書画像の各画素から文書要素を抽出するステップと、
前記入力文書画像から抽出された前記文書要素の色空間における代表色を推定するステップと、
前記入力文書画像の前記代表色を前記色空間上で分離する分離平面を算出するステップと、
前記入力文書画像の前記分離平面によって分離される前記色空間の分離領域に分布する前記文書要素の各画素の色を、同じ前記分離領域に分布する前記代表色に置き換えるステップと、
前記各画素の色を前記代表色に置き換えた前記入力文書画像と、前記代表色の置き換えが既に施された前記入力文書画像に対応するプレプリントデータの各画素との差分画像を生成するステップと、
を有することを特徴とする文書画像処理方法。 - 入力文書画像を減色処理する文書画像処理装置の文書画像処理プログラムであって、
コンピュータに、
前記入力文書画像と、前記入力文書画像に対応するプレプリントデータの各画素から各々の文書要素を抽出する機能と、
前記入力文書画像および前記プレプリントデータの各々から抽出された前記文書要素の色空間における代表色を推定する機能と、
前記入力文書画像および前記プレプリントデータ各々の前記代表色を前記色空間上で各々分離する分離平面を算出する機能と、
前記入力文書画像および前記プレプリントデータ各々の前記分離平面によって分離される前記色空間の分離領域に分布する前記文書要素の各画素の色を、同じ前記分離領域に分布する前記代表色に置き換える機能と、
各画素の色を前記代表色に置き換えた前記文書画像と、各画素の色を前記代表色に置き換えた前記プレプリントデータの各画素との差分画像を生成する機能と、
を実行させることを特徴とする文書画像処理プログラム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010058475A JP4792117B2 (ja) | 2010-03-15 | 2010-03-15 | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム |
| US13/026,735 US8830545B2 (en) | 2010-03-15 | 2011-02-14 | Document image processing system including pixel color substitution |
| CN201110041846.6A CN102194116B (zh) | 2010-03-15 | 2011-02-22 | 文档图像处理装置、文档图像处理方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010058475A JP4792117B2 (ja) | 2010-03-15 | 2010-03-15 | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2011193294A JP2011193294A (ja) | 2011-09-29 |
| JP4792117B2 true JP4792117B2 (ja) | 2011-10-12 |
Family
ID=44559739
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010058475A Active JP4792117B2 (ja) | 2010-03-15 | 2010-03-15 | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US8830545B2 (ja) |
| JP (1) | JP4792117B2 (ja) |
| CN (1) | CN102194116B (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6354253B2 (ja) * | 2014-03-26 | 2018-07-11 | 富士通株式会社 | 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム |
| JP2025042090A (ja) * | 2023-09-14 | 2025-03-27 | 理想科学工業株式会社 | 文書評価装置、方法およびプログラム並びに文書評価システム |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06139364A (ja) * | 1992-10-27 | 1994-05-20 | Fuji Xerox Co Ltd | ページ記述言語処理装置 |
| JP3483912B2 (ja) * | 1993-07-29 | 2004-01-06 | 株式会社東芝 | 色判別装置および色判別方法 |
| US6148102A (en) * | 1997-05-29 | 2000-11-14 | Adobe Systems Incorporated | Recognizing text in a multicolor image |
| JPH1196297A (ja) * | 1997-09-17 | 1999-04-09 | Hitachi Ltd | 帳票画像処理方法及び帳票画像処理装置 |
| JP4375322B2 (ja) * | 2005-11-04 | 2009-12-02 | オムロン株式会社 | 画像処理装置、画像処理方法、そのプログラム、およびそのプログラムを記録したコンピュータ読取り可能な記録媒体 |
| JP4823725B2 (ja) | 2006-03-15 | 2011-11-24 | オリンパスメディカルシステムズ株式会社 | 医療用画像処理装置 |
| JP4697035B2 (ja) * | 2006-04-28 | 2011-06-08 | 富士ゼロックス株式会社 | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
| JP4993093B2 (ja) * | 2007-05-31 | 2012-08-08 | 富士ゼロックス株式会社 | 画像処理装置および画像処理プログラム |
| JP4362538B2 (ja) * | 2007-06-06 | 2009-11-11 | シャープ株式会社 | 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体 |
| JP5091549B2 (ja) * | 2007-06-06 | 2012-12-05 | 株式会社東芝 | 文書データ処理装置 |
| JP4825888B2 (ja) | 2009-03-17 | 2011-11-30 | 株式会社東芝 | 文書画像処理装置および文書画像処理方法 |
| WO2011053300A1 (en) * | 2009-10-29 | 2011-05-05 | Hewlett-Packard Development Company, L.P. | Joint image compression method and apparatus |
-
2010
- 2010-03-15 JP JP2010058475A patent/JP4792117B2/ja active Active
-
2011
- 2011-02-14 US US13/026,735 patent/US8830545B2/en not_active Expired - Fee Related
- 2011-02-22 CN CN201110041846.6A patent/CN102194116B/zh not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| CN102194116B (zh) | 2014-10-15 |
| CN102194116A (zh) | 2011-09-21 |
| US20110222134A1 (en) | 2011-09-15 |
| JP2011193294A (ja) | 2011-09-29 |
| US8830545B2 (en) | 2014-09-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI606406B (zh) | 從成像檔案擷取正文之方法、設備以及有形電腦可讀儲存媒體 | |
| JP5934762B2 (ja) | 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置 | |
| US7965892B2 (en) | Image processing apparatus, control method thereof, and program | |
| US20120294528A1 (en) | Method of Detecting and Correcting Digital Images of Books in the Book Spine Area | |
| CN101295359B (zh) | 图像处理装置及图像处理方法 | |
| JP4902603B2 (ja) | 画像データの特徴を特定する方法及びシステム | |
| CN101344925A (zh) | 字符识别方法 | |
| JP2011022867A (ja) | 画像処理装置、画像処理システムおよびプログラム | |
| US8229214B2 (en) | Image processing apparatus and image processing method | |
| US8249364B2 (en) | Method for resolving contradicting output data from an optical character recognition (OCR) system, wherein the output data comprises more than one recognition alternative for an image of a character | |
| JP5005732B2 (ja) | 画像形成装置及び画像処理方法 | |
| JP4792117B2 (ja) | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム | |
| JP2021149452A (ja) | 画像処理装置、制御方法及び制御プログラム | |
| JP2017174031A (ja) | 画像処理装置及び画像処理プログラム | |
| JP4208520B2 (ja) | 画像処理装置および画像処理方法、プログラムおよび記憶媒体 | |
| JP2021044803A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
| JP4825888B2 (ja) | 文書画像処理装置および文書画像処理方法 | |
| JP4565396B2 (ja) | 画像処理装置および画像処理プログラム | |
| US20220343666A1 (en) | Image processing apparatus, image processing method, and storage medium | |
| JP5517028B2 (ja) | 画像処理装置 | |
| JP2008269131A (ja) | 画像処理装置及び画像処理プログラム | |
| JP4910635B2 (ja) | 画像処理装置及び画像処理プログラム | |
| JP4803001B2 (ja) | 画像処理装置及び画像処理プログラム | |
| CN113705430B (zh) | 基于检测模型的表格检测方法、装置、设备及存储介质 | |
| CN118823808A (zh) | 基于自适应结构元素的表格结构提取方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110624 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110722 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140729 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4792117 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |