JP2007166287A - 画像処理装置、および画像処理方法 - Google Patents
画像処理装置、および画像処理方法 Download PDFInfo
- Publication number
- JP2007166287A JP2007166287A JP2005360487A JP2005360487A JP2007166287A JP 2007166287 A JP2007166287 A JP 2007166287A JP 2005360487 A JP2005360487 A JP 2005360487A JP 2005360487 A JP2005360487 A JP 2005360487A JP 2007166287 A JP2007166287 A JP 2007166287A
- Authority
- JP
- Japan
- Prior art keywords
- image
- image processing
- processing
- character
- ocr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/56—Processing of colour picture signals
- H04N1/58—Edge or detail enhancement; Noise or error suppression, e.g. colour misregistration correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
【解決手段】入力された画像データに対して画像処理を施す画像処理部10にて、画像出力後にOCR処理が施されることを前提としたプリント画像を出力するためのOCRモードが指定されていることを認識し、通常の画像処理に代えてOCR処理のために有効な特定の画像処理をコントローラ11およびエンジン制御部12にて施す。
【選択図】図2
Description
また、他の公報記載の技術として、写真部と文字部の画質両立を目的に、オブジェクト毎にTagをつけて、オブジェクト毎にスクリーンを切り替える処理が行われている(例えば、特許文献2参照。)。この特許文献2に記載の技術によれば、それぞれの画像要素の持つ特性に適応した画像処理を行うことが可能となり、高画質な画像形成を行うことができる。
他方、電子化の中でオリジナルの電子ドキュメントをやり取りすれば、わざわざ紙に出力(プリントアウト)してOCR処理しなくても済むとの考えもある。しかしながら、例えば電子文書に関する日本国の法律(例えば電子文書法)等により紙と電子の両方の原本が必要となるケースがあり、また、現状では、例えば交通費処理、領収書を貼って割印する等の紙を原本として採用する文化が根強く存在している。その結果、かかる紙に記載された文字を読み取ってデータとして入力する要求は依然として強く、プリントアウトした用紙に対するOCR処理の要求は非常に高い。
また、現状、プリントサンプルとして、人間の見た目で高画質になる場合と、OCR機能から見て高画質になる場合とは必ずしも一致しない。上記特許文献2の技術を採用することで、人間の見た目の高画質は達成できるが、コード化処理の観点から見て更に高画質化のための施策が必要となる。
また他の目的は、機械認識機能という観点から見た高画質を達成し得る特定モードを設け、後処理で例えばOCRをかける予定がある場合に、予めプリント時にOCRが判断し易い画像を出力することにある。
また、この処理手段は、機械認識処理が実行される箇所である文字部を機械認識し易くなるように加工することを特徴としている。
更にこの処理手段は、入力された画像データのプリントコマンドに応じたオブジェクト分離を実施し、このオブジェクト分離によって分離された文字部について画像濃度を飽和させ、または黒(100%)一色に置き換えることを特徴としている。
また、この処理手段は、入力された画像データのプリントコマンドに応じたオブジェクト分離を実施し、このオブジェクト分離によって分離された線画部で指定されるエリアについて機械認識され難くなるように画像処理を施すことを特徴とすることができる。
更に、この処理手段は、線画部で指定されるエリアの濃度を、例えば白(0%)に置き換えるなど、減ずることを特徴とすることができる。
また更に、この処理手段は、線画部で指定されるエリアをスキャナの読み取り難い色に置き換えることを特徴としている。
また、この変換手段は、文字線画情報のフォントをボールドのフォントに変換することを特徴とすることができる。
更に、この変換手段は、文字線画情報のフォントを、機械認識処理を容易とするサイズに変換することを特徴としている。例えば、小さいフォントを大きなフォントに変換することで、認識率を上げることができる。
また更に、この変換手段は、文字線画情報のフォントに強調処理を施すことを特徴とすることができる。
また、この変換手段は、フォントの中の小さい記号についてサイズを拡大して出力することを特徴とすることができる。例えば、句読点、小数点、カンマ、ダッシュ、ピリオドなどである。これらのサイズを拡大することで、OCR処理に際して誤って認識される確率を大幅に減らすことが可能となる。
〔実施の形態1〕
図1は、本実施の形態が適用されるプリンタシステムの全体構成を示した図である。ここでは、入力された電子文書の情報を画像展開して用紙上に印刷する画像形成装置1と、この画像形成装置1に対して電子文書を提供するホストコンピュータであるクライアントPC(パーソナルコンピュータ)2とが示されている。この画像形成装置1には、クライアントPC2以外の、図示しない画像読み取り装置(IIT)などから画像データが入力される場合がある。画像形成装置1は、OCR(Optical Character Reader)の対象となるプリント画像を出力(プリントアウト)する。
図2は、本実施の形態が適用されるプリンタシステムの機能構成を示すブロック図である。画像処理部10は、大きくコントローラ11とエンジン制御部12とを備えている。コントローラ11は、クライアントPC2から送られてくるPDL(Page Description Language:ページ記述言語)をコマンド解釈するPDL解釈部21と、PDL指定の色信号(RGB)からマーキングエンジン30の色信号(YMCK)に変換する描画部22とを備えている。また、描画部22にて描画された中間コードをマーキングエンジン30に適合した画像データにレンダリングするレンダリング部23を備えている。
一方、エンジン制御部12は、レンダリングされた画像に対してエッジ判定を行うエッジ判定部24と、エッジ判定がなされた画像に対してスクリーン処理(2値化処理)を施すスクリーン部25とを備えている。また、スクリーン部25にてスクリーニングされた画像データにパルス幅変調を施すパルス幅変調部26を備えている。パルス幅変調部26によりパルス幅変調が施された画像データは、マーキングエンジン30へ出力される。
図3は、本実施の形態のプリンタシステムにて実行されるOCRモード処理を示したフローチャートである。ステップ101からステップ103まではクライアントPC2にて実行される処理であり、ステップ104からステップ111までは、画像処理部10において実行される処理である。
まず、例えばクライアントPC2上で、ユーザによってなされたOCRモード選択を認識する(ステップ101)。また、クライアントPC2のプリンタドライバにて、アプリケーションからのコマンドをプリンタの描画コマンドであるPDL(ページ記述言語)に変換する(ステップ102)。このプリンタドライバにて変換されたPDLの描画コマンドは、クライアントPC2から画像処理部10に送られる(ステップ103)。
ここで、線画濃度は、例えばブルーや黄色のような、スキャナで読み取りにくい特定色に置き換えることも好ましい。また、この線画濃度の制御は、線画の幅に応じて、加工処理を切り替えることも有効である。例えば、帳票の線は白に置き換え、表の枠は強調する等である。更に、プリントコマンドに応じてオブジェクト分離を実施し、重ね合わせ文字エリアを検出し、背景部色を白に置き換えるように構成することもできる。特に、背景と文字とのコントラストの差が小さい場合に、背景部分を白に置き換えることは、コード化処理を良好に行うためには有効である。また更に、画像加工において、フォント(Font)を解釈し、句読点や小数点、ダッシュやピリオド、カンマなど、小さい記号の場合はサイズを拡大して出力することを特徴とすることもできる。このように、小さい記号を強調することで、これらの認識率を高めることが可能となり、OCRで読み取った後に、人手によって修正を施す等の後処理を軽減することが可能となる。特に小数点を、句読点やカンマなどと読み違えるか否かは、OCRの認識率に大きく影響する。したがって、これらの認識率を大幅に向上させることのできる本実施の形態の意義は大きい。
実施の形態1では、OCR処理がし易いように、プリント出力時に画像処理部10にて画像をエンハンスしている。実施の形態2では、クライアントPC2側および/または画像処理部10側にて、例えばフォントを変えることによってOCR用のプリント出力を実現する点に特徴がある。尚、実施の形態1と同様の機能については同様の符号を用い、ここではその詳細な説明を省略する。
また、OCR認識に際して、文字が薄いと、二値化した場合に閾値以下となって認識できなくなる可能性がある。そこで、色文字の色を黒に置換して出力することも有効である。
更に、スキャナの解像度に対してフォントの文字が小さく、OCRの読み取りが正確に行われない場合がある。そこで、文字のフォントサイズを、例えば10ポイントから14ポイント等に変換して出力する方法も好ましい。
Claims (17)
- 入力された画像データに対して画像処理を施す画像処理装置であって、
画像出力後に機械認識処理が施されることを前提としたプリント画像を出力するための機械認識処理モードが指定されていることを認識する認識手段と、
前記認識手段により前記機械認識処理モードの指定が認識された場合に、通常の画像処理に代えて前記機械認識処理のための特定の画像処理を施す処理手段と
を備えたことを特徴とする画像処理装置。 - 前記認識手段により認識される機械認識処理モードは、画像出力後にOCR(Optical Character Reader)処理が施されることを前提とするモードであることを特徴とする請求項1記載の画像処理装置。
- 前記処理手段は、機械認識処理が実行される箇所である文字部を機械認識し易くなるように加工することを特徴とする請求項2記載の画像処理装置。
- 前記処理手段は、入力された前記画像データのプリントコマンドに応じたオブジェクト分離を実施し、当該オブジェクト分離によって分離された文字部について画像濃度を飽和させ、または黒(100%)一色に置き換えることを特徴とする請求項3記載の画像処理装置。
- 前記処理手段は、入力された前記画像データがラスタ画像である場合にエッジ抽出処理を行い、当該エッジ抽出処理により抽出されたエッジ部に対して画像濃度を飽和させることで、濃度の低い文字のコード化処理を良好にすることを特徴とする請求項2記載の画像処理装置。
- 前記処理手段は、入力された前記画像データのプリントコマンドに応じたオブジェクト分離を実施し、当該オブジェクト分離によって分離された線画部で指定されるエリアについて機械認識され難くなるように画像処理を施すことを特徴とする請求項1記載の画像処理装置。
- 前記処理手段は、前記線画部で指定されるエリアの濃度を減ずることを特徴とする請求項6記載の画像処理装置。
- 前記処理手段は、前記線画部で指定されるエリアをスキャナの読み取り難い色に置き換えることを特徴とする請求項6記載の画像処理装置。
- 特定のフォントを有する文字線画情報に画像処理を施して画像データを出力する画像処理装置であって、
前記文字線画情報を入力する入力手段と、
前記入力手段により入力された前記文字線画情報の中から、プリント出力後に機械認識処理がなされるであろう文字線画情報のフォントを、当該機械認識処理のための特定のフォントに変換する変換手段と
を備えたことを特徴とする画像処理装置。 - 前記機械認識処理のためのプリント出力である機械認識処理モードのユーザ指定を認識する認識手段を更に備え、
前記変換手段は、前記認識手段による認識から当該プリント出力後に機械認識処理がなされるものとしてフォントの変換を行うことを特徴とする請求項9記載の画像処理装置。 - 前記変換手段は、前記文字線画情報のフォントをボールドのフォントに変換することを特徴とする請求項9記載の画像処理装置。
- 前記変換手段は、前記文字線画情報のフォントを、前記機械認識処理を容易とするサイズに変換することを特徴とする請求項9記載の画像処理装置。
- 前記変換手段は、前記文字線画情報のフォントに強調処理を施すことを特徴とする請求項9記載の画像処理装置。
- 前記変換手段は、前記フォントの中の小さい記号についてサイズを拡大して出力することを特徴とする請求項9記載の画像処理装置。
- 入力された前記文字線画情報が色背景中にあるか否かを判断する手段を更に備え、
前記文字線画情報が前記色背景中にあると判断される場合に、当該色背景の濃度を減ずることを特徴とする請求項9記載の画像処理装置。 - 入力された画像データに対して画像処理を施す画像処理方法であって、
画像出力後にOCR処理が施されることを前提としたプリント画像を出力するためのOCRモードの指定情報を入力し、
前記OCRモードの指定情報を入力した場合に、前記OCR処理に際して文字部が認識し易くなるように、通常の画像処理に代え特定の画像処理を施すことを特徴とする画像処理方法。 - 前記特定の画像処理は、入力された画像データの有する文字部のフォントを、OCR処理の認識がし易いフォントに変換して出力することを特徴とする請求項16記載の画像処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005360487A JP2007166287A (ja) | 2005-12-14 | 2005-12-14 | 画像処理装置、および画像処理方法 |
US11/447,988 US20070133020A1 (en) | 2005-12-14 | 2006-06-07 | Image processing system and image processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005360487A JP2007166287A (ja) | 2005-12-14 | 2005-12-14 | 画像処理装置、および画像処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007166287A true JP2007166287A (ja) | 2007-06-28 |
Family
ID=38138954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005360487A Pending JP2007166287A (ja) | 2005-12-14 | 2005-12-14 | 画像処理装置、および画像処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20070133020A1 (ja) |
JP (1) | JP2007166287A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11521365B2 (en) | 2019-04-02 | 2022-12-06 | Canon Kabushiki Kaisha | Image processing system, image processing apparatus, image processing method, and storage medium |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4817994B2 (ja) * | 2006-07-03 | 2011-11-16 | キヤノン株式会社 | データ管理システム |
JP4529990B2 (ja) * | 2007-03-30 | 2010-08-25 | ブラザー工業株式会社 | 画像処理プログラム及び画像処理装置 |
US8467089B2 (en) * | 2008-11-24 | 2013-06-18 | Xerox Corporation | Systems and methods for line width control and pixel retagging |
US20130282600A1 (en) * | 2012-04-23 | 2013-10-24 | Sap Ag | Pattern Based Audit Issue Reporting |
JP5992956B2 (ja) * | 2014-05-27 | 2016-09-14 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
CN107665087B (zh) * | 2016-07-28 | 2021-03-16 | 夏普株式会社 | 图像显示装置、图像显示方法以及图像显示系统 |
US20190139280A1 (en) * | 2017-11-06 | 2019-05-09 | Microsoft Technology Licensing, Llc | Augmented reality environment for tabular data in an image feed |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07160815A (ja) * | 1993-12-02 | 1995-06-23 | Hitachi Eng Co Ltd | 輪郭強調による画像二値化処理方法及び装置 |
JPH11272257A (ja) * | 1997-12-16 | 1999-10-08 | Fuji Xerox Co Ltd | 画像処理装置、画像出力装置、画像処理方法および画像処理プログラムを記録した記録媒体 |
JP2000316077A (ja) * | 1999-04-28 | 2000-11-14 | Canon Inc | 画像データ格納装置及び方法及び記憶媒体 |
JP2001096872A (ja) * | 1999-09-29 | 2001-04-10 | Chescom International Co Ltd | プリンタ装置および印刷物検査装置 |
JP2001253125A (ja) * | 2000-03-10 | 2001-09-18 | Canon Inc | 画像処理システム及び画像処理方法 |
JP2002279346A (ja) * | 2001-03-15 | 2002-09-27 | Ricoh Co Ltd | 画像処理装置、画像処理方法、記録媒体および文字認識装置 |
JP2003179768A (ja) * | 2001-12-10 | 2003-06-27 | Pfu Ltd | 画像処理装置 |
JP2004227255A (ja) * | 2003-01-22 | 2004-08-12 | Mitsubishi Electric Corp | 文書解析装置 |
JP2004326213A (ja) * | 2003-04-22 | 2004-11-18 | Fuji Oozx Inc | 伝票作成方法およびそのシステム |
JP2005071088A (ja) * | 2003-08-25 | 2005-03-17 | Canon Inc | 画像処理装置、画像処理方法ならびにプログラム、記憶媒体 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0604685A1 (en) * | 1992-12-28 | 1994-07-06 | Océ-Nederland B.V. | Method of modifying the fatness of characters |
US6571011B1 (en) * | 1995-06-06 | 2003-05-27 | Apple Computer, Inc. | Conversion of output device color values to minimize image quality artifacts |
US6178011B1 (en) * | 1998-03-24 | 2001-01-23 | Hewlett-Packard Company | Adaptive image resolution enhancement technology |
US6470094B1 (en) * | 2000-03-14 | 2002-10-22 | Intel Corporation | Generalized text localization in images |
JP4057337B2 (ja) * | 2002-04-24 | 2008-03-05 | 東芝テック株式会社 | 画像処理装置と画像形成装置 |
US7079686B2 (en) * | 2002-08-20 | 2006-07-18 | Lexmark International, Inc. | Systems and methods for content-based document image enhancement |
JP4401944B2 (ja) * | 2004-12-08 | 2010-01-20 | キヤノン株式会社 | 情報処理装置、情報処理方法ならびにプログラム |
-
2005
- 2005-12-14 JP JP2005360487A patent/JP2007166287A/ja active Pending
-
2006
- 2006-06-07 US US11/447,988 patent/US20070133020A1/en not_active Abandoned
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07160815A (ja) * | 1993-12-02 | 1995-06-23 | Hitachi Eng Co Ltd | 輪郭強調による画像二値化処理方法及び装置 |
JPH11272257A (ja) * | 1997-12-16 | 1999-10-08 | Fuji Xerox Co Ltd | 画像処理装置、画像出力装置、画像処理方法および画像処理プログラムを記録した記録媒体 |
JP2000316077A (ja) * | 1999-04-28 | 2000-11-14 | Canon Inc | 画像データ格納装置及び方法及び記憶媒体 |
JP2001096872A (ja) * | 1999-09-29 | 2001-04-10 | Chescom International Co Ltd | プリンタ装置および印刷物検査装置 |
JP2001253125A (ja) * | 2000-03-10 | 2001-09-18 | Canon Inc | 画像処理システム及び画像処理方法 |
JP2002279346A (ja) * | 2001-03-15 | 2002-09-27 | Ricoh Co Ltd | 画像処理装置、画像処理方法、記録媒体および文字認識装置 |
JP2003179768A (ja) * | 2001-12-10 | 2003-06-27 | Pfu Ltd | 画像処理装置 |
JP2004227255A (ja) * | 2003-01-22 | 2004-08-12 | Mitsubishi Electric Corp | 文書解析装置 |
JP2004326213A (ja) * | 2003-04-22 | 2004-11-18 | Fuji Oozx Inc | 伝票作成方法およびそのシステム |
JP2005071088A (ja) * | 2003-08-25 | 2005-03-17 | Canon Inc | 画像処理装置、画像処理方法ならびにプログラム、記憶媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11521365B2 (en) | 2019-04-02 | 2022-12-06 | Canon Kabushiki Kaisha | Image processing system, image processing apparatus, image processing method, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
US20070133020A1 (en) | 2007-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7505174B2 (en) | Image processing method, system and apparatus, and storage medium | |
US8423900B2 (en) | Object based adaptive document resizing | |
US7692813B2 (en) | Image processing apparatus and method, and storage medium | |
CN102404478B (zh) | 图像形成装置及系统、信息处理装置、图像形成方法 | |
JP4890974B2 (ja) | 画像処理装置、及び画像処理方法 | |
US6556311B1 (en) | Luminance-based color resolution enhancement | |
JP2007166287A (ja) | 画像処理装置、および画像処理方法 | |
EP0772117A1 (en) | Printer driver architecture for reducing band memory | |
JP4872860B2 (ja) | 画像処理装置及び画像処理方法 | |
JP2006262204A (ja) | 画像処理装置及び画像処理方法 | |
JP5499981B2 (ja) | 画像処理装置 | |
CN101090433B (zh) | 图像形成装置和图像形成方法 | |
KR100869284B1 (ko) | 화상 처리 장치 및 화상 처리 방법 | |
US10582088B2 (en) | Information processing apparatus, method, and storage medium for causing printer driver to generate drawing command | |
US8259313B2 (en) | Image processing apparatus, method, and computer-readable medium storing the program thereof | |
JP4797766B2 (ja) | 画像処理装置、画像形成装置および画像処理方法 | |
US20090244559A1 (en) | Image rasterizing apparatus and image rasterizing method | |
US8390907B2 (en) | Image-processing device, image-forming device, image-processing method, and computer readable medium | |
EP2860956B1 (en) | Method for converting print data into a raster image | |
JP2019121870A (ja) | 画像処理装置とその制御方法、及びプログラム | |
JP4217332B2 (ja) | 画像処理装置及びその方法、コンピュータ可読メモリ | |
JP4306841B2 (ja) | 画像処理装置及びその方法、コンピュータ可読メモリ | |
RU2452126C1 (ru) | Устройство обработки изображения, способ обработки изображения и носитель информации | |
US20120140291A1 (en) | System and method of printing micro-pictures for anti-counterfeiting and copy protection | |
US20130063483A1 (en) | System and method to enable correction to application of substantially colorless material over identified text via segmentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100629 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100827 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110301 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110428 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110830 |