JP7022847B2 - 画像処理装置、制御方法及び制御プログラム - Google Patents

画像処理装置、制御方法及び制御プログラム Download PDF

Info

Publication number
JP7022847B2
JP7022847B2 JP2020554628A JP2020554628A JP7022847B2 JP 7022847 B2 JP7022847 B2 JP 7022847B2 JP 2020554628 A JP2020554628 A JP 2020554628A JP 2020554628 A JP2020554628 A JP 2020554628A JP 7022847 B2 JP7022847 B2 JP 7022847B2
Authority
JP
Japan
Prior art keywords
shading
image
pattern
pixel
shaded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020554628A
Other languages
English (en)
Other versions
JPWO2020089984A1 (ja
Inventor
裕紀 谷崎
清人 小坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Publication of JPWO2020089984A1 publication Critical patent/JPWO2020089984A1/ja
Application granted granted Critical
Publication of JP7022847B2 publication Critical patent/JP7022847B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/58Edge or detail enhancement; Noise or error suppression, e.g. colour misregistration correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)

Description

本開示は、画像処理装置、制御方法及び制御プログラムに関し、特に、網掛けが含まれる画像を処理する画像処理装置、制御方法及び制御プログラムに関する。
請求書等の帳票を担当者が手作業によりデータ化している会社では、膨大な数の帳票のデータ化が必要である場合に担当者の業務負担が大きくなるため、帳票のデータ化作業の効率化に対する要望が高まっている。帳票のデータ化作業の効率化を図るためには、帳票に記載されている文字をコンピュータが正しく認識する必要がある。しかしながら、帳票において、網掛けが写っている用紙に文字が印刷されている場合、その文字が正しく認識されない可能性がある。
網掛け画像から、標準的な網点とほぼ同じ径を持つ黒画素の連結成分の中心位置を検出し、その連結成分を網掛け画像から除去して網点除去画像を生成する文字認識装置が開示されている(特許文献1)。
特開2008-134970号公報
画像処理装置では、網掛けが含まれる画像から網掛けをより精度良く除去することが求められている。
画像処理装置、制御方法及び制御プログラムの目的は、網掛けが含まれる画像から網掛けをより精度良く除去することを可能とすることにある。
実施形態の一側面に係る画像処理装置は、注目画素及び注目画素に対して所定の位置関係にある複数の画素の階調値の条件が設定された網掛けパターンを記憶する記憶部と、多値画像を取得する取得部と、多値画像から二値画像を生成する二値画像生成部と、多値画像から、網掛けパターンに設定された条件を満たす画素を網掛けの一部として検出する検出部と、多値画像に基づいて、検出された網掛けを除去するための網掛け除去パターンを生成する網掛け除去パターン生成部と、二値画像に対して網掛け除去パターンを適用して網掛け除去画像を生成する網掛け除去画像生成部と、網掛け除去画像又は網掛け除去画像を用いて生成した情報を出力する出力部と、を有する。
実施形態の他の側面に係る画像処理装置は、注目画素及び注目画素に対して所定の位置関係にある複数の画素の階調値の条件が設定された網掛けパターンを記憶する記憶部と、多値画像を取得する取得部と、多値画像から、網掛けパターンに設定された条件を満たす画素を網掛けの一部として検出する検出部と、多値画像に基づいて、検出された網掛けを除去するための網掛け除去パターンを生成する網掛け除去パターン生成部と、多値画像に対して網掛け除去パターンを適用して網掛け除去画像を生成する網掛け除去画像生成部と、網掛け除去画像又は網掛け除去画像を用いて生成した情報を出力する出力部と、を有する。
また、実施形態の一側面に係る制御方法は、記憶部及び出力部を有する画像処理装置の制御方法であって、画像処理装置が、注目画素及び注目画素に対して所定の位置関係にある複数の画素の階調値の条件が設定された網掛けパターンを記憶部に記憶し、多値画像を取得し、多値画像から二値画像を生成し、多値画像から、網掛けパターンに設定された条件を満たす画素を網掛けの一部として検出し、多値画像に基づいて、検出された網掛けを除去するための網掛け除去パターンを生成し、二値画像に対して網掛け除去パターンを適用して網掛け除去画像を生成し、網掛け除去画像又は網掛け除去画像を用いて生成した情報を出力部から出力することを含む。
また、実施形態の他の側面に係る制御方法は、記憶部及び出力部を有する画像処理装置の制御方法であって、画像処理装置が、注目画素及び注目画素に対して所定の位置関係にある複数の画素の階調値の条件が設定された網掛けパターンを記憶部に記憶し、多値画像を取得し、多値画像から、網掛けパターンに設定された条件を満たす画素を網掛けの一部として検出し、多値画像に基づいて、検出された網掛けを除去するための網掛け除去パターンを生成し、多値画像に対して網掛け除去パターンを適用して網掛け除去画像を生成し、網掛け除去画像又は網掛け除去画像を用いて生成した情報を出力部から出力することを含む。
また、実施形態の一側面に係る制御プログラムは、記憶部及び出力部を有するコンピュータの制御プログラムであって、注目画素及び注目画素に対して所定の位置関係にある複数の画素の階調値の条件が設定された網掛けパターンを記憶部に記憶し、多値画像を取得し、多値画像から二値画像を生成し、多値画像から、網掛けパターンに設定された条件を満たす画素を網掛けの一部として検出し、多値画像に基づいて、検出された網掛けを除去するための網掛け除去パターンを生成し、二値画像に対して網掛け除去パターンを適用して網掛け除去画像を生成し、網掛け除去画像又は網掛け除去画像を用いて生成した情報を出力部から出力することをコンピュータに実行させる。
また、実施形態の他の側面に係る制御プログラムは、記憶部及び出力部を有するコンピュータの制御プログラムであって、注目画素及び注目画素に対して所定の位置関係にある複数の画素の階調値の条件が設定された網掛けパターンを記憶部に記憶し、多値画像を取得し、多値画像から、網掛けパターンに設定された条件を満たす画素を網掛けの一部として検出し、多値画像に基づいて、検出された網掛けを除去するための網掛け除去パターンを生成し、多値画像に対して網掛け除去パターンを適用して網掛け除去画像を生成し、網掛け除去画像又は網掛け除去画像を用いて生成した情報を出力部から出力することをコンピュータに実行させる。
本実施形態によれば、画像処理装置、制御方法及び制御プログラムは、網掛けが含まれる画像から網掛けをより精度良く除去することが可能となる。
本発明の目的及び効果は、特に請求項において指摘される構成要素及び組み合わせを用いることによって認識され且つ得られるだろう。前述の一般的な説明及び後述の詳細な説明の両方は、例示的及び説明的なものであり、特許請求の範囲に記載されている本発明を制限するものではない。
実施形態に従った画像処理システム1の概略構成を示す図である。 第2記憶装置210及び第2CPU220の概略構成を示す図である。 網掛けパターンについて説明するための模式図である。 網掛けパターンについて説明するための模式図である。 網掛けパターンについて説明するための模式図である。 網掛けパターンについて説明するための模式図である。 網掛けパターンについて説明するための模式図である。 画像読取処理の動作を示すフローチャートである。 認識処理の動作を示すフローチャートである。 多値画像の一部の領域600の一例を示す模式図である。 二値画像の一部の領域610の一例を示す模式図である。 網掛け画素について説明するための模式図である。 網掛け画素について説明するための模式図である。 網掛け画素について説明するための模式図である。 網掛け画素について説明するための模式図である。 網掛け画素について説明するための模式図である。 網掛け画素について説明するための模式図である。 網掛け除去パターンについて説明するための模式図である。 網掛け除去パターンについて説明するための模式図である。 網掛け除去パターンについて説明するための模式図である。 網掛け除去パターンについて説明するための模式図である。 網掛け除去パターンについて説明するための模式図である。 網掛け除去パターンについて説明するための模式図である。 網掛け除去画像の一部の領域1100の一例を示す模式図である。 認識処理の動作の他の例を示すフローチャートである。 網掛け除去画像の一部の領域1300の一例を示す模式図である。 処理装置230の概略構成を示すブロック図である。 網掛けパターンの他の例を示す模式図である。 網掛けパターンの他の例を示す模式図である。
以下、本開示の一側面に係る画像処理装置、制御方法及び制御プログラムについて図を参照しつつ説明する。但し、本発明の技術的範囲はそれらの実施の形態に限定されず、特許請求の範囲に記載された発明とその均等物に及ぶ点に留意されたい。
図1は、実施形態に従った画像処理システムの概略構成を示す図である。図1に示すように、画像処理システム1は、画像読取装置100と、情報処理装置200とを有する。
画像読取装置100は、例えばスキャナ装置等である。画像読取装置100は、情報処理装置200に接続されている。情報処理装置200は、画像処理装置の一例であり、例えばパーソナルコンピュータ等である。
画像読取装置100は、第1インタフェース装置101と、撮像装置102と、第1記憶装置110と、第1CPU(Control Processing Unit)120とを有する。
第1インタフェース装置101は、USB(Universal Serial Bus)等のシリアルバスに準じるインタフェース回路を有し、情報処理装置200と電気的に接続して画像データ及び各種の情報を送受信する。また、第1インタフェース装置101の代わりに、無線信号を送受信するアンテナと、所定の通信プロトコルに従って、無線通信回線を通じて信号の送受信を行うための無線通信インタフェース回路とを有する通信装置が用いられてもよい。所定の通信プロトコルは、例えば無線LAN(Local Area Network)である。
撮像装置102は、主走査方向に直線状に配列されたCCD(Charge Coupled Device)による撮像素子を備える縮小光学系タイプの撮像センサを有する。さらに、撮像装置102は、光を照射する光源と、撮像素子上に像を結ぶレンズと、撮像素子から出力された電気信号を増幅してアナログ/デジタル(A/D)変換するA/D変換器とを有する。撮像装置102において、撮像センサは、搬送される用紙の表面を撮像してアナログの画像信号を生成して出力し、A/D変換器は、このアナログの画像信号をA/D変換してデジタルの入力画像を生成して出力する。入力画像は、各画素データが、例えばRGB各色毎に8bitで表される計24bitのR(赤色)値、G(緑色)値、B(青色)値からなるカラー多値画像である。なお、CCDの代わりにCMOS(Complementary Metal Oxide Semiconductor)による撮像素子を備える等倍光学系タイプのCIS(Contact Image Sensor)が用いられてもよい。
第1記憶装置110は、RAM(Random Access Memory)、ROM(Read Only Memory)等のメモリ装置、ハードディスク等の固定ディスク装置、又はフレキシブルディスク、光ディスク等の可搬用の記憶装置等を有する。また、第1記憶装置110には、画像読取装置100の各種処理に用いられるコンピュータプログラム、データベース、テーブル等が格納される。コンピュータプログラムは、コンピュータ読み取り可能な可搬型記録媒体から公知のセットアッププログラム等を用いて第1記憶装置110にインストールされてもよい。可搬型記録媒体は、例えばCD-ROM(compact disk read only memory)、DVD-ROM(digital versatile disk read only memory)等である。また、第1記憶装置110は、撮像装置102により生成された入力画像等を記憶する。
第1CPU120は、予め第1記憶装置110に記憶されているプログラムに基づいて動作する。なお、第1CPU120に代えて、DSP(digital signal processor)、LSI(large scale integration)等が用いられてよい。また、第1CPU120に代えて、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programming Gate Array)等が用いられてもよい。
第1CPU120は、第1インタフェース装置101、撮像装置102及び第1記憶装置110等と接続され、これらの各部を制御する。第1CPU120は、撮像装置102の原稿読取制御、第1インタフェース装置101を介した情報処理装置200とのデータ送受信制御等を行う。
情報処理装置200は、第2インタフェース装置201と、入力装置202と、表示装置203と、第2記憶装置210と、第2CPU220と、処理装置230とを有する。以下、情報処理装置200の各部について詳細に説明する。
第2インタフェース装置201は、画像読取装置100の第1インタフェース装置101と同様のインタフェース回路を有し、情報処理装置200と画像読取装置100とを接続する。また、第2インタフェース装置201の代わりに、無線信号を送受信するアンテナと、無線LAN等の所定の通信プロトコルに従って、無線通信回線を通じて信号の送受信を行うための無線通信インタフェース回路とを有する通信装置が用いられてもよい。
入力装置202は、キーボード、マウス等の入力装置及び入力装置から信号を取得するインタフェース回路を有し、利用者の操作に応じた信号を第2CPU220に出力する。
表示装置203は、出力部の一例である。表示装置203は、液晶、有機EL等から構成されるディスプレイ及びディスプレイに画像データを出力するインタフェース回路を有し、第2記憶装置210と接続されて第2記憶装置210に保存されている画像データをディスプレイに表示する。
第2記憶装置210は、画像読取装置100の第1記憶装置110と同様のメモリ装置、固定ディスク装置、可搬用の記憶装置等を有する。第2記憶装置210には、情報処理装置200の各種処理に用いられるコンピュータプログラム、データベース、テーブル等が格納される。コンピュータプログラムは、例えばCD-ROM、DVD-ROM等のコンピュータ読み取り可能な可搬型記録媒体から、公知のセットアッププログラム等を用いて第2記憶装置210にインストールされてもよい。また、第2記憶装置210は、画像読取装置100から受信した入力画像、及び、処理装置230により入力画像に対して画像処理がなされた各種の処理画像等を記憶する。さらに、第2記憶装置210は、注目画素及び注目画素に対して所定の位置関係にある複数の画素の階調値の条件が設定された網掛けパターンを複数記憶する。網掛けパターンの詳細については後述する。
第2CPU220は、予め第2記憶装置210に記憶されているプログラムに基づいて動作する。なお、第2CPU220に代えて、DSP、LSI、ASIC、FPGA等が用いられてもよい。
第2CPU220は、第2インタフェース装置201、入力装置202、表示装置203、第2記憶装置210及び処理装置230等と接続され、これらの各部を制御する。第2CPU220は、第2インタフェース装置201を介した画像読取装置100とのデータ送受信制御、入力装置202の入力制御、表示装置203の表示制御、処理装置230による画像処理の制御等を行う。
処理装置230は、入力画像に対して所定の画像処理を実行する。処理装置230は、CPU、DSP、LSI、ASIC又はFPGA等で構成される。
図2は、第2記憶装置210及び第2CPU220の概略構成を示す図である。
図2に示すように第2記憶装置210には、取得プログラム211、二値画像生成プログラム212、検出プログラム213、網掛け除去パターン生成プログラム214、網掛け除去画像生成プログラム215、文字認識プログラム216及び出力制御プログラム217等の各プログラムが記憶される。これらの各プログラムは、プロセッサ上で動作するソフトウェアにより実装される機能モジュールである。第2CPU220は、第2記憶装置210に記憶された各プログラムを読み取り、読み取った各プログラムに従って動作する。これにより、第2CPU220は、取得部221、二値画像生成部222、検出部223、網掛け除去パターン生成部224、網掛け除去画像生成部225、文字認識部226及び出力制御部227として機能する。
図3A~図3Eは、網掛けパターンについて説明するための模式図である。
請求書等の帳票では、網掛けが写っている用紙に文字が印刷されている場合がある。網掛けは、特定色を有する複数の点もしくは丸等の記号、又は、横線、縦線及び/もしくは斜め線等のラインが周期的に配置された模様である。一般に、特定色として、白色等の背景色及び黒色等の文字色の両方と異なる色、特にその中間の色(例えばグレー)が使用される。
図3A~図3Eは、複数の点が周期的に配置された網掛けを検出するための網掛けパターンの一例を示す。図3A~図3Eは、それぞれ異なる網掛けパターンを示す。図3A~図3Eにおいて、各矩形は画像内の各画素を示す。
図3Aに示す網掛けパターン300において、各画素Pのパラメータは、各画素Pが位置する左右(水平)方向及び上下(垂直)方向の座標を示す。画素P(x、y)は、座標(x、y)に位置する注目画素である。
網掛けパターン300では、以下の八つの条件が設定されている。
Figure 0007022847000001
ここで、V(α、β)は、画素P(α、β)の階調値であり、Tは閾値である。階調値は、色値(R値、G値もしくはB値)、又は、各色値の最大値等である。条件1の第1式は、注目画素が記号に対応することを想定した場合に、注目画素から上方向に2画素離れた位置に、階調値が注目画素の階調値に対して閾値Tより高い、背景に対応する背景画素が存在することを規定している。また、条件1の第2式は、その背景画素からさらに上方向に2画素離れた位置に、階調値がその背景画素の階調値に対して閾値Tより低い、記号に対応する記号画素が存在することを規定している。同様に、条件2~8の第1式は、それぞれ注目画素から下、右、左、右上、左下、左上及び右下方向に2画素離れた位置に、階調値が注目画素の階調値に対して閾値Tより高い背景画素が存在することを規定している。また、条件2~8の第2式は、それぞれその背景画素からさらに下、右、左、右上、左下、左上及び右下方向に2画素離れた位置に、階調値がその背景画素の階調値に対して閾値Tより低い記号画素が存在することを規定している。
多値画像において、特定色を有する記号に対応する画素と隣接する画素は、特定色と背景色の間の色を有し、その階調値は、その記号が撮影された時の撮像装置102の撮像素子の位置に応じて異なる。そのため、網掛けパターン300では、上下方向及び左右方向において、注目画素と隣接する隣接画素の階調値については条件が設定されていない。
なお、上下又は左右方向の条件に、注目画素と背景画素の間の画素の階調値が注目画素の階調値と背景画素の階調値の間の値を有し、背景画素と記号画素の間の画素の階調値が背景画素の階調値と記号画素の階調値の間の値を有することが設定されてもよい。その場合、上記の条件1~4に、それぞれ以下の四つの条件1’~4’が追加される。
Figure 0007022847000002
即ち、網掛けパターン300に対応する条件が満たされる場合、注目画素に対応する記号に対して八方向(上下、左右及び斜め方向)に略同一距離に、背景を挟んで記号が存在する。
図3Bに示す網掛けパターン310では、上記の八つの条件の内の条件1、3、4、5、7のみが設定され、注目画素に対応する記号に対して左下、下及び右下方向には条件が設定されていない。即ち、網掛けパターン310に対応する条件が満たされる場合、注目画素に対応する記号に対して左、左上、上、右上及び右方向に略同一距離に、背景を挟んで記号が存在する。網掛けパターン310により、下方向において、文字等と重なり、網掛けが連続しない記号が検出される。
図3Cに示す網掛けパターン320では、上記の八つの条件の内の条件2、3、4、6、8のみが設定され、注目画素に対応する記号に対して右上、上及び左上方向には条件が設定されていない。即ち、網掛けパターン320に対応する条件が満たされる場合、注目画素に対応する記号に対して左、左下、下、右下及び右方向に略同一距離に、背景を挟んで記号が存在する。網掛けパターン320により、上方向において、文字等と重なり、網掛けが連続しない記号が検出される。
図3Dに示す網掛けパターン330では、上記の八つの条件の内の条件1、2、3、5、8のみが設定され、注目画素に対応する記号に対して左上、左及び左下方向には条件が設定されていない。即ち、網掛けパターン330に対応する条件が満たされる場合、注目画素に対応する記号に対して上、右上、右、右下及び下方向に略同一距離に、背景を挟んで記号が存在する。網掛けパターン330により、左方向において、文字等と重なり、網掛けが連続しない記号が検出される。
図3Eに示す網掛けパターン340では、上記の八つの条件の内の条件1、2、4、6、7のみが設定され、注目画素に対応する記号に対して右上、右及び右下方向には条件が設定されていない。即ち、網掛けパターン340に対応する条件が満たされる場合、注目画素に対応する記号に対して上、左上、左、左下及び下方向に略同一距離に、背景を挟んで記号が存在する。網掛けパターン340により、右方向において、文字等と重なり、網掛けが連続しない記号が検出される。
このように、網掛けパターンには、注目画素及び注目画素に対して所定の位置関係にある複数の画素の階調値の条件として、各画素の階調値の間の関係が設定されている。この関係は、差分に限定されず、比率等でもよい。また、網掛けパターンは、複数の点又は丸等の記号が周期的に配置された模様に対応するパターンに限定されず、複数の横線、縦線及び/又は斜め線等のラインが周期的に配置された模様に対応するパターンでもよい。また、情報処理装置200に記憶される網掛けパターンは、複数でなく一つのみでもよい。また、各網掛けパターンに設定される条件は、複数でなく一つのみでもよい。
図4は、画像読取装置100による画像読取処理の動作を示すフローチャートである。以下、図4に示したフローチャートを参照しつつ、画像読取処理の動作を説明する。なお、以下に説明する動作のフローは、予め第1記憶装置110に記憶されているプログラムに基づき主に第1CPU120により画像読取装置100の各要素と協働して実行される。
最初に、撮像装置102は、原稿として、網掛けが含まれている請求書等の帳票を撮像して入力画像を生成し、第1記憶装置110に保存する(ステップS101)。
次に、第1CPU120は、第1記憶装置110に保存された入力画像を第1インタフェース装置101を介して情報処理装置200に送信し(ステップS102)、一連のステップを終了する。
図5は、情報処理装置200による認識処理の動作を示すフローチャートである。以下、図5に示したフローチャートを参照しつつ、認識処理の動作を説明する。なお、以下に説明する動作のフローは、予め第2記憶装置210に記憶されているプログラムに基づき主に処理装置230により情報処理装置200の各要素と協同して実行される。
最初に、取得部221は、入力画像を第2インタフェース装置201を介して画像読取装置100から取得し、第2記憶装置210に保存する(ステップS201)。
次に、取得部221は、多値画像である入力画像から、白黒の多値画像を生成し、多値画像として取得する(ステップS202)。取得部221は、入力画像内の各画素毎に、各画素のR値、G値、B値の中の最大値を特定し、特定した最大値を各画素に対応する画素の階調値(輝度値)とする白黒多値画像を生成する。なお、取得部221は、カラー多値画像である入力画像を、そのまま多値画像として取得してもよい。
図6Aは、多値画像の一部の領域600の一例を示す模式図である。
図6Aに示すように、多値画像の一部の領域600には、文字601と、背景602と、記号603とが写っている。領域600において、背景602上に複数の記号603が周期的に配置されることにより網掛けが形成され、その網掛け上に文字601が配置されている。領域600において、文字601は黒色を有し、背景602は白色を有し、記号603は白色と黒色の間の色であるグレー色を有している。
次に、二値画像生成部222は、取得した多値画像から、多値画像を二値化した二値画像を生成する(ステップS203)。二値画像生成部222は、多値画像内で階調値が閾値以上である画素を白色画素とし、階調値が閾値未満である画素を黒色画素とした画像を二値画像として生成する。閾値は、事前の実験により、一般的な網掛けの記号又は文字を形成する画素の階調値より大きくなるように設定される。これにより、二値画像では、多値画像内の文字及び網掛けの記号に対応する画素が黒色画素となり、他の画素に対応する画素が白色画素となる。
図6Bは、二値画像の一部の領域610の一例を示す模式図である。
図6Bは、図6Aに示す領域600を二値化した領域610を示す。図6Bに示すように、領域610において、背景602に対応する画素612は白色画素となり、文字601に対応する画素611及び網掛けの記号603に対応する画素613は黒色画素となっている。
次に、検出部223は、取得した多値画像から、第2記憶装置210に記憶された網掛けパターンに設定された条件を満たす画素を網掛けの一部として検出する(ステップS204)。検出部223は、多値画像内の各画素を順に注目画素として選択し、各画素が、第2記憶装置210に記憶された複数の網掛けパターンの内の少なくとも何れか一つの網掛けパターンに設定された条件を満たすか否かを判定する。検出部223は、少なくとも何れか一つの網掛けパターンに設定された条件を満たす画素を、網掛けの記号に対応する網掛け画素であるとみなし、網掛けの一部として検出する。一方、検出部223は、何れの網掛けパターンに設定された条件も満たさない画素を、網掛けの記号に対応しない非網掛け画素とみなす。
図7A~7C、8A~8Cは、網掛け画素について説明するための模式図である。
図7Aに示す画像700は、図6Aに示す多値画像の一部の領域600に網掛けパターン300を適用した場合に検出される網掛け画素について説明するための模式図である。図7Aに示すように、領域600に網掛けパターン300を適用した場合、その画素が記号に対応し且つその記号に対して八方向に略同一距離に、背景を挟んで記号が存在する画素703(斜線で示される画素)が網掛け画素として検出される。一方、その画素が背景に対応して記号に対応しない画素701、及び、その画素が文字に対応して記号に対応しない画素702は非網掛け画素とみなされる。また、その画素が記号に対応していても、その記号に対して八方向に略同一距離に、背景を挟んで記号が存在しない画素、又は、その記号と隣接する記号との間に背景が存在しない画素704(ドットで示される画素)も非網掛け画素とみなされる。
図7Bに示す画像710は、領域600に網掛けパターン310を適用した場合に検出される網掛け画素について説明するための模式図である。図7Bに示すように、領域600に網掛けパターン310を適用した場合、その画素が記号に対応し且つその記号に対して左、左上、上、右上及び右方向に略同一距離に、背景を挟んで記号が存在する画素713が網掛け画素として検出される。即ち、網掛けパターン310を適用した場合、その記号に対して他の三方向(左下、下、右下方向)において隣接する記号との間に文字等が存在する画素713も、網掛け画素として検出される。
図7Cに示す画像720は、領域600に網掛けパターン320を適用した場合に検出される網掛け画素について説明するための模式図である。図7Cに示すように、領域600に網掛けパターン320を適用した場合、その画素が記号に対応し且つその記号に対して左、左下、下、右下及び右方向に略同一距離に、背景を挟んで記号が存在する画素723が網掛け画素として検出される。即ち、網掛けパターン320を適用した場合、その記号に対して他の三方向(左上、上及び右上方向)において隣接する記号との間に文字等が存在する画素723も、網掛け画素として検出される。
図8Aに示す画像800は、領域600に網掛けパターン330を適用した場合に検出される網掛け画素について説明するための模式図である。図8Aに示すように、領域600に網掛けパターン330を適用した場合、その画素が記号に対応し且つその記号に対して上、右上、右、右下及び下方向に略同一距離に、背景を挟んで記号が存在する画素803が網掛け画素として検出される。即ち、網掛けパターン330を適用した場合、その記号に対して他の三方向(左上、左及び左下方向)において隣接する記号との間に文字等が存在する画素803も、網掛け画素として検出される。
図8Bに示す画像810は、領域600に網掛けパターン340を適用した場合に検出される網掛け画素について説明するための模式図である。図8Bに示すように、領域600に網掛けパターン340を適用した場合、その画素が記号に対応し且つその記号に対して上、左上、左、左下及び下方向に略同一距離に、背景を挟んで記号が存在する画素813が網掛け画素として検出される。即ち、網掛けパターン340を適用した場合、その記号に対して他の三方向(右上、右及び右下方向)において隣接する記号との間に文字等が存在する画素813も、網掛け画素として検出される。
図8Cは、何れかの網掛けパターンに設定された条件を満たす網掛け画素について説明するための模式図である。図8Cに示す画像820において、斜線で示される画素823は、何れかの網掛けパターンにより網掛け画素として検出された画素を示し、他の画素は、全ての網掛けパターンについて非網掛け画素とみなされた画素を示す。ドットで示される画素824のように、記号に対応する画素も非網掛け画素とみなされる場合があるが、記号に対応するほとんどすべての画素は、網掛け画素として検出されている。特に、検出部223は、様々なパターンに対応する複数の網掛けパターンを用いることにより、文字の近傍に位置する記号(図6の記号603等)に対応する画素823も網掛け画素として良好に検出することができる。
次に、網掛け除去パターン生成部224は、多値画像に基づいて、検出された網掛けを除去するための網掛け除去パターンを生成する(ステップS205)。網掛け除去パターン生成部224は、各網掛け画素を検出した際に使用した網掛けパターンに基づいて、網掛け除去パターンを生成する。網掛け除去パターン生成部224は、各網掛け画素を検出した際に使用した網掛けパターンに応じて各網掛け画素を膨張させることにより、網掛け除去パターンを生成する。
網掛け除去パターン生成部224は、各網掛けパターンで設定された条件で規定される注目画素に対する背景画素又は記号画素の方向(所定方向)に、所定画素数だけ各網掛け画素を膨張させる。所定画素数は、例えば各網掛けパターンで設定された条件で規定される注目画素と注目画素に隣接する背景画素との間の距離数である。図3に示した例では、所定画素数は、水平及び垂直方向では2であり、斜め方向では1である。網掛け除去パターン生成部224は、検出された各網掛け画素に対して、所定方向に所定距離内に存在する各画素を膨張画素として特定する。網掛け除去パターン生成部224は、網掛け画素及び膨張画素を含む領域を特定し、特定した領域のパターンを網掛け除去パターンとして生成する。
図9A~9C、10A~10Cは、網掛け除去パターンについて説明するための模式図である。
図9Aに示す画像900は、図7Aに示す網掛け画素703に対応する画素903を膨張させた膨張画素について説明するための模式図である。図9Aに示すように、画素903に対して、網掛け画素703を検出する際に使用した網掛けパターン300で設定された背景画素に対応する画素904と、網掛け画素703と各背景画素との間の画素に対応する画素905とが膨張画素として特定される。
図9Bに示す画像910は、図7Bに示す網掛け画素713に対応する画素913を膨張させた膨張画素について説明するための模式図である。図9Bに示すように、画素913に対して、網掛け画素713を検出する際に使用した網掛けパターン310で設定された背景画素に対応する画素914と、網掛け画素713と各背景画素との間の画素に対応する画素915とが膨張画素として特定される。
図9Cに示す画像920は、図7Cに示す網掛け画素723に対応する画素923を膨張させた膨張画素について説明するための模式図である。図9Cに示すように、画素923に対して、網掛け画素723を検出する際に使用した網掛けパターン320で設定された背景画素に対応する画素924と、網掛け画素723と各背景画素との間の画素に対応する画素925とが膨張画素として特定される。
図10Aに示す画像1000は、図8Aに示す網掛け画素803に対応する画素1003を膨張させた膨張画素について説明するための模式図である。図10Aに示すように、画素1003に対して、網掛け画素803を検出する際に使用した網掛けパターン330で設定された背景画素に対応する画素1004と、網掛け画素803と各背景画素との間の画素に対応する画素1005とが膨張画素として特定される。
図10Bに示す画像1010は、図8Bに示す網掛け画素813に対応する画素1013を膨張させた膨張画素について説明するための模式図である。図10Bに示すように、画素1013に対して、網掛け画素813を検出する際に使用した網掛けパターン340で設定された背景画素に対応する画素1014と、網掛け画素813と各背景画素との間の画素に対応する画素1015とが膨張画素として特定される。
図10Cは、網掛け画素及び膨張画素を含む領域に対応する網掛け除去パターンについて説明するための模式図である。図10Cに示す画像1020において、グレー色で示される領域1021は、何れかの網掛けパターンにより検出された網掛け画素及び何れかの網掛け画素から膨張された膨張画素を含む領域を示す。領域1021に対応するパターンが網掛け除去パターンとして特定される。図10Cに示すように、領域1021には文字に対応する画素は含まれない。また、網掛け又は背景に対応する画素の一部は、領域1021に含まれていないが、網掛け又は背景に対応するほとんど全ての画素は、領域1021に含まれている。網掛け除去パターン生成部224は、各網掛けパターンで設定された条件において規定される所定方向にのみ各網掛け画素を膨張させることにより、網掛けに対応する画素を良好に含むように、網掛け除去パターンを生成することができる。
次に、網掛け除去画像生成部225は、二値画像に対して網掛け除去パターンを適用して、二値画像から網掛けを除去した網掛け除去画像を生成する(ステップS206)。
網掛け除去画像生成部225は、二値画像において、網掛け除去パターンに対応する網掛け領域を特定する。網掛け除去画像生成部225は、特定した網掛け領域内の各画素を順に注目画素として選択し、注目画素から所定範囲内に白色画素が含まれるか否かを判定する。網掛け除去画像生成部225は、注目画素から所定範囲内に白色画素が含まれる場合、注目画素を白色画素に置換することにより、網掛け領域を補正する。これにより、網掛け除去画像生成部225は、二値画像内の網掛け領域を補正した網掛け除去画像を生成する。
所定範囲は、網掛けパターンに基づいて設定される。所定範囲は、例えば、網掛けパターンで設定された条件において規定される注目画素と注目画素に隣接する背景画素との間の距離内である。図3に示した例では、所定範囲は、水平及び垂直方向では2画素の範囲であり、斜め方向では1画素の範囲である。所定範囲が注目画素と背景画素との間の距離に設定されることにより、所定範囲内に背景に対応する画素が確実に存在し、網掛け除去画像生成部225は、網掛け領域内の各画素を背景に相当する画素に良好に置換することが可能となる。
図11は、網掛け除去画像の一部の領域1100の一例を示す模式図である。
図11に示す領域1100は、図6Bに示す二値画像の領域610から生成されている。図11に示すように、網掛け除去画像では、文字の成分1101は残りつつ、記号に対応する成分1103は、背景に対応する成分1102に同化し、網掛けの成分は良好に除去されている。特に、網掛け除去画像では、図6Bに示す二値画像において文字と隣接していた記号603に対応する成分1103も良好に除去されている。なお、領域1100では、一部の記号に対応する成分1104が除去されずに残っている。しかしながら、網掛けが除去されていない成分は十分に小さく、網掛けは、利用者が良好に文字を識別でき、且つ、情報処理装置200が後述する文字認識処理において良好に文字を認識できる程度に除去されている。
なお、網掛け除去画像生成部225は、網掛け領域内でのみ孤立点を除去することにより、網掛け除去画像を生成してもよい。その場合、網掛け除去画像生成部225は、ラベリングにより、網掛け領域内で黒色画素をグループ化し、各黒色画素のグループの内、サイズ(面積)が所定サイズ以下であるグループを白色画素に置換することにより、網掛け領域を補正する。
次に、文字認識部226は、公知のOCR(Optical Character Recognition)技術を利用して、生成された網掛け除去画像から文字を検出する(ステップS207)。
次に、出力制御部227は、検出された文字を表示装置203に表示し(ステップS208)、一連のステップを終了する。なお、出力制御部227は、検出された文字に代えて又は加えて、網掛け除去画像を表示装置203に表示してもよい。また、出力制御部227は、検出された文字又は網掛け除去画像を不図示の通信装置を介して不図示のサーバ等に送信してもよい。このように、出力制御部227は、網掛け除去画像又は網掛け除去画像を用いて生成した情報を出力する。
なお、網掛けパターンに条件が複数設定されている場合、検出部223は、多値画像内の画素が、網掛けパターンに設定された全ての条件を満たさない場合でも、一部の条件を満たす場合、その画素を網掛けの一部として検出してもよい。その場合、ステップS204において、検出部223は、何れかの網掛けパターンに設定された複数の条件の内の所定数の条件(例えば全条件の内の80%の条件)を満たす画素を網掛け画素として検出する。これにより、検出部223は、網掛けをより検出し易くすることができる。
また、情報処理装置200は、図3Aに示す網掛けパターン300のように、複数の条件が予め設定された網掛けパターンのみを使用し、その網掛けパターンに設定された条件の内、予め設定された組合せに係る条件を満たす画素を網掛け画素として検出してもよい。その場合、情報処理装置200は、条件の組合せを変更することにより、網掛けを検出するための条件を、柔軟に変更することができる。
また、ステップS204において、検出部223は、画像読取装置100が入力画像を読み取った際の解像度に応じて、多値画像を拡大又は縮小してから、網掛けパターンを用いて多値画像から網掛け画素を検出してもよい。その場合、検出部223は、第2インタフェース装置201を介して画像読取装置100から解像度を取得し、取得した解像度に応じて、多値画像内の網掛けが、網掛けパターンで想定している網掛けのサイズとあうように、多値画像を拡大又は縮小する。
以上詳述したように、図5に示したフローチャートに従って動作することによって、情報処理装置200は、多値画像において所定の位置関係にある各画素の階調値に基づいて網掛けを検出する。これにより、情報処理装置200は、二値画像において有効画素の位置関係のみに基づいて網掛けを検出する場合より高精度に網掛けを検出することが可能となり、網掛けが含まれる画像から網掛けをより精度良く除去することが可能となった。
一般に、網掛けは、背景色と文字色の間の中間色を有しており、多値画像内で網掛けの記号又はラインに対応する画素は、白色と黒色の間の中間色を有している。したがって、多値画像を二値化した二値画像内で網掛けの記号又はラインに対応する画素は、二値化のための閾値の大きさによって、白色画素にも黒色画素にもなる可能性がある。また、二値画像において、多値画像内のノイズが黒色画素となり、網掛けの記号に同化する可能性もある。したがって、二値画像から網掛けを検出しようとすると、網掛けが検出されない可能性、又は、ノイズを誤って網掛けとして検出する可能性がある。情報処理装置200は、多値画像において所定の位置関係にある各画素の階調値に基づいて網掛けを検出することにより、二値画像において有効画素の位置関係のみに基づいて網掛けを検出する場合より高精度に網掛けを検出することが可能となる。網掛けを高精度に検出することにより、情報処理装置200は、網掛けが含まれる画像から文字を残しつつ網掛けのみを精度良く除去することが可能となる。
特に、二値画像内の各画素の階調値は、二値の内の何れかであるため、各画素の階調値の間の関係は、同一であるか異なるかの内の何れかのみである。情報処理装置200は、多値画像内の複数の画素の階調値の間の差分又は比率等の関係に基づいて網掛けを検出することにより、二値画像において有効画素の位置関係のみに基づいて網掛けを検出する場合より高精度に網掛けを検出することが可能となる。
図12は、認識処理の動作の他の例を示すフローチャートである。このフローチャートは、情報処理装置200において、図5に示すフローチャートの代りに実行される。図12に示すフローチャートでは、図5に示すフローチャートと異なり、網掛け除去画像生成部225は、二値画像でなく多値画像から網掛け除去画像を生成する。図12に示すフローチャートでは、図5のステップS203の処理は省略される。図12のステップS301~S302、S303~S304の処理は、図5のステップS201~S202、S204~S205の処理と同様であるため、説明を省略する。
ステップS305において、網掛け除去画像生成部225は、多値画像に対して網掛け除去パターンを適用して、多値画像から網掛けを除去した網掛け除去画像を生成する(ステップS305)。
網掛け除去画像生成部225は、多値画像において、網掛け除去パターンに対応する網掛け領域を特定する。網掛け除去画像生成部225は、特定した網掛け領域に平滑化フィルタを適用することにより、網掛け領域を補正する。これにより、網掛け除去画像生成部225は、多値画像内の網掛け領域を補正した網掛け除去画像を生成する。
平滑化フィルタは、平均化フィルタ又はガウシアンフィルタ等の公知のフィルタである。平滑化フィルタのサイズは、網掛けパターンに基づいて設定される。平滑化フィルタの水平及び垂直サイズは、例えば、網掛けパターンで設定された条件において規定される、水平及び垂直方向において注目画素に隣接する二つの背景画素の間の距離に設定される。図3に示す例では、平滑化フィルタの水平及び垂直サイズは、5画素に設定される。これにより、フィルタの適用範囲には、注目画素を取り囲む背景画素が含まれ、注目画素に水平及び垂直方向に隣接する記号画素は含まれない。したがって、網掛け除去画像生成部225は、網掛け領域内の各画素を、各画素の階調値が背景画素の階調値に近付くように平均化することが可能となる。
なお、網掛け除去画像生成部225は、特定した網掛け領域内の注目画素の画素値を、注目画素から第2所定範囲内の画素の中で輝度が最も高い画素の画素値に置換することにより、網掛け領域を補正してもよい。
第2所定範囲は、網掛けパターンに基づいて設定される。第2所定範囲は、例えば、網掛けパターンで設定された条件において規定される注目画素と注目画素に隣接する背景画素との間の距離内である。図3に示す例では、第2所定範囲は、水平及び垂直方向では2画素の範囲であり、斜め方向では1画素の範囲である。第2所定範囲が注目画素と背景画素との間の距離に設定されることにより、第2所定範囲内に背景に対応する画素が確実に存在し、網掛け除去画像生成部225は、網掛け領域内の各画素を背景に相当する画素に良好に置換することが可能となる。
図13は、多値画像から生成された網掛け除去画像の一部の領域1300の一例を示す模式図である。
図13に示す領域1300は、図6Aに示す多値画像の領域600から生成されている。図13に示すように、多値画像から生成された網掛け除去画像においても、図11に示す二値画像から生成された網掛け除去画像と同様に、網掛けの成分が良好に除去されている。
次に、網掛け除去画像生成部225は、網掛け除去画像を二値化した網掛け除去二値画像を生成する(ステップS306)。網掛け除去画像生成部225は、網掛け除去画像内で階調値が閾値以上である画素を白色画素とし、階調値が閾値未満である画素を黒色画素とした画像を網掛け除去二値画像として生成する。閾値は、事前の実験により、一般的な文字を形成する画素の階調値より大きくなるように設定される。これにより、網掛け除去二値画像では、網掛け除去画像内の文字に対応する画素が黒色画素となり、他の画素に対応する画素が白色画素となる。網掛け除去二値画像は、図11に示す二値画像から生成された網掛け除去画像と同様の画像となる。
なお、網掛け除去画像生成部225は、網掛け除去画像を生成せずに、多値画像から網掛け除去二値画像を生成してもよい。その場合、網掛け除去画像生成部225は、網掛け領域内の各画素に対する二値化の閾値が、網掛け領域外の各画素に対する二値化の閾値より小さくなるように、二値化の閾値を設定する。これにより、網掛け除去画像生成部225は、網掛け領域外の各画素を通常通りに二値化しつつ、網掛け領域内の各画素を白色画素と判定し易くなるように二値化するため、網掛けを良好に除去することができる。
次に、文字認識部226は、公知のOCR技術を利用して、生成された網掛け除去二値画像から文字を検出する(ステップS307)。
次に、出力制御部227は、検出された文字を表示装置203に表示し(ステップS308)、一連のステップを終了する。なお、出力制御部227は、検出された文字に代えて又は加えて、網掛け除去画像又は網掛け除去二値画像を表示装置203に表示してもよい。また、出力制御部227は、検出された文字、網掛け除去画像又は網掛け除去二値画像を不図示の通信装置を介して不図示のサーバ等に送信してもよい。
以上詳述したように、図12に示したフローチャートに従って動作することによっても、情報処理装置200は、網掛けが含まれる画像から網掛けをより精度良く除去することが可能となった。
図14は、他の実施形態に係る情報処理装置における処理装置230の概略構成を示すブロック図である。
処理装置230は、第2CPU220の代わりに、認識処理を実行する。処理装置230は、取得回路231、二値画像生成回路232、検出回路233、網掛け除去パターン生成回路234、網掛け除去画像生成回路235、文字認識回路236及び出力制御回路237等を有する。
取得回路231は、取得部の一例であり、取得部221と同様の機能を有する。取得回路231は、入力画像を第2インタフェース装置201を介して画像読取装置100から取得し、入力画像から多値画像を生成し、第2記憶装置210に保存する。
二値画像生成回路232は、二値画像生成部の一例であり、二値画像生成部222と同様の機能を有する。二値画像生成回路232は、第2記憶装置210から多値画像を読み出し、多値画像から二値画像を生成し、第2記憶装置210に保存する。
検出回路233は、検出部の一例であり、検出部223と同様の機能を有する。検出回路233は、第2記憶装置210から多値画像及び網掛けパターンを読み出し、多値画像から、網掛けパターンに設定された条件を満たす網掛け画素を検出し、検出結果を第2記憶装置210に保存する。
網掛け除去パターン生成回路234は、網掛け除去パターン生成部の一例であり、網掛け除去パターン生成部224と同様の機能を有する。網掛け除去パターン生成回路234は、第2記憶装置210から多値画像及び網掛け画素の検出結果を読み出し、各情報に基づいて網掛け除去パターンを生成し、第2記憶装置210に保存する。
網掛け除去画像生成回路235は、網掛け除去画像生成部の一例であり、網掛け除去画像生成部225と同様の機能を有する。網掛け除去画像生成回路235は、第2記憶装置210から、二値画像又は多値画像と、網掛け除去パターンとを読み出し、各情報に基づいて網掛け除去画像を生成し、第2記憶装置210に保存する。
文字認識回路236は、文字認識部の一例であり、文字認識部226と同様の機能を有する。文字認識回路236は、第2記憶装置210から網掛け除去画像又は網掛け除去二値画像を読み出し、読み出した画像から文字を検出し、検出結果を第2記憶装置210に保存する。
出力制御回路237は、出力制御部の一例であり、出力制御部227と同様の機能を有する。出力制御回路237は、第2記憶装置210から文字の検出結果、網掛け除去画像又は網掛け除去二値画像を読み出し、読み出した情報を表示装置203に出力する。
以上詳述したように、情報処理装置は、処理装置230を用いる場合も、網掛けが含まれる画像から網掛けをより精度良く除去することが可能となった。
以上、好適な実施形態について説明してきたが、実施形態はこれらに限定されない。例えば、画像読取装置100と情報処理装置200の機能分担は、図1に示す画像処理システム1の例に限られず、画像読取装置100及び情報処理装置200の各部を画像読取装置100と情報処理装置200の何れに配置するかは適宜変更可能である。または、画像読取装置100と情報処理装置200を一つの装置で構成してもよい。
例えば、画像読取装置100の第1記憶装置110が、情報処理装置200の第2記憶装置210に記憶された各プログラムを記憶し、画像読取装置100の第1CPU120が、情報処理装置200の第2CPU120により実現される各部として動作してもよい。また、画像読取装置100が、情報処理装置200の処理装置230と同様の処理装置を有してもよい。
その場合、画像読取装置100は表示装置203と同様の表示装置を有する。認識処理は画像読取装置100で実行されるため、ステップS102、S201、S301の入力画像の送受信処理は省略される。ステップS202~S208、S302~S308の各処理は、画像読取装置100の第1CPU120又は処理装置によって実行される。これらの処理の動作は、情報処理装置200の第2CPU220又は処理装置230によって実行される場合と同様である。
また、画像処理システム1において、第1インタフェース装置101と第2インタフェース装置201は、インターネット、電話回線網(携帯端末回線網、一般電話回線網を含む)、イントラネット等のネットワークを介して接続してもよい。その場合、第1インタフェース装置101及び第2インタフェース装置201に、接続するネットワークの通信インタフェース回路を備える。また、その場合、クラウドコンピューティングの形態で画像処理のサービスを提供できるように、ネットワーク上に複数の情報処理装置を分散して配置し、各情報処理装置が協働して、認識処理等を分担するようにしてもよい。これにより、画像処理システム1は、複数の画像読取装置が読み取った入力画像について、効率よく認識処理を実行できる。
図15A、図15Bは、網掛けパターンの他の例を示す模式図である。
図15Aに示す網掛けパターン1500では、各条件に対応する画素の間隔が、図3Aに示す網掛けパターン300における各条件に対応する画素の間隔より大きい。網掛けパターン1500では、以下の八つの条件が設定されている。
Figure 0007022847000003
図15Bに示す網掛けパターン1510では、斜め方向の条件に対応する画素の間隔が、図3Aに示す網掛けパターン300における斜め方向の条件に対応する画素の間隔より大きい。網掛けパターン1510では、以下の八つの条件が設定されている。
Figure 0007022847000004
このように、網掛けパターンは、想定される網掛けの種類に応じて任意に設定される。
1 画像処理システム
200 情報処理装置
210 第2記憶装置
221 取得部
222 二値画像生成部
223 検出部
224 網掛け除去パターン生成部
225 網掛け除去画像生成部
227 出力制御部

Claims (11)

  1. 注目画素及び前記注目画素に対して所定の位置関係にある複数の画素の階調値の条件が設定された網掛けパターンを記憶する記憶部と、
    多値画像を取得する取得部と、
    前記多値画像から二値画像を生成する二値画像生成部と、
    前記多値画像から、前記網掛けパターンに設定された条件を満たす画素を網掛けの一部として検出する検出部と、
    前記多値画像に基づいて、検出された網掛けを除去するための網掛け除去パターンを生成する網掛け除去パターン生成部と、
    前記二値画像に対して前記網掛け除去パターンを適用して網掛け除去画像を生成する網掛け除去画像生成部と、
    前記網掛け除去画像又は前記網掛け除去画像を用いて生成した情報を出力する出力部と、
    を有することを特徴とする画像処理装置。
  2. 前記網掛け除去画像生成部は、前記二値画像において前記網掛け除去パターンに対応する網掛け領域内の注目画素から前記網掛けパターンに基づく範囲内に白色画素が含まれる場合、前記注目画素を白色画素に置換することにより、前記網掛け領域を補正する、請求項1に記載の画像処理装置。
  3. 注目画素及び前記注目画素に対して所定の位置関係にある複数の画素の階調値の条件が設定された網掛けパターンを記憶する記憶部と、
    多値画像を取得する取得部と、
    前記多値画像から、前記網掛けパターンに設定された条件を満たす画素を網掛けの一部として検出する検出部と、
    前記多値画像に基づいて、検出された網掛けを除去するための網掛け除去パターンを生成する網掛け除去パターン生成部と、
    前記多値画像に対して前記網掛け除去パターンを適用して網掛け除去画像を生成する網掛け除去画像生成部と、
    前記網掛け除去画像又は前記網掛け除去画像を用いて生成した情報を出力する出力部と、
    を有することを特徴とする画像処理装置。
  4. 前記網掛け除去画像生成部は、前記多値画像において前記網掛け除去パターンに対応する網掛け領域に、前記網掛けパターンに基づくサイズの平滑化フィルタを適用することにより、前記網掛け領域を補正する、請求項3に記載の画像処理装置。
  5. 前記網掛け除去画像生成部は、前記多値画像において前記網掛け除去パターンに対応する網掛け領域内の注目画素の画素値を、前記注目画素から前記網掛けパターンに基づく範囲内の画素の中で輝度が最も高い画素の画素値に置換することにより、前記網掛け領域を補正する、請求項3に記載の画像処理装置。
  6. 前記記憶部は、前記網掛けパターンを複数記憶し、
    前記検出部は、前記多値画像内の画素が、前記複数の網掛けパターンの内の少なくとも何れか一つの網掛けパターンに設定された条件を満たす場合、当該画素を網掛けの一部として検出する、請求項1~5の何れか一項に記載の画像処理装置。
  7. 前記網掛けパターンには前記条件が複数設定され、
    前記検出部は、前記多値画像内の画素が、前記網掛けパターンに設定された全ての条件を満たさない場合でも、一部の条件を満たす場合、当該画素を網掛けの一部として検出する、請求項1~5の何れか一項に記載の画像処理装置。
  8. 記憶部及び出力部を有する画像処理装置の制御方法であって、前記画像処理装置が、
    注目画素及び前記注目画素に対して所定の位置関係にある複数の画素の階調値の条件が設定された網掛けパターンを前記記憶部に記憶し、
    多値画像を取得し、
    前記多値画像から二値画像を生成し、
    前記多値画像から、前記網掛けパターンに設定された条件を満たす画素を網掛けの一部として検出し、
    前記多値画像に基づいて、検出された網掛けを除去するための網掛け除去パターンを生成し、
    前記二値画像に対して前記網掛け除去パターンを適用して網掛け除去画像を生成し、
    前記網掛け除去画像又は前記網掛け除去画像を用いて生成した情報を前記出力部から出力する、
    ことを含むことを特徴とする制御方法。
  9. 記憶部及び出力部を有する画像処理装置の制御方法であって、前記画像処理装置が、
    注目画素及び前記注目画素に対して所定の位置関係にある複数の画素の階調値の条件が設定された網掛けパターンを前記記憶部に記憶し、
    多値画像を取得し、
    前記多値画像から、前記網掛けパターンに設定された条件を満たす画素を網掛けの一部として検出し、
    前記多値画像に基づいて、検出された網掛けを除去するための網掛け除去パターンを生成し、
    前記多値画像に対して前記網掛け除去パターンを適用して網掛け除去画像を生成し、
    前記網掛け除去画像又は前記網掛け除去画像を用いて生成した情報を前記出力部から出力する、
    ことを含むことを特徴とする制御方法。
  10. 記憶部及び出力部を有するコンピュータの制御プログラムであって、
    注目画素及び前記注目画素に対して所定の位置関係にある複数の画素の階調値の条件が設定された網掛けパターンを前記記憶部に記憶し、
    多値画像を取得し、
    前記多値画像から二値画像を生成し、
    前記多値画像から、前記網掛けパターンに設定された条件を満たす画素を網掛けの一部として検出し、
    前記多値画像に基づいて、検出された網掛けを除去するための網掛け除去パターンを生成し、
    前記二値画像に対して前記網掛け除去パターンを適用して網掛け除去画像を生成し、
    前記網掛け除去画像又は前記網掛け除去画像を用いて生成した情報を前記出力部から出力する、
    ことを前記コンピュータに実行させることを特徴とする制御方法。
  11. 記憶部及び出力部を有するコンピュータの制御プログラムであって、
    注目画素及び前記注目画素に対して所定の位置関係にある複数の画素の階調値の条件が設定された網掛けパターンを前記記憶部に記憶し、
    多値画像を取得し、
    前記多値画像から、前記網掛けパターンに設定された条件を満たす画素を網掛けの一部として検出し、
    前記多値画像に基づいて、検出された網掛けを除去するための網掛け除去パターンを生成し、
    前記多値画像に対して前記網掛け除去パターンを適用して網掛け除去画像を生成し、
    前記網掛け除去画像又は前記網掛け除去画像を用いて生成した情報を前記出力部から出力する、
    ことを前記コンピュータに実行させることを特徴とする制御方法。
JP2020554628A 2018-10-29 2018-10-29 画像処理装置、制御方法及び制御プログラム Active JP7022847B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/040184 WO2020089984A1 (ja) 2018-10-29 2018-10-29 画像処理装置、制御方法及び制御プログラム

Publications (2)

Publication Number Publication Date
JPWO2020089984A1 JPWO2020089984A1 (ja) 2021-06-03
JP7022847B2 true JP7022847B2 (ja) 2022-02-18

Family

ID=70463580

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020554628A Active JP7022847B2 (ja) 2018-10-29 2018-10-29 画像処理装置、制御方法及び制御プログラム

Country Status (3)

Country Link
US (1) US11620736B2 (ja)
JP (1) JP7022847B2 (ja)
WO (1) WO2020089984A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112819720B (zh) * 2021-02-02 2023-10-03 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008134970A (ja) 2006-11-29 2008-06-12 Toshiba Corp 文字認識装置、文字認識方法および文字認識プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10112800A (ja) * 1996-10-04 1998-04-28 Mita Ind Co Ltd 画像処理装置
US8300928B2 (en) * 2008-01-25 2012-10-30 Intermec Ip Corp. System and method for locating a target region in an image
JP6178280B2 (ja) * 2014-04-24 2017-08-09 日立建機株式会社 作業機械の周囲監視装置
JP6953178B2 (ja) * 2017-05-22 2021-10-27 キヤノン株式会社 画像処理装置、画像処理方法、プログラム
US10559067B2 (en) * 2018-02-28 2020-02-11 Adobe Inc. Removal of shadows from document images while preserving fidelity of image contents

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008134970A (ja) 2006-11-29 2008-06-12 Toshiba Corp 文字認識装置、文字認識方法および文字認識プログラム

Also Published As

Publication number Publication date
JPWO2020089984A1 (ja) 2021-06-03
US20210192694A1 (en) 2021-06-24
US11620736B2 (en) 2023-04-04
WO2020089984A1 (ja) 2020-05-07

Similar Documents

Publication Publication Date Title
JP6970835B2 (ja) 画像処理装置、制御方法及び制御プログラム
JP5701182B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP5887770B2 (ja) 画像処理装置及び画像処理プログラム
US8861854B2 (en) Character recognition apparatus, method, and computer-readable, non-transitory medium
JP5701181B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP2015195549A (ja) 画像処理装置、画像処理方法
CN107566684B (zh) 图像处理装置、图像处理方法及存储介质
JP4582204B2 (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
JP2020086847A (ja) 画像処理装置、制御方法及び制御プログラム
JP2016054564A (ja) 画像処理装置、画像処理方法
JP3886727B2 (ja) 画像処理装置
JP4582200B2 (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
JP7022847B2 (ja) 画像処理装置、制御方法及び制御プログラム
JP6970834B2 (ja) 画像処理装置、制御方法及び制御プログラム
JP2015015599A (ja) 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
US9268998B2 (en) Image determining apparatus, image processing system, and recording medium
US10896344B2 (en) Information processing apparatus, information processing method, and computer program
JP7106672B2 (ja) 画像処理装置、制御方法及び制御プログラム
JP2014127779A (ja) 画像処理装置および画像形成装置
US10931852B2 (en) Image processing apparatus, image processing method, and storage medium, with determining whether or not character clipping rectangle determined to be non-character region is character region
WO2020157938A1 (ja) 画像処理装置、制御方法及び制御プログラム
WO2020157937A1 (ja) 画像処理装置、制御方法及び制御プログラム
JP6025803B2 (ja) 画像処理装置
JP2009267730A (ja) 画像処理装置および画像処理方法
JP2023030420A (ja) 画像処理装置、画像処理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220207

R150 Certificate of patent or registration of utility model

Ref document number: 7022847

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150