JPWO2020065980A1 - 画像処理装置、制御方法及び制御プログラム - Google Patents

画像処理装置、制御方法及び制御プログラム Download PDF

Info

Publication number
JPWO2020065980A1
JPWO2020065980A1 JP2020547848A JP2020547848A JPWO2020065980A1 JP WO2020065980 A1 JPWO2020065980 A1 JP WO2020065980A1 JP 2020547848 A JP2020547848 A JP 2020547848A JP 2020547848 A JP2020547848 A JP 2020547848A JP WO2020065980 A1 JPWO2020065980 A1 JP WO2020065980A1
Authority
JP
Japan
Prior art keywords
image
thin line
tint block
pixels
pixel group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020547848A
Other languages
English (en)
Other versions
JP6970834B2 (ja
Inventor
継司 本田
継司 本田
清人 小坂
清人 小坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Publication of JPWO2020065980A1 publication Critical patent/JPWO2020065980A1/ja
Application granted granted Critical
Publication of JP6970834B2 publication Critical patent/JP6970834B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/413Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information
    • H04N1/417Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information using predictive or differential encoding
    • H04N1/4177Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information using predictive or differential encoding encoding document change data, e.g. form drop out data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

地紋が含まれる画像から地紋をより精度良く除去することが可能な画像処理装置、制御方法、制御プログラムを提供する。画像処理装置は、入力画像を取得する取得部と、入力画像から多値画像を生成する多値画像生成部と、入力画像を二値化した二値画像を生成する二値画像生成部と、多値画像から、所定の画素数以下の幅を有する細線を検出する検出部と、多値画像から検出された細線に基づいて、二値画像から細線を除去した地紋除去画像を生成する地紋除去画像生成部と、地紋除去画像又は地紋除去画像を用いて生成した情報を出力する出力部と、を有する。

Description

本開示は、画像処理装置、制御方法及び制御プログラムに関し、特に、地紋が含まれる画像を処理する画像処理装置、制御方法及び制御プログラムに関する。
請求書等の帳票を担当者が手作業によりデータ化している会社では、膨大な数の帳票のデータ化が必要である場合に担当者の業務負担が大きくなるため、帳票のデータ化作業の効率化に対する要望が高まっている。帳票のデータ化作業の効率化を図るためには、帳票に記載されている文字をコンピュータが正しく認識する必要がある。しかしながら、帳票において、地紋が含まれる用紙に文字が印刷されている場合、その文字が正しく認識されない可能性がある。
画像データから書類の種類を判別する帳票判別装置が開示されている(特許文献1)。この帳票判別装置は、画像データに含まれる線分状のブロブのうち、線分の方向が共通し、線分から分岐が検出されず、かつ線分の幅が一定であるブロブが所定の密度以上で分布する線分状のブロブのグループを抽出し、画像データから除去する。
また、文書に印刷されたパターンの微妙な変化を検出して除去する文書画像処理装置が開示されている(特許文献2)。この文書画像処理装置は、注目する黒ランの上下の走査線上に白領域が存在する場合、その黒ランを線分ノイズとして削除する。
また、画像の文字部分と背景部分とを切り分ける画像処理装置が開示されている(特許文献3)。この画像処理装置は、原画像データ内の各連結成分の線幅としきい値とを比較することにより、各連結成分が文字部分か又は背景部分かを判定し、連結成分が背景部分である場合、原画像データにおけるその連結成分部分を除去する。
特開2017−27365号公報 特開2001−111816号公報 特開平10−143607号公報
画像処理装置では、地紋が含まれる画像から地紋をより精度良く除去することを求められている。
情報処理装置、制御方法及び制御プログラムの目的は、地紋が含まれる画像から地紋をより精度良く除去することを可能とすることにある。
実施形態の一側面に係る画像処理装置は、入力画像を取得する取得部と、入力画像から多値画像を生成する多値画像生成部と、入力画像を二値化した二値画像を生成する二値画像生成部と、多値画像から、所定の画素数以下の幅を有する細線を検出する検出部と、多値画像から検出された細線に基づいて、二値画像から細線を除去した地紋除去画像を生成する地紋除去画像生成部と、地紋除去画像又は地紋除去画像を用いて生成した情報を出力する出力部と、を有する。
また、実施形態の一側面に係る制御方法は、出力部を有する画像処理装置の制御方法であって、画像処理装置が、入力画像から多値画像を生成し、入力画像を二値化した二値画像を生成し、多値画像から、所定の画素数以下の幅を有する細線を検出し、多値画像から検出された細線に基づいて、二値画像から細線を除去した地紋除去画像を生成し、地紋除去画像又は地紋除去画像を用いて生成した情報を出力部から出力する、ことを含む。
また、実施形態の一側面に係る制御プログラムは、出力部を有するコンピュータの制御プログラムであって、入力画像から多値画像を生成し、入力画像を二値化した二値画像を生成し、多値画像から、所定の画素数以下の幅を有する細線を検出し、多値画像から検出された細線に基づいて、二値画像から細線を除去した地紋除去画像を生成し、地紋除去画像又は地紋除去画像を用いて生成した情報を出力部から出力する、ことをコンピュータに実行させる。
本実施形態によれば、情報処理装置、制御方法及び制御プログラムは、地紋が含まれる画像から地紋をより精度良く除去することが可能となる。
本発明の目的及び効果は、特に請求項において指摘される構成要素及び組み合わせを用いることによって認識され且つ得られるだろう。前述の一般的な説明及び後述の詳細な説明の両方は、例示的及び説明的なものであり、特許請求の範囲に記載されている本発明を制限するものではない。
実施形態に従った画像処理システム1の概略構成を示す図である。 第2記憶装置210及び第2CPU220の概略構成を示す図である。 画像読取処理の動作を示すフローチャートである。 認識処理の動作を示すフローチャートである。 入力画像500の一例を示す模式図である。 多値画像510の一例を示す模式図である。 二値画像600の一例を示す模式図である。 二値画像600内の領域613の拡大図である。 二値画像600内の領域614の拡大図である。 二値画像600内の領域615の拡大図である。 細線について説明するための模式図である。 細線について説明するための模式図である。 細線について説明するための模式図である。 細線及びその周囲領域に対応する画素の階調値を示すグラフである。 細線及びその周囲領域に対応する画素の階調値を示すグラフである。 細線及びその周囲領域に対応する画素の階調値を示すグラフである。 水平細線候補画素群を示す模式図である。 垂直細線候補画素群を示す模式図である。 画像900の一例を示す模式図である。 画像910の一例を示す模式図である。 細線領域画像1000の一例を示す模式図である。 画像1010の一例を示す模式図である。 画像1100の一例を示す模式図である。 ドット領域画像1110の一例を示す模式図である。 画像1200の一例を示す模式図である。 地紋除去画像1300の一例を示す模式図である。 多値画像を用いることの意義について説明するための模式図である。 多値画像を用いることの意義について説明するための模式図である。 多値画像を用いることの意義について説明するための模式図である。 多値画像を用いることの意義について説明するための模式図である。 処理装置230の概略構成を示すブロック図である。
以下、本開示の一側面に係る画像処理装置、制御方法及び制御プログラムについて図を参照しつつ説明する。但し、本発明の技術的範囲はそれらの実施の形態に限定されず、特許請求の範囲に記載された発明とその均等物に及ぶ点に留意されたい。
図1は、実施形態に従った画像処理システムの概略構成を示す図である。図1に示すように、画像処理システム1は、画像読取装置100と、情報処理装置200とを有する。
画像読取装置100は、例えばスキャナ装置等である。画像読取装置100は、情報処理装置200に接続されている。情報処理装置200は、画像処理装置の一例であり、例えばパーソナルコンピュータ等である。
画像読取装置100は、第1インタフェース装置101と、撮像装置102と、第1記憶装置110と、第1CPU(Control Processing Unit)120とを有する。
第1インタフェース装置101は、USB(Universal Serial Bus)等のシリアルバスに準じるインタフェース回路を有し、情報処理装置200と電気的に接続して画像データ及び各種の情報を送受信する。また、第1インタフェース装置101の代わりに、無線信号を送受信するアンテナと、所定の通信プロトコルに従って、無線通信回線を通じて信号の送受信を行うための無線通信インタフェース回路とを有する通信装置が用いられてもよい。所定の通信プロトコルは、例えば無線LAN(Local Area Network)である。
撮像装置102は、主走査方向に直線状に配列されたCCD(Charge Coupled Device)による撮像素子を備える縮小光学系タイプの撮像センサを有する。さらに、撮像装置102は、光を照射する光源と、撮像素子上に像を結ぶレンズと、撮像素子から出力された電気信号を増幅してアナログ/デジタル(A/D)変換するA/D変換器とを有する。撮像装置102において、撮像センサは、搬送される用紙の表面を撮像してアナログの画像信号を生成して出力し、A/D変換器は、このアナログの画像信号をA/D変換してデジタルの入力画像を生成して出力する。入力画像は、各画素データが、例えばRGB各色毎に8bitで表される計24bitのR(赤色)値、G(緑色)値、B(青色)値からなるカラー多値画像である。なお、CCDの代わりにCMOS(Complementary Metal Oxide Semiconductor)による撮像素子を備える等倍光学系タイプのCIS(Contact Image Sensor)が用いられてもよい。
第1記憶装置110は、RAM(Random Access Memory)、ROM(Read Only Memory)等のメモリ装置、ハードディスク等の固定ディスク装置、又はフレキシブルディスク、光ディスク等の可搬用の記憶装置等を有する。また、第1記憶装置110には、画像読取装置100の各種処理に用いられるコンピュータプログラム、データベース、テーブル等が格納される。コンピュータプログラムは、コンピュータ読み取り可能な可搬型記録媒体から公知のセットアッププログラム等を用いて第1記憶装置110にインストールされてもよい。可搬型記録媒体は、例えばCD−ROM(compact disk read only memory)、DVD−ROM(digital versatile disk read only memory)等である。また、第1記憶装置110は、撮像装置102により生成された入力画像等を記憶する。
第1CPU120は、予め第1記憶装置110に記憶されているプログラムに基づいて動作する。なお、第1CPU120に代えて、DSP(digital signal processor)、LSI(large scale integration)等が用いられてよい。また、第1CPU120に代えて、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programming Gate Array)等が用いられてもよい。
第1CPU120は、第1インタフェース装置101、撮像装置102及び第1記憶装置110等と接続され、これらの各部を制御する。第1CPU120は、撮像装置102の原稿読取制御、第1インタフェース装置101を介した情報処理装置200とのデータ送受信制御等を行う。
情報処理装置200は、第2インタフェース装置201と、入力装置202と、表示装置203と、第2記憶装置210と、第2CPU220と、処理装置230とを有する。以下、情報処理装置200の各部について詳細に説明する。
第2インタフェース装置201は、画像読取装置100の第1インタフェース装置101と同様のインタフェース回路を有し、情報処理装置200と画像読取装置100とを接続する。また、第2インタフェース装置201の代わりに、無線信号を送受信するアンテナと、無線LAN等の所定の通信プロトコルに従って、無線通信回線を通じて信号の送受信を行うための無線通信インタフェース回路とを有する通信装置が用いられてもよい。
入力装置202は、キーボード、マウス等の入力装置及び入力装置から信号を取得するインタフェース回路を有し、利用者の操作に応じた信号を第2CPU220に出力する。
表示装置203は、出力部の一例である。表示装置203は、液晶、有機EL等から構成されるディスプレイ及びディスプレイに画像データを出力するインタフェース回路を有し、第2記憶装置210と接続されて第2記憶装置210に保存されている画像データをディスプレイに表示する。
第2記憶装置210は、画像読取装置100の第1記憶装置110と同様のメモリ装置、固定ディスク装置、可搬用の記憶装置等を有する。第2記憶装置210には、情報処理装置200の各種処理に用いられるコンピュータプログラム、データベース、テーブル等が格納される。コンピュータプログラムは、例えばCD−ROM、DVD−ROM等のコンピュータ読み取り可能な可搬型記録媒体から、公知のセットアッププログラム等を用いて第2記憶装置210にインストールされてもよい。また、第2記憶装置210は、画像読取装置100から受信した入力画像、及び、処理装置230により入力画像に対して画像処理がなされた各種の処理画像等を記憶する。
第2CPU220は、予め第2記憶装置210に記憶されているプログラムに基づいて動作する。なお、第2CPU220に代えて、DSP、LSI、ASIC、FPGA等が用いられてもよい。
第2CPU220は、第2インタフェース装置201、入力装置202、表示装置203、第2記憶装置210及び処理装置230等と接続され、これらの各部を制御する。第2CPU220は、第2インタフェース装置201を介した画像読取装置100とのデータ送受信制御、入力装置202の入力制御、表示装置203の表示制御、処理装置230による画像処理の制御等を行う。
処理装置230は、入力画像に対して所定の画像処理を実行する。処理装置230は、CPU、DSP、LSI、ASIC又はFPGA等で構成される。
図2は、第2記憶装置210及び第2CPU220の概略構成を示す図である。
図2に示すように第2記憶装置210には、取得プログラム211、多値画像生成プログラム212、二値画像生成プログラム213、検出プログラム214、地紋除去画像生成プログラム215、文字認識プログラム216及び出力制御プログラム217等の各プログラムが記憶される。これらの各プログラムは、プロセッサ上で動作するソフトウェアにより実装される機能モジュールである。第2CPU220は、第2記憶装置210に記憶された各プログラムを読み取り、読み取った各プログラムに従って動作する。これにより、第2CPU220は、取得部221、多値画像生成部222、二値画像生成部223、検出部224、地紋除去画像生成部225、文字認識部226及び出力制御部227として機能する。
図3は、画像読取装置100による画像読取処理の動作を示すフローチャートである。以下、図3に示したフローチャートを参照しつつ、画像読取処理の動作を説明する。なお、以下に説明する動作のフローは、予め第1記憶装置110に記憶されているプログラムに基づき主に第1CPU120により画像読取装置100の各要素と協働して実行される。
最初に、撮像装置102は、原稿として、細線又はドットを含む地紋が含まれる請求書等の帳票を撮像して入力画像を生成し、第1記憶装置110に保存する(ステップS101)。
次に、第1CPU120は、第1記憶装置110に保存された入力画像を第1インタフェース装置101を介して情報処理装置200に送信し(ステップS102)、一連のステップを終了する。
図4は、情報処理装置200による認識処理の動作を示すフローチャートである。以下、図4に示したフローチャートを参照しつつ、認識処理の動作を説明する。なお、以下に説明する動作のフローは、予め第2記憶装置210に記憶されているプログラムに基づき主に処理装置230により情報処理装置200の各要素と協同して実行される。
最初に、取得部221は、入力画像を第2インタフェース装置201を介して画像読取装置100から取得し、第2記憶装置210に保存する(ステップS201)。
図5Aは、入力画像500の一例を示す模式図である。
図5Aに示すように、入力画像500には、タイトル、氏名、生年月日、住所等の文字501と、罫線502と、地紋503〜505とが写っている。文字501及び罫線502の一部は、地紋503〜505上に重なっている。地紋503〜505はそれぞれ同じ文字「複写」を示しているが、地紋503は水平方向に延伸する細線により形成され、地紋504は垂直方向に延伸する細線により形成され、地紋505はドットにより形成されている。
細線は、幅が所定の画素数以下であるラインである。所定の画素数は、例えば300dpi(Dots Per Inch)で1画素である。または、細線は、幅が、画像内の文字のストローク(線)の幅の最小値もしくは平均値、又は、画像内の文字の押さえもしくは払いを除いたストロークの幅の最小値もしくは平均値未満であるラインである。細線は、背景に対して区別可能に表示されるが、薄く(白色に近く)、細線の濃度と背景の濃度との差は、文字の濃度と背景の濃度との差より小さい。地紋503及び504は、相互に所定距離をあけて配置された複数の細線により構成される。なお、細線には、水平方向に対して時計回りに45度傾いた第1斜め方向に延伸する細線、又は、水平方向に対して反時計回りに45度傾いた第2斜め方向に延伸する細線が含まれてもよい。以下では、水平方向に延伸する細線を水平細線と称し、垂直方向に延伸する細線を垂直細線と称し、第1斜め方向に延伸する細線を第1斜め細線と称し、第2斜め方向に延伸する細線を第2斜め細線と称する場合がある。
ドットは、大きさ(面積)が所定サイズ(例えば4画素)以下である画素群である。ドットは、細線と同様に、背景に対して区別可能に表示されるが、薄く(白色に近く)、ドットの濃度と背景の濃度との差は、文字の濃度と背景の濃度との差より小さい。地紋505は、相互に所定距離をあけて配置された複数のドットにより構成される。
次に、多値画像生成部222は、カラー多値画像である入力画像から、白黒の多値画像を生成する(ステップS202)。多値画像生成部222は、入力画像内の各画素毎に、各画素のR値、G値、B値の中の最大値を特定し、特定した最大値を各画素に対応する画素の階調値(輝度値)とする多値画像を生成する。以下では、多値画像とは、白黒の多値画像のことをいう。
図5Bは、多値画像510の一例を示す模式図である。
図5Bに示す多値画像510は、入力画像500から生成され、多値画像510では、入力画像500に対して色成分が除去されている。多値画像510内の文字511、罫線512及び地紋513〜515は、それぞれ入力画像500内の文字501、罫線502及び地紋503〜505に対応している。入力画像500内の地紋503〜505と比較して、多値画像510内の地紋513〜515は、背景に対してより際立つように表示されている。
次に、二値画像生成部223は、カラー多値画像である入力画像から、入力画像を二値化した二値画像を生成する(ステップS203)。二値画像生成部223は、入力画像内で輝度値が所定値以上である画素を白色画素とし、輝度値が所定値未満である画素を黒色画素とした画像を二値画像として生成する。所定値は、事前の実験により、一般的な細線又はドットを形成する画素の輝度値より大きくなるように設定される。これにより、二値画像では、入力画像内の文字、罫線、地紋に対応する画素が黒色画素となり、入力画像内の他の画素に対応する画素が白色画素となる。
図6Aは、二値画像600の一例を示す模式図である。
図6Aに示す二値画像600は、入力画像500から生成されている。二値画像600内の文字601、罫線602及び地紋603〜605は、それぞれ入力画像500内の文字501、罫線502及び地紋503〜505に対応している。
図6B、図6C、図6Dは、それぞれ、二値画像600内の領域613、614、615の拡大図である。
図6Bに示すように地紋603は複数の水平細線により形成され、図6Cに示すように地紋604は複数の垂直細線により形成され、図6Dに示すように地紋605は複数のドットにより形成されている。
次に、検出部224は、多値画像から細線候補画素群を抽出する(ステップS204)。
図7A、図7B、図7Cは、細線について説明するための模式図である。
図7A、図7B、図7Cに示す画像700、710、720には、それぞれ細線701が含まれている。各画像700、710、720において、細線701の幅は1画素以下であり、細線701の延伸方向D1と直交する方向D2において、細線701の階調値は細線の濃度に応じた階調値(低輝度値)となる。一方、方向D2において、細線701の周囲領域702の階調値は、細線701の影響により、細線701の中心位置から外側に向けて徐々に背景703の濃度に応じた階調値(高輝度値)に近くなる。細線701及びその周囲領域702と各画素との関係は、細線が撮影された時の撮像装置102の撮像素子の位置に応じて、画像700、710、720の内の何れかのようになる。
図7D、図7E、図7Fは、それぞれ画像700、710、720における細線701及びその周囲領域702に対応する画素の階調値を示すグラフである。図7D、図7E、図7Fにそれぞれ示されるグラフ730、740、750の横軸は各画像700、710、720における方向D2の画素位置を示し、縦軸は階調値(輝度値)を示す。
画像700のように、方向D2において細線701の中心が注目画素P0の一端側(図7Aの上側)に位置する場合、グラフ730に示すように、注目画素P0及び注目画素P0の一端側に隣接する画素P-1の階調値が閾値T1未満となる。一方、方向D2においてその画素群P-1、P0に隣接する画素P-2及びP1の階調値が閾値T1以上となる。
画像710のように、方向D2において細線701の中心が注目画素P0の多端側(図7Bの下側)に位置する場合、グラフ740に示すように、注目画素P0及び注目画素P0の他端側に隣接する画素P+1の階調値が閾値T1未満となる。一方、方向D2においてその画素群P0、P+1に隣接する画素P-1及びP+2の階調値が閾値T1以上となる。
画像720のように、方向D2において細線701の中心が注目画素P0の中央に位置する場合、グラフ750に示すように、注目画素P0及び注目画素P0の両端側に隣接する画素P-1、P+1の階調値が閾値T1未満となる。一方、方向D2においてその画素群P-1、P0、P+1に隣接する画素P-2及びP+2の階調値が閾値T1以上となる。
そこで、検出部224は、多値画像において、階調値が閾値T1未満である画素が所定方向D2に所定個数連続した画素群であり、且つ、その画素群に所定方向D2に隣接する二つの画素の階調値が閾値T1以上である画素群を細線候補画素群として抽出する。所定方向D2には、垂直方向、水平方向、第2斜め方向及び第1斜め方向が含まれる。所定個数は、検出すべき細線の幅の大きさに応じて予め設定され、例えば2又は3に設定される。閾値T1は、検出すべき細線の濃さに応じて予め設定され、例えば144に設定される。
検出部224は、階調値が閾値T1未満である画素が垂直方向に所定個数連続した画素群であり、且つ、その画素群に垂直方向に隣接する二つの画素の階調値が閾値T1以上である画素群を水平細線候補画素群として抽出する。同様に、検出部224は、階調値が閾値T1未満である画素が水平方向に所定個数連続した画素群であり、且つ、その画素群に水平方向に隣接する二つの画素の階調値が閾値T1以上である画素群を垂直細線候補画素群として抽出する。また、検出部224は、階調値が閾値T1未満である画素が第2斜め方向に所定個数連続した画素群であり、且つ、その画素群に第2斜め方向に隣接する二つの画素の階調値が閾値T1以上である画素群を第1斜め細線候補画素群として抽出する。また、検出部224は、階調値が閾値T1未満である画素が第1斜め方向に所定個数連続した画素群であり、且つ、その画素群に第1斜め方向に隣接する二つの画素の階調値が閾値T1以上である画素群を第2斜め細線候補画素群として抽出する。
図8Aは、水平細線候補画素群を有効画素とする画像800の一例を示す模式図であり、図8Bは、垂直細線候補画素群を有効画素とする画像810の一例を示す模式図である。
図8Aに示すように、画像800内の有効画素、即ち水平細線候補画素群には、水平細線により形成された地紋513に対応する画素803が含まれ、文字511、罫線512又は他の地紋514、515に対応する画素は含まれていない。同様に、図8Bに示すように、画像810内の有効画素、即ち垂直細線候補画素群には、垂直細線により形成された地紋514に対応する画素804が含まれ、文字511、罫線512又は他の地紋513、515に対応する画素は含まれていない。図示しないが、第1斜め細線候補画素群及び第2斜め細線候補画素群についても同様に、各細線により形成された地紋に対応する画素が含まれ、文字511、罫線512又は他の地紋に対応する画素は含まれない。各細線候補画素群には、各細線により形成された地紋と文字511又は罫線512とが重なる部分に対応する画素も含まれていない。
なお、検出部224は、抽出した画素群において、相互に隣接する二つの画素の内、中央側の画素の階調値が外側の画素の階調値より大きい場合、その画素群を細線候補画素群として抽出しなくてもよい。即ち、グラフ750に示す例において、仮に、画素群P-1、P0、P+1の内、中央側の画素P0の階調値が外側の画素P-1又はP+1の階調値より大きい場合、検出部224は、画素群P-1、P0、P+1を細線候補画素群として抽出しない。上記したように、入力画像内で、細線701及び周囲領域702の階調値は、細線701の中心位置から外側に向けて徐々に高くなっていく。検出部224は、中央側の画素の階調値が外側の画素の階調値より大きい画素群を細線候補画素群として抽出しないことにより、細線以外の模様等を細線候補として誤って抽出することを抑制できる。
また、検出部224は、画素群として抽出した画素の階調値が第2閾値T2未満である場合、その画素群を細線候補画素群として抽出しなくてもよい。第2閾値T2は、閾値T1より小さい値(例えば95)に設定される。これにより、検出部224は、幅が細く且つ濃い(輝度が低い)罫線を細線候補として誤って抽出することを抑制できる。
次に、検出部224は、多値画像から抽出した細線候補画素群の内、所定方向D2と直交する方向D1、即ち各細線の延伸方向に連続する画素数が所定数未満である細線候補画素群をノイズとして除去する(ステップS205)。所定数は、検出すべき細線の長さに応じて予め設定され、例えば6に設定される。
検出部224は、抽出した水平細線候補画素群から、水平方向に連続する画素数が所定数未満である水平細線候補画素群を除去する。同様に、検出部224は、抽出した垂直細線候補画素群から、垂直方向に連続する画素数が所定数未満である垂直細線候補画素群を除去する。また、検出部224は、抽出した第1斜め細線候補画素群から、第1斜め方向に連続する画素数が所定数未満である第1斜め細線候補画素群を除去する。また、検出部224は、抽出した第2斜め細線候補画素群から、第2斜め方向に連続する画素数が所定数未満である第2斜め細線候補画素群を除去する。
図9Aは、ノイズが除去された水平細線候補画素群を有効画素とする画像900の一例を示す模式図であり、図9Bは、ノイズが除去された垂直細線候補画素群を有効画素とする画像910の一例を示す模式図である。
図9Aに示すように、画像900内の有効画素、即ちノイズが除去された水平細線候補画素群には、水平細線により形成された地紋513に対応する画素903のみが含まれている。同様に、図9Bに示すように、画像910内の有効画素、即ちノイズが除去された垂直細線候補画素群には、垂直細線により形成された地紋514に対応する画素904のみが含まれている。図示しないが、ノイズが除去された第1斜め細線候補画素群及び第2斜め細線候補画素群についても同様に、各細線により形成された地紋に対応する画素のみが含まれる。
次に、検出部224は、抽出した各細線候補画素群がそれぞれ含まれる細線領域を特定する(ステップS206)。各細線領域は、検出部224が検出する各細線が含まれる領域である。
まず、検出部224は、水平細線候補画素群、垂直細線候補画素群、第1斜め細線候補画素群及び第2斜め細線候補画素群のそれぞれについて、各細線候補画素群を有効画素とし、他の画素を無効画素とする細線二値画像を生成する。次に、検出部224は、各細線二値画像について、各細線二値画像内の各画素から第1距離内に有効画素が存在する場合、その画素を有効画素に置換することにより、有効画素を膨張させた細線膨張画像を生成する。第1距離は、検出すべき複数の細線の配置間隔に応じて予め設定され、2以上の値(例えば10)に設定される。即ち、各細線膨張画像では、第1距離内に存在する複数の細線が結合される。
次に、検出部224は、各細線膨張画像について、各細線膨張画像内の各画素から第2距離内に無効画素が存在する場合、その画素を無効画素に置換することにより、有効画素を収縮させた細線収縮画像を生成する。第2距離は、第1距離より第3距離(例えば1)だけ大きい値に設定される。即ち、各細線収縮画像では、元の細線二値画像内において、細線の延伸方向と直交する方向の第1距離内に他の細線が存在していない単一の細線が除去される。次に、検出部224は、各細線収縮画像について、各細線収縮画像内の各画素から第3距離内に有効画素が存在する場合、その画素を有効画素に置換することにより、有効画素を膨張させて細線領域画像を生成する。この膨張処理は、膨張処理と収縮処理の次数を同一にするために実行される。
次に、検出部224は、各細線領域画像内の有効画素に対応する多値画像内の画素の領域を細線領域として特定する。検出部224は、水平細線候補画素群、垂直細線候補画素群、第1斜め細線候補画素群及び第2斜め細線候補画素群のそれぞれについて、水平細線領域、垂直細線領域、第1斜め細線領域及び第2斜め細線領域を特定する。
図10Aは、水平細線について生成された細線領域画像1000の一例を示す模式図である。
図10Aに示すように、細線領域画像1000内の有効画素1003(即ち、水平細線領域)には、各水平細線及び各水平細線の間に存在する背景に対応する領域が含まれ、文字、罫線、他の地紋等は除去されている。図示しないが、垂直細線、第1斜め細線及び第2斜め細線について生成された各細線領域画像についても同様に、各細線及び各細線の間に存在する背景に対応する領域が含まれ、文字、罫線、他の地紋等は除去される。
次に、検出部224は、多値画像から細線を検出する(ステップS207)。検出部224は、多値画像から抽出した水平細線候補画素群の内、水平細線領域内に位置する水平細線候補画素群を水平細線として検出し、垂直細線候補画素群の内、垂直細線領域内に位置する垂直細線候補画素群を垂直細線として検出する。また、検出部224は、第1斜め細線候補画素群の内、第1斜め細線領域内に位置する第1斜め細線候補画素群を第1斜め細線として検出し、第2斜め細線候補画素群の内、第2斜め細線領域内に位置する第2斜め細線候補画素群を第2斜め細線として検出する。
検出部224は、ステップS205において、各細線候補画素群から、各細線の延伸方向に連続する画素数が所定数未満である細線候補画素群をノイズとして除去している。したがって、検出部224は、多値画像から所定方向D2について抽出した各細線候補画素群の内、所定方向D2と直交する方向D1(各細線の延伸方向)に所定数以上連続する細線候補画素群を細線として検出する。
また、検出部224は、ステップS206において、細線の延伸方向と直交する方向の第1距離内に他の細線が存在していない単一の細線が除去されるように各細線領域を特定している。したがって、検出部224は、多値画像から所定方向D2について抽出した各細線候補画素群の内、所定方向D2において所定距離内に他の細線候補画素群が存在する細線候補画素群に限り細線として検出する。
図10Bは、検出された水平細線に対応する画素を有効画素とする画像1010の一例を示す模式図である。
図10Bに示すように、画像1010の有効画素、即ち検出された水平細線には、水平細線により形成された地紋513に対応する画素1013が含まれ、文字511、罫線512又は他の地紋514、515に対応する画素は含まれていない。図示しないが、垂直細線、第1斜め細線及び第2斜め細線についても同様に、各細線に対応する画素には、各細線により形成された地紋に対応する画素が含まれ、文字601、罫線602又は他の地紋に対応する画素は含まれない。また、各細線に対応する画素には、各細線により形成された地紋と文字511又は罫線512とが重なっている画素も含まれていない。
次に、検出部224は、二値画像からドット候補画素群を抽出する(ステップS208)。検出部224は、二値画像内で相互に隣接する黒色画素をラベリングにより連結した連結領域を抽出し、二値画像内の黒色画素を連結した連結領域の内、画素数が所定サイズ以下である連結領域をドット候補画素群として抽出する。所定サイズは、検出すべきドットの大きさに応じて予め設定され、例えば4画素に設定される。
図11Aは、ドット候補画素群を有効画素とする画像1100の一例を示す模式図である。
図11Aに示すように、画像1100内のドット候補画素群には、ドットにより形成された地紋605に対応する画素1105が含まれ、文字601、罫線602又は他の地紋603、604に対応する画素は含まれていない。ドット候補画素群には、ドットにより形成された地紋605と文字601又は罫線602とが重なる部分に対応する画素も含まれていない。
次に、検出部224は、抽出したドット候補画素群が含まれるドット領域を特定する(ステップS209)。ドット領域は、検出部224が検出するドットが含まれる領域である。
まず、検出部224は、各ドット候補画素群を有効画素とし、他の画素を無効画素とするドット二値画像を生成する。次に、検出部224は、ドット二値画像において、各画素から第1距離内に有効画素が存在する場合、その画素を有効画素に置換することにより、有効画素を膨張させたドット膨張画像を生成する。第1距離は、検出すべき複数のドットの配置間隔に応じて予め設定され、2以上の値(例えば10)に設定される。即ち、各ドット膨張画像では、第1距離内に存在する複数のドットが結合される。
次に、検出部224は、ドット膨張画像において、各画素から第2距離内に無効画素が存在する場合、その画素を無効画素に置換することにより、有効画素を収縮させたドット収縮画像を生成する。第2距離は、第1距離より第3距離(例えば1)だけ大きい値に設定される。即ち、ドット収縮画像では、元のドット二値画像において、第1距離内に他のドットが存在していない単一のドットが除去される。次に、検出部224は、ドット収縮画像において、各画素から第3距離内に有効画素が存在する場合、その画素を有効画素に置換することにより、有効画素を膨張させてドット領域画像を生成する。この膨張処理は、膨張処理と収縮処理の次数を同一にするために実行される。
次に、検出部224は、ドット領域画像内の有効画素に対応する二値画像内の画素の領域をドット領域として特定する。
図11Bは、ドット領域画像1110の一例を示す模式図である。
図11Bに示すように、ドット領域画像1110内の有効画素、即ちドット領域には、各ドット及び各ドットの間に存在する背景に対応する領域1115が含まれ、文字、罫線、他の地紋等は除去されている。
次に、検出部224は、二値画像からドットを検出する(ステップS210)。検出部224は、二値画像から抽出したドット候補画素群の内、ドット領域内に位置するドット候補画素群をドットとして検出する。
検出部224は、ステップS209において、第1距離内に他のドットが存在していない単一のドットが除去されるようにドット領域を特定している。これにより、検出部224は、二値画像から抽出したドット候補画素群の内、第2所定距離内に他のドット候補画素群が存在するドット候補画素群をドットとして検出する。
図12は、検出されたドットに対応する画素を有効画素とする画像1200の一例を示す模式図である。
図12に示すように、画像1200内の有効画素、即ち検出されたドットには、ドットにより形成された地紋605に対応する画素1205が含まれ、文字601、罫線602又は他の地紋603、604に対応する画素は含まれていない。また、検出されたドットに対応する画素には、ドットにより形成された地紋603と文字601又は罫線602とが重なっている画素も含まれていない。
次に、地紋除去画像生成部225は、多値画像から検出された細線及び二値画像から検出されたドットに基づいて、二値画像から、細線及びドットを含む地紋を除去した地紋除去画像を生成する(ステップS211)。地紋除去画像生成部225は、二値画像内の黒色画素の内、多値画像から検出された細線及び二値画像から検出されたドットに対応する画素を白色画素に置換することにより、地紋除去画像を生成する。
さらに、地紋除去画像生成部225は、多値画像内の各画素の内、二値画像内で白色画素に置換した黒色画素に対応する画素の階調値を所定値に置換した多値地紋除去画像を生成してもよい。所定値は、例えば多値画像内の背景領域の階調値の平均値である。
また、地紋除去画像生成部225は、二値画像内の黒色画素の内、各細線領域に対応し且つ検出された各細線に対応しないドットに対応する画素を白色画素に置換しなくてもよい。細線に対応する画素がドットとして検出される可能性があるが、このような画素をドットとみなして除去すると、地紋除去画像生成部225は、文字又は罫線等のコンテンツを誤って除去してしまう可能性がある。そこで、地紋除去画像生成部225は、二値画像内の黒色画素の内、多値画像内において各細線領域に対応する画素についてはドットとして除去しない。即ち、地紋除去画像生成部225は、仮にその画素が細線として検出されていない場合、その画素を除去しない。これにより、地紋除去画像生成部225は、地紋以外のコンテンツを誤って除去してしまうことを抑制できる。
図13は、地紋除去画像1300の一例を示す模式図である。
図13に示すように、地紋除去画像1300では、二値画像600に示されていた文字601及び罫線602のみが残り、地紋603〜605は良好に除去されている。
なお、地紋除去画像生成部225は、生成した地紋除去画像内で相互に隣接する黒色画素をラベリングにより連結した連結領域を抽出し、連結領域の内、画素数が第2所定サイズ以下である連結領域をノイズとして除去してもよい。第2所定サイズは、所定サイズより小さいサイズ(例えば3画素)に予め設定される。
次に、文字認識部226は、公知のOCR(Optical Character Recognition)技術を利用して、生成された地紋除去画像から文字を検出する(ステップS212)。
次に、出力制御部227は、検出された文字を表示装置203に表示し(ステップS213)、一連のステップを終了する。なお、出力制御部227は、検出された文字に代えて又は加えて、検出部224により検出された地紋の種類(水平細線、垂直細線、第1斜め細線、第2斜め細線又はドット)、地紋除去画像又は多値地紋除去画像を表示装置203に表示してもよい。また、出力制御部227は、検出された文字、地紋の種類、地紋除去画像又は多値地紋除去画像を不図示の通信装置を介して不図示のサーバ等に送信してもよい。このように、出力制御部227は、地紋除去画像又は地紋除去画像を用いて生成した情報を出力する。
なお、検出部224は、水平細線、垂直細線、第1斜め細線及び第2斜め細線の内の少なくとも一つの種類の細線を検出し、他の種類の細線の検出処理を省略してもよい。また、検出部224は、細線及びドットの内の少なくとも一つの種類の地紋を検出し、他の種類の地紋の検出処理を省略してもよい。その場合、情報処理装置200は、入力装置202を用いて利用者から、検出する地紋の種類の指定を受け付けてもよい。検出部224は、受け付けた種類の地紋のみを検出し、地紋除去画像生成部225は、検出された種類の地紋に基づいて、二値画像から、検出された種類の地紋を除去した地紋除去画像を生成する。情報処理装置200は、対象とする種類の地紋以外の地紋を検出しないため、地紋検出処理の処理時間を短縮しつつ、地紋の誤検出を抑制することが可能となる。
また、検出部224は、ステップS205の処理を省略し、ステップS204で抽出した細線候補画素群から細線を検出してもよい。また、検出部224は、ステップS206の処理を省略し、抽出した細線候補画素群をそのまま細線として検出してもよい。また、検出部224は、ステップS209の処理を省略し、抽出したドット候補画素群をそのままドットとして検出してもよい。これにより、情報処理装置200は、地紋検出処理の処理時間を短縮することが可能となる。
図14A、図14B、図14C、図14Dは、多値画像から地紋を検出することの意義について説明するための模式図である。
図14Aは、入力画像を所定閾値で二値化した二値画像1400を示す。二値画像1400には、太い細線1401及び途切れた細線1402等が含まれており、文字1403又は罫線1404を各細線と正しく区別することは困難である。
図14Bは、入力画像を所定閾値より小さい閾値で二値化した二値画像1410を示す。二値画像1410では、途切れた細線1412の数は減少しているが、太い細線1411がより太くなってしまい、文字1413又は罫線1414を各細線と正しく区別することは困難である。また、二値画像1410では、文字1413自体も濃くなってしまい、そもそも文字1413を正しく認識することが困難になる。
図14Cは、入力画像を所定閾値より大きい閾値で二値化した二値画像1420を示す。二値画像1420では、ほとんどの細線1422が途切れた状態となり、文字1423又は罫線1424を各細線と正しく区別することは困難である。また、二値画像1410では、文字1423自体も薄くなってしまい、そもそも文字1423を正しく認識することが困難になる。
このように、閾値をどのように調整して二値画像を生成しても、細線のサイズは安定せず、二値画像から細線を精度良く検出することは困難である。
図14Dは、多値画像から検出した細線を示す画像1430を示す。画像1430において、細線1431は、細線及びその周囲領域の階調値(多値)に基づいて詳細に解析され、良好に抽出されている。特に、画像1430において、文字に対応する領域1432及び罫線に対応する領域1433では細線が検出されておらず、細線1431と文字又は罫線とが良好に区別されている。
以上詳述したように、図4に示したフローチャートに従って動作することによって、情報処理装置200は、多値画像から細線を地紋として検出し、検出した地紋を対応する二値画像から除去する。情報処理装置200は、多値画像を、細線及びその周囲領域の階調値(多値)に基づいて詳細に解析することにより、細線を文字又は罫線と区別して精度良く検出することが可能となった。したがって、情報処理装置200は、地紋が含まれる画像から地紋をより精度良く除去することが可能となった。
また、本実施形態に係る細線検出処理により、様々な種類の細線が印刷された画像から細線を検出する実験を行った。その結果、情報処理装置200は、特定の方向に延伸する細線を対象として検出処理を実行した場合に、その特定の方向に対して±25°の方向に延伸する細線を検出することができた。したがって、検出部224は、水平細線、垂直細線、第1斜め細線及び第2斜め細線の全ての細線を検出することにより、全ての方向に延伸する細線を検出することが可能となる。
また、情報処理装置200は、検出部224により検出された地紋の種類(水平細線、垂直細線、第1斜め細線、第2斜め細線又はドット)に基づいて、異種帳票の混在を検出すること、又は、異種帳票を同種帳票毎に分類することが可能となる。
図15は、他の実施形態に係る情報処理装置における処理装置230の概略構成を示すブロック図である。
処理装置230は、CPU220の代わりに、認識処理を実行する。処理装置230は、取得回路231、多値画像生成回路232、二値画像生成回路233、検出回路234、地紋除去画像生成回路235、文字認識回路236及び出力制御回路237等を有する。
取得回路231は、取得部の一例であり、取得部221と同様の機能を有する。取得回路231は、入力画像を第2インタフェース装置201を介して画像読取装置100から取得し、第2記憶装置210に保存する。
多値画像生成回路232は、多値画像生成部の一例であり、多値画像生成部222と同様の機能を有する。多値画像生成回路232は、第2記憶装置210から入力画像を読み出し、多値画像を生成し、第2記憶装置210に保存する。
二値画像生成回路233は、二値画像生成部の一例であり、二値画像生成部223と同様の機能を有する。二値画像生成回路233は、第2記憶装置210から入力画像を読み出し、二値画像を生成し、第2記憶装置210に保存する。
検出回路234は、検出部の一例であり、検出部224と同様の機能を有する。検出回路234は、第2記憶装置210から多値画像を読み出し、多値画像から細線及びドットを検出し、検出結果を第2記憶装置210に保存する。
地紋除去画像生成回路235は、地紋除去画像生成部の一例であり、地紋除去画像生成部225と同様の機能を有する。地紋除去画像生成回路235は、第2記憶装置210から二値画像と、細線及びドットの検出結果とを読み出し、地紋除去画像を生成し、第2記憶装置210に保存する。
文字認識回路236は、文字認識部の一例であり、文字認識部226と同様の機能を有する。文字認識回路236は、第2記憶装置210から地紋除去画像を読み出し、地紋除去画像から文字を検出し、検出結果を第2記憶装置210に保存する。
出力制御回路237は、出力制御部の一例であり、出力制御部227と同様の機能を有する。出力制御回路237は、第2記憶装置210から文字の検出結果、印鑑除去画像又は多値印鑑除去画像を読み出し、読み出した情報を表示装置203に出力する。
以上詳述したように、情報処理装置は、処理装置230を用いる場合も、細線を含む地紋が含まれる画像から地紋をより精度良く除去することが可能となった。
以上、好適な実施形態について説明してきたが、実施形態はこれらに限定されない。例えば、画像読取装置100と情報処理装置200の機能分担は、図1に示す画像処理システム1の例に限られず、画像読取装置100及び情報処理装置200の各部を画像読取装置100と情報処理装置200の何れに配置するかは適宜変更可能である。または、画像読取装置100と情報処理装置200を一つの装置で構成してもよい。
例えば、画像読取装置100の第1記憶装置110が、情報処理装置200の第2記憶装置210に記憶された各プログラムを記憶し、画像読取装置100の第1CPU120が、情報処理装置200の第2CPU120により実現される各部として動作してもよい。また、画像読取装置100が、情報処理装置200の処理装置230と同様の処理装置を有してもよい。
その場合、画像読取装置100は表示装置203と同様の表示装置を有する。認識処理は画像読取装置100で実行されるため、ステップS102、S201の入力画像の送受信処理は省略される。ステップS202〜S213の各処理は、画像読取装置100の第1CPU120又は処理装置によって実行される。これらの処理の動作は、情報処理装置200の第2CPU220又は処理装置230によって実行される場合と同様である。
また、画像処理システム1において、第1インタフェース装置101と第2インタフェース装置201は、インターネット、電話回線網(携帯端末回線網、一般電話回線網を含む)、イントラネット等のネットワークを介して接続してもよい。その場合、第1インタフェース装置101及び第2インタフェース装置201に、接続するネットワークの通信インタフェース回路を備える。また、その場合、クラウドコンピューティングの形態で画像処理のサービスを提供できるように、ネットワーク上に複数の情報処理装置を分散して配置し、各情報処理装置が協働して、認識処理等を分担するようにしてもよい。これにより、画像処理システム1は、複数の画像読取装置が読み取った入力画像について、効率よく認識処理を実行できる。
1 画像処理システム
200 情報処理装置
221 取得部
222 多値画像生成部
223 二値画像生成部
224 検出部
225 地紋除去画像生成部
227 出力制御部

Claims (10)

  1. 入力画像を取得する取得部と、
    前記入力画像から多値画像を生成する多値画像生成部と、
    前記入力画像を二値化した二値画像を生成する二値画像生成部と、
    前記多値画像から、所定の画素数以下の幅を有する細線を検出する検出部と、
    前記多値画像から検出された細線に基づいて、前記二値画像から細線を除去した地紋除去画像を生成する地紋除去画像生成部と、
    前記地紋除去画像又は前記地紋除去画像を用いて生成した情報を出力する出力部と、
    を有することを特徴とする画像処理装置。
  2. 前記検出部は、
    前記多値画像において、階調値が閾値未満である画素が所定方向に所定個数連続した画素群であり、且つ、当該画素群に前記所定方向に隣接する二つの画素の階調値が前記閾値以上である画素群を細線候補画素群として抽出し、
    前記抽出した細線候補画素群の内、前記所定方向と直交する方向に所定数以上連続する細線候補画素群を細線として検出する、請求項1に記載の画像処理装置。
  3. 前記検出部は、前記所定方向において所定距離内に他の細線候補画素群が存在する細線候補画素群に限り細線として検出する、請求項2に記載の画像処理装置。
  4. 前記検出部は、前記画素群において、相互に隣接する二つの画素の内、中央側の画素の階調値が外側の画素の階調値より大きい場合、当該画素群を細線候補画素群として抽出しない、請求項2または3に記載の画像処理装置。
  5. 前記検出部は、さらに、前記二値画像からドットを検出し、
    前記地紋除去画像生成部は、さらに、前記二値画像から前記検出されたドットを除去することにより、前記地紋除去画像を生成する、請求項1〜4の何れか一項に記載の画像処理装置。
  6. 前記検出部は、
    前記二値画像内の黒色画素を連結した連結領域の内、所定サイズ以下である連結領域をドット候補画素群として抽出し、
    前記抽出したドット候補画素群の内、第2所定距離内に他のドット候補画素群が存在するドット候補画素群をドットとして検出する、請求項5に記載の画像処理装置。
  7. 前記地紋除去画像生成部は、前記二値画像内の黒色画素の内、前記検出された細線又はドットに対応する画素を白色画素に置換することにより、前記地紋除去画像を生成する、請求項5または6に記載の画像処理装置。
  8. 前記検出部は、さらに、前記検出した細線が含まれる細線領域を特定し、
    前記地紋除去画像生成部は、前記二値画像内の黒色画素の内、前記細線領域に対応し且つ前記検出された細線に対応しないドットに対応する画素を白色画素に置換しない、請求項7に記載の画像処理装置。
  9. 出力部を有する画像処理装置の制御方法であって、前記画像処理装置が、
    入力画像を取得し、
    前記入力画像から多値画像を生成し、
    前記入力画像を二値化した二値画像を生成し、
    前記多値画像から、所定の画素数以下の幅を有する細線を検出し、
    前記多値画像から検出された細線に基づいて、前記二値画像から細線を除去した地紋除去画像を生成し、
    前記地紋除去画像又は前記地紋除去画像を用いて生成した情報を前記出力部から出力する、
    ことを含むことを特徴とする制御方法。
  10. 出力部を有するコンピュータの制御プログラムであって、
    入力画像を取得し、
    前記入力画像から多値画像を生成し、
    前記入力画像を二値化した二値画像を生成し、
    前記多値画像から、所定の画素数以下の幅を有する細線を検出し、
    前記多値画像から検出された細線に基づいて、前記二値画像から細線を除去した地紋除去画像を生成し、
    前記地紋除去画像又は前記地紋除去画像を用いて生成した情報を前記出力部から出力する、
    ことを前記コンピュータに実行させることを特徴とする制御プログラム。
JP2020547848A 2018-09-28 2018-09-28 画像処理装置、制御方法及び制御プログラム Active JP6970834B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/036484 WO2020065980A1 (ja) 2018-09-28 2018-09-28 画像処理装置、制御方法及び制御プログラム

Publications (2)

Publication Number Publication Date
JPWO2020065980A1 true JPWO2020065980A1 (ja) 2021-03-18
JP6970834B2 JP6970834B2 (ja) 2021-11-24

Family

ID=69951260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020547848A Active JP6970834B2 (ja) 2018-09-28 2018-09-28 画像処理装置、制御方法及び制御プログラム

Country Status (3)

Country Link
US (1) US11115560B2 (ja)
JP (1) JP6970834B2 (ja)
WO (1) WO2020065980A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7433887B2 (ja) * 2019-12-23 2024-02-20 キヤノン株式会社 画像を処理するための装置、プログラム、画像処理方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143607A (ja) * 1996-11-13 1998-05-29 Oki Electric Ind Co Ltd 画像処理装置
JP2001111816A (ja) 1999-10-14 2001-04-20 Hitachi Ltd 文書画像処理装置
JP2005301713A (ja) * 2004-04-13 2005-10-27 Oki Electric Ind Co Ltd 帳票画像の地紋除去方法及び装置
JP2012248948A (ja) * 2011-05-25 2012-12-13 Oki Electric Ind Co Ltd 帳票確認支援装置、方法及びプログラム
JP6554352B2 (ja) 2015-07-22 2019-07-31 株式会社富士通コンピュータテクノロジーズ 帳票判別プログラム、帳票判別方法及び帳票判別装置

Also Published As

Publication number Publication date
JP6970834B2 (ja) 2021-11-24
US11115560B2 (en) 2021-09-07
US20210127032A1 (en) 2021-04-29
WO2020065980A1 (ja) 2020-04-02

Similar Documents

Publication Publication Date Title
JP5701182B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP6970835B2 (ja) 画像処理装置、制御方法及び制御プログラム
US8861854B2 (en) Character recognition apparatus, method, and computer-readable, non-transitory medium
US10699110B2 (en) Image processing apparatus, image processing method, and non-transitory recording medium storing program for causing computer to execute image processing method
JP4424309B2 (ja) 画像処理装置、文字判定プログラム、および文字判定方法
JP5701181B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
US10970579B2 (en) Image processing apparatus for placing a character recognition target region at a position of a predetermined region in an image conforming to a predetermined format
JP2014195148A (ja) 画像処理装置、領域決定方法及びコンピュータプログラム
JP2020061720A (ja) 画像処理装置、制御方法及び制御プログラム
JP6021665B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP2011008549A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP2010056827A (ja) 画像処理装置および画像処理プログラム
JP6970834B2 (ja) 画像処理装置、制御方法及び制御プログラム
JP7022847B2 (ja) 画像処理装置、制御方法及び制御プログラム
US9268998B2 (en) Image determining apparatus, image processing system, and recording medium
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
US10931852B2 (en) Image processing apparatus, image processing method, and storage medium, with determining whether or not character clipping rectangle determined to be non-character region is character region
JP2010287178A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP7106672B2 (ja) 画像処理装置、制御方法及び制御プログラム
WO2020157938A1 (ja) 画像処理装置、制御方法及び制御プログラム
WO2020157937A1 (ja) 画像処理装置、制御方法及び制御プログラム
JP2021149459A (ja) 画像処理装置、制御方法及び制御プログラム
JP7282257B2 (ja) 画像処理装置、制御方法及び制御プログラム
JP2011070327A (ja) 画像属性判定装置、画像属性判定方法および画像属性判定プログラム
JP6645143B2 (ja) 画像解析装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211012

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211029

R150 Certificate of patent or registration of utility model

Ref document number: 6970834

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150