JP6701773B2 - 罫線削除装置、罫線削除方法、および罫線削除プログラム - Google Patents

罫線削除装置、罫線削除方法、および罫線削除プログラム Download PDF

Info

Publication number
JP6701773B2
JP6701773B2 JP2016023105A JP2016023105A JP6701773B2 JP 6701773 B2 JP6701773 B2 JP 6701773B2 JP 2016023105 A JP2016023105 A JP 2016023105A JP 2016023105 A JP2016023105 A JP 2016023105A JP 6701773 B2 JP6701773 B2 JP 6701773B2
Authority
JP
Japan
Prior art keywords
pixel
ruled line
image
character
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016023105A
Other languages
English (en)
Other versions
JP2017142628A (ja
Inventor
泰正 笹野
泰正 笹野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2016023105A priority Critical patent/JP6701773B2/ja
Publication of JP2017142628A publication Critical patent/JP2017142628A/ja
Application granted granted Critical
Publication of JP6701773B2 publication Critical patent/JP6701773B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Description

この発明は、濃淡を有する多値画像であって、文字と罫線とを含む処理対象画像から、設定した長さ方向の罫線を削除した画像を生成する技術に関する。
従来、文字と罫線が記載された帳票等の原稿を、イメージスキャナ等の画像読取装置で光学的に読み取った濃淡画像(多値画像)を処理し、罫線を削除(除去)した画像を生成する技術が提案されている(特許文献1等参照)。罫線を削除した画像は、例えば、文字にかかる画素(文字画素)を黒(例えば、画素値を1)、それ以外の画素(非文字画素)を白(例えば、画素値を0)とした2値化画像である。この技術は、例えば、公知のOCR(Optical Character Recognition)機能により、原稿に記載されている文字のテキストデータを取得する装置で利用されている。上記技術で罫線を削除した画像に対して、OCR機能による文字認識を行うことで、罫線による文字の誤認識が抑えられる。
罫線を削除した画像の生成では、罫線にかかる全ての画素を白にすると、罫線と文字とが重なっている位置において、その文字が分断される。その結果、OCR機能による文字認識精度の低下をまねく。すなわち、罫線を削除した画像の生成においては、罫線のみにかかる画素については白にし、罫線と文字とが重なっている画素については黒にしなければならない。
上記特許文献1では、罫線の周辺に位置する画素が文字にかかる画素であるかどうかによって、その画素が罫線のみにかかる画素であるか、罫線と文字とが重なっている画素であるかを判定し、その画素を白にするか、黒にするかを判定している。
特開平9−185676号公報
しかしながら、特許文献1は、罫線の抽出を行い、抽出した罫線にかかる画素毎に、その画素が罫線のみにかかる画素であるか、罫線と文字とが重なっている画素であるかを判定している。したがって、原稿を光学的に読み取った濃淡画像に多数の罫線が含まれていると、罫線の抽出にかかる処理負荷が大きくなる。
また、罫線の抽出漏れが生じると、抽出されなかった罫線にかかる画素は、その画素が罫線のみにかかる画素であるか、罫線と文字とが重なっている画素であるかについて判定されることがない。したがって、罫線の抽出漏れが生じると、抽出されなかった罫線が削除されずに、残った画像を生成することになる。
この発明の目的は、濃淡を有する多値画像であって、文字と罫線とを含む処理対象画像から、設定した長さ方向の罫線を削除した画像を、比較的簡単な処理で精度よく生成できる技術を提供することにある。
この発明の罫線削除装置は、上記目的を達するために、以下のように構成している。
罫線削除装置は、閾値決定部と、第1の2値化画像生成部と、を備えている。罫線削除装置には、濃淡を有する多値画像であって、文字と罫線とを含む処理対象画像が入力される。
閾値決定部は、入力された処理対象画像の注目画素が文字にかかる文字画素であるか、それ以外の非文字画素であるかを判定するのに用いる画素値の閾値を決定する。閾値決定部は、処理対象画像の各画素を順番に注目画素に設定することにより、処理対象画像の画素毎に、その画素が文字画素であるか、非文字画素であるかを判定するのに用いる画素値の閾値を決定することができる。
また、閾値決定部は、閾値を決定する注目画素を含む複数の画素が、削除する罫線の長さ方向に並ぶ領域を局所領域として設定する。この局所領域は、局所領域内に位置する全ての画素が、文字画素にならないように設定するのがよい。例えば、局所領域は、閾値を決定する注目画素が、削除する罫線の長さ方向に並ぶ複数の画素の中間に位置するように設定してもよいし、また、削除する罫線の長さ方向の長さが、削除する罫線の長さ方向における文字の長さよりも長くなるように設定してもよい。
閾値決定部は、局所領域内に位置する複数の画素の画素値を用いて、当該注目画素の閾値を決定する。例えば、閾値決定部は、局所領域内に位置する画素について、画素値に対する画素数の分布等から、注目画素が文字画素であるか、非文字画素であるかの判定に用いる閾値を決定する。
第1の2値化画像生成部は、入力された処理対象画像の注目画素が、文字画素、または非文字画素のいずれであるかを、当該注目画素について閾値決定部が決定した閾値を用いて判定する。第1の2値化画像生成部は、処理対象画像の各画素を順番に注目画素に設定することにより、処理対象画像の画素毎に、その画素が文字画素であるか、非文字画素であるかを判定することができる。
このように、画素毎に、文字画素であるか、非文字画素であるかの判定に用いる閾値を決定し、その閾値を用いて文字画素であるか、非文字画素であるかを判定するので、設定した長さ方向の罫線を削除した画像の生成が、比較的簡単な処理で精度よく行える。
また、入力された処理対象画像の注目画素が、文字または罫線にかかる前景画素であるか、それ以外の背景画素であるかを判定し、第2の2値化画像を生成する第2の2値化画像生成部を備える構成にしてもよい。この場合には、第1の2値化画像生成部は、第2の2値化画像生成部が背景画素であると判定した注目画素については、非文字画素であると判定するように構成すればよい。
また、閾値決定部は、閾値を決定する注目画素に応じて法線領域を設定し、この法線領域内に位置する画素の画素値も用いて、当該注目画素の前記閾値を決定する構成にしてもよい。法線領域は、閾値を決定する注目画素を含み、第1の2値化画像生成部が非文字画素であると判定していない画素、または第2の2値化画像生成部が背景画素であると判定していない画素が、削除する罫線の長さ方向に直交する方向に連続して並んでいる領域である。
このように構成すれば、注目画素に対して、削除する罫線の長さ方向に並んでいる画素だけでなく、削除する罫線の長さ方向に直交する方向に並んでいる画素も用いて、閾値を決定することができる。したがって、注目画素の閾値の決定が、より精度よく行える。
さらに、入力された処理対象画像に対して、削除する罫線の長さ方向を設定する罫線方向設定部を備える構成にしてもよい。
この発明によれば、文字と罫線を含む多値画像から、設定した長さ方向の罫線を削除した画像を、比較的簡単な処理で精度よく生成できる。
この例にかかる罫線削除装置の主要部の構成を示すブロック図である。 画像処理部の機能構成を示す図である。 図3(A)は、処理対象画像の例を示す図であり、図3(B)は、長さ方向が文字の幅方向である罫線を削除した罫線分離画像の例を示す図であり、図3(C)は、さらに長さ方向が文字の高さ方向である罫線も削除した罫線分離画像の例を示す図である。 罫線削除装置の動作を示すフローチャートである。 罫線削除処理を示すフローチャートである。 閾値決定処理を示すフローチャートである。 局所領域を説明する図である。 局所領域A〜Dを示す図である。 図9(A)は、局所領域Aにおける画素の画素値の分布であり、図9(B)は、局所領域Bにおける画素の画素値の分布であり、図9(C)は、局所領域Cにおける画素の画素値の分布であり、図9(D)は、局所領域Dにおける画素の画素値の分布である。 法線領域A’〜D’を示す図である。
以下、この発明の実施形態である罫線削除装置について説明する。
図1は、この例にかかる罫線削除装置の主要部の構成を示すブロック図である。罫線削除装置1は、画像入力部2と、画像処理部3と、画像出力部4と、を備えている。
画像入力部2には、処理対象画像が入力される。処理対象画像は、文字と罫線が記載された濃淡画像(多値画像)である。処理対象画像は、例えば256階調であり、黒い画素ほど画素値が小さく、白い画素ほど画素値が大きい画像である。処理対象画像は、例えばイメージスキャナ等の画像読取装置で帳票等の原稿を光学的に読み取った濃淡画像である。処理対象画像を画像入力部2に入力する機器(画像入力部2に接続される機器)は、例えば、上述の画像読取装置であってもよいし、CD等の記録媒体に記録されている処理対象画像を読み出して出力する記録媒体読取装置であってもよい。
画像処理部3は、画像入力部2に入力された処理対象画像を処理し、罫線を削除した罫線分離画像を生成する。画像処理部3において生成される罫線分離画像は、2値化画像である。罫線分離画像は、文字にかかる画素(文字画素)の画素値が1であり、その他の画素(非文字画素)の画素値が0である、2値化画像である。画像処理部3は、プロセッサや、メモリを有している。このプロセッサが、この発明にかかる罫線削除方法を実行する。また、この発明にかかる罫線削除プログラムは、このプロセッサで実行される。また、メモリは、画像処理部3(プロセッサ)における罫線削除処理の実行時にワーキングエリアとして使用する記憶領域を有している。
画像出力部4は、画像処理部3において生成された罫線分離画像を出力する。画像出力部4には、例えば、画像処理部3において生成された罫線分離画像を処理し、文字を認識する文字認識装置(OCR)が接続される。
図2は、画像処理部の機能構成を示す図である。画像処理部3は、背景分離機能部31と、2値化画像記憶部32と、罫線方向設定機能部33と、閾値決定機能部34と、罫線分離機能部35と、を有している。
背景分離機能部31は、画像入力部2に入力された処理対象画像を処理し、背景分離画像を生成する。背景分離画像は、処理対象画像において、文字や罫線にかかる画素を前景画素(画素値を1)、それ以外の画素を背景画素(画素値を0)にした2値化画像である。この背景分離機能部31が、この発明で言う第2の2値化画像生成部に相当する。また、背景分離画像が、この発明で言う第2の2値化画像に相当する。
2値化画像記憶部32は、背景分離機能部31が生成した背景分離画像や、後述する罫線分離機能部35が生成した罫線分離画像(2値化画像)を一時的に記憶する。この罫線分離画像が、この発明で言う第1の2値化画像に相当する。
罫線方向設定機能部33は、処理対象画像に対して削除する罫線の長さ方向を設定する。削除する罫線の長さ方向は、処理対象画像における文字の幅方向や、高さ方向等である。罫線方向設定機能部33が、この発明で言う罫線方向設定部に相当する。
閾値決定機能部34は、処理対象画像の注目画素が文字にかかる文字画素であるか、それ以外の非文字画素であるかを判定するのに用いる画素値の閾値を決定する。閾値決定機能部34は、処理対象画像の任意の画素を注目画素に設定する機能を有している。すなわち、閾値決定機能部34は、処理対象画像の各画素を、順次注目画素に設定することで、処理対象画像の各画素について、その画素の閾値を決定することができる。この閾値決定機能部34が、この発明で言う閾値決定部に相当する。閾値決定機能部34は、2値化画像記憶部32に記憶している2値化画像(背景分離画像、または罫線分離画像)、および画像入力部2に入力された処理対象画像を用いて、注目画素の閾値を決定する。
罫線分離機能部35は、閾値決定機能部34が処理対象画像の画素毎に決定した閾値を用いて、処理対象画像の各画素を文字画素(画素値を1)、または非文字画素(画素値を0)のいずれであるかを判定した罫線分離画像を生成する。
2値化画像記憶部32は、背景分離機能部31において背景分離画像が生成されると、記憶している2値化画像が今回生成された背景分離画像に更新され、罫線分離機能部35において罫線分離画像が生成されると、記憶している2値化画像を今回生成された罫線分離画像に更新される。
図3を参照しながら、画像処理部3が、処理対象画像から、罫線分離画像を生成する処理について簡単に説明する、
ここでは、処理対象画像が、図3(A)に示す、文字50(ELECTRONICS)、および罫線51、52を有する画像である場合を例にする。罫線51の長さ方向は、図示するように文字50の幅方向である。また、罫線52の長さ方向は、図示するように文字50の高さ方向である。画像処理部3は、処理対象画像から罫線51、52を削除した画像(図3(C)参照)を生成する。
まず、画像処理部3は、罫線方向設定機能部33が削除する罫線の長さ方向を文字の幅方向に設定し、長さ方向が文字の幅方向である罫線51を削除した罫線分離画像を生成する(図3(B)参照)。図3(B)に示す罫線分離画像は、長さ方向が設定されていない文字の高さ方向である罫線52が削除されずに残った画像である。すなわち、画像処理部3は、長さ方向が設定された文字の幅方向である罫線51のみを削除した罫線分離画像を生成する。
画像処理部3は、長さ方向が文字の幅方向である罫線51を削除した罫線分離画像を生成した後に、罫線方向設定機能部33が削除する罫線の長さ方向を文字の高さ方向に設定し、長さ方向が文字の高さ方向である罫線52を削除した、罫線分離画像を生成する。画像処理部3は、すでに生成した長さ方向が文字の幅方向である罫線51を削除した罫線分離画像(図3(B)に示す罫線分離画像)を用いて、長さ方向が文字の高さ方向である罫線52を削除した罫線分離画像を生成する。これにより、画像処理部3は、図3(C)に示す、罫線51、52を削除した罫線分離画像を生成する。
なお、処理対象画像に対して削除する罫線の長さ方向は、上述した文字の幅方向、文字の高さ方向の順番に限らず、文字の高さ方向、文字の幅方向の順番であってもよい。また、罫線方向設定機能部33は、削除する罫線の長さ方向として、上記の文字幅方向、文字高さ方向の2方向に限らず、他の方向も設定できるようにしてもよい。また、図3では、削除する罫線の長さ方向を2方向としたが、削除する罫線の長さ方向は、1方向であってもよいし、3方向以上であってもよい。
以下、この例にかかる罫線削除装置1の動作について説明する。図4は、罫線削除装置の動作を示すフローチャートである。
罫線削除装置1は、画像入力部2において処理対象画像の入力を受け付ける(s1)。処理対象画像は、例えば図3(A)に示した画像である。
罫線削除装置1は、画像処理部3において、画像入力部2に入力された処理対象画像に対して罫線削除処理を行い、罫線を削除した罫線分離画像を生成する(s2)。この例では、図3(A)に示した処理対象画像を処理し、図3(C)に示した罫線分離画像を生成する場合を例にして説明する。
罫線削除装置1は、画像出力部4において、画像処理部3がs2で生成した罫線分離画像を出力し(s3)、s1に戻る。画像出力部4は、2値化画像記憶部32に記憶している罫線分離画像を出力する。
図5は、s2かかる罫線削除処理を示すフローチャートである。画像処理部3は、背景分離機能部31において、画像入力部2に入力された処理対象画像を処理し、背景分離画像を生成する(s11)。背景分離画像は、文字や罫線にかかる画素を前景画素(画素値を1)、それ以外の画素を背景画素(画素値を0)とした2値化画像である。背景画素は、文字にかかる画素ではないので、非文字画素である。
s11では、例えば、処理対象画像の画素毎に、画素値が予め定めた閾値よりも高い画素を背景画素、画素値が予め定めた閾値よりも低い画素を前景画素と判定することにより、背景分離画像を生成してもよい。また、処理対象画像の画素毎に、その画素に対して設定した近傍領域内に位置する画素の画素値の平均や、標準偏差等を用いて、その画素が前景画素であるか、背景画素であるかを判定することにより、背景分離画像を生成してもよい。この方法で背景分離画像を生成すると、輝度むらが生じている処理対象画像についても、背景分離画像を精度よく生成できる。
画像処理部3は、背景分離機能部31がs11で生成した背景分離画像を2値化画像記憶部32に記憶する(s12)。s12では、2値化画像記憶部32が、その時点において記憶している2値化画像を、背景分離機能部31がs11で生成した背景分離画像(2値化画像)に書き換える。
画像処理部3は、処理対象画像に対して未処理である削除する罫線の長さ方向があるかどうかを判定する(s13)。この例では、処理対象画像に対して、削除する罫線の長さ方向として、文字の幅方向、および文字の高さ方向の2つの方向が予め登録されているものとする。
画像処理部3は、処理対象画像に対して未処理である削除する罫線の長さ方向があると、罫線方向設定機能部33が、未処理である削除する罫線の長さ方向の1つを設定する(s14)。この例では、罫線方向設定機能部33は、削除する罫線の長さ方向を、文字の幅方向、文字の高さ方向の順番に設定するものとして説明する。
画像処理部3は、閾値決定機能部34において、処理対象画像の画素毎に、文字画素であるか、非文字画素であるかの判定に用いる画素値の閾値を決定する閾値決定処理を行う(s15)。
図6は、s15にかかる閾値決定処理を示すフローチャートである。閾値決定機能部34は、処理対象画像に、閾値を設定していない未処理の画素があるかどうかを判定する(s21)。閾値決定機能部34は、未処理の画素があれば、未処理であるいずれかの画素を注目画素(これから、閾値を決定する画素)に決定する(s22)。
閾値決定機能部34は、s22で決定した注目画素が、すでに非文字画素であると判定されているかどうか、を判定する(s23)。s23では、2値化画像記憶部32が記憶している2値化画像(背景分離画像、または罫線分離画像)において、注目画素に対応する画素の画素値が0であれば、すでに非文字画素であると判定されている、と判定する。また、2値化画像記憶部32が記憶している2値化画像において、注目画素に対応する画素の画素値が1であれば、現時点では非文字画素であると判定されていない、と判定する。
閾値決定機能部34は、s23で注目画素がすでに非文字画素であると判定されている、と判定すると、後述するs24以降の処理を行うことなく、s21に戻る。
なお、この例では、すでに非文字画素であると判定されている画素については閾値を設定しない構成としているが、閾値を0(この注目画素が、画素値に関係なく、以降の処理で非文字画素と判定される閾値)に設定するようにしてもよい。
閾値決定機能部34は、注目画素がこの時点で非文字画素であると判定されていなければ、この注目画素について局所領域を設定する(s24)。図7は、s24で設定する局所領域を説明する図である。局所領域は、図7に示すように、s22で決定した注目画素を中心にして、s14で設定した罫線の長さ方向に連続して並んでいる(2n+1)個の画素が位置する領域である。局所領域は、文字間の画素が含まれる大きさである。具体的には、局所領域は、s14で設定した罫線の長さ方向における文字の長さよりも長ければよい。ここで言う罫線方向における文字の長さとは、罫線方向が文字の幅方向であれば、文字の幅であり、罫線方向が文字の高さ方向であれば、文字の高さである。この例では、局所領域は、s14で設定した罫線の長さ方向に文字の長さの2倍程度の大きさにしている。
なお、ここでは、局所領域は、その中心に注目画素が位置するとしたが、注目画素が含まれており、且つs14で設定した罫線の長さ方向に連続して並んでいる画素の領域であれば、どのような領域を設定してもよい。
閾値決定機能部34は、s24で設定した局所領域内に位置する(2n+1)個の画素の画素値を用いて局所閾値αを決定する(s25)。
図8は、設定されている削除する罫線の長さ方向が文字の幅方向である場合に、s24で設定される4つの局所領域A〜Dを例示した図である。また、図8に示す4つの局所領域A〜Dについて、画素値に対する画素数の分布を図9に示す。図9(A)は、局所領域Aについての画素値に対する画素数の分布であり、図9(B)は、局所領域Bについての画素値に対する画素数の分布であり、図9(C)は、局所領域Cについての画素値に対する画素数の分布であり、図9(D)は、局所領域Dについての画素値に対する画素数の分布である。
局所領域A内に位置する画素は、文字と罫線とが重なっている画素、および罫線のみにかかる画素の2種類である。局所領域B内に位置する画素は、罫線のみにかかる画素の1種類である。局所領域C内に位置する画素は、文字のみにかかる画素、および背景画素の2種類である。局所領域D内に位置する画素は、罫線のみにかかる画素、および背景画素の2種類である。
なお、局所領域D内に位置する罫線のみにかかる画素は、s14で長さ方向を設定した罫線にかかる画素ではない。
図9(A)、(C)、(D)に示すように、局所領域内に位置する画素が2種類である場合、画素値に対する画素数の分布は、2つのピーク(2つの山)を有する形状になる。また、図9(B)に示すように、局所領域内に位置する画素が1種類である場合、画素値に対する画素数の分布は、1つのピーク(1つの山)を有する形状になる。
局所領域は、上述したように、文字間の画素が含まれる大きさである。したがって、文字にかかる画素(文字のみにかかる画素、および文字および罫線にかかる画素)のみが位置する局所領域が設定されることはない。また、この例では、注目画素が背景画素であれば、局所領域を設定しないので、背景画素のみが位置する局所領域が設定されることもない。すなわち、画素値に対する画素数の分布が1つのピークを有する形状である局所領域は、罫線のみにかかる画素が位置する局所領域である。
閾値決定機能部34は、図9(A)、(C)、(D)に示すように、画素値に対する画素数の分布が、2つのピークを有する形状であると、局所閾値αを2つの山の間の画素値に決定する。また、閾値決定機能部34は、図9(B)に示すように、画素値に対する画素数の分布が、1つのピークを有する形状であると、局所閾値αを1つの山よりも低い画素値に決定する。
なお、局所領域内に位置する画素が、文字にかかる画素、罫線のみにかかる画素、および背景画素の3種類である場合、画素値に対する画素数の分布は、3つのピーク(3つの山)を有する形状になる。この場合には、閾値決定機能部34は、局所閾値αを画素値が最も低い山と、画素値が2番目に低い山との間の画素値に決定する。
次に、閾値決定機能部34は、注目画素について法線領域を設定する(s26)。法線領域は、注目画素に対して、s14で設定した罫線の長さ方向に直交する方向に、この時点で非文字画素であると判定されていない画素が連続して並んでいる領域である。図8に示した局所領域A〜Dに対応する、法線領域A’〜D’を図10に示す。法線領域A’〜D’内に位置する画素の個数は、一定ではない。閾値決定機能部34は、s26で設定した法線領域内に位置する画素の画素値を用いて法線閾値βを決定する(s27)。s27では、法線領域内に位置する画素の画素値の平均や、画素値の分散を用いて算出する。
閾値決定機能部34は、s25で決定した局所閾値α、およびs27で決定した法線閾値βを用いて、注目画素に対する閾値を決定し(s28)、s21に戻る。
s28では、
閾値=局所閾値α+k×法線閾値β(但し、kは予め定めた定数)
により算出し、決定する。kは、小さい値であり、法線閾値βは、注目画素周辺に位置する画素の画素値で局所閾値αを補正するものである。
すなわち、注目画素の閾値の決定において、法線閾値βを用いなくてもある程度の精度を確保することができる。また、法線閾値βを用いることで、注目画素の閾値を、この注目画素周辺に位置する画素の画素値を考慮した値に決定できるので、閾値の設定精度を向上できる。
画像処理部3は、s21で未処理の画素が無いと判定すると、閾値決定処理を終了する。
図5に戻って、画像処理部は、s15にかかる閾値決定処理を完了すると、罫線分離機能部35が罫線分離画像を生成する罫線分離画像生成処理を行う(s16)。s16では、処理対象画像の画素毎に、その画素について決定された閾値を用いて、文字画素であるか、非文字画素であるかを判定する。このとき、2値化画像記憶部32が記憶している2値化画像において、すでに非文字画素であると判定されている画素については、非文字画素と判定する。すなわち、s16では、この時点において、非文字画素であると判定されていない画素についてのみ、s15で決定した閾値を用いて、文字画素であるか、非文字画素であるかを判定する。
図8、および図9から明らかなように、局所領域A、Cにかかる注目画素は、適正に文字画素であると判定され、局所領域Bにかかる注目画素は、適正に非文字画素であると判定される。一方で局所領域Dにかかる注目画素は、非文字画素(罫線のみにかかる画素)であるにもかかわらず、文字画素であると判定される。しかしながら、局所領域Dにかかる注目画素は、今回s14で設定された削除する長さ方向の罫線にかかる画素ではないので、この時点において、文字画素であると判定しても問題はない。
画像処理部3は、罫線分離機能部35がs16で生成した罫線分離画像を、2値化画像記憶部32に記憶し(s17)、s13に戻る。s17では、2値化画像記憶部32が、その時点において記憶している2値化画像を、罫線分離機能部35がs16で生成した背景分離画像(2値化画像)に書き換える。画像処理部3は、s13で未処理の罫線の長さ方向がないと判定すると、本処理を終了する。
したがって、画像処理部3は、設定した罫線の長さ方向毎に、上述したs15〜17の処理を繰り返すことで、設定した長さ方向の罫線を削除した罫線分離画像を生成することができる。
なお、画像入力部2に入力される処理対象画像がカラー画像である場合には、入力された処理対象画像をグレースケールの画像に変換した後に、図5に示した罫線削除処理を実行する構成にしてもよいし、入力された処理対象画像をHSV表色系に変換し、V成分を画素値として図5に示した罫線削除処理を実行する構成にしてもよい。
また、図5に示した罫線削除処理や、図6に示した閾値決定処理は、各ステップを実行する順番については、上記の順番に限らず、どのように変更してもよい。例えば、上記の説明では、注目画素について、局所閾値αを決定した後、法線閾値βを決定するとしたが、法線閾値βを決定した後、局所閾値αを決定する順番であってもよい。
A〜D…局所領域
A’〜D’…法線領域
1…罫線削除装置
2…画像入力部
3…画像処理部
4…画像出力部
31…背景分離機能部
32…2値化画像記憶部
33…罫線方向設定機能部
34…閾値決定機能部
35…罫線分離機能部
50…文字
51、52…罫線

Claims (7)

  1. 濃淡を有する多値画像であって、文字と罫線とを含む処理対象画像から前記罫線を削除した画像を生成する罫線削除装置において、
    入力された前記処理対象画像の注目画素が文字にかかる文字画素であるか、それ以外の非文字画素であるかを判定するのに用いる画素値の閾値を決定する閾値決定部と、
    入力された前記処理対象画像の注目画素が、前記文字画素、または前記非文字画素のいずれであるかを、当該注目画素について前記閾値決定部が決定した前記閾値を用いて判定し、第1の2値化画像を生成する第1の2値化画像生成部と、
    入力された前記処理対象画像の注目画素が、文字または罫線にかかる前景画素であるか、それ以外の背景画素であるかを判定し、第2の2値化画像を生成する第2の2値化画像生成部と、を備え、
    前記閾値決定部は、前記閾値を決定する注目画素に応じて局所領域、および法線領域を設定し、前記局所領域内、および前記法線領域内に位置する複数の画素の画素値を用いて、当該注目画素の前記閾値を決定し、
    前記局所領域は、前記閾値を決定する注目画素を含む複数の画素が、削除する前記罫線の長さ方向に並ぶ領域であ
    前記法線領域は、前記閾値を決定する注目画素を含み、前記第1の2値化画像生成部が前記非文字画素であると判定していない画素、または前記第2の2値化画像生成部が前記背景画素であると判定していない画素が、削除する前記罫線の長さ方向に直交する方向に連続して並んでいる領域である、ことを特徴とする罫線削除装置。
  2. 前記局所領域は、前記閾値を決定する注目画素が、削除する前記罫線の長さ方向に並ぶ複数の画素の中間に位置する領域である、ことを特徴とする請求項1に記載の罫線削除装置。
  3. 前記局所領域は、削除する前記罫線の長さ方向の長さが、削除する前記罫線の長さ方向における文字の長さよりも長い領域である、ことを特徴とする請求項1、または2に記載の罫線削除装置。
  4. 記第1の2値化画像生成部は、前記第2の2値化画像生成部が前記背景画素であると判定した注目画素については、前記非文字画素であると判定する、ことを特徴とする請求項1〜3のいずれか1項に記載の罫線削除装置。
  5. 入力された前記処理対象画像に対して、削除する前記罫線の長さ方向を設定する罫線方向設定部を備えた、ことを特徴とする請求項1〜のいずれか1項に記載の罫線削除装置。
  6. 濃淡を有する多値画像であって、文字と罫線とを含む処理対象画像から前記罫線を削除した画像を生成する罫線削除方法において、
    入力された前記処理対象画像の注目画素が文字にかかる文字画素であるか、それ以外の非文字画素であるかを判定するのに用いる画素値の閾値を決定する閾値決定ステップと、
    入力された前記処理対象画像の注目画素が、前記文字画素、または前記非文字画素のいずれであるかを、当該注目画素について前記閾値決定ステップで決定した前記閾値を用いて判定し、第1の2値化画像を生成する第1の2値化画像生成ステップと、
    入力された前記処理対象画像の注目画素が、文字または罫線にかかる前景画素であるか、それ以外の背景画素であるかを判定し、第2の2値化画像を生成する第2の2値化画像生成ステップと、をコンピュータが実行し、
    前記閾値決定ステップは、前記閾値を決定する注目画素に応じて局所領域、および法線領域を設定し、前記局所領域内、および前記法線領域内に位置する複数の画素の画素値を用いて、当該注目画素の前記閾値を決定するステップであり、且つ、
    前記局所領域として、前記閾値を決定する注目画素を含む複数の画素が、削除する前記罫線の長さ方向に並ぶ領域を設定し、
    前記法線領域として、前記閾値を決定する注目画素を含み、前記第1の2値化画像生成ステップで前記非文字画素であると判定していない画素、または前記第2の2値化画像生成ステップで前記背景画素であると判定していない画素が、削除する前記罫線の長さ方向に直交する方向に連続して並んでいる領域を設定する、
    ステップである、ことを特徴とする罫線削除方法。
  7. 濃淡を有する多値画像であって、文字と罫線とを含む処理対象画像から前記罫線を削除した画像をコンピュータに生成させる罫線削除プログラムにおいて、
    入力された前記処理対象画像の注目画素が文字にかかる文字画素であるか、それ以外の非文字画素であるかを判定するのに用いる画素値の閾値を決定する閾値決定ステップと、
    入力された前記処理対象画像の注目画素が、前記文字画素、または前記非文字画素のいずれであるかを、当該注目画素について前記閾値決定ステップで決定した前記閾値を用いて判定し、第1の2値化画像を生成する第1の2値化画像生成ステップと、
    入力された前記処理対象画像の注目画素が、文字または罫線にかかる前景画素であるか、それ以外の背景画素であるかを判定し、第2の2値化画像を生成する第2の2値化画像生成ステップと、をコンピュータに実行させ、
    前記閾値決定ステップは、前記閾値を決定する注目画素に応じて局所領域、および法線領域を設定し、前記局所領域内、および前記法線領域内に位置する複数の画素の画素値を用いて、当該注目画素の前記閾値を決定するステップであり、且つ、
    前記局所領域として、前記閾値を決定する注目画素を含む複数の画素が、削除する前記罫線の長さ方向に並ぶ領域を設定し、
    前記法線領域として、前記閾値を決定する注目画素を含み、前記第1の2値化画像生成ステップで前記非文字画素であると判定していない画素、または前記第2の2値化画像生成ステップで前記背景画素であると判定していない画素が、削除する前記罫線の長さ方向に直交する方向に連続して並んでいる領域を設定する、
    ステップである、ことを特徴とする罫線削除プログラム。
JP2016023105A 2016-02-09 2016-02-09 罫線削除装置、罫線削除方法、および罫線削除プログラム Active JP6701773B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016023105A JP6701773B2 (ja) 2016-02-09 2016-02-09 罫線削除装置、罫線削除方法、および罫線削除プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016023105A JP6701773B2 (ja) 2016-02-09 2016-02-09 罫線削除装置、罫線削除方法、および罫線削除プログラム

Publications (2)

Publication Number Publication Date
JP2017142628A JP2017142628A (ja) 2017-08-17
JP6701773B2 true JP6701773B2 (ja) 2020-05-27

Family

ID=59627430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016023105A Active JP6701773B2 (ja) 2016-02-09 2016-02-09 罫線削除装置、罫線削除方法、および罫線削除プログラム

Country Status (1)

Country Link
JP (1) JP6701773B2 (ja)

Also Published As

Publication number Publication date
JP2017142628A (ja) 2017-08-17

Similar Documents

Publication Publication Date Title
US10049291B2 (en) Image-processing apparatus, image-processing method, and computer program product
US9275030B1 (en) Horizontal and vertical line detection and removal for document images
CN105469027A (zh) 针对文档图像的水平和垂直线检测和移除
US8538191B2 (en) Image correction apparatus and method for eliminating lighting component
KR20090109047A (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
JP6754120B2 (ja) プログラム、情報記憶媒体及び文字分割装置
JP2013196136A (ja) 画像処理装置、及び画像処理方法
KR20150099116A (ko) Ocr를 이용한 컬러 문자 인식 방법 및 그 장치
JP6701773B2 (ja) 罫線削除装置、罫線削除方法、および罫線削除プログラム
US8401325B2 (en) Image processing method, image processing apparatus, and computer program for core line modification of a thinning figure in an image process
JP7013341B2 (ja) 帳票認識装置、帳票認識方法、及び帳票認識プログラム
JP7301529B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP6091400B2 (ja) 画像処理装置
US10380463B2 (en) Image processing device, setting support method, and non-transitory computer-readable media
JP4890351B2 (ja) 画像処理装置、画像処理プログラムおよび該画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに画像処理方法
JP6055952B1 (ja) 画像検査装置、画像検査方法、およびプログラム
JP4162195B2 (ja) 画像処理装置、及び画像処理プログラム
JP2007184842A (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP7508212B2 (ja) 画像処理装置、画像処理方法及びプログラム
US20220406083A1 (en) Image processing apparatus, control method thereof, and storage medium
JP2019021085A (ja) 画像処理プログラム、画像処理方法及び画像処理装置
US20230196519A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium storing program
RU2737001C1 (ru) Устройство и способ обработки изображений и носитель данных
JP6513311B2 (ja) 文字認識装置および文字認識方法
JP2007328652A (ja) 画像処理装置および画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200420

R150 Certificate of patent or registration of utility model

Ref document number: 6701773

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250